Vous êtes sur la page 1sur 18

Statistique infrentielle

1 Oprations sur des variables alatoires discrtes


Dans cette section, quelques rsultats seront noncs et dmontrs dans le cadre des va-
riables alatoires discrte prenant un nombre ni de valeurs. Ce cadre permet dexposer des
dmonstrations plus simples que le cadre gnral des variables alatoires discrtes ou conti-
nues. Cependant, les thormes restent vrais pour ces variables alatoires, en ajoutant dans
leurs hypothses certaines conditions de convergence dont le cas ni nous dispense.
Dans les dmonstrations, on utilisera le fait que toute variable alatoire constante X :
R, c, a pour esprance E(X) = c.
Thorme 1.1 (Linarit de lesprance) Soient X : R et Y : R des variables
alatoires discrtes prenant chacune un nombre ni de valeurs. Soient et dans R. Alors,
X +Y : R, X() +Y () est une variable alatoires dont lesprance vrie :
E(X +Y ) = E(X) +E(Y ).
Dautre part, X + : R, X() + est une variable alatoire dont lesprance
vrie :
E(X +) = E(X) +.
Dmonstration 1.1 (Dmonstration partielle) Les dmonstrations ne porteront pas sur le fait que X + Y
et X + sont des variables alatoires.
Soit A lensemble des valeurs de X+Y . Comme X et Y prennent un nombre ni de valeurs, A est ni.
Par dnition E(X +Y ) =

zA
zP(X +Y = z). Or, {X +Y = z} =

x+y=z
({X = x} {Y = y}).
Les ensembles de cette runion tant deux deux disjoints, on a P(X + Y = z) =

x+y=z
P({X =
x}{Y = y}). Dautre part, {X = x} est la runion pour y parcourant Y (), des ensembles deux deux
disjoints {X = x} {Y = y}. De mme, {Y = y} est la runion pour x parcourant X(), des ensembles
deux deux disjoints {X = x} {Y = y}. On a donc
E(X +Y ) =

xX(), yY ()
(x +y)P({X = x} {Y = y})
=

xX(), yY ()
xP({X = x} {Y = y}) +

xX(), yY ()
yP({X = x} {Y = y})
=

xX()
xP(X = x) +

yY ()
yP(Y = y)
= E(X) +E(Y )
1
2 1 OPRATIONS SUR DES VARIABLES ALATOIRES DISCRTES
E(X +) =

xX()
(x +)P(X + = x +)
=

xX()
(x +)P(X = x)
=

xX()
xP(X = x) +

xX()
P(X = x)
= E(X) +.
Thorme 1.2 Avec les hypothses du thorme prcdent, on a :
V (X +) =
2
V (X).
Dmonstration 1.2 On a V (X + ) = E
_
(X +)
2
_
(E(X + ))
2
. Or, daprs le thorme 1.1,
E
_
(X +)
2
_
= E
_

2
X
2
+ 2X +
2
_
=
2
E(X
2
)+2E(X)+
2
et (E(X+))
2
= (E(X)+
)
2
=
2
(E(X))
2
+ 2E(X) +
2
. Do, V (X +) =
2
_
E(X
2
) (E(X))
2
_
=
2
V (X).
Dnition et notation 1.1 (Covariance) Soient X et Y des variables alatoires discrtes
prenant un nombre n de valeurs. La covariance de X et Y est note cov(X, Y ). La covariance
est dnie par :
cov(X, Y ) = E
_
(X E(X))(Y E(Y ))
_
.
Remarque : Si X et Y sont des variables alatoires admettant chacune une esprance, (X
E(X))(Y E(Y )) est une variable alatoire.
Thorme 1.3 Avec les conditions de la dnition ci-dessus, on a :
cov(X, Y ) = E(XY ) E(X)E(Y ).
Dmonstration 1.3 Il sut dappliquer la linarit de E sur (X E(X))(Y E(Y )) = XY XE(Y )
Y E(X) +E(X)E(Y ). On a :
cov(X, Y ) = E
_
XY XE(Y ) Y E(X) +E(X)E(Y )
_
= E(XY ) E(XE(Y )) E(Y E(X)) +E(E(X)E(Y ))
= E(XY ) E(Y )E(X) E(X)E(Y ) +E(E(X)E(Y ))
= E(XY ) E(Y )E(X) E(X)E(Y ) +E(X)E(Y )
= E(XY ) E(X)E(Y ).
Il est sous-entendu dans le thorme ci-dessus, que XY est une variable alatoire... sinon,
E(XY ) naurait aucun sens.
Thorme 1.4 Avec les conditions de la dnition ci-dessus, on a :
V (X +Y ) = V (X) +V (Y ) + 2 cov(X, Y ).
Dmonstration 1.4 Par dnition, V (X+Y ) = E
_
(X +Y E(X +Y ))
2
_
. On sait que cette expression
se simplie en V (X +Y ) = E((X +Y )
2
) (E(X +Y ))
2
. Do,
V (X +Y ) = E(X
2
+ 2XY +Y
2
) (E(X) +E(Y ))
2
= E(X
2
) + 2E(XY ) +E(Y
2
) (E(X))
2
2E(X)E(Y ) (E(Y ))
2
= E(X
2
) (E(X))
2
+E(Y
2
) (E(Y ))
2
+ 2(E(XY ) E(X)E(Y ))
= V (X) +V (Y ) + 2 cov(X, Y )
DUT Gnie Biologique Anne universitaire 2007/2008
3
2 Indpendance
On suppose que les variables alatoires apparaissant dans ce chapitre ont toutes une es-
prance et une variance. Les variables alatoires considres sont des variables alatoires
valeurs relles, discrtes ou continues (cest dire : densit de probabilit), telles que celles
tudies dans la section Variables alatoires et lois de probabilit.
Soit lunivers dune exprience alatoire muni de la probabilit P.
Dnition 2.1 (Variables alatoires indpendantes) Soit X : R et Y : R des
variables alatoires. On dit que X et Y sont des variables alatoires indpendantes si pour tout
intervalle I et tout intervalle J de R:
P((X I) (Y J)) = P(X I)P(Y J).
Pour des variables alatoires discrtes, la dnition ci-dessus peut tre simplie.
Dnition 2.2 (Variables alatoires discrtes indpendantes) Soit X : R et Y :
R des variables alatoires discrtes. X et Y sont indpendantes si pour tout x et tout y
dans R, P((X = x) (Y = y)) = P(X = x)P(Y = y).
Dnition 2.3 (Variables alatoires indpendantes) Soit I un ensemble non vide. Les
variables alatoires X
i
: R, i I, sont indpendantes si pour tout sous-ensemble ni et
non vide J de I et toute famille dintervalles (I
i
)
iJ
de R:
P
_

iJ
(X
i
I
i
)
_
=

iJ
P(X
i
I
i
).
Cette dernire dnition peut tre elle aussi simplie dans le cas de variables alatoires
discrtes.
Dnition 2.4 (Variables alatoires discrtes indpendantes) Soit I un ensemble non
vide. Les variables alatoires discrtes X
i
: R, i I, sont indpendantes si pour tout
sous-ensemble ni et non vide J de I et toute famille (x
i
)
iJ
dlments de R:
P
_

iJ
(X
i
= x
i
)
_
=

iJ
P(X
i
= x
i
).
Thorme 2.1 Soient X : R et Y : R des variables alatoires discrtes, indpen-
dantes, et prenant un nombre ni de valeurs. Alors,
E(XY ) = E(X)E(Y ).
Dmonstration 2.1 Comme X et Y sont indpendantes, pour tout x dans X() et tout y dans Y (),
P({X = x} {Y = y}) = P(X = x)P(Y = y). Do, pour tout rel z, P(XY = z) =

xy=z
P(X =
x)P(Y = y), la somme tant prise sur tous les couples (x, y) tels que xy = z. On en dduit que E(XY ) =

zXY ()
zP(XY = z) =

zXY ()
_

xy=z
xP(X = x)yP(Y = y)
_
. Notons que si x X() ou
si y Y (), alors P(X = x)P(Y = y) = 0. Do,

zXY ()
_

xy=z
xP(X = x)yP(Y = y)
_
=

xX(), yY ()
xP(X = x)yP(Y = y). Cette dernire expression nest rien dautre que le dveloppement
de E(X)E(Y ).
T. Cuesta IUT de Crteil
4 2 INDPENDANCE
Corollaire 2.1.1 Avec les hypothses du thorme prcdent, on a :
cov(X, Y ) = 0.
Attention! Si cov(X, Y ) = 0, les variables alatoires X et Y peuvent trs bien ne pas tre
indpendantes.
Dmonstration 2.1.1 Il sut de reporter E(XY ) = E(X)E(Y ) dans lgalit du thorme 1.3.
Corollaire 2.1.2 Avec les hypothses du thorme, on a
V (X +Y ) = V (X) +V (Y ).
Dmonstration 2.1.2 Il sut dutiliser lgalit du thorme 1.4 et le corollaire ci-dessus.
Les thormes ci-dessus se gnralisent aux variables alatoires quelconques. On dmontre (et
nous admettrons) :
Thorme 2.2
1. Soient X : R et Y : R des variables alatoires, soient et des nombres
rels. Alors, (X+Y ) : R, X() +Y () et (X+) : R, X() +
sont des variables alatoires. De plus, on a :
E(X +Y ) = E(X) +E(Y )
E(X +) = E(X) +
V (X +) =
2
V (X).
Si X et Y sont indpendantes, on a aussi :
V (X +Y ) = V (X) +V (Y ).
2. Soient X
1
, X
2
, . . . ,X
n
des variables alatoires dnies sur et valeurs dans R. Alors,
(

n
i=1
X
i
) : R,

n
i=1
X
i
() est une variable alatoire. On a :
E
_
n

i=1
X
i
_
=
n

i=1
E(X
i
).
De plus, si les variables alatoires X
1
, X
2
, . . . ,X
n
sont indpendantes, on a :
V
_
n

i=1
X
i
_
=
n

i=1
V (X
i
).
Ce thorme permet de retrouver des rsultats obtenus directement pour la loi binomiale.
En eet, considrons le schma de Bernoulli constitu de n rptitions indpendantes dun
preuve deux issues. Notons

X la variable alatoire de Bernoulli associant 1 lissue a et 0
lissue b. Supposons que P(

X = 1) = p. Fabriquons les variables alatoires indpendantes
X
1
, X
2
, . . . ,X
n
, dnie de la manire suivante : X
i
(
1
,
2
, . . . ,
n
) =

X(
i
). On remarquera
que P(X
i
= 1) = P(
i
= a) = p, et donc P(X
i
= 0) = 1 p. On en dduit que E(X
i
) = p et
V (X
i
) = p(1p). Posons X = X
1
+X
2
+ +X
n
. X comptabilise alors le nombre de ralisations
de lissue a lors des n rptitions de lpreuve. Nous savons que X suit la loi binomiale B(n, p).
En utilisant les thormes ci-dessus, on obtient : E(X) =

n
i=1
E(X
i
) =

n
i=1
p = np et
V (X) =

n
i=1
V (X
i
) =

n
i=1
p(1 p) = np(1 p).
Exercice 2.1 Soient X et Y des variables alatoires indpendantes suivant respectivement les lois
binomiales B(n
1
, p) et B(n
2
, p). Montrer que la variable alatoire Z = X +Y suit la loi B(n
1
+n
2
, p).
DUT Gnie Biologique Anne universitaire 2007/2008
5
Corollaire 2.2.1 Soient X
1
, X
2
, . . . , X
n
des variables alatoires indpendantes dnies sur
et valeurs dans R, suivant toutes la mme loi de probabilit, desprance et dcart-type .
Alors, la variable alatoire X =
1
n

n
i=1
X
i
vrie :
E
_
X
_
= et V
_
X
_
=

2
n
.
Dmonstration 2.2.1 Daprs le thorme, E
_

n
i=1
X
i
n
_
=

n
i=1
E
_
X
i
n
_
et E
_
X
i
n
_
=
E(X
i
)
n
. On
en dduit :E
_
X
_
= E
_

n
i=1
X
i
n
_
=

n
i=1

n
= . Toujours daprs le thorme, V
_

n
i=1
X
i
n
_
=

n
i=1
V
_
X
i
n
_
et V
_
X
i
n
_
=
1
n
2
V (X
i
). Do : V
_
X
_
= V
_

n
i=1
X
i
n
_
=

n
i=1
1
n
2

2
=

2
n
.
Corollaire 2.2.2 Soient X et Y des variables alatoires indpendantes. On a : E(X Y ) =
E(X) E(Y ) et V (X Y ) = V (X) +V (Y )
Dmonstration 2.2.2 Puisque X et Y sont indpendantes, X et Y sont indpendantes (preuve?). Alors,
E(X Y ) = E(X + (Y )) = E(X) + E(Y ) = E(X) E(Y ) et V (X Y ) = V (X + (Y )) =
V (X) +V (Y ) = V (X) + (1)
2
V (Y ) = V (X) +V (Y ).
Exercice 2.2 Soient X
1
et X
2
des variables alatoires indpendantes suivant respectivement les lois
de poissons P(
1
) et P(
2
). Montrer qualors la variable alatoire Y = X
1
+X
2
suit la loi de Poisson
de paramtre =
1
+
2
.
Le thorme suivant (admis) est une gnralisation du thorme de Moivre-Laplace nonc
dans le chapitre Probabilit.
Thorme 2.3 (Thorme limite central
1
) Soit (X
n
)
nN{0}
une suite de variables ala-
toires indpendantes, de mme loi, admettant toutes pour esprance et pour cart-type ,
avec = 0. Pour tout n dans N {0}, on pose X
n
=
1
n

n
i=1
X
i
. Comme E
_
X
n
_
= et

_
X
n
_
=

n
, la variable alatoire T
n
=

n(Xn)

est centre et rduite. Alors, pour tout a et


tout b dans R, a < b :
lim
n+
P(a < T
n
b) =
1

2
_
b
a
exp
_

x
2
2
_
dx.
En dautres termes, pour n assez grand, la loi suivie par X
n
est trs peu dirente de la loi
normale N
_
,

n
_
.
Le thorme suivant (que nous admettrons aussi), moins gnral que le thorme prcdent,
ne donne pas une approximation mais lexacte loi de X
n
:
Thorme 2.4 Soit n un nombre entier naturel dirent de 0. Soit (X
i
)
iN[1, n]
une suite de
variables alatoires indpendantes. Pour tout i dans N[1, n], X
i
suit la loi normale N(, ).
Alors, la variable alatoire X
n
=
1
n

n
i=1
X
i
suit la loi normale N
_
,

n
_
.
1. galement appel : Thorme de la limite centre.
T. Cuesta IUT de Crteil
6 3 CHANTILLONNAGE
3 chantillonnage
Cette partie du cours na pas pour objectif dexposer les techniques de construction des
plans dchantillonnage, mais plutt dexaminer une premire fois les techniques probabi-
listes qui justient le recours de tels plans. Les plans dchantillonnage sont utiliss pour les
contrles de rception.
On prlve au hasard, dans une population (P) comportant N individus
2
, un chantillon
(E) de n individus. On suppose que tous les individus ont la mme probabilit de faire partie
de lchantillon. On constitue ainsi un chantillon reprsentatif (chantillon pour lequel on
connat la probabilit pour chaque individu de faire partie de lchantillon).
3.1 chantillons non exhaustifs
On prlve lchantillon (E) au hasard et avec remise. Ces conditions thoriques de pr-
lvement de lchantillon seront supposes remplies, mme si on neectue pas rellement un
tirage avec remise, si leectif de la population est trs important et si leectif de lchantillon
est petit eu gard leectif de la population (
n
N
< 0,1).
3.1.1 Distribution dchantillonnage des moyennes
Le problme de lchantillonnage des moyennes consiste obtenir des informations sur les
moyennes des chantillons de n individus lorsque la moyenne et lcart-type de la population
sont connus. Lide est de considrer les moyennes des chantillons de taille n comme des
ralisations dune variable alatoire.
On tudie un caractre numrique associ chaque individu. Ce caractre numrique per-
met de dnir une variable alatoire X qui associe chaque individu pris au hasard dans la
population, la valeur du caractre tudi. Supposons que, pour tout i N [1, N], x
i
soit la
valeur du caractre pour lindividu I
i
de la population. On a alors la correspondance entre
statistique et probabilits :
E(X) =
1
N
N

i=1
x
i
= et (X) =

_
1
N
n

i=1
(x
i
)
2
= .
On considre les variables alatoires indpendantes
3
X
i
de mme loi que X. Toutes les
fois quun chantillon de taille n est eectivement constitu, on a une ralisation de la suite de
variables alatoires (X
i
)
iN[1, n]
, la variable alatoire X
i
prenant alors la valeur du caractre
pour lindividu numro i de lchantillon. Posons X =
1
n

n
i=1
X
i
. Alors, la moyenne dun
chantillon de taille n est une ralisation de X. X est la distribution dchantillonnage des
moyennes dans les chantillons de taille n. Daprs le corollaire 2.2.1, on a :
E
_
X
_
= et
_
X
_
=

n
.
de plus, si lchantillon est assez grand, la distribution dchantillonnage des moyennes des
chantillons, daprs le thorme limite central 2.3, suit approximativement la loi normale
2. N est un nombre entier naturel, mais il arrive que dans un nonc, la population soit suppose innie. De
tels noncs ne disent alors rien sur la probabilit pour un individu de faire partie dun chantillon. Pourquoi ?
3. Tirage avec remise !
DUT Gnie Biologique Anne universitaire 2007/2008
3.1 chantillons non exhaustifs 7
desprance et dcart-type

n
. Le thorme 2.4 donne la loi exacte de X lorsque X suit
une loi normale.
Il ne faut pas confondre lcart-type dun chantillon avec lcart-type de X. Lcart-type
de X est celui dune variable alatoire prenant comme valeurs les moyennes du caractre dans
les chantillons de taille n.
3.1.2 Distribution dchantillonnage des frquences
On supppose cette fois que lon tudie la prsence dun caractre qualitatif parmi les
N individus de la population. On supppose que p est la frquence de ce caractre dans la
population. Pour une population nie, ce qui est la cas de toute population concrte, p est
la proportion dindividus de la population prsentant le caractre tudi. Soit X la variable
alatoire qui un individu donn de la population, associe la valeur 0 lorsque lindividu ne
prsente pas le caractre tudi, et la valeur 1 lorsque lindividu prsente le caractre tudi.
P(X = 1) = p et P(X = 0) = 1 p. On a alors :
E(X) = p et (X) =
_
p(1 p).
Soient X
1
, . . . , X
n
, n variables alatoires indpendantes et de mme loi que X. On re-
marque que la variable alatoire

n
i=1
X
i
suit la loi binomiale B(n, p). On pose nouveau
X =
1
n

n
i=1
X
i
. Les frquences dapparition du caractre dans les chantillons de taille n sont
les ralisations de la variable alatoire X. Le corolaire 2.2.1 donne cette fois :
E
_
X
_
= p et
_
X
_
=
_
p(1 p)
n
.
Dautre part, comme

n
i=1
X
i
suit la loi B(n, p),
P
_
X =
k
n
_
= P
_
n

i=1
X
i
= k
_
= C
k
n
p
k
(1 p)
nk
.
Comme dans le cas prcdent, si n est assez grand, la distribution des valeurs de la frquence
des chantillons, autrement dit : X, suit approximative la loi N
_
p,
_
p(1p)
n
_
.
Exercice 3.1 BTS Plastiques et composites, session 1998, exercice 2
Les trois parties sont indpendantes.
Un atelier produit en grande srie des pices cylindriques.
Partie A: tude gnrale
1. On dsigne par X la variable alatoire associant chaque pice tire au hasard dans la pro-
duction, son diamtre x, en mm. On suppose que X suit la loi normale de moyenne 12,50 et
dcart-type 0,02.
Dterminer, 10
3
prs, la probabilit que le diamtre dune pice, prise au hasard dans la
production, soit compris entre 12,45 et 12,55.
2. On dsigne par Y la variable alatoire associant chaque pice tire au hasard dans la pro-
duction, sa longueur y en mm. On sait que la probabilit que la longueur dune pice, prise au
hasard dans la production, soit comprise entre 49,75 et 50,20 est gale 0,971.
Une pice est juge acceptable si ses dimensions vrient : 12,45 x 12,55 et 49,75 y
50,20. Dans le cas contraire, elle est rejete.
T. Cuesta IUT de Crteil
8 3 CHANTILLONNAGE
Sachant que le procd de fabrication permet de considrer que les variables alatoires X et Y
sont indpendantes, dduire de ce qui prcde la probabilit quune pice, prise au hasard dans
la production, soit rejete. (On donnera un rsultat arrondi au centime).
Partie B: tude de lots
On suppose dans cette partie que la probabilit dobtenir une pice dfectueuse est 0,04.
On prlve dans la production des lots de 50 pices, tires au hasard et avec remise. On appelle Z la
variable alatoire qui prend pour valeur le nombre de pices dfectueuses dans un tel lot.
1. Donner la loi de probabilit de Z. Prciser les paramtres.
2. Calculer la probabilit quun lot contienne exactement deux pices dfectueuses. (On donnera
un rsultat arrondi au centime).
Partie C: chantillonnage
Soit n un entier naturel. On note X la variable alatoire mesurant la moyenne des diamtres des n
pices dun chantillon de taille n, pris au hasard et avec remise dans la production. On note P
n
la
probabilit que cette moyenne appartienne lintervalle [12,495 ; 12,505]. On suppose n assez grand
et on rappelle que dans ce cas X suit approximativement la loi normale de moyenne 12,50 et dcart-
type
0,02

n
.
En utilisant cette loi, dterminer la taille minimale n de lchantillon pour que la probabilit P
n
soit
suprieure ou gale 0,97.
Exercice 3.2 Hubert Egon, Statistique et probabilits, BTS et DUT secteur industriel, Hachette
Une usine dsire rpondre un appel dore pour la fourniture rgulire dun appareil donn. Le
contrat prvoit une priode dessais qui sera conduite de la faon suivante : Pendant trois semaines
conscutives, la production journalire moyenne releve sur la semaine, devra tre dau moins 100
appareils .
Avant de rpondre lappel dore, il a t procd lanalyse de la production de lanne coule.
La production journalire moyenne est = 102,56, avec un cart-type = 4,34.
1. Compte tenu du grand nombre dpreuves (232 jours), on admet que la production journalire
venir est une variable alatoire continue X, suivant la loi normale N(, ).
(a) Dterminer la probabilit pour que, un jour quelconque, la production soit comprise entre
98 et 102 units : P(98 X 102).
(b) Dterminer la probabilit pour que, un jour quelconque, la production soit au moins gale
100.
2. Pendant une semaine de 5 jours ouvrables, la production moyenne journalire doit tre dau
moins 100 appareils. Soit X la production journalire moyenne sur une semaine. On peut
considrer une semaine quelconque comme un chantillon de taille 5.
(a) Quelle est la loi suivie par la variable alatoire X?
(b) Dterminer la probabilit pour que la production journalire soit au moins gale 100 :
P
_
X 100
_
.
Exercice 3.3 BTS Productique des alliages mouls, session 1996, exercice 1
Une machine fabrique en grande srie des pices cylindriques. Les diamtres de ces pices sont exprims
en millimtres. Les rsultats numriques demands seront arrondis au millime.
1. Soit X la variable alatoire qui, chaque pice choisie au hasard dans la production, associe
son diamtre. On admet que la variable alatoire X suit la loi normale de moyenne m = 50 et
dcart-type = 0,4.
Un pice est considre comme dfectueuse si son diamtre est infrieur 49.1 ou suprieur
50,9. Dterminer la probabilit quune pice soit dfectueuse.
DUT Gnie Biologique Anne universitaire 2007/2008
3.2 chantillons exhaustifs 9
2. On suppose dans cette question que 2% des pices produites sont dfectueuses. On eectue un
prlvement de n pices prises au hasard dans la production. Ce prlvement peut tre assimil
un tirage avec remise. On dsigne par Y la variable alatoire qui prend pour valeur le nombre
de pices dfectueuses dans le lot.
(a) Quelle est la loi suivie par Y ?
(b) Pour n = 10, calculer la probabilit P(Y = 2).
Le client accepte un lot de 10 pices sil contient au plus une pice dfectueuse. Quelle est
la probabilit que le lot soit accept?
(c) Pour n = 50, quel est le paramtre de la loi de Poisson par laquelle on peut approcher la
loi de Y ?
En utilisant cette approximation, dterminer la probabilit quil y ait plus dune pice
dfectueuse dans le lot.
3. Pour contrler la fabrication, on prlve des chantillons de 100 pices ; ce prlvement est
assimil un tirage avec remise.
On appelle X la variable alatoire qui, chaque chantillon de 100 pices, associe la moyenne
des diamtres des pices de cet chantillon. On admet que X suit la loi normale de moyenne
50 et dcart-type
0,4

100
.
Dterminer le nombre rel b positif tel que P(50 b X 50 +b) = 0,95.
3.2 chantillons exhaustifs
On prlve lchantillon (E) de n individus au hasard et sans remise dans la population
(P) de N individus. On se trouve dans ce cas de gure lorsque la taille de lchantillon est
assez grande par rapport la taille de population (
n
N
0,1).
3.2.1 Distribution dchantillonnage des moyennes
Reprenons les notations utilise pour les chantillons non exhaustifs. Cette fois, les variables
alatoire X
1
, X
2
, . . . , X
n
ne sont plus indpendantes. On sait que le calcul de lesprance de
X =
1
n

n
i=1
X
i
est le mme que les variables X
i
soient indpendantes o non. Par contre, la
variance, lcart-type, sont aects par la non indpendance des X
i
.
On admettra les rsultats suivants :
E(X) = et (X) =

n
_
N n
N 1
et tant respectivement la moyenne et lcart-type du caractre numrique tudi dans la
population.
3.2.2 Distribution dchantillonnage des frquences
Avec les mmes notations que dans le cas des chantillons non exhaustifs, on remarquera
que nX =

n
i=1
X
i
suit la loi hypergomtrique H(N, D, n), avec D = Np, o p est la
proportion dindividus prsentant le caractre tudi dans la population.
On en dduit que :
P
_
X =
k
n
_
= P
_
n

i=1
X
i
= k
_
=
_
D
k
__
ND
nk
_
_
N
n
_
T. Cuesta IUT de Crteil
10 4 ESTIMATION
Alors, en utilisant les rsultats obtenus dans le cadre de la loi hypergomtrique, on obtient :
E(X) = p et (X) =

p(1 p)
n
_
N n
N 1
_
.
4 Estimation
Le problme de lestimation est le problme inverse de celui de lchantillonnage. On sou-
haite dterminer la moyenne et lcart-type dun caractre dune population (P) partir de la
moyenne et de lcart-type dun chantillon (E) de cette population. On suppose que lchan-
tillon est constitu de la mme manire que dans le problme de lchantillonnage. Au caractre
tudi dans la population, on associe la variable alatoire X qui donne comme image chaque
individu de la population, la valeur du caractre pour cet individu. Alors, E(X) est gale la
moyenne du caractre et (X) est gal lcart-type du caractre.
4.1 Estimation ponctuelle
On examine un chantillon (E) de n individus dans la population (P). Notons mla moyenne
et s lcart-type du caractre pour cet chantillon (notions de statistique descriptive). Cette
moyenne et cet cart-type permettent destimer la moyenne et lcart-type de la population
(P).
chaque individu I
i
de (E), on associe la variable alatoire X
i
de mme loi que X.
On considre que lchantillon est obtenu de telle sorte que
4
les variables alatoires X
i
sont
indpendantes, toutes de mme loi, E(X
i
) = et (X
i
) = pour tout i N [1, n].
Dans ces conditions, pour n susamment grand, on sait que la variable alatoire X =
1
n

n
i=1
X
i
suit presque la loi normale N
_
,

n
_
. Plus n est grand, plus la probabilit que
X prenne la valeur est proche de 1 (daprs la loi faible des grands nombres). De plus,
(X) =

n
tend vers 0 lorsque n tend vers +. Cest la raison pour laquelle on choisit
comme estimation ponctuelle de , la valeur m. On dit que la variable alatoire X est
un estimateur sans biais de car E(X) =
1
n

n
i=1
E(X
i
) =
1
n
n = . On dit que X est un
estimateur convergent car lim
n+

_
X
_
= 0.
On choisit s
_
n
n1
comme estimation ponctuelle de . Lestimateur sans biais de

2
est la variable alatoire S
2
n1
=
1
n1

n
i=1
_
X
i
X
_
2
; ce qui signie que E
_
S
2
n1
_
=
2
.
En eet, (X
i
)
2
=
_
X
i
X +X
_
2
=
_
X
i
X
_
2
+ 2
_
X
i
X
_ _
X
_
+
_
X
_
2
.
Or,

n
i=1
_
X
i
X
_
=

n
i=1
X
i
nX = 0. Donc,

n
i=1
(X
i
)
2
=

n
i=1
_
X
i
X
_
2
+

n
i=1
_
X
_
2
=

n
i=1
_
X
i
X
_
2
+ n
_
X
_
2
. On en dduit que : E
_

n
i=1
_
X
i
X
_
2
_
=

n
i=1
E
_
(X
i
)
2
_
nE
_
_
X
_
2
_
=

n
i=1
V (X
i
) nV
_
X
_
= n
2
n

2
n
=
2
(n 1), et
donc : E(S
2
n1
) =
2
. La moyenne de la variable alatoire S
2
=
1
n

n
i=1
_
X
i
X
_
2
=
n1
n
S
2
n1
vaut donc
n1
n

2
. Or, s
2
est la ralisation de S
2
(la valeur prise par S
2
) pour lchantillon (E).
On montre
5
que S
n1
est un estimateur convergent.
4. Cest le cas si lchantillon est constitu en utilisant un tirage avec remise ; on considre que cest galement
le cas quand la taille de lchantillon est trs infrieure la taille de la population (en gnral : moins de 10%).
5. Les calculs sont plutt compliqus.
DUT Gnie Biologique Anne universitaire 2007/2008
4.2 Estimation par intervalle de conance 11
Si lon tudie la prsence dun caractre qualitatif, on utilise la variable alatoire X prenant
la valeur 1 si lindividu prsente le caractre, et la valeur 0 si lindividu ne prsente pas le
caractre. Si p est la frquence dapparition du caractre dans la population, on sait que
E(X) = p et (X) =
_
p(1 p). Notons f la frquence dapparition du caractre dans
lchantillon. Pour les mmes raisons que celles dveloppe ci-dessus, on choisit f comme
estimation ponctuelle de p. Lcart-type de lchantillon est
_
f(1 f). On se retrouve
alors avec lalternative suivante : reprendre la mme logique que celle qui nous a dtermins
choisir s
_
n
n1
comme estimation ponctuelle de lcart-type de la population, ce qui donne
ici :
_
nf(1f)
n1
; ou bien utiliser lestimation ponctuelle que nous venons de choisir : p = f, et
dans ce cas obtenir
_
f(1 f) comme estimation ponctuelle de lcart-type de la population.
On verra que dans le cadre de lestimation par intervalle de conance, on utilise
_
f(1 f)
comme estimation ponctuelle de lcart-type de X.
Estimation ponctuelle :
Moyenne cart-type Frquence
chantillon m s f
Population = m = s
_
n
n1
p = f
4.2 Estimation par intervalle de conance
Notons encore une fois la moyenne, et lcart-type des valeurs du caractre pour la
population (P). X dsigne la variable alatoire desprance et dcart-type qui associe
tout individu de la population (P) la valeur correspondante du caractre. On dispose dun
chantillon (E) pour lequel la moyenne des valeurs du caractre est m et lcart-type est s.
On met en place le mme procd que pour lestimation ponctuelle ; savoir : on associe une
variable alatoire X
i
, i N [1, n] chaque individu I
i
de lchantillon (E), comportant
n individus (n 1), prlev dans la population. Une fois encore, on considre que tous les
individus de la population (P) ont la mme probabilit de faire partie de lchantillon (E). Pour
tout i dans N[1, n], la variable alatoire X
i
suit la loi de probabilit de X, et donc : E(X
i
) =
E(X) = et (X
i
) = (X) = . On pose X =
1
n

n
i=1
X
i
, et on suppose que la population
est susamment importante pour que les variables alatoires X
i
soient indpendantes
6
.
4.2.1 Intervalle de conance de la moyenne lorsque X est gaussienne
On dit que X est gaussienne lorsque X suit une loi de Laplace-Gauss, cest dire : lorsque
X suit une loi normale. On suppose donc que X suit la loi N(, ).
Si est connu
La loi de probabilit de X est dans ce cas la loi normale desprance et dcart-type

n
. On
pose T =

n(X)

. T suit la loi normale centre rduite N(0, 1).


6. La constitution de lchantillon est assimile un tirage avec remise.
T. Cuesta IUT de Crteil
12 4 ESTIMATION
Soit a un nombre rel positif. P
_
a X +a
_
= P
_

T
a

_
= 2
_
a

1. Posons t =
a

; on obtient : P
_
t

n
X +t

n
_
= 2(t) 1. Comme a
X +a Xa X+a, on a : P
_
a X +a
_
= P
_

_
X a, X +a
_
.
Une fois lchantillon prlev, on dispose de m et de s pour estimer et . Quant , on
estime quelle doit appartenir un intervalle donn, et cette estimation est plus ou moins de
certaine. Cette incertitude est mesure par le coecient de conance, nombre de lintervalle
[0, 1]. Lintervalle en question est appel : intervalle de conance de la moyenne . Lapparte-
nance de lintervalle de conance doit tre dautant plus sre que le coecient de conance
est proche de 1. Les calculs prcdents justient les dnitions ci-dessous.
Dnitions 4.1 (Intervalle, coecient de conance) Soit t [0, +[. Lintervalle
_
mt

n
, m+t

n
_
est lintervalle de conance de la moyenne , avec un coecient de conance de P(|T| t) =
2(t) 1 ; T suivant la loi N(0, 1) et tant la fonction de rpartition de la loi normale
centre rduite.
Dnition 4.2 (Risque) Lintervalle I est lintervalle de conance de la moyenne , avec
coecient de conance 1 . On dit alors que I est lintervalle de conance de la moyenne
au risque (ou au seuil de risque) .
Si est inconnu
On pose S
2
=
1
n

n
i=1
_
X
i
X
_
2
=
n1
n
S
2
n1
. Lcart-type s mesur sur lchantillon est une
ralisation de S. On admet qualors, la variable alatoire T
n1
=

n1(X)
S
suit la loi de
Student = n 1 degrs de libert.
Dnitions 4.3 (Intervalle, coecient de conance) Soit t [0, +[. Lintervalle
_
mt
s

n 1
, m+t
s

n 1
_
est lintervalle de conance de la moyenne , avec un coecient de conance de 1 =
P(|T
n1
| t) ; T
n1
suivant la loi de Student = n 1 degrs de libert.
La table de la loi de Student (voir la dernire page) donne la valeur de t correspondant au
seuil de risque = P(|T
n1
| > t), pour dirents degrs de libert . Si dans les calculs,
on remplace s par lestimation ponctuelle
7
s
_
n
n1
= de lcart-type de la population,
lintervalle de conance de au seuil de risque devient alors :
_
mt

n
, m+t

n
_
.
Dans la pratique, si lchantillon est de grande taille (n > 30), on utilise souvent la loi
normale au lieu de la loi de Student, en prenant pour valeur de lcart-type de la population,
son estimation ponctuelle. La loi de Student est incontournable pour les chantillons de petite
taille (n 30). Dans le cas o X nest pas une variable gaussienne, lestimation dune moyenne
par intervalles de conance ne pourra tre obtenue pour les petits chantillons.
7. Il sut dutiliser la touche
n1
, au lieu de la touche
n
, de la calculatrice lors du calcul de lcart-type
de lchantillon, pour obtenir s

n
n1
.
DUT Gnie Biologique Anne universitaire 2007/2008
4.2 Estimation par intervalle de conance 13
4.2.2 Intervalle de conance de la moyenne lorsque X nest pas gaussienne (chan-
tillons de grande taille n > 30)
En vertu du thorme limite central 2.3, on considre que X suit la loi normale N
_
,

n
_
,
et donc que T =

n(X)

suit la loi normale centre rduite. On a alors les mmes dnitions


de lintervalle de conance et du coecient de conance que dans le cas o X est gaussienne
et connu (si est inconnu, on lui attribue la valeur de son estimation ponctuelle).
4.2.3 Intervalle de conance dune frquence (chantillons de grande taille : n >
30, np 5 et n(1 p) 5)
On considre un caractre qualitatif de frquence p dans la population. On dnit X
comme dans le cas de lchantillonnage. On dnit les variables alatoires indpendantes X
i
de mme loi que X. Notons que si les chantillons comportent n individus, en assimilant la
constitution des chantillons un tirage avec remise, la loi suivie par la variable alatoire
nX est la loi binomiale B(n, p). En utilisant une nouvelle fois le thorme 2.3, on considre
que X =
1
n

n
i=1
X
i
suit
8
la loi N
_
p,
_
p(1p)
n
_
. On note f la frquence du caractre dans
lchantillon. f est lestimation ponctuelle de p.
Dnitions 4.4 (Intervalle, coecient de conance) Soit t [0, +[. Lintervalle
_
f t
_
f(1 f)
n
, f +t
_
f(1 f)
n
_
est lintervalle de conance de la frquence p, avec un coecient de conance de 2(t) 1 ;
tant la fonction de rpartition de la loi normale centre rduite.
Exercice 4.1 (Adapt de) BTS Analyses Biologiques, session 1996, exercice 2
Partie A
Dans une ville A, le centre de transfusion sanguine eectue 2000 prlvements par jour. La probabilit
pour quun prlvement soit retenu est gale
4
5
. On estime que la population de cette ville est
susamment importante pour que les 2000 prlvements soient assimils un tirage avec remise. On
dsigne par X la variable alatoire prenant comme valeurs le nombre de prlvements retenus par
jour.
1. Dterminer la loi suivie par la variable alatoire X (en prciser les paramtres).
2. Donner lesprance mathmatique de X, puis son cart-type 10
1
prs par excs.
3. On admet que cette loi peut tre approche par une loi normale. Dterminer les paramtres de
cette loi normale.
En utilisant cette loi normale, dterminer la probabilit que plus de 1620 prlvements soient
retenus.
Partie B
Dans une ville B, le centre de transfusion sanguine eectue galement 2000 prlvements par jour.
Pendant 30 jours, on a retenu 47928 prlvements. On suppose que tous les prlvements sont ind-
pendants.
1. Donner une estimation de la probabilit p de retenir un prlvement.
8. Cest une approximation dautant plus juste que lchantillon est de grande taille.
T. Cuesta IUT de Crteil
14 4 ESTIMATION
2. En dduire une estimation du nombre de prlvements retenus par jour.
3. Dterminer un intervalle de conance au risque 5% pour la probabilit p.
Exercice 4.2 Patrice Trousset, Jean-Franois Morin, Mathmatiques pour les sciences de la vie,
tome 2 : probabilits et statistiques, Ediscience
Un mareyeur livre des caisses de thon blanc une conserverie. la rception des colis, le responsable
a des doutes sur le poids ach ; il prlve 25 caisses dont il mesure, en tonne, la moyenne et lcart-
type :
x = 1,98 t et
e
= 0,11 t.
Donner un intervalle de conance 95% du poids moyen de ces caisses.
Sachant que le poids ach est de 2 t, le mareyeur tient-il ses engagements?
Exercice 4.3 (Daprs) BTS groupement D, session 2000, exercice
tude du rsultat de la pese dun objet de masse m (exprime en grammes).
On admet que la variable alatoire X qui prend comme valeurs les rsultats de la pese dun mme
objet donn suit la loi normale de moyenne et dcart-type .
PARTIE A
Dans cette partie, on suppose que = 72,40 et = 0,08.
1. Calculer la probabilit des vnements suivants (les rsultats seront arrondis au millime le plus
proche) :
(a) X > 72,45
(b) X < 72,25
(c) 72,30 < X < 72,50 .
2. Dterminer le rel strictement positif h (arrondi au centime) tel que la probabilit pour que
X prenne une valeur dans lintervalle [ h, +h] soit gale 0,989.
PARTIE B
Dans cette partie, on suppose que et sont inconnus.
On a relev dans le tableau suivant les rsultats de 10 peses dun mme objet :
masse en grammes 72,20 72,24 72,26 72,30 72,36 72,39 72,42 72,48 72,50 72,54
les rsultats seront arrondis au centime le plus proche.
1. Calculer la moyenne et lcart-type de cet chantillon.
2. En dduire des estimations ponctuelles de la moyenne et de lcart-type de la variable
alatoire X.
3. En prenant pour cart-type la valeur estime en 1, donner un intervalle de conance au seuil
de 5% de la moyenne .
4. Lcart-type de lappareil de pes, mesur partir de nombreuses tudes antrieures, est en
ralit, pour un objet ayant environ cette masse, de 0,08. Dans cette question, on prend donc
= 0,08.
(a) Donner un intervalle de conance au seuil de 5% de la moyenne .
(b) Dterminer ( lunit prs) pour que au seuil de %, un intervalle de conance de
soit [72,31 ; 72,43].
Exercice 4.4 BTS Mtiers de leau, session 1997, exercice 2
Tous les rsultats seront arrondis au millime.
Partie A
DUT Gnie Biologique Anne universitaire 2007/2008
4.2 Estimation par intervalle de conance 15
On prlve un chantillon de 48 bouteilles la sortie dune chane de conditionnement, et on mesure
le volume v de leau contenue dans chacune des bouteilles.
Le tableau suivant rsume les rsultats obtenus :
v(en litres) 1,45 1,47 1,48 1,49 1,50 1,51 1,52 1,53
Nombre de bouteilles 3 5 5 7 8 8 7 5
1. Dterminer la moyenne et lcart-type de cette srie statistique.
2. En dduire les estimations ponctuelles de la moyenne et de lcart-type pour la production
totale.
3. Donner un intervalle de conance 99% du contenu moyen des bouteilles dun lot de 48.
Partie B
On dsigne par Q la variable alatoire qui, chaque bouteille, associe le volume deau v quelle
contient.
On admet que Q suit une loi normale dont lcart-type reste constant, gal 0,022, et dont lesprance
est 1,5.
1. Quelle est la probabilit p quune bouteille prise au hasard contienne moins de 1,48 litre deau?
2. Quelle est la probabilit que le contenu dune bouteille soit compris entre 1,48 et 1,52 litre
deau?
Partie C
Un dispositif permet de rgler la quantit deau dans chaque bouteille. La variable alatoire Q suit
alors la loi normale desprance m et dcart-type = 0,022. Lorsque la machine est bien rgle
m = 1,5. Pour pouvoir vrier que le contenu moyen des bouteilles reste bien de 1,5 litre deau, on
veut disposer dun test partir dchantillons de douze bouteilles.
1. Quelle est, lorsque le rglage est bon, la loi suivie par Q contenu moyen des bouteilles dun
paquet de douze?
2. (Question relative un test bilatral).
3. (Application du test).
Exercice 4.5 BTS Biochimiste, session 1991, exercice 1
I. On a prlev, au hasard, un chantillon form de 100 personnes dans une population dtermine
et on sintresse au taux de cholestrol de cette population. On a obtenu, pour lchantillon, les
rsultats suivants :
Taux de cholestrol en cg/l Eectif Taux de cholestrol en cg/l Eectif
[90, 110[ 1 [190, 210[ 17
[110, 130[ 2 [210, 230[ 12
[130, 150[ 18 [230, 250[ 4
[150, 170[ 26 [250, 270[ 2
[170, 190[ 16 [270, 290[ 2
1. (a) Reprsenter lhistogramme de cet chantillon.
(b) On appelle m la moyenne du taux de cholestrol de lchantillon et s son cart-type.
Calculer des valeurs approches de m et s (on donnera un rsultat 10
1
prs).
2. (a) Estimer lcart-type du taux de cholestrol pour la population.
T. Cuesta IUT de Crteil
16 5 TESTS STATISTIQUES
(b) On appelle X la variable alatoire qui, chaque individu, associe son taux de cholestrol.
On suppose que X suit une loi normale de moyenne et dcart-type . Pour la suite,
on remplacera par sa valeur estime.
Dterminer un intervalle de conance pour la moyenne du taux de cholestrol de la
population au risque de 5%.
II. Une tude dun deuxime chantillon de 100 personnes a donn, pour cet chantillon, une
moyenne de 188 cg/l et un cart-type de 30 cg/l.
Peut-on armer que les deux chantillons proviennent de la mme population au seuil de 5%?
(On admet que la grande taille des chantillons nous permet de considrer que la dirence des
moyennes dchantillons a une distribution normale).
5 Tests statistiques
Commenons par un exemple :
(Daprs La statistique infrentielle en quatre sances , publication n

118 de la commis-
sion inter-IREM Lyces techniques)
Un professeur dsireux de savoir si ses tudiants ont bien appris leurs leons, organise un
contrle sous forme de QCM. Il pose 20 questions et propose 3 rponses par question; pour
chaque question, il ny a quune seule bonne rponse parmi les trois propositions. Lobjectif du
professeur est de dbusquer les tudiants qui ne connaissent pas leur cours, et dmettre alors
un avis dfavorable pour leur passage en anne suprieure. Ces tudiants devraient rpondre
au hasard avec, pour chaque question, une probabilit gale
1
3
de donner la bonne rponse.
Le problme de ce professeur est dtablir une rgle de dcision en fonction du nombre de
bonnes rponses au QCM. Il souhaite quaucun tudiant rpondant au hasard ne bncie
dun avis favorable pour son passage (ce qui serait une erreur de premire espce), et il
souhaite galement ne pas mettre davis dfavorable pour un tudiant ayant appris son cours
(ce qui serait une erreur de seconde espce).
Soit p la proportion de rponses exactes dun tudiant au QCM. Lhypothse H
0
est p =
1
3
;
cest dire : ltudiant a rpondu au hasard. Cette hypothse est appele : hypothse nulle.
Pour chaque tudiant, on compare la frquence des rponses exactes au QCM, la frquence
attendue pour un tudiant rpondant au hasard. Lui est oppose lhypothse H
1
: p >
1
3
. Cette
dernire hypothse est appele : hypothse alternative. Pour un tudiant, soit lhypothse
H
0
sera retenue, soit elle sera rejete et alors cest lhypothse H
1
qui sera retenue. Nous
sommes en prsence dun test de conformit dune frquence (ou proportion). En
raison de la forme de lhypothse alternative H
1
, ce test est unilatral droite.
On considre un tudiant rpondant au hasard. Soit X la variable alatoire qui, chaque
tudiant de ce type, associe le nombre de rponses exactes au QCM. X suit alors la loi
binomiale B
_
20,
1
3
_
. Le professeur souhaite que lerreur de premire espce : rejeter H
0
alors que H
0
est vraie, ait une probabilit de se produire gale . est le risque de
premire espce ( est aussi appel : seuil de signication). Pour = 0,05, on constate
que P(X > 10) (cest la meilleure approximation de quand on eectue les calculs).
En fonction du rsultat prcdent, le professeur tablit la rgle de dcision suivante :
si le nombre de rponses correctes au QCM est infrieur ou gal 10, alors lhypothse
H
0
est accepte et ltudiant est pnalis dun avis dfavorable ;
si le nombre de rponses correctes au QCM est suprieur ou gal 11, alors lhypothse
H
0
est rejete et ltudiant bncie dun avis favorable.
DUT Gnie Biologique Anne universitaire 2007/2008
17
Cette rgle de dcision porte sur un nombre moyen de rponses correctes au QCM; cest
une rgle de dcision dun test de conformit dune moyenne. Pour revenir au test de
conformit dune frquence, il faut nonc la rgle de dcision en ces termes :
Si p dsigne la proportion de rponses correctes,
H
0
est accepte si p 0,5 ;
H
0
est rejete si p > 0,5.
Ce mme professeur, grce sa longue exprience du mtier de professeur, estime quun
tudiant ayant appris son cours nest pas forcment en pleine possession de ses moyens durant
le QCM. Aussi, pense-t-il quun tel tudiant rpond correctement une question du QCM
avec une probabilit gale 0,6. Pour un tel tudiant, notons Y la variable alatoire prenant
comme valeurs le nombre de rponses correctes au QCM. Y suit la loi binomiale B(20, 0,6).
Ceci permet dvaluer le risque de seconde espce, qui est la probabilit daccepter H
0
alors
que H
0
est fausse ; accepter H
0
alors que H
0
est fausse, signie ici : mettre un avis dfavorable
alors que ltudiant appris son cours. Un calcul montre que : P(Y 10) = 0,24 10
2
prs.
Le risque de seconde espce, not , est ici 0,24.
La puissance du test est la probabilit de rejeter H
0
en ayant raison de le faire, cette
probabilit est gale 1 .
Si et sont respectivement les risques de premire et de seconde espce, on retiendra le
tableau donnant les probabilits :
Hypothse vraie
H
0
H
1
Hypothse H
0
1
accepte H
1
1
Lhypothse nulle H
0
est de type : p = p
0
, o p
0
est la valeur attendue pour p.
Lhypothse alternative H
1
peut alors tre :
p = p
0
, le test est alors bilatral ;
p < p
0
, le test est alors unilatral gauche ;
p > p
0
, le test est alors unilatral droite.
Exercice 5.1 Daprs BTS Analyses Biologiques, session 1999
Les statistiques ont permis dtablir quen priode de comptition, la probabilit pour un sportif pris
au hasard, dtre dclar positif au contrle antidopage est gale 0,02.
On dcide de construire un test qui, la suite des contrles sur un chantillon de 50 sportifs
prlev au hasard, permette de dcider si, au seuil de signication de 10%, le pourcentage de sportifs
contrls positifs est de p = 0,02.
1. Construction dun test bilatral :
Soit F la variable alatoire qui, tout chantillon alatoire (suppos non exhaustif) de 50
sportifs contrls, associe le pourcentage de sportifs contrls positivement.
On suppose que F suit la loi normale N
_
p,
_
p(1p)
n
_
o p = 0,02 et n = 50.
noncer une hypothse nulle H
0
et une hypothse alternative H
1
pour ce test bilatral.
Dterminer, sous lhypothse H
0
, le rel positif a tel que P(p a F p +a) = 0,9.
noncer la rgle de dcision.
2. Utilisation du test :
Dans lchantillon E, deux contrles antidopage ont t dclars positifs. En appliquant la rgle
de dcision du test cet chantillon (assimil un chantillon alatoire non exhaustif), peut-on
T. Cuesta IUT de Crteil
18 5 TESTS STATISTIQUES
conclure au seuil de risque 10% que lchantillon observ est reprsentatif de lensemble des la
population?
Exercice 5.2 Daprs BTS Comptabilit et Gestion, session 1990
Avant dengager une campagne publicitaire, la direction de lhypermarch vous demande de construire
un test unilatral qui, au vu des chires daaires journaliers des trente jours ouvrables suivant cette
campagne, permettre de dcider si, au seuil de signication de 5%, la moyenne des chires daaires
journaliers a augment, cest dire dpass 1,5 millions de francs, la suite de cette campagne
publicitaire.
1. Construction du test unilatral :
On note la moyenne inconnue de la nouvelle population des chires daaires journaliers
obtenus aprs la campagne publicitaire, et on suppose que lcart type de cette population est
0,3 million de francs.
Soit Z la variable alatoire qui, tout chantillon alatoire, non exhaustif, de trente chires
daaires journaliers de cette nouvelle population, associe la moyenne de ceux-ci. On suppose
que Z suit la loi normale de moyenne et dcart type
0,3

30
.
(a) Choisir une hypothse nulle H
0
et une hypothse alternative H
1
pour ce test unilatral.
(b) Dterminer le nombre rel h tel que, sous lhypothse H
0
, on ait : P(Z h) = 0,95.
(c) noncer la rgle de dcision de ce test.
2. Utilisation de ce test :
Les chires daaires journaliers pendant les trente jours ouvrables suivant la campagne publi-
citaire sont donns par le tableau suivant :
chires daaires 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2 2,1 2,2 2,3
nombre de jours 1 2 2 8 8 2 2 1 2 1 0 1
(a) Calculer la moyenne des chires daaires journaliers pendant ces trente jours.
(b) En appliquant la rgle de dcision du test cet chantillon de trente chires daaires
journaliers que lon assimile un chantillon non exhaustif, peut-on conclure, au seuil de
signication 5% qu la suite de la campagne publicitaire, la moyenne des chires daaires
journaliers a dpass 1,5 millions de francs?
DUT Gnie Biologique Anne universitaire 2007/2008