Vous êtes sur la page 1sur 47

Opration et systmes de dcision

Facult des Sciences de lAdministration

MQT-21919
Probabilits et statistique

Estimation par intervalle

Chapitre 8

Lectures

Volume obligatoire: Chapitre 8

Volume recommand, Statistique en gestion et


conomie: sections 4.4.2 et 4.4.4 ainsi que pages
227-242

Rsum des distributions

dchantillonnage de

Si n est grand (plus grand que 30), alors x suit 2


x
x
une loi Normale et:
2
x N ( , )
Si la valeur de est connue alors:
n
2
Si la valeur de est inconnue alors: x N ( , s )

Si n est petit (plus petit que 30), et X suit une loi


normale, et:
2
Si la valeur de est connue alors:
Si la valeur de est inconnue alors:

x N ( , )
n
x
t( n 1 )
s
n

Lestimation par intervalle de


confiance

Les estimations ponctuelles, bien quutiles, ne


fournissent aucune information concernant la
prcision des estimations cest--dire quelles ne
tiennent pas compte de lerreur possible dans
lestimation, erreur attribuable aux fluctuations
dchantillonnage.

Lestimation par intervalle de


confiance
Population
Moyenne, ,
est inconnue
chantillon

chantillon alatoire
Moyenne = 50

Je suis confiant
95% que est
entre 40 & 60.

Lestimation par intervalle de


confiance

Consiste construire, autour de lestimation


ponctuelle, un intervalle qui aura une grande
probabilit (1- ) de contenir la vraie valeur du
paramtre.

Lestimation par intervalle de


confiance
Forte probabilit que le paramtre se trouve
quelque part lintrieur de lI. de C.
Valeur de la
statistique
Intervalle de confiance
calcule
partir de
lchantillon
Limite infrieure

Limite suprieure

Affirmations propos de lerreur


d'chantillonnage

La connaissance de la distribution
dchantillonnage de xnous permet de tirer des
conclusions sur lerreur chantillonnale mme si on
ne connat pas la vraie valeur de

La probabilit que lintervalle de confiance


contienne la vraie valeur du paramtre est de 1- .
1- is est le coefficient de confiance
(1-)*100% est le seuil de confiance

La marge derreur E

Intervalle de confiance

Limite infrieure

Valeur de la
statistique x

Limite suprieure

La marge derreur E (prcision)


La moiti de la largeur de lintervalle

Estimation par intervalle de la moyenne de la


population: grand chantillon

Lorsque la taille de l'chantillon est grande (n 30) et la variance de la population de


X est connue, on obtient un intervalle de confiance pour au seuil de confiance 1- en
utilisant lquation suivante:

1
P x z 2 .
x z 2 .
n
n

a vient du fait que: x N ( ,


)
Ceci est aussi vrai pour de petits chantillons lorsque
n la variable alatoire X suit une loi
normale et que la variance de X est connue.

Estimation par intervalle de la moyenne


de la population: grand chantillon

Lorsque (n 30) et est connu, lintervalle de confiance


pour est

x z / 2
1 - est le coefficient de confiance

z/2 est la valeur de z qui correspond une surface de /2 sous la


queue suprieure de la distribution de la loi normale centrale
rduite
Cet intervalle a une probabilit de 1- de contenir le vrai
paramtre
Ceci est aussi vrai pour de petits chantillons lorsque la variable alatoire X
suit une loi normale et que la variance de X est connue.

La marge d'erreur E (prcision)

La prcision de lestimation : Il y a une probabilit de 1 - que la valeur de la moyenne chantillonnale

fournisse une marge derreur de

ou moins.

z/2 est la valeur telle que


P(Z> z/2)= /2 o Z suit
une loi normale centre rduite

z /2 x

Distribution
chantillonnale
de x

/2

-z/2

1 - de toutes
les valeurs dex

/2

z/2

Exemple: U-Mart
U-Mart a 260 magasins travers le pays. Ils
valuent le potentiel dun emplacement dun
nouveau magasin bas sur le revenu annuel
moyen des gens qui composent le march cibl
de ce nouveau magasin. On sait que = $5 000.
La taille de lchantillon est n = 64.

Exemple: U-Mart

Supposons que la moyenne chantillonnale


soit $21x100.
Pour =5%, la marge derreur est 1,96 o
=625, ce
qui correspond $1 225

Lestimation par intervalle de est [$21,100 + $1225], ou


[$19 875 $22 325]
On est confiant 95% que cet intervalle contient la
moyenne de la population
La probabilit que la moyenne chantillonnale donne une
erreur d au plus $1 225 est donc de 95%

Estimation par intervalle de la moyenne


de la population: grand chantillon

Exemple :
X = salaire horaire N(= 9)
n = 36
x = 25 $
I. de C. 95 % pour ?

Estimation par intervalle de la moyenne de la


population: grand chantillon
Lorsque la taille de l'chantillon est grande (n 30) et la variance de la
population de X est inconnue, on obtient un intervalle de confiance pour
au seuil de confiance 1- en utilisant lquation suivante:

1
P x z 2 .
x z 2 .
n
n

a vient du fait que:

s2
x N ( , )
n

Estimation par intervalle de la moyenne


de la population: grand chantillon
Lorsque la taille de l'chantillon est grande (n 30) et
la variance de la population de X est inconnue,
l'intervalle de confiance pour au seuil de confiance
1- est :
s

x z / 2 n
1 - est le coefficient de confiance, s est l'cart-type de
l'chantillon
z/2 est la valeur de z qui correspond une surface de /2 sous
la queue suprieure de la distribution de la loi normale
centrale rduite
Cet intervalle a une probabilit de 1- de contenir le vrai paramtre

Lestimation par intervalle de confiance


pour

Lorsque la taille de l'chantillon est petite (n <30) et X suit une loi normale
de variance inconnue, on obtient un intervalle de confiance pour au seuil
de confiance 1- en utilisant lquation suivante::

1
P x t 2 .
x t 2 .
n
n

a vient du fait que:

x
t( n 1 )
s
n

Estimation par intervalle de la moyenne de la


population: petit chantillon(n < 30)

Lintervalle de confiance est


o:
1 - = le coefficient de confiance
(1 - )*100 % = le seuil de confiance

s
x t 2 n 1
n

t /2 = est la valeur t qui donne une surface de /2 dans


la queue suprieure dune distribution t avec n - 1 degrs
de libert
s = est lcart-type de lchantillon

Exemple: location
dappartement

Un reporter pour un journal tudiant est en train de


rdiger un article sur le cot du logement prs du
campus. Un chantillon de 10 appartements (trois et
demi) dans un rayon de 1 km de luniversit a permis
destimer le cot moyen du loyer mensuel 350 par mois
et un cart type de 30. Quel est lintervalle de confiance
de 95% pour la moyenne des loyers mensuels?
Supposons que les loyers suivent une loi normale.

Exemple: location
dappartement

Valeur t
pour un coefficient de confiance de 0,95 , 1 - = 0,95, = 0,05, et
/2 = 0,025.
t0,025 est bas sur n - 1 = 10 - 1 = 9 degrs de libert. Dans la table de
la distribution t on trouve que t0,025 = 2,262.
Degrs
Degrees

Surface
sousinlaUpper
queue Tail
suprieure
Area

of
deFreedom
libert
.

.10
.

.05
.

.025
.

.01
.

.005
.

7
8

1.415
1.397

1.895
1.860

2.365
2.306

2.998
2.896

3.499
3.355

9
10

1.383
1.372
.

1.833
1.812
.

2.262
2.228
.

2.821
2.764
.

3.250
3.169
.

Exemple: location
dappartement
x t 0 , 025

s
n

30
350 2,262
10

[ $ 350 + $ 21,46]
ou
[$328,54 $371,46]
Nous sommes confiants 95% que la moyenne
des loyers mensuels (le vrai paramtre de la
population , se trouve entre $328,54 et $371,46.

Lestimation par intervalle de confiance


pour petit chantillon(n < 30)
Exemple :
n = 25 sur N( )
x = 15
s2 = 9
I. de C. 95 % pour ?

Estimation par intervalle de la moyenne de la


population: petit chantillon(n < 30)

Population ne suit pas une loi normale


La seule option est daugmenter la taille de lchantillon
n > 30 et utiliser les procdures destimation par intervalle
pour un grand chantillon
Population suit une loi normale et est connu
Utiliser les procdures pour un grand chantillon
Population suit une loi normale et est inconnu
Lestimation par intervalle est base sur une distribution
appele la distribution t ou de Student

Rsum des intervalles de confiance dex

Si n est grand (plus grand que 30), et :


si la valeur de est connue alors:
si la valeur de est inconnue alors:

/
2
/ 2

n
s

/
2
/ 2

Si n est petit (plus petit que 30), la population


suit une loi normale et:

si la valeur de est connue alors:


si la valeur de est inconnue alors:

x z // 22

x t 2 n 1

Dtermination de la taille de lchantillon en


fonction de la prcision dsire

Dans le cas o 2 est connue, la grandeur de n


a une influence directe sur la largeur de
lintervalle de confiance pour et donc sur la
prcision de lestimation ainsi obtenue.

Taille de lchantillon: n = ?

Trop grande:
Exige trop de
ressources

Trop petite:
Pas assez
prcis

Dtermination de la taille de lchantillon en fonction


de la prcision dsire

Quelle est la taille n de lchantillon qui permettrait daffirmer


quen utilisant un estimateur ponctuel, lerreur commise pour un
coefficient de confiance 1- serait moindre que la marge derreur
E?

E est la quantit ajoute et soustraite de lestimation ponctuelle afin


dobtenir une estimation par intervalle. C'est la prcision.

E= lerreur maximale commise pour un coefficient de confiance 1-


(marge derreur)

E z 2 .

Dtermination de la taille de lchantillon en


fonction de la prcision dsire

Si on fixe E alors on peut dduire la taille n comme


suit :

z 2 .

Exemple: U-Mart

Supposons que lquipe de gestion de U-Mart


veuille obtenir une estimation de la moyenne de
la population avec une probabilit de 0,95 que
lerreur dchantillonnage soit $500 ou moins.
Quelle est la taille de lchantillon ncessaire
pour obtenir cette prcision?

Exemple: U-Mart
Au seuil de confiance de 95% , z0,025 = 1,96.
On se souvient que = 5 000 donc,
en rsolvant pour n on obtient
2

(1,96) (5000)
n

384
2
(500)
On a besoin dun chantillon de 384 pour arriver
une prcision de + $500 un seuil de confiance
de 95%

Lestimation par intervalle de confiance


pour p
Lorsque n est grand:

P p z 2

p( 1 p )
p p z 2
n

a vient du fait que:

p( 1 p )
1

p( 1 p )
p N p,

Estimation par intervalle pour la proportion


de population
Lintervalle de confiance est:

p z / 2

p( 1 p )

o: 1 - est le coefficient de confiance


z/2 est la valeur z correspondant une surface
/2 sous la queue suprieure de la
distribution normale centre rduite
est la proportion chantillonnale

Exemple Sciences Po. Inc.

Sciences Po. Inc. (SPI) est une compagnie qui se


spcialise dans les sondages politiques. laide
de sondages tlphoniques, les interviewers
demandent aux citoyens pour qui ils voteraient
si les lections avaient lieu aujourdhui.
Rcemmment, SPI a trouv que 220 votants sur
500 voterait pour un candidat particulier. SPI
veut estimer lintervalle de confiance 95%
pour la proportion des votants qui sont en
faveur de ce candidat.

Exemple Sciences Po. Inc.

n = 500,

p z / 2

p( 1 p )

=p220/500 = 0,44,

z/2 = 1,96

0 , 44( 1 0 , 44 )
0 , 44 1,96

500

[0,44 0,0435]
SPI est confiant 95% que la proportion des votants qui
favoriseront ce candidat est entre
0,3965 et 0,4835.

Taille dchantillon pour la proportion dchantillon

Considrons la taille dchantillon ncessaire pour estimer


avec un niveau de prcision donn, la proportion de la
population. Si on connat la valeur spcifique de p alors :

z2

p (1 p )

E2
Sinon, on peut approximer p par psi cette donne est
disponible

Pour p totalement inconnue, on sait que la valeur maximale


du produit pq est de 0,25, on peut alors approximer:

z2

4E

2
2

Exemple Sciences Po. Inc.

Supposons que SPI veuille une probabilit 0,99


que la proportion dchantillon se retrouve en
dedans de 0,03 de la proportion de la
population. Quelle taille dchantillon n est
ncessaire pour obtenir cette prcision?

Exemple Sciences Po. Inc.


un seuil de confiance de 99%, z0,005 = 2,576.

( z / 2 )2 p(1 p) (2,576)2 (0,44)(0,56)


n

1817
2
2
E
(0,03)
Note: Nous avons utilis p=0,44, la meilleure
estimation de p. Si aucune information nest disponible
sur p, on utilise alors 0,5 comme valeur pour p, ce qui
donne la taille dchantillon maximale pour cette
prcision. Si on avait utilis p = 0,5, le n suggr aurait
t 1843.

Distribution dchantillonnage de la variance


de lchantillon ( s2 ) : loi du 2 (Khi-deux)

Si X suit une loi normale alors la statistique:


2
2
( n 1 )d l
2

( n 1 )s

suit

dl: degrs de liberts

Donc la distribution dchantillonnage de


n 1 2
2
s

n 1 2
s
2

est:

2( n 1)

Loi du 2 et ses degrs de libert


Degrs de libert =
(taille de lchantillon) - (# de paramtres indpendants estimer)
n

1
2
xi x
s

n 1 i 1
2

n 1 s 2
2

x
i

i 1

Thorme:
Si n augmente indfiniment (n ) ,
alors: loi du 2 (n) loi N( n, 2n)

~ 2 n 1

Loi du 2

Ex: n = 10, P( (10 dl) > 15,99) = 0,1

15,99

Table 3 p. 694, probabilit dans la queue suprieure

Lestimation par intervalle de confiance


pour 2

Nous utiliserons la statistique suivante :

o:

n 1 s

2
1 2

n 1 s

n 1

2
2

Lestimation par intervalle de confiance pour


2
L'intervalle de confiance au seuil 1- pour 2
est:

n 1 s
2
2

(n-1d.l.)

n 1 s

2
1 2

(n-1d.l.)

Lestimation par intervalle de confiance


pour 2
Exemple :
n = 51
s2 = 100
Donner lintervalle de confiance 95 % pour 2

Exemple
Une firme spcialise fait une tude de march pour
dterminer le montant annuel moyen dpens par les
familles qubcoises pour lachat de vitamines. On dsire
une erreur destimation maximale de 2 $ un seuil de
confiance de 90 %. On suppose que lcart type de la
variable considre est de 7 $. Quelle doit tre la taille de
lchantillon prlev ?
Rp. 33

Exemple
Pour valuer la cote de popularit des missions tlvises, on procde
habituellement par chantillonnage.
On veut estimer la proportion p des mnages (d'une grande population) qui
visionnent un talk-show le lundi soir au canal 1 entre 21h30 et 22h30, par
l'intermdiaire d'un chantillon alatoire de taille n. Si on veut que notre erreur
d'estimation soit d'au plus 3 % avec une probabilit d'au moins 95%, quelle taille n
d'chantillon devrait-on choisir ?
Rp. 1068

Exemple
Le service du personnel dune entreprise choisit au hasard 25 employs et constate
que le salaire moyen est de 1500 $ par mois. On suppose que les salaires suivent une
distribution normale. On sait par ailleurs que lcart type de cette distribution est de
100 $.

Estimer le salaire moyen des employs de lentreprise laide dun intervalle de


confiance 90 %. [1467,1;1532,9]

Supposons quon ignore lcart type de la population alors quon sait que lcart type
de lchantillon de 25 personnes est de 100$. Estimer le salaire moyen des employs
de lentreprise laide dun intervalle de confiance 90 %. [1465,78;1534,22]

On se replace dans le cas o lcart type de la population est connu (= 100 $).
x tre certain, un
Quelle devrait tre la taille minimale de lchantillon si on veut
seuil de confiance de 90 %, que lerreur relie lutilisation de comme estimateur
de , ne dpassera pas 10 $ ? n=269