Vous êtes sur la page 1sur 45

Résumé des distributions

d’échantillonnage de x

➢ Si n est grand (plus grand que 30), alors x suit 2


une loi Normale et: x s x
s 2

– Si la valeur de s est connue alors: x  N ( , )


n
– Si la valeur de s est inconnue alors: x  N (  , s )
2

➢ Si n est petit (plus petit que 30), et X suit une loi


normale, et: 2
s
– Si la valeur de s est connue alors: x  N ( , )
n
– Si la valeur de s est inconnue alors: x−
 t( n − 1 )
s
n
L’estimation par intervalle de
confiance

➢ Les estimations ponctuelles, bien qu’utiles, ne


fournissent aucune information concernant la
précision des estimations c’est-à-dire qu’elles ne
tiennent pas compte de l’erreur possible dans
l’estimation, erreur attribuable aux fluctuations
d’échantillonnage.
L’estimation par intervalle de
confiance

Population Échantillon aléatoire


Je suis confiant à
Moyenne, , Moyenne = 50 95% que  est
est inconnue entre 40 & 60.

Échantillon
L’estimation par intervalle de
confiance

➢ Consiste à construire, autour de l’estimation


ponctuelle, un intervalle qui aura une grande
probabilité (1-a) de contenir la vraie valeur du
paramètre.
L’estimation par intervalle de
confiance
Forte probabilité que le paramètre se trouve
quelque part à l’intérieur de l’I. de C.
Valeur de la
Intervalle de confiance statistique
calculée à
partir de
l’échantillon

Limite inférieure Limite supérieure


Affirmations à propos de l’erreur
d'échantillonnage

➢ La connaissance de la distribution
d’échantillonnage de x nous permet de tirer des
conclusions sur l’erreur échantillonnale même si
on ne connaît pas la vraie valeur de .

➢ La probabilité que l’intervalle de confiance


contienne la vraie valeur du paramètre  est de
1-a.
– 1-a is est le coefficient de confiance
– (1-a)*100% est le seuil de confiance
La marge d’erreur E

Valeur de la
Intervalle de confiance
statistique x

Limite inférieure Limite supérieure

La marge d’erreur E (précision)


La moitié de la largeur de l’intervalle
Estimation par intervalle de la moyenne de la
population: grand échantillon

Lorsque la taille de l'échantillon est grande (n ≥ 30) et la variance de la


population de X est connue, on obtient un intervalle de confiance pour  au
seuil de confiance 1-a en utilisant l’équation suivante:

 s s 
P  x − za 2 .    x + za 2 .  = 1 − a
 n n
Ça vient du fait que: x  N (  ,s 2
)
n
Ceci est aussi vrai pour de petits échantillons lorsque la variable aléatoire X
suit une loi normale et que la variance de X est connue.
Estimation par intervalle de la
moyenne de la population: grand
échantillon
➢ Lorsque (n ≥ 30) et s est connu, l’intervalle de confiance
pour  est  s 
 x  za / 2
 n 
➢ 1 -a est le coefficient de confiance
➢ za/2 est la valeur de z qui correspond à une surface de a/2 sous la
queue supérieure de la distribution de la loi normale centrale
réduite
➢ Cet intervalle a une probabilité de 1-a de contenir le vrai
paramètre 
➢ Ceci est aussi vrai pour de petits échantillons lorsque la variable aléatoire X
suit une loi normale et que la variance de X est connue.
La marge d'erreur E (précision)

➢ La précision de l’estimation : Il y a une


probabilité de 1 - a que la valeur de la moyenne
échantillonnale x fournisse une marge d’erreur
de za /2 s x ou moins. Distribution
za/2 est la valeur telle que échantillonnale
de x
P(Z> za/2)=a/2 où Z suit
une loi normale centrée réduite 1 - a de toutes
a/2 les valeurs de x a/2

-za/2 za/2 x

Exemple: U-Mart

U-Mart a 260 magasins à travers le pays. Ils


évaluent le potentiel d’un emplacement d’un
nouveau magasin basé sur le revenu annuel
moyen des gens qui composent le marché ciblé
de ce nouveau magasin. On sait que s = $5 000.
La taille de l’échantillon est n = 64.
Exemple: U-Mart
➢ Supposons que la moyenne échantillonnale x
soit $21 100. Pour a=5%, la marge d’erreur est
1,96 s x oùs x =625, ce qui correspond à $1 225

➢ L’estimation par intervalle de  est [$21,100 +


$1225], ou [$19 875 à $22 325]

➢ On est confiant à 95% que cet intervalle contient


la moyenne de la population
➢ La probabilité que la moyenne échantillonnale
donne une erreur d’ au plus $1 225 est donc de
Estimation par intervalle de la
moyenne de la population: grand
échantillon

Exemple :

X = salaire horaire  N(, s2= 9)


n = 36
x = 25 $
I. de C. à 95 % pour  ?
Estimation par intervalle de la moyenne de
la population: grand échantillon

Lorsque la taille de l'échantillon est grande (n ≥ 30) et la variance de la


population de X est inconnue, on obtient un intervalle de confiance pour 
au seuil de confiance 1-a en utilisant l’équation suivante:

 s s 
P  x − za 2 .    x + za 2 .  = 1 − a
 n n

s2
Ça vient du fait que: x  N ( , )
n
Estimation par intervalle de la
moyenne de la population: grand
échantillon

Lorsque la taille de l'échantillon est grande (n ≥ 30) et


la variance de la population de X est inconnue,
l'intervalle de confiance pour  au seuil de confiance
1-a est :  s 
 x  za / 2
 n 
➢ 1 -a est le coefficient de confiance, s est l'écart-type de
l'échantillon
➢ za/2 est la valeur de z qui correspond à une surface de a/2 sous
la queue supérieure de la distribution de la loi normale
centrale réduite
➢ Cet intervalle a une probabilité de 1-a de contenir le vrai paramètre 
L’estimation par intervalle de confiance
pour 

Lorsque la taille de l'échantillon est petite (n <30) et X suit une loi normale
de variance inconnue, on obtient un intervalle de confiance pour  au seuil
de confiance 1-a en utilisant l’équation suivante::

 s s 
P  x − ta 2 .    x + ta 2 .  = 1 − a
 n n
x−
Ça vient du fait que:  t( n − 1 )
s
n
Estimation par intervalle de la moyenne de la
population: petit échantillon(n < 30)

L’intervalle de confiance est  s 


x  ta ( n − 1)

où:  
 2 n
1 -a = le coefficient de confiance
(1 -a )*100 % = le seuil de confiance

ta/2 = est la valeur t qui donne une surface


de a/2 dans la queue supérieure d’une
distribution t avec n - 1 degrés de liberté

s = est l’écart-type de l’échantillon


Exemple: location
d’appartement
➢ Un reporter pour un journal étudiant est en train de
rédiger un article sur le coût du logement près du
campus. Un échantillon de 10 appartements (trois et
demi) dans un rayon de 1 km de l’université a permis
d’estimer le coût moyen du loyer mensuel à 350 par mois
et un écart type de 30. Quel est l’intervalle de confiance
de 95% pour la moyenne des loyers mensuels?
Supposons que les loyers suivent une loi normale.
Exemple: location
d’appartement
➢ Valeur t
– pour un coefficient de confiance de 0,95 , 1 - a = 0,95, a = 0,05, et
a/2 = 0,025.
– t0,025 est basé sur n - 1 = 10 - 1 = 9 degrés de liberté. Dans la table de
la distribution t on trouve que t0,025 = 2,262.
Degrés
Degrees Surface sousinlaUpper
Area queue Tail
supérieure
deFreedom
of liberté ,10 ,05 ,025 ,01 ,005
. . . . . .
7 1,415 1,895 2,365 2,998 3,499
8 1,397 1,860 2,306 2,896 3,355
9 1,383 1,833 2,262 2,821 3,250
10 1,372 1,812 2,228 2,764 3,169
. . . . . .
Exemple: location
d’appartement
s 30
x  t0 , 025 350  2,262
n 10
[ $ 350 + $ 21,46]
ou [$328,54 à $371,46]

Nous sommes confiants à 95% que la moyenne


des loyers mensuels (le vrai paramètre de la
population ), se trouve entre $328,54 et
$371,46.
L’estimation par intervalle de confiance
pour  petit échantillon(n < 30)

Exemple :

n = 25 sur N(, s2)


x = 15
s2 = 9
I. de C. à 95 % pour  ?
Estimation par intervalle de la moyenne de la
population: petit échantillon(n < 30)

➢ Population ne suit pas une loi normale


La seule option est d’augmenter la taille de l’échantillon à
n > 30 et utiliser les procédures d’estimation par intervalle
pour un grand échantillon

➢ Population suit une loi normale et s est connu


Utiliser les procédures pour un grand échantillon

➢ Population suit une loi normale et s est inconnu


L’estimation par intervalle est basée sur une distribution
appelée la distribution t ou de Student
Résumé des intervalles de confiance de
x

➢ Si n est grand (plus grand que 30), et :


 s 
– si la valeur de s est connue alors: 

x  z a / 2
n
– si la valeur de s est inconnue alors: 
 x  z
s 
n
a / 2
 

➢ Si n est petit (plus petit que 30), la population


suit une loi normale et:  s 
 x  za / 2
– si la valeur de s est connue alors:  n

– si la valeur de s est inconnue alors:  s 


 x  ta ( n − 1) 
 2 n
Détermination de la taille de l’échantillon en
fonction de la précision désirée

➢ Dans le cas où s2 est connue, la grandeur de n


a une influence directe sur la largeur de
l’intervalle de confiance pour  et donc sur la
précision de l’estimation ainsi obtenue.
Taille de l’échantillon: n = ?

Trop grande: Trop petite:


Exige trop de Pas assez
ressources précis
Détermination de la taille de l’échantillon en
fonction de la précision désirée

➢ Quelle est la taille n de l’échantillon qui permettrait d’affirmer


qu’en utilisant un estimateur ponctuel, l’erreur commise pour un
coefficient de confiance 1-a serait moindre que la marge d’erreur
E?

➢ E est la quantité ajoutée et soustraite de l’estimation ponctuelle afin


d’obtenir une estimation par intervalle. C'est la précision.

➢ E= l’erreur maximale commise pour un coefficient de confiance 1-a


(marge d’erreur)
s
E = za 2 .
n
Détermination de la taille de l’échantillon en
fonction de la précision désirée

Si on fixe E alors on peut déduire la taille n comme


suit :

2
 za 2 .s 
n= 
 E 
Exemple: U-Mart
➢ Supposons que l’équipe de gestion de U-Mart
veuille obtenir une estimation de la moyenne de
la population avec une probabilité de 0,95 que
l’erreur d’échantillonnage soit $500 ou moins.
Quelle est la taille de l’échantillon nécessaire
pour obtenir cette précision?
Exemple: U-Mart
Au seuil de confiance de 95% , z0,025 = 1,96.
On se souvient que s = 5 000 donc,
en résolvant pour n on obtient
2 2
(1,96) (5000)
n= 2
= 384
(500)
On a besoin d’un échantillon de 384 pour arriver
à une précision de + $500 à un seuil de confiance
de 95%
L’estimation par intervalle de confiance
pour p

Lorsque n est grand:

 p( 1 − p ) p( 1 − p ) 
P  p − za 2

 p  p + za 2  = 1 − a
 n n 

 p( 1 − p ) 
Ça vient du fait que: p  N  p, 
 n 
Estimation par intervalle pour la
proportion de population

 p( 1 − p ) 
 p  za / 2
L’intervalle de confiance est: 
 n 
où: 1 -a est le coefficient de confiance

za/2 est la valeur z correspondant à une


surface a/2 sous la queue supérieure de la
distribution normale centrée réduite

p est la proportion échantillonnale


Exemple Sciences Po. Inc.
➢ Sciences Po. Inc. (SPI) est une compagnie qui se
spécialise dans les sondages politiques. À l’aide
de sondages téléphoniques, les interviewers
demandent aux citoyens pour qui ils voteraient
si les élections avaient lieu aujourd’hui.
Récemmment, SPI a trouvé que 220 votants sur
500 voterait pour un candidat particulier. SPI
veut estimer l’intervalle de confiance à 95%
pour la proportion des votants qui sont en
faveur de ce candidat.
Exemple Sciences Po. Inc.
 p( 1 − p ) 
 p  za / 2 
 n 
où n = 500, p = 220/500 = 0,44, za/2 = 1,96
 0 , 44( 1 − 0 , 44 ) 
0 , 44  1,96 
 500 
[0,44 ± 0,0435]
SPI est confiant à 95% que la proportion des
votants qui favoriseront ce candidat est entre
0,3965 et 0,4835.
Taille d’échantillon pour la proportion d’échantillon

⚫ Considérons la taille d’échantillon nécessaire pour estimer


avec un niveau de précision donné, la proportion de la
population. Si on connaît la valeur spécifique de p alors :
za2 2 p (1 − p )
n=
E2
⚫ Sinon, on peut approximer p par psi cette donnée est
disponible

⚫ Pour p totalement inconnue, on sait que la valeur maximale


du produit pq est de 0,25, on peut alors approximer:
za2 2
n= 2
4E
Exemple Sciences Po. Inc.
➢ Supposons que SPI veuille une probabilité 0,99
que la proportion d’échantillon se retrouve en
dedans de ±0,03 de la proportion de la
population. Quelle taille d’échantillon n est
nécessaire pour obtenir cette précision?
Exemple Sciences Po. Inc.

À un seuil de confiance de 99%, z0,005 = 2,576.

( za / 2 )2 p(1 − p) (2,576)2 (0,44)(0,56)


n= 2
= 2
 1817
E (0,03)
Note: Nous avons utilisé p=0,44, la meilleure
estimation de p. Si aucune information n’est disponible
sur p, on utilise alors 0,5 comme valeur pour p, ce qui
donne la taille d’échantillon maximale pour cette
précision. Si on avait utilisé p = 0,5, le n suggéré aurait
été 1843.
Distribution d’échantillonnage de la variance
de l’échantillon ( s2 ) : loi du c2 (Khi-deux)

Si X suit une loi normale alors la statistique:


( n − 1 )s 2
suit c 2
( n −1 )d
s 2
dl: degrés de libertés
n −1
Donc la distribution d’échantillonnage de s2 est: c 2 ( n −1 )
s2

 n −1 
P  2 s2   c 2
 s 

0 c 2
Loi du c2 et ses degrés de liberté

Degrés de liberté =
(taille de l’échantillon) - (# de paramètres indépendants à estimer)

n
n
(n − 1) s 2 (
 ix − x )2

s =
2 1
 ( xi − x )2
= i =1 ~ c 2 (n −1)
n − 1 i =1 s2 s2
Théorème:
Si n augmente indéfiniment (n → ) ,
alors: loi du c2 (n) → loi N( n, 2n)
Loi du c2

Ex: n = 10, P(c2 (10 dl) > 15,99) = 0,1

0 15,99
c20,1
Table 3 p. 694, probabilité dans la queue supérieure
L’estimation par intervalle de confiance
pour s2

Nous utiliserons la statistique suivante :

c 2
=
( n − 1) s 2

c 2
( n−1)
où: s 2

 2
P  c1−a 2 
( n − 1) s  2

 ca 2  = 1 − a
2
 s 2 
 
L’estimation par intervalle de confiance
pour s2

➢ L'intervalle de confiance au seuil 1-a pour s2


est:

 ( n − 1) s 2 ( n − 1) s 2

 2 , 2 
 ca 2 (n-1d.l.) c1−a 2 (n-1d.l.) 
L’estimation par intervalle de confiance
pour s2

Exemple :

n = 51
s2 = 100

Donner l’intervalle de confiance à 95 % pour s2


Exemple

Une firme spécialisée fait une étude de marché pour


déterminer le montant annuel moyen dépensé par les
familles québécoises pour l’achat de vitamines. On désire
une erreur d’estimation maximale de 2 $ à un seuil de
confiance de 90 %. On suppose que l’écart type de la
variable considérée est de 7 $. Quelle doit être la taille de
l’échantillon prélevé ?
Rép. 33
Exemple

Pour évaluer la cote de popularité des émissions télévisées, on procède


habituellement par échantillonnage.

On veut estimer la proportion p des ménages (d'une grande population) qui


visionnent un talk-show le lundi soir au canal 1 entre 21h30 et 22h30, par
l'intermédiaire d'un échantillon aléatoire de taille n. Si on veut que notre erreur
d'estimation soit d'au plus 3 % avec une probabilité d'au moins 95%, quelle taille n
d'échantillon devrait-on choisir ?
Rép. 1068
Exemple
Le service du personnel d’une entreprise choisit au hasard 25 employés et constate
que le salaire moyen est de 1500 $ par mois. On suppose que les salaires suivent une
distribution normale. On sait par ailleurs que l’écart type de cette distribution est de
100 $.

⚫ Estimer le salaire moyen des employés de l’entreprise à l’aide d’un intervalle de


confiance à 90 %. [1467,1;1532,9]

⚫ Supposons qu’on ignore l’écart type de la population alors qu’on sait que l’écart type
de l’échantillon de 25 personnes est de 100$. Estimer le salaire moyen des employés
de l’entreprise à l’aide d’un intervalle de confiance à 90 %. [1465,78;1534,22]

⚫ On se replace dans le cas où l’écart type de la population est connu (s= 100 $).
Quelle devrait être la taille minimale de l’échantillon si on veutx être certain, à un
seuil de confiance de 90 %, que l’erreur reliée à l’utilisation de comme estimateur
de , ne dépassera pas 10 $ ? n=269

Vous aimerez peut-être aussi