Vous êtes sur la page 1sur 14

CHANTILLONNAGE - ESTIMATION

- Partie A - chantillonnage -
L'objectif decettepartieest derpondrelaproblmatiquesuivante: comment, partir d'informations (couple
moyenne-cart-type ou proportion) connues sur une population, peut-on prvoir celles d'un chantillon ?
Nousdistingueronsdeux cas: celui ol'ontudieunemoyenne dans un chantillon et celui ol'on tudieune
proportion dansunchantillon.
A.1. tude de la moyenne d'un chantillon
Ondisposed'unepopulationsur laquelleest dfinieunevariablealatoireX dont on connat l'esprance(oula
moyenne) et l'cart-typeo.
On s'intresse aux chantillons de taille n. Auront-ils tous la mme moyenne ? Non, certains peuvent tre
constitus d'lments atypiques et avoir une moyenne trs diffrente de celle de la population (surtout si
l'chantillonest depetitetaille).
Notons X lavariablealatoirequi, chaquechantillondetaillen, associesamoyenne ( X s'appelleencorela
distribution des moyennes des chantillons). Quepeut-ondiredecettevariablealatoire X ?
Thorme Central Limite - Version 1 - (Versionfaible)
Contexte: variablealatoireX qui suit uneloi normale sur lapopulation
X N( ; o)
Onprlve, auhasard, unchantillon(tiragesavecremise
(1)
ouassimils) detaillen demoyenne X .
AlorslavariablealatoireX suit galement uneloi normale :
X N ;
n
o | |

|
\ .
(1)
Untirageavec remiseest encoreappel"tiragenonexhaustif". Si onfait untiragesans remise(tirageexhaustif), onmodifielatailledela
populationau fur et mesuredes tirages, cequi compliquerait les calculs (interventiond'unfacteur d'exhaustivit). Ceci dit, pour des grandes
populations le tiragesansremises'assimileun tirageavecremise.
Echantillonsde taillen
... i 5 4 3 2 1
Population
Moyenne connue.
Ecart-typeo connu.
{

Attnuationde ladispersionpar
leprocessusd'chantillonnage.
Dmonstration :
NotonsE = {x
1
; x
2
; ... ; x
n
}unchantillonden lmentsprlevsauhasarddanslapopulation.
Pour tout i comprisentre1et n, notonsX
i
lavariablealatoirecorrespondant lavaleur dui-melment x
i
de
l'chantillon. Noussavons, par hypothse, que :
E(X
i
) = et o(X
i
) = o
Lamoyenne X desn valeursdel'chantillonest :
X =
1 2
...
n
X X X
n
+ + +
D'aprs les proprits dela loi normale, nous savons qu'une combinaison linraire de variables alatoire qui
suivent la loi normale est encore une variable alatoire qui suit la loi normale. Comme chaque variable
alatoire X
i
suit ici la loi normale N(, o), la variable alatoire moyenne X suit donc galement une loi
normale. Calculonssesparamtres.
D'aprslapropritdelinaritdel'esprance :
E( ) X =
1 2
( ) ( ) ... ( )
n
E X E X E X
n
+ + +
=
n
n

=
D'aprslespropritsdelavariance :
V( ) X =
1 2
2
( ) ( ) ... ( )
n
V X V X V X
n
+ + +
=
2
2
n
n
o
=
2
n
o
D'o : o( ) X =
n
o
Thorme Central Limite - Version 2 - (Versionforte)
Contexte: variablealatoireX qui suit uneloi quelconque sur lapopulationavecE(X) = et o(X) = o.
Onprlve, auhasard, unchantillon(tiragesavecremiseouassimils) detaillen, avec n 30, demoyenne X .
AlorslavariablealatoireX suit approximativement uneloi normale :
X N ;
n
o | |

|
\ .
CethormedauxmathmaticiensDe Moivre et Laplace est dedmonstrationtrsdifficile. Il est admisici.
Remarque: il nefaut pas confondrel'cart-type
n
o
dela variablealatoireX (qui est dfiniesur l'ensemble
des chantillons possibles de taille n) avec l'cart-type d'un chantillon prlev. L'cart-type de l'chantillon
prlevn'interviendrapas dans nos calculs dans cettepartie. Pour viter cetteconfusion, laquantit
n
o
sera
parfoisappele "erreur type".
Exemple :
LesstatistiquesdesnotesobtenuesenmathmatiquesauBAC STI enFrancepour l'anne2006sont :
Moyennenationale: =10,44
cart-type: o = 1,46
UneclassedeBTScomporte35lvesen2006/2007issusd'unBAC STI en2006.
Calculer laprobabilitquelamoyennedecetteclassesoit suprieure10.
Ici, nousneconnaissonspaslaloi sur lapopulation, maisl'effectif n del'chantillonest suprieur 30.
Nousallonsdoncpouvoir utiliser leT.C.L. 2.
Notons X lavariablealatoirequi, tout chantillondetaillen = 35, fait correspondresamoyenne.
Alors : X N ;
n
o | |

|
\ .
= N
1,46
10,44;
35
| |
|
\ .
PosonsT =
10,44
1,46
35
X
ainsi T N(0; 1).
Nousobtenonsalorspar centrageet rduction :
P( X 10) = P
10,44 10 10,44
1,46 1,46
35 35
X
| |
|

|
|
|
\ .
= P(T 1,78)
= P(T 1,78)
= (1,78)
Et par lecturedirectedelatabledelaloi normalecentre-rduite :
(1,78) = 0,9625
Conclusion: il yaenviron96%dechanceque, danscetteclassedeBTS, lamoyennedesnotesaubaccalaurat
deMathmatiquessoit suprieure10.
A.2. tude d'une proportion dans un chantillon
Cettefois-ci, on disposed'unepopulation sur laquelleon tudieun caractre(ou attribut) A dont on connat la
proportionp danslapopulation.
On s'intresse aux chantillons de taille n. La proportion du caractre A dans les chantillons sera-t-elle
toujours la mme ? Evidemment non, cette proportion varie en fonction de l'chantillon choisi. Notons F la
variable alatoire qui, chaque chantillon de taille n, associe sa proportion du caractre A (F s'appelle
distribution des frquence des chantillons). Quepeut-ondiredecettevariablealatoireF ?
1 (t) (t)
t
t
Remarque : P(T t) = P(T t)
Eneffet :
P(T t) = 1 P(T t) = 1 (t) = (t) = P(T t)
Echantillonsde taillen ... pi p5 p4 p3 p2 p1
Population
Proportionp connue
ducaractreA
{
A
1 p p
A A
Thorme
Contexte: unepopulationsur laquelleontudieuncaractreA rpanduavecunefrquencep.
Onprlve, auhasard, unchantillon(tiragesavecremiseouassimils) detaillen avec n 30.
OnnoteF lafrquenceducaractreA dansl'chantillon.
AlorslavariablealatoireF suit approximativement uneloi normale :
F N
(1 )
;
p p
p
n
| |

|
|
\ .
Dmonstration :
Nousallonsavoir ici unmodlebinomial ouapparentdont onsait qu'il convergeverslaloi normale.
Pour tout i comprisentre1et n, notonsX
i
lavariablealatoiredfiniepar :
X
i
=
1si le -melment del'chantillonpossdel'attribut
0sinon
i A

LavariablealatoireX
i
suit uneloi deBernoulli deparamtrep.
LavariablealatoireX = X
1
+ X
2
+ ... + X
n
est doncbinomialedeparamtresn et p :
X B(n, p)
Enconsquence : E(X) = np et o(X) = (1 ) np p
LavariablealatoireF =
X
n
correpondainsi lafrquencedel'attribut A dansl'chantillon.
D'aprslespropritsdel'espranceet del'cart-type :
E(F) =
( ) E X
n
= p et o(F) =
( ) X
n
o
=
(1 ) p p
n

Exemple :
Unelectiona eu lieu et uncandidat aeu40%desvoix.
Onprlveunchantillonde100bulletinsdevote.
Quelleest laprobabilitque, dansl'chantillon, lecandidat ait entre35%et 45%desvoix ?
Ici, nous avons n = 100 et p = 0,4. La variable alatoire F correspondant la frquence des votes pour le
candidat dansl'chantillonvrifiedonc :
F N
0,4 0,6
0,4;
100
| |

|
|
\ .
= N
0,24
0,4;
10
| |
|
|
\ .
PosonsT =
0,4
0,24
10
F
ainsi T N(0; 1). Nousobtenonsalorspar centrageet rduction :
P(0,35 F 0,45) = P(1,02 T 1,02) = 2 (1,02) 1
Et par lecturedirectedelatabledelaloi normalecentre-rduite (1,02) = 0,8461.
D'o : P(0,35 F 0,45) = 0,6922
Il y adonc environ 69 %dechanceque, dans un chantillon detaille n = 100, lecandidat ait entre35 %et
45%desvoix.
En analysant l'exercice ci-dessus, on constate que l'on dispose des informations sur la population (ici,
l'ensembledesvotes) parcequel'lection adjeulieu. On en dduit des informations sur l'chantillon. Mais,
danslapratique, c'est souvent lephnomnerciproquequenous tudierons : les lections n'ont pas encoreeu
lieu et on voudrait retrouver les informations sur la population grce un sondage ralis sur un chantillon.
D'oladeuximepartiedecedocument consacrel'estimation.
- Partie B - Estimation -
L'objectif decettepartieest derpondrelaproblmatiquesuivante: comment, partir d'informations (couple
moyenne/cart-type ou proportion) calcules sur un chantillon, retrouver ou plutt estimer celles d'une
population entire ? L'estimationest leproblmerciproquedel'chantillonnage. (Maisnousauronsbesoindesrsultats
tablissur la thoriede l'chantillonnagepour passer laphaseestimative).
Nousdistingueronsdeux cas: celui ol'onchercheestimer lamoyenne d'unevariablealatoiredfiniesur
une population et celui o l'on cherche estimer la proportion d'individus p ayant tel caractre dans la
population.
B.1. Estimation d'une moyenne
B.1.1. Estimationponctuelle
Contexte: on considreunevariablealatoireX sur unepopulation demoyenne(ou esprance) inconnueet
d'cart-typeo inconnu(ouconnu). Onsupposequel'on aprlevun chantillon detaillen (tirageavec remise
ouassimil) sur lequel onacalcullamoyenne
e
et l'cart-typeo
e
.
Uneestimationponctuelle delamoyenne delapopulationest :
=
e
Uneestimationponctuelleo del'cart-typeo
e
delapopulationest :
o =
1
n
n
o
e
Proportion : p inconnue
Moyenne : inconnue
Ecart-type : o connu ou inconnu
Echantillonde taillen Echantillonde taillen
Population Population
pe
connue
e connue
oe connu
ESTIMATION d'unePROPORTION ESTIMATION d'uneMOYENNE
Le coefficient
1
n
n
s'appelle correction de biais. Lorsque la taille n de l'chantillon est assez grand (en
pratiquen 30), cecoefficient est trsvoisinde1, si bienque, danscecas, onpeut estimer
e
.
Exemple :
Uneuniversitcomporte1500tudiants. Onmesurelataillede20d'entreeux. Lamoyenne
e
et l'cart-typeo
e
calculspartir decet chantillonsont :

e
= 176cm et o
e
= 6cm
Nouspouvonsdoncestimer lesparamtresdelapopulation :
= 176cm et o =
20
19
6 6,16cm
Remarque :
Nousn'avonsfait qu'uneestimation, il est bien sr impossiblederetrouver les vraies caractristiques et o de
lapopulation.
L'estimationponctuellepermet surtout dedisposer d'unevaleur derfrencepour poursuivre/affiner lescalculs.
Onsouhaiterait notamment pouvoir faireuneestimationpar intervalle, encontrlant lerisquepris.
B.1.2. Estimationpar intervalledeconfiance
Lecontexteest lemmequeleprcdent, sauf quenousallonsraisonner endeux temps, unephasea priori (ou
prvisionnelle) dans lequelle on suppose que l'chantillon n'est pas encore prlev et une phase a posteriori
danslaquelleonsupposeconnuelamoyenne
e
et l'cart-typeo
e
del'chantillonet donclamoyenneestime
et l'cart-typeestim o delapopulation.
- PHASE A PRIORI - Mise en place du modle prvisionnel -
Nous avons vu, dans la thorie sur l'chantillonnage, que si X est la variable alatoire correspondant la
moyenned'unchantillondetaillen prisauhasard, alorsleThormeCentral Limitepermet d'affirmer que X
suit approximativement uneloi normale :
X N ;
n
o | |

|
\ .
Nousallonschercher unintervallequi contient avecuneconfiancearbitrairede95%(celapourrait aussi tre99%ou
unautrecoefficient deconfiance). Nouscherchonsdoncunrayonr tel que :
P( X r X + r) = 0,95
Probabilitque lamoyenne de la
population tombedansun intervalle
du type [ X r ; X + r]
X + r X r
X
Cette disposition des ingalits n'est pas pratique mais il y a une correspondance remarquable entre deux
vnementsqui vanousfaciliter lescalculs :
X r X + r
Retranchons X et danschaquemembre :
r X r
Multiplionspar 1 : r + X r
Remettonslesingalitsdansl'ordrecroissant :
r X r +
Noussommesainsi ramenscalculer :
P( r X + r) = 0,95
Onsait quelavariablealatoireT =
X
n

o
=
( )
n
X
o
suit laloi normalecentre-rduiteN(0; 1).
Nousobtenonsdonc, par centrageet rduction :
P
r X r
n n n
| |
|
+
|
o o o
|
|
\ .
= 0,95
P
r n r n
T
| |

|
|
o o
\ .
= 0,95
P
r n r n
T
| |

|
|
o o
\ .
= 0,95
2
r n
| |
|
|
o
\ .
1= 0,95
r n
| |
|
|
o
\ .
= 0,975
(t) = 0,975 ot =
r n
o
Nouscherchonsdonc, par lectureinversedelatabledelaloi normalecentrerduiteunebornet telleque :
(t) = 0,975
Labornet = 1,96convient.
Labornet dpendducoefficient deconfiancechoisi.
Avecuncoefficient deconfiancede99%, nousaurionsobtenu :
2
r n
| |
|
|
o
\ .
1= 0,99
Dans la pratique, nous partirons
decettecriturepour dterminer
un intervalledeconfiance.
Probabilitque lamoyenneX de
l'chantillon tombedansun
intervallecentren.
Cette proprit dcoule de la
symtriede lavaleur absolue :
|X Y| r
Cela signifie que l'cart entre X
et Y est infrieur r, cequi s'crit
indiffremment :
r X Y r
Y r X Y + r
Ouencore :
r Y X r
X r Y X + r
Onconstate ici que lefait denepas
connatre n'est pasgnant, cestade.
Rappel : si T N(0 ; 1) alors :
P(o T o) = 2 (o) 1
Eneffet :
P(o T o) = (o) (o)
= (o) (1 (o))
= 2 (o) 1
+ r r
X
(t) = 0,995
t = 2,575
Par lasuite, nousnoteronst lerel tel que 2 (t) 1= C oC est ledegrdeconfiancechoisi.
Ainsi, notrerel r recherchest tel que :
r n
o
= t
Lerayonr del'intervallecherchest : r t
n
o
=
- PHASE A POSTERIORI - Utilisation des valeurs estimes ponctuellement -
Nous supposons maintenant que l'chantillon a t tir, nous obtenons donc une reprsentation
e
de la
variable alatoire X :
Nouspouvonsaffirmer quel'intervalleobtenupour cet chantillon
e e
; t t
n n
o o (
+
(

fait partied'unefamilledanslaquelle95%contiennent lavraiemoyenne delapopulation.
Onl'appelleintervalle de confiance 95 % (ouautreselonlecoefficient deconfiancedcidpralablement).
Pour calculer les bornes decet intervalle, deux cas defigureseprsentent selon quenous connaissons ou pas
l'cart-typeo delapopulation. S'il est connu, il n'yarienfaire :
IC =
e e
; t t
n n
o o (
+
(

Si l'cart-typeo delapopulationn'est pasconnu, onleremplacepar sonestimationponctuelle o =
1
n
n
o
e
.
Danscecas, nousobtenons : r =
e
1
n
t
n n
o

=
e
1
t
n
o

Nous pouvons donc estimer avec une confiance de 95 % (ou 99 % selon le cas) que la moyenne de la
populationappartient l'intervalle :
IC =
e e
e e
;
1 1
t t
n n
o o (
+
(

Remarques :
- L'intervalledeconfianceest centrenlavaleur
e
car c'est laseulevaleur derfrencequenousdisposons.
- Lecentredel'intervalledeconfiance( savoir
e
) dpend del'chantillon choisi (puisque
e
en dpend).
Sonrayonendpendaussi lorsqu'onneconnat pasl'cart-typedelapopulation.
- Lavraievaleur delamoyennedelapopulationpeut nepasappartenir l'intervalledeconfiance.
- Lerayondel'intervalledeconfiance(savoir laquantitr =t
n
o
) dpenddudegrdeconfianceC choisi.
PlusledegrdeconfianceC est prochede100%, et pluslabornet seraleveet donclerayongrand.
Onneretiendrapascetteformule.
Dans lapratique, onrefait lescalculs.
e + r e r
e
Illustration :
Exemple :
Uneuniversitcomporte1500tudiants. Onmesurelataillede20d'entreeux. Lamoyenne
e
et l'cart-typeo
e
calculspartir decet chantillonsont :

e
= 176cm et o
e
= 6cm
Nousavonsdjestimponctuellement lesparamtresdelapopulation :
= 176cm et o =
20
19
6 6,16cm
Dterminonsmaintenant uneestimationde par intervalledeconfiance95%(ouaurisquede5%).
Notons X lavariablealatoirecorrespondant lamoyenned'unchantillondetaille20prisauhasard.
Noussavonsque : X N ;
n
o | |

|
\ .
= N ;
20
o | |

|
\ .
Oncalculeunrayonr tel que : P( r X + r) = 0,95
OnposeT =
20
X r
o
, ainsi T suit laloi normalecentre-rduiteN(0; 1).
Nousavonsdonc : P
20 20 r r
T
| |

|
|
o o
\ .
= 0,95
2
20 r
| |
|
|
o
\ .
1= 0,95
20 r
| |
|
|
o
\ .
= 0,975
(t) = 0,975 ot =
20 r
o
Nouscherchonsdonc, par lectureinversedelatabledelaloi normalecentrerduiteunebornet telleque :
(t) = 0,975
Labornet = 1,96convient.
Ainsi, notrerel r recherchest tel que :
20 r
o
= 1,96

= e
99%
99%
95%
= e
= e
X Population
Echantillon 1
Echantillon 2
Echantillon 3
Un intervallede
confiancenecontient
pasforcment la
moyenne de la
population.
Un intervallede
confiance95%est
pluspetit qu'un
intervalledeconfiance
99%. Il risquemoins
decontenir lavaleur
moyenne.
r =
1,96
20
o
Maisunefoisl'chantillontir, nousavonsobtenuuncart-typeestim o 6,16cm.
D'o : r 2,7
Laralisationdel'intervalledeconfiance95%sur cet chantillonest :
IC = [176 2,7; 176+ 2,7]
IC = [173,3; 178,7]
Nous pouvons donc estimer, avec uneconfiancede95 %quelataillemoyennedela population est comprise
entre173,3cmet 178,7cm.
B.2. Estimation d'une proportion
B.2.1. Estimationponctuelle
Contexte: on considreun caractre(ou attribut) A sur unepopulation dont laproportion p est inconnue. On
supposequel'on aprlevun chantillon detaillen (tirageavec remiseouassimil) sur lequel on acalculla
proportionp
e
d'individusayant lecaractreA.
NotonsF lavariablealatoirecorrespondant laproportion ducaractreA dans un chantillon detaillen pris
auhasard. Onrappellequ'alorsF suit approximativement uneloi normale :
F N
( )
;
p
p o oo
p
=
(1 ) p p
n

Uneestimationponctuelle p delaproportionp del'attribut A danslapopulationest :


p = p
e
Uneestimationponctuelleo
p
del'cart-typeo
p
est selonlecas :
1
n
n
e e
(1 ) p p
n

=
e e
(1 )
1
p p
n

si n 30
e e
(1 ) p p
n

si n >30
1
4n
si statisticienpessimiste
Exemple :
quelquesjoursd'unelection, uncandidat fait effectuer unsondage. Sur les150personnesinterroges, 45se
disent prtesvoter pour lui auxprochaineslections.
Laproportiond'individusprtevoter pour cecandidat dansl'chantillonest ici de p
e
=
45
150
= 0,3.
Onestimedoncqu'il enest demmedanslapopulation(comment pourrait-onfaireautrement ?) :
p = p
e
= 0,3
Quandl'indicationo
p
, onpeut ici l'estimer par :
o
p
=
e e
(1 ) p p
n

=
0,3 0,7
150

0,037
Cesestimationsponctuellesde
l'cart-typenesont pasutilesdans
l'immdiat. Elleserviront pour la
dterminationd'un intervallede
confiancede laproportion.
Correctiondebiais.
On voudrait aller plus loin et, au lieu d'une simple proportion, calculer un intervalle contenant, avec une
confiancearbitrairefixeaudpart, laproportionp d'individusprtsvoter pour cecandidat.
B.2.2. Estimationpar intervalledeconfiance
Lecontexteest lemmequeleprcdent. Nous avons vu, dans lathoriesur l'chantillonnage, quesi F est la
variablealatoirecorrespondant la proportion d'un caractredans un chantillon detaillen pris au hasard,
alorsF suit approximativement uneloi normale :
F N
( )
;
p
p o oo
p
=
(1 ) p p
n

Nousavonsdjremarququelefait quep soit inconnun'est pasgnant danslescalculsa priori. Leproblme


ici, c'est quenousneconnaissonspasl'cart-type
(1 ) p p
n

. Nousleremplaerons, dans laphasea posteriori,


par son estimation ponctuelle(qui est
e e
(1 )
1
p p
n

en gnral ou
e e
(1 ) p p
n

si la correction de biais n'est


pasproposeouencore
1
4n
si nousvoulonsunehypothsepessimiste).
Cherchons un intervallequi contient p avec uneconfiancearbitrairede90 %(celapourrait treunautrecoefficient de
confiance). Nouscherchonsdoncunrayonr tel que :
P(F r p F + r) = 0,90
Nousavonsdjvuquecetteprobabilitpouvait s'criredemanirepluspratique :
P(p r F p + r) = 0,90
Onsait quelavariablealatoireT =
p
F p
o
suit laloi normalecentrerduiteN(0; 1).
Nousobtenonsdonc, par centrageet rduction :
P
p p p
p r p F p p r p
| |
+
|
|
o o o
\ .
= 0,90
P
p p
r r
T
| |

|
|
o o
\ .
= 0,90
2
p
r
| |
|
|
o
\ .
1= 0,90
p
r
| |
|
|
o
\ .
= 0,95
Onchercheunebornet telleque : (t) = 0,95avect =
p
r
o
Par lectureinversedelatabledelaloi normalecentrerduiteN(0; 1) :
t = 1,645
Cequi nouspermet decalculer r : r = t o
p
Supposonsmaintenant l'chantillonprlev. Nousavonsdoncuneestimationpontuelledep et o
p
.
Ainsi, laralisationdel'intervalledeconfiancedansl'chantillonest :
IC =
e e e e
e e
(1 ) (1 )
;
1 1
p p p p
p t p t
n n
(

+
(

(

Remarques :
- Si onn'effectuepaslacorrectiondebiais, l'intervalledeconfianceest :
IC =
e e e e
e e
(1 ) (1 )
;
p p p p
p t p t
n n
(

+
(
(

- On peut galement se placer dans une hypothse pessimiste en choisissant un cart-type maximal. Nous
savonsquelaparaboled'quationy = x(1 x) admet unmaximumgal
1
4
en
1
2
.
Ainsi l'cart-typemaximal est
1
4n
. Il a, deplus, l'avantaged'treindpendant dep.
Danscecas, laralisationdel'intervalledeconfiancedansl'chantillonest :
IC =
e e
1 1
;
4 4
p t p t
n n
(
+
(

Exemple :
A quelques jours d'une lection, un candidat fait faire un sondage. Sur les 150 personnes interroges, 45 se
disent prtesvoter pour lui auxprochaineslections.
Laproportiond'individusprtevoter pour cecandidat dansl'chantillonest ici de p
e
=
45
150
= 0,3.
Onadjestimponctuellement : p = p
e
= 0,3 et o
p
0,037
Dterminonsmaintenant uneestimationdep par intervalledeconfiance80%.
NotonsF lavariablealatoirecorrespondant laproportion d'individus prts voter pour cecandidat dans un
chantillondetaille150prisauhasard.
Nousavonsvuqu'approximativement :
F N
( )
;
p
p o oo
p
=
(1 ) p p
n

Onchercheunrayonr tel que : P(p r F p + r) = 0,8


2
p
r
| |
|
|
o
\ .
1= 0,8
p
r
| |
|
|
o
\ .
= 0,9
Par lectureinversedelatabledelaloi normalecentre-rduite, onchercheunebornet telleque :
(t) = 0,9 avect =
p
r
o
Lavaleur t 1,28convient donc : r = 1,28o
p
Supposonsmaintenant l'chantillonprlev. Uneestimationponctuelledeo
p
est o
p
0,037.
D'o : r 0,047
Onneretiendrapascetteformule.
Dans lapratique, onrefait lescalculs.
Laralisationdel'intervalledeconfiancedanscet chantillonest alors
IC = [0,3 0,047; 0,3+ 0,047]
IC = [0,253; 0,347]
IC
%
= [25,3; 34,7]
Nous pouvons estimer, avec uneconfiancede80 %, quela proportion d'individus dans la population prts
voter pour lecandidat enquestionest compriseentre25,3%et 34,7%.
Exercice :
Une usine fabrique des cbles. Un cble est considr comme conforme si sa rsistance la rupture X est
suprieure3tonnes. L'ingnieur responsabledelaproductionvoudrait connatre, enmoyenne, larsistance
larupturedescblesfabriqus.
Il n'est, biensr, pasquestiondefaireletest sur toutelaproduction(l'usineperdrait toutesaproduction!).
Un technicien prlvedonc un chantillon de100 cbles dans la production. Notons X la variable alatoire
correspondant laforceexercer sur lecblepour lerompre. Letechnicienobtient lesrsultatssuivants :
E( X ) = 3,5tonnes
o( X ) = 0,4tonne
Proportiondecblesdont larsistanceest suprieure3tonnes: p
e
= 0,85
1. a. Donner uneestimationponctuelledelamoyenne et del'cart-typeo delavariablealatoireX dans la
production.
b. Dterminer uneestimationpar intervalledeconfiance95%delamoyenne deX.
2. a. Donner uneestimationponctuelledelaproportionp decblesconformesdanslaproduction.
b. Dterminer uneestimationpar intervalledeconfiance90%decetteproportion.
- RSUM -
- Echantillonnage -
- Estimation -
Echantillonsdetaillen demoyenneX
X N ;
n
o | |

|
\ .
o et o sont lamoyenneet l'cart-type
danslapopulation.
Echantillonsdetaillen avecunefrquenceF
F N
(1 )
;
p p
p
n
| |

|
|
\ .
op est laproportiondanslapopulation.
PROPORTION MOYENNE
Proportion inconnue p dans une population.
Echantillon de taille n connu avec une proportion p
e
.
Uneestimationponctuelledep est p
e
.
Uneestimationponctuelledeo
p
est
e e
(1 )
1
p p
n

si
n 30ou
e e
(1 ) p p
n

sinon (n >30).
Pour estimer p par intervalleavecuneconfianceC
(par ex95%), onchercheunrayonr tel que :
P(p r F p + r) = C
o F N
( )
;
p
p o aveco
p
=
(1 ) p p
n

Onexprimer enfonctiondeo
p
et onremplaceo
p
par
sonestimationponctuelle.
IC = [p
e
r ; p
e
+ r]
Population de moyenne inconnue et d'cart-type .
Echantillon de taille n connu de moyenne
e
et d'cart-type
e
.
Uneestimationponctuellede est
e
.
Uneestimationponctuelledeo est
1
n
n
o
e
si n 30 ou
tout simplement o
e
sinon (n >30).
Pour estimer par intervalle avec une confiance C (par
ex95%), onchercheunrayonr tel que :
P( r X + r) = C
o X N ;
n
o | |

|
\ .
On exprimer en fonction deo et on remplaceo par sa valeur
connueousonestimationponctuelle.
IC = [
e
r ;
e
+ r]
PROPORTION MOYENNE
Coefficient deconfiance 80 % 90 % 95 % 99 %
Valeur deH(t) 0,9 0,95 0,975 0,995
Bornet 1,28 1,645 1,96 2,575

Vous aimerez peut-être aussi