Académique Documents
Professionnel Documents
Culture Documents
à l ’ économ étrie
Le mod è lede régressi on
li néai re si mple
(ver s io n du 29 /9 /2 00 9, 18 :3 6)
2
Tabl e des m ati ères
3
4.1 L e contex te
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
4.2 Test d ’u ne hyp oth èse simpβ1le.sur
. . . . . . . . . . . . . . . . . . . . . . . . . 66
4.2.1 Le pr ob lème de test
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
4.2.2 Ap pro ch e intu itive
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
4.2.3 Ap pr o ch e th éor .ique
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
4.2.4 Gén ér alisations
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
4.2.4.1 Test d ’u ne valeu r qu elcon βqu
1 e. de
. . . . . . . . . . . . . . . 70
4.2.4.2 Test d ’u ne in égalitéβsur
1 . . . . . . . . . . . . . . . . . . . . . 72
4.3 Région s de confi ance
( in co mp l et) . . . . . . . . . . . . . . . . . . . . . . . . . . 73
4.3.1 Défi n ition.. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
4
I ntro ducti on : prés entati on du cou
5
Bien qu e cette qu estion aille au -d elà du contenu du cou rs, on p eu t se deman der ce qu ’
l’écon ométr ie par rap p or t à un e an alyse écon omique th éor iqu e.
Les mo dèles théoriques prop osent une description du fonctionnement de l’économie (ou de
cer tain s de ses mar ch és) au moyen d ’u n en semb le de r elation s entr e var iab les écon om
fois cette descrip tion prop osée, plu sieu rs typ es qu estions p eu vent se p oser. Par exemple:
1. Les r elation s étab lies p ar le mo d èle th éor iqu e existent-elles vr aiment?
2. En su p p osant qu e ce soit le qu
cas,
elles sont les prop r iétés de ces r elations
d eux
? Si
var iab les
X et Y sont m ises en r elation,
p eu t-on su pp oser qu e cette d er n ièr e lin éair e?
n on lin éaire ? Les variab
X les
et Y varient-elles en semb le d an s le même sen s ou en sens
op p osé?
3. En supp osant que le mo dèle théorique prop ose une relation entre deuxXvariables et
Y exp r imée au moyen d ’u ne fon ction ap p ar ten ant à un e classe
ex. fonctions
d on n ée (p.
lin éair es, log-lin éair es, p olyn
etcômes,
), la classe prop osée est-elle la b onne?
4. En su p p os ant qu e ce soit leaucas,
tr ement d it s’il
existe un élém ent d an s la classe de
fon ction s qui
p er met d ’exp r im er la r elation existant r éellem X ent
et Yentre
, qu elest
cet élément ? Sip ar exemp le la r elation est lin éair e (la cou rb e r ep r ésentant la fon ctio
reliant une variable à l’autre est une droite) quelle est la valeur de chacun des co efficients
exp r im ant cette r elation?
Les qu estion s ci-d essu s sont de d eu x n atu r es:
– Cer tain es (la pr emièr e et la tr oisième) p osent celle de la valid ité du mo dèle écon omiq
th éor iq uc’est
e, à d ir e sa cap acité à r en dr e comp te cor r ectement du fon ction n emen
d e l’écon omie.
– Les au tr es qu estion s tr aitent de la p ossib ilité d’u tiliser un mo dèle th éor ique p ou r é
su r la natu re des relation s entr e var iab les écon omiques des én on cés de typ e qu alita
exem p le: l’au gmentation d ’u n tau x d ’intérêt entraîn e la b aisse du tau x d ’in fl ation ) o
q u antitatif(p ar exemp le:
un e au gmentation d ’1 p oint du taux de cr oissan ce du PIB,
p er m et,
san s ch an ger le n iveau de la d ette dedel’État,
d iminu er de 10% le n iveau d es
imp ôts dir ects p er çu s par l’État au cou rs des 2 pr o ch ain es années).
Les rép onses à ces questions sont d éterminantes. On compren d aisément qu’il est intéress
de savoir si un mo dèle écon omique th éor ique par vient à ren dre compte cor rectement de la
lité d’u ne relation écon omique. Si ce n’est pas le cas, on p eu t le con sid ér er comme fau x, e
u tilisation ne contr ib ue p as à un e meilleu re compr éh en sion d es mécan ismes En écon omiqu
su pp osant qu ’u n mo dèle soit con sid ér é comme ad équat, la p ossib ilité de l’u tiliser p ou r
à des énoncés quantitatifs non-triviaux est d’un intérêt ma jeur p our les économistes (p ossibili
d ’effectu er d es pr évision s, con du ite de p olitiqu esetcécon
). Or,omiqu
p armies,
les mo d èles th éo-
riques écon omiques for mu lés, p eu (au cu n ?) offr ent un e telle p ossib ilité. Par ailleu rs, ces
eux-mêmes ne prop osent aucune métho de p ermettant de savoir s’ils sont justes ou faux.
L’u tilisation d es d iver ses méth o d es d ’in fér en ce de l’écon ométr ie comp lète la for mu
mo dèle théorique et vise à app orter des rép onses à des questions du typ e de celles mentionn
ci-d essu s, en fou rn issant d es ons
e stimati d es p ar amètr es d es d iver ses r elation s ap p ar aissant d
les mo d èles écon omiqu es, en p er mettant
te sterl’adéquation
de d’une formulation prop osée par
u n mo d èle th éor iqu e avec laDe réalité.
p lu s,
p ar ce qu e ces estimation s et tests sont effectu és
en u tilisant les méth o d es de l’in fér en ce statistiqu
ils sont accomp
e, agn és d ’u ne évalu ation d es
6
2
r isqu es qu i leu r sont asso ciés.
Bibliogra phie
– Cou rs de statistiqu e mathé matique
, Alain Mon fort,Econ omica (coll.
Écon omie et statis-
tiqu es avan cées),3
e édition , 1997
– Statistiqu e et économé trie. Du modè le linéaire . . . au x modèle , Xavier
s non- Gu yon,
linéaires
Ellip ses (coll. Un iver sités, math ématiqu es ap p liqu ées), 2001
– M é thode s économé ,triquJ. J oh
esn ston et J. N. DiNard(trad.F.
o, Gu err ien et O. Gü n ),
Econ omica, 1999
2
Le risq ue asso cié à un estimateur p eut se mesurer en utilisant par ex emple l’erreur quadratiq ue moyenne.
Les risq ues classiq uement asso ciés à un test sont les risq ue de ty p e 1 et de ty p e 2. Voir le chapitre suivant p o
d es rap p els su r ces n otion s.
7
8
C h ap i tre1
9
3. Dir e qu ’on s’intér esse à un e car actér istique d ’u ne p op u lation sign ifi e qu ’on s’intér
la façon d ont sont r ép ar ties les mesu r es de cette car actér istiqu e au sein de la p op u
Au tr ement d it, si cette car actér istiqu e est mesur
X, onées’intér
p ar esse à la fon ction de
r ép artition
F X de X.
4. Dan s b ien des cas,
on ne s’intér esse p as à la fon ction de r ép arXtition
tou te
deentière,
mais seu lement à cer tain es de ses pr op r iétés.
E xe mp l(1e:) ladisp e rs des
ion s alaires en France ; (2 ) la tension
mi ni made le ru p ture
d e câbl es d ’as cens (3eu) lar;tai lle
moye n ned es en fa n ts d an s l es cl a s s es d e co u rs
prép ara to i re da ns le (4 N ord;
) la pro p ortion
des ména g es fra nçai s un ayaa nt
cc ès
i n ternet à l eur do mi ci l e.
Les exemp les ci-d essu s illu str ent les pr op r iétés les p lu s fr équ emment étu d iées d ’
tion de rép artition:les valeu rs extr êmes( l a tensi on d e ru p t),ure
minima le la ten d ance
centr ale(
l a moyenne des t a i l ou
l es,
en core la de mén a )ges
prop ortion et la d isp er sion(
la
i onsa la ).
d i sp ersdes i res
5. En statis tiqu ces
e, prop r iétés se mesu r ent au moyen de d ivers inPar d icateu
exem prs.le,
la ten d an ce centrale de la fon ction de r ép artition
X est un
dee valeu r au tou r de laqu elle
se r egr ou p ent les valeu rs pr Xises
dan
p ar
s la p opulation;on m es u re typ iqu em ent cette
ten d an ce centrale pmédi
ar la ane
ou l’espé rancede X. 3
La d isp er sion,
qui décrit le caractère plu s ou moin s regrou p é des valeu
X au
rs tour
de
d ’u ne ten d an ce centr ale, se mesu re fr équ emment p ar 4
X. la var ian ce de
6. Un ind icateu r qui
mesure un e prop riété don née d’u ne fon ction de rép artition est ap p elé
de
paramè tre cette fon ction de rép artition.
La valeu r d ’u n p ar amètr e est un n omb re r éel
qu ’on p eu t calcu ler d ès qu ’on con n aît la fon ction de rép artition.
E xe mp lSie:o n s ’i n téres se à la tendance cen X ,tral
lee p deF
ara mètre co n s i d é ré p eut
ê tre l a méd i a n(Xe).MeLa val eur du p aramètre est la val eur de la médiane qu’on
c al cu l e à p artiXr g
deF = inf{a ∈ | F X (a) ≥ 12 }.
râ ce à l a formu(lXe) Me Ê
4
La varian ce de
X, n ot ée X
V() est un e mesu re de la d istan ce moyen ne entre les X valeu
d an srsla de
p op u lation
et l’esp érance de
X.
10
d es in d ivid par
us( exempl e l ors qu’on mes ure à quel le t ensi on le câ bl e d’a
), s cens eur a
etc.
10. Cette imp ossib ilité implique au ssi l’imp ossib ilité de calcu ler (et don c con naîtr e) la val
de θ. On se contente alor ps,ou r d es r aison sseront
qui d évelop p ées p lu s b as (à p artir
d u p oint 17),
de mesu r er la car actér istiqu e psous-
ou r ensemble
un de la p opu lation.
Les
in divid us comp osant ce sou s-en semb le p eu vent êtr e ch oisis de différ entes man ièr
n ou s contenteron s de mention n er qu e la man ière de ch oisir ces in d ivid us a d es con
imp or tantes su r les pr op r iétés d es méth o d es statistiqu es qu i ser ont emp loyées p
11. La man ière de ch oisir les in divid us dan s un e p op ulation qu e nou s retien dron s est a
éc hantil lonnag e aléatoire .simple
Celle-cipro cèd e de la man ière su ivante.
On ch oisitau
5 un pr emier in divid u dan s la p op ulation et on effectu e p ou r cet in divid u un e m
hasard
au moyen de la variabX. le C ette mesu re est un e valeu r xn1 otée
de X. O n « r em et»
l’individu dans la p opulation et on rép ète l’étap e précédente,
ce qui f ourn it une secon de
mesu re x2. En rép étant cette op ération
n fois , on d is p osnemesu
de r es (ou ob ser vation s)
n de la variab X.
x1, . . . ,x le
E xe mp lLa e: vari abl e X es t la mes u re de la tai ll e d ’un enfant de CP dans le N ord. On
c ho is it au has ard un premi er enfant i ns c ri t en CP dans le N ord, o n mes u re sa tai ll e
o n la no tex
1 . On « remet » l ’en fa nt da ns l ’ens e mb l e des en fa n ts de CP da ns le N ord
e t o n en cho is it au has ard un deu xi è me ; o n2no ; etc
te. sa tai ll ex
12. De man ière évid ente, ces ob servation s ne p eu vent être con nu es avec certitu de à l’av
puisqu’elles dép endentqudei sontles n in divid us ch oisis dan s la p op ulation . Par con sé-
q u ent, n sont con sid ér ées comme les r éalisation s de variab
x1, . . . ,x X 1les . ,Xn .6 es
, . .aléatoir
13. Les prop r iétés de ces variab les aléatoires sont assez faciles à d éd u ire de la façon d ont
sont intr o du ites.
– X i ser t à mesu r er la car actér istiqu i e in
e du
d ivid u ch oisi. C et in d ivid u est chde oisi
manière tout à fait ind ép end ante d es autres. En effet, savoir que j,d k, esℓ,ind. .. ividus
ont été ch oisis et savoir qu e p ou r ces in d ivid us on a effectu x éj les mesu
,x k ,x ℓ , . .. r es
de la car actér istique n’affecte pas la pr ob ab ilité p ou r qu ’on fasse qu elque mesur e
cu lière qu e ce soit ch ez l’in d i. ividu
Au tr ement d it, le fait de con n aîtr e les r éalisations
de X j ,X k ,X ℓ , . ..n ’affecte p as la loi de probab ilité X i . On
de d it qu e les variab les aléa-
toir esX 1, . . . ,Xn sont indé pendantes . C eci sign ifi e qu ’il n ’existe au cu ne liaison d ’au cu ne
sorte entre ces variab les aléatoires. On p eu t don c étu dier les prop riétés de l’u ne d’e
en écartant les au tres san s qu e cette étu de soit affectée p ar cette mise à l’écart.
– Con sid éron s alorsi ela de ces var iab les aléatoir X i ,es,
et essayon s de tr ou ver sa de loi
p r ob ab ilité, caractérisée p ar sa fon ction de rFép (
Xi a artition
) = P( )
X i ≤ a ,a ∈ .
Ê
On
note d’ab ord que l’individu i étant ch oisi au h asar d, les valeu rs p ossibX ilessontp our
les mêmes qu e les valeu rs p ossib les X. pDeour
p lu s, p ou r n ’imp or te réel qu el a, on
sait qu’il y a une prop ortion égaleà F X (a) d ’in d ivid us d an s la p op u lation p ou r lesqu els
la variab le X est in fér ieu re ou égaleà
a. Par con séqu ent, si on ch oisit un in d ivid u au
5
Choisir au hasard un ob jet dans un ensemble signifie ici que n’imp orte quel ob jet a la même probabilité d’être
choisi que n’imp orte quel autre ob jet dans cet ensemble.
6
D’u ne man ière un p eu vagu e, on défi nit un e variab le aléatoire comme un e gran deu r p ou vant varier en fo
d u résu ltat d ’u ne ex p érien ce aléatoire.
Ici l’ex p érience est le choix d’un indiv idu au hasard dans la p opulation.
La gran d eu r est la mesu re de la caractéristiq ue étu d iée ch ez l’inserad iv id
chuoisi.
qui
Cette mesure dép end
clairem ent dequelestl’in div id u qu i a été ch oisi au hasard , don c du résu ltat de l’ex p érien ce aléatoire.
11
h asard d an s la p op u lation, i e, alors la prob ab ilité p ou r qu e la mesu re de la
d ison s le
car actér istique p ou r cet in divid u soit in fér ieu re aouest égaleà
pr écisém ent égaleà
7
F X (a). For m ellement, on a P(X i ≤ a)= F X (a). Ceci étant vr ai qu elqu e soit le ch oix
de a, ona F X i = F X . Ceci étant vr aip ou r tout i, ona F X 1 = ··· = F X n = F X .
Au tr ement dles it, variab les aléatoires
X 1, . . . ,X
n ont la mêm e loide prob abilité.
On
dit queX 1, . . . ,X
n sonti de ntiqu e me nt distribu . ées
14. On n ote qu e la variab X le
a un e rép ar tition d an s la p op u lation qu i est id entiqu e à celle
d es variab les aléatoires n . Or n ou s n ’avon s à au cu n moment con sid éré la va-
X 1, . . . ,X
riab leX comme aléatoir e. C elle-ci a été simp lement d éfi n ie comme la f açon de mesu r
car actér istiqu e d ’intér êt (voir le p oint 1 ci-d essu s).
Cep endant, en utilisant le même raisonnement que celui intro duit dans le p oint précéden
il est facile de d éd u ire qu e si on con sid ère la variabX̃ledaléatoire
ésign ant la mesu re de
la car actér istique étu diée p ou r un in divid au u chh asard
oisi d an s la p op u lation,alors
la fon ction de rép artition X̃deest la mêm e qu e celleX. deIl n ’y a d on c p as lieu de
d iffér en cier
X̃ et X : ces d eu x var iab les ser vent à mesu r er la même ch ose et ont la m ê
fon ction de rép artition.
On compr en d alor s p ou r qu F Xoi
i
=ona
F X . En effet,X est la mesu re de la car actér istique
étu d iée p ou r in d ivid u qu elcon qu au eh ch
asard
oisi d an s la p op u lation,
et X i d ésigne la
mê me chose , mais lor squ ’on convient qu e l’in d ividau u ch oisi d d ésigni eedes
h asar le n
in d ivid us extr aits de la p op u lation.
Au tr ement dl’exp it, ér ien ce aléatoir e qu i con siste à ch oisir au hasar d un in divid u, qu ’
ap p ellerai, d an s la p opu lation et pqui
ermet de d éfi X n i irest un e r ép liqu e id entique
de l’exp ér ien ce qu i con siste à ch oisir au hasar d un in divid u qu elcon qu e et qu i p er
défi nirX. La fon ction de rép artition, et don c la loide probab ilité, de ce d eu x variab les
est p ar con séqu ent la mêm e.
15. On r ap p elle qu e d es variab les aléatoireséc forment un aléatoire simple
hantil lon si elles sont
indép endantes et identiquement distribuées. C ette d éfi n ition fait ap p araître
X 1, . . . ,X
n
comme un éch antillon aléatoir e simp le. De p lu s, comme la loi commu n variabne les
de ces
aléatoir es est celle X,
deon d it queX 1, . . . ,X
n forme nt un éc hantil lon aléatoire simple
de X.
On rap p elle également qu ’un e dans u ne de
tirag P est un n omb re qui
loi probab i lité est
la r éalisation d ’u ne var iab le aléatoir e d es onttPla
. Par
loi con séqu ent,
les ob servations
x1, . . . ,x
n étant les réalisations de variables aléatoires indép endantes ayant toutes la mêm
loi, sont con sid érées comme d es tirages d an s cette loi. Celle-ci étant X, on celle
inter-de
p r étera n com me
x1, . . . ,x n tirages indép endants dans la loi X, de F X .8
ou en core d ans
16. Résumé des p oint s qui précèdent.On ne p eu t faire de r ecen sement et calcu θ. ler
On con stitu par
e, un e méth o de de sélection ap p elée éch antillon age aléatoire un simple,
n-u p let de variab les aléatoires n , indép endantes et identiquement distribuées. La
X 1, . . . ,X
loi de pr ob ab ilité commu ne de ces var iab les est la même X.qu
Donc
e celle
X 1, .de
. . ,X
n
7
Le raison n ement u t ilisé
est
iciid entiq ue à celui
— b ien con nu — con cern ant d es b oules d ans une si u rne:
une urne contient une prop ortionp de b ou les blan ch es, alors la prob ab ilité p ou r qu ’u ne b ou le ch oisie au hasard
dans l’u rn e soit b lan ch e est égaleà
p. Les raisonnements de ce ty p e p ermettent de voir des prop ortions comme
d es p rob ab ilités
vi et .
ce versa
8
On ne fera p as de d ifféren ce entre un e p rob ab ilité et sa fon ction dePar
répcon
artition.
séq u ent, un e
deloi
p rob ab ilité d ésign e au ssi b ien l’u ne qu e l’au tre.
12
for ment un éch antillon aléatoir e simpX. le
Endecon séqu en ce, les r éalisations
x1, . . . ,x
n
d e ces variab les aléatoires con stitu
n tirages
ent indép endants dans la
FX loi
de X.
13
p articu lier su r la p aramètre d ’intérêt de cette loi. En termes p lu s gén érau x, cette d ém
in fère les prop r iétés( ) d ’u ne p op u lation à p artir d es prop
inconnu es r iétés(
ob se rv)ées
d ’u ne
p artie de la p op u lation (cette p artie étant con stitu ée d es in d ivid us sélection n és).
21. On p eu t illu str er le contenu de cette section p ar l’exp érien ce
C on
susid
ivante.
éron s une
variab le aléatoire
X qu i su it un e loi n or male ayant un e esp ér an ce et un e var ian ce don
Au moyen de techn iqu es de génération de n ombres aléatoires, on effectue ind ép end am
200 tir ages aléatoir es de nomb res réels, de sor te qu e p ou r ch aque tir age la pr ob ab
qu e le n omb re soit compr isaentre
et b est
1 b (x − µ)2
P( a ≤ X ≤ b)= √ exp − dx
2πσ2 a 2σ2
14
n ou s r estitu er de l’in formation su r cette
ou p loi,
lu s p ar ticu lièr ement su r un p ar amètre
d ’intérêt de cette loi.
Il est cr ucial de noter l’imp or tan ce du mo dèle statistique dan s un e démar ch e d’in fér
Un mo dèle statistique (voir plu s loin p ou r un défi nition un p eu plu s for melle) est une
d escrip tion d es prop r iétés dedelaprob
loi ab ilité d ont sont issu es les ob servation
ain si s,
qu ’u ne d escr ip tion de la man ièr e d ont elles en sont issu es. Un e telle d escr ip tion p
alor s l’étu de d es pr op r iétés de la statistiqu e for mée à p ar tir d es ob ser vation s (p a
cette statistiqu e a-t-elle ten d an ce à pr en dr e d es valeu rs pr o ch es du p ar amètr e d
Le mo d èle ser t d on c de cad re d ’an alyse d es pr op riétés de statistiqu es d estin ées à
mer le p aramètre d ’intérêt. Si on ne se d on ne au cu ne in formation su r la man ière d on
ob ser vation s sont r eliées à un e loi de pr ob ab ilité, il est imp ossib le de savoir commen
observations p euvent nous restituer de l’information à prop os de cette loi, ou à prop os d
l’u n d es p ar amètr es d ’intér êt de cette loi.
0, si x< 0
F X (x; θ0)= P (X ≤ x)= 1 − θ0, si 0 ≤ x< 1
1, si x ≥ 1
1 b (x − µ)2
P( a ≤ X ≤ b)= √ exp − dx
2πσ2 a
2σ2
1 x (t − µ0)2
F X (x; θ0)= exp − dt, x∈
2πσ02 2σ02
Ê
−∞
15
On disp ose de
n m es u rX es n de la variab X,
1, . . . ,X le obtenues p ar un pro céd é d ’éch antillon-
n age aléatoire.
Dan s cette pr ésentation gén on ér su
ale,pp oser a X
que
1, . . . ,Xn con stituent un
éch antillon aléatoir e simpXle: de n sont indép endantes et suivent toutes la même loi
X 1, . . . ,X
q ueX. On r ap p elle la d istin ction faite entre les variab les X 1aléatoires
, . . . ,Xn et les r éalisations
(ou valeu rs ob ser vées) de ces var iab les, n otées
x1, . . . ,x
n.
Lorsqu’u n prob lème d’in féren ce en formu lé, la solu tion qu ’on lu i apmé p orte est ap p elé
thode
.9 Il est es s entiel
de mention n er qu e qu el qu e soit le prob lème d ’in féren ce con sid
d’ i nfé re nce
(voir les section s qu i su ivent), il existe à ch aque fois p lu sieu rs méth o d es d ’in fér en ce. P
qu ent, se p oser a le ch oix de la « b on ne » méth o de. Pou r qu e cette qu estion ait un sen s,
alor s êtr e en mesur e de compar er plu sieu rs méth o des d’in féren ce disp on ib les p ou r ré
même pr ob lème d ’in fér en ce. Lor squ e de tels moyen s de comp ar aison sont étab lis, on p
être cap ab le de reten ir les meilleu res méth o des d’in féren ce.
Les prop riétés d ’u ne méth o de d ’in féren ce p articu lière sont étu d iées relativement au
blème d’in féren ce p osé. Au trement dit un e même méth o de d’inféren ce p eu t être b on ne
pr ob lème et mau vaise p ou r un au tr e. Ceci p ose don ccadre la qud estion
an s lequ
du el on p ose le
p rob lème d ’in féren ce et d an s lequ el on an alyse les prop riétés d ’u ne méth o de d ’in fére
à r ésou dr e le pr ob lème p osé. Ce cad re modè est aplep statistique
elé . Un mo d èle s tatis tiqu e est
un ob jet mathématique qui sp écifie:
– l’esp ace au qu el ap p artien n ent les ob x1,servations
n d es variab les aléatoires
. . . ,x X 1, . . . ,X
n
(c’est sou ventn ou un sous-en semble nde
Ê Ê
);
– l’en semb le d es lois qu ’on con a sid ère
pri ori p ossib les p ou r les variab X 1, les
. . . ,X
n.
Dan s le pr emier exemp le ci-d essu les variab
s, les con stitu ant l’éch antillon sont d es variab les
aléatoires de Bern ou lli.i eLa d’entr e elles,
Xi , in d iqu e si l’in d iividu
p ossèd e un accès inter n età
d omicile (d an s ce cas on ob servera X i = 1) ou n on (et on ob servera Xalors i = 0). L ’es p ace d es
ob servation s sera d on , 1] cet
n [0l’en semb le d es lois est l’en semb le de tou tes les lois de Bern ou
{B (θ) | θ ∈ ]0, 1[}. Dan s le secon d exemp X i est
le, la mesur e de la var iation du p ou voir d ’ach at
du i e individu de l’échantillon au cous de la p ério de donnée. C’est
a pri oriun réel quelcon que.
L’esp ace d es ob ser vation s ser an .dL’en
Ê
onc semble d es ploiossib les est l’en semb le d es lois
n or males 2 2
{N (µ ,σ ) | µ ∈ ,σ ∈ ]0, ∞ [ }.
Ê
1.3.1 E st imation
L’ob jectif d ’un problème d ’estimation est d ’approximer la valeur inconnue du
θ. p aramètre
Cela p eu t se faire de d eu x man ières:
1. on p eu t ap pr oximer
θ p ar un e valeu r isolée d an s Θ;
2. on p eu t ap pr oximer le p ar amètr e en ch er ch ant un e région de Θ ch oisie de sor te qu
contienne la valeu r inconnuθeavec
de une probab ilité élevée, et ceci quelle que soit cette
valeur incon nue.
Le reste de cette section est consacré au premier typ e d’estimation. Le second sera ab ordé à l
section 1.3.3.
On p ar le ed’stimation ponc tude elθlelorsque l’ob jectif corresp ond au premier des deux cas
ci-d essu s. Pou r estimer
θ, on u tilis e un
e stimate. urUn estimateu r est un e var iab le aléatoire
Tn
9
Ces métho des p ortent des noms particu liers selon la catégorie de prob lème d’in féren ce qu ’on sou haite réso
(voir les section s qu i su ivent).
16
ob tenu e comme un e fon T ction
de X 1, . . . ,X
n à valeu rs d an s Θ et form ée d an s le bu t de fou rn ir
d es ap pr oximationθ.s Ona
de
n
T: Ê
→ Θ
(u1, . . . ,u
n ) → T (u1, . . . ,u
n)
et Tn = T (X 1, . . . ,X
n ).
Un e ap pr oximation θ ob
de tenu e en u tilisant un estimateu r este ap p elée
deθ. C ’est
sti mation
u ne valeurtn ∈ Θ ob tenu e à p ar tir de l’estimateur
Tn de la man ière su ivante:
tn = T (x1, . . . ,x
n ).
C’est d on c la valeu r pr ise p ar la var iab le Tnaléatoire
lorsqu e les ob servation s sont
x1, . . . ,x
n.
E xe mp lOne: reprend l ’exemp le de l ’a ccès à in tern et à do mi ci le. θ es t le p ara mètre d ’u ne l
Berno ulli. Pour n ménag es cho isis au hasard, on intro duit les variables 1, . . .aléatoiresX
,Xn
d e la mani è re s ui van =1 si lei e mé na g e chaoun
X i te: isi accès i n tern et à do mi ci l e et
X i =0 si no n,i
=1 , . . . , n. La pro p ortio n θ de ménag da nses la
quip o pu la ti o n o nt un ac cès
à internet à do micile p eut être estimée par la pro p orti o n de d ménag
a n s l ’éesch quia n ti l l on
o nt un accès à internet à do micile. L’es timateurT
n u tilisé dans ce cas est cette pro p orti o n:
n n
Tn = n1 i =1 X i . La fo nctio n T est do nc défi nie (parT n )= n
u1, . . . ,u 1
i =1 ui . Si on
o bs e rveX
1 = =
x1, .. . ,X n xn , a l ors l ’e s ti man otibote
ntnu e à p arti r l ’e s nties mat lete urT
1 n
n = n
n o mbret i =1 xi .
Pou r un même pr ob lème d ’estimation (même p ar amètr e à estimer à p ar tir d es mêmes
surX es1, . . . ,X
n ), on p eu t u tiliser p lu sieu rs estimateu rs. On les comp ar e u su ellement au m
d e leu r b iais et de leu r précision.
Ces n otion s sont d éfi n ies au moyen de l’esp Tér n (ou
an ce
d ’u
dene fonction Tde n ). Cette
variab le aléatoire étant un e fon ction de
X 1, . . . ,Xn, (on rap p elle que
Tn = (
T X 1, . . . ,X n ))
l’esp ér an ceTnE(
) se calcu le à p artir de la Xloi 1, de n . C es variab les formant un éch antillon
. . . ,X
aléatoir e simp leX,dela loi deX 1, . . . ,X
n est d on née p ar la loi X. de
Par con séqu ent,TnE( ) se
calcu le à p artir de la loiX,dec’est à direF X ( · ; θ). Puisque celle-ci dép endθ,de il en ser a de
même p ou rTE( )
n . Au tr ement dil
it,
existe au tant de façon de calcu ler
Tn ) E(
qu ’ily a de lois
p ossibles p our
X, c’est à d ir e au tant qu ’il y a de valeu rs p ossib θ. Pou
les rp cette
our r aison , on
voit E(Tn ) comme un e f on ction θ, et
de p ou r l’in d iqu er , on n ote cette esp θ(Térn ).an ceE
Soit Tn un estimateu r deθ. On d it que Tn est un estimateu r san s b iais si p ou r tou te valeur
p ossib θle0 du p ar amètre
θ on aE θ0 (Tn ) − θ0 =0 . S i ce n ’est p as le cas,
l’estimateur
Tn de θ
es t b iaisé et son b iais
θ0 en
es tEθ0 (Tn ) − θ0.
La pr écision d ’u n estimateur
Tn deθ se mesu re au moyen de son er r eu r qu ad r atiqu e moyen
C elle-ci est d éfi n ie comme la fon ction qu i àθ0la∈valeur (Tn − θ0)2 ,
Θ asso cie le n ombθ0reE
où l’esp ér an ce est calcu lée en u tilisant
F X ( la
· ; θloi
0).
Lor squ e le b iais ou l’er r eu r qu ad r atiqu e moyen ne ou tou t au tr e pr op r iété intér ess
estimateu r sont tr op comp lexes à calcu ler , on examin e p ar foisasymptoti
les pr op q
r iétés
u ne. sT
C es pr op r iétés sont celles qu e l’on ob tient lor squ e la taille de l’éch antillon est ar b itr air e
gr an d ne(→∞ ). Gr ace à de pu issants th éor èmes (p ar exemp le le th éor ème lim «itcentr al
»), les pr op r iétés limite(
n →∞ ) de Tn sont souvent p lus faciles à calcu ler que les prop r iétés
valab les p our
n fin i, qu elcon qu e.
On d ir a p ar exem p le
Tnque
est un estimateur
conv e rgede
ntθ si la limite en prob ab ilité de
Tn es t égaleà
θ :
17
où la notationPθ0 in dique qu e la pr ob ab ilité est calcu lée lor squ’on su pp ose qu e la valeu r d
p ar am ètre
θ est θ0, et d on c que la loiXdeest F X ( · ; θ0).
La raison p ou r laqu elle on étu d ie les pr op riétés asymp totiqu es d ’uTn n estimateur
de θ
p eut être illustrée de la manière suivante. Si les conditions d’application d’un théorème central
lim ite sont satisf aites,
alor s ce th éor ème d it typ iqu ement qu e la d iffér en ce entr e la fon ction
rép artition de Tn et la fon ction de r ép artition d ’u ne loi n ormale ten d vers 0. On d it qu e cette
n or male est la « loi limite T»n .de Pou r vu que n soit su ffisamment gran d, cette d ifféren ce entre
les d eu x fon ction s de r ép artition est p etite
au ssi
qu ’on veu Dant. s ce cas, sous d es con d itions
ap prop r iées (qu ’il fau t en gén éral étab lir), les prop r iétés qu ’on ob tient en u tilisant l’u ne
fon ction s de rép artition est au ssi pro ch e qu ’on le veu t des mêmes prop riétés ob tenu es e
l’au tre fon ction de rép artition.
Ain si,su pp oson s qu ’on s’intér esse au b iais de l’estimateur Tn .
S elon la d éfi n ition ci-d essu
si la s,
valeu r du p ar amètre θ est θ0, le biais vau tEθ0 (Tn ) − θ0.
Plaçon s-n ou s d an s le cas où on ne sait p as θcalcu ( ).lerE
0 Tn
S ou s les con d ition s d écrites d ans
ce p aragrap hp e, ou r vu que
n soit su ffisamm ent gr an
la dd,
iffér en ce entr e cette esp ér an ce et
l’esp ér an ceTde n calcu lée en u tilisant lalimite
loi est au ssi p etite qu ’on le sou h Or aite.
il est
sou vent étabqu li e cette d er n ièr e est égaleà
θ0. Par con séqu ent, si n est su ffisamm ent gr an d,
E θ0 (Tn ) est au ssi pro ch e qu e l’on veu θ0, ou
t deen core, le b iaisE
θ0 (Tn ) − θ0 est au ssi p etit que
l’on veu t.
En con clu sion , sou s d es con d ition s ap rop riées qu i p ermettent d ’u tiliser d es résu lta
le th éor ème « centr al limitn »,
estsisu ffisamment gr an d, calcu ler les pr op r iétés asymp totiqu e
d ’u n estimateu r r evient qu asiment à calcu ler les vér itab les pr op r iétés de La cet estimateu r
difficu lté de cette ap pr o ch e résid e dan s le fait qu ’il est difficile (et par fois imp ossib le) de
q u e la taille
n de l’éch antillon d ont on d isp ose est effectivement su ffisamment gr an de p ou r
l’ap pr oxim ation f aite en u tilisant un e loi lim ite est satisf aisante.
18
d éfi n ir for m ellement un test comme un e ap ϕ dpéfi
lication
n ie sur
Ê
n et à valeu r dans {0, 1} qui
in d iqu e la d écision pr ise en fon ction de l’éch antillon Pluobs prtenu.
écisément, cette fon ction
est d éfi n ie ain : ϕsi
(X 1, . . . ,X
n )= k si et seu lementsu si r la b ase de l’éch antillon X 1, . . . ,X
n
on d écid e que H k es t vr aie,k =0 , 1. La v ariab le aléatoireϕ
(X 1, . . . ,X
n ) s’inter pr ète comme la
règ leu tilisée p ou r pr en dr e un e d écision su r la b ase deXl’éch 1, . . antillon
n . Si on ob servé
. ,X
X 1 = x1, . . . ,X n = xn , la déc i sionp r is e au moyen d uϕtest est l’élém ent { de
0, 1} qu ’on n ote
ϕ(x1, . . . ,x
n ).
Un test statistique p ermet de prendre une décision à prop os de la vraie valeur θ en de
u tilisant certain es prop r iétés de l’éch antillon . Pou r constru ire un test, on ch erch e en gén é
existe un e pr op riété de l’éch antillon qu i ch an ge — si p ossible for tement — selon qu ’on co
H 0 ou bienH 1 com me étant vr aie. C ette pr op r iété est mesu r ée p ar T unn feor
statistique
m éeà
p ar tir d es var iab les comp osant l’échTantillon:
n = T (X 1, . . . ,X
n ).
E xe mp lLe e:p aramètre θ es t la pro p orti o n de ménag es françai s di sp o sant d ’un accès intern
à do mi ci le. Au trement odint,mes si u re cette c arac téri s ti q ue d ’un au ménag
ha s e
ard
cho isi
p ar X , o n n o teraX=1 l ’é vè ne me nt s equi
ré a l i le
s eménag
si e di sp o se d ’un accès in tern et
à so n do mi ci le etX =0 so n co n traOn i re.
a é vi demme ntX ∼ B (θ). Admetto ns que l ’on
: θrH
ve u i l l e tes0te = 12 co nt reH 1 : θ> 1
2 et q u e p o u r cel a o n d i s p o s e d ’u n éch an ti l l on
a l éa to i re s i 1mp
, . .l .eX
,Xn de X.
Les hyp o thèses p ortent sur une pro p ortio n d’individus dans la p o pulatio n. On sait que cette
pro p orti o n et la même pro p orti o n calculée dans l ’échantil lo n o nt tendance à ê tre semblab
Autrement dit, une pro priété de l ’échantillo ch an ngqui
era se lo n0qu es eH
t vra i e o u p as est
l a pro p orti o n de variablesX
1, . . . ,X
n d a n s l ’é c h a n ti prendro
l l o n qntuila valeur 1. En e ffet,
si H 0 es t vra ice,’e s t à d i reθ =si 12 , cette prop ortion sera probablement assez pro che de
1
2 ; siau co n tra i 0reH
es t fa u s s e, al sera
ors pro
il bable d’o bserver une valeur plus g rande que
1
2 p o ur cette même pro p ortio n. On cho isit do nc de mesurer cette pro priété au moyen de la
1 n
s ta ti s ti qu=
n eT n i =1 X i , c ’est à di re de la pro p orti o n d ’i ndi vi dus de l ’échanti ll o n ayant
u n accès à i n ternet à do mi ci l e.
Ain si,on p ou rra p artition n er l’en semb
noté le,
⊆ , d es valeu rs p ossib les de la variab le
Ì Ê
19
b lab le lorsque
H 1 (ou H 0) est vraie ? Le critère qui p ermet de rép ondre à cette question est basé
su r un calcu l de r isqu es.
Noton s qu e ces r isqu es sont d es, compr is entr e 0 et 1 (ce sont d es pr ob ab ilités).
nombres
Remar qu on s au ssi qu e RT −1 RT2,
=1 b ien qu e les évèn ements( Tn ∈ T ) (qu i ser t à d éfi n ir
le RT 1) et(Tn ∈ T ) (qu i ser t à d éfi n ir le RT 2) soient contr C ela
air p
es.
r ov ient d u f ait qu e la
p r ob ab ilité de l’u n n ’est p as calcu lée sou s les mêmes con d ition s qu e la prob ab ilité de
Dan s le calcul deTP( n ∈T ) on su p p os e H que
0 est vr aie, alor s qu e p ou r calcu Tn ler
∈T P(
),
on s u p p H ose
1 vraie. On trad u it sou vent cela en n H otantP
1
ouP H 0 p ou r in d iqu er si un calcul
d e prob ab ilité se fait en su pp H 1osant
ou H 0 vr aie, r esp ectivement. Ain si, on p eu t écr ir e le RT1
com meP H 0 (T ∈T ). On voit ain si aisément qu e même H 0 (siP
T ∈T ) =1 − P H 0 (T ∈T ), en
gén éral on aP (
H 0 T ∈T )=1 P (
− H 1 T ∈T , ) c’est-à-d ir e RT 1 =1
− RT 2.
Pou r un pr ob lème de test d on n é, il existe évid emment p lu sieurs tests p ossib les. Par e
on p eu t con str u ir e un test qu ’on
ϕT,nTotera
en con sid ér ant un e statistique
Tn et un e r égion
20
T de valeu rs p ossib les p Tnour
, d e la f or me ϕT, T (X 1, . . . ,Xn ) =1 ⇐⇒ Tn ∈ T . On voit
qu ’il existe au tant de tests de cette for me qu ’il existe de ch oix p Tossib . Parles
exem
p our
p le,
si T est un inter valle de la fortme] ∗
, ∞ [, il y a au tant d ’intervalles p ossib les qu ’il y a de ch oix
p ossibles p ourt . Par ailleu r s, on p eu t également vou loir u tiliser un e Sstatistique
∗
n au tre que
Tn et u tilis er u n test b as é
Sn ,sur
d e la f or me (
ϕS,S X 1, . . . ,X n ) =1 ⇐⇒ Sn ∈S .
Pou r ch oisir entr e d eu x tests,
on con sid èr e leu rs r isqu
Deues.
x test d iffér ents n ’au r ont en
gén ér al
p as les mêm es r isqu Comme
es. d es r isqu es sont d es pr ob ab ilités de se tr omp er (de
p r en dr e de mau vaises d écision s), d es d eu x tests on pr éfèr era celu i d ont les RT1 et RT2
plu s p etits. De man ièr e plu s gén ér ale, p ou r un pr ob lème de test don né, on sera tenté de
p ar mi tou s les tests p ossib les celu i d ont les r isqu es de typ e 1 et de typ e 2 sont p lu s p e
ceu x de n ’imp or te auqu tr
ele test.
Un e telle ap pro ch e bu tte su r la non -existen test
ce d’u n tel
d an s les situ ation s qu i pr ésentent un intér êt. Pou r se r en d re comp te de cette n on -exist
p eut considérer l’exemple suivant.
E xe mp lOn e: re pre nd l ’exemp l e précé de nt da on ns
s ’in
l eqtéres
uel se à la valeur de la pro-
p ortio n θ de ménag es français ayant un accès à internet à do micile, à pro p os de laquelle on
1
0 : θ ≤ 2 co nt reH
s o uhaite tes terH 1
1 : θ> 2 . Pu i s quneT = n1 ni=1 X i , la pro p ortio n de
ménag es de l ’échantillo n ayant un accès à internet à domicile, a tendance à être pro che de
1
θ , on s ’atte nd à ce queT
n prenn e un e va l eu r si g ni fi ca ti vement pl 2 si
usHg1 ra
estnd e que
vra i e. Par co n s éq u en t, o n p eu t ch oTi s(ensemblei r u n en sde emb
valeule rs pro bables n p o urT
l ors qu 1eHes t vra i e) de l a T =]12 + d,1], où d est un no mbre que l’o n se do nne. Ainsi,
forme
1
T =1 ⇐⇒ Tn > 2 + d; il co nsiste à rejeter l’hyp o thèse que la pro p ortion
l e tes t esT,tϕ
d es ménag es françai s ayant i n tern et es t pl12 us l orsque
p e ti tecette
quepro p orti o n, o bservée
1
s ur l ’échanti ll o n, es t si g ni fi cati vement 2pl. Po us urg rande
cho isirqued, il est raiso nnable de
retenir la valeur p o ur laquelle les risques du test c orresp o ndant sero nt les plus p e tits p o ssib
1 1
Po ur un cho ix de d donné, le RT 1 es tP H 0 (Tn > 2 + d) et le RT 2 es tP H 1 (Tn ≤ 2 + d).
Il est facile de vo ir que p o ur diminuer lefaut RT 1chil o is ir de g ra nd es val eu al ors
rs de d,
q ue p o u r d i mi n u er lfa e ut
R Tch2o , ilis ir de p e ti tes val eu Il es
rs tde
dod. nc im p os si bl e de
c ho is ir d de mani è re à mi ni mi s er si mul tanément Au l estrement
deux ri sdisoques.
t, ie ntd1
1
e td2 d eu x ré el s tel 0s <d
q ue1 <d 2 < 2 . On co ns id è re le te st da ns
o n
lere
qu jeel
tteH
0
> 12 + d1 ai ns i qu e le tes t da ns l eq uel o0 n
l ors qu neT l ors
rejequeT
tteH 1
n > 2 + d2. Le RT1
d u premi er tes t s e ra pl us g rand duqu seeco
celnd
ui, al ors qu e so n RT 2 se ra pl us p et it.
Cet exemp le montr e qu e d an s un cas p ar si ticu
onlier,
s’intér esse à d es tests b asés sur
u ne statistiqu e d on n ée (la statistique
Tn mesurant la prop ortion dans l’échantillon),
ayant une
for me d on n ée (le test H r 0ejette
lor squ e la statistiqu e pr en d un e valeu r p lu s gr an de qu ’u n ce
seu il) alor s il n ’existe p as de test ayant d es r isqu es p lu s p etits qu e les au tr es tests. Un r
p lu s gén éral
montr e qu e c’est égalem ent d le ès
cas,
qu ’il
existe un évèn em entest quip ossib le
(d e prob ab ilité n on nu lle) n on seu lement H 0lorsque
est su pp osée vr aie mais au ssi lor H 1 sque
10. Cela montr e qu e les cas d an s lesqu
es t vr aie. existe
els ilun test d ont les d eu x r isqu es sont
min imau x sont d es cas d an s lesqu els les hyp oth d éfi
èsesn issent
qui le pr ob lème de test sont
tellement dissemb lab les qu ’on p eu t tr ou ver des évèn ements imp ossib les selon l’u ne des
hyp oth èses alor s qu ’ils sont cer tain s selon l’au tr11eDe hyptels
othèse.
cas s ont p eu f r éq u ents et
san s intér êt pr atiqu e.
L’ap pr o ch e usuelle utilisée p ou r lever cette in déter min ation qu i p or te su r le ch oix d
10
La p reu ve de ce résu ltat est d on n ée à la fin de ce ch ap itre
11
Il ap p araît d an s la p reu ve du résu ltat mention né qu e les tests min imisant les d eu x risq u es sont n écess
des tests p ou r lesq uels ces risq ues sont nu ls. Les hy p othèses sont tellement dissemb lab les, et don c recon nai
l’u ne par rap p ort à l’au tre, qu e la prob ab ilité de se tromp er est tou jou rs nu lle.
21
Jer zyNe ym an
(1894-1981)
à partir des RT1 et RT2 a été prop osée par J.Ne ym anet E. Pe ars on (voir fi gu re 1.1).
Cette ap pr o ch e con siste à s’assu rer qu e p ou r un pr ob lème de test don né et p ou r tou t
envisagé p ou r le r ésouledrRT1 e, de ce test ne d ép asse p as un e cer tain enotée
valeuα r,
et
ap p elée ni v eau d u tes t.Sou s ce tte condition
, on p eu t alors ch erch er d es moyen s de r en dre
le RT2 le p lu s p etit p ossibLa le.contr ainte quiimp ose qu e le RT 1 d ’u n test,
d e la f or me
ϕ(X 1, . . . ,X
n ) =1 ⇐⇒ Tn ∈T , ne d ép asse p as le n αiveau s’écr it
P H 0 (Tn ∈T ) ≤ α. (1.1)
Pou r un niveau
α, tou t test satisfaisant l’in égalité ci-d essu s est apde
te st p elé . Pu is que
niv eauα
p our tout problème de test d’une hyp H othèse
0 contr e un e hyp oth
H 1èse
on d oit se d on n er u ne
valeu r p our
α et u tilis er u n test d e n α,
iveau
on d it qu’
on te steH
0 contreH1 au ni v eauα.
On voit alor s qu e si le n iveau
α est fi xé, p ou r tou t test il existe d es ch
T oix
qu ide
ne sont
pas au tor isés car ils con du ir aient à un e violation de la contr ainte imp osée par l’in égalité (
On note qu e dan s l’ap pro ch e de Neyman -Pearson,
on ne ch oisit p as d ir ectement
T , mais on
fi xeα d’ abord
,et e nsu ite
on ch oisit
T de man ièr e qu e (1.1) soit satisfaite.
Le ch oix de
α reste arbitraire. Il convient cep endant de noter que d’après la contrainte (1.1),
α r ep r ésente la valeu r maximale qu e le RT 1 ne d oit p as d ép asser . Un r isqu e étant un e
de se tromp er, on sou haite en gén éral qu e cette prob ab ilité ne soit pas Au trop
ssi délevée.
ans
la pr atiqu e cou r ante d es tests, on r etient
α lespvaleu
our rs « stan d ard » 0,1, 0,05 ou 0,01.
E xe mp lOn e: reprend l ’exempl e précédent dans l equel on s ’i n téres se à la val eur de la pro p or
ti o n de mé na g es fra nç ai s aya nt un ac cè s à i n te rn et à do mi ci l e. En s ui va nt ce qu i a é
, 05 H 0 : θ = 12 co nt reH
=0veauα
u ti li sera p o ur tes ter au ni 1
1 : θ> 2 u n te s t d e l a forme
22
ϕ(X 1, . . . ,Xn ) =1 ⇐⇒ Tn ∈ ]12 + d; 1]. La rég io n c ri tiT que ]12 + d; 1]et
e s t d e l a forme
c h o i s i r u n te s t p o u r d é0cietH
d er
1 revi
en treH
ent à cho is ir la val eurSide o nd.ve u t q ue
l a co ntrainte (1 .1 ) p ortant sur le niveau so it faut
satisque fai te,
l ’oiln ait
P H 0 (1 ≥ Tn >d + 12 ) ≤ 0, 05 (1.2)
1
o u enc orePH 0 (Tn >d + 2 ) ≤ 0, 05 pu i s qu ne,T étant une pro p ortio n, on a to nujo ≤ 1ursT
.
On ra p p el l e q u e l a n H0oindique
ta ti o nP
que le calcul de pro babilité do it se fai re en supp o s ant
a u tre me n t d i t en s u p p o=s 12a, nou
H 0 vra i e, t qenu ceθore qu eX ∼ B ( 12 ). Ave c ce tte
s upp o sitio n, la lo i co mmune 1 , . . deX
. ,Xn es t é vi demme B (θnt) et il es t fa ci le d ’en dédu i re
1 n 1)
l a loideTn = n i =1 X i , quin o u s p e rm e ttra d e H c 0a(Tlnc>d
u l+ e rP
2 p o ur n’i mp orte
q uel le val eu r de d. E n e ffet
n n
P H 0 (Tn >d + 12 )= P H 0 ( n1 X i >d + 12 )= P H 0 ( X i >nd + n2 )
i =1 i =1
n
=1 − P H 0 ( X i ≤ nd + n2 )
i =1
n
On s ai t qu e 0siHes t vra i e,X
1, . . . ,X B ( 12 ) et do nc i =1 X i ∼ B (n; 12 ). Ai ns i la
n so nt iid
n
( i =1 X i ≤ nd + 2 ) est ég ale à la fo nctio n de répartitio n de la lo i binô miale
pro ba b i lHi 0téP n
1 − b(n, 1 ) (nd + n2 ) ≤ 0, 05
2
23
su pp osée vr aie qu e lor squ’elle est su pp osée fau sse (la pr ob ab ilité de pr en dr e un e b on
est p lu s gran de qu e la prob ab ilité d ’en pren dre un e mau vaise).
P θ0 θ0 ∈G(X 1, . . . ,X
n) ≥ 1 − α
24
Cela se r efor mu le ain si : la pr ob ab ilité, calcu lée lor squ e la valeu rθdu
0, ppou
ar ramètr
que e est
la régionG contienne la b onne valeu r (à s θavoir
0) du p ar amètr e est d ’au moin− αs1
. Ceci
étant vr ai qu elle qu e soit la valeu r qu ’on su pp ose p ou rθ,lel’in
p aramètre
égalité (1.3) d it que
la probabilité p ou r que
G contien ne la vraie valeu r (in con nu e) du p aramètre est au moin s égal
à1 − α, quelle qu e soit cette vraie valeu r.
Con stru ire un e région de con fi an ce con siste à d élimiter d an s l’en semb le Θ d es valeu
sib les du p ar amètr e un e r égion d an s laqu elle se tr ou ve la vr aie valeu r avec un e gr an d
(1 − α). Étant d on n ée cette d émarch e, il ap p araît n atu r el de préférer p armi d eu x r égion
le même n iveau de con fi an ce, celle qu i est la p lu s étroite, l’id ée étant qu e la région la p lu
est la p lu s in for mative su r la vr aie valeu r du p ar amètr e.
Bien qu ’on ne for malise p as cette id ée, on p eu t facilement en voir la r aison à tr aver s l’
su ivant. Su pp oson s qu e le p ar amètr θesoit d ’intér
la prob
êt ab ilité d ’u n évèn ement d on né (p ar
exemple la pr ob ab ilité qu ’u n mén age ch oisi au hasar d disp ose d’u ne con nexion à inter n
d om icile).
Dan s ce cas, on a par construction Θ = [0; . On
1] a évid emm entP θ(θ ∈ [0; 1]) =1 ,
∀θ ∈ Θ et il est d on c clair qu e p ou r
α∈tout
[0; 1]
, la régionG = [0; 1]s atisf ait la con d ition
(1.3).L’intervalle [0; 1]est d on c un e r égion de con fi anθceaupniveau1
our − α. Cep endant
on voit b ien qu e tou t en p osséd ant un n iveau de con fi an ce ,au
i . e.aussi
ssi hpro
au ch
t( e de 1)
qu ’on le sou h aite,
cette r égion coïn cid e avec l’en semb le d es valeup rs ossib
a priori
les p ou r la
p rob ab ilité
θ et n’ap p orte don c au cu ne in formation su r la vraie valeu r du paramètre, au tre q
celle d ont on d isp osait d éjà, à savoir qu e le pθ,arétant
amètre
une prob abilité, sa vraie valeur
est n écessair ement d an s l’inter valle [0; 1].
Un au tr e exemp le p er mettant d ’illu str er la même id ée est Su le
ppsuoson
ivant.s qu e p our
u n p ar amètre θ et un n iveau de confi ance d on − αné1
n ou s soyon s p arvenu s à con stru ire une
r égion de con fi an ( ce
G X 1, . . . ,X n ). Il est clair qu e tou te p ar tie de Θ contenG(X 1ant
, . . . ,Xn )
est également un e r égion de con fi an ce de − αnpiveau1
ourθ. En effet, p ou r tou te p Gartie
′ de
25
θ :P( A n ≤ θ ≤ B n ). C ette prob ab ilité sera d on n ée à p artir de la loiA ndu ,B cou
n ). Cpomle( me
A n et B n sont d es variab les aléatoires qu i sont fon X ction
1, . .s. de
n , la loi de(A n ,B n ) sera
,X
elle-même ob tenu e à p ar tir de X la. loi
C elle
de est
F ( · ; θ) et dép end de la valeur du paramètre
θ. Par conséquent, la probabilité que l’on cherche à calculer dép end de cette valeur. On notera
d onc cette probabilitéP 13
θ(A n ≤ θ ≤ B n ).
L’inter valle
I n est d estin é à fou rn ir un en cad r ement pr ob ab le de la valeuθr. incon nu e d
Par con séqu ent,A n et B n ne sont p as ch oisis ar b itr air ement, mais de man ièr e qu e la prob ab
P θ(A n ≤ θ ≤ B n ) soit gran d e, et ce qu elle qu e soit la valeu r pθossib
. Pou rlecela,
de on se fi xe
u n n ombre α dan s [0, 1] et on ch erche
A n et B n d e sor te que
P θ(A n ≤ θ ≤ B n ) ≥ 1 − α, ∀θ ∈ Θ (1.4)
13
Notons aussi que non seulement la loi de probabilité qui sera utilisée p our faire le calcul dép end de la valeur
in con nue
θ, mais aussi que l’évènement lui- même dont on cherche à calculer la probabilité dép end également de
cette même valeu r in con nu e.
26
C h ap i tre2
Dan s ce ch ap itre, on étu die un des mo dèles les plu s simples destin és à mo déliser et étu
la dép endance entre deux phénomènes dont la mesure s’effectue au moyen de variables notée
X et Y.
On supp ose que la dép endance entre les deux variables est orientée:la variab le
X « ex-
p liqu e » la var iab
Y . le
Dan s le contexte d’u n mo dèle écon omique, cette hyp oth èse est cou ran
E n effet,la plu part des mo dèles écon omiques distin gu ent les variab les en dogèn es des varia
exogèn es : le mo dèle décr it comment le niveau des pr emièr es est déter min é en fon ction d
d es secon dNotons
es. don c,
ain siqu e l’exp rime leu r qu alifiqu
catif,
e le mo d èle écon omiqu e ne
d it r ien su r la façon d ont se d éter min e les n iveau x d es var iables
On verexogèn
ra commes. ent
p ren dr e en comp te cette d istin ction faite au sein d es var iables d an s le contexte d ’u n mo
écon om étr iqu e.
Une façon simple de représenter la dép endance Y envers
de X con siste à p oser un e r elation
lin éaire entre les variabYles:
= aX + b. Dan s un e r ep r ésentation de ce typ e, la car actér isation
de la dép endance de la variable
Y envers la variabX, le c’est à d ir e la façon d ont les var iations
de X provo quent des variationsY,deest entièrement capturée par la valeur du co efficient
a. Il s’agit de prop oser un mo dèle statistique p er
quim ette le mêm e typ e de mo d élisation de
cette dép endance et p qui
er mette de l’étu d ier au moyen de tech n iqu es d ’in fér en ce statistiq
ap pr op riées. Le mo dèle le plu s simple est le mo dèle de régr ession lin éair e. Dan s un tel m
relation entre les variabXles
et Y est r ep r ésentée et car actér isée de man ièr e simp le, au moye
d ’u n p etit n omb re d ’éléments
con qui
stituent les
paramè tres du mo d èle (semb lab alesàet b
dan s l’égalité précéd ente). Les méth o des d’in féren ce dévelop p ées dan s le contexte de ce
ont p ou r bu t d ’ap pr oximer ces p ar amètr es à p ar tir d ’ob ser vationX et s
Y.d es var iab les
27
2.2 Heuristique de la construction du mo dèle
SoientX et Y deu x variab les aléatoires décrivant ch acu ne un ph én omèn e dan s un e p o
lation.On sélection npe,ar un pr o céd é su pp osé aléatoire 1,
n in d ivid us de cette p op u et
lation,
p our chacun on intro duit le couple de variables mesurant les deux phénomènes p our
étudiés:
e
le i in d ivid u, on n oter a ce cou
X i ,Ypi )le(
. En u tilisant la convention de n otation qu i d istin gue
les variab les de leu rs r éalisation s, onxni ,yotera(
i ) le cou p le d es valeu rs ob servées
X i et de
Yi .
On sou h aite r ep r en dre l’orientation d on n ée à la r elation entre les variab les (voir la se
p récéd ente). Pou r ch aqu e in d ividu i, la variab leX i est su pp osée d éter min er le n iveau de la
var iab Ylei . On ap p elle alors n variab les
X 1, . . . ,X e xplicati ves et Y1, . . . ,Y
n variab les e xpliqu ées
ou variab les dépe ndantes . Cette distin ction su r la natu re des var iab les est en gén ér al intr o du i
d an s la con str u ction du mo d èle statistiqu Dan s d e. an s la version la p lu s simp le du mo d èle de
r égr ession lin éair on e, su pp ose qu e les var iab X 1, les n sont n on -aléatoirDu
. . . ,X es.point de
vu e statistique, cela revient à dir e qu ’au sein du mo dèle écon om étr ique X 1, . les var
. . ,Xn iab les
sont fi xes d an s le sen s où les valeu rs pr ises p ar ces var iab les ne sont p as d istr ib u ées s
véritab le loi de prob ab2ilité. Elles ne p eu vent p ar con séqu ent qu ’êtr e simp lement égales à leu
ob ser vations n . Avec un e telle hyp oth èse,
x1, . . . ,x les variab les n sont d étermin ées
X 1, . . . ,X
par leu rs ob servation s et au cu n au tre comp ortement p ossib le p ou r ces variab les n’est a
deh ors de ce qu i est directement issu de l’ob servation , le mo dèle ne p ermet de détermin er
prop riété particu lière p ou r les variab X 1, . les
. . ,Xn . On retrou ve en cela la n otion de variab le
exogèn e qui existe dan s un mo dèle écon omique désign ant un e var iab le dont ou les
la valeu r,
prop riétés, sont détermin ées en deh ors du3 mo Dandèle.
s la su ite, on tr ad u ir a cette hyp oth èse
en u tilisant d an s la n otation les ob servations x1, . . . ,x n au lieu d es variab X les n elles-
1, . . . ,X
m êm es.
Avec cette hyp oth èse,
si on veu t un mo d èle statistiqu re ep
quir en ne l’id ée de b ase de la
dép endance linéaireYdeenversX, le mo d èle p ou rr ait p ar exemp le stip u exis
ler te
qud’iles
n omb res
β0 et β1 tels qu e la relation
Yi = β0 + β1xi (2.1)
28
les variab les n , les variab les
X 1, . . . ,X n doivent dan s ce cas avoir
Y1, . . . ,Y un e d istr ib u tion
dégén érée et ne p eu vent don c être égales à au tre ch ose qu e leu rs ob servation s. Le mo d
alor s stip u ler qu ’il existe d es nβomb 0 et βr
1 es
tels queyi = β0 + β1xi , ∀i =1 , .. . ,n.L’ob jectif
con sistant à tr ou ver d es ap pr oximation s d es β0petar
β1amètr
p eu tesêtre atteint d ’u ne man ière
tr ès simp le.
En effet,il su ffit d ’u tiliser (p ar exemp le) les 2 pr emièr es ob x ser
1,yvation
1) et s(
(x2,y2) p ou r d éd u ire la valeu β0 retde
deβ1.
C ep en d ant,d an s qu asiment tou tes les situ ation s r en contr ées on en con
pr atiqu
staterait
e,
qu e les ap pr oximation qu ’on
s, p eu t p ar exemp leβn0 oter
∗ et β1 , ain siob tenu es p ou r les deux
∗
Yi = β0 + β1xi + εi , ∀i =1 , .. . ,n (2.2)
29
Le fait qu e l’on ne s’intér esse p as à l’imp act qu ’ont ces facteu rs d an s la d éter min ation
n iveau de la var iab le exp liqu ée est tr ad u it p ar le fait qu e la façon d ont cet imp act s’exer
pas mo délisé, contr air ement à ce qu i est fait p ou r décr ir e le rôle de la var iab le explicative
p r écisément, d an s un e r elation telle qu e (2.2), on ne ch erche ni à id entifi er ce qu e sont c
facteu r ni
s, à mesur er ch acu n d ’entr e eu x au moyen deDe varp iab
lu s,les.
la man ière dYiont
dép endrait de ces autres facteurs n’est pas explicitement mo délisée. Cela est à contraster ave
le statu t de la var iab le exp licative, d ont (1) on d on ne la d éfin ition et la sign ifi cation en ta
var iab le, et (2) d ont on stip u le la façon d ont elle p eu t affecter le n iveau de la var iab le ex
(l’effet deX i sur Yi est tr ad u it p ar le ter
β0 me
+ β1X i ).
Le fait que l’imp act de ces facteurs sur la variable d ép end ante puisse être n égligé est tra
p ar un e n ou velle hyp othOn èse.
su pp oser a p ar la su ite qu e p our tou i, t in
endob
ividu
servant
q ueX i = xi on p eu t s’atten dr e à ce qu e la valeu r de la var iab leYi exp
soitliqu
β0 +ée
β1xi .
Cette hyp oth èse sign ifi e qu e les facteu rs au tr es qu e la var iab le explicative ne contr ib ue
rien à la valeu r à laqu elle on s’atten d p ou r la var iab le exp liqu ée.
Si on rep ren d l’exemple de la relation entr e l’an cien neté dan s l’emploi et le salair e, ce ty
d ’hyp oth èse r evient à su pp oserd qu
eu ex si
in d ivid us ont un e an cien n eté notée
id entiqu
x, e,
alors on p eu t s’atten dre à ce leu rs salaires soient égau x, bien qu e ob
ceuse
x rv
qunei seront
és le
soient p as n écessair ement. La valeu r commu ne atten du e p ou r cesβd0 + euβ1xx.salair es est
Il reste d on c à for mu ler math ématiqu ement au sein d ’u n mo d èle statistique for mellem
d éfi net
i, qui servira de cad re à l’in féren ce men ée su r les p βaramètres
0 et β1, l’ensemb le d es
hyp oth èses et inter pr étation s for mu lées ci-d essu s.
Re ma rque1 Le mo d èle de régr ession lin éair e simp le con siste en l’en semb le d es lois de p
lité p ossib les p our
(X 1,Y 1), .. .,(X n ,Y n ) telles qu e les con d ition s exp r imées p ar les con d itions
C1, C2 et C3 sont vér ifi ées.Pou r dévelop p er des méth o des d’inféren ce dan s le contexte de ce
mo d èle, on su pp oser a qu e celu bien i-ci est i, fié
spéc c’est-à-d ir e qu e la loi de pr ob ab ilité d ont est
30
is su le2
n-u p let(X 1,Y 1), .. .,(X n ,Y n ) de var iab les aléatoir es est b ien l’u ne de lois du mo d èle.
Cette loi de pr ob ab ilité est d ésign ée p arv le raiter ,me
d an s le sen s où p armi tou tes les lois
e loi
con stitu ant le mo dèle, c’est celle qu i décrit la distrib ution de prob ab ilité des variab les aléa
d ont on ob servera les r éalisation s.
Par ailleu r s,
p ou r n ’imp or te qu elle de probab
loi ilité du mo d la
èle,
con d ition C2 imp lique
qu e con n aissantxi , on p eu t écr ir e l’esp ér anYice
comme
de un e f on ction affinxei . de
S ous
l’hyp oth èse qu e le mo d èle est b ienceciestsp écifiau
é, ssi
vr aien p articu lier p ou r la vraie loi.
Dan s ce cas, les n omb r es p qui
ermettent d ’écrir Yei )E(comme un e f on ction affinxie sont de
notésβ0 et β1. On ap p elle ces n ombr es v ale du es
v raies rs p ar amètr
β0 et
esβ1. C es vraies valeu rs
sont in con nu es et le mo d èleci-d d éfi
essu
ni s con stitu e le cad re d anseront
s lequdelévelop p ées
des méth o des d’in fér en ce statistique p er mettant d’estimer ces vr aies valeu rs.
La d éfi n ition ci-d essu s ad met un e d éfi n ition équ ivalente, qui for malise la r elation (2.
qu e les r em ar qu es qu ’elle a su scitées.
Propriét é 1 Soi e(X nt1,Y 1),..., (X n ,Y n ) n cou ple s de v ariab le s aléatoire s dont le s ob se rv atio
sont (x1,y1),..., (xn ,y n ). O n dé finit le s n v ariab le s aléatoire
1, . sε n parε i ≡ Yi − E( Yi ),
. . ,ε
i =1 , . . . , n . Le s conditions
C1 à C3 sont satisfaite s si et se u le me nt si le s conditions su iv antes
le sont au ssi
C′ 1. La condi ti on C1 e st satisfai te
C′ 2. ∃β0 ∈ , ∃β1 ∈ , Yi = β0 + β1xi + εi ,
Ê Ê
i =1 , .. . ,n
C′ 3. E( εi ) =0 ,i =1 , ... ,n
C′ 4. ∃σ ∈ ]0, +∞ [,
0 sii = j
cov(εi ,ε j )= ∀i,j =1 , .. . ,n
2
σ sii = j
La preuve de cette prop osition est obtenue à partir de la définition des εvariables n et
1, . . . ,ε
d es égalités su ivantes, ob tenu es en su pp osant
′ 1 vrC1
aie:
ouC
E( εi ) = E(Yi ) − β0 − β1xi
cov(εi ,ε j ) = cov(Yi ,Y j ) (2.3)
Il est don c p ossib le de défi nir in différ emment le mo dèle de régr ession lin éair e simple
les cond ition s C1 à C3 ou p ar les cond itionsC
′ 1 àC ′ 4. C es d er n ièr es sont p lu s fr équ emment
u tilis ées.
31
var iab le exp licative. Il est imp or tant de n oter qu e les d eu x n omb r es qu i d éfi n issent ce
sont les m êmes p ou r tou s les in d ivid u s.
C3 est un e con dition qu i n’est pas fon damentale dan s la mo délisation : elle ne cap tu re
des éléments qu i ont motivé la con struction du mo dèle, décrits dan s la section précéd ente. C
condition p ermet, tout en préservant les caractéristiques essentielles de ce mo dèle, d’en prop
u ne ver sion tr ès simp le su r le p lan statistiqu e. De ce p oint de vu e,Yila
,Ycon
j ) =d0 ition
si cov(
=
i j in d iqu e qu e les var iab les exp liqu ées relatives à d eu x in d ivid us d istin cts sont d es
aléatoir es n on -cor r L’ab
élées.
sen ce de corr élation entre d eu x variab les équ ivau t à l’ab sen ce
toute dép endance de forme linéaire entre ces variables.
,Y i )= σ2 ∀i =1 , .. . , n,qu i équ ivau t évid emment
Par ailleu r s, la con d itionYicov( Yi )=
à V(
2
σ ∀i =1 , ... , n,imp ose au x var ian ces n variab
d es les aléatoires i de ntiqu.4es
n d ’être
Y1, . . . ,Y
C ette pr op r iété est aphomoscédasti
p elée .c i té
Les ter m es n ont la même inter pr étation qu e celle
ε1, . . . ,ε enqui
a été d on n ée d an s la
section pr écéd ente (voir le p oint 2 à la p age La con
29).d itionC′ 3 qu ’on imp ose à ces ter mes
p our définir formellement le mo dèle traduit les remarques qui ont été faites précédemment. D
la con d itionC′ 2 on r econ n aît qu e d es facteu rs d istin cts de la var iab le exp
X i p eulicative
vent
affecter le niveau de la variable dép endanteYi . C es facteu rs sont mesu r és p ar la var εi . iab le
Cep endant, on s’attend à ce que, compte tenu du niveau de la variable explicative, ces facteur
n e jou ent au cu n r ôle d an s la d éterminYi : laation
con de
d itionC
′ 3 imp ose qu e la valeu r atten due
4
De plus, cette même condition imp ose à ces variances d’ex ister. Même si ce problème ne sera pas ab ordé par
la su ite,l’hy p othèse d’ex isten ce des varian ces a un e imp ortan ce dan s le traitement statistiq ue du mo dèle défi
ci- dessu s.
5
On assimile ici la prév ision à la valeu r atten du e. Il est p ossib le de ju stifi er cela su r le plan th éoriq ue.
32
du mo dèle de régr ession lin éair e et les méth o des statistique qu i lu i sont asso ciées n’ont p
r aison d ’êtr e. Ce qu i su it n ’a d on c d ’intér êt qu ’en su
e1, pp
. . .osant
n sont
,e que
in con nu es.
On r ap p elle qu ’on p eu t interpréter la Yi =
r elation
β0+β1xi +εi com me un e d écom p osition de
Yi en « p ar tie exp liqu éexi »p+ar« p ar tie n on exp liquxiée », plaar
pr emièr e étant
β0+β1xi et la
secon de εi . Intuitivement, la capacité de la variable explicative à expliquer la variable dép endant
ser a d ’au tant meilleu re qu e l’écar Yi et
t entre
β0 + β1xi a ten d an ce à êtr e p etit. Si on mesu re cet
2 2
écar t p ar ( + )
Yi − β0 β1xi , la valeu r atten du e est − β0 − β1xi )2 =E Yi − E( Yi )
Yi E( =
2
V( Yi )= σ . C ela p er met d on c d ’inter pr éter le pσ ar comme
amètre un e m esu re de la cap acité
d e la var iab le exp licative à p lu s ou moin s b ien exp liqu er à elle seu le le n iveau de la var
ex p liqu ée.
Le p ar amètre β0 s ’interprète comme la valeu r atten Ydu i lor
e desque xi =0 . On ap p elle ce
p ar am ètre
interce ,ptou or don née à l’or igin e, p ou r un e raison exp osée ci-d essous. Le par amè
β1 a p lu sieu rs inter pr étation s p ossib les et équ ivalentes.
– C on sid ér on s d eu x in d ivid us statistiqu
i et j et sues pp oson s qu e l’on obxiser et xve
j de
sor te que xj = xi +1. On au ra alors Y E(
j ) − E( Yi )= β0 + β1(xi +1) − β0 − β1xi = β1. On
interprète d onc β1 comme la d iffér en ce entr e la valeu r atten du e de la var iab le exp liqu
p our un individu quelconque i et la valeu r atten du e de cette m ême variab le p ou r un
in d iv idu
j ayant un n iveau de la variab le exp licative d ’u ne un ité su p érieu r à celu i de
variab le p ou r l’in d i.ividu
– Si on con sid èr e la fon ction affine qu i exp r ime la valeu Yi ) en rfon
de ction
E( de
xi (voir la
con d ition C2), ona
dE(Yi )
= β1.
dxi
Par con séqu ent, si la var iab le expxlicative
i au gmente de ∆ un ités, la var iation atten due
de la variable dép endante sera β1∆deu n ités.β1 est ap p elépela nte
du mo dèle.
C ette d er n ièr e inter pr étation fait clair ementβap 1 comme
p ar aître
le p ar amètr e d ’intér êt d ans
ce mo dèle. Étant don née la for me affine expr imant la relation entr e la var iab le explicative e
var iab le exp liqu ée, le p arβamètre
1 capture à lui seul toute la dép endance Yi envers
de xi . Les
tech niques d’in féren ce dévelop p ées dan s le cad re du mo dèle de régression lin éaire simple
p our ob jet
β1.
33
variable expliquée
Valeurs de la
Droite d’équation
y = β0 + β1x
yi
ei
E( Yi )
xi Valeu rs d e la
var iab le exp licative
34
Var iabl es
Notation Interprétation Dénomination Observations
Yi Variable aléatoire mesurant le Variable expliquée, dépen- yi Son esp
phénomène à expliquer pour dante, endogène Toutes
l’individu i ont la m
Xi Variable aléatoire mesurant la Variable explicative, exogène xi Considé
phénomène expliquant Yi
εi Variable aléatoire mesurant la Terme d’erreur associé à N’est pas obser- εi = Yi
partie Yi qui ne peut être ex- (xi , Yi ) vée. Son esp
pliquée par X i La réalisation Toutes
(non observée) de ont la m
εi est notée ei .
Par amèt r es
Notation Interprétation Dénomination Com
35
β0 Valeur attendue de Yi lors- Ordonnéeà l’origine, intercept Sa vraie valeur est inconnue
qu’on observe X i = 0
β1 Variation attendue de Yi Pente C’est le paramètre d’intérêt,
lorsque xi augmente d’une dance de la variable endogèn
unité Sa vraie valeur est inconnue
σ Écart-type commun des va- C’est également l’écart-type
riables dépendantes — Sa vraie valeur est inconnue
Le mo dèle statistique défi ni dan s la section pr écéd ente est n otamment con str uit dan s
de fou rn ir un cad re à des méth o des d’in féren ce p ermettant d’estimer β0 et
les
β1paramètres
. En
suivant le princip e d écrit d ans le chapitre 1, on cherchera dans cette section à d égager une f
ad équ ate d ’u tiliser les varXiab
1, . les
. . ,X n en vu e de for mer un estimateu r p on ctu el
n ,Y 1, . . .Y
d es p ar amètrL’u
es.tilisation de cet estimateu r et d es ob ser vation s fou rn ir a l’estimation de l
vr aie valeu r de ces p ar amètr es.
3.1 Ap p ro ch e intuitive
Dan s un e première ap pro ch e du probonlème, ch erch e d es valeurs d es p aramètres p our
lesqu elles la p ar tie de
Y1, . . . ,Y
n qu i n ’es t p as exp liquXée
1, . p. .ar
,Xn est la p lu s p etite p ossib le
en moyen n e. Pou r cela, on ch oisit d es valeu β0 et de
rs βde
1 p ou r lequ elles la d istan ce moyen ne
entr e les
Yi et lesβ0 + β1X i est min imale.
For m ellem ent,
si on mesu re ch acu ne de ces d istan Yces pβ0ar+ β1X i ) 2, le pr ob lème
i −(
con siste à min imiser la fon Sction
défi n ie p ar
S: Ê
× Ê
−→ Ê
+
1 n
(β0,β 1) −→ S (β0,β 1)= (Yi − β0 − β1X i )2
n i=1
1 n (
oùS (β0,β 1)= n i=1 Yi − β0 − β1X i )2.
s atis f aisant
∂S
(β̂0, β̂1) =0 , k =0 , 1. (3.2)
∂βk
37
S (β0 , β1 ) −→
−→
β1
β0 −→
∂S 1 n
(β0,β 1)= −2(Yi − β0 − β1X i ) (3.3)
∂β0 n i=1
∂S 1 n
(β0,β 1)= −2X i (Yi − β0 − β1X i ). (3.4)
∂β1 n i=1
1 1
n
n ( 2)(
i=1 − Yi − β̂0 − β̂1X i ) =0
n
n
i=1 Yi − β̂0 − β̂1 n1 n
i=1 X i
=0
⇐⇒
1 1
n
n ( 2) (
i=1 − X i Yi − β̂0 − β̂1X i ) =0 n
n
i=1 X i Yi − β̂0 n1 n
i=1 X i − β̂1 n1 n 2
i=1 X i
=0
38
La pr em ièr e équ ation est équ ivalenteà
1 n 1 n
2
X i Yi − XY + β̂1X − β̂1 X i2 =0 , (3.6)
n i=1 n i=1
2
d e sorte qu en1si n 2
i=1 X i − X
=0 , ona
n
X i Yi − nXY
i=1
β̂1 = n
2
X i2 − nX
i=1
1 2
Noton s quen
n 2
i=1 X i − X
= n1 ni=1(X i − X )2, de sorte qu e la con d ition
1
n
n 2
i=1 X i −
2
X = 0 p ermettant de d éfi ir ni=1(X i − X )2 =0 . Le memb re de gau ch e de cette
β̂1nest
relation étant un e somme à ter mes p ositifs, cette somme est nu lle si et seu lement si ch
d e ses ter m es est nu l:
n
(X i − X )2 =0 ⇐⇒ (X i − X )2 =0 ∀i ⇐⇒ X i = X ∀i ⇐⇒ X 1 = X 2 = ··· = X n
i=1
O r ceci est un e p ossib ilité qu i a été exclu e au d éb ut de ce pr emier p oint. Par con séq
on a le r és u ltat su ivant.
n
X i Yi − nXY
i=1
β̂1 = n , (3.7)
2
X i2 − nX
i=1
2
Ŝ = S (β̂0, β̂1) ≤ S (β0,β 1), (β0,β 1) ∈ Ê
.
39
5000
4000
S(β0 , β1 )
3000
2000
1000
0 50
S(β̂0, β̂1) −→ β̂1
30
β̂0 ↓
ց
10
−→
−10
40.0
20.0
β1
0.0 −30
−20.0
←− −40.0 −50
β0
∂S ∂S
(β0,β 1)= x (β0,β 1) , ∀β0, ∀β1.
∂β1 ∂β0
Par con séqu ent les d eu x con d ition s du premier ordre (3.2), qu i d emeu r ent d es con
n écessair es et su ffisantes p ou
β̂0,rβ̂1qu
) min
e( imise la fon ction
S, sont r ed on d antes. Elles
d on n ent toutes d eux
β̂0 = Y − β̂1x.
La solu tion au pr ob lème (3.1) est d on c l’hyp er2 p
défi
lannde
i p {ar
(β0,β 1) ∈Ê Ê
2
| β0 =
Y − xβ1}. Nou s avon s d on c le résu ltat su ivant.
40
S (β0 , β1 ) −→
→
β1 −
β0 −→
réalisation des variab les du mo dèle ne p ermettent don c pas de disso cier dan s cet en se
les vr aies valeu rs de par amètr es des au tr es valeu rs. Pu isqu ’il est imp ossib le de dist
les vr aies valeu rs p ar mi d ’au
il ntr’est
es,p as su rp r en ant qu e la solu tion du prob lème de
l’estim ation de ces valeu rs ne soit p as un iqu e.
Ce même prob lème p eu t être p erçu à travers les con dition d éfi ns issent
qui le MRLS. Si
X i = x p ouri =1 , .. . ,nqu elles qu e soient les valeu rs d es p βar 0 et
amètr
β1, l’esp
es ér an ce
de la variable dép endante sera la même p our tous lesXindividus: i = x,∀i =1 , .. . ,n =⇒
E( Yi ) = E( Yj ), ∀i,j =1 , .. . , n.Notonsm la valeu r commu ne de cette esp érLes an ce.
cou p les(m−ax ,a)et( m−bx ,b ), où a et b sont d es réels qu elcon qu es, d on n ent tou s d eux
u ne valeu r deYiE( ) égaleàm p ou r tou t in d ividu i. Or , p u isqu e le mo d èle es t su p p os é b ien
sp écifi é, p armi tou s les cou p
β0,β 1 les(
) p ou r lesqu els
Y1E(
)= ··· =E( Yn )= m, on trou ve
le coup le d es vraies valeu β0,βrs(
1). Don c du p oint de vu e de l’exp r ession de l’esp ér an ce
de Yi comme un e f on ction affin xi , eil de
est imp ossib le de d istin gu er les vr aies valeu rs d es
p aramètres d ’au tres valeu On rs.
d it d an s ce cas qu e les p ar amètr β0 et βes1 du mo dèle
sontnon- identifiés .
n n n n
(ui − u)(vi − v)= ui vi − nuv = (ui − u)vi = (vi − v)ui ,
i=1 i=1 i=1 i=1
1 n 1 n
où u = n i=1 ui et v = n i=1 vi .
41
:O n a(ui − u)(vi − v) =( ui − u)vi − (ui − u)v ,i =1 , .. . , n,et d onc
P re u ve
n n n n
(ui − u)(vi − v)= (ui − u)vi − v (ui − u)= (ui − u)vi ,
i=1 i=1 i=1 i=1
Noton s qu e lorsque
Re ma rque3 u = v, le r ésu ltat pr écéd ent d on ne
n n n
(ui − u)2 = u2i − nu2 = (ui − u)ui . (3.9)
i=1 i=1 i=1
n ( )
i=1 X i − X εi
β̂1 = β1 + n (
(3.11)
j =1 X j − X
)2
42
Pour obten ir (3.10),
on n ote que Yi = β0 + β1X i + εi , i =1 , . . . , n,
im p lique
Y =
1 n
β0 + β1X + ε, où ε = n i=1 εi . On su b stitu e cette exp r ession
Y d an de s (3.8), ce qui
don ne
β̂0 = β0 +( β1 − β̂1)X + ε. (3.13)
D’ap r ès (3.11) qu ’on vient de prou ver, on p eu t écrire
n ( )
i=1 X i − X εi
β1 − β̂1 = − n (
j =1 X j − X
)2
3.2 Ap p ro ch e th éorique
Un e ap pr o ch e plu s th éor ique con siste à ne con sid ér er qulinéaires
e les estimateu
de β0 et rs
β1, pu is à ch erch er d an s l’en semb le de tels estimateu rs ceu x qu i sont préférab les au x au
Re ma rque4 On con state qu’à tout n-u p let de n ombrwes( n ), on p eu t asso cier un
1, . . . ,w
estimateu r lin éairen D’au tr e p ar t, tou t estimateu r lin n éaireest com p létem ent
i=1 wi Yi . i=1 wi Yi
car actér isé p arn-u
le p let(w1, . . .,wn ). Par con séqu ent,
ch oisir un estimateu r lin éairβe k de
r evient à ch oisir nun
-u p let de r éels.
1 n n n 1 n
β̂0 = Y − β̂1X = Yi − ŵ1i XY i = − X ŵ1i Yi = ŵ0i Yi ,
n i=1 i=1 i=1
n i=1
avecŵ0i = 1
− X ŵ1i ,i =1 , ... , n.
n
Un cr itèr e de comp ar aison d ’estimateu rs est l’er r eu r qu ad ratiqu e moyen ne (EQ M).
Re ma rque5
43
– La d éfi n ition 3 in d iqu e exp licitem ent qu e β̃l’EQM
1 est un
de e fon ction βde
1 et de β0.
Cep endant, il p eut sembler au premier ab ord 2
β̃1que
−β1)E( ne dép end queβde 0. Cela
n ’est évid emment p as vr ai. En effet,β̃comme
1 est un estimateu r lin éairβe 1, de
ona
n n
β̃1 = w̃1i Yi = w̃1i (β0 + β1X i + εi ),
i=1 i=1
p our un certainn-u p letw(˜11, . . .,w̃1n ). On voit alor s clair ement qu e la var iab le β̃1aléatoire
p eut s’écrire non seulement en fonction β1, mais
de aussi en fon ction β0.de
Par con séqu ent,
il n ’est p as su rp r en ant qu e β̃1la
dép
loi ende
de à la fois
β0 et deβ1. Cela sera en p articu lier
vr ai p ou r l’EQM β̃E( 2
1−β1) . La même r emar qu e s’ap p liqu e évid emment au x estimateu
de β0.
– L’EQM d ’u n estimateur β̃k est un e m esu re de la pr écision de cet estimp ateu u is que
r,
l’EQM s’inter pr ète comme la d istan ce atten du e entr e un β̃k estimateu
) et ce qu ’il
r( estime
(βk ).
– Pou r d eu x estimateu β̌k et
rs β̃k de βk , on d it quě
βk est pr éfér ab β̃leà
k au sen s de l’err eur
qu ad r atiqu e moyen ne si
– En gén éral,il n’est pas p ossib le de tr ou ver des estimateu rs pr éfér ab les à tou t au tr e
sen s de l’EQ M.
C ep en d ant,
comme on va le m ontr si er,on intro duit un autre typ e de contrainte sur
les estimateu rs qu ’on con sidalors
èr e,
on p ou rra trou ver,
d an s le contexte du MRLS,
un
estimateu r pr éfér ab le à tou t au tr e au sen s de l’EQ M.
La contr ainte su pp lémentair e imp osée au x estimateu rs est d’êtr e san s biais.
Dé finit ion4
1. Le biais d’un e stimate
β̃k ur
deβk e st la fonc tion qu 0i ,β
à 1(β E (β̃k −βk ).
) assoc ie le nombre
2. O n ditqu ’u n e stimate β̃kur
deβ k est sans b i ai s son
si b iai s e constant
st et ég alà 0:
E (β̃k − βk ) = 0,∀β0,β 1.
Re ma rque6
– Le premier p oint de la remarque 5 faite à prop os de l’EQM p eut aussi s’appliquer au biais
d ’u n estimateu r. Le b iais
β̃0 dép
de end de β0 et de β1.
– Un estimateurβ̃k de βk est san s b iais si et seu lement (β̃k )siE
=β k , ∀β0,β 1.
– Si β̃k est un estimateu r san s b iais
βk , alors
de son EQM coïn cid e avec sa varian ce. En effet
2
E QMβ̃ (β0,β 1)= E (β̃k − βk )2 = E β̃k − E (β̃k ) = V (β̃k ).
k
44
Dan s le mo dèle de régression lin éaire stan si on
dard,
ne con sid èr e qu e d es estimateu rs li-
n éaires et san s b iais
β0 de
et deβ1, on pr éfèr er a ceu x qu i sont de var ian ce min imale.
P re u ve β̃k = ni=1 ˜w
: Par d éfi n ition , b iais de l’estimateur ki Yi deβk est la fon ction qu i au cou p le
n
(β0,β 1) asso cie le n omb reEi=1 ˜w ki Yi − βk . C om m e les ˜wki ne dép endent que de
X 1, . . . ,Xn , et qu e ces var iab les ont un e distr ib ution dégén ér ée, il en est de même p
les ˜w n n
ki , et on aE i=1 ˜wki Yi = i=1 ˜wki E (Yi ). D’ap r ès la con d ition C2 du MLRS,
on aE (Yi ) =β 0 +β 1X i et en su b stitu ant cette exp r ession d an s l’exp r ession du b iais
ce d ern ier s’écr ni=1 it ˜wki (β0 +β 1X i ) − βk . En factor isant β0 et β1, on ob tient (3.14).
n n
i=1(X i − X)
ˆw
1i = n 2
=0,
i=1 i=1(X i − X)
45
car le nu mérateu r est nu l, et d ’au tre p art
n n
i=1(X i − X)X i
1i X i − 1=
ˆw 2 − 1 = 0,
n
i=1 i=1(X i − X )
car la remarqu e 3 p ermet de con clu re qu e le rap p ort du memb re de gau ch e est ég
1. Au tr ement d
β̂1itest un estimateu r lin éair e qu i vér ifi e les con d ition s (3.17).
Q u antàβ̂0, ona ˆw 1
0i = n 1i . Par con séqu ent,
− X ˆw
n n n
1
0i − 1=
ˆw −X 1i − 1 =1 − 0− 1 = 0,
ˆw
i=1 i=1
n i=1
n
p u isqu e on a montr é que 1i =0. D’au tre p art,
i=1 ˆw
n n n
1
ˆw
0i X i = ( − X ˆw
1i )X i =X − X 1i X i =X − X =0,
ˆw
i=1 i=1
n i=1
n
car on a montr é ci-d essu s que 1i X i =1. Donc β̂0 satisf ait les con d ition s (3.16).
i=1 ˆw
Avant d ’én on cer et prou ver le résu ltatdecentral
ce ch ap itre,
n ou s avon s b esoin d ’étab lir l’ex-
p r ession de la var ian ce d ’estimateu rs lin
β0éair
et β1es
. de
n
V (β̃k ) =σ 2 2
˜w
ki .
(3.18)
i=1
: Pu is que
P re u ve β̃k est lin éair e,
n n n n
V (β̃k )= V ˜w
ki Yi = V ( ˜w
ki Yi ) +2 cov( ˜w
ki Yi , ˜w
kj Yj ).
i=1 i=1 i=1 j =i+1
: Pou rV(β̂1) il su ffit d ’u tiliser la prop r iété précéd ente, tan d is(β̂qu
P re u ve 0), e
il fau
p out rV
en
p lu s u tiliser la pr emièr e con d ition de (3.17).
46
Re ma rque8
– Noton s qu e les varian ces d es estimateu rs Moin dres C arr és sontp in u is
conqunu
’elles
es,
dép endent de 2
σ . On p eut cep endant les estimer.
– La varian ce dê
βk est un e m esu re de la d istan ce atten du β̂k et
e entre
βk . C’est d on c un
in d icateu r de la pr écision de l’estimateur
β̂k . On con state qu e cette pr écision est affectée
p ar d eu x facteurs.
Le th éor ème su ivant est le résultat la pr op riété la plu s imp or tante de la méth o de d’est
Moin dr es C ar r és.
47
Au trement d it, il fau t montrer qu e la solu tion du prob lème
n
min n
σ2 2
w1i sou s contrainte qu e:ni=1 w1i =0,
(w11 ,. ..,w1n )∈
i=1
Ê
n
i=1 w1i X i − 1 = 0,
n
2 sou s contrainte qu e:ni=1 w1i =0, (3.19)
min n
w1i
(w11,...,w1n )∈
i=1
Ê
n
i=1 w1i X i − 1 = 0,
n n n
2
L(w11, . . . ,w
1n , λ, γ)= w1i +λ w1i +γ( w1i X i − 1)
i=1 i=1 i=1
Un n-u p let ∗
(w11 1n ) est un e solu tion du pr ob lème (3.19) si et seu lement si il existe
∗
, . . . ,w
d eu x n omb res n on n λégatifs
∗ et ∗ tels que
γ
∂L
(w∗ , . . . ,w∗ ∗ ∗
1n ,λ ,γ ) = 0, i = 1, .. . , n,
∂w1i 11
∂L (w∗ , . . . ,w
∗ ∗ ∗ (3.20)
1n ,λ ,γ ) = 0,
∂λ 11
∂L ∗ ∗ ∗ ∗
(w , . . . ,w1n ,λ ,γ ) = 0.
∂γ 11
2w∗ +λ ∗ +γ ∗X i =0, i = 1, .. . , n,
1i
n ∗
i=1 w1i =0, (3.21)
n ∗
i=1 w1i X i =1
O n s omme les
n pr emièr es équ ation s du système, et on ob tient
n
∗
2 w1i +nλ ∗ +γ ∗nX = 0. (3.22)
i=1
n n
2 ∗
w1i X i +λ ∗nX +γ ∗ X i2 =0. (3.23)
i=1 i=1
48
e équ ation du système (3.21) d an s (3.22)
En u tilis ant (n
la + 1) ne detanlas (3.23), on
a les cond ition s su ivantes
nλ∗ +γ ∗nX =0
(3.24)
∗ ∗ n 2
2 +λ nX +γ i=1 X i =0
2
P u is qu ’on a su pβp
0 et
oséβ1 id entifi és,ni=1 X i2 − nX =0 (voir le comm entair e qui
p récèd e le th éorème 2 à la p age 39), et on en d éd u it
−2
γ∗ = n 2 .
2
i=1 X i − nX
2X
λ∗ = n 2 .
2
i=1 X i − nX
∗ 2X 2Xi
2w1i + 2 − 2 =0, i = 1, ... , n,
n 2 n 2
i=1 X i − nX i=1 X i − nX
ou en core
∗ Xi −X
w1i = n 2, i = 1, .. . , n.
2
i=1 X i − nX
49
3.3 Prop riétés d es estimateu rs M oin d res Carrés
La plu par t des pr op riétés imp or tantes des estimateu rs Moindr es Car rés ont été pr ou v
d essu s. Par con séqu ent, le r ésu ltat su ivant con siste simp lement en un r ésu mé de ces pr
Re ma rque9
1. Pu is quê
β0 et β̂1 sont d es estimateu rs β0deet deβ1, on p eu t interpréter
Ŷi = β̂0 + β̂1X i
comme un estimateu r (Y deE
i ) =β 0 +β X
1 i . Au tr ement d
Ŷiit
est l’estimation de la valeur
atten d ue Yde
i lorsqu ’on con nXaît i . En r ep r en ant l’interprétation d on n ée au p oint 1 p age
29, on p eu t également d ir Ŷi que
e
est l’estim ation de la p ar Ytie
i qu
dei p eu t êtr e exp liqu ée
par la valeur de Xi.
2. La valeu r a ju stée
Ŷi ne coïncid e p as avecE
(Yi ), mais on s’atten d à ce qu ’elle le fasse,
p u isqu e la d iffér en ce atten du e est
Définit ion 6 D ans le M RLS, on appe l le ré sidu s de l’estimation M oindre s Carré s le s variab
aléatoire s, noté
ε1,sˆ
. . .ε,ˆ εi =Y i − Ŷi , i = 1, .. . , n.
n , et dé finies parˆ
50
Valeu rs de
Yi
y= β1 +β 2x
× y= β̂1 + β̂2x
×
× ×
× ×
E (Yi )
εi (< 0) ×
yi ×A
ŷi ε̂i (> 0)
×
×
xi Valeu rs de
Xi
La fi gu re 3.4 de la p age 51 illu str e gr ap h iqu ement les r ésu ltats de l’estimation Moin d
C ar r és qu e sont β̂0, β̂1, Ŷi et ε̂i , i = 1, .. . , n.Sur cette fi gu rlese, cou p les d es ob servation s de
(X i ,Y i ), i = 1, .. . ,n sont r ep r ésentés p ar d es× cr). oix(
L a d r oite d ’éq u ation y =β 0 +β 1x
est celle le long de laquelle sont alignés les p oints de co ordonnées (X i , E (Yi )). C ette dr oite
s’inter pr ète comme la vr aie dr oite, pu isqu e c’est celle qu i r ep r ésente la Yvr i et
aie r elation en
X i . L a d r oite d ’éq u y= ation
β̂0 + β̂1x contient les p oints de co ordonnées (X i , Ŷi ). C ette dr oite
est entièr ement car actér isée β̂0 petar
β̂1. Elle r ep r ésente l’estimation Moin dr es C ar r és de la
relation entre Yi et X i .
Pou r un p oint A caractérisant le cou p le d ’ob servations (xi ,yi ), l’im age de
xi p ar la fon ction
y =β 0 +β 1x est évid em m entE (Yi ). La d ifféren ce entre
yi etE (Yi ) est égale à la r éalis ation de
la variab le aléatoire εi , qu ’on a n otée
ei su r le grap h iqu e de la fi gu re 3.4. Pou r ces valeu rs d es
var iab lesX i et Yi , la r éalisation de la var iab le aléatoir e valeu Ŷri aest ju ŷstée
i , et cor r esp ond
à l’im age de xi p ar la fon ction β̂0 + β̂1. La r éalisation,
notéeêi , de la var iab le aléatoir e r ésidu
ε̂i est la d iffér en ce entre
yi et ŷi .
3.4.2 Propriét és
Les résid us p ossèd ent un e pr op riété imp or tante qu ’on ré-inter pr éter a dan s le ch ap
vant.
51
Proprié t é 7 D ans le M RLS, ona
n n
ε̂i =0 et ε̂i X i =0.
i=1 i=1
: Ona
P re u ve
(Yi −Y) 2 =(Y i −Ŷi +Ŷi −Y) 2 =(Y i −Ŷi )2 +(Ŷi −Y) 2 +2(Yi −Ŷi )(Ŷi −Y ), i = 1, .. . ,n.
Par con séqu ent, p ou r d émontr er le th éor ème, il est su ffisant de montr er que
n
(Yi − Ŷi )(Ŷi − Y) = 0.
i=1
Rema rque 11 Ce r ésu ltat a l’inter pr étation su ivante. Le memb re de gau che de l’égalité (3.2
est un e mesu re d es var iation Yi aus tou
d esr de leu r moyen ne au sein de l’éch antillon d es in d ivid
i = 1, .. . , n,ces var iation s étant mesu r ées p ar les (car r és d es) d istanYices
et leur
entr e les
moyen n e. Pou r inter pr éter le memb re de dr oite, il fau t r emarqu er que
n n n
1 1 1
Ŷi = (Yi − ε̂i )= Y − ε̂i = Y,
n i=1 n i=1 n i=1
52
es t égalà ni=1 ε̂2i , qu i est un e mesu re d es var iation
ε̂i autour
s d esde leu r moyen n e, qui vau t0
d ’ap r ès la propr iété 7.
L’égalité (3.25) du th éor ème 6 est un e d écomp osition d es var
Yi en
iation
la som
s dm
ese d es
variation s de
Ŷi et d es variation s ε̂di .es
S i on r evient à l’inter pr étation du mo d èle, on Y r iap
estpdelle
étermin
que ée p ar d eu x facteu rs
n on -corr élés l’u n avec l’au tre : un facteu r pren ant la forme d ’u ne fon ction affine de la var
ex p licative d u m oXdi , èle
et un facteu r r ep r ésenté p ar tou tes les au tres variab les n on-corr él
avecX i . Par con séqu ent, les sou r ces d es var Y iation
i sontsaud es
ssi de d eux n atur es : il y a d ’un
côté la p artie d es variationYisdudees au x variation s de la variab le exp licative, et de l’au tre la
p artie d es variation Ysi de
attrib u ab le au x variation s de variab les n on -corr élées avec la variab
ex p licative.
L’égalité (3.25) trad u it cette d istin ction d an s les sou r ces d es variation Yi .sLe
ob servées d e
memb re de gau ch e mesu re les variation s ob servées
Yi . Il s’agit
d esd e la var iation totale,
sans
qu e l’on ch erch er à d istin gu er la p artie de ces variation s attrib u ab les à un e sou r ce ou à
n
au tre. On ap p elle le terme 2 , ou (S CT).
i=1(Yi − Y) v ari ation totale somme des carrés totaux
Dan s le m emb re de droite, le premier terme n 2 est un e estim ation de la p ar t d es
i=1(Ŷi −Y)
variation s dYes i qu i sont attrib u ab les au x variation s de la variab le exp licative.Ŷi es t uEn
neeffet
es tim ationE (Yi ), c’est à d ir e de la p arYtie
i qudei p eu t d ’écr ir e entièr ement comme un e fon ction
affine de la var iab les exp licative, . Par
u niqu e me nt con séqu ent, la seu le sou r ce de variab ilité de
E (Yi ) est la var iab ilité deXi . L’estimation de (Yi ) est ni=1(Ŷi − Y) 2. On
la var iab ilité deE
ap p elle le terme n 2 , ou somme de s carré s e xpliqu (S C ésE).
i=1(Ŷi − Y) v ari ation e xpliqu ée
Q u ant au secon d terme du m emb re de n droite 2 n 2 c’est un e estim ation
i=1(Yi − Ŷi ) = i=1 ε̂i ,
d e p artie d es variation Ysi dqui
es ne p eu vent être cau sées p ar d es variation
X i . C s’es
det la
p artie d es variation sYdi qui
es r es te,
ou r ésid u elle,
un e fois qu ’on a r etran ch é au x variations
desYi la part attrib uab le au x variation s de la variab le explicative. On ap p elle n 2 terme
le
i=1 ε̂i
v ariations ré sidu ,ou somme de s carré s de s ré(Ssidus
el les C R).
On p eu t d on c ré-én on cer le th éorème 6 de la façon d su
an ivante:
s le MRLS , on a SC T=
S CE + SCR. À p ar tir d e cette égalité,
on p eu t con stru ire un estimateu r de la cap acité de la
variable explicative à déterminer le niveau de la variable dép endante.
Rema rque 12
1. Pu is qu e S C T = S+CESC R et qu e les tr ois som m es de cette égalité sont p ositives, ona
n écessair ement SCT≥ SCE ≥ 0 et donc0 ≤ R 2 ≤ 1. Le r ap p or t d éfi nRissant
2 s’inter p r ète
alors comme une prop ortion. Le co efficient de détermination est la part des variations ob
ser vées dYes
i qu ’on p eu t estimer êtr e attr ib uab les au x var iation s de la var iab le explic
On d ir a alor s qu ’on p eu t estimer × R 2)% d es variation s d es variab
(100que Y1, .les
. . ,Y
n
sont du es au x var iation s d es var iab les exp
X 1, licatives
. . . ,X
n ..
R 2 est un e mesur e de la cap acité d es var iab les exp licatives à fair e var ier ,
2. Le rap p ort
leu rs prop r es variation
les s,
variab les en d ogèn tr ement d Rit,2 es t u n e mesu r e de
Au es.
53
l’effet qu e les
X i p eu vent avoir sur Yles
i , c’est à d ir e un e mesu re du p ou voir exp licatif
desX i su r lesYi .
Plu s pr écisément, plus R 2 est pr o ch e dep 1, lu s la p art d es variationYsi d qu’on
es p eut
attrib u er au x variation sX d 2
i est
es gr an dDe e. f açon éq u ivalente,
p lusR est pr o ch e de
1, p lu s la p art d es variation Yi sattrib
d es ées aux variables autresXque n (et non
1, . . . ,X
corr élées auxX i ) est faib le. Au trement d it, le prin cip al d étermin ant duYni est iveau d es
le n iveau desXi. Dan s ce cas, le p ou voir exp licatif d es var iab les exp licatives est élevé.
Si R 2 est pro ch e de 0, la plu s gran de partie des variation s des
Yi est
variab
attr les
ib u ab le
au x variation s résid u elles, c’est à d ire au x variation s d es variab les au tres qu e les va
exp licatives,
et n on -cor r élées à celles-ci.
Dan s ce cas,le p ou voir exp licatif
d es variab les
exp licatives est faib le.
2
Les cas extr êmRes =0 et R 2 =1 p eu vent s’én on cer (d e man ière équ ivalente) sou s une
for me qu i p er met d ’ob ten ir d ir ectement les inter pr étations d on n ées ci-d essu s.
∃i,sij te ls q u eX
Proprié t é 8 D ans le M RLS, i =X j , alors ona
:
P re u ve
2 et de ona
1. En utilisant les définitionsRde ε̂i
n
R 2 =1 ⇐⇒ SC R=0⇐⇒ ε̂2i =0 ⇐⇒ ε̂i =0, i = 1, . . . ,n
i=1
⇐⇒ Yi = β̂0 + β̂1X i , i = 1, .. . ,n
β̂1(X i − X j ) = 0, i,j = 1, .. . ,n
X i =X j , i,j = 1, .. . ,n ou β̂1 =0
R 2 =0d onc
La pr emièr e con d ition étant exclu e, on ob tient ⇐⇒ β̂1 =0.
Rema rque 13
54
1. Le premier p oint de la prop osition 8 montre clairement que lorsque R 2 =1 on estime
q ueYi est un iqu ement d éter minXéi , pi =ar1, .. . ,n. Dan s ce cas, p ou r tou t in d ividu
i, les facteu rs au tres que
X i p ou vant affecter le n iveau Yi de
sont in existants. Dan s la
for mu lation du mo dèle de régr ession lin éair e simple, cela revient à écr
εi =0 p our
ir e que
,
i = 1, .. . ,n et qu ’on p eu t écrire
Yi comme un e fon ction affin e
Xi .de
La con d itionC′
2
est dan s ce cas:
∃β0 ∈ , ∃β1 ∈
Ê Ê
t.q. Yi =β 0 +β 1xi , i = 1, ... , n.
55
On termine cette section en rapp elant les propriétés élémentaires du co efficient de corrélat
lin éair e emp ir iqu e.
Proprié t é 10
1. ρ(Y , X) = ρ(X, Y)∈[−1; 1].
2. ρ(X , Y ) =1 ⇐⇒∃ a ∈]0,+∞ [,∃b ∈ ,Y i =aX i +b ∀i = 1, .. . , n. De plus, ρ(X, Y )=
Ê
Yi =aX i +b, i = 1, .. . ,n
56
3.5 Estimation d es varian c es
3.5.1 E st imat ion de la variance des t ermes d’erreur
C omme on le ver ra d an s la section su ivante, on ne p eu t se contenter d ’u ne simp le est
de β0 et deβ1. On sou h aite p ar exem p le d isp oser d ’u ne mesu re de la pr écision de l’estim
ob tenu e. Pu isqu e les estimateu rs Moin dr es Car r és sont san s b iais, on p eu t mesur er leu
p ar la var ian ce de ces estimateuNours.
s avon s vu d an s la pr opr iété 6 à l’équ ation
et (3.18),
d an s le corollaire qui
suit, que les variances d es estimateurs Moindres Carrés d ép end ent de la
σ2 d es termes d ’errεieur
var ian ce . Or la valeu r de celle-ci est in con nu e. Dan s cette section , on
p r ésente un e façon d ’estimer cette var ian ce b asée su r le r és u ltat su ivant.
Donc
et
n n n n
ε̂2i = ε2i +n ε2 +( β̂1 − β1)2 (X i − X) 2 − 2(β̂1 − β1) (X i − X)ε i − 2nε2
i=1 i=1 i=1 i=1
n
+2ε(β̂1 − β1) (X i − X)
i=1
Le d er n ier ter me du memb re de dr oiteD’au est nu
trel.p art,
en u tilis ant l’exp r es s ion
(3.12) de n n 2 Par con séqu ent,
β̂1, on p eu t écrire
i=1(X i −X )εi =( β̂1 −β1) i=1(X i −X) .
n n n
ε̂2i = ε2i − (β̂1 − β1)2 (X i − X) 2 − nε2
i=1 i=1 i=1
Par con séqu ent, si on calcu le l’esp ér an ce, on ob tient
n n n
E ε̂2i = E (ε2i )+ E (β̂1 − β1)2 (X i − X) 2 − nE (ε2) [lin éar ité de l’esp ér an ce]
i=1 i=1 i=1
n n n
2 n 2 ′ 4 ;E
= nσ − V (β̂1) (X i − X) − 2 E (εi εj ) [con d itionC (β̂1) =β 1]
i=1
n i=1 j =1
n
12 2
= nσ − σ − E (ε2i ) ′ 4 ; exp r es sion d eV
[con ditionC (β̂1)]
n i=1
= nσ2 − σ2 − σ2
57
2
C orollaire 2 D ans le M RLS, la variable aléatoire
dé finie
ˆσ par
n
2 1
ˆσ = ε̂2
n − 2 i=1 i
2
e st un e stimate ur sans biais de σ.EOna
( ˆσ) =σ 2.
3.5.2 E st imat ion de la variance des est imat eurs Moindres Carrés
C omme mention nn é à la r emar qu e 8 les var ian ces con d ition n elles d es estimateu rs
2 l’est.
Carr és ne sont in con nu es qu e p σarce queCep endant, le résultat précédent nous p ermet
d e for mer d es estimateu rs d es var ian ces con d ition n elles.
V (β̂0)de
sont de s e stimate u rs sans biais et V (β̂1), re spec tive me nt.
: Il fau t montrer qu eE
P re u ve V̂ (β̂k ) = V (β̂k ), k = 0, 1.C ’es t un .
Exerci ce
58
C h ap i tre4
4.1 L e c ontex te
J u squ ’à p r ésent,
n ou s avon s étu d ié le pr ob lème de l’estimation d es p ar amètr es du MRL
Comme r ap p elé d an s le ch ap lesitre
prop
1, r iétés d ’u n estimateu r s’étu d ient en calcu lant son
esp ér an ce ou sa var ian ce (ou son er reu r qu ad ratique moyen ne). Pou r qu ’u ne telle étu d
sib le, il fau t qu e la sp écifi cation du mo dèle p ermette ces calcu ls. Nou s avon s pu dan s le
p r écédent étud ier le b iais β̂0 et
dedeβ̂1 en u tilisant les con d ition s C1 et C2 entrent
qui d ans
la sp écifi cation du mo dèle. En effet, la première nou s p ermet de X 1con
, . . .sid
,Xn érer
com me
des nomb res (n on aléatoires) et la secon de nou s p ermet de calcu ler l’esp Y1, . .érann . ce de
. ,Y
Par con séqu ent, le calcu l de l’esp érβ̂1an (pcearde
exemp le), p er mettant d ’ap pr écier le b iais de
cet estimateuest r, p ossib le, pu isqu ’il revient à calcu ler l’esp ér an ce d’u ne comb in aison lin
de Y1, . . . ,Y
n , ce qu e nou s p ou von s faire grâce au x con dition s C1 et C2.
De mêm e, p ou r montrer qupe, ar mi tou s les estimateu rs lin éair es et san s b β1iais
, β̂1 de
était celu i qu i avait la p lu s p etite var ian ce, il était n écessair e de p ou voir u tiliser l’exp r e
la varian ce dê
β1. Ce calcula été p ossible grâce à l’a jout de la condition quiC3,
n ous d on ne
l’exp r ession d es covar ian(Yces cov
i ,Y j ), de laqu elle on d éd u it l’exp r ession
(β̂1) deV
.
Si on s’intér esse mainten ant à un pr ob lème n deoutest,
s savons,
comme cela est r ap p elé
dan s la section 1.3.2, qu ’il est nécessair e de p ou voir effectu er des calcu ls de risqu es. Ces d
étant défi nis comme des pr ob ab ilités de commettr e des er reu rs, il fau t p ou r cela disp ose
p ermettant de faire les calculs. Notons que dans le MRLS tel que défini par les conditions C1,
C2 et C3, r ien ne n ou s p er met de fair e de tels calcu ls, d ès qu e ceu x-ci p or tent su r d es
qu i sont d es fon ctionY1s, .de n . Il fau t don c préciser la défi nition du mo dèle en lu i a jou tant
. . ,Y
d es con d ition s qu i p er mettr ont d ’effectu er le calcu l d es r isqu es.
Plu sieu rs ap pr o ch es sont p ossib
Celle les.
qu e n ou s ad op teron s (la p lu s simp le) con sisteà
59
intro du ire les lois p ermettant le calcu l des prob ab ilités d’erreu rs dan s la défi nition du mo d
Nou s mo difi on s la défi nition du MRLS en a jou tant au x con ditions qu i le défi nissent (C1 à
ouC ′ 1 àC ′ 3) la con d itionC ′′ N su ivante:
C ′′ N. (ε1, . . . ,ε
n ) es t un n-u p let gaussien
On rap p elle que n variab les aléatoires formentnun
-u p let gaussientou si te comb in aison
lin éaire de ces variab les d éfi n it un e variab le aléatoire gaussien
i .e .,d ont lane(
loi de prob abilité
est un e loi n or m ale). VO IR RAPPELS
De même qu ’u ne var iab le aléatoir e gau ssien ne (ou n or male) est entièr ement car acté
p ar son esp éran ce et sa varian un nce,
-up let gau ssien n ) est entièr ement car actér isé
(U1, . . . ,U
par len-u p let d ’esp ér anE (Uces E
1), . . ., (Un ) et p ar la matr ice d es
variances- dont
covariances
l’élément con stitu tif est(Ucov
i ,U j ).
Il est sou vent commo de de con sidnér variab
er le les aléatoires n comme les co or-
U1, . . . ,U
n .1 On
d on n ées aléatoires d ’u n vecteu r denoteU =(U 1, . . . ,U ⊤ ce vecteu r. L’esp ér an ce de
Ê
n)
ce vecteu r est par défi nition le vecteu r des esp ér an ces et(U) la var
du vecteur
ian ceV
U ser a la
matr ice d es var ian ces-covar ian ces:
V (U1) cov(U1,U 2) ··· cov(U1,U n )
E (U1)
.. cov(U2,U 1) V (U2) ··· cov(U2,U n )
E (U )= . et V (U )= . . .. ..
.. .. . .
E (Un )
cov(Un ,U 1) cov(Un ,U 2) ··· V (Un )
Dan s le cas où n f or m ent n
U1, . . . ,U un
-up let gaussien , la d onn ée(U)deE
etV (U) p er m et de
déter min er complètement la loi de n’imp or te qu elle comb in aison U1, .lin
. . éair
n p e
,U u de
is que
ces comb in aison s lin éaires sont d gau
es ssien
v.a. n es et d on c entièrement caractérisées p ar leur
esp ér an ce et var ian Cesce.par amètr es sont resp ectivement des comb in aison s lin éair es des é
ments d eE (U) et d es for mes qu ad r atiqu (U) es .deV
Dans le cas d ’un vecteu r gau U, ssien
la
loi de U est d on c entièr ement car actér isée p ar la d (U) on netée
deV
deE(U ). Dan s le cas où
cette d on n ée estE
(U ) =µ etV (U ) = Ω,on noteU ∼N (µ , Ω ), ou p ar f ois
U ∼N n (µ , Ω ), p our
in d iqu er la d imen sion U. de
En r even ant d an s le contexte du MRLS, si on con sid èrenle
-u p let n ) com me les
(ε1, . . . ,ε
co ordonnées du vecteur
ε= (ε 1, · ·· ,ε n ) , on a d ’apr ès la con d itionC
⊤ ′ 3 et la d éfi n ition d es
termes d ’err eu r:
σ2 0 ··· 0
0
0 σ2 ··· 0
E (ε)= ... =0 n V (ε)= . .. . . .. =σ 2I n
.. . . .
0 2
0 0 ··· σ
où 0n d ésign e le vecteu rde nuln et I n la matrice id entité de
Ê
n vers Ê Ê
n. Avec la con d ition
su p p lém entair
′′ N,eC
ε ∼N (0n ,σ 2I n ).
on au ra
1
Ce ty p e de construction faisant apparaître des vecteurs dont les co ordonnées sont aléatoires est fréq uent et
ap paraît de man ière assez naturelle. Par ex emple dan s le contex te d’u n ex p érien ce aléatoire classiq ue, comm
lancer d ’une p ièce, au lieu de s’intéresser au résultat p ile ou face du lancer (c’est à d ire le côté sur leq u el retom
la p ièce lan cée) on p eu t s’intéresser au p oint le p lu s h au t atteint p ar la p ièce lorsDde
e mêm
son lane qcer.
ue
le côté sur leq uel retomb e la pièce est considéré comme aléatoire car ne p ouvant être connu avec certitude avant
le lan cer,ce p oint le p lu s h au t sera aussi
con sid éré comme aléatoire.
Un p oint p eu t se d écrire au moyen d ’un
triplet de co ordonnées dans l’espace. Dans le cas du p oint le plus haut atteint par la pièce au cours de son lancer,
3
chacune de ces co ordonnées sera aléatoire. Le triplet co ordonnées, ou vecteur , sera d
Ê
deon c aléatoire.
60
On s’ap erçoit donc que le MRLS défini p ar les cond ition′ 1sCàC ′ 3 etC ′′ N p eu t au ssi
se
d éfi n ir de man ière équ ivalente p ar les con ′ 1,C
d ′ition
2 etCsC
′ N, où cette d er n ièr e est
2
C N. ∃σ ∈]0,+∞ [, ε ∼N (0n ,σ I n ).
′
Y =(Y 1, . . . ,Y ⊤ ⊤ ⊤ n
Propriét é 13 D é fini ssonsY n ) , X =(X 1, . . . ,X
n ) etι n = (1, . . . ,1) ∈ .Ê
C′ 1, C ′ 2 et C′ N sont vé rifiée s si et se u le me nt si le s C1
Le s conditions et CN le sont
conditions
CN étant dé finie par
au ssi, la condition
CN. ∃β0 ∈ , ∃β1 ∈ , ∃σ ∈]0,+∞ [, Y ∼N (β0ιn +β 1X ,σ2I n ).
Ê Ê
à CN. Su pp oson s qu′ 2eC etC ′ N soient vr aies. Avec les n otation s intr o duCites, ′
2
s’écr it:∃β0 ∈ , ∃β1 ∈ ,YY =β 0ιn +β1X +ε. Soienta1, . . . ,a
Ê Ê
β0 +β 1X 1 β0 β1X 1
E (Y .. . .
= .. + .. =β 0ιn +β 1X
Y )=
.
β0 +β 1X n β0 β1X n
Par ailleu r s,
la matr iceV(YY) a p our(i, j) e élément le n omb re(Y cov
i ,Y j ). Or ona
montr é (voir l’égalité (2.3) p age 31) qu e cov
(Yi ,Y j )= cov
(εi ,ε j ), ∀i,j = 1, .. . , n.Les
matr icesV Y) etV (ε) ont d on c le même élément con stitu
(Y et sonttif p ar con séqu ent
égales.C om me on a su p p oséC N vérifi ée,
on a alor sV(Y 2
′ Y ) =σ I n . Fin alement, ona
montr é qu e siC 1,C 2 etC N sont vr aies, alors 2
′ ′ ′
Y ∼N (β0ιn +β 1X ,σ I n ), et C N est
d on c également vraie.
S up p oson s mainten ant qu e C1 et CN soient vr aies. ′ 1 l’est
Alor
for
sCcément. De p lu s,
on p eut d éfiεin=Y ir i −(β0+β1X i ), i = 1, ... ,net don cC ′ 2 est vér ifi ée. De p lu s, comme
61
Définit ion 3 Soie nt 1(X ,Y 1), . . . , (Xn ,Y n ) n cou ple s de v ariab le s aléatoire s dont le s ob se rv a-
tions sont notée 1s,y(x
1), . . . , n
(x,y n ). Le modèle de régression linéaire simple g au ssien (M RLSG)
de Y su r X e st un modè le statistiqu e dansleleq C1 et CN sont satisfaite s. De
s conditions
uel
maniè re éq uiv ale nte , ce modè le e st ég ale me nt dé finit par C′ 1, le
C′ 2 et C ′ N.
s conditions
La figu re 4.1 illu str e la mo délisation entr e les var iab les exp licatives et expliquées retenu
le MRLS G. Par r ap p or t au MRLS , le MRLS G a jou te la con dn-u ition
p let
que
(Y1, le
. . . ,Yn ) est
gau ssien . Pou r rep résenter cet a jou t de con dition gr ap hiquement, on p eu t a jou ter au gr
2.1 un e3 e d imen sion (ver ticale)pqui ermet de r ep r ésenter le caractère gau ssien d es variab les
ex p liqu ées n . La dr oite r ep r ésentant d an s le p lan la r elation
Y1, . . . ,Y (Yi )entr
et xeEi , p our
i = 1, ... ,n est d’ab ord tracée. Pou r ch aqu e in d ividu
i, on r ep r ésente p ar•un le cou p le
d ’ob ser vations
(xi ,y i ) ain siqu e,en u tilisant la d imen sion ver ticale,
la d ensité (gau ssienn e) de
Yi (courb e « en clo che »). Cette variable aléatoire gaussienne est d’esp(Yi ) éranceE
et d ’écar t-
ty peσ. On rap p elle qu e ces deu x paramètres détermin ent entièrement la forme de la den sit
d ’u ne variab le aléatoire gau ssien Plu s npre.écisément,
l’esp ér an ce d éter min e l’emp lacement de
la cou rb e de la den sité (p lu s exactement de son axe de symétr ie) et l’écar t-typ e déter min
for me de cette d en sité (son car actèr e p lu s ou moin Pars ap
conlati).
séqu ent, d an s le cas du
MRLS G, les d en sitésYide et Yj sont r esp ectivement situ ées au tou (Yi ) ret
deE
deE(Yj ) et ont
le même for me, pu isqu e d an s ce mo d èle les écar Yi etts-typ
Yj sont
e de
les m êm es.
L’a jout de la condition CN dans la définition du MRLS p ermet d’affiner les résultats obtenus
su r les estimateu rs Moin dr es C ar βr0és
etde
β1. Il est commo de d ’intr o du ir e les n otations
s u ivantes:
β̂0 et β= β0
β̂=
β̂1 β1
62
Densités (gaussiennes) des v.a. Y1 , . . . , Yn
Y
ble
ria
va
la yj
de
rs E (Y ) y=β 0 +β 1x
leu j
Va
E (Yi )
yi
xi xj
Valeurs de la variable X
β̂0 β0
E = =β
β̂1 β1
63
β̂1 sont lin éair es. Ain si ona
n n n n
cov(β̂0, β̂1)= cov ˆw
0i Yi , ˆw
1j Yj = ˆw 1j cov(Yi ,Y j ).
0i ˆw
i=1 j =1 i=1 j =1
C omme d an s le MRLS G on (Y
a icov
,Y j ) =0 d ès que
i= j, on p eu t écrire
n n
cov(β̂0, β̂1)= 2
ˆw 1i V (Yi ) =σ
0i ˆw ˆw
0i ˆw
1i .
i=1 i=1
Pou r ter min er cette section , on comp lète le r ésu ltat ob tenu
β̂.su r la loi de
Dé finit ion4
1. Laloi duχ 2 à m deg ré s de libe rté e st la loi su iv ie par la somme de s carré s de m v aria
aléatoire s g au ssieNnnes(0, 1) indépendantes. On note cette2(m loiχ).Au tre me nt dit, si
m 2
(Z1, . . . ,Z
m ) est un m- u ple t gau N
ssien
(0 ,I
m m ), alors Z
j =1 j ∼ χ 2(m ).
2. La loi de Stu de nt à m deg ré s de libe rté e st la loi de la v ariab le aléatoire T dé finie par
Z
T=
C
m
64
C orollaire 4 D ans le M RLSG, quels que soient les0 réelsa
eta 1, ona
a0(β̂0 − β0) +a1(β̂1 − β1)
∼ τ(n − 2)
a20V̂ (β̂0) +a21V̂ (β̂1) + 2a0a1cov
ˆ (β̂0, β̂1)
2 −X
cov
ˆ (β̂0, β̂1) = ˆσ n
i=1(X i − X) 2
: On sait d ’ap r ès la prop r iété 14 qu e la variabale
P re u ve aléatoire
0β̂0 +a1β̂1 est gau ssien n e. On
calcu le alors son esp éran ce et sa varian ce.
Par ailleu rs
a0β̂0 +a 1β̂1 ∼N a0β0 +a 1β1,a 20V (β̂0) +a21V (β̂1) + 2a0a1cov(β̂0, β̂1)
et p ar con séqu ent,
H 0 :β 1 =0 H 1 :β 1 =0
Résou dr e ce pr ob lème con siste à se fi xer unα n∈iveau]0, 1[pu is à ch oisir un e statistique
n ,Y n ) et un e r égion
Sn =S (X 1,Y 1), . . . , (X S de tels que
Ê
66
4.2.2 Appro che int uit ive
Cette appro che rep ose sur l’enchaînement suivant. β1 n’est pas con nu,mais n ous p ou vons
en avoir un e b on ne estimation , f ou β̂1rn
, leieppluars pr écis d es estimateu rs lin éair es san s b iais.
Pour décid er β si1 est nu l(H 0 est la b on ne hyp oth èse) ou H 1pest
as(la b on ne hyp oth èse), on
p eut se baser sur l’observation de la valeur β̂1. Endeeffet, pu isqu e ce d er n ier est un b on estim a-
teu r de
β1, il est prob ab le d ’ob server
β̂1 est
que pr o ch e de 0 lorHsque
0 est vr aie. Au tr ement d it,
si on est amen é à ob ser ver β̂1 est
queéloign é de 0, on ob serve un évèn ement d ont la prob ab ilité
d’o ccurrence est faible lorsque H 0 es t vr aie. On ju ge alor s que H 0 n ’est p as vr aisemb lab le au
vu de ce qu ’on ob ser ve et on rHejette 0.
Dan s un e telle appro che, il f aut se fi xers,un avec
seuil
s ∈]0,+∞ [, p er mettant d ’exp r im er
« β̂1 est trop éloign é de 0 » au moyen d ’u ne in égalité |β̂1| telle
>s. En que
r ep r en ant la d émarche
gén ér ale de con str u ction d es tests exp osée d an s lalasection s tatis 1.3.2,
tique
Sn es t iciégale
à |β̂1| et la région cr itiqueS , con stitu ant l’en semb le d es valeu rs de la statistiqu e qu i sont p e
vr aisemb lab les lorHsque 0 est vr aie, est
S = ]s ,+ ∞ [. L’évèn ement Sn ∈S con du isant au r ejet
de H 0 est don c b ien|β̂1| > s.
Le n omb re s d ésign e le seu il au d elà du β̂1 qu
estelju gé tr op éloign é de 0 p ou H 0r soit
que
u ne hyp oth èse p lauLa sibqu
le.estion du ch oix sder es te p osPou ée. r gu id er ce ch on oix,fait
ap p el à la con d ition d e n iveauimqui p ose qu HeP
0 (Sn ∈ S ) ≤ α
(voir l’in égalité (1.1) et les
commentaires qu i la précèd ent, p age 22). C ette in égalité s’écrit en core
−s − β1 s − β1
=1 − P H 0 ≤ τn−2 ≤
V̂ (β̂1) V̂ (β̂1)
=1 − F τn − 2 √s−β1 − F τn − 2 √−s−β1
V̂( β̂1) V̂( β̂1 )
P H 0 (|β̂1| > s) =1 − F τn 2 √ s s
− F τn − 2 √ −s =21 − F τn − 2 √
− V̂( β̂1 ) V̂( β̂1 ) V̂( β̂1 )
67
où la d er n ièr e égalité pr ovient de la symétr ie au tou r de 0 de la d en
τ(nsité
− 2).de
Par
la loi
con séqu ent, la contr ainte p or tant su r le n iveau du test, expr imée p ar l’in égalité (4.3), s’é
P H 0 (|β̂1| >s) ≤ α ⇐⇒ 21 − F τn 2 √ s
≤ α ⇐⇒ F τn − 2 √ s
≥ 1− α2
− V̂( β̂1 ) V̂( β̂1)
C om me
F τn − 2 est continu e et str ictement cr oissante, la d er n ièr e in égalité s’écr it
s
≥ F τ−1
n 2
(1− α2 )
−
V̂ (β̂1)
s ≥ τn−2;1− α2 V̂ (β̂1)
O n n ote qu ’à ce p oint,
l’imp osition de la contr ainte (4.3) ne p er met p as de d égager une
valeu r un iqu es.dePou r cela,on s’intér esse au r isqu e de typ e 2. On r ap p elle que la d émar ch
con siste à ch oisir p arunmi
en semb le de tests ayant tou s un nα,iveaucelui(ou ceu x) p our
le(s)qu el(s) le r isqu e de typ e 2 ser a tou jou rs le p lu s faib le.
On con sid ère les
ici tests de la for me « On r ejette H 0 et on accep te
H 1 si on ob serve que
|β̂1| >s », avecs ≥ τn−2;1− α2 V̂ (β̂1). Pou r tou t test de cette for me, le r isqu e de typ e 2 s’exp r im
com me 2
P H 1 (|β̂1|≤ s)
où la notationPH 1 in d iqu e la pr ob ab ilité est calcu lée en su H 1ppvrosant
aie,c’est à dir e en
s u p p osant
β1 =0 . La valeur de cette probabilité dép end de la valeur (non nulle) β1 ch de
oisie
p our effectuer le calcul.
Cep endant, quelle qu e soit cette valeuon r,
voit que cette prob abilité
est un e f on ction cr oissante.3 Par
de con séqu ent, si on veu t le test de la for me d on n ée ci-d essu
s
qu i a le p lu s p etit r isqu e de typ e 2, il fau t ch oisir
s le le
p lu
seus pil etit p ossib le. S ach ant que
p our que le test soit de niveau
α il faut s ne soit p ar p lu s p etitτque
n−2;1− α2 V̂ (β̂1), on est
con du it à ch oisir
s=τ n−2;1− α2 V̂ (β̂1)
Le test ain si ob tenu con siste d on c àHr0 ejeter
:β 1 =0 et à accep ter
H 1 :β 1 =0 au niveauα
si on ob ser |ve
β̂1| >τ n−2;1− α V̂ (β̂1), ou , de man ièr e équ ivalente, si on ob ser ve
2
β̂1
>τ n−2;1− α2
V̂ (β̂1)
68
O n rejetteH0 e t on acce pteH |Tn | >τ n−2;1− α2 ; on re je tteH
1 si on ob serve 1 et on
acce pteH0 si non
Au tr ement d it si on écr
ϕ sou
it s la f orme
1 si Sn ∈ S
ϕ(X 1,Y 1), . . . , (X
n ,Y n ) =
0
sin on
69
la pr ob ab ilité de pr en dr e la mau vaise d écisionHen
0. Cette
r ejetant
d er n ièr e r emar qu e montre
qu e l’ab sen ce de biais p ou r un test est gén ér alement con sid ér ée comme un e b on ne pr
La d émar ch e con sistant à r ech er ch er le/les meilleu r /s les
test/s
tests
p ar
sanmis b iais au
niveauα est p lu s d ifficile à su ivr e qu e d an s le contexte où n ou s n ou s sommes p lacés lor
l’estimation d es p ar amètr es du mo d èle. Au ssi on ne pr ésenter a p as la pr eu ve du résu lt
d e cette section.
et com me on su p H
p 0ose s
:b =β 1 vr aie, cette pr ob ab ilité est simp21
lement
−F τn − 2 √ .
V̂( β̂1 )
Pou r qu e le test soit de n iveau
α, il fau t d onc que
s soit su p érieu rà
τn−2;1− α2 V̂ (β̂1). Par
ailleu rs, la min imisation du r isqu e de typ e 2 con dus=τ it à n−2;1
ch oisir
− α2 V̂ (β̂1).
Le test con siste d on c à r ejeter
H 0 : β1 =b et à accep ter H 1 : β1 =b au niveauα si on
ob ser ve
β̂1 − b
>τ n−2;1− α2
V̂ (β̂1)
On a défi nition semb lab le à celle intro du ite précéd emment dan s le cas où
b=on0.avait ch oisi
70
O n rejetteH0 e t on acce pteH |Tn (b)| >τ n−2;1− α2 ; on re je tteH
1 si on ob serve 1 et
on acce pteH0 si non
β̂1 − b
Tn (b )=
V̂ (β̂1)
δ0 =β 0 δ1 =β 1 − b et σZ =σ
Donc
n
i=1(Yi − Y)X i − b ni=1(X i − X)X i
n
i=1(Yi − Y)X i
δ̂1 = n 2
= n 2
− b= β̂1 − b
i=1(X i − X) i=1(X i − X)
4
Ces deux mo dèles sont en fait identiques puisque la récipro que est vraie : si C1 et CN sont vérifiées p our les
cou ples(
X 1 ,Z 1 ), . . .,(X n ,Z n ), alors elles le sont aussi p our les couXp1 ,Y
les(
1 ), . . .,(X n ,Y n ).
71
D’au tre part
δ̂0 = Z − δ̂1X = (Y − bX) − (β̂1 − b)X =Y − β̂1X= β̂0
Fin alement, p ou r calcu
V̂ (δ̂
ler
1), on u tilise la for mu le d on n ée à la section 3.5. Ona
2
ˆσ
V̂ (δ̂1)= n
Z
2
i=1(X i − X)
2 est l’estimateu r de la var ian
où ˆσZ σZ2 des
ce Zi pr ésenté à la section 3.5, b asé su r les r ésid us de
l’estim ation de et de p ar m oin dr e r ésid
es car r iés. Le u est
δ0 δ1
Dan s les pr ob lèmes de test étu diés ju squ’à pr ésent, l’hyp oth èse nu β1 es
lle tsp
égal
écifi e que
à une valeur d on nb. ée
Il existe d es situ ation s d an s lesqu elles ce n ’est p asβla 1 qui
valeu r de
est intér essante en soi, mais simp lement son sign e. On sait enβ1effet est pquositif,
e si alors Y
varie d an s le même senX, s que
et en sen s op p osé β1 est
si n égatif. Il est d an s ce cas intér essant
d e p ou voir d isp oser d ’u nHtest
0 :β de
1 ≤ 0 contreH 1 :β 1 >0. De man ière p lu s gén on érale,
p eut être amené à tester
H 0 :β 1 ≤ b contreH 1 :β 1 >b, où b est un e valeu r d on n ée et con nu e.
On ad mettr a le r ésu ltat su ivant.
72
Propriété 17 D ans le M RLSG, pou r te ste 1 ≤ b contreH1 :β 1 > b, le test de Stu dent
0 :βrH
dé fini par
β̂1 −b
O n rejetteH 1 au niv eau α si on ob se√rve >τ n−2;1−α
0 e t on acce pteH
V̂( β̂1 )
e st le me il le ur parmi le s te sts sans biais au niv eau α.
73