Methodologie Outils D Analyse Introduction A L Econometrie

I ntro ducti on
à l ’ économ étrie
Le mod è lede régressi on
li néai re si mple
Supp ortde co ursdest iné a ux étu-

dia nts de 3e année de licence
shs /mias hs /mase
Un i ve rs ité Ch arle s-de -Gau lle Lille3

UFR ID I ST
O. Torrès Année universitaire 2009-10
(ver s io n du 29 /9 /2 00 9, 18 :3 6)
2
Tabl e des m ati ères
1 Rapp els sur la démarche de l’inférence statistique 9

1.1 Ob jectif d ’u ne d émarch e in férentielle et n otion. .s .de
. .b.ase
. . . . . . . . 9
1.2 Présentation du princip e de l’inférence statistiqu
. . . e.
. . . . . . . . . . . . . . 13
1.3 Les prob lèmes d ’in féren ce u. su
. . els
. . . . . . . . . . . . . . . . . . . . . . . . 15
1.3.1 Estim ation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.3.2 Test d’hyp oth èse
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.3.2.1 Pr ob lème de test.
. . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.3.2.2 Tes t statis tiqu .e.. . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.3.2.3 Calcu l d es r isqu. es
. . . . . . . . . . . . . . . . . . . . . . . . . 20
1.3.2.4 C omp ar aison de tests. Ch oix d ’u .n. test.
. . . . . . . . . . . . 20
1.3.3 Estimation p ar r égion de con fi an
. . ce.
. . . . . . . . . . . . . . . . . . . 24
2 Le mo dèle de régression linéaire simple : définition et inte rprétations 27

2.1 Le contexte et les ob jectifs.
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.2 Heu r istiqu e de la con str u ction du mo
. . .d. èle
. . . . . . . . . . . . . . . . . . 28
2.3 Défi nition et inter pr étation s du mo dèle de régr ession lin éair
. . . e. simple
. . . 30
2.3.1 Défi n ition.. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.3.2 Interprétations. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3 Le mo dèle de régression linéaire simple : estimation des pa ramètres 37

3.1 Appro che intu itive
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.2 Ap pr o ch e th éor iqu
. . .e.. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.3 Pr op r iétés d es estimateu rs Moin dr es
. .C. ar
. .r .és
. . . . . . . . . . . . . . . 50
3.4 Mesu re de la qu alité de l’estimation p ar Moin dr es. C
. .ar. .r és
. . . . . . . . 50
3.4.1 Valeu rs a ju stées et r ésid
. . us.
. . . . . . . . . . . . . . . . . . . . . . . . 50
3.4.2 Prop r iétés.. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
3.5 Estimation d es var ian ces.
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
3.5.1 Estimation de la varian ce d es termes d .’err
. . eur
. . . . . . . . . . . . . 57
3.5.2 Estimation de la var ian ce d es estimateu rs Moin dr .es. C
. .ar. .r és
. . 58
4 Le mo dèle de régression linéaire simple : tests et régions de confiance

59
3
4.1 L e contex te
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
4.2 Test d ’u ne hyp oth èse simpβ1le.sur
. . . . . . . . . . . . . . . . . . . . . . . . . 66
4.2.1 Le pr ob lème de test
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
4.2.2 Ap pro ch e intu itive
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
4.2.3 Ap pr o ch e th éor .ique
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
4.2.4 Gén ér alisations
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
4.2.4.1 Test d ’u ne valeu r qu elcon βqu
1 e. de
. . . . . . . . . . . . . . . 70
4.2.4.2 Test d ’u ne in égalitéβsur
1 . . . . . . . . . . . . . . . . . . . . . 72
4.3 Région s de confi ance
( in co mp l et) . . . . . . . . . . . . . . . . . . . . . . . . . . 73
4.3.1 Défi n ition.. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
4
I ntro ducti on : prés entati on du cou
Ce cou rs est un e intr o du ction au x méth o des et mo dèles de base de l’écon

Cette ométr ie.
d ern ière s’enten dra
comme
ici un e br an ch e de la statistiqu e math ématiqu e (ou in fér entielle)
d an s laqu elle
1. les mo dèles statistiques utilisés sont con stitu és à par tir d’u ne ad ap tation d’u n mo dèl
écon omiqu e th éor iqu e ou p eu vent avoir un e inter prr elève
étation
duqui
r aison n ement
écon om ique
2. les d on n ées u tilisées p ou r l’in fér en ce statistiqu e pr ovien n ent de l’ob ser vation du
n ement de l’écon omie
On p eut résumer la définition prop osée de l’économétrie en assimilant cette dernière à la sta-
tistique ap pliquée à des situ ation s p ou vant êtr e décr ites par la scien ce écon omique.
S ur le p lan de la statistiqu e, cette d éfi n ition amèn e p lu sieurs r emar qu es.
1. Du fait de cette con n exion avec la scien ce écon omiqu e, les var iab les p ou r lesqu elles
1 de
d èles statistiqu es l’écon ométr ie (qu’on ap p eller a simplement mo dèles écon ométr iqu
par la su ite) sont con struits sont également des variab les qu e l’on retrou ve dan s les m
écon omiqu es. Ces d er n ier s d écr ivent typ iqu ement les r elation s qu i existent entr e
var iab les écon omiques. Par con séquent, les mo dèles écon om étr iques sont destin és à
senter d es r elation ssont
qui su pp osées exister entr e les var iab les tou t en p er m ettant d
les inter pr éter . Ces mo dèles mettr ont ain si en évid en ce des par amètr es qu i expr im
r elation s entr e var iab les et en car actér isent la for me.
2. L’in fér en ce statistique qu i ser a men ée dan s le contexte du mo dèle écon ométr ique p
essentiellement su r ces p ar amètr es ; ceu x-ci ser ont d on c les p ar amètr es d ’intér êt
p oints 6 et 7 à la page 10) du mo dèle économétrique.
3. De p ar la n atu re même d es mo d èles écon ométr iqu es (voir le p oint les1mé-
ci-d essu s),
th o d es d ’in féren ce
serqui
ont mises en œu vr e p ou r étu d ier ces p ar amètr es ser ont qu a
ex clu s ivemmuentltiv ariées
.
Ce cou rs p eu t êtr e con sid ér é comme un cou rs deet statistique,
d an s lequon
el pr ésentera
des mo dèles et des méth o des d’in fér en ce de base cou ramment u tilisés en écon ométr ie. B
le contenu de ce cou rs soit or ienté par la pr atique statistiqu e dan s le domain e des mo dèles
écon omiques, les méth o des statistiques qu i ser ont pr ésentées p eu vent bien enten du s’ap
à des contextes au tr es (les pr emièr es ap plication s du mo dèle de base qu i ser a pr ésenté d
cou rs sont d ’ailleu rs ap p aru es d an s d es d omain es b ien d istin cts de l’écon omie).
1
On rap p elle qu ’u n mo dèle statistiq ue — et don c un mo dèle économétriq ue — contient un en semb le d’hy
th èses p rob ab ilitstes sou s lesq usera
elles
n otamment
il p ossib le de d ériver les p rop riétés d es d iverses métho d es
statistiq u es utilisées d an s le cad re de ce mo d èle. Voir p age 16.
5
Bien qu e cette qu estion aille au -d elà du contenu du cou rs, on p eu t se deman der ce qu ’
l’écon ométr ie par rap p or t à un e an alyse écon omique th éor iqu e.
Les mo dèles théoriques prop osent une description du fonctionnement de l’économie (ou de
cer tain s de ses mar ch és) au moyen d ’u n en semb le de r elation s entr e var iab les écon om
fois cette descrip tion prop osée, plu sieu rs typ es qu estions p eu vent se p oser. Par exemple:
1. Les r elation s étab lies p ar le mo d èle th éor iqu e existent-elles vr aiment?
2. En su p p osant qu e ce soit le qu
cas,
elles sont les prop r iétés de ces r elations
d eux
? Si
var iab les
X et Y sont m ises en r elation,
p eu t-on su pp oser qu e cette d er n ièr e lin éair e?
n on lin éaire ? Les variab
X les
et Y varient-elles en semb le d an s le même sen s ou en sens
op p osé?
3. En supp osant que le mo dèle théorique prop ose une relation entre deuxXvariables et
Y exp r imée au moyen d ’u ne fon ction ap p ar ten ant à un e classe
ex. fonctions
d on n ée (p.
lin éair es, log-lin éair es, p olyn
etcômes,
), la classe prop osée est-elle la b onne?
4. En su p p os ant qu e ce soit leaucas,
tr ement d it s’il
existe un élém ent d an s la classe de
fon ction s qui
p er met d ’exp r im er la r elation existant r éellem X ent
et Yentre
, qu elest
cet élément ? Sip ar exemp le la r elation est lin éair e (la cou rb e r ep r ésentant la fon ctio
reliant une variable à l’autre est une droite) quelle est la valeur de chacun des co efficients
exp r im ant cette r elation?
Les qu estion s ci-d essu s sont de d eu x n atu r es:
– Cer tain es (la pr emièr e et la tr oisième) p osent celle de la valid ité du mo dèle écon omiq
th éor iq uc’est
e, à d ir e sa cap acité à r en dr e comp te cor r ectement du fon ction n emen
d e l’écon omie.
– Les au tr es qu estion s tr aitent de la p ossib ilité d’u tiliser un mo dèle th éor ique p ou r é
su r la natu re des relation s entr e var iab les écon omiques des én on cés de typ e qu alita
exem p le: l’au gmentation d ’u n tau x d ’intérêt entraîn e la b aisse du tau x d ’in fl ation ) o
q u antitatif(p ar exemp le:
un e au gmentation d ’1 p oint du taux de cr oissan ce du PIB,
p er m et,
san s ch an ger le n iveau de la d ette dedel’État,
d iminu er de 10% le n iveau d es
imp ôts dir ects p er çu s par l’État au cou rs des 2 pr o ch ain es années).
Les rép onses à ces questions sont d éterminantes. On compren d aisément qu’il est intéress
de savoir si un mo dèle écon omique th éor ique par vient à ren dre compte cor rectement de la
lité d’u ne relation écon omique. Si ce n’est pas le cas, on p eu t le con sid ér er comme fau x, e
u tilisation ne contr ib ue p as à un e meilleu re compr éh en sion d es mécan ismes En écon omiqu
su pp osant qu ’u n mo dèle soit con sid ér é comme ad équat, la p ossib ilité de l’u tiliser p ou r
à des énoncés quantitatifs non-triviaux est d’un intérêt ma jeur p our les économistes (p ossibili
d ’effectu er d es pr évision s, con du ite de p olitiqu esetcécon
). Or,omiqu
p armies,
les mo d èles th éo-
riques écon omiques for mu lés, p eu (au cu n ?) offr ent un e telle p ossib ilité. Par ailleu rs, ces
eux-mêmes ne prop osent aucune métho de p ermettant de savoir s’ils sont justes ou faux.
L’u tilisation d es d iver ses méth o d es d ’in fér en ce de l’écon ométr ie comp lète la for mu
mo dèle théorique et vise à app orter des rép onses à des questions du typ e de celles mentionn
ci-d essu s, en fou rn issant d es ons
e stimati d es p ar amètr es d es d iver ses r elation s ap p ar aissant d
les mo d èles écon omiqu es, en p er mettant
te sterl’adéquation
de d’une formulation prop osée par
u n mo d èle th éor iqu e avec laDe réalité.
p lu s,
p ar ce qu e ces estimation s et tests sont effectu és
en u tilisant les méth o d es de l’in fér en ce statistiqu
ils sont accomp
e, agn és d ’u ne évalu ation d es
6
2
r isqu es qu i leu r sont asso ciés.
Bibliogra phie
– Cou rs de statistiqu e mathé matique
, Alain Mon fort,Econ omica (coll.
Écon omie et statis-
tiqu es avan cées),3
e édition , 1997
– Statistiqu e et économé trie. Du modè le linéaire . . . au x modèle , Xavier
s non- Gu yon,
linéaires
Ellip ses (coll. Un iver sités, math ématiqu es ap p liqu ées), 2001
– M é thode s économé ,triquJ. J oh
esn ston et J. N. DiNard(trad.F.
o, Gu err ien et O. Gü n ),
Econ omica, 1999
2
Le risq ue asso cié à un estimateur p eut se mesurer en utilisant par ex emple l’erreur quadratiq ue moyenne.
Les risq ues classiq uement asso ciés à un test sont les risq ue de ty p e 1 et de ty p e 2. Voir le chapitre suivant p o
d es rap p els su r ces n otion s.
7
8
C h ap i tre1
Rapp els sur la démarche de

l ’i nférence s tati s ti q ue
Cette section p ermet de rapp eler les princip es de l’inférence statistique.

On précise l’ob jet
d’étude dans une démarche inférentielle et on rapp elle les différentes notions de base (p opula
tion, variab le,
éch antillon,
p ar amètr On
e). présente un e ju stifi cation (intu itive) d es méth o d es
d ’in fér en ce ad op tées (u tilisation de statistiqu es) en in sistant suexiste
r le lien
entrqui
e une
car actér istiqu e d on n ée d ’u ne d istr ib u tion de pr ob ab ilité et les pr op r iétés d ’u n éch a
riab les aléatoir es issu es de cette distr ib ution . Ces rap p els sont faits dan s un contexte un i
1.1 Ob jectif d’une démarche inférentielle et notions de base

1. On s’intér esse à un e car actér istique don née d’u ne p op ulation . Pou r simplifi er , on su
X. 1var iab le n otée
qu e cette car actér istiqu e p eu t se mesu r er au moyen d ’u ne
E xe mp l(1e:) les s alaires des employés en France ; (2 ) la tensio n de rup ture de câbles
d ’as cens eu(3 r;
) la taille des enfants dans les classes de co u rs prép arato i re dans le
N ord ; (4 ) l ’accès à internet à do micile p o ur les ménag es français.
2. Qu elle qu e soit la car actér istiqu e qu X,
e mesu
les valeu
re rs prises p ar cette variab le d ans
2
la p op u lation étu d iée ont un e certain e r Notamment,
ép artition. p ou r ch aqu e n omb re r éel
a cette répartition exprime la prop ortion d’individus de la p opulation p our lesquels la
var iab Xle est in fér ieu re ou égaleà
a. On p eu t alors d éfi nfonc
ir la tion de ré partition
de
X qu i, à ch aqu e réel
a asso cie cette prop ortion. On notera
FX cette fonction.
E xe mp lEe: n re prena nt l es e xemp l es du premi
F X er
décrit
p o i to
n t,
ur à to ur (1 ) la
rép arti ti o n des salai res en France ; (2 ) co mment la tens io n de ruptu re es t rép arti e da
l a p o pulatio n des câbles d ’ascenseur tes tés ; (3 ) la rép artiti o n de la taille au sein de la
p o pulatio n des enfants de CP dans le N ord ; (4) la réparti tio n de la variable indiquant
s i un ménag e a un accès internet à do micile, p armi la p o pulatio n des ménag es français
1
On rap p elle qu ’en statistiqlaupe,op u lation d ésign e l’en semb le de tou s les in d iv id us statistiq
est u es qu ’il
p ossible de considérer.
D e plu s,
les variab les servent à d écrire un e p op u lation en mesu rant un e caractéristiq ue
des in div id us de la p op ulation . Certain es caractéristiq ues p eu vent être de dimen sion su p érieu re à 1 et on u
d an s ce cas p lu sieu rs variab les simu ltan ément.
2
Si unevari ableest unemani èrede mesu rer un e caractéristiq ue d es in d iv id us d ’u neles p op
valueurs
lation,
p rises p ar cette variab le sont les faites en utilisant la variab le.
mesures
9
3. Dir e qu ’on s’intér esse à un e car actér istique d ’u ne p op u lation sign ifi e qu ’on s’intér
la façon d ont sont r ép ar ties les mesu r es de cette car actér istiqu e au sein de la p op u
Au tr ement d it, si cette car actér istiqu e est mesur
X, onées’intér
p ar esse à la fon ction de
r ép artition
F X de X.
4. Dan s b ien des cas,
on ne s’intér esse p as à la fon ction de r ép arXtition
tou te
deentière,
mais seu lement à cer tain es de ses pr op r iétés.
E xe mp l(1e:) ladisp e rs des
ion s alaires en France ; (2 ) la tension
mi ni made le ru p ture
d e câbl es d ’as cens (3eu) lar;tai lle
moye n ned es en fa n ts d an s l es cl a s s es d e co u rs
prép ara to i re da ns le (4 N ord;
) la pro p ortion
des ména g es fra nçai s un ayaa nt
cc ès
i n ternet à l eur do mi ci l e.
Les exemp les ci-d essu s illu str ent les pr op r iétés les p lu s fr équ emment étu d iées d ’
tion de rép artition:les valeu rs extr êmes( l a tensi on d e ru p t),ure
minima le la ten d ance
centr ale(
l a moyenne des t a i l ou
l es,
en core la de mén a )ges
prop ortion et la d isp er sion(
la
i onsa la ).
d i sp ersdes i res
5. En statis tiqu ces
e, prop r iétés se mesu r ent au moyen de d ivers inPar d icateu
exem prs.le,
la ten d an ce centrale de la fon ction de r ép artition
X est un
dee valeu r au tou r de laqu elle
se r egr ou p ent les valeu rs pr Xises
dan
p ar
s la p opulation;on m es u re typ iqu em ent cette
ten d an ce centrale pmédi
ar la ane
ou l’espé rancede X. 3
La d isp er sion,
qui décrit le caractère plu s ou moin s regrou p é des valeu
X au
rs tour
de
d ’u ne ten d an ce centr ale, se mesu re fr équ emment p ar 4
X. la var ian ce de
6. Un ind icateu r qui
mesure un e prop riété don née d’u ne fon ction de rép artition est ap p elé
de
paramè tre cette fon ction de rép artition.
La valeu r d ’u n p ar amètr e est un n omb re r éel
qu ’on p eu t calcu ler d ès qu ’on con n aît la fon ction de rép artition.
E xe mp lSie:o n s ’i n téres se à la tendance cen X ,tral
lee p deF
ara mètre co n s i d é ré p eut
ê tre l a méd i a n(Xe).MeLa val eur du p aramètre est la val eur de la médiane qu’on
c al cu l e à p artiXr g
deF = inf{a ∈ | F X (a) ≥ 12 }.
râ ce à l a formu(lXe) Me Ê
7. Avec les n otion s intr o du ites ci-don

essu
se ps,lace d an s un e situ ation où on s’intér esse
à u n e prop r iétéFdeX, mesu r ée p ar un p ar amètr
Celu e.
i-ciest alor s ap p paramè
elé tre
et
d’ i nté rêt on le n otera
θ.
8. Si on p eu t ob server la valeu r de la variab
X p oule r ch aqu e in d ivid u de la p op u lation,
alors on con n aît la fon ction de r épFartition
X (voir comment au p oint 2). Par con séqu ent,
d ’ap r ès ce vient
qui d ’être d it, on p eu t calcu ler la valeu r du p aramètre d ’intérêt (voir le
point 6).
9. La p ossib ilité d’ob ser ver la valeu r de la var iab le p ou r chaque in divid u sign ifi e effec
r ecen sement de la p op u Cecilation.
ne p eu t d an s b ien d es cas êtr e envisagé.
Les r aisons
p our cela sont multiples:le recen sement p eu t être trop coû teu x (n otamment en temps)
lor sque le nomb re d’in divid us dan s la p op ulationpar estex
grempl
an d(e l ors que la p opul a-
ti on est cel le de tous l es empl oyés ) ;en
le Fra
r ecen
ncesement p eu t con du ir e à la d estr u ction
3
L’esp érance de
X, n ot ée X
E(), s’interp rète comme la valeu r att enX.duCe
endeomb re s’interp rète également
comme la m oyen neX de au sein de la p op u lation . La méd ian
X , ne ot
deée Me(
X ), est la p lu s p etite valeu r telle
que la prop ortion d’individus dans la p opulation p our laquelle
X est su p érieure à Me( X ) est d ’au moin s 50%.
Formellement, on a Me( a ∈ | F X (a)≥ 12 }.
X ) = in f{ Ê
4
La varian ce de
X, n ot ée X
V() est un e mesu re de la d istan ce moyen ne entre les X valeu
d an srsla de
p op u lation
et l’esp érance de
X.
10
d es in d ivid par
us( exempl e l ors qu’on mes ure à quel le t ensi on le câ bl e d’a
), s cens eur a
etc.
10. Cette imp ossib ilité implique au ssi l’imp ossib ilité de calcu ler (et don c con naîtr e) la val
de θ. On se contente alor ps,ou r d es r aison sseront
qui d évelop p ées p lu s b as (à p artir
d u p oint 17),
de mesu r er la car actér istiqu e psous-
ou r ensemble
un de la p opu lation.
Les
in divid us comp osant ce sou s-en semb le p eu vent êtr e ch oisis de différ entes man ièr
n ou s contenteron s de mention n er qu e la man ière de ch oisir ces in d ivid us a d es con
imp or tantes su r les pr op r iétés d es méth o d es statistiqu es qu i ser ont emp loyées p
11. La man ière de ch oisir les in divid us dan s un e p op ulation qu e nou s retien dron s est a
éc hantil lonnag e aléatoire .simple
Celle-cipro cèd e de la man ière su ivante.
On ch oisitau
5 un pr emier in divid u dan s la p op ulation et on effectu e p ou r cet in divid u un e m
hasard
au moyen de la variabX. le C ette mesu re est un e valeu r xn1 otée
de X. O n « r em et»
l’individu dans la p opulation et on rép ète l’étap e précédente,
ce qui f ourn it une secon de
mesu re x2. En rép étant cette op ération
n fois , on d is p osnemesu
de r es (ou ob ser vation s)
n de la variab X.
x1, . . . ,x le
E xe mp lLa e: vari abl e X es t la mes u re de la tai ll e d ’un enfant de CP dans le N ord. On
c ho is it au has ard un premi er enfant i ns c ri t en CP dans le N ord, o n mes u re sa tai ll e
o n la no tex
1 . On « remet » l ’en fa nt da ns l ’ens e mb l e des en fa n ts de CP da ns le N ord
e t o n en cho is it au has ard un deu xi è me ; o n2no ; etc
te. sa tai ll ex
12. De man ière évid ente, ces ob servation s ne p eu vent être con nu es avec certitu de à l’av
puisqu’elles dép endentqudei sontles n in divid us ch oisis dan s la p op ulation . Par con sé-
q u ent, n sont con sid ér ées comme les r éalisation s de variab
x1, . . . ,x X 1les . ,Xn .6 es
, . .aléatoir
13. Les prop r iétés de ces variab les aléatoires sont assez faciles à d éd u ire de la façon d ont
sont intr o du ites.
– X i ser t à mesu r er la car actér istiqu i e in
e du
d ivid u ch oisi. C et in d ivid u est chde oisi
manière tout à fait ind ép end ante d es autres. En effet, savoir que j,d k, esℓ,ind. .. ividus
ont été ch oisis et savoir qu e p ou r ces in d ivid us on a effectu x éj les mesu
,x k ,x ℓ , . .. r es
de la car actér istique n’affecte pas la pr ob ab ilité p ou r qu ’on fasse qu elque mesur e
cu lière qu e ce soit ch ez l’in d i. ividu
Au tr ement d it, le fait de con n aîtr e les r éalisations
de X j ,X k ,X ℓ , . ..n ’affecte p as la loi de probab ilité X i . On
de d it qu e les variab les aléa-
toir esX 1, . . . ,Xn sont indé pendantes . C eci sign ifi e qu ’il n ’existe au cu ne liaison d ’au cu ne
sorte entre ces variab les aléatoires. On p eu t don c étu dier les prop riétés de l’u ne d’e
en écartant les au tres san s qu e cette étu de soit affectée p ar cette mise à l’écart.
– Con sid éron s alorsi ela de ces var iab les aléatoir X i ,es,
et essayon s de tr ou ver sa de loi
p r ob ab ilité, caractérisée p ar sa fon ction de rFép (
Xi a artition
) = P( )
X i ≤ a ,a ∈ .
Ê
On
note d’ab ord que l’individu i étant ch oisi au h asar d, les valeu rs p ossibX ilessontp our
les mêmes qu e les valeu rs p ossib les X. pDeour
p lu s, p ou r n ’imp or te réel qu el a, on
sait qu’il y a une prop ortion égaleà F X (a) d ’in d ivid us d an s la p op u lation p ou r lesqu els
la variab le X est in fér ieu re ou égaleà
a. Par con séqu ent, si on ch oisit un in d ivid u au
5
Choisir au hasard un ob jet dans un ensemble signifie ici que n’imp orte quel ob jet a la même probabilité d’être
choisi que n’imp orte quel autre ob jet dans cet ensemble.
6
D’u ne man ière un p eu vagu e, on défi nit un e variab le aléatoire comme un e gran deu r p ou vant varier en fo
d u résu ltat d ’u ne ex p érien ce aléatoire.
Ici l’ex p érience est le choix d’un indiv idu au hasard dans la p opulation.
La gran d eu r est la mesu re de la caractéristiq ue étu d iée ch ez l’inserad iv id
chuoisi.
qui
Cette mesure dép end
clairem ent dequelestl’in div id u qu i a été ch oisi au hasard , don c du résu ltat de l’ex p érien ce aléatoire.
11
h asard d an s la p op u lation, i e, alors la prob ab ilité p ou r qu e la mesu re de la
d ison s le
car actér istique p ou r cet in divid u soit in fér ieu re aouest égaleà
pr écisém ent égaleà
7
F X (a). For m ellement, on a P(X i ≤ a)= F X (a). Ceci étant vr ai qu elqu e soit le ch oix
de a, ona F X i = F X . Ceci étant vr aip ou r tout i, ona F X 1 = ··· = F X n = F X .
Au tr ement dles it, variab les aléatoires
X 1, . . . ,X
n ont la mêm e loide prob abilité.
On
dit queX 1, . . . ,X
n sonti de ntiqu e me nt distribu . ées
14. On n ote qu e la variab X le
a un e rép ar tition d an s la p op u lation qu i est id entiqu e à celle
d es variab les aléatoires n . Or n ou s n ’avon s à au cu n moment con sid éré la va-
X 1, . . . ,X
riab leX comme aléatoir e. C elle-ci a été simp lement d éfi n ie comme la f açon de mesu r
car actér istiqu e d ’intér êt (voir le p oint 1 ci-d essu s).
Cep endant, en utilisant le même raisonnement que celui intro duit dans le p oint précéden
il est facile de d éd u ire qu e si on con sid ère la variabX̃ledaléatoire
ésign ant la mesu re de
la car actér istique étu diée p ou r un in divid au u chh asard
oisi d an s la p op u lation,alors
la fon ction de rép artition X̃deest la mêm e qu e celleX. deIl n ’y a d on c p as lieu de
d iffér en cier
X̃ et X : ces d eu x var iab les ser vent à mesu r er la même ch ose et ont la m ê
fon ction de rép artition.
On compr en d alor s p ou r qu F Xoi
i
=ona
F X . En effet,X est la mesu re de la car actér istique
étu d iée p ou r in d ivid u qu elcon qu au eh ch
asard
oisi d an s la p op u lation,
et X i d ésigne la
mê me chose , mais lor squ ’on convient qu e l’in d ividau u ch oisi d d ésigni eedes
h asar le n
in d ivid us extr aits de la p op u lation.
Au tr ement dl’exp it, ér ien ce aléatoir e qu i con siste à ch oisir au hasar d un in divid u, qu ’
ap p ellerai, d an s la p opu lation et pqui
ermet de d éfi X n i irest un e r ép liqu e id entique
de l’exp ér ien ce qu i con siste à ch oisir au hasar d un in divid u qu elcon qu e et qu i p er
défi nirX. La fon ction de rép artition, et don c la loide probab ilité, de ce d eu x variab les
est p ar con séqu ent la mêm e.
15. On r ap p elle qu e d es variab les aléatoireséc forment un aléatoire simple
hantil lon si elles sont
indép endantes et identiquement distribuées. C ette d éfi n ition fait ap p araître
X 1, . . . ,X
n
comme un éch antillon aléatoir e simp le. De p lu s, comme la loi commu n variabne les
de ces
aléatoir es est celle X,
deon d it queX 1, . . . ,X
n forme nt un éc hantil lon aléatoire simple
de X.
On rap p elle également qu ’un e dans u ne de
tirag P est un n omb re qui
loi probab i lité est
la r éalisation d ’u ne var iab le aléatoir e d es onttPla
. Par
loi con séqu ent,
les ob servations
x1, . . . ,x
n étant les réalisations de variables aléatoires indép endantes ayant toutes la mêm
loi, sont con sid érées comme d es tirages d an s cette loi. Celle-ci étant X, on celle
inter-de
p r étera n com me
x1, . . . ,x n tirages indép endants dans la loi X, de F X .8
ou en core d ans
16. Résumé des p oint s qui précèdent.On ne p eu t faire de r ecen sement et calcu θ. ler
On con stitu par
e, un e méth o de de sélection ap p elée éch antillon age aléatoire un simple,
n-u p let de variab les aléatoires n , indép endantes et identiquement distribuées. La
X 1, . . . ,X
loi de pr ob ab ilité commu ne de ces var iab les est la même X.qu
Donc
e celle
X 1, .de
. . ,X
n
7
Le raison n ement u t ilisé
est
iciid entiq ue à celui
— b ien con nu — con cern ant d es b oules d ans une si u rne:
une urne contient une prop ortionp de b ou les blan ch es, alors la prob ab ilité p ou r qu ’u ne b ou le ch oisie au hasard
dans l’u rn e soit b lan ch e est égaleà
p. Les raisonnements de ce ty p e p ermettent de voir des prop ortions comme
d es p rob ab ilités
vi et .
ce versa
8
On ne fera p as de d ifféren ce entre un e p rob ab ilité et sa fon ction dePar
répcon
artition.
séq u ent, un e
deloi
p rob ab ilité d ésign e au ssi b ien l’u ne qu e l’au tre.
12
for ment un éch antillon aléatoir e simpX. le
Endecon séqu en ce, les r éalisations
x1, . . . ,x
n
d e ces variab les aléatoires con stitu
n tirages
ent indép endants dans la
FX loi
de X.
1.2 Présentation du p rinc ip e de l’inférence statistique

17. Il r este à exp liqu er p ou r qu oi, d evant l’imp ossib ilité d’effectu er un r ecen sement et
cu ler la valeu r du p aramètre d ’intérêt
θ, on pro cèd e de la man ière décrite ci-d essu s. Plus
pr écisément, qu el est le bu t qu ’on p eu t se fixer en matièr e de con naissan ce qu e l’on
avoir deθ ? Qu e p eu t-on faire avec les ob servation
X 1, . .s .den p our attein d re ce but?
,X
L a valeu r de
θ ne p ou vant se calcu ler, on p eu t tou t au mieu x l’ap proximer. Si on con sti
u n éch antillon aléatoire simp le X, de
c’est d an s ce buIl t.fau t d on c montrer qu
est
’il
p ossible, à partir de
X 1, . . . ,X
n, de con str u ir e d es méth o d es p er mettant d ’ap pr oximer
valeu r in con nu e du p aramètre θ. d ’intérêt
Cet ob jectif est celui que se fixent (sous diverses
for mes) tou tes les méth o di es nféde
rel’nce statistique
.
18. Le princip e de b ase de l’inférence statistiqu ue nest
écqu’hantil lon constitu é au moye n de
tirag es dans u ne loi contie nt de l’i nformation su r Reconnaissant
. ce tte loi ce princip e, il
est natu rel de ch er ch er des méth o des qu i p er mettent d’extr air e cette Tou tein for mation.
m éth o de con str u ite d an s ce bu mét est uned’i nfé re nce statistique
thode .
19. Il est évid ent qu Xe1si n sont indép endantes et ont comme loi commune
, . . . ,X F X , alor s la
loi de tou te var iab le aléatoir e s’exp r imant comme Tund eesfon
variab
ctionX
les1, . . . ,X
n
ser a d éd u ite
F Xde
.
E xe mp lSo e: it une variable aléato i re X sui vant B (p).laSoloiitX1, . . . ,Xn un éc h an-
tillo n aléato i re simple de X . So it la fo nctio
Ê
: n
Ê
→ nTdé fi ni e parT (x1, . . . ,x
n )=
1 n 1 n
n i =1 xi . On forme la vari able al éato i T
= reY
(X 1, . . . ,Xn )= n i =1 X i . La loi
d e Y s e ra dédui te d e cel1l, e . .d. eX
,Xn , c’e s t à d i XreF
. E n p art i c u les i et r,
biilen
c o nn u qu e l ’es p é ra nce de Y es t la même qu e cel le de X , c ’es t à di re p. On s ai t ég
n
m e n t q u e=nY i =1 X i su it un e loi B (n; p). Par co nséquent, les valeu rs pro bables
p o ur nY (resp. p o ur Y ) se situeront autour × p den
(re s p . p ).
Tou te var iab le aléatoir e s’exp r imant comme un e fon X 1ction de
n seu lement est
, . . . ,X
ap p elée . L’étu de de la façon d ont lad’une
stati stique loi statistique dép end de celle de
X 1, . . . ,Xn s’ap p elle la th éorie de l’éch antillon
Dans n age.
une telle ap pro ch e, on con n aît
F X et on d éd u it la loiTde (X 1, . . . ,X
n ).
20. Le p oint qu i pr écèd e r ap p elle qu ’il existeFun X vers
lien les
de prop r iétésXde
1, . . . ,Xn
et don c un lien de
θ vers les prop r iétés de
X 1, . . . ,X
n. On p eu t essayer d ’ob ten ir un lien
d an s l’au tre sen s : d es prop rXiétés
1, . . .den , p eu t-on in fér er qu elqu e ch
,X θ ?ose sur
E xe mp lDa e: ns l ’exe mp l e précé suppde o
n so
t, ns que le p aramètre d ’i n térêt = so itθ
p, d o n t o n i g n ore l a Suppva l eu
o so
r. ns qu’o n disp o se = 100
deno b s e rva ti o n s de
vari abl es al éato 1i,resX
. . . ,X100 et qu ’a vec ces o bs e rva ti o ns o n ai t o b tenu la va l eur
0,31 p o ur la vari abl Au e Y.trement dil t, es o b s e rva 1ti, o
. .n. sx
,x
100 so nt te ll es que
1 100
100 i =1 xi =0 ,31 . On ne co nn aî t pa s la va leur de θ , ma is , en reprena nt la remarq ue
d e l ’e xe mp le pré cé de nt, le s o bs e rva ti o ns no us di se nt qu e ce p ara mè tre a ce rt
u ne val eu r p o ur l aq uel le o bs e rver 0,31
quest
e Yun
vaut é vènement pro bable. Ce la
é l i mi ne do nc co mme va l eu rs pl au s i blso esnt
detro θ cel
p élo l es
igqui 0
nées31
, de
.
C et exemp le illu str e la d émar ch e de l’in fér en cecon
statistiqu
sistant e,
à in férer de l’ob-
servation d ’u n éch antillon d es én on cés su r les prop r iétés
dont de
il eslat loi
is su,
et en
13
p articu lier su r la p aramètre d ’intérêt de cette loi. En termes p lu s gén érau x, cette d ém
in fère les prop r iétés( ) d ’u ne p op u lation à p artir d es prop
inconnu es r iétés(
ob se rv)ées
d ’u ne
p artie de la p op u lation (cette p artie étant con stitu ée d es in d ivid us sélection n és).
21. On p eu t illu str er le contenu de cette section p ar l’exp érien ce
C on
susid
ivante.
éron s une
variab le aléatoire
X qu i su it un e loi n or male ayant un e esp ér an ce et un e var ian ce don
Au moyen de techn iqu es de génération de n ombres aléatoires, on effectue ind ép end am
200 tir ages aléatoir es de nomb res réels, de sor te qu e p ou r ch aque tir age la pr ob ab
qu e le n omb re soit compr isaentre
et b est
1 b (x − µ)2
P( a ≤ X ≤ b)= √ exp − dx
2πσ2 a 2σ2
a et b (a <b), où µ et σ2 sont les valeu rs de l’esp ér an ce et de la

p our toute paire de réels
varian ce de
X qu e l’on s’est d on n é, r esp ectivement. Les var iabXles 1, .aléatoir
200, es
. . ,X
qu i d ésign ent les n omb r es qu i ser ont tir és lor s d es 200 tir ages, for ment d on c un
aléatoir e simp leXde
. On calcule ensu ite la moyenne de ces n omb 1 r200
es: .
200 i=1 X i
On effectu e cette exp ér ien ce en ch oisissant tou r à tou r diver ses valeu rs de l’esp ér a
Dan s le tab leau ci-d essou s, on rep ro du it les résultats ob tenu s.
Exp ér ien ce
Valeu r de l’esp ér anMoyen
ce ne ob servée
1 −10 −10.50
2 −5 −4.75
3 −1 −1.20
4 0 0.03
5 1 1.08
6 5 5.08
7 10 9.94
On con state qu e la valeu r de la moyen ne varie en fon ction du choix de la valeu r r eten
p our l’esp érancepet,
lu s sp écifi qu ement,
qu e la pr emièr e est pr o ch e de la secon
Cela d e.
illustre la dép endance de ladloi
’u ne statistiqu e la
(icim oyen n e) vis à vis d e la
desloi
variab les de l’éch antillon (en p articu lier l’esp éran ce de cette loi).
Con sid éron s mainten ant l’exp érien ce « récip ro qu e » dan s laquelle on ne se don ne p
d iverses valeu rs de l’esp éran
µ, mais
ce où on su pp ose p lu tôt qu e celle-ci
est in con nu e,
mais qu ’elle est égale à l’u ne d es valeu rs de l’en{− , − , − , , , 5, 10}. On se
semb
10 5 le 1 0 1
d on ne en r evan ch e la valeu r ob servée de200 1 200
la moyen ne
d es n omb r es qui ont été
i=1 X i
tir és, et su r cette b ase, on essaie de « d evin er » (ou estim er , en lan gage statistiqu e)
est la valeu r de l’esp ér an ce.
Au vu de l’exp ér ien ce pr écédqui ente,
illu stre le fait qu e la moyen ne a ten d an ce à être
p ro ch e de l’esp éran
si on
ce,ob serve qu e la moyen ne −10,5
vaut on d ira qu e la valeu r de
l’esp ér an ce est san s d ou te−égaleà
10.Si la valeu r ob servée de la m oyen ne est 1,08 on
dir a plu tôt qu e la valeu r de l’esp ér an ce est cer tain ement 1, et ain si de su ite.
22. Cet exemp le illu str e la d émar ch e de l’in fér en ce statistiqu
laqu eelle
d ans
le pr ob lème
con siste à « d evin er » à p artir d ’ob servation s la valeu r in con nu e d ’u n p aramètre d
loi d ’où sont issu es ces ob ser vation s. La raison p ou r laqu elle cette d émar ch e est b a
l’u tilisation d’ob ser vation s est qu e celles-ci ont un comp or tement qu i est entièr emen
ter min é p ar la loi d ont elles pr ovien n ent, et qu e p ar con séquent ces ob ser vation s p
14
n ou s r estitu er de l’in formation su r cette
ou p loi,
lu s p ar ticu lièr ement su r un p ar amètre
d ’intérêt de cette loi.
Il est cr ucial de noter l’imp or tan ce du mo dèle statistique dan s un e démar ch e d’in fér
Un mo dèle statistique (voir plu s loin p ou r un défi nition un p eu plu s for melle) est une
d escrip tion d es prop r iétés dedelaprob
loi ab ilité d ont sont issu es les ob servation
ain si s,
qu ’u ne d escr ip tion de la man ièr e d ont elles en sont issu es. Un e telle d escr ip tion p
alor s l’étu de d es pr op r iétés de la statistiqu e for mée à p ar tir d es ob ser vation s (p a
cette statistiqu e a-t-elle ten d an ce à pr en dr e d es valeu rs pr o ch es du p ar amètr e d
Le mo d èle ser t d on c de cad re d ’an alyse d es pr op riétés de statistiqu es d estin ées à
mer le p aramètre d ’intérêt. Si on ne se d on ne au cu ne in formation su r la man ière d on
ob ser vation s sont r eliées à un e loi de pr ob ab ilité, il est imp ossib le de savoir commen
observations p euvent nous restituer de l’information à prop os de cette loi, ou à prop os d
l’u n d es p ar amètr es d ’intér êt de cette loi.
1.3 Les p rob lèmes d ’in féren ce u su els

Il est commu n de d istin gu er tr ois pr ob lèmes d ’in fér en ce. Cette section pr ésente ch a
L a n otation est la su ivante.
Le p ar amètr e d ’intér êt est θ.nSa
otévr aie valeu r est un n omb re
réel in con nu ap parten ant à un en semb le Θ ap p elé en semb le des valeu rs p ossib les du p
θ est le p ar amètr e d ’u nede probab
loi ilité qui
sera celle d ’u ne variab le aléatoire
X, et qu ’on
n otera ( ; )
FX · θ . Pou r tou te valeu r p ossib
θ0 ∈ Θ
le du p ar amètre
θ, le n omb F X x; θ0) d ésigne
re (
la prob ab ilité de l’évèn ement(
X ≤ x), calcu lée lorsqu e la valeu r du p aramètre de X la loi
est θ0.
E xe mp lSie:on s ’i nté ress e p ar e xemple à es ti mer la pro p orti o n p de ménag es françai s aya
u n accès i n tern et à do mi ci l e, θ co ï nci=de
p . aL’ens
vec pe :θ
mb l e des va l eu rs p o ss i bl es est
Θ = [0 ; .1]La loi de pro babilité do nt θ est le paramètre est de la
Bern B (liθ). Do nc
loi o ul
F X (x; θ0) désig nera la fo nctio n de réparti tio n d’une variable aléatoi
B (θ0) : reX
 0, si x< 0


F X (x; θ0)= P (X ≤ x)=  1 − θ0, si 0 ≤ x< 1
 1, si x ≥ 1


E xe mp lOne: s ’i n téres se à la vari ablemesure

X qui la variati o n du p o uvo ir d’achat d’une
c atég ori e de françai s sur une p é ri o de do nnée. On supp o se que la di s tri buti o n de cette v
a u s ei n de la p o pu l a ti o n co ns i dérée s uiaNtle(un
n orm µ,σe2)loi
. Cel a si g ni fi e qu ’e n ch o i-
s issant un individu au has ard dans la p o pulatio n, la pro babili té d’o bserver que la variati o n d
s o n p o uvo ir d’achat est co mprise entre a et b est
1 b (x − µ)2
P( a ≤ X ≤ b)= √ exp − dx
2πσ2 a
2σ2
Ic i,o n p eut co ns i dérer que le p aramètre d ’i n térêt θ(µ,σ es t2)le

, qui
co uple
p aramétri se
l a loiN (µ,σ ) de la vari abl e é tudi
2
L’eée.
n s e mbΘ slee ra n a tu re l l e ]0 ;+
× meÊ
∞ [. Po ur
nt
=(
u n co up l e do 0n néθ 2) Θ ( ; )
µ0,σ 0 de , la no ta ti oXnFx θ0 désig nera do nc la fo nctio n de
N (µ
ré p arti ti o n de ,σ 02) :
l 0oi
1 x (t − µ0)2
F X (x; θ0)= exp − dt, x∈
2πσ02 2σ02
Ê
−∞
15
On disp ose de
n m es u rX es n de la variab X,
1, . . . ,X le obtenues p ar un pro céd é d ’éch antillon-
n age aléatoire.
Dan s cette pr ésentation gén on ér su
ale,pp oser a X
que
1, . . . ,Xn con stituent un
éch antillon aléatoir e simpXle: de n sont indép endantes et suivent toutes la même loi
X 1, . . . ,X
q ueX. On r ap p elle la d istin ction faite entre les variab les X 1aléatoires
, . . . ,Xn et les r éalisations
(ou valeu rs ob ser vées) de ces var iab les, n otées
x1, . . . ,x
n.
Lorsqu’u n prob lème d’in féren ce en formu lé, la solu tion qu ’on lu i apmé p orte est ap p elé
thode
.9 Il est es s entiel
de mention n er qu e qu el qu e soit le prob lème d ’in féren ce con sid
d’ i nfé re nce
(voir les section s qu i su ivent), il existe à ch aque fois p lu sieu rs méth o d es d ’in fér en ce. P
qu ent, se p oser a le ch oix de la « b on ne » méth o de. Pou r qu e cette qu estion ait un sen s,
alor s êtr e en mesur e de compar er plu sieu rs méth o des d’in féren ce disp on ib les p ou r ré
même pr ob lème d ’in fér en ce. Lor squ e de tels moyen s de comp ar aison sont étab lis, on p
être cap ab le de reten ir les meilleu res méth o des d’in féren ce.
Les prop riétés d ’u ne méth o de d ’in féren ce p articu lière sont étu d iées relativement au
blème d’in féren ce p osé. Au trement dit un e même méth o de d’inféren ce p eu t être b on ne
pr ob lème et mau vaise p ou r un au tr e. Ceci p ose don ccadre la qud estion
an s lequ
du el on p ose le
p rob lème d ’in féren ce et d an s lequ el on an alyse les prop riétés d ’u ne méth o de d ’in fére
à r ésou dr e le pr ob lème p osé. Ce cad re modè est aplep statistique
elé . Un mo d èle s tatis tiqu e est
un ob jet mathématique qui sp écifie:
– l’esp ace au qu el ap p artien n ent les ob x1,servations
n d es variab les aléatoires
. . . ,x X 1, . . . ,X
n
(c’est sou ventn ou un sous-en semble nde
Ê Ê
);
– l’en semb le d es lois qu ’on con a sid ère
pri ori p ossib les p ou r les variab X 1, les
. . . ,X
n.
Dan s le pr emier exemp le ci-d essu les variab
s, les con stitu ant l’éch antillon sont d es variab les
aléatoires de Bern ou lli.i eLa d’entr e elles,
Xi , in d iqu e si l’in d iividu
p ossèd e un accès inter n età
d omicile (d an s ce cas on ob servera X i = 1) ou n on (et on ob servera Xalors i = 0). L ’es p ace d es
ob servation s sera d on , 1] cet
n [0l’en semb le d es lois est l’en semb le de tou tes les lois de Bern ou
{B (θ) | θ ∈ ]0, 1[}. Dan s le secon d exemp X i est
le, la mesur e de la var iation du p ou voir d ’ach at
du i e individu de l’échantillon au cous de la p ério de donnée. C’est
a pri oriun réel quelcon que.
L’esp ace d es ob ser vation s ser an .dL’en
Ê
onc semble d es ploiossib les est l’en semb le d es lois
n or males 2 2
{N (µ ,σ ) | µ ∈ ,σ ∈ ]0, ∞ [ }.
Ê
1.3.1 E st imation
L’ob jectif d ’un problème d ’estimation est d ’approximer la valeur inconnue du
θ. p aramètre
Cela p eu t se faire de d eu x man ières:
1. on p eu t ap pr oximer
θ p ar un e valeu r isolée d an s Θ;
2. on p eu t ap pr oximer le p ar amètr e en ch er ch ant un e région de Θ ch oisie de sor te qu
contienne la valeu r inconnuθeavec
de une probab ilité élevée, et ceci quelle que soit cette
valeur incon nue.
Le reste de cette section est consacré au premier typ e d’estimation. Le second sera ab ordé à l
section 1.3.3.
On p ar le ed’stimation ponc tude elθlelorsque l’ob jectif corresp ond au premier des deux cas
ci-d essu s. Pou r estimer
θ, on u tilis e un
e stimate. urUn estimateu r est un e var iab le aléatoire
Tn
9
Ces métho des p ortent des noms particu liers selon la catégorie de prob lème d’in féren ce qu ’on sou haite réso
(voir les section s qu i su ivent).
16
ob tenu e comme un e fon T ction
de X 1, . . . ,X
n à valeu rs d an s Θ et form ée d an s le bu t de fou rn ir
d es ap pr oximationθ.s Ona
de
n
T: Ê
→ Θ
(u1, . . . ,u
n ) → T (u1, . . . ,u
n)
et Tn = T (X 1, . . . ,X
n ).
Un e ap pr oximation θ ob
de tenu e en u tilisant un estimateu r este ap p elée
deθ. C ’est
sti mation
u ne valeurtn ∈ Θ ob tenu e à p ar tir de l’estimateur
Tn de la man ière su ivante:
tn = T (x1, . . . ,x
n ).
C’est d on c la valeu r pr ise p ar la var iab le Tnaléatoire
lorsqu e les ob servation s sont
x1, . . . ,x
n.
E xe mp lOne: reprend l ’exemp le de l ’a ccès à in tern et à do mi ci le. θ es t le p ara mètre d ’u ne l
Berno ulli. Pour n ménag es cho isis au hasard, on intro duit les variables 1, . . .aléatoiresX
,Xn
d e la mani è re s ui van =1 si lei e mé na g e chaoun
X i te: isi accès i n tern et à do mi ci l e et
X i =0 si no n,i
=1 , . . . , n. La pro p ortio n θ de ménag da nses la
quip o pu la ti o n o nt un ac cès
à internet à do micile p eut être estimée par la pro p orti o n de d ménag
a n s l ’éesch quia n ti l l on
o nt un accès à internet à do micile. L’es timateurT
n u tilisé dans ce cas est cette pro p orti o n:
n n
Tn = n1 i =1 X i . La fo nctio n T est do nc défi nie (parT n )= n
u1, . . . ,u 1
i =1 ui . Si on
o bs e rveX
1 = =
x1, .. . ,X n xn , a l ors l ’e s ti man otibote
ntnu e à p arti r l ’e s nties mat lete urT
1 n
n = n
n o mbret i =1 xi .
Pou r un même pr ob lème d ’estimation (même p ar amètr e à estimer à p ar tir d es mêmes
surX es1, . . . ,X
n ), on p eu t u tiliser p lu sieu rs estimateu rs. On les comp ar e u su ellement au m
d e leu r b iais et de leu r précision.
Ces n otion s sont d éfi n ies au moyen de l’esp Tér n (ou
an ce
d ’u
dene fonction Tde n ). Cette
variab le aléatoire étant un e fon ction de
X 1, . . . ,Xn, (on rap p elle que
Tn = (
T X 1, . . . ,X n ))
l’esp ér an ceTnE(
) se calcu le à p artir de la Xloi 1, de n . C es variab les formant un éch antillon
. . . ,X
aléatoir e simp leX,dela loi deX 1, . . . ,X
n est d on née p ar la loi X. de
Par con séqu ent,TnE( ) se
calcu le à p artir de la loiX,dec’est à direF X ( · ; θ). Puisque celle-ci dép endθ,de il en ser a de
même p ou rTE( )
n . Au tr ement dil
it,
existe au tant de façon de calcu ler
Tn ) E(
qu ’ily a de lois
p ossibles p our
X, c’est à d ir e au tant qu ’il y a de valeu rs p ossib θ. Pou
les rp cette
our r aison , on
voit E(Tn ) comme un e f on ction θ, et
de p ou r l’in d iqu er , on n ote cette esp θ(Térn ).an ceE
Soit Tn un estimateu r deθ. On d it que Tn est un estimateu r san s b iais si p ou r tou te valeur
p ossib θle0 du p ar amètre
θ on aE θ0 (Tn ) − θ0 =0 . S i ce n ’est p as le cas,
l’estimateur
Tn de θ
es t b iaisé et son b iais
θ0 en
es tEθ0 (Tn ) − θ0.
La pr écision d ’u n estimateur
Tn deθ se mesu re au moyen de son er r eu r qu ad r atiqu e moyen
C elle-ci est d éfi n ie comme la fon ction qu i àθ0la∈valeur (Tn − θ0)2 ,
Θ asso cie le n ombθ0reE
où l’esp ér an ce est calcu lée en u tilisant
F X ( la
· ; θloi
0).
Lor squ e le b iais ou l’er r eu r qu ad r atiqu e moyen ne ou tou t au tr e pr op r iété intér ess
estimateu r sont tr op comp lexes à calcu ler , on examin e p ar foisasymptoti
les pr op q
r iétés
u ne. sT
C es pr op r iétés sont celles qu e l’on ob tient lor squ e la taille de l’éch antillon est ar b itr air e
gr an d ne(→∞ ). Gr ace à de pu issants th éor èmes (p ar exemp le le th éor ème lim «itcentr al
»), les pr op r iétés limite(
n →∞ ) de Tn sont souvent p lus faciles à calcu ler que les prop r iétés
valab les p our
n fin i, qu elcon qu e.
On d ir a p ar exem p le
Tnque
est un estimateur
conv e rgede
ntθ si la limite en prob ab ilité de
Tn es t égaleà
θ :
P θ0 |Tn − θ0| >ǫ → 0, n →∞ , ∀ǫ> 0, ∀θ0 ∈ Θ.
17
où la notationPθ0 in dique qu e la pr ob ab ilité est calcu lée lor squ’on su pp ose qu e la valeu r d
p ar am ètre
θ est θ0, et d on c que la loiXdeest F X ( · ; θ0).
La raison p ou r laqu elle on étu d ie les pr op riétés asymp totiqu es d ’uTn n estimateur
de θ
p eut être illustrée de la manière suivante. Si les conditions d’application d’un théorème central
lim ite sont satisf aites,
alor s ce th éor ème d it typ iqu ement qu e la d iffér en ce entr e la fon ction
rép artition de Tn et la fon ction de r ép artition d ’u ne loi n ormale ten d vers 0. On d it qu e cette
n or male est la « loi limite T»n .de Pou r vu que n soit su ffisamment gran d, cette d ifféren ce entre
les d eu x fon ction s de r ép artition est p etite
au ssi
qu ’on veu Dant. s ce cas, sous d es con d itions
ap prop r iées (qu ’il fau t en gén éral étab lir), les prop r iétés qu ’on ob tient en u tilisant l’u ne
fon ction s de rép artition est au ssi pro ch e qu ’on le veu t des mêmes prop riétés ob tenu es e
l’au tre fon ction de rép artition.
Ain si,su pp oson s qu ’on s’intér esse au b iais de l’estimateur Tn .
S elon la d éfi n ition ci-d essu
si la s,
valeu r du p ar amètre θ est θ0, le biais vau tEθ0 (Tn ) − θ0.
Plaçon s-n ou s d an s le cas où on ne sait p as θcalcu ( ).lerE
0 Tn
S ou s les con d ition s d écrites d ans
ce p aragrap hp e, ou r vu que
n soit su ffisamm ent gr an
la dd,
iffér en ce entr e cette esp ér an ce et
l’esp ér an ceTde n calcu lée en u tilisant lalimite
loi est au ssi p etite qu ’on le sou h Or aite.
il est
sou vent étabqu li e cette d er n ièr e est égaleà
θ0. Par con séqu ent, si n est su ffisamm ent gr an d,
E θ0 (Tn ) est au ssi pro ch e qu e l’on veu θ0, ou
t deen core, le b iaisE
θ0 (Tn ) − θ0 est au ssi p etit que
l’on veu t.
En con clu sion , sou s d es con d ition s ap rop riées qu i p ermettent d ’u tiliser d es résu lta
le th éor ème « centr al limitn »,
estsisu ffisamment gr an d, calcu ler les pr op r iétés asymp totiqu e
d ’u n estimateu r r evient qu asiment à calcu ler les vér itab les pr op r iétés de La cet estimateu r
difficu lté de cette ap pr o ch e résid e dan s le fait qu ’il est difficile (et par fois imp ossib le) de
q u e la taille
n de l’éch antillon d ont on d isp ose est effectivement su ffisamment gr an de p ou r
l’ap pr oxim ation f aite en u tilisant un e loi lim ite est satisf aisante.
1.3.2 Test d’hypothèse

1.3.2.1 Problè me de t e st
Un pr ob lème de test est un pr ob lème d an ils lequ

fau t el
d écid er p armi
d eu x hyp oth èses
mu tu ellement exclu sives,
ch acu ne con cern ant la valeur
θ du p ar amètr e d ’intér
celle
êt, qu ’on
con sid èr e comme étant vr aie. C es hyp oth èsesHsont
0 et H
n1otées
et ap p elées r esp ectivement
hyp oth èse nu lle et hyp oth èse alter n ative.
E xe mp lSie:θ désig ne une pro p ortio on pn,eut avoir avoir à cho isir entre les hyp o thèses
H 0 : θ ≤ 12 etH 1 : θ> 12 celle qu’o n co nsidère co mme vraie.
Qu elle qu e soit l’hyp oth èse con sid ér ée comme on suvrp aie,
p os e qu
y en
’il a tou j ours une
(et un e seu le) qu i est vr aie en r éalité, c’est à d ir e qu i est comp atib le avec θ. la vr aie valeur
Résou dr e un pr ob lème de testtesesterH
d it0 contreH1.
1.3.2.2 Test st at ist ique
Le pr o céd é p ar lequ el on ch oisitH 0 et

entre
H 1 est ap p eléte st(ou en cor e r ègle de d écision,
ou r ègle de classifi cation
Un ).
te st statistiqueest un test d an s lequ la el
d écision es t p r is e sur
la b ase de l’ob servation d ’u n éch X antillon n . Les d écision s p ossib les sont«
1, . . . ,X on déc i de
q u eH »
0 e st v raie d ’u ne p art,
et« on déc i de qu 1eH »,
e st v raie d ’au tre p art.
On p eu t alors
18
d éfi n ir for m ellement un test comme un e ap ϕ dpéfi
lication
n ie sur
Ê
n et à valeu r dans {0, 1} qui
in d iqu e la d écision pr ise en fon ction de l’éch antillon Pluobs prtenu.
écisément, cette fon ction
est d éfi n ie ain : ϕsi
(X 1, . . . ,X
n )= k si et seu lementsu si r la b ase de l’éch antillon X 1, . . . ,X
n
on d écid e que H k es t vr aie,k =0 , 1. La v ariab le aléatoireϕ
(X 1, . . . ,X
n ) s’inter pr ète comme la
règ leu tilisée p ou r pr en dr e un e d écision su r la b ase deXl’éch 1, . . antillon
n . Si on ob servé
. ,X
X 1 = x1, . . . ,X n = xn , la déc i sionp r is e au moyen d uϕtest est l’élém ent { de
0, 1} qu ’on n ote
ϕ(x1, . . . ,x
n ).
Un test statistique p ermet de prendre une décision à prop os de la vraie valeur θ en de
u tilisant certain es prop r iétés de l’éch antillon . Pou r constru ire un test, on ch erch e en gén é
existe un e pr op riété de l’éch antillon qu i ch an ge — si p ossible for tement — selon qu ’on co
H 0 ou bienH 1 com me étant vr aie. C ette pr op r iété est mesu r ée p ar T unn feor
statistique
m éeà
p ar tir d es var iab les comp osant l’échTantillon:
n = T (X 1, . . . ,X
n ).
E xe mp lLe e:p aramètre θ es t la pro p orti o n de ménag es françai s di sp o sant d ’un accès intern
à do mi ci le. Au trement odint,mes si u re cette c arac téri s ti q ue d ’un au ménag
ha s e
ard
cho isi
p ar X , o n n o teraX=1 l ’é vè ne me nt s equi
ré a l i le
s eménag
si e di sp o se d ’un accès in tern et
à so n do mi ci le etX =0 so n co n traOn i re.
a é vi demme ntX ∼ B (θ). Admetto ns que l ’on
: θrH
ve u i l l e tes0te = 12 co nt reH 1 : θ> 1
2 et q u e p o u r cel a o n d i s p o s e d ’u n éch an ti l l on
a l éa to i re s i 1mp
, . .l .eX
,Xn de X.
Les hyp o thèses p ortent sur une pro p ortio n d’individus dans la p o pulatio n. On sait que cette
pro p orti o n et la même pro p orti o n calculée dans l ’échantil lo n o nt tendance à ê tre semblab
Autrement dit, une pro priété de l ’échantillo ch an ngqui
era se lo n0qu es eH
t vra i e o u p as est
l a pro p orti o n de variablesX
1, . . . ,X
n d a n s l ’é c h a n ti prendro
l l o n qntuila valeur 1. En e ffet,
si H 0 es t vra ice,’e s t à d i reθ =si 12 , cette prop ortion sera probablement assez pro che de
1
2 ; siau co n tra i 0reH
es t fa u s s e, al sera
ors pro
il bable d’o bserver une valeur plus g rande que
1
2 p o ur cette même pro p ortio n. On cho isit do nc de mesurer cette pro priété au moyen de la
1 n
s ta ti s ti qu=
n eT n i =1 X i , c ’est à di re de la pro p orti o n d ’i ndi vi dus de l ’échanti ll o n ayant
u n accès à i n ternet à do mi ci l e.
Ain si,on p ou rra p artition n er l’en semb
noté le,
⊆ , d es valeu rs p ossib les de la variab le
Ì Ê
aléatoireTn de la façon su ivante:= T ∪ T , où T = \ T . L’en sembTle est l’en semb le d es

Ì Ì
valeu rs les p lu s vraisemb labTnles

lorde
squeH 1 est vr aie et l’en semb
T est
le d on c l’en semb le
d es valeu rs les p lu s vraisemb labTn lor
les sque
de H 0 es t vr aie.
Le princip e d’un test consiste alors à comparer le comp ortementTnprobable en su p pdeos ant
su ccessivem ent H que
0 es t vr aie p u is Hque
1 es t vr aie,
avec le comp or tement ob serTnvé . de
On d écid er a que H 1 es t vr aie le
si comp or tement ob ser Tvé n est
de p lu s pro ch e de celuiqui
est pr ob ab le lor squ ’on su ppHose 1 est
que
vr aie, qu e du comp or tement Tn qu dei est pr ob ab le
lor sq ue
H0 est su p p os ée vr aie. Unϕ sera
test d on c de la forme
(
ϕ X 1, . . . ,X
n ) = 1 ssiTn ∈T ,
et ϕ(X 1, . . . ,X
n ) = 0 sin on. L’en semble T est d on c l’en semb le d es valeu Tn con
rs de
du isantà
u ne acceptation H de1 et d on c à un r ejetHde 0 p ar le testϕ. On ap p elle T la rég i on c ritique
d u testϕ.
E xe mp lDanse: l ’exempl e précéden t, pui estsvraisemblable

qu’il d ’o bse rver une valeurn deT
1
g rande par ra p p ortà
2 l ors queH
1 es t vra il e,
’e n s embT le
p eu t êt re ch d
o e
isi
l a forme
T =] 12 + d; 1]p o ur un ce rta i np réos el
it if Le
d. te s t c orre s p o nd an t s e ra do nc de l a forme
( ) =1 1 1 +
ϕ X 1, . . . ,Xn ssi ≥ Tn > 2 d. Sicet é vènement es t o bs e rvé, la va l eu r a tte i n te p ar
Tn est une valeur tro p p eu vraisemblable au reg ard de o nces à’aquoi
tte nd rait
H 0 ésita it
vra ie. On déci de al ors qu ’ell e ne l ’es t pa s , ma 1 la
is vraie
qu e hyp
c ’esotH
thèse.
À ce p oint, la qu estion est : qu an d con sid ère-t-on qu ’u ne valeu
Tn rest
donvrnée
aisem-
de
19
b lab le lorsque
H 1 (ou H 0) est vraie ? Le critère qui p ermet de rép ondre à cette question est basé
su r un calcu l de r isqu es.
1.3.2.3 C a lcul des risques
Un test con du it for cément à pr en dr e l’u ne d es d eu x d écision on con

s susid
ivantes:
ère que
H 0 est vr aie, ou b ien on con sid Hèr1 eest
que
vr aie. Évid emment, l’hyp oth èse con sid ér ée comme
vr aie à l’issu e du test ne l’est p as for cém
c’estent,
à d ir e n ’est p as for cément comp atib le avec
la vr aie valeu r du p ar amètr e. Au tr ement d it, il est p ossib le de pr en dr e un e mau vaise d
Deu x typ es d’er reu r amen ant à un e mau vaise décision sont p ossib les:
– l’er r eu r de typ e 1:
d écid er de con sid érerHque 1 est vr aie alor s que
H 0 es t la vr aie
hyp oth èse;
– l’er r eu r de typ e 2:
d écid er de con sid érerHque 0 est vr aie alor s que
H 1 es t la vr aie
hyp oth èse.
Pou r savoir si on a comm is un e err fau eu r,t comp
il ar er sa d écision avec la C r éalité.
ela ex ige
de con naîtr e cette der nièr e et par con séquent de savoir qu elle est l’hyp oth èse compatib le
la vraie valeurθ du p ar amètrOr e.cette d er n ièr e est in con nu e et p ar con séqu ent on ne p eu
p as savoir san s amb igu ïté qu elle est, H 0 et
p armi
H 1, l’hyp oth èse qu i est vr aie. Par con séqu ent,
qu el qu e soit le tes t u tilis
qu elé,que soit le ch oixTdeet qu elle qu e s oit la d écision p r is e, on
n e p eu t jamais savoir si cette d écision pr ise con du it à un e err eu r.
On p eu t en revan ch e calcu ler la pr ob ab ilité de commettr e un e er reu r en envisageant
tou r que
H 0, pu isH 1, es t vr aie.
1. Su pp oson s H que
0 est vr aie. Il y au ra d an s ce cas er r eu r (d e typ e 1) si la d écision con s
à con sid érer que
H 1 est vr aie, au tr ement d it si l’évèn
Tnement
∈T se r éalise. Par con sé-
q u ent,
la pr ob ab ilité de commettr e un e er reu r de typ e 1 est la prTob n ∈ab
T )ilité
, P(
calcu lée en su pp osant H0que
est vr aie. On ap p elle cette pr ob ab ilité r isqu e de typ e 1 (ou
RT 1).
2. Su pp oson s Hque
1 est vraie. Par le même argu ment qu e d an s le p oint précéd ent, la prob
b ilité de commettr e un e er r eu r de typTe 2 est
n ∈T ), P(
calcu lée en su pp osant
H 1 vr aie.
On ap p elle cette pr ob ab ilité r isqu e de typ e 2 (ou RT 2).
Noton s qu e ces r isqu es sont d es, compr is entr e 0 et 1 (ce sont d es pr ob ab ilités).
nombres
Remar qu on s au ssi qu e RT −1 RT2,
=1 b ien qu e les évèn ements( Tn ∈ T ) (qu i ser t à d éfi n ir
le RT 1) et(Tn ∈ T ) (qu i ser t à d éfi n ir le RT 2) soient contr C ela
air p
es.
r ov ient d u f ait qu e la
p r ob ab ilité de l’u n n ’est p as calcu lée sou s les mêmes con d ition s qu e la prob ab ilité de
Dan s le calcul deTP( n ∈T ) on su p p os e H que
0 est vr aie, alor s qu e p ou r calcu Tn ler
∈T P(
),
on s u p p H ose
1 vraie. On trad u it sou vent cela en n H otantP
1
ouP H 0 p ou r in d iqu er si un calcul
d e prob ab ilité se fait en su pp H 1osant
ou H 0 vr aie, r esp ectivement. Ain si, on p eu t écr ir e le RT1
com meP H 0 (T ∈T ). On voit ain si aisément qu e même H 0 (siP
T ∈T ) =1 − P H 0 (T ∈T ), en
gén éral on aP (
H 0 T ∈T )=1 P (
− H 1 T ∈T , ) c’est-à-d ir e RT 1 =1
− RT 2.
1.3.2.4 C omparaison de test s. C hoix d’un test
Pou r un pr ob lème de test d on n é, il existe évid emment p lu sieurs tests p ossib les. Par e
on p eu t con str u ir e un test qu ’on
ϕT,nTotera
en con sid ér ant un e statistique
Tn et un e r égion
20
T de valeu rs p ossib les p Tnour
, d e la f or me ϕT, T (X 1, . . . ,Xn ) =1 ⇐⇒ Tn ∈ T . On voit
qu ’il existe au tant de tests de cette for me qu ’il existe de ch oix p Tossib . Parles
exem
p our
p le,
si T est un inter valle de la fortme] ∗
, ∞ [, il y a au tant d ’intervalles p ossib les qu ’il y a de ch oix
p ossibles p ourt . Par ailleu r s, on p eu t également vou loir u tiliser un e Sstatistique
∗
n au tre que
Tn et u tilis er u n test b as é
Sn ,sur
d e la f or me (
ϕS,S X 1, . . . ,X n ) =1 ⇐⇒ Sn ∈S .
Pou r ch oisir entr e d eu x tests,
on con sid èr e leu rs r isqu
Deues.
x test d iffér ents n ’au r ont en
gén ér al
p as les mêm es r isqu Comme
es. d es r isqu es sont d es pr ob ab ilités de se tr omp er (de
p r en dr e de mau vaises d écision s), d es d eu x tests on pr éfèr era celu i d ont les RT1 et RT2
plu s p etits. De man ièr e plu s gén ér ale, p ou r un pr ob lème de test don né, on sera tenté de
p ar mi tou s les tests p ossib les celu i d ont les r isqu es de typ e 1 et de typ e 2 sont p lu s p e
ceu x de n ’imp or te auqu tr
ele test.
Un e telle ap pro ch e bu tte su r la non -existen test
ce d’u n tel
d an s les situ ation s qu i pr ésentent un intér êt. Pou r se r en d re comp te de cette n on -exist
p eut considérer l’exemple suivant.
E xe mp lOn e: re pre nd l ’exemp l e précé de nt da on ns
s ’in
l eqtéres
uel se à la valeur de la pro-
p ortio n θ de ménag es français ayant un accès à internet à do micile, à pro p os de laquelle on
1
0 : θ ≤ 2 co nt reH
s o uhaite tes terH 1
1 : θ> 2 . Pu i s quneT = n1 ni=1 X i , la pro p ortio n de
ménag es de l ’échantillo n ayant un accès à internet à domicile, a tendance à être pro che de
1
θ , on s ’atte nd à ce queT
n prenn e un e va l eu r si g ni fi ca ti vement pl 2 si
usHg1 ra
estnd e que
vra i e. Par co n s éq u en t, o n p eu t ch oTi s(ensemblei r u n en sde emb
valeule rs pro bables n p o urT
l ors qu 1eHes t vra i e) de l a T =]12 + d,1], où d est un no mbre que l’o n se do nne. Ainsi,
forme
1
T =1 ⇐⇒ Tn > 2 + d; il co nsiste à rejeter l’hyp o thèse que la pro p ortion
l e tes t esT,tϕ
d es ménag es françai s ayant i n tern et es t pl12 us l orsque
p e ti tecette
quepro p orti o n, o bservée
1
s ur l ’échanti ll o n, es t si g ni fi cati vement 2pl. Po us urg rande
cho isirqued, il est raiso nnable de
retenir la valeur p o ur laquelle les risques du test c orresp o ndant sero nt les plus p e tits p o ssib
1 1
Po ur un cho ix de d donné, le RT 1 es tP H 0 (Tn > 2 + d) et le RT 2 es tP H 1 (Tn ≤ 2 + d).
Il est facile de vo ir que p o ur diminuer lefaut RT 1chil o is ir de g ra nd es val eu al ors
rs de d,
q ue p o u r d i mi n u er lfa e ut
R Tch2o , ilis ir de p e ti tes val eu Il es
rs tde
dod. nc im p os si bl e de
c ho is ir d de mani è re à mi ni mi s er si mul tanément Au l estrement
deux ri sdisoques.
t, ie ntd1
1
e td2 d eu x ré el s tel 0s <d
q ue1 <d 2 < 2 . On co ns id è re le te st da ns
o n
lere
qu jeel
tteH
0
> 12 + d1 ai ns i qu e le tes t da ns l eq uel o0 n
l ors qu neT l ors
rejequeT
tteH 1
n > 2 + d2. Le RT1
d u premi er tes t s e ra pl us g rand duqu seeco
celnd
ui, al ors qu e so n RT 2 se ra pl us p et it.
Cet exemp le montr e qu e d an s un cas p ar si ticu
onlier,
s’intér esse à d es tests b asés sur
u ne statistiqu e d on n ée (la statistique
Tn mesurant la prop ortion dans l’échantillon),
ayant une
for me d on n ée (le test H r 0ejette
lor squ e la statistiqu e pr en d un e valeu r p lu s gr an de qu ’u n ce
seu il) alor s il n ’existe p as de test ayant d es r isqu es p lu s p etits qu e les au tr es tests. Un r
p lu s gén éral
montr e qu e c’est égalem ent d le ès
cas,
qu ’il
existe un évèn em entest quip ossib le
(d e prob ab ilité n on nu lle) n on seu lement H 0lorsque
est su pp osée vr aie mais au ssi lor H 1 sque
10. Cela montr e qu e les cas d an s lesqu
es t vr aie. existe
els ilun test d ont les d eu x r isqu es sont
min imau x sont d es cas d an s lesqu els les hyp oth d éfi
èsesn issent
qui le pr ob lème de test sont
tellement dissemb lab les qu ’on p eu t tr ou ver des évèn ements imp ossib les selon l’u ne des
hyp oth èses alor s qu ’ils sont cer tain s selon l’au tr11eDe hyptels
othèse.
cas s ont p eu f r éq u ents et
san s intér êt pr atiqu e.
L’ap pr o ch e usuelle utilisée p ou r lever cette in déter min ation qu i p or te su r le ch oix d
10
La p reu ve de ce résu ltat est d on n ée à la fin de ce ch ap itre
11
Il ap p araît d an s la p reu ve du résu ltat mention né qu e les tests min imisant les d eu x risq u es sont n écess
des tests p ou r lesq uels ces risq ues sont nu ls. Les hy p othèses sont tellement dissemb lab les, et don c recon nai
l’u ne par rap p ort à l’au tre, qu e la prob ab ilité de se tromp er est tou jou rs nu lle.
21
Jer zyNe ym an
(1894-1981)
Egon Pe ars on(1895-1980)
Fig. 1.1 –J. Ne ym an

et E. Pe ars on
à partir des RT1 et RT2 a été prop osée par J.Ne ym anet E. Pe ars on (voir fi gu re 1.1).
Cette ap pr o ch e con siste à s’assu rer qu e p ou r un pr ob lème de test don né et p ou r tou t
envisagé p ou r le r ésouledrRT1 e, de ce test ne d ép asse p as un e cer tain enotée
valeuα r,
et
ap p elée ni v eau d u tes t.Sou s ce tte condition
, on p eu t alors ch erch er d es moyen s de r en dre
le RT2 le p lu s p etit p ossibLa le.contr ainte quiimp ose qu e le RT 1 d ’u n test,
d e la f or me
ϕ(X 1, . . . ,X
n ) =1 ⇐⇒ Tn ∈T , ne d ép asse p as le n αiveau s’écr it
P H 0 (Tn ∈T ) ≤ α. (1.1)
Pou r un niveau
α, tou t test satisfaisant l’in égalité ci-d essu s est apde
te st p elé . Pu is que
niv eauα
p our tout problème de test d’une hyp H othèse
0 contr e un e hyp oth
H 1èse
on d oit se d on n er u ne
valeu r p our
α et u tilis er u n test d e n α,
iveau
on d it qu’
on te steH
0 contreH1 au ni v eauα.
On voit alor s qu e si le n iveau
α est fi xé, p ou r tou t test il existe d es ch
T oix
qu ide
ne sont
pas au tor isés car ils con du ir aient à un e violation de la contr ainte imp osée par l’in égalité (
On note qu e dan s l’ap pro ch e de Neyman -Pearson,
on ne ch oisit p as d ir ectement
T , mais on
fi xeα d’ abord
,et e nsu ite
on ch oisit
T de man ièr e qu e (1.1) soit satisfaite.
Le ch oix de
α reste arbitraire. Il convient cep endant de noter que d’après la contrainte (1.1),
α r ep r ésente la valeu r maximale qu e le RT 1 ne d oit p as d ép asser . Un r isqu e étant un e
de se tromp er, on sou haite en gén éral qu e cette prob ab ilité ne soit pas Au trop
ssi délevée.
ans
la pr atiqu e cou r ante d es tests, on r etient
α lespvaleu
our rs « stan d ard » 0,1, 0,05 ou 0,01.
E xe mp lOn e: reprend l ’exempl e précédent dans l equel on s ’i n téres se à la val eur de la pro p or
ti o n de mé na g es fra nç ai s aya nt un ac cè s à i n te rn et à do mi ci l e. En s ui va nt ce qu i a é
, 05 H 0 : θ = 12 co nt reH
=0veauα
u ti li sera p o ur tes ter au ni 1
1 : θ> 2 u n te s t d e l a forme
22
ϕ(X 1, . . . ,Xn ) =1 ⇐⇒ Tn ∈ ]12 + d; 1]. La rég io n c ri tiT que ]12 + d; 1]et
e s t d e l a forme
c h o i s i r u n te s t p o u r d é0cietH
d er
1 revi
en treH
ent à cho is ir la val eurSide o nd.ve u t q ue
l a co ntrainte (1 .1 ) p ortant sur le niveau so it faut
satisque fai te,
l ’oiln ait
P H 0 (1 ≥ Tn >d + 12 ) ≤ 0, 05 (1.2)
1
o u enc orePH 0 (Tn >d + 2 ) ≤ 0, 05 pu i s qu ne,T étant une pro p ortio n, on a to nujo ≤ 1ursT
.
On ra p p el l e q u e l a n H0oindique
ta ti o nP
que le calcul de pro babilité do it se fai re en supp o s ant
a u tre me n t d i t en s u p p o=s 12a, nou
H 0 vra i e, t qenu ceθore qu eX ∼ B ( 12 ). Ave c ce tte
s upp o sitio n, la lo i co mmune 1 , . . deX
. ,Xn es t é vi demme B (θnt) et il es t fa ci le d ’en dédu i re
1 n 1)
l a loideTn = n i =1 X i , quin o u s p e rm e ttra d e H c 0a(Tlnc>d
u l+ e rP
2 p o ur n’i mp orte
q uel le val eu r de d. E n e ffet
n n
P H 0 (Tn >d + 12 )= P H 0 ( n1 X i >d + 12 )= P H 0 ( X i >nd + n2 )
i =1 i =1
n
=1 − P H 0 ( X i ≤ nd + n2 )
i =1
n
On s ai t qu e 0siHes t vra i e,X
1, . . . ,X B ( 12 ) et do nc i =1 X i ∼ B (n; 12 ). Ai ns i la
n so nt iid
n
( i =1 X i ≤ nd + 2 ) est ég ale à la fo nctio n de répartitio n de la lo i binô miale
pro ba b i lHi 0téP n
d e p aramètres n12 ,et éva l u ée en+nd n

2 . Cette fo nctio n est parfai tement co nnue et cette
pro babilité p eut do nc être calculée p o ur n ’imp orte quelle Novaleur
to nsb(n,de
1 ) d.
2
ce tte
fo nctio n. Dans ce cas, p o ur que l ’inég alité (1 .2 ) sofaitusatisfaite,
t q ue il
1 − b(n, 1 ) (nd + n2 ) ≤ 0, 05
2
(n, 12 ) (nd+ 2 ) ≥ 0, 95. Il fa u t d o n c ch o i s i r d d e ma +nn2 isère

n
o u enc oreb o itqsuup
e nd
é ri eur
1
o u ég au
al q u an ti l e d ’ord re 9 5 % B (dn,e2l).aOn
l oico n s ta te d o n c q u e to u tes l es va l eu rs
d e d ne so nt pas autori sonées veutsi qu’un test de la forme retenue ai t un ni veau 0 ,0 5.
Cep endant, même si la co ntrainte (1 .2 ) sur le RT 1 du test e xclut certaines valeu rs de d, elle n
p ermet pas d’en déterminer une de manière unique. Pour fa utcela,
ma i iln tena nt co ns i dérer
l e R T 2:p armito utes les valeurs de d p o ur lesquelles la co ntrainte (1 .2 ) on est satis fai te,
c ho is i ra cel le p o ur l aq uel le le R T 2 es t le pl us fa i bl e.
Pou r un pr ob lème de test et un n αiveau
d on n és,
s’il exis te u n tes t d e n iveau
α ayant un
RT2 p lu s p etit qu e celu i de n ’imp or te qu el au tr eα, test
on de
d itnqu
iveau
’il est
u niformé me nt
(UP P ) au n iveau 12
le plus pu i ssant α. La r ech er ch e de test UPP p ou r un pr ob lème de test p osé
est la r ech er ch e d ’u n in str ument de r ésolu tion du pr ob lème dont les pr op r iétés sont o
L’op timalité est d an s ce cas d éfi n ie p ar le n iveaud umin
RT imal
2,comp te-tenu de la b or ne
su p ér ieu re (la valeur
α) imp osée au RT 1.
Mention n on s fin alement qu e p ou r les pr ob lèmes de tests qu i sont fr équ ement p osés
p as de test UPP.Le pr ob lème du ch oix du meilleu r (en ter mes de r isqu es) test est à n ou vea
p os é.
Pour p ouvoir y rép ondre, on restreint la famille des tests au sein de laquelle on cherche
le m eilleu Les
r. r estr iction s se font en imp osant au x tests
ser ont
quiéligib les de satisfair e un
cer tain n omb re de b on n es pr op riétés. Par mi celles-ci, la con d ition d ’ab sen ce de b iais e
im p osée.
D’u ne man ière un p eu vagu mais
e,quiser a pr écisée p ar la su
l’absen
ite, ce de b iais
dan s le cas de tests est un e pr op riété qu i p or te su r les risqu es ; un test san s biais est un
lequel la pr ob ab ilité de ch oisir un e hyp oth èse don née est plu s gr an de qu an d cette hyp
12
La termin ologie v ient de la d éfi n ition dessance
pui la d ’u n test, d éfi n ie comme 1 − RT2. Si un test est U PP,
son RT2 est min imal et d on c sa pu issan ce max imale, d ’où la qu alifi
pluscation de
.
pui ssant
23
su pp osée vr aie qu e lor squ’elle est su pp osée fau sse (la pr ob ab ilité de pr en dr e un e b on
est p lu s gran de qu e la prob ab ilité d ’en pren dre un e mau vaise).
T héorème 1 Soit un prob lè me de te st dé fini par u ne hypothè 0 etse

u ne
nu hypothè
l leH se al-
te rnati v eH
1. U ne condition néce ssaire pou r qu ’il e xiste un te st ayant des RT1 et RT2 infé rieu
à ce ux de n’i mporte qu el le au tre te steexiste
st qu
un’ilév è ne me nt A dont la probab i lité v au t1
lorsq u eH
0 e st su pposée v raie, et 0 lorsq
1 e ueH
st su pposée v raie.
: Su pp oson s qu ’u n tel test existe et ϕn∗.oton
P re u ve S ons-le
RT 1 estP H 0 ϕ (X 1, . . . ,X
∗
n ) = 1.
Pu isqu e son RT 1 est in fér ieu r à celu i de n’imp or te qu el au tr e test, il est en par tic
in fér ieu r au test nϕ0oté et qu i con siste à tou jou rs accep H 0, i.ter
e., ϕ0(X 1, . . . ,X
n )=
0, ∀X 1, . . . ,X
n . O r p u is qu n ’il
e r ejette jam ais
H0 , le RT 1 de ϕ0 est nul( ϕ0 valant
toujou rs 0, la probabilitéϕque 0 vaille 1 est nu lle). Le RT ϕ1∗de
vau t 0, pu isqu e c’est un
n omb re p ositif qu i d oit être in férieu rϕau 0. Don
RT1 cPdeH 0 (ϕ (X 1, . . . ,X
∗
n ) = 1) =0,
ou en coreP ( ∗(
H 0 ϕ X 1, . . . ,X n ) = 0) = 1. On intr o du it à pr ésent ϕ1 test
le qu i con siste
à tou jou rs r ejeter H 0, i. e., ϕ1(X 1, . . . ,Xn ) =1 , ∀X 1, . . . ,X n . Le RT 2 deϕ1 est nul
et p ar un r aison n ement semb lab le au pr onécéd
doit ent,
avoirPH 1 (ϕ∗(X 1, . . . ,X n )=
0) =0. Défi n isson s alor s l’évèn A ement
comme étant « Les ob servation s sont telles
qu ’on accepHte 0 avec le test
ϕ ∗ », ou en core = {X
A 1, . . . ,Xn | ϕ (X 1, . . . ,X
∗
n ) =0 }.
D’apr ès ce qui précèd e on voit que la probabAilité calcudelée en su pp osant H 0 vr aie
vau t 1, tan d is qu e lor squ ’elle est calcu lée enHsu 1 vraie,
pp osant
elle vau t 0.
1.3.3 E st imat ion par région de confiance

Plu tôt qu e d ’ap pr oximer
θ p ar un e seu le valeu r (l’estimation p on θctu
) com
elleme
de on l’a
f ait à la section 1.3.1,
on p eu t vou loir con struire, en utilisant les don nées de l’éch
uneantillon,
p artie (ou un e r égion ) de Θ ayant un e gran de prob ab ilité de conten ir la valeu θ. r in con nu e
Dan s le cas où θ est un id imen sion n⊆el (Θ
), on
Ê
r ech erch e sou vent cette p artie sou s la forme
d ’un intervalle. L’ob jectif d ans ce cas est de trouver une fourchette de valeurs ayant de grand
ch an ces d ’en cad rer la valeu r in con nu e du θ. p aramètre
Dan s un e d émarch e de r ech erch e d ’u ne telle p artie de Θ, on se d on ne un e prob ab i
q u ’on n ote1
−α (α est don c p etit), et on ch erch e à ob ten ir en utilisant un X 1éch
, . . .antillon
,X
n
u ne r égion de Θ, n otée
(
G X 1, . . . ,X
n ) telle que la probab ilité que
(
G X 1, . . . ,X
n ) contien ne la
valeu r in con nu e du p aramètre
θ est d ’au moin − s1α, quelle que soit cette valeu r in connu e:
P θ θ ∈G(X 1, . . . ,Xn ) ≥ 1 − α, ∀θ ∈ Θ (1.3)
On n ote d an s l’in égalité ci-d essu s qu e la pr ob ab ilité estθ. ind

Laexée
r aison
p ares t qu e la
r éalisation ou n on de l’évèn ement
θ ∈ G(X 1, . . . ,X n ) dont on calcule la probabilité dép endra
d es réalisation d es var iab
X 1les
, . . . ,Xn . Par con séqu ent,la prob ab ilité d ’un tel
évèn ement
ser a calcu lée à p ar tir de de
la Xloi1, . . . ,X
n . Or cette dernière dép end précisément θ. Par
de
conséquent, la valeur de cette probabilité dép end également de la θ. valeur de
L’in égalité (1.3) s’inter pr ète de la man ièr e su
Onivante.
ne conn aît p as la vraie valeu r du
p ar am ètre
θ. On se p lace alor s d an s l’hyp oth èse qu est
e celle-ci
θ0. L’in égalité (1.3),
vérifi ée
p our toute valeur du paramètre, s’écrit dans ce cas (1.3)
P θ0 θ0 ∈G(X 1, . . . ,X
n) ≥ 1 − α
24
Cela se r efor mu le ain si : la pr ob ab ilité, calcu lée lor squ e la valeu rθdu
0, ppou
ar ramètr
que e est
la régionG contienne la b onne valeu r (à s θavoir
0) du p ar amètr e est d ’au moin− αs1
. Ceci
étant vr ai qu elle qu e soit la valeu r qu ’on su pp ose p ou rθ,lel’in
p aramètre
égalité (1.3) d it que
la probabilité p ou r que
G contien ne la vraie valeu r (in con nu e) du p aramètre est au moin s égal
à1 − α, quelle qu e soit cette vraie valeu r.
Définit ion 1 On appel le région de confiance de 1−α

niv pou (X 1, . . . ,Xn )
eau r θ tou te partieG
1
pou r laq ue l le l’i nég alité (1.3) e st satisfaite . −α
On le
appe le de confiance(XdeG
ni vl eau 1, . . .,
X n ).
Con stru ire un e région de con fi an ce con siste à d élimiter d an s l’en semb le Θ d es valeu
sib les du p ar amètr e un e r égion d an s laqu elle se tr ou ve la vr aie valeu r avec un e gr an d
(1 − α). Étant d on n ée cette d émarch e, il ap p araît n atu r el de préférer p armi d eu x r égion
le même n iveau de con fi an ce, celle qu i est la p lu s étroite, l’id ée étant qu e la région la p lu
est la p lu s in for mative su r la vr aie valeu r du p ar amètr e.
Bien qu ’on ne for malise p as cette id ée, on p eu t facilement en voir la r aison à tr aver s l’
su ivant. Su pp oson s qu e le p ar amètr θesoit d ’intér
la prob
êt ab ilité d ’u n évèn ement d on né (p ar
exemple la pr ob ab ilité qu ’u n mén age ch oisi au hasar d disp ose d’u ne con nexion à inter n
d om icile).
Dan s ce cas, on a par construction Θ = [0; . On
1] a évid emm entP θ(θ ∈ [0; 1]) =1 ,
∀θ ∈ Θ et il est d on c clair qu e p ou r
α∈tout
[0; 1]
, la régionG = [0; 1]s atisf ait la con d ition
(1.3).L’intervalle [0; 1]est d on c un e r égion de con fi anθceaupniveau1
our − α. Cep endant
on voit b ien qu e tou t en p osséd ant un n iveau de con fi an ce ,au
i . e.aussi
ssi hpro
au ch
t( e de 1)
qu ’on le sou h aite,
cette r égion coïn cid e avec l’en semb le d es valeup rs ossib
a priori
les p ou r la
p rob ab ilité
θ et n’ap p orte don c au cu ne in formation su r la vraie valeu r du paramètre, au tre q
celle d ont on d isp osait d éjà, à savoir qu e le pθ,arétant
amètre
une prob abilité, sa vraie valeur
est n écessair ement d an s l’inter valle [0; 1].
Un au tr e exemp le p er mettant d ’illu str er la même id ée est Su le
ppsuoson
ivant.s qu e p our
u n p ar amètre θ et un n iveau de confi ance d on − αné1
n ou s soyon s p arvenu s à con stru ire une
r égion de con fi an ( ce
G X 1, . . . ,X n ). Il est clair qu e tou te p ar tie de Θ contenG(X 1ant
, . . . ,Xn )
est également un e r égion de con fi an ce de − αnpiveau1
ourθ. En effet, p ou r tou te p Gartie
′ de
Θ telle queG(X 1, . . . ,Xn ) ⊆ G , l’évèn ement

′
θ ∈ G(X 1, . . . ,Xn ) imp liqu e l’évèn ement
θ ∈ G′
et d on cP θ θ ∈ G ) ≥ P θ θ ∈ G(X 1, . . . ,X
′
n ) . Comme la p lu s p etite d es d eu x prob ab ilités est
su p ér ieu re ou égale −à1 α p our toutθ ∈ Θ, elles le sont tou tes les d eux. Par con séqu ent,
′ satisf ait la con d ition (1.3).
Cep endant, si le niveau de confiance requis est − αde1
, p ar mi
G
les d eux régions G et G ayant ce n iveau,
′ on pr éfèr era G à G , p u isqu ’avec u n m êm e n iveau
′
d e confi ance,et tout en étant contenu e dans G ′ , la région d élimite d an s Θ un en semb le de

G
valeu rs p ossib les pθour p lu s étroit que G ′ . La région
G est d on c p lu s in formative G′queà
prop os de la vraie valeur du paramètre θ.
I N CO MPLET - EN COURS
b l a- b la -b la
Dan s le cas d ’u n intervalle, G(X 1, . . . ,X
n ) est car actér isé p ar ses 2 b or n es qu ’on n otera
(
A X 1, . . . ,X
n ) et (
B X 1, . . . ,X
n ), d e sor te que
G(X 1, . . . ,X
n ) =[ A (X 1, . . . ,X
n ),B (X 1, . . . ,X
n )].
Pou r alléger la n otation , on écrira Gn =[ A n ,B n ]. Noton s que A n et B n sont d es variab les aléa-
toir es.
Pou r un intervalle don né, on p eu t calcu ler la prob ab ilité qu’il contien ne la valeu r in con
25
θ :P( A n ≤ θ ≤ B n ). C ette prob ab ilité sera d on n ée à p artir de la loiA ndu ,B cou
n ). Cpomle( me
A n et B n sont d es variab les aléatoires qu i sont fon X ction
1, . .s. de
n , la loi de(A n ,B n ) sera
,X
elle-même ob tenu e à p ar tir de X la. loi
C elle
de est
F ( · ; θ) et dép end de la valeur du paramètre
θ. Par conséquent, la probabilité que l’on cherche à calculer dép end de cette valeur. On notera
d onc cette probabilitéP 13
θ(A n ≤ θ ≤ B n ).
L’inter valle
I n est d estin é à fou rn ir un en cad r ement pr ob ab le de la valeuθr. incon nu e d
Par con séqu ent,A n et B n ne sont p as ch oisis ar b itr air ement, mais de man ièr e qu e la prob ab
P θ(A n ≤ θ ≤ B n ) soit gran d e, et ce qu elle qu e soit la valeu r pθossib
. Pou rlecela,
de on se fi xe
u n n ombre α dan s [0, 1] et on ch erche
A n et B n d e sor te que
P θ(A n ≤ θ ≤ B n ) ≥ 1 − α, ∀θ ∈ Θ (1.4)
Au trement d it, on ch erch e un intervalle

I n d ont la probab ilité de conten ir la valeu r in connu e de
θ est d ’au moin s1
−α , et ceci quelle que soit cette valeur in con nue.
Pour un choix d on néα,de
tou t intervalle
I n =[ A n ,B n ] qu i satisfait (1.4) est ap p elé inter valle
d e confi ance pθour
de niveau1− α.
S i on veu t qu ’u n intervalle ait un e prob ab ilité élevée θ ilde
fau
conten
t ch oisir
irα petit. Des
ch oix cour ants sont
α =0 , 05 ouα =0 , 1. Ain si,avecα =0 , 05 tou t intervalle
I n satisf ais ant
(1.4) a un e prob abilité de 95% de conten ir la valeu r inθcon. nue de
13
Notons aussi que non seulement la loi de probabilité qui sera utilisée p our faire le calcul dép end de la valeur
in con nue
θ, mais aussi que l’évènement lui- même dont on cherche à calculer la probabilité dép end également de
cette même valeu r in con nu e.
26
C h ap i tre2
L e mo dèl e de régres si on li néai re

s im pl e : défini ti on et i nterprétati o
Dan s ce ch ap itre, on étu die un des mo dèles les plu s simples destin és à mo déliser et étu
la dép endance entre deux phénomènes dont la mesure s’effectue au moyen de variables notée
X et Y.
2.1 Le contexte et les ob jectifs
On supp ose que la dép endance entre les deux variables est orientée:la variab le
X « ex-
p liqu e » la var iab
Y . le
Dan s le contexte d’u n mo dèle écon omique, cette hyp oth èse est cou ran
E n effet,la plu part des mo dèles écon omiques distin gu ent les variab les en dogèn es des varia
exogèn es : le mo dèle décr it comment le niveau des pr emièr es est déter min é en fon ction d
d es secon dNotons
es. don c,
ain siqu e l’exp rime leu r qu alifiqu
catif,
e le mo d èle écon omiqu e ne
d it r ien su r la façon d ont se d éter min e les n iveau x d es var iables
On verexogèn
ra commes. ent
p ren dr e en comp te cette d istin ction faite au sein d es var iables d an s le contexte d ’u n mo
écon om étr iqu e.
Une façon simple de représenter la dép endance Y envers
de X con siste à p oser un e r elation
lin éaire entre les variabYles:
= aX + b. Dan s un e r ep r ésentation de ce typ e, la car actér isation
de la dép endance de la variable
Y envers la variabX, le c’est à d ir e la façon d ont les var iations
de X provo quent des variationsY,deest entièrement capturée par la valeur du co efficient
a. Il s’agit de prop oser un mo dèle statistique p er
quim ette le mêm e typ e de mo d élisation de
cette dép endance et p qui
er mette de l’étu d ier au moyen de tech n iqu es d ’in fér en ce statistiq
ap pr op riées. Le mo dèle le plu s simple est le mo dèle de régr ession lin éair e. Dan s un tel m
relation entre les variabXles
et Y est r ep r ésentée et car actér isée de man ièr e simp le, au moye
d ’u n p etit n omb re d ’éléments
con qui
stituent les
paramè tres du mo d èle (semb lab alesàet b
dan s l’égalité précéd ente). Les méth o des d’in féren ce dévelop p ées dan s le contexte de ce
ont p ou r bu t d ’ap pr oximer ces p ar amètr es à p ar tir d ’ob ser vationX et s
Y.d es var iab les
27
2.2 Heuristique de la construction du mo dèle
SoientX et Y deu x variab les aléatoires décrivant ch acu ne un ph én omèn e dan s un e p o
lation.On sélection npe,ar un pr o céd é su pp osé aléatoire 1,
n in d ivid us de cette p op u et
lation,
p our chacun on intro duit le couple de variables mesurant les deux phénomènes p our
étudiés:
e
le i in d ivid u, on n oter a ce cou
X i ,Ypi )le(
. En u tilisant la convention de n otation qu i d istin gue
les variab les de leu rs r éalisation s, onxni ,yotera(
i ) le cou p le d es valeu rs ob servées
X i et de
Yi .
On sou h aite r ep r en dre l’orientation d on n ée à la r elation entre les variab les (voir la se
p récéd ente). Pou r ch aqu e in d ividu i, la variab leX i est su pp osée d éter min er le n iveau de la
var iab Ylei . On ap p elle alors n variab les
X 1, . . . ,X e xplicati ves et Y1, . . . ,Y
n variab les e xpliqu ées
ou variab les dépe ndantes . Cette distin ction su r la natu re des var iab les est en gén ér al intr o du i
d an s la con str u ction du mo d èle statistiqu Dan s d e. an s la version la p lu s simp le du mo d èle de
r égr ession lin éair on e, su pp ose qu e les var iab X 1, les n sont n on -aléatoirDu
. . . ,X es.point de
vu e statistique, cela revient à dir e qu ’au sein du mo dèle écon om étr ique X 1, . les var
. . ,Xn iab les
sont fi xes d an s le sen s où les valeu rs pr ises p ar ces var iab les ne sont p as d istr ib u ées s
véritab le loi de prob ab2ilité. Elles ne p eu vent p ar con séqu ent qu ’êtr e simp lement égales à leu
ob ser vations n . Avec un e telle hyp oth èse,
x1, . . . ,x les variab les n sont d étermin ées
X 1, . . . ,X
par leu rs ob servation s et au cu n au tre comp ortement p ossib le p ou r ces variab les n’est a
deh ors de ce qu i est directement issu de l’ob servation , le mo dèle ne p ermet de détermin er
prop riété particu lière p ou r les variab X 1, . les
. . ,Xn . On retrou ve en cela la n otion de variab le
exogèn e qui existe dan s un mo dèle écon omique désign ant un e var iab le dont ou les
la valeu r,
prop riétés, sont détermin ées en deh ors du3 mo Dandèle.
s la su ite, on tr ad u ir a cette hyp oth èse
en u tilisant d an s la n otation les ob servations x1, . . . ,x n au lieu d es variab X les n elles-
1, . . . ,X
m êm es.
Avec cette hyp oth èse,
si on veu t un mo d èle statistiqu re ep
quir en ne l’id ée de b ase de la
dép endance linéaireYdeenversX, le mo d èle p ou rr ait p ar exemp le stip u exis
ler te
qud’iles
n omb res
β0 et β1 tels qu e la relation
Yi = β0 + β1xi (2.1)
est vr aie p ou r tou t in di.ividu

Les n omb rβes
0 et β1 sont d on c les p ar amètr es du mo d èle qui
p ermettent de caractériser la dép endance existe
qui p ou r ch aqu e in di ividu
entre xi et Yi .
L’hyp oth èse expr imée par la for mu lation (2.1) con du it imméd iatement à un cer tain nomb
com m entair es.
Pu isqu e le ter me de dr oite de l’égalité
Yi = β0 + β1xi es t fi xe,
il est clair qu e celui
de
gau ch e doit l’être au ssi. En su ivant le même raison nement que celu i qu e nou s avon s tenu
1
Contrairement à ce qu i a été présenté dan s les rap p els du ch ap itre précéd ent, on n’a pas b esoin ici de su p
q ue la sélection se fait p ar éch antillon n age aléatoire simple.
2
On p eut toujours considérer un n omb rez réel comme un e variab le aléatoire
Z en lui att rib u ant comme loi
de prob ab ilitéZP(= z) =1. D an s ce cas, la loiZden ’est p as un e « véritab le » loi de p rob ab ilité. On d it p lu tôt
q ueZ a un e loi de p rob ab ilité d égén érée. Un e variab le aléatoire a un e loi de p rob ab ilité d égén érée s’il ex is
nomb re réel r tel qu e la p rob ab ilité p ou r qu e la variab le soitr vau
égaleà
t 1.
3
Il est p ossib le,
en faisant ap p àella n otion p rob ab iliste de con d ition nd ement,
’écrire un mo d èle statistiq ue
d ans leq ules el variab les
X 1 , . . . ,Xn sont d es variab les aléatoires,
mais d ans leq ul’u
el tilisation d es métho d es
d ’in féren ce con du ira à d es résu ltats ayant la même interp rétation et le même u sage qu e ceu x qu e n ou s d é
d an s le contex te p lu s simp le utilisé ici.
28
les variab les n , les variab les
X 1, . . . ,X n doivent dan s ce cas avoir
Y1, . . . ,Y un e d istr ib u tion
dégén érée et ne p eu vent don c être égales à au tre ch ose qu e leu rs ob servation s. Le mo d
alor s stip u ler qu ’il existe d es nβomb 0 et βr
1 es
tels queyi = β0 + β1xi , ∀i =1 , .. . ,n.L’ob jectif
con sistant à tr ou ver d es ap pr oximation s d es β0petar
β1amètr
p eu tesêtre atteint d ’u ne man ière
tr ès simp le.
En effet,il su ffit d ’u tiliser (p ar exemp le) les 2 pr emièr es ob x ser
1,yvation
1) et s(
(x2,y2) p ou r d éd u ire la valeu β0 retde
deβ1.
C ep en d ant,d an s qu asiment tou tes les situ ation s r en contr ées on en con
pr atiqu
staterait
e,
qu e les ap pr oximation qu ’on
s, p eu t p ar exemp leβn0 oter
∗ et β1 , ain siob tenu es p ou r les deux
∗
p ar amètr es ne p er mettent p as l’égalité

d ’avoiryi = β0 + β1∗xi p our touti =1 , .. . , n.De
∗
man ièr e p lu s gén ér ale, il n ’existe qu asiment jamais β0 de

et βn1 tels
ombque
r es
yi = β0 + β1xi ,
∀i =1 , .. . , n.
Un exemp le simp le p er met d ’en illu str er la raison . Con sid éron s le cas d ’u ne étu de s
d an s laqu elle nlesin divid us sont des employés d’u ne ch aîn e de su p ermarch és o ccu pant de
p ostes similaires. Pour un individu i,X i d ésign e l’an cien n eté d an s l’emp loi (exp r imée en mois
et Yi le salair e men su el de cet in dSiivid on u.
ad op te l’hyp oth èse qu e p ou r tou it on in dividu
a yi = β0 + β1xi , alors tou s les in d ivid us ayant le même n omb re de mois d ’an cien n eté d oiv
n écessair ement avoir le te me nt le même
e xac salair e men su el. Or d an s la r éalité, cela n ’est jamais
le cas. Si à an cien n eté égale, d es in d ivid us p eu vent avoir d es salair es qu i d iffèr ent, cel
dire qu e d’au tres facteu rs qu e l’an cien neté p eu vent avoir un effet dan s la détermin ation
d u salaire. Dan s ce senless, n r elation s exp r imées p ar (2.1) sont in comp lètes (et ne p eu vent
rep résenter le ph én omèn e ob servé entre l’an cien n eté et le salaire p ou r tou s les in d ivid
D’u ne man ière gén érale, même si on sou haite mo déliser un e relation de forme lin éaire e
u ne var iab le exp licative et un e var iab le exp liqu ée en r etenant un e for mu lation semb la
il fau t in cor p or er dan s la mo délisation retenu e le fait qu e le niveau de la var iab le expliqu
p as exclu sivement d éter min é p ar celu i de la var iab le exp licative. Un e façon simp le de co
ch acu ne de ces relation s con siste à intro du ire des termes notés
n de man ière que
ε1, . . . ,ε
Yi = β0 + β1xi + εi , ∀i =1 , .. . ,n (2.2)
L’intr o du ction de ces ter mes d on ne lieu à l’inter pr étation Pou

su rivante.
tou t in d ividu
i, le
n iveau de la var iab le exp Yliqu
i seée
d écomp ose ad d itivement en d eu x ter mes:
1. Le ter meβ0 + β1xi qui trad u it l’id ée de d ép art d ’u ne relation lin éaire d an s laqu elle la
var iab le exogèn e explique la var iab le en dogèn e ; dan s la décomp
Yi , ce ter
osition
me estde
don c la part du n iveauYide
qu i est d éter min ée p ar laxvaleur
i de la var iab le exp licative
Xi .
2. Le ter meεi qu i trad u it le fait qu e la valeu
X i rne
ded étermin e p as à elle seu le le n iveau
de la variable dép endanteYi ; d an s la d écomp osition Yi , de
ce ter me est d on c la p ar t du
niveau deYi qu i est d éter min ée p ar d ’au tr es ch oses qu e la var iab X i . le exp licative
Avec la formu lation (2.2) et les interprétation s d on n ées ci-d essu s, on a trad u it l’id ée d
relation lin éair e d an s laqu elle un e var iab le en d éter min e un e au tr e, tou t en laissant la
à d es facteu rs au tres qu e la variab le exp licative d ’avoir un effet su r le n iveau de la variab
expliquée. Il reste cep endant à trouver un moyen de formuler l’idée que la variable explicative
joue un rôle prép ondérant dans la détermination de la variable expliquée,
et qu e les au tres
facteu rs d ont on r econ n aît l’existen ce n ’ont qu ’u n imp act négligeab le su r cette d er n iè
l’intér êt r este accessoir e.
29
Le fait qu e l’on ne s’intér esse p as à l’imp act qu ’ont ces facteu rs d an s la d éter min ation
n iveau de la var iab le exp liqu ée est tr ad u it p ar le fait qu e la façon d ont cet imp act s’exer
pas mo délisé, contr air ement à ce qu i est fait p ou r décr ir e le rôle de la var iab le explicative
p r écisément, d an s un e r elation telle qu e (2.2), on ne ch erche ni à id entifi er ce qu e sont c
facteu r ni
s, à mesur er ch acu n d ’entr e eu x au moyen deDe varp iab
lu s,les.
la man ière dYiont
dép endrait de ces autres facteurs n’est pas explicitement mo délisée. Cela est à contraster ave
le statu t de la var iab le exp licative, d ont (1) on d on ne la d éfin ition et la sign ifi cation en ta
var iab le, et (2) d ont on stip u le la façon d ont elle p eu t affecter le n iveau de la var iab le ex
(l’effet deX i sur Yi est tr ad u it p ar le ter
β0 me
+ β1X i ).
Le fait que l’imp act de ces facteurs sur la variable d ép end ante puisse être n égligé est tra
p ar un e n ou velle hyp othOn èse.
su pp oser a p ar la su ite qu e p our tou i, t in
endob
ividu
servant
q ueX i = xi on p eu t s’atten dr e à ce qu e la valeu r de la var iab leYi exp
soitliqu
β0 +ée
β1xi .
Cette hyp oth èse sign ifi e qu e les facteu rs au tr es qu e la var iab le explicative ne contr ib ue
rien à la valeu r à laqu elle on s’atten d p ou r la var iab le exp liqu ée.
Si on rep ren d l’exemple de la relation entr e l’an cien neté dan s l’emploi et le salair e, ce ty
d ’hyp oth èse r evient à su pp oserd qu
eu ex si
in d ivid us ont un e an cien n eté notée
id entiqu
x, e,
alors on p eu t s’atten dre à ce leu rs salaires soient égau x, bien qu e ob
ceuse
x rv
qunei seront
és le
soient p as n écessair ement. La valeu r commu ne atten du e p ou r cesβd0 + euβ1xx.salair es est
Il reste d on c à for mu ler math ématiqu ement au sein d ’u n mo d èle statistique for mellem
d éfi net
i, qui servira de cad re à l’in féren ce men ée su r les p βaramètres
0 et β1, l’ensemb le d es
hyp oth èses et inter pr étation s for mu lées ci-d essu s.
2.3 Défi n ition et

interp rétations
du mo dèle de régression li-
néaire simp le
2.3.1 Définit ion
Définit ion 2 Soie (ntX 1,Y 1), .. .,(X n ,Y n ) n cou ple s de v ariab le s aléatoire s dont le s ob se rv a-
ti ons sontnotées x1,y1), .. .,(xn ,yn ). Le modèle de régression linéaire simple (M RLS) deY
(
su r X e st un modè le statistiqu e dansleleq s conditions
uel su iv ante s sont satisfaites
C1. Le s v ariab le1,sX n ont u ne loi dégé né P(
. . . ,X X 1 = x1, . . . ,X
rée: n = xn ) =1
C2. Pou r tou ti=1 , . . . , n on pe ut éc rire l’e spé rance
i comme
deY u ne fonc tion affine de
xi :
∃β0 ∈ , ∃β1 ∈ , E( Yi )= β0 + β1xi ,
Ê Ê
∀i =1 , .. . ,n
C3. P ou r tou te paire

(i,j ) d’é lé me nts{1de , .. . ,n}, il e xiste un réel
stric te me nt positifσ
tel que
0
sii = j
cov(Yi ,Y j )= 
2 =j
 σ sii
Re ma rque1 Le mo d èle de régr ession lin éair e simp le con siste en l’en semb le d es lois de p
lité p ossib les p our
(X 1,Y 1), .. .,(X n ,Y n ) telles qu e les con d ition s exp r imées p ar les con d itions
C1, C2 et C3 sont vér ifi ées.Pou r dévelop p er des méth o des d’inféren ce dan s le contexte de ce
mo d èle, on su pp oser a qu e celu bien i-ci est i, fié
spéc c’est-à-d ir e qu e la loi de pr ob ab ilité d ont est
30
is su le2
n-u p let(X 1,Y 1), .. .,(X n ,Y n ) de var iab les aléatoir es est b ien l’u ne de lois du mo d èle.
Cette loi de pr ob ab ilité est d ésign ée p arv le raiter ,me
d an s le sen s où p armi tou tes les lois
e loi
con stitu ant le mo dèle, c’est celle qu i décrit la distrib ution de prob ab ilité des variab les aléa
d ont on ob servera les r éalisation s.
Par ailleu r s,
p ou r n ’imp or te qu elle de probab
loi ilité du mo d la
èle,
con d ition C2 imp lique
qu e con n aissantxi , on p eu t écr ir e l’esp ér anYice
comme
de un e f on ction affinxei . de
S ous
l’hyp oth èse qu e le mo d èle est b ienceciestsp écifiau
é, ssi
vr aien p articu lier p ou r la vraie loi.
Dan s ce cas, les n omb r es p qui
ermettent d ’écrir Yei )E(comme un e f on ction affinxie sont de
notésβ0 et β1. On ap p elle ces n ombr es v ale du es
v raies rs p ar amètr
β0 et
esβ1. C es vraies valeu rs
sont in con nu es et le mo d èleci-d d éfi
essu
ni s con stitu e le cad re d anseront
s lequdelévelop p ées
des méth o des d’in fér en ce statistique p er mettant d’estimer ces vr aies valeu rs.
La d éfi n ition ci-d essu s ad met un e d éfi n ition équ ivalente, qui for malise la r elation (2.
qu e les r em ar qu es qu ’elle a su scitées.
Propriét é 1 Soi e(X nt1,Y 1),..., (X n ,Y n ) n cou ple s de v ariab le s aléatoire s dont le s ob se rv atio
sont (x1,y1),..., (xn ,y n ). O n dé finit le s n v ariab le s aléatoire
1, . sε n parε i ≡ Yi − E( Yi ),
. . ,ε
i =1 , . . . , n . Le s conditions
C1 à C3 sont satisfaite s si et se u le me nt si le s conditions su iv antes
le sont au ssi
C′ 1. La condi ti on C1 e st satisfai te
C′ 2. ∃β0 ∈ , ∃β1 ∈ , Yi = β0 + β1xi + εi ,
Ê Ê
i =1 , .. . ,n
C′ 3. E( εi ) =0 ,i =1 , ... ,n
C′ 4. ∃σ ∈ ]0, +∞ [,
 0 sii = j
cov(εi ,ε j )=  ∀i,j =1 , .. . ,n
2
 σ sii = j
La preuve de cette prop osition est obtenue à partir de la définition des εvariables n et
1, . . . ,ε
d es égalités su ivantes, ob tenu es en su pp osant
′ 1 vrC1
aie:
ouC
E( εi ) = E(Yi ) − β0 − β1xi
cov(εi ,ε j ) = cov(Yi ,Y j ) (2.3)
Il est don c p ossib le de défi nir in différ emment le mo dèle de régr ession lin éair e simple
les cond ition s C1 à C3 ou p ar les cond itionsC
′ 1 àC ′ 4. C es d er n ièr es sont p lu s fr équ emment
u tilis ées.
2.3.2 Int erprét at ions

La con d ition C1 for malise le fait qu e les var
X 1,iab
. . .les
n sont les var iab les exp licatives
,X
d an s la relation entre
X et Y, et sont con sid ér ées comme fi xes (voir les comm entair es faits à ce
prop os dans la section précédente)
Dan s la con d ition C2 l’esp éranYicep de
eu t s ’interpréter comme la valeu r atten Yi .du e de
Par con séquent, l’égalité expr imée dan s C2 in dique qu e p ou r chi, aqueen obinservant
dividu le
niveauxi de sa var iab le exp licative,
on p eut déduire la valeur attendue de sa variable dép en-
dante,d on n ée pβ0ar
+ β1xi . C ette valeur atten du Y ei de
est d on c un e fon ction lin éaire de la
31
var iab le exp licative. Il est imp or tant de n oter qu e les d eu x n omb r es qu i d éfi n issent ce
sont les m êmes p ou r tou s les in d ivid u s.
C3 est un e con dition qu i n’est pas fon damentale dan s la mo délisation : elle ne cap tu re
des éléments qu i ont motivé la con struction du mo dèle, décrits dan s la section précéd ente. C
condition p ermet, tout en préservant les caractéristiques essentielles de ce mo dèle, d’en prop
u ne ver sion tr ès simp le su r le p lan statistiqu e. De ce p oint de vu e,Yila
,Ycon
j ) =d0 ition
si cov(
=
i j in d iqu e qu e les var iab les exp liqu ées relatives à d eu x in d ivid us d istin cts sont d es
aléatoir es n on -cor r L’ab
élées.
sen ce de corr élation entre d eu x variab les équ ivau t à l’ab sen ce
toute dép endance de forme linéaire entre ces variables.
,Y i )= σ2 ∀i =1 , .. . , n,qu i équ ivau t évid emment
Par ailleu r s, la con d itionYicov( Yi )=
à V(
2
σ ∀i =1 , ... , n,imp ose au x var ian ces n variab
d es les aléatoires i de ntiqu.4es
n d ’être
Y1, . . . ,Y
C ette pr op r iété est aphomoscédasti
p elée .c i té
Les ter m es n ont la même inter pr étation qu e celle
ε1, . . . ,ε enqui
a été d on n ée d an s la
section pr écéd ente (voir le p oint 2 à la p age La con
29).d itionC′ 3 qu ’on imp ose à ces ter mes
p our définir formellement le mo dèle traduit les remarques qui ont été faites précédemment. D
la con d itionC′ 2 on r econ n aît qu e d es facteu rs d istin cts de la var iab le exp
X i p eulicative
vent
affecter le niveau de la variable dép endanteYi . C es facteu rs sont mesu r és p ar la var εi . iab le
Cep endant, on s’attend à ce que, compte tenu du niveau de la variable explicative, ces facteur
n e jou ent au cu n r ôle d an s la d éterminYi : laation
con de
d itionC
′ 3 imp ose qu e la valeu r atten due
de εi est nu lle, c’est-à-d irεie) E(

=0 .
On ap p elle la variab le aléatoire
εi te rme d’e rreasurso cié xà( i ,Y i ) ; on n otera
ei la r éalis ation
d e cette variab Cette
le. termin ologie trad uit le fait qu e dan s le mo dèle de régression lin éaire
simp le, si con n aissant
xi on essaie de pr évoir la valeuYi , rlade
pr évision ser ait Yi ),
E(c’est-à-d ire
+ 5 Par con séqu ent, l’er r eu r de pr évision qu i est faite E( est
) c’est-à-d ire
β0 β1xi . Yi − Yi , εi . Ce
terme ap p araît d oncomme
c ici un terme d ’err eu r. On n ote in cid emment qu e la′ 3con d itionC
équ ivau t à ce qu ’on s’atten de à ne p as fair e d ’er r eu r de pr évision.
Il est à n oter qu e contr air em ent au x var iab les exp licatives et exp liqu ées, on ne d isp o
d es ob servation sε1de n . C omme on l’a d éjà mention né d an s la section pr écéd
, . . . ,ε les ente,
termes d ’err eu r sont d estin és à cap tu r er l’effet de tou s les facteu rs qu i en d eh ors de la
ex p licative,
p euvent avoir un impact sur le niveau de la variable dép endante. Cep endant, la
mo délisation retenu e n’id entifi e pas explicitement ces facteu rs et on n’intr o du it pas de var
bien défi nies, et bien id entifi ées dan s la pr atique, p er mettant de les mesur εi n er
’est. La var iab le
p as d éfi n ie p ar au tre chεose i = Yque
i − E( Yi ). C omp te tenu de cela et de la con d ition C2 qui
im p ose YE(
i )= +
β0 β1xi , on voit qu e p ou r con n aître la evaleur
i p r is e pεiar
, il n ’y a d ’au tre
moyen qu e d ’u tiliser la foreimu = yle
i − β0 − β1xi . Or le memb re de droite ne p eu t être con nu
p u isqu e les vr aies valeu
β0 etrs β1 d es p ar amètr es sont in con nu es.
S up p oson s qu e les r éalisation
ε1, .s. den sont ob ser vées.
. ,ε Pu isqu e p ar d éfi n ition,
ona
ei = yi − β0 − β1xi p ou r tou t in d ividu
i et qu ’on ob ser ve évid emment
xi et yi p ou r tout
i ,on
p ourrait p ar simp le résolution d ’un système linéaire
n équ ation
de s (u ne p ou r ch aqu e in d ivid u)à
2 in con nues(
β0 et β1) déd uir e la valeu r des paramètr es du mo dèle. Dan s ce cas, la con str uct
4
De plus, cette même condition imp ose à ces variances d’ex ister. Même si ce problème ne sera pas ab ordé par
la su ite,l’hy p othèse d’ex isten ce des varian ces a un e imp ortan ce dan s le traitement statistiq ue du mo dèle défi
ci- dessu s.
5
On assimile ici la prév ision à la valeu r atten du e. Il est p ossib le de ju stifi er cela su r le plan th éoriq ue.
32
du mo dèle de régr ession lin éair e et les méth o des statistique qu i lu i sont asso ciées n’ont p
r aison d ’êtr e. Ce qu i su it n ’a d on c d ’intér êt qu ’en su
e1, pp
. . .osant
n sont
,e que
in con nu es.
On r ap p elle qu ’on p eu t interpréter la Yi =
r elation
β0+β1xi +εi com me un e d écom p osition de
Yi en « p ar tie exp liqu éexi »p+ar« p ar tie n on exp liquxiée », plaar
pr emièr e étant
β0+β1xi et la
secon de εi . Intuitivement, la capacité de la variable explicative à expliquer la variable dép endant
ser a d ’au tant meilleu re qu e l’écar Yi et
t entre
β0 + β1xi a ten d an ce à êtr e p etit. Si on mesu re cet
2 2
écar t p ar ( + )
Yi − β0 β1xi , la valeu r atten du e est − β0 − β1xi )2 =E Yi − E( Yi )
Yi E( =
2
V( Yi )= σ . C ela p er met d on c d ’inter pr éter le pσ ar comme
amètre un e m esu re de la cap acité
d e la var iab le exp licative à p lu s ou moin s b ien exp liqu er à elle seu le le n iveau de la var
ex p liqu ée.
Le p ar amètre β0 s ’interprète comme la valeu r atten Ydu i lor
e desque xi =0 . On ap p elle ce
p ar am ètre
interce ,ptou or don née à l’or igin e, p ou r un e raison exp osée ci-d essous. Le par amè
β1 a p lu sieu rs inter pr étation s p ossib les et équ ivalentes.
– C on sid ér on s d eu x in d ivid us statistiqu
i et j et sues pp oson s qu e l’on obxiser et xve
j de
sor te que xj = xi +1. On au ra alors Y E(
j ) − E( Yi )= β0 + β1(xi +1) − β0 − β1xi = β1. On
interprète d onc β1 comme la d iffér en ce entr e la valeu r atten du e de la var iab le exp liqu
p our un individu quelconque i et la valeu r atten du e de cette m ême variab le p ou r un
in d iv idu
j ayant un n iveau de la variab le exp licative d ’u ne un ité su p érieu r à celu i de
variab le p ou r l’in d i.ividu
– Si on con sid èr e la fon ction affine qu i exp r ime la valeu Yi ) en rfon
de ction
E( de
xi (voir la
con d ition C2), ona
dE(Yi )
= β1.
dxi
Par con séqu ent, si la var iab le expxlicative
i au gmente de ∆ un ités, la var iation atten due
de la variable dép endante sera β1∆deu n ités.β1 est ap p elépela nte
du mo dèle.
C ette d er n ièr e inter pr étation fait clair ementβap 1 comme
p ar aître
le p ar amètr e d ’intér êt d ans
ce mo dèle. Étant don née la for me affine expr imant la relation entr e la var iab le explicative e
var iab le exp liqu ée, le p arβamètre
1 capture à lui seul toute la dép endance Yi envers
de xi . Les
tech niques d’in féren ce dévelop p ées dan s le cad re du mo dèle de régression lin éaire simple
p our ob jet
β1.
33
variable expliquée
Valeurs de la
Droite d’équation
y = β0 + β1x
yi
ei
E( Yi )
xi Valeu rs d e la
var iab le exp licative
Fig. 2.1 – Mo délisation de la relation entre variables dans le MRLS
34
Var iabl es
Notation Interprétation Dénomination Observations
Yi Variable aléatoire mesurant le Variable expliquée, dépen- yi Son esp
phénomène à expliquer pour dante, endogène Toutes
l’individu i ont la m
Xi Variable aléatoire mesurant la Variable explicative, exogène xi Considé
phénomène expliquant Yi
εi Variable aléatoire mesurant la Terme d’erreur associé à N’est pas obser- εi = Yi
partie Yi qui ne peut être ex- (xi , Yi ) vée. Son esp
pliquée par X i La réalisation Toutes
(non observée) de ont la m
εi est notée ei .
Par amèt r es
Notation Interprétation Dénomination Com
35
β0 Valeur attendue de Yi lors- Ordonnéeà l’origine, intercept Sa vraie valeur est inconnue
qu’on observe X i = 0
β1 Variation attendue de Yi Pente C’est le paramètre d’intérêt,
lorsque xi augmente d’une dance de la variable endogèn
unité Sa vraie valeur est inconnue
σ Écart-type commun des va- C’est également l’écart-type
riables dépendantes — Sa vraie valeur est inconnue
R el at ions découl ant de l a déf init ion du modèl e

Yi = β0 + β1xi + εi yi = β0 + β1xi + ei
36
C h ap i tre3

s im pl e : es ti m ati on des param ètr
Le mo dèle statistique défi ni dan s la section pr écéd ente est n otamment con str uit dan s
de fou rn ir un cad re à des méth o des d’in féren ce p ermettant d’estimer β0 et
les
β1paramètres
. En
suivant le princip e d écrit d ans le chapitre 1, on cherchera dans cette section à d égager une f
ad équ ate d ’u tiliser les varXiab
1, . les
. . ,X n en vu e de for mer un estimateu r p on ctu el
n ,Y 1, . . .Y
d es p ar amètrL’u
es.tilisation de cet estimateu r et d es ob ser vation s fou rn ir a l’estimation de l
vr aie valeu r de ces p ar amètr es.
3.1 Ap p ro ch e intuitive
Dan s un e première ap pro ch e du probonlème, ch erch e d es valeurs d es p aramètres p our
lesqu elles la p ar tie de
Y1, . . . ,Y
n qu i n ’es t p as exp liquXée
1, . p. .ar
,Xn est la p lu s p etite p ossib le
en moyen n e. Pou r cela, on ch oisit d es valeu β0 et de
rs βde
1 p ou r lequ elles la d istan ce moyen ne
entr e les
Yi et lesβ0 + β1X i est min imale.
For m ellem ent,
si on mesu re ch acu ne de ces d istan Yces pβ0ar+ β1X i ) 2, le pr ob lème
i −(
con siste à min imiser la fon Sction
défi n ie p ar
S: Ê
× Ê
−→ Ê
+
1 n
(β0,β 1) −→ S (β0,β 1)= (Yi − β0 − β1X i )2
n i=1
Définit ion 1 D ans le M RLS, (β0,β

on appe l le estimate ur de s M oindre s Carré ) tou te
s1de
(
solu tion notée )
β̂0, β̂1 du problè me
min S (β0,β 1), (3.1)
(β0 ,β1)∈
Ê
2
1 n (
oùS (β0,β 1)= n i=1 Yi − β0 − β1X i )2.
S est un e fon ction de(

β0,β 1) d eu x fois continû ment d érivab
De ple.
lu s c’est un e fon ction
convexe. Par con séquent, tou t extr emu m est un min imu m, atteint en 2
β̂0,tou
β̂1) de
t p oint( Ê
s atis f aisant
∂S
(β̂0, β̂1) =0 , k =0 , 1. (3.2)
∂βk
37
S (β0 , β1 ) −→
−→
β1
β0 −→
Fig. 3.1 – Allu re de la fonction

S (cas 1).
Dan s la min imisationS,de

il est imp or tant de d istin gu er d eu x situ ation s.
1. S’il existe d eu x in d ivid i etus
j p ou r lesqu Xelsi = X j , alorsS est str ictem ent convexe,
p u isqu e c’est la sommen de fon ction s str ictement convexes β0de(
,β 1): S (β0,β 1) =
n ( 2
) où Si (β0,β 1) =( Yi −β0 −β1X i ) . L’allu re de la fonction
i=1 Si β0,β 1 S est r ep r ésentée
p ar la fi gu re 3.1,
p age 38. Par con séqu ent, Cette fon ction ad met un un iqu e min imu m a
point(β̂0, β̂1), comp lètement car actér isé p ar le système de d eu x équ ation s (3.2). C omm
fon ction S est un p olyn ôme du secon d d egr é en ch acu n de β ses
0 etar
β1,gu
ces
ments
d eux
équation s sont lin éair es. Au tr ement dit, p ou r tr ou ver le β̂0,min
β̂1) diman
e la d(
fon ction
S il su ffit d on c de r ésou dr e un système de d eu x équ ation s lin éaires à d eu x in con n
Noton s que
n 1 n ∂
∂S ∂ 1
(β0,β 1)= (Yi − β0 − β1X i )2 = (Yi − β0 − β1X i )2, k =0 , 1.
∂βk ∂βk n i=1 n i=1 ∂βk
Par con séqu ent
∂S 1 n
(β0,β 1)= −2(Yi − β0 − β1X i ) (3.3)
∂β0 n i=1
∂S 1 n
(β0,β 1)= −2X i (Yi − β0 − β1X i ). (3.4)
∂β1 n i=1
Le système (3.2) s’écr it d onc
1 1

n
n ( 2)(
i=1 − Yi − β̂0 − β̂1X i ) =0 
n
n
i=1 Yi − β̂0 − β̂1 n1 n
i=1 X i
=0
 ⇐⇒ 
1 1
 n
n ( 2) (
i=1 − X i Yi − β̂0 − β̂1X i ) =0  n
n
i=1 X i Yi − β̂0 n1 n
i=1 X i − β̂1 n1 n 2
i=1 X i
=0
38
La pr em ièr e équ ation est équ ivalenteà
β̂0 = Y − β̂1X, (3.5)
où X = n1 ni=1 X i et Y = n1 ni=1 Yi . En su b stistu ant cette exp r ession

β̂0 dde
an s le
secon de équ ation , on ob tient
1 n 1 n
2
X i Yi − XY + β̂1X − β̂1 X i2 =0 , (3.6)
n i=1 n i=1
2
d e sorte qu en1si n 2
i=1 X i − X
=0 , ona
n
X i Yi − nXY
i=1
β̂1 = n
2
X i2 − nX
i=1
1 2
Noton s quen
n 2
i=1 X i − X
= n1 ni=1(X i − X )2, de sorte qu e la con d ition
1
n
n 2
i=1 X i −
2
X = 0 p ermettant de d éfi ir ni=1(X i − X )2 =0 . Le memb re de gau ch e de cette
β̂1nest
relation étant un e somme à ter mes p ositifs, cette somme est nu lle si et seu lement si ch
d e ses ter m es est nu l:
n
(X i − X )2 =0 ⇐⇒ (X i − X )2 =0 ∀i ⇐⇒ X i = X ∀i ⇐⇒ X 1 = X 2 = ··· = X n
i=1
O r ceci est un e p ossib ilité qu i a été exclu e au d éb ut de ce pr emier p oint. Par con séq
on a le r és u ltat su ivant.
T héorème 2 D ans le M RLS, s’ ile xiste de ux i ndividu sj iteetls qu eXi = X j , alors

(β0s,βde
l’e stimate ur M oindre s Carré 1) est donné par
n
X i Yi − nXY
i=1
β̂1 = n , (3.7)
2
X i2 − nX
i=1
β̂0 = Y − β̂1X. (3.8)
Ce th éor ème est illu str é p ar la fi gu re 3.2.

2. Su pp oson s m ainten ant qu e p ou r tou s les i ona
in dXivid
i = us
x =0 . La fon ction
S est
d on c d éfi n ie (p ar )= n ( )2 Su pp oson s que ad mette un minimum
S β0,β 1 i=1 Yi −β0 −β1xi . S
au point(β̂0, β̂1). On au ra d onc
2
Ŝ = S (β̂0, β̂1) ≤ S (β0,β 1), (β0,β 1) ∈ Ê
.
Il est facile de voir qu e p ou βr 0tou

,β 1)t(ch oisi de sor teβque
0+β1x = β̂0+β̂1x, la fon ction
S sera au ssi égaleà Ŝ. Au tr ement dla it,fon ction
S adm et une in fin ité (continu u m) de
min iman d s. La fi gu re 3.3 de la p age 41 illu stre cette situ ation.
39
5000
4000
S(β0 , β1 )
3000
2000
1000
0 50
S(β̂0, β̂1) −→ β̂1
30
β̂0 ↓
ց
10
−→
−10
40.0
20.0
β1
0.0 −30
−20.0
←− −40.0 −50
β0
Fig. 3.2 – Les estimateu rs Moin dr es C ar r és sont ob tenu s en

S m in imisant
(La p er sp ective ado ptée no us mo ntr e le dessous de la sur fa ce de la
fo nc tion
S et no us p er met d’en vo ir le minimum. Celui- civa ut ici
1, 8 5 4 et es t a tte int
β̂0,en(
β̂1) = (0, 998, 0, 99 9 ).)
Dan s ce cas, les d eu x d ér ivées p ar

S sont
tielles
prop
de ortionn elles, puisque les exp ressions
(3.3) et (3.4) d on n ent
∂S ∂S
(β0,β 1)= x (β0,β 1) , ∀β0, ∀β1.
∂β1 ∂β0
Par con séqu ent les d eu x con d ition s du premier ordre (3.2), qu i d emeu r ent d es con
n écessair es et su ffisantes p ou
β̂0,rβ̂1qu
) min
e( imise la fon ction
S, sont r ed on d antes. Elles
d on n ent toutes d eux
β̂0 = Y − β̂1x.
La solu tion au pr ob lème (3.1) est d on c l’hyp er2 p
défi
lannde
i p {ar
(β0,β 1) ∈Ê Ê
2
| β0 =
Y − xβ1}. Nou s avon s d on c le résu ltat su ivant.
T héorème 3 D ans le M RLS, si pou r tou s le s individu si =i on

x, aX
alors la solu tion
au prob lè me (3.1) n’e
passt u ni q uTout de 2 de la forme(Y − xβ̂1, β̂1), où
e. é lé ment Ê
β̂1 ∈ , pe ut ê tre considé ré comme un e stimate ur M oindre (sβ0Carré

Ê
,β 1). O
s de
n di ra
dans ce cas qu e l’e stimate ur M oindre s Carré s n’e xiste pas.
Dan s ce d er n ier ilcas,

n’est pas p ossib le de distin gu er les vr aies valeu rs des par amètr es
d ’au tres valeu
a pri orip ossib les p ou r ces p ar amètr
rs En effet,tou
es. tes les cou p les d ans
l’en semb{le
(β0,β 1) | β0 + β1x = m} sont comp atib les avec les ob servation d an s s, le sens
où si on ch oisit d eu x éléments( 1 1 2 2
β0 ,β 1 ) et( β0 ,β 1 ) de cet en semb le, on au ra simu ltan ément
p our tous les individusi =1 , .. . ,n: yi = β01 + β11 + xi + ei et yi = β02 + β12xi + ei . C om me
ces égalités sont également vérifi ées p ou r les vraies β0 valeu
et β1 drses p ar amètrles es,
40
S (β0 , β1 ) −→
→
β1 −
β0 −→
Fig. 3.3 – Allu re de la fonction

S (cas 2).
réalisation des variab les du mo dèle ne p ermettent don c pas de disso cier dan s cet en se
les vr aies valeu rs de par amètr es des au tr es valeu rs. Pu isqu ’il est imp ossib le de dist
les vr aies valeu rs p ar mi d ’au
il ntr’est
es,p as su rp r en ant qu e la solu tion du prob lème de
l’estim ation de ces valeu rs ne soit p as un iqu e.
Ce même prob lème p eu t être p erçu à travers les con dition d éfi ns issent
qui le MRLS. Si
X i = x p ouri =1 , .. . ,nqu elles qu e soient les valeu rs d es p βar 0 et
amètr
β1, l’esp
es ér an ce
de la variable dép endante sera la même p our tous lesXindividus: i = x,∀i =1 , .. . ,n =⇒
E( Yi ) = E( Yj ), ∀i,j =1 , .. . , n.Notonsm la valeu r commu ne de cette esp érLes an ce.
cou p les(m−ax ,a)et( m−bx ,b ), où a et b sont d es réels qu elcon qu es, d on n ent tou s d eux
u ne valeu r deYiE( ) égaleàm p ou r tou t in d ividu i. Or , p u isqu e le mo d èle es t su p p os é b ien
sp écifi é, p armi tou s les cou p
β0,β 1 les(
) p ou r lesqu els
Y1E(
)= ··· =E( Yn )= m, on trou ve
le coup le d es vraies valeu β0,βrs(
1). Don c du p oint de vu e de l’exp r ession de l’esp ér an ce
de Yi comme un e f on ction affin xi , eil de
est imp ossib le de d istin gu er les vr aies valeu rs d es
p aramètres d ’au tres valeu On rs.
d it d an s ce cas qu e les p ar amètr β0 et βes1 du mo dèle
sontnon- identifiés .
Re ma rque2 L es estimateuβ̂0rset β̂1 ad mettent d es exp r ession s qu i ser ont u tiles d an s la su

Ces exp r ession s sont ob tenu es à p ar tir du r ésu ltat su ivant.
Lemme 1 Soie nt u et v de ux n- u ple ts de =( n ) etv =( v1, . . . ,v

réeu1ls, .:u. . ,u n ). Ona
n n n n
(ui − u)(vi − v)= ui vi − nuv = (ui − u)vi = (vi − v)ui ,
i=1 i=1 i=1 i=1
1 n 1 n
où u = n i=1 ui et v = n i=1 vi .
41
:O n a(ui − u)(vi − v) =( ui − u)vi − (ui − u)v ,i =1 , .. . , n,et d onc
P re u ve
n n n n
(ui − u)(vi − v)= (ui − u)vi − v (ui − u)= (ui − u)vi ,
i=1 i=1 i=1 i=1
car ni=1(ui − u) =0 . On ob tient n (

i=1 ui − u)(vi − v)= n (
i=1 vi − v)ui d e la m ême
man ièr e.
Fin alement, pu isqu
ui e(
− u)(vi − v)= ui vi − uvi − ui v + u v,i =1 , .. . , n,ona
n n n n
(ui − u)(vi − v)= ui vi − u vi − v ui + nuv
i=1 i=1 i=1 i=1
n
= ui vi − unv− vnu + nu v,
i=1
ce qui achève la preu ve.
Noton s qu e lorsque
Re ma rque3 u = v, le r ésu ltat pr écéd ent d on ne
n n n
(ui − u)2 = u2i − nu2 = (ui − u)ui . (3.9)
i=1 i=1 i=1
On p eu t mainten ant ob ten ir de n ou velles expβ̂r0 ession

et deβ̂1s. de
Proprié t é 2 D ans le M RLS, i = X j , le s estimate u rs M oindres

s’ ile xi steiet j te ls qu eX
Carré s adme tte nt le s e xpre ssions su iv ante s:
n 1 X (X i − X )
β̂0 = β0 + − n ( εi (3.10)
n j =1 X j − X
)2
i=1
n ( )
i=1 X i − X εi
β̂1 = β1 + n (
(3.11)
j =1 X j − X
)2
: En u tilisant le lemme 1 et la r emar qu e 3, on p eu t r éécr ir e l’exp r ession (3.7) comm

P re u ve
n ( )
i=1 X i − X Yi
β̂1 = n ( . (3.12)
i=1 X i − X
)2
Or Yi = β0 + β1X i + εi et p ar con séqu ent, le nu mér ateu r ci-d essu s d evient,

n n
(X i − X )Yi = (X i − X )(β0 + β1X i + εi )
i=1 i=1
n n n
= (X i − X )β0 + β1 (X i − X )X i + (X i − X )εi
i=1 i=1 i=1
n n
= β1 (X i − X )2 + (X i − X )εi ,
i=1 i=1
où la d er n ièr e égalité pr ovient de la r emar qu e 3nap -u p liqu

let
X, et
ée du
au fait que
n ( ) =0 En u tilisant l’exp r ession ci-d essu s d an s (3.12), on ob tient (3.11).
i=1 X i − X .
42
Pour obten ir (3.10),
on n ote que Yi = β0 + β1X i + εi , i =1 , . . . , n,
im p lique
Y =
1 n
β0 + β1X + ε, où ε = n i=1 εi . On su b stitu e cette exp r ession
Y d an de s (3.8), ce qui
don ne
β̂0 = β0 +( β1 − β̂1)X + ε. (3.13)
D’ap r ès (3.11) qu ’on vient de prou ver, on p eu t écrire
n ( )
i=1 X i − X εi
β1 − β̂1 = − n (
j =1 X j − X
)2
et en su b stitu ant cette exp r ession d an s (3.13), on ob tient

n ( )
i=1 X i − X εi
β̂0 = β0 − X n (
+ ε.
j =1 X j − X
)2
En u tilisant la d éfi n ition

ε et
deen factor isant les
εi on ob tient l’exp r ession (3.10).
3.2 Ap p ro ch e th éorique
Un e ap pr o ch e plu s th éor ique con siste à ne con sid ér er qulinéaires
e les estimateu
de β0 et rs
β1, pu is à ch erch er d an s l’en semb le de tels estimateu rs ceu x qu i sont préférab les au x au
Définit ion 2 U ne statistique β̃k e st un e stimate ur linéaire k si

deβon peut trou ver n nombres
∗= n =
w̃k1, . . .,w̃kn , pou v ant éve ntu el lement dépendre
1, . . deX
. ,X
n , te ls qu eβ
k i=1 w̃ki Yi , k
0, 1.
Re ma rque4 On con state qu’à tout n-u p let de n ombrwes( n ), on p eu t asso cier un
1, . . . ,w
estimateu r lin éairen D’au tr e p ar t, tou t estimateu r lin n éaireest com p létem ent
i=1 wi Yi . i=1 wi Yi
car actér isé p arn-u
le p let(w1, . . .,wn ). Par con séqu ent,
ch oisir un estimateu r lin éairβe k de
r evient à ch oisir nun
-u p let de r éels.
Propriét é 3 Le s estimate u rs M oindre sβ̂Carrés

0 et β̂1 deβ 0 et β1 sontde s e stimate u rs li-
néai re s.
: En u tilis ant l’exp r es s ion (3.12) X i −X
P re u ve β̂1 et en
de p os ant
ŵ1i = n
(X j −X )2
,i =1 , .. . , n,on
j =1
a β̂1 = n
i=1 ŵ1i Yi . En ce qu i con cerne
β̂0, ona
1 n n n 1 n
β̂0 = Y − β̂1X = Yi − ŵ1i XY i = − X ŵ1i Yi = ŵ0i Yi ,
n i=1 i=1 i=1
n i=1
avecŵ0i = 1
− X ŵ1i ,i =1 , ... , n.
n
Un cr itèr e de comp ar aison d ’estimateu rs est l’er r eu r qu ad ratiqu e moyen ne (EQ M).
Définit ion 3 P ou r un estimateur

β̃k deβk , l’ E Q M dẽ EQM β̃ qu i au
βk e st la fonc tion, notée k
( ) E( )2 =0 1
cou pleβ0,β 1 assoc ie le nombreβ̃k − βk ,k , . Au tre me nt dit,
E QMβ̃ (β0,β 1) = E( β̃k − βk )2 , k =0 , 1.

k
Re ma rque5
43
– La d éfi n ition 3 in d iqu e exp licitem ent qu e β̃l’EQM
1 est un
de e fon ction βde
1 et de β0.
Cep endant, il p eut sembler au premier ab ord 2
β̃1que
−β1)E( ne dép end queβde 0. Cela
n ’est évid emment p as vr ai. En effet,β̃comme
1 est un estimateu r lin éairβe 1, de
ona
n n
β̃1 = w̃1i Yi = w̃1i (β0 + β1X i + εi ),
i=1 i=1
p our un certainn-u p letw(˜11, . . .,w̃1n ). On voit alor s clair ement qu e la var iab le β̃1aléatoire
p eut s’écrire non seulement en fonction β1, mais
de aussi en fon ction β0.de
Par con séqu ent,
il n ’est p as su rp r en ant qu e β̃1la
dép
loi ende
de à la fois
β0 et deβ1. Cela sera en p articu lier
vr ai p ou r l’EQM β̃E( 2
1−β1) . La même r emar qu e s’ap p liqu e évid emment au x estimateu
de β0.
– L’EQM d ’u n estimateur β̃k est un e m esu re de la pr écision de cet estimp ateu u is que
r,
l’EQM s’inter pr ète comme la d istan ce atten du e entr e un β̃k estimateu
) et ce qu ’il
r( estime
(βk ).
– Pou r d eu x estimateu β̌k et
rs β̃k de βk , on d it quě
βk est pr éfér ab β̃leà
k au sen s de l’err eur
qu ad r atiqu e moyen ne si
E QMβ̌ (β0,β 1) ≤ EQM β̃ (β0,β 1), ∀β0,β 1.

k k
– En gén éral,il n’est pas p ossib le de tr ou ver des estimateu rs pr éfér ab les à tou t au tr e
sen s de l’EQ M.
C ep en d ant,
comme on va le m ontr si er,on intro duit un autre typ e de contrainte sur
les estimateu rs qu ’on con sidalors
èr e,
on p ou rra trou ver,
d an s le contexte du MRLS,
un
estimateu r pr éfér ab le à tou t au tr e au sen s de l’EQ M.
La contr ainte su pp lémentair e imp osée au x estimateu rs est d’êtr e san s biais.
Dé finit ion4
1. Le biais d’un e stimate
β̃k ur
deβk e st la fonc tion qu 0i ,β
à 1(β E (β̃k −βk ).
) assoc ie le nombre
2. O n ditqu ’u n e stimate β̃kur
deβ k est sans b i ai s son
si b iai s e constant
st et ég alà 0:
E (β̃k − βk ) = 0,∀β0,β 1.
Re ma rque6
– Le premier p oint de la remarque 5 faite à prop os de l’EQM p eut aussi s’appliquer au biais
d ’u n estimateu r. Le b iais
β̃0 dép
de end de β0 et de β1.
– Un estimateurβ̃k de βk est san s b iais si et seu lement (β̃k )siE
=β k , ∀β0,β 1.
– Si β̃k est un estimateu r san s b iais
βk , alors
de son EQM coïn cid e avec sa varian ce. En effet
2
E QMβ̃ (β0,β 1)= E (β̃k − βk )2 = E β̃k − E (β̃k ) = V (β̃k ).
k
– La var ian ce d ’u n estimateu r san s b iais est d on c un e mesu re de sa pr écision . Plu s l

d’u n estimateu r san s biais est p etite, plu s cet estimateu r est pr écis.
– Par con séqu ent, p ou r comp ar er d es estimateu rs san s b iais d’u n même p ar amètr e,
d e comp ar er leu rs var ian ces. Plu s pr écisément,
β̌k et β̃k sontsid eu x estimateu rs san s b iais
de βk , on pr éfèr era
β̌k à β̃k au sen s de l’EQ M siV
(β̌k ) ≤ V (β̃k ), ∀β0,β 1.
44
Dan s le mo dèle de régression lin éaire stan si on
dard,
ne con sid èr e qu e d es estimateu rs li-
n éaires et san s b iais
β0 de
et deβ1, on pr éfèr er a ceu x qu i sont de var ian ce min imale.
Proprié t é 4 D ans le M RLS, le biais d’un e stimate ur linéaire

β̃k deβ k , dé finipar le n - u plet
(˜w
k1, . ..˜w
kn ), e st la fonc tion qu i au cou0ple
,β 1)(β
assoc ie le nomb re
n n
β0 ˜w
ki +β 1 ki X i − βk .
˜w (3.14)
i=1 i=1
P re u ve β̃k = ni=1 ˜w
: Par d éfi n ition , b iais de l’estimateur ki Yi deβk est la fon ction qu i au cou p le
n
(β0,β 1) asso cie le n omb reEi=1 ˜w ki Yi − βk . C om m e les ˜wki ne dép endent que de
X 1, . . . ,Xn , et qu e ces var iab les ont un e distr ib ution dégén ér ée, il en est de même p
les ˜w n n
ki , et on aE i=1 ˜wki Yi = i=1 ˜wki E (Yi ). D’ap r ès la con d ition C2 du MLRS,
on aE (Yi ) =β 0 +β 1X i et en su b stitu ant cette exp r ession d an s l’exp r ession du b iais
ce d ern ier s’écr ni=1 it ˜wki (β0 +β 1X i ) − βk . En factor isant β0 et β1, on ob tient (3.14).
Re ma rque7 On n ote qu ’en u tilisant (3.14), la con d ition p ou r qu ’u n estimateu

β̃0 = r lin éaire
n
0i Yi de β0 soit san s b iais est
i=1 ˜w
n n
β0 ˜w
0i +β 1 ˜w
0i X i =β 0, ∀β0, ∀β1. (3.15)
i=1 i=1
C ette con d ition est un e con d itionnsu

-u pr le
let de réels
(˜w 0n ) qui d éfi n β̃
01, . . .,̃ w it0. Cette
con d ition (3.15) s’écrit au ssi
n n
β0( 0i − 1) +β1
˜w ˜w
0i X i =0, ∀β0, ∀β1.
i=1 i=1
Afi n que les

˜w 0n satisf assent cette con d ition p ou r tou te valeu r β
0i , . . .,̃ w p0 ossib
et deβle
1, de
sans dép endre d’autre chose que X 1, de n , il fau t avoir
. . . ,X
 n

 0i − 1 = 0,
˜w


 i=1 (3.16)
n

 ˜w
0i X i =0.


 i=1
De la même man ièr e, tou t estimateuβ̃r1 lin n

= éaire 1i Yi deβ1 sera san s b iais
i=1 ˜w ˜w si, . . .,̃ w
11 1n
satisf ont la con d ition
 n



˜w
1i =0,

 i=1
n (3.17)

 1i X i − 1 = 0.
˜w


 i=1
Propriét é 5 D ans le M RLS, le s estimate urs M oindre s Carré

0 et deβ
s deβ
1 sont sans b i ai s.
: On u tilise les exp r essionβ̂s0 de

P re u ve et β̂1 obtenues d ans la preu ve de la prop r iété 3 et
on montre qu e les con d ition s (3.16) et (3.16)sont satisf aites.
Ain sip ourβ̂1, ona
X i −X Donc
ˆw1i = n 2.
(X j −X )
j =1
n n
i=1(X i − X)
ˆw
1i = n 2
=0,
i=1 i=1(X i − X)
45
car le nu mérateu r est nu l, et d ’au tre p art
n n
i=1(X i − X)X i
1i X i − 1=
ˆw 2 − 1 = 0,
n
i=1 i=1(X i − X )
car la remarqu e 3 p ermet de con clu re qu e le rap p ort du memb re de gau ch e est ég
1. Au tr ement d
β̂1itest un estimateu r lin éair e qu i vér ifi e les con d ition s (3.17).
Q u antàβ̂0, ona ˆw 1
0i = n 1i . Par con séqu ent,
− X ˆw
n n n
1
0i − 1=
ˆw −X 1i − 1 =1 − 0− 1 = 0,
ˆw
i=1 i=1
n i=1
n
p u isqu e on a montr é que 1i =0. D’au tre p art,
i=1 ˆw
n n n
1
ˆw
0i X i = ( − X ˆw
1i )X i =X − X 1i X i =X − X =0,
ˆw
i=1 i=1
n i=1
n
car on a montr é ci-d essu s que 1i X i =1. Donc β̂0 satisf ait les con d ition s (3.16).
i=1 ˆw
Avant d ’én on cer et prou ver le résu ltatdecentral
ce ch ap itre,
n ou s avon s b esoin d ’étab lir l’ex-
p r ession de la var ian ce d ’estimateu rs lin
β0éair
et β1es
. de
Proprié t é 6 D ans le MRLS, si β̃k est un e stimate ur

linéai re deβk dé finipar le n - u plet
(˜w
k1, . . .,̃ w
kn ), alors la v ari anceβ̃de
k est donnée par
n
V (β̃k ) =σ 2 2
˜w
ki .
(3.18)
i=1
: Pu is que
P re u ve β̃k est lin éair e,
n n n n
V (β̃k )= V ˜w
ki Yi = V ( ˜w
ki Yi ) +2 cov( ˜w
ki Yi , ˜w
kj Yj ).
i=1 i=1 i=1 j =i+1
En u tilis ant le f ait qu ˜w

ekiles
ne dép endent queXde n et qu e ces variab les ont
1, . . . ,X
u ne d istrib u tion de prob ab ilité d égén érée, en ap p liqu ant les prop r iétés de la cov
ona
n n n
V (β̃k )= 2V
˜w
ki (Yi ) +2 ˜w kj cov(Yi ,Y j ).
ki ˜w
i=1 i=1 j =i+1
La con d ition C3 d éfi n issant le MRLS imp liqu e qu e tou s les ter mes de la pr emièr e
sont égau xà̃w2 2 et qu e tou tes les covarian ces de la d eu xième (d ou b le) somme s o
ki σ ,
nu lles. On ob tient d on c l’exp r ession vou
(β̃klu
). e deV
C orollaire 1 Dans le M RLS,

le s variance s de s estimate u rs de s M oindre
β̂0 setCarrés
β̂1 de
β0 et deβ1 sont
2
1 X σ2
V (β̂0) =σ 2 + n et V (β̂1)= n
n 2 − X) 2
i=1(X i − X) i=1(X i
: Pou rV(β̂1) il su ffit d ’u tiliser la prop r iété précéd ente, tan d is(β̂qu
P re u ve 0), e
il fau
p out rV
en
p lu s u tiliser la pr emièr e con d ition de (3.17).
46
Re ma rque8
– Noton s qu e les varian ces d es estimateu rs Moin dres C arr és sontp in u is
conqunu
’elles
es,
dép endent de 2
σ . On p eut cep endant les estimer.
– La varian ce dê
βk est un e m esu re de la d istan ce atten du β̂k et
e entre
βk . C’est d on c un
in d icateu r de la pr écision de l’estimateur
β̂k . On con state qu e cette pr écision est affectée
p ar d eu x facteurs.
1. Le pr emier est la var ian ce commu σ2 des

neYi . Plu s elle est élévée,
p lu sV(β̂k ) est
grande. Autrement dit, plus les variables dép endantes ont tendance à être disp ersée
au tou r de leu r esp éranp luce,
s les estimateu rs Moin dres C arr és au r ont ten d an ceà
l’êtr e et moin s ils ser ont pr écis.
2. Le secon d facteu r est la variab ilité ob servée d es X 1variab nles

, . . . ,X au tour de leur
moyen n e, mesu r éei=1 np (X 2
ar i −X) . Plu s ce ter me est élevé, p(β̂lu k ) sV
es t p etite.
Au tr ement d pit,lu s on ob ser ve de d isp er sion d es valeu rs de la var iab le exp licat
au tou r de sa valeu r m oyen n e, p lu s les estimateu rs Moin dres Carr és seront préc
On rap p elle queβ1 mesure la rép onse de la variable expliquée aux variations de
la var iab le exp licative.
Pour estimer précisément cette rép onse,
on a b esoin d ’un
éch antillon d an s lequ el ces var iation s sont su ffisamment élevées.
Dan s le cas limite X où1 = ··· =X n , la d isp er sion d es valeu rs de la var iab le exp lica-
n
tive est nu lle: i=1(X i − X) 2 =0, et la varian ceV (β̂k ) est in fin ie. C ela est coh ér ent
avec ce qu ’on a mention né à la p age 41 ap r ès le thDan éorème
s ce cas
3. limite,il
est imp ossib du
le, p oint de vue d es cond ition ds éfi quin issent le MRLS,de d istin-
gu er les vraies valeu rs des paramètres parmi un continu um de valeu rs p ossib les p
ces p ar amètr es. Par con séqu ent, on ne p eu t p as atten dr e d ’estimateu rs raison
comme ceu x d es Moin dr es C ar r és, de f ou rn ir un e estimation β0 et de
pβ r 1écise
. de
Le th éor ème su ivant est le résultat la pr op riété la plu s imp or tante de la méth o de d’est
Moin dr es C ar r és.
T héorème 4 ( Ga uss-Ma rkov) D ans le M RLS, si le s paramè 0 etβ 1tre

sont
sβide ntifié s, les
e stimate u rs M oindre s Carré s sont le s e stimate u rs ayant la plu s pe tite
tou
v ariance
s les parmi
e stimate u rs linéaire s sans biais
0 etdeβ
deβ1.
: C on sid ér on s le pr ob lème dβ’estimer

P re u ve 1 p ar un estimateu r lin éair e et san sCela b iais.
r evient à con sid ér er toun-u
s les
p lets de r éels p ou r lesqu els les con d ition s (3.17) sont
satis f aites.
À ch acu n de ces n
n-u p lets est asso cié un estimateur
β̃1 = i=1 ˜w 1i Yi de β1,
d ont la varian ce con d ition n elle est d on n ée p ar (3.18), ) =σ à dni=1
(β̃1c’est2 ireV
˜w2
1i .
Pou r montrer quê β1 = ni=1 ˆw 1i Yi est l’estimateu r lin éair e et san s bβiais 1 ayant
de
un e varian ce plu s p etite qu e celle de tou t au tre estimateu r lin éaire san s biais
β̃1 =
n
1i Yi de β1, il est équ ivalent de montr er qu
i=1 ˜w n-u
e le
p let
(ˆw 1n ) s atis f ait
11, . . .,̂ w
(3.17), et qu e p ou r tou tnau -u tre
p let
(˜w 1n ) satisf aisant les m êmes con d ition s,
11, . . .,̃ w
ona
n n
σ2 2
1i ≤ σ
ˆw 2 2
˜w
1i .
i=1 i=1
47
Au trement d it, il fau t montrer qu e la solu tion du prob lème
n
min n
σ2 2
w1i sou s contrainte qu e:ni=1 w1i =0,
(w11 ,. ..,w1n )∈
i=1
Ê
n
i=1 w1i X i − 1 = 0,
admet p our solu tion

ˆw11, . . .,̂ w
1n .
C e pr ob lème est évid emment équ ivalentà
n
2 sou s contrainte qu e:ni=1 w1i =0, (3.19)
min n
w1i
(w11,...,w1n )∈
i=1
Ê
n
i=1 w1i X i − 1 = 0,
Pu isqu e la fon ction à min imiser est convexe et d ér w ivab

11, . le
. .en1n , et qu e les
,w
contraintes sont lin éaireswen 1n , on p eu t u tiliser la méth o de du lagran gien
11, . . . ,w
p our résoudre ce problème. Le lagrangien s’écrit
n n n
2
L(w11, . . . ,w
1n , λ, γ)= w1i +λ w1i +γ( w1i X i − 1)
i=1 i=1 i=1
Un n-u p let ∗
(w11 1n ) est un e solu tion du pr ob lème (3.19) si et seu lement si il existe
∗
, . . . ,w
d eu x n omb res n on n λégatifs
∗ et ∗ tels que
γ
 ∂L
 (w∗ , . . . ,w∗ ∗ ∗
1n ,λ ,γ ) = 0, i = 1, .. . , n,


 ∂w1i 11




 ∂L (w∗ , . . . ,w
 ∗ ∗ ∗ (3.20)
1n ,λ ,γ ) = 0,
∂λ 11







∂L ∗ ∗ ∗ ∗

 (w , . . . ,w1n ,λ ,γ ) = 0.
 ∂γ 11
ou en cor e, en u tilisant la d éfi n Lition de
 2w∗ +λ ∗ +γ ∗X i =0, i = 1, .. . , n,
 1i





 n ∗
i=1 w1i =0, (3.21)





 n ∗
 i=1 w1i X i =1
O n s omme les
n pr emièr es équ ation s du système, et on ob tient
n
∗
2 w1i +nλ ∗ +γ ∗nX = 0. (3.22)
i=1
i e d es pr emièr es équ ationX si , pi =

On mu ltilp lie la ar1, .. . , n,et on f ait la som me
desn équ ation s ain si ob tenu es, ce qu i d on ne
n n
2 ∗
w1i X i +λ ∗nX +γ ∗ X i2 =0. (3.23)
i=1 i=1
48
e équ ation du système (3.21) d an s (3.22)
En u tilis ant (n
la + 1) ne detanlas (3.23), on
a les cond ition s su ivantes
 nλ∗ +γ ∗nX =0

 (3.24)
 ∗ ∗ n 2
 2 +λ nX +γ i=1 X i =0
De la pr emièr e équ ation de (3.24) λon

∗ tire
= −γ∗X, qu ’on sub stitu e d ans la seconde
p our obtenir
n
2
2+γ ∗( X i2 − nX ) = 0.
i=1
2
P u is qu ’on a su pβp
0 et
oséβ1 id entifi és,ni=1 X i2 − nX =0 (voir le comm entair e qui
p récèd e le th éorème 2 à la p age 39), et on en d éd u it
−2
γ∗ = n 2 .
2
i=1 X i − nX
S i on su b stitu e cette exp r ession d an s la pr emièr e équ ation de (3.24), on ob tient
2X
λ∗ = n 2 .
2
i=1 X i − nX
On p eu t fin alement ob ten ir les exp r ession

∗ en s
w1i rdem
esp laçant les exp r ession
λ∗ s de
et γ∗ qu’on vient d ’ob ten ir d an s chacune
n pr emièr
d es es équ ation s de (3.21):
∗ 2X 2Xi
2w1i + 2 − 2 =0, i = 1, ... , n,
n 2 n 2
i=1 X i − nX i=1 X i − nX
ou en core
∗ Xi −X
w1i = n 2, i = 1, .. . , n.
2
i=1 X i − nX
En u tilisant le lemme 1, on con statew1ique

∗
= ˆw (voir la prop r iété 3).
1i , i = 1, .. . , n,
Au tr ement d it, l’estimateu r lin éair e et sanβ1sayant
b iais la
dep lu s p etite var ian ce est
l’estimateu r Moin dr es C β̂ar
1. r és
On ob tient le résu ltat con cer β̂n0 ant
p ar le même pr o céd
La é.
pr eu ve est laissée en
Ex erci.ce
Le résultat du th éor ème 4 p eu t êtr e éten du p ou r montr er qu e les estimateu rs des Mo
Car rés p er mettent d ’ob ten ir les estimateu rs les p lu s pr écis p ar mi tou s les estimateu rs
san s b iais de n ’imp or te qu elle comb in aison β0 lin
et de
éair
β1.ePlus
de précisément, si l’ob jectif
est d ’estimaer
0β0 +a1β1, où a0 et a1 sont d es r éels con nu s, alors le meilleu r estimateu r lin éaire
et san s b iais de cette comb in aison lina0éair e1est
β̂0 +a β̂1. Au tr ement d it, le meilleu r estimateur
(au sen s d on né ci-d essu s) de la comb in aison lin éair e est la comb in aison lin éair e d es es
La pr eu ve de ce résultat s’ob tient par la même démar ch e qu e celle utilisée p ou r démontr e
th éor ème 4. C ette pr eu ve est d on c Exerci
laisséece
. en
Ce r ésu ltat p ermet alors d ’ob ten ir celui
du théorème 4 comme corollaire, en choisissant a d’ab
0 =0ord
et a1 =1 , pu isa0 =1 et a1 =0 .
49
3.3 Prop riétés d es estimateu rs M oin d res Carrés
La plu par t des pr op riétés imp or tantes des estimateu rs Moindr es Car rés ont été pr ou v
d essu s. Par con séqu ent, le r ésu ltat su ivant con siste simp lement en un r ésu mé de ces pr
T héorème 5 D ans le M RLS, si le s paramè

0 etβ
tre 1sβ
sont ide ntifié s, alors
1. Le s estimate u rs M oindre s Carré s sont donné s par
n
i=1(X i − X)(Y i − Y)
β̂0 = Y − β̂1X et β̂1 = n 2
.
i=1(X i − X)
2. Ce s e stimate u rs sont de s v ariab le s aléatoire s dont le s v ariance s sont donnée s par

2
1 X σ2
V (β̂0) =σ 2 + n et V (β̂1)= n .
n 2 − X) 2
i=1(X i − X) i=1(X i
3. Le s e stimate u rs M oindre s Carré s sont linéaire s et sans b iais. P armi de te ls e stimate

ce sont le s e stimate u rs le s plu s préc is (de v ariance minimale ).
Siβ 0 etβ 1 ne sont pas ide ntifié s, alors la mé thode M oindre s Carré s ne perme t0pas d’e stime
e tβ1 sé parément.
3.4 M esu re de la qu alité de l’estimation p ar M oin dres Carrés

3.4.1 Valeurs a just ées et résidus
Définit ion 5 D ans le M RLS, le s vale u rs aju stée s issu es de l’estimation M oindre 0 s Carré s
e t deβ
1 sont le s n v ariab le s aléatoireŶs1,notées
. . .,Ŷn , dé finies par
Ŷi = β̂0+β̂1X i , i = 1, .. . , n.
Re ma rque9
1. Pu is quê
β0 et β̂1 sont d es estimateu rs β0deet deβ1, on p eu t interpréter
Ŷi = β̂0 + β̂1X i
comme un estimateu r (Y deE
i ) =β 0 +β X
1 i . Au tr ement d
Ŷiit
est l’estimation de la valeur
atten d ue Yde
i lorsqu ’on con nXaît i . En r ep r en ant l’interprétation d on n ée au p oint 1 p age
29, on p eu t également d ir Ŷi que
e
est l’estim ation de la p ar Ytie
i qu
dei p eu t êtr e exp liqu ée
par la valeur de Xi.
2. La valeu r a ju stée
Ŷi ne coïncid e p as avecE
(Yi ), mais on s’atten d à ce qu ’elle le fasse,
p u isqu e la d iffér en ce atten du e est
E Ŷi − E (Yi ) = E (β̂0 + β̂1X i − β0 − β1X i )

= E (β̂0)+ E (β̂1X i ) − E (β0 +β 1X i )
=β 0 +β 1X i − (β0 +β 1X i ),
car β̂0 et β̂1 sont d es estimateu rs san s bβiais

0 etde
β1, r esp ectivem ent.
3. La valeu r a ju stée
Ŷi ne coïn cide pas non p lu sYavec
i . On d on ne la d éfin ition suivante de
leu r d ifféren ce.
Définit ion 6 D ans le M RLS, on appe l le ré sidu s de l’estimation M oindre s Carré s le s variab
aléatoire s, noté
ε1,sˆ
. . .ε,ˆ εi =Y i − Ŷi , i = 1, .. . , n.
n , et dé finies parˆ
50
Valeu rs de
Yi
y= β1 +β 2x
× y= β̂1 + β̂2x
×
× ×
× ×
E (Yi )
εi (< 0) ×
yi ×A
ŷi ε̂i (> 0)
×
×
xi Valeu rs de
Xi
Fig. 3.4 – Rep r ésentation gr ap h iqu e de l’estimation Moin dr es C ar r és.
Rema rque 10 Le i e r ésidûεi s’inter pr ète comme l’estimation de la p Yar i qu’on

tie den e p eut
p as exp liqu er p
X iar
. Dan s la mesu re où la valeu r a ju Ŷi stée
p eu t être con sid érée comme un
estimateu r deE
(Yi ), on p eu t con sid érerε̂i que
=Y i − Ŷi est un estimateu r Ydei − E (Yi ) =ε i .
La fi gu re 3.4 de la p age 51 illu str e gr ap h iqu ement les r ésu ltats de l’estimation Moin d
C ar r és qu e sont β̂0, β̂1, Ŷi et ε̂i , i = 1, .. . , n.Sur cette fi gu rlese, cou p les d es ob servation s de
(X i ,Y i ), i = 1, .. . ,n sont r ep r ésentés p ar d es× cr). oix(
L a d r oite d ’éq u ation y =β 0 +β 1x
est celle le long de laquelle sont alignés les p oints de co ordonnées (X i , E (Yi )). C ette dr oite
s’inter pr ète comme la vr aie dr oite, pu isqu e c’est celle qu i r ep r ésente la Yvr i et
aie r elation en
X i . L a d r oite d ’éq u y= ation
β̂0 + β̂1x contient les p oints de co ordonnées (X i , Ŷi ). C ette dr oite
est entièr ement car actér isée β̂0 petar
β̂1. Elle r ep r ésente l’estimation Moin dr es C ar r és de la
relation entre Yi et X i .
Pou r un p oint A caractérisant le cou p le d ’ob servations (xi ,yi ), l’im age de
xi p ar la fon ction
y =β 0 +β 1x est évid em m entE (Yi ). La d ifféren ce entre
yi etE (Yi ) est égale à la r éalis ation de
la variab le aléatoire εi , qu ’on a n otée
ei su r le grap h iqu e de la fi gu re 3.4. Pou r ces valeu rs d es
var iab lesX i et Yi , la r éalisation de la var iab le aléatoir e valeu Ŷri aest ju ŷstée
i , et cor r esp ond
à l’im age de xi p ar la fon ction β̂0 + β̂1. La r éalisation,
notéeêi , de la var iab le aléatoir e r ésidu
ε̂i est la d iffér en ce entre
yi et ŷi .
3.4.2 Propriét és
Les résid us p ossèd ent un e pr op riété imp or tante qu ’on ré-inter pr éter a dan s le ch ap
vant.
51
Proprié t é 7 D ans le M RLS, ona
n n
ε̂i =0 et ε̂i X i =0.
i=1 i=1
: C es d eu x égalités sont un e r é-écritu re d es con d ition s du premier ordre d éfi n issa

P re u ve
estimateu rs Moin dr es C β̂ar
0 et
r és
β̂1 comme solu tion s du pr ob lème de min imisation
n
S(β0,β 1)= i=1(Yi −β0 −β1X i )2. En effet, d an s la r é-écritu r e, p age 38,
d e la fon ction
d u système (3.2) on r empYilace
− β̂0 − β̂1X i par ε̂i et les d eu x équ ation s du système
coïn cid ent avec les d eu x égalités de la prop r iété ci-d essu s.
Cette pr op r iété p er met d ’ob ten ir le r ésu ltat su ivant.
Théorème 6 (Décomp osition de la régression) Dans le M RLS, ona

n n n
(Yi − Y) 2 = (Ŷi − Y) 2 + (Yi − Ŷi )2. (3.25)
i=1 i=1 i=1
: Ona
P re u ve
(Yi −Y) 2 =(Y i −Ŷi +Ŷi −Y) 2 =(Y i −Ŷi )2 +(Ŷi −Y) 2 +2(Yi −Ŷi )(Ŷi −Y ), i = 1, .. . ,n.
Par con séqu ent, p ou r d émontr er le th éor ème, il est su ffisant de montr er que
n
(Yi − Ŷi )(Ŷi − Y) = 0.
i=1
Le lemme 1 pu is la d éfi n ition

Ŷi et
dedeε̂i p ermettent d ’écrire le memb re de gau che
d e cette égalité comme
n n n
(Yi − Ŷi )(Ŷi − Y)= (Yi − Ŷi )Ŷi = ε̂i (β̂0 + β̂1X i ).
i=1 i=1 i=1
En d écomp osant la d er n ièr e exp r ession , ona

n n n
(Yi − Ŷi )(Ŷi − Y)= β̂0 ε̂i + β̂1 ε̂i X i .
i=1 i=1 i=1
Les d eu x égalités de la prop r iété précéd ente p ermettent ni=1

de(Y
con clu
i − Ŷi )(Ŷre
i−
Y ) = 0.
Rema rque 11 Ce r ésu ltat a l’inter pr étation su ivante. Le memb re de gau che de l’égalité (3.2
est un e mesu re d es var iation Yi aus tou
d esr de leu r moyen ne au sein de l’éch antillon d es in d ivid
i = 1, .. . , n,ces var iation s étant mesu r ées p ar les (car r és d es) d istanYices
et leur
entr e les
moyen n e. Pou r inter pr éter le memb re de dr oite, il fau t r emarqu er que
n n n
1 1 1
Ŷi = (Yi − ε̂i )= Y − ε̂i = Y,
n i=1 n i=1 n i=1
d ’ap r ès la première égalité de la prop Par r iété

con
7. séqu ent le pr emier ter me du memb re de
d r oite de l’égalité (3.25) est un e mesu re d es var Ŷiation
i autour
s d de
es leu r m oyen ne au sein
d e l’éch antillon d es in d iivid us Qu
= 1, .. . , n. an d au secon d terme de ce m emb re deil droite,
52
es t égalà ni=1 ε̂2i , qu i est un e mesu re d es var iation
ε̂i autour
s d esde leu r moyen n e, qui vau t0
d ’ap r ès la propr iété 7.
L’égalité (3.25) du th éor ème 6 est un e d écomp osition d es var
Yi en
iation
la som
s dm
ese d es
variation s de
Ŷi et d es variation s ε̂di .es
S i on r evient à l’inter pr étation du mo d èle, on Y r iap
estpdelle
étermin
que ée p ar d eu x facteu rs
n on -corr élés l’u n avec l’au tre : un facteu r pren ant la forme d ’u ne fon ction affine de la var
ex p licative d u m oXdi , èle
et un facteu r r ep r ésenté p ar tou tes les au tres variab les n on-corr él
avecX i . Par con séqu ent, les sou r ces d es var Y iation
i sontsaud es
ssi de d eux n atur es : il y a d ’un
côté la p artie d es variationYisdudees au x variation s de la variab le exp licative, et de l’au tre la
p artie d es variation Ysi de
attrib u ab le au x variation s de variab les n on -corr élées avec la variab
ex p licative.
L’égalité (3.25) trad u it cette d istin ction d an s les sou r ces d es variation Yi .sLe
ob servées d e
memb re de gau ch e mesu re les variation s ob servées
Yi . Il s’agit
d esd e la var iation totale,
sans
qu e l’on ch erch er à d istin gu er la p artie de ces variation s attrib u ab les à un e sou r ce ou à
n
au tre. On ap p elle le terme 2 , ou (S CT).
i=1(Yi − Y) v ari ation totale somme des carrés totaux
Dan s le m emb re de droite, le premier terme n 2 est un e estim ation de la p ar t d es
i=1(Ŷi −Y)
variation s dYes i qu i sont attrib u ab les au x variation s de la variab le exp licative.Ŷi es t uEn
neeffet
es tim ationE (Yi ), c’est à d ir e de la p arYtie
i qudei p eu t d ’écr ir e entièr ement comme un e fon ction
affine de la var iab les exp licative, . Par
u niqu e me nt con séqu ent, la seu le sou r ce de variab ilité de
E (Yi ) est la var iab ilité deXi . L’estimation de (Yi ) est ni=1(Ŷi − Y) 2. On
la var iab ilité deE
ap p elle le terme n 2 , ou somme de s carré s e xpliqu (S C ésE).
i=1(Ŷi − Y) v ari ation e xpliqu ée
Q u ant au secon d terme du m emb re de n droite 2 n 2 c’est un e estim ation
i=1(Yi − Ŷi ) = i=1 ε̂i ,
d e p artie d es variation Ysi dqui
es ne p eu vent être cau sées p ar d es variation
X i . C s’es
det la
p artie d es variation sYdi qui
es r es te,
ou r ésid u elle,
un e fois qu ’on a r etran ch é au x variations
desYi la part attrib uab le au x variation s de la variab le explicative. On ap p elle n 2 terme
le
i=1 ε̂i
v ariations ré sidu ,ou somme de s carré s de s ré(Ssidus
el les C R).
On p eu t d on c ré-én on cer le th éorème 6 de la façon d su
an ivante:
s le MRLS , on a SC T=
S CE + SCR. À p ar tir d e cette égalité,
on p eu t con stru ire un estimateu r de la cap acité de la
variable explicative à déterminer le niveau de la variable dép endante.
Définit ion 7 D ans le M RLS,

on appel le coeffic ie
dentdé te rmination de la régre ssion,
et on
2
noteR le nomb re dé fini par
n
2
SCE i=1(Ŷi − Y) 2
R = =
S CT n
i=1(Yi − Y) 2
Rema rque 12
1. Pu is qu e S C T = S+CESC R et qu e les tr ois som m es de cette égalité sont p ositives, ona
n écessair ement SCT≥ SCE ≥ 0 et donc0 ≤ R 2 ≤ 1. Le r ap p or t d éfi nRissant
2 s’inter p r ète
alors comme une prop ortion. Le co efficient de détermination est la part des variations ob
ser vées dYes
i qu ’on p eu t estimer êtr e attr ib uab les au x var iation s de la var iab le explic
On d ir a alor s qu ’on p eu t estimer × R 2)% d es variation s d es variab
(100que Y1, .les
. . ,Y
n
sont du es au x var iation s d es var iab les exp
X 1, licatives
. . . ,X
n ..
R 2 est un e mesur e de la cap acité d es var iab les exp licatives à fair e var ier ,
2. Le rap p ort
leu rs prop r es variation
les s,
variab les en d ogèn tr ement d Rit,2 es t u n e mesu r e de
Au es.
53
l’effet qu e les
X i p eu vent avoir sur Yles
i , c’est à d ir e un e mesu re du p ou voir exp licatif
desX i su r lesYi .
Plu s pr écisément, plus R 2 est pr o ch e dep 1, lu s la p art d es variationYsi d qu’on
es p eut
attrib u er au x variation sX d 2
i est
es gr an dDe e. f açon éq u ivalente,
p lusR est pr o ch e de
1, p lu s la p art d es variation Yi sattrib
d es ées aux variables autresXque n (et non
1, . . . ,X
corr élées auxX i ) est faib le. Au trement d it, le prin cip al d étermin ant duYni est iveau d es
le n iveau desXi. Dan s ce cas, le p ou voir exp licatif d es var iab les exp licatives est élevé.
Si R 2 est pro ch e de 0, la plu s gran de partie des variation s des
Yi est
variab
attr les
ib u ab le
au x variation s résid u elles, c’est à d ire au x variation s d es variab les au tres qu e les va
exp licatives,
et n on -cor r élées à celles-ci.
Dan s ce cas,le p ou voir exp licatif
d es variab les
exp licatives est faib le.
2
Les cas extr êmRes =0 et R 2 =1 p eu vent s’én on cer (d e man ière équ ivalente) sou s une
for me qu i p er met d ’ob ten ir d ir ectement les inter pr étations d on n ées ci-d essu s.
∃i,sij te ls q u eX
Proprié t é 8 D ans le M RLS, i =X j , alors ona
1. R 2 =1 ⇐⇒∃ (β0∗,β 1∗) ∈ Ê

2
,Y i =β 0∗ +β 1∗X i , ∀i = 1, .. . , n.
2. R 2 =0 ⇐⇒ β̂1 =0.
:
P re u ve
2 et de ona
1. En utilisant les définitionsRde ε̂i
n
R 2 =1 ⇐⇒ SC R=0⇐⇒ ε̂2i =0 ⇐⇒ ε̂i =0, i = 1, . . . ,n
i=1
⇐⇒ Yi = β̂0 + β̂1X i , i = 1, .. . ,n
où la d er n ièr e équ ivalen ce pr ovient de l’égalité

Yi = Ŷi +ˆεi et d e la d éfi n ition de
Ŷi . On voit d on c qu e l’équ ivalen ce du pr emier p oint de la pr op r iété est ob ten
ch ois iss ant
β0 = β̂0 et β1 = β̂1.
∗ ∗
2. Tou jou rs avec les mêmes d éfi n ition s, ona

n
R 2 =0 ⇐⇒ SC E=0⇐⇒ (Ŷi − Y) 2 =0 ⇐⇒ Ŷi =Y, i = 1, ... ,n
i=1
⇐⇒ Ŷi = Ŷj , i,j = 1, .. .,n
En u tilisant la d éfi n itionŶid, les

es d er n ièr es égalités sont équ ivalentesà
β̂1(X i − X j ) = 0, i,j = 1, .. . ,n
Ces n2 égalités sont tou tes vraies si et seu lement si
X i =X j , i,j = 1, .. . ,n ou β̂1 =0
R 2 =0d onc
La pr emièr e con d ition étant exclu e, on ob tient ⇐⇒ β̂1 =0.
Rema rque 13
54
1. Le premier p oint de la prop osition 8 montre clairement que lorsque R 2 =1 on estime
q ueYi est un iqu ement d éter minXéi , pi =ar1, .. . ,n. Dan s ce cas, p ou r tou t in d ividu
i, les facteu rs au tres que
X i p ou vant affecter le n iveau Yi de
sont in existants. Dan s la
for mu lation du mo dèle de régr ession lin éair e simple, cela revient à écr
εi =0 p our
ir e que
,
i = 1, .. . ,n et qu ’on p eu t écrire
Yi comme un e fon ction affin e
Xi .de
La con d itionC′
2
est dan s ce cas:
∃β0 ∈ , ∃β1 ∈
Ê Ê
t.q. Yi =β 0 +β 1xi , i = 1, ... , n.
La preuve de la prop osition 8 montre que les β0réels

et β1 qu i satis f ont nles
égalités de
la con d itionC ′
2 sont d on n és β̂p0 ar
et β̂1, resp ectivement. Tous les p oints de co ordonnées
ap p ar tien n ent à la dr oite d ’équ
(X i ,Y i ), i = 1, .. . , n, y= β̂ation
0 + β̂1x.
2. Le secon d p oint montre qu e lorsque R 2 =0, on estim e que Yi n ’est d éter min é qu e p ar
d es variab les au tres Xquei . Au tr ement d onit, estime d on c qu e lor X
sque
i var ie,cela
n ’en gen dre au cu ne variation Yi . Dan
de s le contexte d ’u n MRLS , d an s lequ el on su pp ose
q ueYi =β 0 +β 1X i +ε i , cela r evient à es tim erβ1que=0. C ’est pr écisém ent ce qu e d it
l’égalitéβ̂1 =0.
3. Le premier p oint de cette propriété laisse suggérer qu’il existe une relation entre le co effi
cient de détermination et le co efficient de corrélation linéaire empirique. On rapp elle que
le co efficient de corrélation linéaire empirique entre les variables
X et Y , notéρ(X , Y),
est d éfi ni p ar
n
i=1(X i − X)(Y i − Y)
ρ(X , Y )=
n 2 n 2
i=1(X i − X) i=1(Yi − Y)
Il p er met d ’évalu er l’inten sité d ’u ne liaison lin X éair
et Y .eOn
entre
p eu t d onc s’attendre
à ce que ce co efficient soit lié au co efficient de détermination,
pu isqu e ce d er n ier mesu re
le p ou voir exp licatif
de X sur Y au tr aver s d ’u ne liaison lin éair e du Yi type
=β 0 +
β1X i , p ertu rb ée p ar un terme
εi . L’inten sité de cette liaison lin éaire sera d ’au tant p lus
for te (et d onc|ρ(X , Y)| pro che de 1) que l’influen ceεi dsera
es faib le.
C ’est pr écisém ent
ce qu’indique le co efficient de détermination 2. La pr op r iété su ivante for malise cette
R
r em ar qu e.
Proprié t é 9 D ans le M RLS, on2 aR

= ρ(X , Y)2.
: On rap p elle que
P re u ve Y coïn cid e avec la moyen ne des valeu rs a ju stées (voir la remarqu e 11
Par con séqu ent
n n
1 1
Y= Ŷi = (β̂0 + β̂1X i )= β̂0 + β̂1X
n i=1 n i=1
Donc
n n n
(Ŷi − Y) 2 = (β̂0 + β̂1X i − β̂0 + β̂1X) 2 = β̂12 (X i − X) 2
i=1 i=1 i=1
2
2 n n
i=1(X i − X)(Y i − Y)
n
i=1 X i Yi − nXY
= 2 (X i − X) 2 = n 2
i=1(X i − X)
n 2
i=1 X i − nX i=1
où p ou r ob ten ir la d ern ière égalité,

on a u tilisé le lem meLe1.résu ltat d écou le d ir ec-
2. n ition de
tement de l’u tilisation de cette exp r ession d an s la d Réfi
55
On termine cette section en rapp elant les propriétés élémentaires du co efficient de corrélat
lin éair e emp ir iqu e.
Proprié t é 10
1. ρ(Y , X) = ρ(X, Y)∈[−1; 1].
2. ρ(X , Y ) =1 ⇐⇒∃ a ∈]0,+∞ [,∃b ∈ ,Y i =aX i +b ∀i = 1, .. . , n. De plus, ρ(X, Y )=
Ê
−1 ⇐⇒∃ a ∈] −∞ , 0[,∃b∈ ,Y i =aX i +b ∀i = 1, .. . , n.

Ê
Pou r d émontr er ces pr op riliétés,est commo de d ’intr o du ir e la n otation suΣivante:

X ,Y =
n . Ain si, on p eu t r éécrire .
i=1(X i − X)(Y i − Y) ρ(X , Y ) =ΣX ,Y / Σ X ,X Σ Y ,Y
: 1. La pr op r iété de symétr ie r ésu lte d ir ectement

P re u ve Σ Xdu fait Yque
,Y =Σ ,X . Pour tout
réelλ, on p eu t f orm er
n 2
Σ λX +Y ,λX+Y = (λX i +Y i ) − (λX +Y)
i=1
En d évelop p ant, on p eu t écr ire

n 2
Σ λX +Y ,λX+Y = λ(X i − X) + (Yi − Y) =λ 2Σ X ,X +Σ Y ,Y + 2λΣX ,Y (3.26)
i=1
C ette exp r ession p er met de conΣ λXsid ér er com me un p olyn ôm

+Y ,λX+Y λ∈e en
. Ê
On n ote qu e ce p olyn ôme est tou jou rs p ositif (il p

oueu
nul
t s’exp r imer comme
u ne somme de car r és). Par con séqu ent, son d iscr imin ant d oit n écessair emen
n égatif ou nu l. Au trementon doit avoir4Σ2X ,Y − 4ΣX ,X Σ Y ,Y ≤ 0, ou en core
d it,
Σ 2X ,Y
Σ X ,X Σ Y ,Y ≤ 1, c’est à direρ(X , Y)2 ≤ 1. D’où le r és u ltat.
2. Su pp oson s qu ’il existe daes etrb,éels
aveca=0 , tels queYi =aX i +b, p our tout
i = 1, .. . , n.Ona Yi − Y =a(X i − X) p our touti et on vér ifi e alor s facilement
q ueΣ Y ,Y =a 2Σ X ,X et queΣ X ,Y =aΣ X ,X . Par con séqu ent,
ρ(X , Y ) =1si a>0
et ρ(X , Y )=−1 si a<0 .
S up p osons
mainten antque |ρ(X , Y)| =1 , ou de man ièreéq u ivalente, que
2 2
ρ(X , Y) =1 . C ela équ ivau t auà ssi
Σ X ,Y =Σ X ,X Σ Y ,Y . Le d iscr imin ant du p o-
lyn ôme intr o du it en (3.26) est alor s nu
ad lmet
et ilun e r acine un iqu e,λ∗ n. otée
D’ap r ès (3.26), on p eu t écrire
n 2
λ∗(X i − X) + (Yi − Y) =0
i=1
C ette somme de car r és est nuetlle seu

si lement tous
si les car r és sont nuls.
On
doit d on c avoir
∗ ,
λ (X i − X) + (Yi − Y) = 0, ∀i = 1, .. . ,n ou en core
Yi =aX i +b, i = 1, .. . ,n
aveca= −λ∗ et b =λ ∗X +Y . Fin alement, on étu d ie le signe de

a. Notons
qu e la racine λ es t égaleà−Σ X ,Y /Σ X ,X . Don c,sou s l’hyp oth èse in itiale que
∗
|ρ(X , Y)| =1 ,ona a>0 ⇐⇒ Σ X ,Y >0 ⇐⇒ ρ(X , Y ) =1et d onca<0 ⇐⇒

Σ X ,Y <0 ⇐⇒ ρ(X , Y )=−1.
56
3.5 Estimation d es varian c es
3.5.1 E st imat ion de la variance des t ermes d’erreur
C omme on le ver ra d an s la section su ivante, on ne p eu t se contenter d ’u ne simp le est
de β0 et deβ1. On sou h aite p ar exem p le d isp oser d ’u ne mesu re de la pr écision de l’estim
ob tenu e. Pu isqu e les estimateu rs Moin dr es Car r és sont san s b iais, on p eu t mesur er leu
p ar la var ian ce de ces estimateuNours.
s avon s vu d an s la pr opr iété 6 à l’équ ation
et (3.18),
d an s le corollaire qui
suit, que les variances d es estimateurs Moindres Carrés d ép end ent de la
σ2 d es termes d ’errεieur
var ian ce . Or la valeu r de celle-ci est in con nu e. Dan s cette section , on
p r ésente un e façon d ’estimer cette var ian ce b asée su r le r és u ltat su ivant.
Propriété 11 D ans le M RLS, si le s paramè0 tre

etβsβ
1 sont ide ntifié s, ona
n
E ε̂2i =(n − 2)σ2.
i=1
: Ona
P re u ve
ε̂i =Y i − Ŷi =β 0 +β 1X i +ε i − β̂0 − β̂1X i [par définition des
Ŷi ]
=β 0 +β 1X i +ε i − Y+ β̂1X − β̂1X i [par définition dê
β0]
=β 0 +β 1X i +ε i − β0 − β1X − ε+ β̂1X − β̂1X i [par calcul de
Y]
=ε i − ε − (X i − X)( β̂1 − β1)
Donc
ε̂2i =ε 2i + ε2 +(X i − X) 2(β̂1 − β1)2 − 2εi (X i − X)( β̂1 − β1) − 2εi ε + 2ε (X

i − X)( β̂1 − β1)
et
n n n n
ε̂2i = ε2i +n ε2 +( β̂1 − β1)2 (X i − X) 2 − 2(β̂1 − β1) (X i − X)ε i − 2nε2
i=1 i=1 i=1 i=1
n
+2ε(β̂1 − β1) (X i − X)
i=1
Le d er n ier ter me du memb re de dr oiteD’au est nu
trel.p art,
en u tilis ant l’exp r es s ion
(3.12) de n n 2 Par con séqu ent,
β̂1, on p eu t écrire
i=1(X i −X )εi =( β̂1 −β1) i=1(X i −X) .
n n n
ε̂2i = ε2i − (β̂1 − β1)2 (X i − X) 2 − nε2
i=1 i=1 i=1
Par con séqu ent, si on calcu le l’esp ér an ce, on ob tient
n n n
E ε̂2i = E (ε2i )+ E (β̂1 − β1)2 (X i − X) 2 − nE (ε2) [lin éar ité de l’esp ér an ce]
i=1 i=1 i=1
n n n
2 n 2 ′ 4 ;E
= nσ − V (β̂1) (X i − X) − 2 E (εi εj ) [con d itionC (β̂1) =β 1]
i=1
n i=1 j =1
n
12 2
= nσ − σ − E (ε2i ) ′ 4 ; exp r es sion d eV
[con ditionC (β̂1)]
n i=1
= nσ2 − σ2 − σ2
57
2
C orollaire 2 D ans le M RLS, la variable aléatoire
dé finie
ˆσ par
n
2 1
ˆσ = ε̂2
n − 2 i=1 i
2
e st un e stimate ur sans biais de σ.EOna
( ˆσ) =σ 2.
3.5.2 E st imat ion de la variance des est imat eurs Moindres Carrés
C omme mention nn é à la r emar qu e 8 les var ian ces con d ition n elles d es estimateu rs
2 l’est.
Carr és ne sont in con nu es qu e p σarce queCep endant, le résultat précédent nous p ermet
d e for mer d es estimateu rs d es var ian ces con d ition n elles.
Propriété 12 D ans le M RLS, si le s paramè

0 etβ
tre 1sβ
sont ide ntifié s, le s v ariab le s aléatoires
V̂ (β̂0) et V̂ (β̂1) dé finies par
2 2
2 1 X ˆσ
V̂ (β̂0) = ˆσ + n et V̂ (β̂1)= n
n 2 2
i=1(X i − X) i=1(X i − X)
V (β̂0)de
sont de s e stimate u rs sans biais et V (β̂1), re spec tive me nt.
: Il fau t montrer qu eE
P re u ve V̂ (β̂k ) = V (β̂k ), k = 0, 1.C ’es t un .
Exerci ce
58
C h ap i tre4

s im pl e : tes ts et régi ons de confian
Dan s cette section,

on s’intér esse d’u ne au tr e man ièr e au x par amètres d’intér êt du mo d
d e r égr ession lin éair e simp
Le problème
le. d’inférence ab ordé est d
celui
es tests d ’hyp oth èses
su r ces p ar amètrLaes.
d émar ch e ser a évid emment celle r ap p elée à la section section 1.3.2.
L’assimilation de cette section est d on c un pr éalab le à la lectu re de ce ch ap itr e.
4.1 L e c ontex te
J u squ ’à p r ésent,
n ou s avon s étu d ié le pr ob lème de l’estimation d es p ar amètr es du MRL
Comme r ap p elé d an s le ch ap lesitre
prop
1, r iétés d ’u n estimateu r s’étu d ient en calcu lant son
esp ér an ce ou sa var ian ce (ou son er reu r qu ad ratique moyen ne). Pou r qu ’u ne telle étu d
sib le, il fau t qu e la sp écifi cation du mo dèle p ermette ces calcu ls. Nou s avon s pu dan s le
p r écédent étud ier le b iais β̂0 et
dedeβ̂1 en u tilisant les con d ition s C1 et C2 entrent
qui d ans
la sp écifi cation du mo dèle. En effet, la première nou s p ermet de X 1con
, . . .sid
,Xn érer
com me
des nomb res (n on aléatoires) et la secon de nou s p ermet de calcu ler l’esp Y1, . .érann . ce de
. ,Y
Par con séqu ent, le calcu l de l’esp érβ̂1an (pcearde
exemp le), p er mettant d ’ap pr écier le b iais de
cet estimateuest r, p ossib le, pu isqu ’il revient à calcu ler l’esp ér an ce d’u ne comb in aison lin
de Y1, . . . ,Y
n , ce qu e nou s p ou von s faire grâce au x con dition s C1 et C2.
De mêm e, p ou r montrer qupe, ar mi tou s les estimateu rs lin éair es et san s b β1iais
, β̂1 de
était celu i qu i avait la p lu s p etite var ian ce, il était n écessair e de p ou voir u tiliser l’exp r e
la varian ce dê
β1. Ce calcula été p ossible grâce à l’a jout de la condition quiC3,
n ous d on ne
l’exp r ession d es covar ian(Yces cov
i ,Y j ), de laqu elle on d éd u it l’exp r ession
(β̂1) deV
.
Si on s’intér esse mainten ant à un pr ob lème n deoutest,
s savons,
comme cela est r ap p elé
dan s la section 1.3.2, qu ’il est nécessair e de p ou voir effectu er des calcu ls de risqu es. Ces d
étant défi nis comme des pr ob ab ilités de commettr e des er reu rs, il fau t p ou r cela disp ose
p ermettant de faire les calculs. Notons que dans le MRLS tel que défini par les conditions C1,
C2 et C3, r ien ne n ou s p er met de fair e de tels calcu ls, d ès qu e ceu x-ci p or tent su r d es
qu i sont d es fon ctionY1s, .de n . Il fau t don c préciser la défi nition du mo dèle en lu i a jou tant
. . ,Y
d es con d ition s qu i p er mettr ont d ’effectu er le calcu l d es r isqu es.
Plu sieu rs ap pr o ch es sont p ossib
Celle les.
qu e n ou s ad op teron s (la p lu s simp le) con sisteà
59
intro du ire les lois p ermettant le calcu l des prob ab ilités d’erreu rs dan s la défi nition du mo d
Nou s mo difi on s la défi nition du MRLS en a jou tant au x con ditions qu i le défi nissent (C1 à
ouC ′ 1 àC ′ 3) la con d itionC ′′ N su ivante:
C ′′ N. (ε1, . . . ,ε
n ) es t un n-u p let gaussien
On rap p elle que n variab les aléatoires formentnun
-u p let gaussientou si te comb in aison
lin éaire de ces variab les d éfi n it un e variab le aléatoire gaussien
i .e .,d ont lane(
loi de prob abilité
est un e loi n or m ale). VO IR RAPPELS
De même qu ’u ne var iab le aléatoir e gau ssien ne (ou n or male) est entièr ement car acté
p ar son esp éran ce et sa varian un nce,
-up let gau ssien n ) est entièr ement car actér isé
(U1, . . . ,U
par len-u p let d ’esp ér anE (Uces E
1), . . ., (Un ) et p ar la matr ice d es
variances- dont
covariances
l’élément con stitu tif est(Ucov
i ,U j ).
Il est sou vent commo de de con sidnér variab
er le les aléatoires n comme les co or-
U1, . . . ,U
n .1 On
d on n ées aléatoires d ’u n vecteu r denoteU =(U 1, . . . ,U ⊤ ce vecteu r. L’esp ér an ce de
Ê
n)
ce vecteu r est par défi nition le vecteu r des esp ér an ces et(U) la var
du vecteur
ian ceV
U ser a la
matr ice d es var ian ces-covar ian ces:
 V (U1) cov(U1,U 2) ··· cov(U1,U n )
 E (U1) 
..  cov(U2,U 1) V (U2) ··· cov(U2,U n )
E (U )=  .  et V (U )=  . . .. .. 
   .. .. . . 
   
E (Un )  
cov(Un ,U 1) cov(Un ,U 2) ··· V (Un )
Dan s le cas où n f or m ent n
U1, . . . ,U un
-up let gaussien , la d onn ée(U)deE
etV (U) p er m et de
déter min er complètement la loi de n’imp or te qu elle comb in aison U1, .lin
. . éair
n p e
,U u de
is que
ces comb in aison s lin éaires sont d gau
es ssien
v.a. n es et d on c entièrement caractérisées p ar leur
esp ér an ce et var ian Cesce.par amètr es sont resp ectivement des comb in aison s lin éair es des é
ments d eE (U) et d es for mes qu ad r atiqu (U) es .deV
Dans le cas d ’un vecteu r gau U, ssien
la
loi de U est d on c entièr ement car actér isée p ar la d (U) on netée
deV
deE(U ). Dan s le cas où
cette d on n ée estE
(U ) =µ etV (U ) = Ω,on noteU ∼N (µ , Ω ), ou p ar f ois
U ∼N n (µ , Ω ), p our
in d iqu er la d imen sion U. de
En r even ant d an s le contexte du MRLS, si on con sid èrenle
-u p let n ) com me les
(ε1, . . . ,ε
co ordonnées du vecteur
ε= (ε 1, · ·· ,ε n ) , on a d ’apr ès la con d itionC
⊤ ′ 3 et la d éfi n ition d es
termes d ’err eu r:
 σ2 0 ··· 0
 0
 0 σ2 ··· 0
E (ε)=  ...  =0 n V (ε)=  . .. . . ..  =σ 2I n
   .. . . .
   
0  2

0 0 ··· σ
où 0n d ésign e le vecteu rde nuln et I n la matrice id entité de
Ê
n vers Ê Ê
n. Avec la con d ition
su p p lém entair
′′ N,eC
ε ∼N (0n ,σ 2I n ).
on au ra
1
Ce ty p e de construction faisant apparaître des vecteurs dont les co ordonnées sont aléatoires est fréq uent et
ap paraît de man ière assez naturelle. Par ex emple dan s le contex te d’u n ex p érien ce aléatoire classiq ue, comm
lancer d ’une p ièce, au lieu de s’intéresser au résultat p ile ou face du lancer (c’est à d ire le côté sur leq u el retom
la p ièce lan cée) on p eu t s’intéresser au p oint le p lu s h au t atteint p ar la p ièce lorsDde
e mêm
son lane qcer.
ue
le côté sur leq uel retomb e la pièce est considéré comme aléatoire car ne p ouvant être connu avec certitude avant
le lan cer,ce p oint le p lu s h au t sera aussi
con sid éré comme aléatoire.
Un p oint p eu t se d écrire au moyen d ’un
triplet de co ordonnées dans l’espace. Dans le cas du p oint le plus haut atteint par la pièce au cours de son lancer,
3
chacune de ces co ordonnées sera aléatoire. Le triplet co ordonnées, ou vecteur , sera d
Ê
deon c aléatoire.
60
On s’ap erçoit donc que le MRLS défini p ar les cond ition′ 1sCàC ′ 3 etC ′′ N p eu t au ssi
se
d éfi n ir de man ière équ ivalente p ar les con ′ 1,C
d ′ition
2 etCsC
′ N, où cette d er n ièr e est
2
C N. ∃σ ∈]0,+∞ [, ε ∼N (0n ,σ I n ).
′
O n ap p ellemodè le de rég re ssion linéaire simple g(MR L S G p ar la s u ite) le m o d èle

au ssien
d éfi ni
p ar les cond ition ′sC
1, C′ 2 etC ′ N. Ce mo d èle ser vir a de contexte d an sser lequ
ontel
con str uits des tests p er mettant de tester des hyp oth èses for mu lées su r les par amètr es d
Nou s avon s montr é qu e le MRLS ad met d eu x d éfi n ition s l’u équneivalentes,
exp r imée au
moyen de con d ition s p ortant su r les propYr1,iétés nde
. . . ,Y et l’au tre au moyen de con d itions
p ortant sur les propriétés n . Il en est de même p ou r le MRLS G, ain si qu e le montr e la
ε1, . . . ,ε
p r op r iété su ivante.
Y =(Y 1, . . . ,Y ⊤ ⊤ ⊤ n
Propriét é 13 D é fini ssonsY n ) , X =(X 1, . . . ,X
n ) etι n = (1, . . . ,1) ∈ .Ê
C′ 1, C ′ 2 et C′ N sont vé rifiée s si et se u le me nt si le s C1
Le s conditions et CN le sont
conditions
CN étant dé finie par
au ssi, la condition
CN. ∃β0 ∈ , ∃β1 ∈ , ∃σ ∈]0,+∞ [, Y ∼N (β0ιn +β 1X ,σ2I n ).
Ê Ê
:C 1 etC ′ 1 sont la m ême con d ition.

P re u ve Montron s alors qu eC ′ 2 etC ′ N s ont éq u ivalentes
à CN. Su pp oson s qu′ 2eC etC ′ N soient vr aies. Avec les n otation s intr o duCites, ′
2
s’écr it:∃β0 ∈ , ∃β1 ∈ ,YY =β 0ιn +β1X +ε. Soienta1, . . . ,a
Ê Ê
n ,n réels qu elcon qu es. La

comb in aison lin éaire n deY1, . . . ,Y n n
i=1 ai Yi n es t égaleà i=1 ai (β0 +β1X i )+ i=1 ai εi .
Pu isqu e n ou s avon s su pp ′ N,oséCn est un e variab le aléatoire gau ssien ne et
i=1 ai εi
en lui ra jou tant le n omb re r éel n on ob tient en core un e variab le
i=1 ai (β0 +β 1X i )
aléatoire gau ssienLe n e.
ch oix de n étant quelcon qu
a1, . . . ,a one,en d édu it que tou te
comb in aison lin éaire Y1,de. . . ,Yn est un e var iab le aléatoir e gau ssien n e. Par con séqu en
le n-u p let n ) est gau ssien.
(Y1, . . . ,Y Sa loi est d on c car actér isée p ar son esp ér an ce
E (Y
Y) et sa varian ceV Y ).
(Y On aE (YY )= E (β0ιn +β 1X +ε), au tr ement d (Y itEi )=
E (β0 +β 1X i +ε i ) =β 0 +β 1X i , i = 1, .. . , n. Le vecteu rE(Y ) est don c égalà
 β0 +β 1X 1  β0  β1X 1
E (Y .. . .
 =  ..  +  ..  =β 0ιn +β 1X
Y )= 
 .     
     
β0 +β 1X n β0 β1X n
Par ailleu r s,
la matr iceV(YY) a p our(i, j) e élément le n omb re(Y cov
i ,Y j ). Or ona
montr é (voir l’égalité (2.3) p age 31) qu e cov
(Yi ,Y j )= cov
(εi ,ε j ), ∀i,j = 1, .. . , n.Les
matr icesV Y) etV (ε) ont d on c le même élément con stitu
(Y et sonttif p ar con séqu ent
égales.C om me on a su p p oséC N vérifi ée,
on a alor sV(Y 2
′ Y ) =σ I n . Fin alement, ona
montr é qu e siC 1,C 2 etC N sont vr aies, alors 2
′ ′ ′
Y ∼N (β0ιn +β 1X ,σ I n ), et C N est
d on c également vraie.
S up p oson s mainten ant qu e C1 et CN soient vr aies. ′ 1 l’est
Alor
for
sCcément. De p lu s,
on p eut d éfiεin=Y ir i −(β0+β1X i ), i = 1, ... ,net don cC ′ 2 est vér ifi ée. De p lu s, comme
n ) est gau ssien , en su ivant la même d émar ch e qu e pron

(Y1, . . . ,Y écéd
d éd emment,
u it
q ue(ε1, . . . ,εn ) est égalem ent gaussien.Fin alement, on ob tientcomme au p ar avant
(p age 31) queE (εi ) =0 ∀i = 1. .. ,n et qu e cov
(εi ,ε j )= cov(Yi ,Y j ) ∀i,j = 1, .. ., n.
Par con séqu ent, avec n ) , on ob tientE
ε= (ε 1, . . . ,ε ⊤
(ε) =0n etV (ε)= V (Y Y ) =σ 2I n .
Don c en r ésu mé, ε ∼N (0n ,σ I n ). La con d itionC
2 ′ N est d on c vér ifi ée.
On p eu t for maliser la pr op riété pr écéd ente en intr o du isant un e d éfi n ition du MRLS G
61
Définit ion 3 Soie nt 1(X ,Y 1), . . . , (Xn ,Y n ) n cou ple s de v ariab le s aléatoire s dont le s ob se rv a-
tions sont notée 1s,y(x
1), . . . , n
(x,y n ). Le modèle de régression linéaire simple g au ssien (M RLSG)
de Y su r X e st un modè le statistiqu e dansleleq C1 et CN sont satisfaite s. De
s conditions
uel
maniè re éq uiv ale nte , ce modè le e st ég ale me nt dé finit par C′ 1, le
C′ 2 et C ′ N.
s conditions
La figu re 4.1 illu str e la mo délisation entr e les var iab les exp licatives et expliquées retenu
le MRLS G. Par r ap p or t au MRLS , le MRLS G a jou te la con dn-u ition
p let
que
(Y1, le
. . . ,Yn ) est
gau ssien . Pou r rep résenter cet a jou t de con dition gr ap hiquement, on p eu t a jou ter au gr
2.1 un e3 e d imen sion (ver ticale)pqui ermet de r ep r ésenter le caractère gau ssien d es variab les
ex p liqu ées n . La dr oite r ep r ésentant d an s le p lan la r elation
Y1, . . . ,Y (Yi )entr
et xeEi , p our
i = 1, ... ,n est d’ab ord tracée. Pou r ch aqu e in d ividu
i, on r ep r ésente p ar•un le cou p le
d ’ob ser vations
(xi ,y i ) ain siqu e,en u tilisant la d imen sion ver ticale,
la d ensité (gau ssienn e) de
Yi (courb e « en clo che »). Cette variable aléatoire gaussienne est d’esp(Yi ) éranceE
et d ’écar t-
ty peσ. On rap p elle qu e ces deu x paramètres détermin ent entièrement la forme de la den sit
d ’u ne variab le aléatoire gau ssien Plu s npre.écisément,
l’esp ér an ce d éter min e l’emp lacement de
la cou rb e de la den sité (p lu s exactement de son axe de symétr ie) et l’écar t-typ e déter min
for me de cette d en sité (son car actèr e p lu s ou moin Pars ap
conlati).
séqu ent, d an s le cas du
MRLS G, les d en sitésYide et Yj sont r esp ectivement situ ées au tou (Yi ) ret
deE
deE(Yj ) et ont
le même for me, pu isqu e d an s ce mo d èle les écar Yi etts-typ
Yj sont
e de
les m êm es.
L’a jout de la condition CN dans la définition du MRLS p ermet d’affiner les résultats obtenus
su r les estimateu rs Moin dr es C ar βr0és
etde
β1. Il est commo de d ’intr o du ir e les n otations
s u ivantes:
β̂0 et β= β0
β̂=
β̂1 β1
β̂ est don c un vecteu r aléatoir 2e et

deβ est u n élém ent de
Ê
2
. Ê
Propriét é 14 D ans le M RLSG, le couβ̂0ple( β̂ ∼N (β, V ) où V =σ 2v

, β̂1) e st g au ssie n. Ona
av ec
2
 1 X −X 
+ n 2 n 2
n i=1(X i − X) i=1(X i − X) 
v= 


 
 −X 1 
 
n 2 n 2
i=1(X i − X) i=1(X i − X)
: D’ap r ès la propr iété

P re u ve β̂0 3,
et β̂1 sont d es estimateu rs lin éairβ0esetde β1, r es p ective-
ment,d e la f or me n n
β̂0 = i=1 ˆw 0i Yi et β̂1 = 1i Yi , où ˆw
i=1 ˆw 01, . . .,̂ w
0n , ˆw
11, . . .,ˆw
1n
sont d es r éels con Soient
nu s. a0 et a1 d es réels qu elcon qu La es.
comb in aison lin éaire
a0β̂0 +a 1β̂1 de β̂0 et β̂1 s’écr it
n n n
a0β̂0 +a 1β̂1 =a 0 ˆw
0i Yi +a 1 ˆw
1i Yi = (a0ˆw
0i +a 1ˆw
1i )Yi
i=1 i=1 i=1
c’est-à-d ir e comme un e comb in aison Y lin

1, éair e. de
. . . ,Y
n Le n-u p let n ) étant
(Y1, . . . ,Y
gau ssien , cette comb in aison lin éaire est un e variab le aléatoire gau ssien a0 n e. Les r é
et a1 étant qu elcon quon es,en d éd u it qu e tou te comb in aison lin β̂0éaire
et dedeβ̂1
d éfi n it un e variab le aléatoire gau ssien n e. Le cou
(β̂0, β̂1) est
p d
leon c gau ssien.
62
Densités (gaussiennes) des v.a. Y1 , . . . , Yn
Y
ble
ria
va
la yj
de
rs E (Y ) y=β 0 +β 1x
leu j
Va
E (Yi )
yi
xi xj
Valeurs de la variable X
Fig. 4.1 – Mo délisation de la relation entre variables dans le MRLSG
Par ailleu r s, ona
β̂0 E (β̂0) V (β̂0) cov(β̂0, β̂1)

E (β̂ )= E = et V = V (β̂ )=
β̂1 E (β̂1) cov(β̂0, β̂1) V (β̂1)
Les exp r ession s (deE

β̂0), E (β̂1), V (β̂0) etV (β̂1) ob tenu es d an s le ch ap itre précéd ent
l’ont été d an s le contexte du MRLS, c’est-à-d ir e en su pp osant les con d ition
C2 s C 1,
et C3 vér ifi ées.
Dan s le MRLS G, ces con d ition s sont évid emment également vér ifi ées,
p u isqu e le MRLS G s’ob tient (p ar exemp le) en ra jou tant la′′ N cond
au xitionC
cond i-
tion s qu i d éfi n issent le MRLS . On a d on c d an s le MRLSG
β̂0 β0
E = =β
β̂1 β1
d ’ap r ès la prop r iété 5. De p lu s, d ’ap r ès le corollaire 1, on a au ssi

2
1 X σ2
V (β̂0) =σ 2 + n
et V (β̂1)= n
n 2 2
i=1(X i − X) i=1(X i − X)
Il r este à d éter min er l’exp r ession

(β̂0de
, β̂1cov
). Pou r cela,on u tilis e le f ait que
β̂0 et
63
β̂1 sont lin éair es. Ain si ona
n n n n
cov(β̂0, β̂1)= cov ˆw
0i Yi , ˆw
1j Yj = ˆw 1j cov(Yi ,Y j ).
0i ˆw
i=1 j =1 i=1 j =1
C omme d an s le MRLS G on (Y
a icov
,Y j ) =0 d ès que
i= j, on p eu t écrire
n n
cov(β̂0, β̂1)= 2
ˆw 1i V (Yi ) =σ
0i ˆw ˆw
0i ˆw
1i .
i=1 i=1
En u tilis ant l’exp r es sion0idobtenue

ˆw es d ans la preu ve de la prop r iété 3, ona
n n n
1 σ2
cov(β̂0, β̂1) =σ 2 ( − X ˆw
1i ) ˆw
1i = ˆw 2
1i − σ X
2
ˆw
1i .
i=1
n n i=1 i=1
Dan s la prop r iété 5, on a montré ni=1

que 1i =0 et on a p ar con séqu ent
ˆw
n
−σ2X
cov(β̂0, β̂1)= −σ2X 2
ˆw
1i = n 2
i=1 i=1(X i − X)
où la d er n ièr e égalité est ob tenu e en u tilisant l’exp

ˆw1i d
r ession
onn ée de
d ans la preu ve
d e la prop r iétéOn
3. en con clu t qu e la matr ice V a b ien l’exp r ession d on n ée d ans
l’énon cé de la propr iété.
C orollaire 3 Dans le M RLSG, le s estimate u rs M oindre s Carré

0 et
s deβ
deβ1 sont de s va-
riab le s aléatoire s g au ssie nne s. Ona
2
1 X σ2
β̂0 ∼N β0,σ 2( + n 2
) β̂1 ∼N β1, n 2
n i=1(X i − X) i=1(X i − X)
Pou r ter min er cette section , on comp lète le r ésu ltat ob tenu
β̂.su r la loi de
Dé finit ion4
1. Laloi duχ 2 à m deg ré s de libe rté e st la loi su iv ie par la somme de s carré s de m v aria
aléatoire s g au ssieNnnes(0, 1) indépendantes. On note cette2(m loiχ).Au tre me nt dit, si
m 2
(Z1, . . . ,Z
m ) est un m- u ple t gau N
ssien
(0 ,I
m m ), alors Z
j =1 j ∼ χ 2(m ).
2. La loi de Stu de nt à m deg ré s de libe rté e st la loi de la v ariab le aléatoire T dé finie par
Z
T=
C
m
où Z et C sont de s v ariab le s aléatoire s indé pe ndante s et ∼N

te l (0,
le s1) eZ∼
quetC
χ 2(m ). O n noteT∼ τ (m ).
On ad mettr a le r ésu ltat su ivant.

n 2
i=1 ε̂i 2
Propriét é 15 D ans le M RLSG, la variab le aléatoire suit une loi duχ à(n −2) deg rés
σ2
de libe rté s. De plu s, ce tte v ariab le aléatoire e st indé β̂.pe ndante de
64
C orollaire 4 D ans le M RLSG, quels que soient les0 réelsa
eta 1, ona
a0(β̂0 − β0) +a1(β̂1 − β1)
∼ τ(n − 2)
a20V̂ (β̂0) +a21V̂ (β̂1) + 2a0a1cov
ˆ (β̂0, β̂1)
où V̂ (β̂0) et V̂ (β̂1) sont le s v ariance s e stimée β̂0 et

s de
β̂1 dont le s e xpre ssions sont donnée sà
la propri é té 12, et cov
ˆ (β̂0, β̂1) la cov ariance e stimée eβ̂0ntre
et β̂1, dé finie par
2 −X
cov
ˆ (β̂0, β̂1) = ˆσ n
i=1(X i − X) 2
: On sait d ’ap r ès la prop r iété 14 qu e la variabale
P re u ve aléatoire
0β̂0 +a1β̂1 est gau ssien n e. On
calcu le alors son esp éran ce et sa varian ce.
E (a0β̂0 +a 1β̂1) =a 0E (β̂0) +a1E (β̂1) =a 0β0 +a 1β1
Par ailleu rs
V (a0β̂0 +a 1β̂1)= V (a0β̂0)+ V (a1β̂1) +2cov(a0β̂0,a 1β̂1)

=a 20V (β̂0) +a21V (β̂1) + 2a0a1cov(β̂0, β̂1)
Donc
a0β̂0 +a 1β̂1 ∼N a0β0 +a 1β1,a 20V (β̂0) +a21V (β̂1) + 2a0a1cov(β̂0, β̂1)
et p ar con séqu ent,
a0(β̂0 − β0) +a1(β̂1 − β1)

∼N (0, 1) (4.1)
a20V (β̂0) +a21V (β̂1) + 2a0a1cov(β̂0, β̂1)
n 2
2 (voir
Notons que d ’ap r ès la d éfin ition i=1 ε̂i
de corollaire 2) et la prop r iété 15,
ˆσ =
σ2
2
ˆσ
(n − 2) 2 ∼ χ 2(n − 2) et est indép endante de la variable aléatoire en (4.1). Par consé-
σ
qu ent, en u tilisant d ir ectement la d éfi n ition pr écéd ente de la loi de S tu d ent, ona
a0(β̂0 − β0) +a1(β̂1 − β1)

a20V (β̂0) +a21V (β̂1) + 2a0a1cov(β̂0, β̂1)
∼ τ(n − 2) (4.2)
2
(n − 2)σ̂σ2
n−2
C omme cela ap p araît à la pr op r iété 14, ona
V (β̂0) =σ 2v00 V (β̂1) =σ 2v11 cov(β̂0, β̂1) =σ 2v01
où vjk es t le(j, k)e ter me de la matr vice

d éfin ie d ans la propr iété 14. Si on sub stitue
ces exp r ession s et simp lifi e les(nter
−2)m σ2, la variab le aléatoire d an s 4.2 s’écrit
etes
donc
a0(β̂0 − β0) +a1(β̂1 − β1)
a20σ2v00 +a 21σ2v11 +2a0a1σ2v01 a0(β̂0 − β0) +a1(β̂1 − β1)
=
σ̂2
(n − 2) σ2 a20V̂ (β̂0) +a21V̂ (β̂1) + 2a0a1cov
ˆ (β̂0, β̂1)
n−2
65
Un cas par ticu lier imp or tant du résultat pr écéd ent est ob tenu(a
en
0,ach
1) oisissant
= (0, 1)
ou bien(a0,a 1) = (1, 0).
C orollaire 5 Dans le M RLSG, on a pour k = 0,1

β̂k − βk
∼ τ(n − 2)
V̂ (β̂k )
4.2 Test d ’u ne hyp oth èse simp 1le su rβ

4.2.1 Le problème de test
Le p ar amètre
β1 est le p ar amètr e essentiel
d an s le MRLS (G). En effet,ce mo dèle a été
constru it afin de fournir un cadre d ’étude d ’une relation supp osée exister X et Y.
entre
Plus
p r écisément, ce mo d èle stipYuest
le que
un e fon ction affinXe et dep ar con séqu ent la man ière
dont Y dép end de X p eu t se mesu r erβ1p=ardd XY . Un e qu estion essentielle (et qu i a d éjà été
ab ordée à la section 3.4.2) est celle de l’existence d’une telle dép endance.
Pou r étu dier cette qu estion , on p eu t p oser et résou dr e le pr ob lème de test su ivant:
H 0 :β 1 =0 H 1 :β 1 =0
Résou dr e ce pr ob lème con siste à se fi xer unα n∈iveau]0, 1[pu is à ch oisir un e statistique
n ,Y n ) et un e r égion
Sn =S (X 1,Y 1), . . . , (X S de tels que
Ê
1. H 0 ser a r ejetée si et seu lement si l’évèn Sn ement

∈S s e r éalis e;
2. lor squeH 0 est vr aie, la pr ob ab ilité qu e cet évèn ement se r éalise ne α. d ép asse p as
La pr emièr e con d ition d éfi n it le test p aronlequ
ch oisit
el entreH 0 et H 1. En r ep r en ant la
n otation de la section 1.3.2, ce test ser a d éfi ni p ar

 1 si Sn ∈S
ϕ(X 1,Y 1), . . . , (X
n ,Y n ) =
0
sin on
La secon de con d ition imp ose au testd ch
’avoir
oisi le niveau
α : le r is qu e d e typ e 1 d e ce test
n e d ép asse αpas
.
Pou r un n iveau α fi xé,le ch oix de la statistique
Sn (ou, de man ièr e équ ivalente,de la
fon ctionS ) et de la régionS tel qu e les d eu x con d ition s ci-d essu s sont satisfaites n ’est p as
un ique. Au tr ement dit, p ou r le pr ob lème de test p osé, il existe plu sieuα. rsPour
tests de niveau
ch oisir p ar mi d eu x de ces tests, il fau dr a évalu er leu rs risqu es de typ e 2 et reten ir le tes
risqu e de typ e 2 est le plu s p etit. De man ièr e plu s gén ér ale, en su ivant l’ap pr o ch e du e
et Pearson (voir p age 22), il fau t ch erch er p armi tou s les tests
α celu
de i,n s’il
iveau
existe, d ont
le r isqu e de typ e 2 est le p lu s faib le.
Comme p our le problème de l’estimation, on ab ordera dans un premier temps la résolution
de ce prob lème par un e ap pro ch e intu itive ; on présentera en su ite un e ap pro ch e th éori
p ar l’ap pr o ch e u su elle d es tests statistiqu es.
On mention ne fin alement qu e tou tes les défi nition s et résultats ob β1 tenu
et le sprpo-
our
blème de test H 0 :β 1 =0 contreH 1 :β 1 =0 se tr an sp osent dir ectement au par amètr e d’or don-
n ée à l’origine
β0 en ch an geant simp lement l’in 1 et
d in
icedice
0 (sau f p ou r la d ésign ation d es
hyp oth èses et
H 0 H 1, bien enten d u).
66
4.2.2 Appro che int uit ive
Cette appro che rep ose sur l’enchaînement suivant. β1 n’est pas con nu,mais n ous p ou vons
en avoir un e b on ne estimation , f ou β̂1rn
, leieppluars pr écis d es estimateu rs lin éair es san s b iais.
Pour décid er β si1 est nu l(H 0 est la b on ne hyp oth èse) ou H 1pest
as(la b on ne hyp oth èse), on
p eut se baser sur l’observation de la valeur β̂1. Endeeffet, pu isqu e ce d er n ier est un b on estim a-
teu r de
β1, il est prob ab le d ’ob server
β̂1 est
que pr o ch e de 0 lorHsque
0 est vr aie. Au tr ement d it,
si on est amen é à ob ser ver β̂1 est
queéloign é de 0, on ob serve un évèn ement d ont la prob ab ilité
d’o ccurrence est faible lorsque H 0 es t vr aie. On ju ge alor s que H 0 n ’est p as vr aisemb lab le au
vu de ce qu ’on ob ser ve et on rHejette 0.
Dan s un e telle appro che, il f aut se fi xers,un avec
seuil
s ∈]0,+∞ [, p er mettant d ’exp r im er
« β̂1 est trop éloign é de 0 » au moyen d ’u ne in égalité |β̂1| telle
>s. En que
r ep r en ant la d émarche
gén ér ale de con str u ction d es tests exp osée d an s lalasection s tatis 1.3.2,
tique
Sn es t iciégale
à |β̂1| et la région cr itiqueS , con stitu ant l’en semb le d es valeu rs de la statistiqu e qu i sont p e
vr aisemb lab les lorHsque 0 est vr aie, est
S = ]s ,+ ∞ [. L’évèn ement Sn ∈S con du isant au r ejet
de H 0 est don c b ien|β̂1| > s.
Le n omb re s d ésign e le seu il au d elà du β̂1 qu
estelju gé tr op éloign é de 0 p ou H 0r soit
que
u ne hyp oth èse p lauLa sibqu
le.estion du ch oix sder es te p osPou ée. r gu id er ce ch on oix,fait
ap p el à la con d ition d e n iveauimqui p ose qu HeP
0 (Sn ∈ S ) ≤ α
(voir l’in égalité (1.1) et les
commentaires qu i la précèd ent, p age 22). C ette in égalité s’écrit en core
P H 0 (|β̂1| >s) ≤ α (4.3)
C h ois sirde man ièr e qu e le test ait un n α

iveau
r evient à r ésou dr se l’in
en égalité (4.3).
La
p r ob ab ilité qu i en con stitu e le memb re de gau ch e est d étermin ée p ar la loi de la variab
β̂1.
Les résultats ob tenu s dan s la section 4.1 nou s p ermettent p ou r n’imp s>0orte
dequ el réel
calcu ler le memb re de gau ch e de l’inégalité
En (4.3).
effet,d ’ap r ès le corollaire
la 5,
loi de la
β̂
variab le aléatoire −β
√ 1 1 est con nu e et on p eu t écrire
V̂( β̂1 )
P H 0 (|β̂1| > s) =1 − P H 0 (−s ≤ β̂1 ≤ s)

−s − β1 β̂1 − β1 s − β1
=1 − P H 0 ≤ ≤
V̂ (β̂1) V̂ (β̂1) V̂ (β̂1)
−s − β1 s − β1
=1 − P H 0 ≤ τn−2 ≤
V̂ (β̂1) V̂ (β̂1)
=1 − F τn − 2 √s−β1 − F τn − 2 √−s−β1
V̂( β̂1) V̂( β̂1 )
où τn−2 est un e var iab le aléatoir e su ivantdune Se tu

loid entà
(n − 2) degrés de lib erté et où
F τn 2 d ésign e la fon ction de r ép artition de cette loi.
−
C omme la n otationP
H 0 l’in d iqu e, cette pr ob ab ilité d oit êtr e calcu lée H
en0 vr
suaie.
pp osant
Dan s ce cas,
β1 =0 et
P H 0 (|β̂1| > s) =1 − F τn 2 √ s s
− F τn − 2 √ −s =21 − F τn − 2 √
− V̂( β̂1 ) V̂( β̂1 ) V̂( β̂1 )
67
où la d er n ièr e égalité pr ovient de la symétr ie au tou r de 0 de la d en
τ(nsité
− 2).de
Par
la loi
con séqu ent, la contr ainte p or tant su r le n iveau du test, expr imée p ar l’in égalité (4.3), s’é
P H 0 (|β̂1| >s) ≤ α ⇐⇒ 21 − F τn 2 √ s
≤ α ⇐⇒ F τn − 2 √ s
≥ 1− α2
− V̂( β̂1 ) V̂( β̂1)
C om me
F τn − 2 est continu e et str ictement cr oissante, la d er n ièr e in égalité s’écr it
s
≥ F τ−1
n 2
(1− α2 )
−
V̂ (β̂1)
Le memb re de dr oite de cette in égalité est p ar d éfi n ition le qu antile 1 − α2 dde

’or
F τdre
n−2 ,
ou en core le qu antile d ’ordre α
1 − 2 de la loid e S tu dentàn − 2 degrés de lib erté. On n otera
τn−2;1− α ce qu antile. Fin alement, le test au ra le αn si
2
iveau
le seu sil est ch oisi de sor te que
s ≥ τn−2;1− α2 V̂ (β̂1)
O n n ote qu ’à ce p oint,
l’imp osition de la contr ainte (4.3) ne p er met p as de d égager une
valeu r un iqu es.dePou r cela,on s’intér esse au r isqu e de typ e 2. On r ap p elle que la d émar ch
con siste à ch oisir p arunmi
en semb le de tests ayant tou s un nα,iveaucelui(ou ceu x) p our
le(s)qu el(s) le r isqu e de typ e 2 ser a tou jou rs le p lu s faib le.
On con sid ère les
ici tests de la for me « On r ejette H 0 et on accep te
H 1 si on ob serve que
|β̂1| >s », avecs ≥ τn−2;1− α2 V̂ (β̂1). Pou r tou t test de cette for me, le r isqu e de typ e 2 s’exp r im
com me 2
P H 1 (|β̂1|≤ s)
où la notationPH 1 in d iqu e la pr ob ab ilité est calcu lée en su H 1ppvrosant
aie,c’est à dir e en
s u p p osant
β1 =0 . La valeur de cette probabilité dép end de la valeur (non nulle) β1 ch de
oisie
p our effectuer le calcul.
Cep endant, quelle qu e soit cette valeuon r,
voit que cette prob abilité
est un e f on ction cr oissante.3 Par
de con séqu ent, si on veu t le test de la for me d on n ée ci-d essu
s
qu i a le p lu s p etit r isqu e de typ e 2, il fau t ch oisir
s le le
p lu
seus pil etit p ossib le. S ach ant que
p our que le test soit de niveau
α il faut s ne soit p ar p lu s p etitτque
n−2;1− α2 V̂ (β̂1), on est
con du it à ch oisir
s=τ n−2;1− α2 V̂ (β̂1)
Le test ain si ob tenu con siste d on c àHr0 ejeter
:β 1 =0 et à accep ter
H 1 :β 1 =0 au niveauα
si on ob ser |ve
β̂1| >τ n−2;1− α V̂ (β̂1), ou , de man ièr e équ ivalente, si on ob ser ve
2
β̂1
>τ n−2;1− α2
V̂ (β̂1)
C e test est ap p elé test de S tu d ent, qu e l’on d éfi n it for mellement.
Définit ion 5 D ans le M RLSG, on appel le test de Stu dent de niveau

0 :βα
1 deH
=0 contre
H 1 :β 1 = 0 le test dé fini par:
2
On rap p elle qu e le risq ue de ty p e 2 est la p rob ab ilité qu e l’on a Hde 1 lorsq
rejeter ue cette d ern ière est
su pp osée v raie (voir la section 1.3.2.3).
3
Pou r tou te variab le aléatoire Uréelle
et p ou r toute p aire de réels(
s1 ,s 2 ) t els que
s1 <s 2 , l’évèn ement
U ≤ s1
imp liq ue l’évèn ement
U ≤ s2 et il est d on c au moin s au ssi p rob ab le d ’ob server le secon d que le p remier.
68
O n rejetteH0 e t on acce pteH |Tn | >τ n−2;1− α2 ; on re je tteH
1 si on ob serve 1 et on
acce pteH0 si non
oùT n e st la statistiqu e dé finie par

β̂1
Tn =
V̂ (β̂1)
e t appe lée statistiqu e de Stu de nt (ou « T » de Stu de nt)0.assoc iée àH
S ou s la for mu lation pr écéd ente du test, la statistiqu|Ten |deettest

la région
est cr itiqu e est
]τn−2;1− α2 ,+∞ [. Pour r ep r endre la n otation de la sectionle1.3.2,
test de S tu d ent de n αiveau
est d éfi ni par

 1 si |Tn | >τ n−2;1− α2
ϕ(X 1,Y 1), . . . , (X
n ,Y n ) =
0
sin on
4.2.3 A ppro che t héor ique

Dan s la section précédente, le test a été intro duit en partant sur un princip e raisonnable:
β̂1 est un e b on ne ap pr oximation β1 et
desi H 0 es t vr aie,
il est p eu prob ab le d ’ob server un
évèn ement tel queβ̂1 >s, p ou r un e valeu r b ien ch oisies. Dandes un e telle ap pro ch e, la f orme
d u test est d onanpriée oriet il r este à ch er ch er le meilleu r d es testsα de
p ar
n mi
iveau
les tests
ayant cette f or m e.
Dan s un e ap pr o ch e th éor ique de con str uction d’u n test p ou r H résou
0 :β 1dr
=0e le pr ob lème
contreH 1 :β 1 =0 , on ne se limite p as à ch er ch er le meilleu r d es tests ayant
forme une;
donnée
on ch erch e p lu tôt le meilleu r test les
p armi
tes ts ayant d proprié
es té s sou haitées t u ne
. C ’es
ap pr o ch e id entique à celle su ivie dan s la section 3.2 p ou r résou dr e un pr ob lème d’estim
p our estimer un p aramètre, on a cherché le meilleur estimateur d ans un ensemble d ’estimat
ayant d es pr op r iétés (sou h aitées) d on n ées.
Par miles b on n es prop r iétés sou h aitées p ouon
r un
r etrou
test, ve la n otion d ’ab sen ce de
b iais.
Définit ion 8 Soit ϕ un test pou r testerH

0 contreH1. On dit qu e ϕ e st un te st sans biais au
niv eau α si ϕ et de niv eau α et si le risq ue de type 2 de ϕ ne dé passe− α.jamais1
Au tr ement d it si on écr
ϕ sou
it s la f orme

 1 si Sn ∈ S
ϕ(X 1,Y 1), . . . , (X
n ,Y n ) =
0
sin on
alors ϕ est san s b iais au n iveau

α d ès qu eP H 0 (Sn ∈ S ) ≤ α etP H 1 (Sn ∈ S ) ≤ 1 − α. La
d ern ière in égalité s’écrit au ssiP
H 1 (S n ∈S ) ≥ α et la d éfi n ition d ’u n test san s b iais au n iveau
α est donc
P H 0 (Sn ∈S ) ≤ α ≤ P H 1 (Sn ∈S )
C es in égalités montr ent qu e p ou r un test san s b iais la pr ob abilitéH 0 est

de rtou
ejeter
j ou rs
p lus faible quandH 0 est vr aie qu e qu an d elle ne l’est
Aup tr
as.
ement d pit,ou r un test sans
b iais,la pr ob ab ilité de pr en dr e la b on ne d écision H
en0 est
r ejetant
tou jou rs p lu s gran de que
69
la pr ob ab ilité de pr en dr e la mau vaise d écisionHen
0. Cette
r ejetant
d er n ièr e r emar qu e montre
qu e l’ab sen ce de biais p ou r un test est gén ér alement con sid ér ée comme un e b on ne pr
La d émar ch e con sistant à r ech er ch er le/les meilleu r /s les
test/s
tests
p ar
sanmis b iais au
niveauα est p lu s d ifficile à su ivr e qu e d an s le contexte où n ou s n ou s sommes p lacés lor
l’estimation d es p ar amètr es du mo d èle. Au ssi on ne pr ésenter a p as la pr eu ve du résu lt
d e cette section.
T héorème 7 P ou r te ste 0 :rH

β1 =0 contreH 1 : β1 = 0 dans le MRLSG, le me il leur test
parmi tou s le s te sts sans biais au niveau α est le te st de Stu de nt dé fini cide ssu s.
Ce r ésu ltat d it qu e (1) le test de S tu d ent est un test san s b iais

α et
au qu
n iveau
e (2) il
n ’existe p as d ’au tr e test san s b iais au
α—n iveau
d on c semb lab les au test de S tu d ent en ce
qu i con cer ne le r isqu e de typ e 1 — d ont le r isqu e de typ e 2 soit plu s p etit qu e celu i du
Stu dent. Le bu t étant de ch er ch er des tests ayant les plu s p etits risqu es p ossib les ce résu
u n r ésu ltat d ’op timalité du test de S tu d ent, d an s le contexte du MRLS G.
4.2.4 Généralisat ions

4.2.4.1 Test d’une va leur quelconque 1deβ
O n s’est intér essé,

p our les raisons qu’on a évo quées au début de la sectionàun 4.2.1,
p rob lème de test qu i reven ait à d écid
β1 valait
er si 0 ou n on . La valeu r 0 su r git n atu r ellement
dan s b eau cou p de pr ob lèmes de tests, mais même si on p eu t tr ès sou vent s’y ramen er ,
êtr e intér essé p ar d es pr ob lèmes d an s lesqu els la valeu r testée est qu elcon qu e.
Soit b un r éel con nu . On veu t tester
H 0 :β 1 =b contreH 1 :β 1 =b. En suivant l’appro che
d évelopp ée d an s la section 4.2.2, on n H ote
0 est
quevrsiaie, la d istan ce entre β1 et b est nu lle.
On b aser a d on c le test su r la d istanβ̂ce
1 et
entre
b et on r ejettera H 0 si on ob serve qu e cette
d istan ce est tr op gr an
Le dtest
e. ser a d on c b asé su r l’in |égalité
β̂1 − b| >s . La d émar ch e est
en su ite la même qu e d an s la section On 4.2.2.
choisit d’ab ord s de man ièr e qu e le test soit de
niveauα,α étant fixéa pri ori. On d oit d on c r ésou drs l’in
e en
égalitéP H 0 (|β̂1 −b| >s) ≤ α. En
effectu ant les mêmes d évelop p ements qu ’en 4.2.2, on ob tient
s+b−β1
P H 0 (|β̂1 − b| > s) =1 − F τn 2 √
−
− F τn − 2 −s+b−β
√ 1
V̂( β̂1 ) V̂( β̂1 )
et com me on su p H
p 0ose s
:b =β 1 vr aie, cette pr ob ab ilité est simp21
lement
−F τn − 2 √ .
V̂( β̂1 )
Pou r qu e le test soit de n iveau
α, il fau t d onc que
s soit su p érieu rà
τn−2;1− α2 V̂ (β̂1). Par
ailleu rs, la min imisation du r isqu e de typ e 2 con dus=τ it à n−2;1
ch oisir
− α2 V̂ (β̂1).
Le test con siste d on c à r ejeter
H 0 : β1 =b et à accep ter H 1 : β1 =b au niveauα si on
ob ser ve
β̂1 − b
>τ n−2;1− α2
V̂ (β̂1)
On a défi nition semb lab le à celle intro du ite précéd emment dan s le cas où
b=on0.avait ch oisi
Définit ion 6 D ans le M RLSG, on appel le test de Stu dent de niveau

0 :βα
1 deH
=b contre
H 1 :β 1 = b le te st dé fini par:
70
O n rejetteH0 e t on acce pteH |Tn (b)| >τ n−2;1− α2 ; on re je tteH
1 si on ob serve 1 et
on acce pteH0 si non
oùT n (b) e st la stati sti qu e dé fini e par
β̂1 − b
Tn (b )=
V̂ (β̂1)
e t appe lée statistiqu e de Stu de nt (ou « T » de Stu de nt)0.assoc iée àH
Il r este à montr er qu e ce test p ossèd e de b on n esPou pr op

r cela,
r iétés.
d éfi n isson s les va-
riab lesZi =Y i − bXi , i = 1, .. . ,net con sid éron s les imp lication s de C1 et CN su r les cou p les
n ,Z n ). La con d ition C1 ne p ortant qu e
(X 1,Z 1), . . . , (X X 1sur
, . . . ,Xn est évid em m ent satis-
faite. Par ailleu rs, si CN est satisfaite, alor s on en d éd u it (en u tilisant un e d émar ch e id ent
à celle u tilisée d an s la preu ve de la prop r iété 13) qu Z e led éfi
vecteur
n i pZar=YY − bXX est
gau ssien . Avec la con d ition C 1, on calcu le alor s aisément
E (Zi )= E (Yi − bXi ) =β 0 +(β 1 − b)Xi

cov(Zi ,Z j )= cov(Yi − bXi ,Y j − bXj )= cov(Yi ,Y j )
∃δ0 ∈ , ∃δ1 ∈ , ∃σZ ∈]0,∞ [ t.q. Z ∼N (δ0ιn +δ1X ,σZ2 I n ). Au tr ement d it si

Par con séqu ent, Ê Ê
on a un MRLS G p ou r les cou p les de var iab

(X 1,Y 1),les n ,Y n ), alor s on a au ssi un MRLSG
. . . , (X
p our les couples 4
n ,Z n ). Les p ar amètr es d es d eu x mo d èles sont r eliés p ar
(X 1,Z 1), . . . , (X
δ0 =β 0 δ1 =β 1 − b et σZ =σ
S i on se p lace d an s le MRLS G(Xp1our n ,Z n ), les r ésu ltats d es section s pr écé-

,Z 1), . . . , (X
d entes p er mettent de d ir e qu e pHou r 1tester
0 :δ =0 contreH 1 :δ 1 =0 au niveau α, le meilleur
d es tests p ar mi les tests san s b iais auα nest
iveau
le test de S tu d ent. conIl siste à r ejeter
H0
au niveauα si on ob serve que
δ̂1
>τ n−2;1− α2
V̂ (δ̂1)
où δ̂1 et V̂ (δ̂1) sont r esp ectivement l’estimateu r Moin dr es Cδ1aretr és

l’estimateu
de r de la
varian ce de ce dernier, ob tenu s par les méth o des du ch ap itre précéd ent. On a en particu l
n
i=1(Zi − Z)X i
δ̂1 = n 2
i=1(X i − X)
Par d éfi n ition dZies

ona Z =Y − bX, et le nu mérateu r ci-d essu s s’écrit
n n n n
(Zi − Z)X i = Yi − Y − b(Xi − X)X i = (Yi − Y )Xi − b (X i − X)X i
i=1 i=1 i=1 i=1
Donc
n
i=1(Yi − Y)X i − b ni=1(X i − X)X i
n
i=1(Yi − Y)X i
δ̂1 = n 2
= n 2
− b= β̂1 − b
i=1(X i − X) i=1(X i − X)
4
Ces deux mo dèles sont en fait identiques puisque la récipro que est vraie : si C1 et CN sont vérifiées p our les
cou ples(
X 1 ,Z 1 ), . . .,(X n ,Z n ), alors elles le sont aussi p our les couXp1 ,Y
les(
1 ), . . .,(X n ,Y n ).
71
D’au tre part
δ̂0 = Z − δ̂1X = (Y − bX) − (β̂1 − b)X =Y − β̂1X= β̂0
Fin alement, p ou r calcu
V̂ (δ̂
ler
1), on u tilise la for mu le d on n ée à la section 3.5. Ona
2
ˆσ
V̂ (δ̂1)= n
Z
2
i=1(X i − X)
2 est l’estimateu r de la var ian
où ˆσZ σZ2 des
ce Zi pr ésenté à la section 3.5, b asé su r les r ésid us de
l’estim ation de et de p ar m oin dr e r ésid
es car r iés. Le u est
δ0 δ1
Zi − Ẑi =Y i − bXi − (δ̂0 + δ̂1X i )

En u tilisant les exp r ession s ob tenuδ̂0es
etpδ̂1our
on ob tient
Zi − Ẑi =Y i − bXi − (β̂0 + β̂1X i − bXi ) =Y i − β̂0 − β̂1X i =ˆεi

Par con séqu ent
n n
2 1 1
ˆσ
Z = (Zi − Ẑi )2 = ε̂2 =ˆσ2
n − 2 i=1 n − 2 i=1 i
et d onĉ
V (δ̂1)= V̂ (β̂1).
On vient de montr er qu e la statistiqu e su r laqu elle est b asé le test de S tu d ent p ou r te
δ1 =0 contreδ1 =0 s’écr it
δ̂1 β̂1 − b
=
V̂ (δ̂1) V̂ (β̂1)
Le test de S tu d ent de la d éfi n ition 6 ser vantβà1 tester
=b contreβ1 =b et le tes t de
S tu d ent ser vant à δtester
1 =0 contreδ1 =0 sont d on c d éfi n is p ar le même évèn ement (la même
in égalité).
De p lu s,
p u is que
β1 =b ⇐⇒ δ1 =0, les hyp oth èses testées sont les mPar êm es.
con séqu ent les d eu x tests ont les mêmes r isqu es de typ e 1 et de typ e 2 et ils con du isent
tou s les d eu x à la même d écision . Par con séqu ent, ces d eu x tests sont les mêmes. L’op tim
(d irectement déd uite du th éorème 7) ob tenu e dan s le MRLS (X 1,ZG1),
p .our n ,Z n ) est
. . , (X
d on c équ ivalente à l’op timalité du test de la d éfi n Onition
a d 6.
on c d émontré la prop r iété
s u ivante.
Propriété 16 D ans le M RLSG, pou r te ste

0 :βrH
1 =b contreH1 :β 1 = b, le test de Stu dent
dé fini par
β̂1 −b
O n rejetteH 1 au niv eau α si on ob se √
0 e t on acce pteH rve >τ n−2;1− α2
V̂( β̂1 )
e st le me il le ur parmi le s te sts sans biais au niv eau α.
4.2.4.2 Test d’une inéga lit é surβ

1
Dan s les pr ob lèmes de test étu diés ju squ’à pr ésent, l’hyp oth èse nu β1 es
lle tsp
égal
écifi e que
à une valeur d on nb. ée
Il existe d es situ ation s d an s lesqu elles ce n ’est p asβla 1 qui
valeu r de
est intér essante en soi, mais simp lement son sign e. On sait enβ1effet est pquositif,
e si alors Y
varie d an s le même senX, s que
et en sen s op p osé β1 est
si n égatif. Il est d an s ce cas intér essant
d e p ou voir d isp oser d ’u nHtest
0 :β de
1 ≤ 0 contreH 1 :β 1 >0. De man ière p lu s gén on érale,
p eut être amené à tester
H 0 :β 1 ≤ b contreH 1 :β 1 >b, où b est un e valeu r d on n ée et con nu e.
On ad mettr a le r ésu ltat su ivant.
72
Propriété 17 D ans le M RLSG, pou r te ste 1 ≤ b contreH1 :β 1 > b, le test de Stu dent
0 :βrH
dé fini par
β̂1 −b
O n rejetteH 1 au niv eau α si on ob se√rve >τ n−2;1−α
0 e t on acce pteH
V̂( β̂1 )
e st le me il le ur parmi le s te sts sans biais au niv eau α.
On noter a simplement qu e ce test est compatib le avec un e ap pr o ch e intu itive semb la

celle u tilisée d an s la section 4.2.2. En effet, leHr0 ejet
su r de
vient lor sque
β̂1 − b est p lu s gr and
qu e la qu antité p osτn−2;1
itive−α V̂ (β̂1), c’est à d ir e lor sque
β̂1 est tr op gr an d p ar rap b.
p or tà
C ’est pr écisément d an s ce cas H 0 semb
que lera p eu p lau sib le.
On n oter a également qu e la contr ainte de n iveau de ce test (le r isqu e de typ e 1 ne d ép
pas α) imp ose d ’u tiliser le qu antile d1− ’orαdre
de la loi d e S tu d entà
n − 2 degré de lib erté
(et n on le qu antile d ’or d α
recomme au p ar avant).
1− 2
4.3 Région s de c onfi ance

( in co mp le t)
Ap rès le pr ob lèmes d’estimation des par amètr es et des tests d’hyp on s’intér
oth èses,
esse
mainten ant à la con stru ction de r égion s de conL’ob
fi jectif
an ce.
es t le s u ivant:
on ch erch àe,
p artir d es ob servation
à ds,éter min er un e r égion de l’esp ace d es p ar amètr es ayant de b on
ch an ces de conten ir la valeu r in con nu e de ces paramètres. Les région s ain si ob tenu es so
léesrég i ons de confiance
.
Dan s le cas simp le d ’u n p ar amètr e un id imen sion n el (d ont la valeuÊ
), rcette
est un élément
r égion est d on c un sou s-en semb
Ê
à laqu
le deelle on d on ne tr ès sou vent la for me d ’u n inter valle
On p ar le d an s ce cas d’ . Celu i-cis’interprète comme un e f ou r ch ette de
interval le de confiance
n omb res d an s laqu elle
est prob
il ab le qu e se situ e la valeu r in con nu e du pDan
aramètre.
s le
cas où on ch er ch e à con str uir e ce typ e de région s p ou r plu sieurs par amètr es à la fois, la
rech erch ée p eu t pren dre d iverses formes.
Les r égion s de con fi an ce p eu vent être vu es comme quiun
p er
oum tilet d ’ap pr oximer la
valeu r in con nu e d ’u n p aramètre p ar un en semb le de valeu prsarp op laupsib
osition
les, aux
estimateu rs qu i r éalisent un e ap pr oximation de ce m ême p ar amètr e à l’aid e d ’u ne vale
Cette d istin ction est p ar fois sou lign ée enepstimate
ar lant ur
d’ ponc ptuou
elr les estimateu r s, et
d’e stimate ur e nse mb p our
listeles régions de con fi ance.
Noton s qu e p ou r étab lir qu ’u ne région don née a de « fortes ch an ces » de conten ir la v
in con nu e d ’u n p aramètre,
il fau t être en mesu re de calcu ler ces « ch Au
an tr
ces
ement
». dilit,
fau t p ou voir utiliser un e loi de prob ab ilité p ermettant de calcu ler la prob ab ilité qu ’u ne ré
contien ne un e valeur.
Dan s cette section on pr ésenter a d an s le contexte du MRLS G la d émar ch e p er mettan
con stru ire d es intervalles
de confi an ce p our
β0 et β1 sép ar ément,
ain siqu e d esrégionsde
con fian ce p ou r les deu x paramètres simu ltan Noton
ément.
s qu’en faisant le ch oix de se p la-
cer d an s un tel
contex te,on p eu t faire ap à
p l’hyp
el oth èse n or malité
n-udu
p let n ).
(Y1, . . . ,Y
L’u tilisation de la loi dence
-u plet p ermettra de calcu ler la prob ab ilité qu ’u ne région contien n
la valeu r in con nu e du /d es p aramètres.
4.3.1 Définit ion
73

Methodologie Outils D Analyse Introduction A L Econometrie

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Methodologie Outils D Analyse Introduction A L Econometrie

Transféré par

Droits d'auteur :

Formats disponibles

I ntro ducti on

Supp ortde co ursdest iné a ux étu-

Un i ve rs ité Ch arle s-de -Gau lle Lille3

O. Torrès Année universitaire 2009-10

1 Rapp els sur la démarche de l’inférence statistique 9

2 Le mo dèle de régression linéaire simple : définition et inte rprétations 27

3 Le mo dèle de régression linéaire simple : estimation des pa ramètres 37

4 Le mo dèle de régression linéaire simple : tests et régions de confiance

Ce cou rs est un e intr o du ction au x méth o des et mo dèles de base de l’écon

Rapp els sur la démarche de

Cette section p ermet de rapp eler les princip es de l’inférence statistique.

1.1 Ob jectif d’une démarche inférentielle et notions de base

7. Avec les n otion s intr o du ites ci-don

1.2 Présentation du p rinc ip e de l’inférence statistique

a et b (a <b), où µ et σ2 sont les valeu rs de l’esp ér an ce et de la

1.3 Les p rob lèmes d ’in féren ce u su els

E xe mp lOne: s ’i n téres se à la vari ablemesure

Ic i,o n p eut co ns i dérer que le p aramètre d ’i n térêt θ(µ,σ es t2)le

P θ0 |Tn − θ0| >ǫ → 0, n →∞ , ∀ǫ> 0, ∀θ0 ∈ Θ.

1.3.2 Test d’hypothèse

Un pr ob lème de test est un pr ob lème d an ils lequ

1.3.2.2 Test st at ist ique

Le pr o céd é p ar lequ el on ch oisitH 0 et

aléatoireTn de la façon su ivante:= T ∪ T , où T = \ T . L’en sembTle est l’en semb le d es

valeu rs les p lu s vraisemb labTnles

E xe mp lDanse: l ’exempl e précéden t, pui estsvraisemblable

1.3.2.3 C a lcul des risques

Un test con du it for cément à pr en dr e l’u ne d es d eu x d écision on con

1.3.2.4 C omparaison de test s. C hoix d’un test

Egon Pe ars on(1895-1980)

Fig. 1.1 –J. Ne ym an

d e p aramètres n12 ,et éva l u ée en+nd n

(n, 12 ) (nd+ 2 ) ≥ 0, 95. Il fa u t d o n c ch o i s i r d d e ma +nn2 isère

T héorème 1 Soit un prob lè me de te st dé fini par u ne hypothè 0 etse

1.3.3 E st imat ion par région de confiance

P θ θ ∈G(X 1, . . . ,Xn ) ≥ 1 − α, ∀θ ∈ Θ (1.3)

On n ote d an s l’in égalité ci-d essu s qu e la pr ob ab ilité estθ. ind

Définit ion 1 On appel le région de confiance de 1−α

Θ telle queG(X 1, . . . ,Xn ) ⊆ G , l’évèn ement

d e confi ance,et tout en étant contenu e dans G ′ , la région d élimite d an s Θ un en semb le de

Au trement d it, on ch erch e un intervalle

L e mo dèl e de régres si on li néai re

2.1 Le contexte et les ob jectifs

est vr aie p ou r tou t in di.ividu

p ar amètr es ne p er mettent p as l’égalité

man ièr e p lu s gén ér ale, il n ’existe qu asiment jamais β0 de

L’intr o du ction de ces ter mes d on ne lieu à l’inter pr étation Pou

2.3 Défi n ition et

C3. P ou r tou te paire

2.3.2 Int erprét at ions

de εi est nu lle, c’est-à-d irεie) E(

Fig. 2.1 – Mo délisation de la relation entre variables dans le MRLS

R el at ions découl ant de l a déf init ion du modèl e

L e mo dèl e de régres si on li néai re

Définit ion 1 D ans le M RLS, (β0,β

S est un e fon ction de(

Fig. 3.1 – Allu re de la fonction

Dan s la min imisationS,de

Par con séqu ent

Le système (3.2) s’écr it d onc

β̂0 = Y − β̂1X, (3.5)

où X = n1 ni=1 X i et Y = n1 ni=1 Yi . En su b stistu ant cette exp r ession

T héorème 2 D ans le M RLS, s’ ile xiste de ux i ndividu sj iteetls qu eXi = X j , alors