Vous êtes sur la page 1sur 32

D.

TOUIJAR 15/03/2016

2015-16

Mthodes Economtries
Module M2:
-Economtrie I

Parcours :
Economie et Gestion

S6 -Section B-
Vol. Horaire : 50h = 34 C + 12.5 Td +3.5 val
TOUIJAR 1 TOUIJAR 2

La naissance de l'conomtrie moderne


La naissance de l'conomtrie moderne

L'conomtrie moderne est ne la fin des annes 30 et


En simplifiant de faon sans doute abusive l'on peut
pendant les annes 40. Elle est la rsultante de trois
phnomnes : le dveloppement de la thorie de l'infrence distinguer deux grandes priodes de la recherche
statistique la fin du XIX me sicle ; la thorie macro- conomtrique moderne . Jusqu' la fin des annes
conomique et la comptabilit nationale qui offrent des 70 l'conomtrie va tudier la spcification et la
agrgats objectivement mesurables ( contrairement la solvabilit de modles macroconomiques
microconomie fonde sur l'utilit subjective ) ; enfin, et surtout quations simultanes . Puis la suite de ce que l'on
, la forte demande de travaux conomtriques, soit de la part
a appel la rvolution des anticipations rationnelles et
d'organismes publics de prvision et de planification , soit de la
part dentreprises qui ont de plus en plus besoin de modliser de la critique de Lucas, la recherche se tournera
la demande et leur environnement conomique gnral. A davantage vers la microconomie et l'analyse des
partir des annes 60, l'introduction de l'informatique et des sries temporelles .
logiciels standardiss va rendre presque routinire l'utilisation
de l'conomtrie . TOUIJAR 3 TOUIJAR 4

Introduction gnrale Introduction gnrale


Lconomtrie est la branche des sciences conomiques
qui traite des modles et des mthodes mathmatiques Les modles utiliss ne permettent pas de
appliques aux grandeurs et variations conomiques.
prvoir, au sens strict, lvolution des
Le calcul infinitsimal, les probabilits, la statistique, et phnomnes conomiques, mais davantage de
la thorie des jeux, ainsi que dautres domaines des
construire des hypothses et dextrapoler des
mathmatiques, sont utiliss pour analyser, interprter
et prvoir divers phnomnes conomiques tels que les tendances futures partir dlments actuels.
variations de prix sur le march, lvolution des cots
de production, le taux de croissance, le niveau du
chmage, les variations du taux de change, les grandes
tendances de lconomie court et moyen terme qui
permettent dorienter la conduite dune politique
conomique. TOUIJAR 5 TOUIJAR 6

1
D.TOUIJAR 15/03/2016

PROGRAMME DE CE SEMESTRE BIBLIOGRAPHIE

Titre Auteurs Code


Chapitre 0: Rappel sur les Tests ECONOMETRIE
William Greene
dHypothses et moments conditionnels
ECONOMETRIE : Thorie et M.Cohen-
techniques de base- exercices J.Pradel
Chapitre 1: Introduction au modle ECONOMETRIE : manuel et exercices
corrigs R.Bourbonnais
de rgression linaire simple
Probabilits-Analyse des donnes et
G.Saporta
statistique
Chapitre 2: Le modle ECONOMETRIE : Le modle linaire
F.B. doucour Econ:46
de rgression linaire multiple
TOUIJAR 7 gnral
TOUIJAR
8

CH 0 Introduction
 Soit X1, X2, , Xn un chantillon alatoire
), o
Rappels relatif la V.A. parente X de loi L (
est un paramtre rel inconnu.
I  Le semestre prcdent, on cherchait estimer
. Mais il arrive quon ait une ide prconue sur
LES TESTS sa valeur: = 0
 On dsire alors tester la validit de cette
STATISTIQUES hypothse, en la confrontant une hypothse
alternative.
TOUIJAR 9 TOUIJAR 10

 Cette dernire exprime une


tendance diffrente au sujet du
Mthodologie du
paramtre. test dhypothse
Exemple :
On suppose que est partitionn en 0
Est-ce que le taux de
et 1:
chmage au Maroc est p 0 ? = 0 1 et 0 1 =
Est-ce que lesprance de vie
au Maroc est 0 ?...ou a  Exprimons le fait que 0 par
augment ?
TOUIJAR 11
lhypothse H0 et le fait que 1 par H1
TOUIJAR 12

2
D.TOUIJAR 15/03/2016

 H0 : sappelle lhypothse nulle.


 H0 : 0
H1 : sappelle lhypothse
H1 : 1 alternative.

Si 0 se rduit au seul point 0: 0 = { 0 }

H0 devient H0 : = 0 et sera
appele lhypothse simple.

TOUIJAR 13 TOUIJAR 14

Soit lhypothse simple H0 : = 0  Si H1 est telle que H1: < 0 ;


alors on dit que le test est unilatral
gauche:
 Si H1 est telle que H1: > 0
;
alors on dit que le test est unilatral
droite: H0 :" =0"
H0 :" =0"
T.U.G. #
T.U.D. # H :" < "
H :" > " 1 0
1 TOUIJAR
0 15 TOUIJAR 16

 Si H1 est telle que H1: 0 ; Dfinition: Un test dhypothse, est


une rgle de dcision permettant, au vu
alors on dit que le test est bilatral : de la ralisation ( x1, x2, , xn ) de lE.A., de
rpondre la question dans lequel des

H0 :" = 0" deux sous ensemble se trouve ?


T.B. # Cette rgle de dcision peut
conduire deux types derreurs:
H :" "
1 0
TOUIJAR 17 TOUIJAR 18

3
D.TOUIJAR 15/03/2016

On rejette H0 alors que H0 est vraie: 1)-


RH0/H0vraie
On lappelle erreur de premire
= P(RH 0 H 0Vraie ) = P0 (RH 0 )
espce
Cest le risque de premire espce.
On ne rejette pas H0 alors que H1 est
vraie: 2)-
NRH0/H1vraie;
= P (NRH 0 H1Vraie ) = P1 ( NRH 0 )
cest lerreur de seconde espce .
On dfinit alors la probabilit de
commettre lune ou lautre erreur: Cest le risque de seconde espce.
TOUIJAR 19 TOUIJAR 20

Voici un tableau rsumant toutes les situations Procdure suivre


1- dfinir le paramtre tester
Dcision 2- Formuler les deux hypothses H0 et H1
Ralit RH0 NRH0 3- Prciser le Genre du test
4- Choisir la Statistique du test (bon estimateur de )
H0 Vraie Erreur de 1re Bonne Dcision
espce 5- Prciser la loi de la statistique sous H0
6- Ecrire la rgle de Dcision
H1 Vraie Bonne Dcision Erreur de 2me
7- Faire lapplication numrique et dcider
espce
8- Conclure
TOUIJAR 21 TOUIJAR 22

I- Tests Relatifs Une Proportion


Procdure suivre
1Test Unilatral gauche pour la proportion
i) Formulation des hypothses 1- paramtre p= tester
2- Formulation des deux hypothses
3- TUG pour la proportion
H 0 :" p = p 0 " 4- F est un bon estimateur de p
5- si le T.C.L. est vrifi sous H0 alors
T .U .G . #
H 1 :" p < p 0 " F p0
Z= 0 , 1
p 0q 0
n
TOUIJAR 23 TOUIJAR 24

4
D.TOUIJAR 15/03/2016

I- Tests Relatifs Une Proportion Courbe de densit o


de la loi normale P ( Z > +z ) =
1Test Unilatral gauche pour la proportion centre rduite 1 et
F p0 2 o z = z 1
R.D Z=
p 0q 0
p0 q0
Si f < c = p0 z on rejette H 0 n
n

Si f c = p z p0 q0
0 on ne rejette pas H 0 1-
n
En effet :

0 TOUIJAR +z Z
- Notation : TOUIJAR 25 26

Loi de Loi de
F sous F sous
H1 H0
z p0 q0
n
R0
c p 0 R0 p1 c p0 F

Fp c p0
= P0 (RH 0 ) = P0 (F < c ) = P0 0
<
p q
0 0 p0 q0
n n
c p0
= z c = p0 z p0 q0
p0 q0 n
TOUIJAR 27 TOUIJAR 28
n p1 c p0

Remarque : Les logiciels utilisent souvent


le niveau de signification 0 ( p-value)
dune ralisation f de F : cest le plus
petit partir du quel on ne peut plus 0 P-value Interpretation

P0 (F < f ) = 0
rejeter H0 :
0 < 0,01 very strong evidence against H0

0,01 0 < 0,05 moderate evidence against H0


Si dans notre exemple on suppose que n=100, p0=0.75 f = 0,65
Alors : 0 = P0 (F < f ) 0,05 0 < 0,10 suggestive evidence against H0

= P0 (Z < 2,309) = 1% 0,10 0 little or no real evidence against H0


Signe de la rgion de Rejet
Le test est donc significatif
TOUIJAR 5% 29 TOUIJAR 30

5
D.TOUIJAR 15/03/2016

2- Test Unilatral droite pour la En effet :


proportion
H 0 :" p = p0 "
i)-F.H. z p0 q0
T .U .D.# n
F
H 1 :" p > p0 "
R0 p0 c
R0
ii) si le T.C.L. est vrifi sous H0 alors la
rgle de dcision devient : F p0 c p0
= P0 ( RH 0 ) = P0 ( F > c ) = P0 >
p 0q 0 p 0q 0
R.D

p0 q0 n n
Si f > c = p0 + z on rejette H 0
n c p 0
= + z c = p 0 + z p 0q 0
Si f c = p + z p0 q0 on ne rejette pas H p 0q 0 n
TOUIJAR
0
n
0 31
n TOUIJAR 32

Remarque : La p-value ici vaut : 3- Test Bilatral pour la proportion


F.H

0 = P0 (F > f ) H0 :" p = p0"



T.B.#
Si on teste p = 0,75 # p > 0,75 et si n=100 f = 0,65
H1 :"p p0"
Alors : Si T.C.L. On adopte la Rgle de
0 = P0 (F > f ) dcision suivante :
= P0 (Z > 2,309) = 99%
R.D
Si f [c1 ; c2 ] on rejette H 0

Le test nest donc pas significatif 5% ni Si f [c1 ; c2 ] on ne rejette pas H 0
95% TOUIJAR 33 TOUIJAR 34

Do:
R0 R0 R.D
c1 p0 c2 p0q0
Si f p0 > z / 2 on rejette H0
n
R0
Si f p z p0 q0
or f [c1 , c2 ] f [ p0 c , p0 + c ] f p0 c 0 /2 on ne rejette pas H0
n
d ' o f [c1 , c2 ] f p0 > c
Ou

Fp Si z > z /2 on rejette H 0
= P0 (RH 0 ) = P0 ( F p0 > c ) = P0
c
0
>
Si z z /2 on ne rejette pas H 0
p0 q0 p0 q0
n n
avec f p0
c p0 q0 z =
= z c = z p 0q 0
p0 q0 2 2
TOUIJAR
n 35 TOUIJAR 36
n n

6
D.TOUIJAR 15/03/2016

Remarque Si on teste p = 0,75 # p 0,75 II- Tests Relatifs Une


et si F vaut f = 0,65 , alors la p-value Moyenne
vaut ici : 1- Test Unilatral droite pour la
moyenne
F p f 0, 75
0 = P0 0
>
p 0q 0 0, 75 0, 25
Question : est-ce que lesprance de vie
n 100
des marocains a augment depuis le
= P0 (Z > + 2 , 3 0 9 ) = 2 P0 ( Z > + 2 , 3 0 9 ) dernier recensement ?
= 2 1% = 2%
Pour rpondre cette question, on doit
Le test est donc significatif 5% et mme
confronter 2 hypothses:
2,5% TOUIJAR 37 TOUIJAR 38

i)-
H 0 :" = 0 " 1)- Dtermination de c en fonction du
risque :
T .U .D.#
H 1 :" > 0 "
a)Si est connu et (X est normale ou n 30 )
ii)-On adopte ensuite une Rgle de
dcision base sur la statistique X et qui
c 0
= P0 (RH 0 ) = P0 ( X > c ) = P0 Z > n
rpondra la question: partir de quelle

ralisation de X dcidera-t-on du rejet de
H0 pour un risque ?

Si x > c on rejette H 0
c 0
n = z c = 0 + z

Si x c on ne rejette pas H
TOUIJAR
0 39 TOUIJAR n 40

b)Si est inconnu et X est normale; on a


Do la rgle de dcision : la rgle de dcision :
s
Si x > c = 0 + t n 1; on rejette H 0
n
s
Si x c = 0 + t n 1; on ne rejette pas H 0

Si x > c = 0 + z n on rejette H0
n
c)Si est inconnu et n 50 ; on a la
rgle de dcision :
Si x c = 0 + z on ne rejette pas H0
n s
Si x > c = 0 + z n on rejette H 0
s
Si x c = 0 + z on ne rejette pas H 0
TOUIJAR 41 n
TOUIJAR 42

7
D.TOUIJAR 15/03/2016

II- Tests Relatifs Une ii)-On adopte ensuite une Rgle de


Moyenne dcision base sur la statistique X et qui
2- Test Unilatral gauche pour rpondra la question: partir de quelle
la moyenne ralisation de X dcidera-t-on du rejet de
H0 ?
On doit confronter les deux hypothses
Si x < c on rejette H 0
suivantes Si x c on ne rejette pas H

H 0 :" = 0 "
0
i)-
T .U .G.# De la mme faon que prcdemment, on
H1 :" < 0 " a les rgles de dcision selon les cas :
TOUIJAR 43 TOUIJAR 44

a)Si est connu et (X est normale ou n 30) c)Si est inconnu et n 50 ; on a la


rgle de dcision :

Si x < c = 0 z
s
Si x < c = 0 z n on rejette H 0
on rejette H0
n
s
Si x c = 0 z on ne rejette pas H0 Si x c = 0 z on ne rejette pas H 0
n n
b)Si est inconnu et X est normale; on a II- Tests Relatifs Une Moyenne
la rgle de dcision : 3- Test Bilatral pour la moyenne
s
Si x < c = 0 t n 1; on rejette H 0

i)- H0 :" = 0"

n
s T.B.#
Si x c = 0 t n 1; on ne rejette pas H 0
TOUIJAR
n 45 H1 :" 0"
TOUIJAR 46

ii)-On adopte la Rgle de dcision


suivante : x [c1 ; c2 ] c1 x c2 0 c x 0 + c
c x 0 + c x 0 c
Si x [c1 ; c2 ] on rejette H 0

Si x [c1 ; c2 ] on ne rejette pas H 0 Do la rgle de dcision suivante

Si x 0 > c on rejette H0

R0 R0

c1 0 c2 Si x 0 c on ne rejette pas H0
TOUIJAR 47 TOUIJAR 48
R0

8
D.TOUIJAR 15/03/2016

b)Si est inconnu et X est normale


On a les rgles de dcision selon les
s
cas : Si x 0 > t n1; / 2 n
on rejette H0
s
a)Si est connu et (X est normale ou n 30 ) Si x 0 t n1; / 2 on ne rejette pas H0
n

Si x 0 > z / 2 n
on rejette H0 c)Si est inconnu et n 50 ; on a
s
Si x 0 > z / 2
on rejette H0
n
Si x 0 z / 2 on ne rejette pas H0
n s
Si x 0 z / 2 on ne rejette pas H0
TOUIJAR 49
n
TOUIJAR 50

RD.
III- Tests Relatifs Une Si s 2 > c on rejette H 0

Si s c
2
on ne rejette pas H 0
Variance
Dans ce paragraphe on supposera la 2 (n-1)
normalit de la population

1- Test Unilatral droite pour la


variance
H 0 :" = 0 "
2 2
2n1; Y

T .U .D.# Y = ( n 1)
S2 2 (n-1) sous H0
02
H1 :" 2 > 02 " 02 2
= P0 (Y > 2 ) = P S
2
>

2 c = 0 522
TOUIJAR 51 n 1; 0

TOUIJAR
n 1
n 1;
n 1 n 1;

2- Test Unilatral gauche pour la


De la mme faon que prcdemment, on variance
a les rgles de dcision selon les cas : H 0 :" 2 = 02 "

T .U .G.#
a)Si est inconnue
H1 :" 2 < 02 "
La statistique utilise est S2; do la R.D.
est :
02 R.D. (pour inconnue)
Si s > n 1; 02
2 2
on rejette H 0
n 1 Si s < n 1;1
2 2
on rejette H 0
n 1
Si s 2 n21; 2
0

02
on ne rejette pas H 0 Si s 2 n21;1
n 1
on ne rejette pas H 0
TOUIJAR 53
n 1 TOUIJAR 54

9
D.TOUIJAR 15/03/2016

3- Test Bilatral pour la Si est inconnue


variance
2 02 02
Si s 2

n 1;1 / 2 ; n21; / 2
n 1 n 1
H0 :" = " 2 2
0
on rejette H
T .B.#
0

Si s 2 2 02 02
H1 :" 2 02 " n 1;1 / 2 ; n21; / 2
n 1 n 1

on ne rejette pas H 0
TOUIJAR 55 TOUIJAR 56

Cas o est inconnue


1- Test Bilatral de Rapport critique (sous H0):
comparaison de 2 Variances : S2
Rc = 12 Si s12 > s22 22
On suppose la normalit des 2 S2 H 0 : =1
S 22 12
populations Sinon R c = 2 et F.H. devient alors
H1 : 2 2 1
2
S1
12 = 1 1
F.H. H :
H 0 : 12 = 22
0
22 Loi de Rc sous H0 :


# #
Rc 
1 ,
2 
H : 2 2
1 1 2
12
H 1 : 1
22
TOUIJAR 57 TOUIJAR 58

2- Test Bilatral de comparaison de 2


R.D. moyennes
H0 : 1 = 2 H0 : 1 2 = 0
[
Si Rc F1 / 2 ( 1 ; 2 ) ; F / 2 ( 1 ; 2 ) ]
#

#

on rejette H 0 H1 : 1 2 H1 : 1 2 0

[
Si Rc F1 / 2 ( 1 ; 2 ) ; F / 2 ( 1 ; 2 ) ]
On propose X 1 X 2 comme estimateur
on ne rejette pas H 0 de 12 :
o i = ni 1
a)Si 1 et 2 connus et (X1 normale ou n1 30 )
TOUIJAR 59
n2 30
et (X2 normale ou TOUIJAR ) 60

10
D.TOUIJAR 15/03/2016

R.D. b)Si 1 et 2 inconnus mais gales et X1 et


X2 normales, alors la R.D. est la suivante
12 22 :
Si x1 x2 > z / 2 + on rejette H0 1 1
n1 n2 Si x1 x2 > t / 2;n1 +n2 2 s +
n1 n 2

on rejette H
12 22
0
Si x1 x2 z / 2 + on ne rejette
Si x x t 1 1
n1 n2 / 2;n1 + n2 2 s +
pas H 1 2
n1 n 2
0

TOUIJAR 61 on ne rejette pas H0 TOUIJAR 62

S =
2 (n1 1)S12 + (n2 1)S 22
Si x1 x2 > z / 2
s12 s22
+ on rejette H0
(n1 1) + (n2 1) n1 n 2



s12 s22
c)Si 1 et 2 inconnus et n1 50 , n2 50 Si x1 x2 z / 2 + on ne rejette
alors la R.D. est la suivante : n1 n 2
pas H
0
TOUIJAR 63 TOUIJAR 64

RAPPELS
Moments Conditionnels :
On suppose que Y est une V.A.R. mais que X
CH 0 peut tre qualitative;

Rappels LEsprance conditionnelle :


II On appelle esprance de Y sachant X=x;
note E (Y X = x ) ; la quantit dfinie par
Moments E (Y X = x ) = y P (Y = y / X = x )
Conditionnels y
Rem : E(Y/X=x)=(x) est une fonction de x
appele fonction de rgression de Y en X
TOUIJAR 66
TOUIJAR 65

11
D.TOUIJAR 15/03/2016

Dfinition : La Variance conditionnelle :


On appelle esprance conditionnelle de Y Dfinition :
sachant X; note E (Y X ) ; la variable On appelle Variance conditionnelle de Y
alatoire dfinie par : sachant X=x; note V (Y X = x ) ; la quantit
E(Y/X)=(X)
V (Y X = x ) = E (Y E (Y X = x ) ) / X = x
2


Proprits : De l on peut dfinir la V.A. variance
conditionnelle :
1) Linarit: E (Y 1 + Y 2 X ) = E (Y 1 X ) + E (Y 2 X ) V (Y X ) = E (Y E (Y X ))
2
/X

2) Thorme de lesprance Totale :
Thorme de la variance Totale :
E E (Y TOUIJAR
X ) = E (Y ) 67 V (Y ) = E V (Y
TOUIJAR / X ) +V E (Y X ) 68

Approche gomtrique : Approche gomtrique :


Soit le produit scalaire de 2 V.A. X et Y, not Soit maintenant lespace Lx des V.A.
<X , Y>, dfinie comme suit fonctions de X (i.e. du type (X)); alors
<X , Y>= E(XY) E(Y/X) est la projection orthogonale de Y sur
Et soit ||.|| la norme associe ce produit Lx (les proprits dun projecteur orthogonale sont
vrifies grce aux proprits de lesprance
X ,X = E (X )
scalaire :
X = 2
conditionnelle).Do E[(Y-(X))2] minimale si
(X)=E(Y/X)
Si Y et X sont deux variables centres, alors Y W
<X,Y>=E(XY)=cov(X,Y) et X = E X 2 = X ( )
E(Y/X)

E(X) est la projection orthogonale de X sur O D


E(Y)
la droite D des V.A. constantes : X
X
E[(X-a)2] minimale si a=E(X)
TOUIJAR 69 Lx TOUIJAR 70
O E(X)
D
a

Introduction :
La RLS (rgression linaire simple)
permet dtudier la liaison (suppose
linaire) entre deux variables quantitatives
X et Y; o Y (variable endogne) sera
explique par X (variable exogne).
Autrement, on cherche prvoir le
comportement moyen de Y en fonction de
la V.A. X : Y= (X) tel que cet estimateur
soit sans biais : E(Y)=E(Y), et mesurer
TOUIJAR 71 lerreur de prvision : V(Y-Y)
TOUIJAR 72

12
D.TOUIJAR 15/03/2016

Nous allons nous intress laspect Modle thorique de la rgression simple


infrentiel de cette rgression. On mesure la qualit de cette approximation
On supposera, dornavant, que la par le rapport
fonction de la V.A. X est linaire
(Rgression Linaire) et on traitera alors
2
=
( ( X )) = V ariance exp lique = Cos
V E Y
2
( )
Y
X V (Y ) V arianceTotale
cette rgression sous deux volets; le
volet thorique ensuite le volet o on ne La fonction qui x E (Y / X = x ) est appel
travaillera quavec les ralisations de X fonction de rgression, dont la reprsentation
et Y sur un chantillon. graphique sappelle courbe de rgression de Y
en X : on crit Y = E (Y / X ) +W . Or puisque

E (Y ) = E E (Y / X ) + E (W ) E (W ) = 0

TOUIJAR 73 = E (Y ) TOUIJAR 74

et daprs le graphique ci-dessus W est non Cas o la rgression est Linaire


corrle ni avec X ni avec E(Y/X) (car ) do Cest le cas o E(Y/X)=0+1X ; on a alors
Y = 0 + 1X +W
V (Y ) =V E (Y / X ) +V (W ) E Y( X )= 0 + 1X
E (Y ) = 0 + 1E ( X )
V (Y ) V (W ) V (W )
Y =
2
= 1 Y E (Y ) = 1 ( X E ( X ) ) +W
X V (Y ) V (Y )
E (Y E (Y )) ( X E (X ) ) = 1E ( X E (X ))
2

V (W ) = (W ) = 1 Y V (Y )
2
2
X + E W ( X E ( X ) )

=0

Cov ( X ,Y ) = Y
Cov ( X ,Y ) = 1V ( X )TOUIJAR
1 =
TOUIJAR 75
V (X ) X76

Cas o la rgression est Linaire et simple Modle de la rgression linaire avec


Lquation de la droite scrit alors donnes Exprimentales
Cov ( X ,Y ) Il y a trois types diffrents de donnes :
(
E Y
X ) E (Y )= V (X )
(X E (X ))
Donnes en coupes instantanes ( ou transversales :

Y = E (Y ) + Y ( X E ( X ) ) +W
Cross-sections)
X
Y 2 Exemple : Si on prend le modle keynsien classique:
V (Y ) = 2 V ( X ) +V (W )
X 2 C i = 0 + 1Ri +W i i = 1, , n
= 2V (Y ) +V (W )
2 = Y
2 Ci et Ri observs pour i = 1, ...,n
X i =individu, mnage, entreprise,... et n = nombre total
dobservations
TOUIJAR 77 TOUIJAR 78

13
D.TOUIJAR 15/03/2016

Modle de la rgression linaire avec Modle de la rgression linaire avec


donnes Exprimentales donnes Exprimentales

Sries chronologiques (ou sries temporelles :Time


series) Donnes de panel : Panel data (ou donnes individuelles-
temporelles)
Exemple : Exemple :

Ct = 0 + 1Rt +W t t = 1, ,T Ci t = 0 + 1Ri t +Wi t t = 1,,T i = 1,, n


Ct et Rt observs pour t = 1, ...,T
Cit et Rit observs pour i = 1, ...,n ; t = 1, ...,T
T = anne, trimestre, mois,... et T = nombre total
dobservations TOUIJAR 79 TOUIJAR 80

Modle de la rgression linaire avec


donnes Exprimentales : 1er type
Soient les donnes (xi , yi) un chantillon de
taille n , relatif (X ,Y).
Rgression linaire E Y ( )
= 0 + 1X
X
Le modle scrit alors :

y i = 0 + 1x i +w i i = 1,, n

O wi sont des ralisations indpendantes de W


desprance nulle et de variance 2 constante x i
On lappelle modle linaire
TOUIJAR 81 TOUIJAR 82

Exemples de Modles linaires et non


Linaires:
1)- Soit la fonction keynsienne :
Les coefficients(paramtres) 0 et 1 du
Ct = 0 + 1Rt +W t t = 1, , n
modle, ainsi que 2 (W ) seront estims
O C : consommation
R : le revenu
puis tests partir des donnes (xi ,yi ) de 1: propension marginale consommer
0: consommation incompressible.
lchantillon. w : lerreur (bruit)

Cest un modle linaire :MRLS


TOUIJAR 83 TOUIJAR 84

14
D.TOUIJAR 15/03/2016

Exemples de Modles linaires et non Exemples de Modles linaires et non


Linaires: Linaires:

2)- y = x un modle non-linaire mais 3)- y = exp ( x )


un modle non-linaire
quon peut rendre linaire en composant par le mais quon peut linariser en posant :
logarithme :
y = Ln ( y ) y = + x
Ln ( y ) = Ln ( ) + Ln ( x )
Modle croissance exponentielle
Modle trs utilis en conomtrie (lasticit
constante de y/x ; o est le coefficient
dlasticit

TOUIJAR 85 TOUIJAR 86

Exemples de Modles linaires et non Exemples de Modles linaires et non


Linaires: Linaires:
exp ( + x )
4)- y = un modle non-linaire 5)- y = + exp ( x )
1 + exp ( + x )
est un modle non-linarisable
mais quon peut rendre linaire en posant :
y
y = Ln y = + x
1 y 6)- y = + x + x est un modle linaire
2
Modle logistique qui tudie les variations dun mais pas simple : 2 variables explicatives.
taux de rponse y en fonction dune excitation
x

TOUIJAR 87 TOUIJAR 88

Estimations des paramtres , et 2: Anne PNB: X La Demande : Y


1969 50 6
Exemple Introductif 1970 52 8
1971 55 9
1972 60 12
Le tableau ci-dessous reprsente le produit
1973 57 8
national brute ( PNB) et la demande des biens de
1974 58 10
premire ncessit obtenus pour la priode
1975 62 12
1969-1980 dans un certain pays.
1976 65 9
Nous cherchons estimer la demande des biens 1977 68 11
de premire ncessit en fonction du PNB suivant le
1978 69 10
modle linaire simple: TOUIJAR
1979 70 11
yi = 0 + 1x i +w i ;
TOUIJAR i = 1,, n 89
1980 78 14 90

15
D.TOUIJAR 15/03/2016

Estimations des paramtres , et 2: Hypothses


Exemple Introductif H1: Le modle est linaire en X

H2: Exognit de la Variable indpendante:


Pour effectuer une telle tude, on doit
prciser certaines conditions dapplication E(Wi /X)=0
(hypothses fondamentales)
H3: Homoscdasticit et absence dautocorrlation:
- 2 = V(W i ) est constante quelque soit i
- Cov(Wi , Wj)=0 pour ij

H4: Les Wi sont de mme loi normale :


TOUIJAR 91
Wi N (0,TOUIJAR
2) 92

f (Y/X)
Remarques

Y
1)- La normalit des erreurs W i entrane celle x1
des Yi ; en effet
x2

Wi N (0,2) Y
i
X i = xi N (0 +1xi ; 2 ) x3

X
Graphiquement : E (Y / X = x ) = 0 + 1x
TOUIJAR 93 TOUIJAR 94

Remarques I- Estimation des paramtres du MRLS

2)- E(Wi /X)=0  E(Wi)=0 et cov(Wi ,X)=0


1- La mthode des MCO
3)- La normalit des erreurs W i nest pas On dtermine la droite passant, le plus
ncessaire pour lestimation des paramtres 0 proche, de tous les points du nuage (xi,y i)
et 1 par la mthode des moindres carrs. E(Y /X=x) = 0+ 1 x
Y
4)- Il suffit davoir la non corrlation des erreurs yi
y ei y = 0+ 1 x
et leur normalit pour avoir leur indpendance y (xi )
yi
5)- On pourra ajouter une autre hypothse : Les
Xi sont certaines (non alatoires); ceci nous
vitera dutiliser les esprances
TOUIJAR conditionnelles
95 xi
TOUIJAR
x X 96

16
D.TOUIJAR 15/03/2016

F (0 , 1 ) n
Notons par lquation de la = 0 2 ( y i 0 1x i ) = 0 (1)
droite de rgression recherche
0 i =1

y = 0 + 1x
Et la valeur rsiduelle. Donc la droite passe par le point moyen G ( x ; y )
F (0 , 1 ) n
= 0 2 x i ( y i 0 1x i ) = 0 ( 2)
On dsire calculer les valeurs qui 1 i =1
n n n
minimisent la somme des carrs des rsidus :
n n
x i y i 0 x i 1 x i2 = 0
e = ( y 0 1x i ) = F (0 , 1 )
2 2 i =1 i =1 i =1
i i
i =1 i =1 xy 0 x 1 x = 0 2

On notera dsormais 0 et 1 la place de0 et 1


xy x y Cov ( x , y )
TOUIJAR par rapport et 97
1: 1 =TOUIJAR =
En annulant les drives 0 x2 x2 V (x ) 98

(1) et (2) nous donnent les quations :


n n Les Donnes centres
ei = 0 et
i =1
x i ei = 0
i =1 En utilisant les donnes centres:

Et dautre part : 0 =   0 =  
(xi )( y i y )
1 =
x
et 0 = y 1x do A1 scrit
(xi x )
2
 =1  0 0 
1 =
1 scrit aussi  =1 0
2
n (x y ) x
1 = i i 2 i 2 i
y
TOUIJAR
n (xi ) ( xi ) 99 TOUIJAR 100

X Y X0 X02 Y0 X0 Y0 Y^ ei ei xi ei2

50 6 -12 144 -4 48 7,511 -1,511 -75,532 2,282


52 8 -10 100 -2 20 7,926 0,074 3,872 0,006
55 9 -7 49 -1 7 8,548 0,452 24,867 0,204

60 12 -2 4 2 -4 9,585 2,415 144,894 5,832


57 8 -5 25 -2 10 8,963 -0,963 -54,878 0,927
58 10 -4 16 0 0 9,170 0,830 48,128 0,689
62 12 0 0 2 0 10,000 2,000 124,000 4,000
65 9 3 9 -1 -3 10,622 -1,622 -105,452 2,632
68 11 6 36 1 6 11,245 -0,245 -16,638 0,060
69 10 7 49 0 0 11,452 -1,452 -100,197 2,109
70 11 8 64 1 8 11,660 -0,660 -46,170 0,435
78 14 16 256 4 64 13,319 0,681 53,106 0,464
744 120 0 752 0 156 120,000 0,000 0,000 19,638
^1 = ^0 =
62 10 0 0 10 0,2074 -2,862

17
D.TOUIJAR 15/03/2016

Exemple: la droite de rgression empirique Thorme 1:


sont des estimateurs sans Biais de , et de E x (Y
A0 , A1 et Y )
dans notre cas, a pour quation : 0 1

Elle permet dobtenir une estimation de la


A1 =
( X X )(Y Y )
i i

(X X )
2
demande moyenne des biens de 1re ncessit
i
pour un PNB x.
Rem : 1)- si x (PNB)=0 alors valeur O E x (Y ) dsignera E (Y X =x)
qui na aucune signification concrte.
2) si x=x+1, alors ; une aug de 1 Remarque :

du PNB entraine une aug de la demande


0 , 1 et y sont des ralisations de A0 , A1 et Y

moyenne de 0,21. TOUIJAR 103 TOUIJAR 104

Dem : on doit montrer que E ( A1 ) = 1 De mme puisque :


Pour ce on doit montrer E xi
(A ) =
1 1
0 = y 1x , 0 tant une ralisation de A0 ;on a :
En effet E E ( ( A )) = E ( A ) =
xi
1 1 1
E x i ( A0 ) = E x i ( Y ) x 1 E x i ( A1 )

E x i ( A1 ) =
(x i x )E xi
((Y i Y) )  
1

(x x ) = 0 + 1x x 11 = 0
2
i

Or E x i (Y i ) = 0 + 1x i
(
E E x i ( A0 ) = E ( A0 ) = 0)
do
E x i ( Y ) = 0 + 1x E x i (Y i Y ) = 1 ( x i x )
E x i ( A1 ) = 1 TOUIJAR 105 TOUIJAR 106

Pour la troisime estimation : En utilisant les donnes centres:


E (Y
x
) = 0 + 1x 0 + 1x = y
x 0i = x i x et Y 0 i =Y i Y do A1 scrit
est une estimation sans Biais de 0 + 1x = E (Y x
) x Y = x Y = Y x 0i
A1 = 0i 0i 0i i
o i =
(x ) (x ) (x )
i i
= A + A X est un estimateur sans
Y 0i
2
0i
2
0i
2
0 1

Biais de E x (Y ) Do Cov ( A , Y ) = Cov ( Y


xi
1
xi
i i , Y)
1
= i Cov x i (Y i , Y ) = i Cov x i Y i , Y j
On montre de plus que A1 et Y sont non
corrls; pour ce, on commence par n
2
montrer quelles le sont = i
n
=0
=0
conditionnellementTOUIJAR
xi : 107 Par consquent elles sont non corrles marginalement
TOUIJAR 108

18
D.TOUIJAR 15/03/2016

Pour la linarit, on a dj vu que :


Proprits et Distributions des
x 0i
Estimateurs A1 et A0 A1 = iY i o i =
(x )
2
0i
Thorme 2 (GAUSS-MARKOV) :
Reste montrer que la variance est minimale;
A0 et A1 sont des estimateurs BLUE de 0 et 1 pour ce supposons quil existe un autre
estimateur A linaire et sans Biais (o on
notera E la place de Exi et V au lieu de Vxi ) :
Dm : on a dj montr qu ils sont sans biais. A = k iY i et E ( A ) = 1 k i E (Y i ) = 1
De plus
k i (0 + 1x i ) = 1
2
V xi
( A ) = V (Y ) = 2 xi 2 2
=
(x )
1 i i i 2
0i 0 k i + 1 k i x i = 1
car
k i = 0 et k x =1
V xi
(Y i ) =V (0 + 1X i W i X i = x i ) =V (W i ) =
+TOUIJAR 109
2 i i
TOUIJAR 110

Or De mme pour A0; on a vu que :


V ( A ) = k i2V (Y i ) = 2 k i2 1 X (Y Y)
A0 = Y XA1 = Y X
0i i

= ( k + ) = ( k ) + ( )
i
X
2 2 2 2 2 2 2
i i i i i i N 0i

+ 2 ( k )
2
i i i X 0iY i YX 0i

= ( k ) + ( ) 2 ( ) 1 1
Y i X = X i Y i
2 2 2
= =0
2 2 2

X 0i 2
i i i i

+ 2 k 2 N N
i i
une ralisation de A0 est :
2 2 2 2
= 2 ( k i i ) 2 (i ) + 2 i i
 x 02i
2 2
x k x k
 x 0i   i 1
V ( A1 )  =1 =0 0 = x i yi
2V ( A1 ) N
= 2 ( k i i ) + 2V ( A1 ) V ( A1 )
2
On vient de voir que A0; est une
combinaison linaire des Yi et quil est sans
= ( k i i ) +V ( A1 ) V ( A1 )
2 2

 TOUIJAR 111


Biais de 0 reste montrer
TOUIJAR
quil est de variance
112
0
minimale :

On calcule maintenant la variance de A0: Considrons un autre estimateur linaire sans biais
(dsormais, on travaille avec les xi fixes et V au lieu de Vxi) A de 0, do
2 2
1 1
V ( A 0 ) = x i V (Y i ) = 2 x i
N N A = k iY i et E ( A ) = 0 k i E (Y i ) = 0

2
k i (0 + 1x i ) = 0
= 2 2 + x 2
1 x 0i x
2
N N
2
2
N
i
0 k i + 1 k i x i = 0

xoi

i =1 k i = 1 et k x i i =0

x0i

2 1 1 x  = +1 x 2

= +x 2
2 =0 2

N N
2 N N
2 N N
2
x 0i x 0i x 0i
i =1 i =1
TOUIJAR i =1 113 TOUIJAR 114

19
D.TOUIJAR 15/03/2016

1
Or posons f i = x i Thorme 3 :
N n
V ( A ) = k i V (Y i ) = 2 k i2 ( y yi )
2 2
i
=
2 i =1 est une estimation sans Biais de 2
= 2 (ki f i + f i ) = 2 (ki f i ) + 2 (f i )
2 2 2
n 2
+ 2 2 f i ( k i f i )
= 2 ( k i f i ) V ( A0 ) + 2 2 f i k i
2
Dm : en injectant Y dans la diffrence, on a :
2 2 2 2
= (k fi ) V ( A0 ) + x xi ki
2
ki
(Y ) = (Y )
2 n n
2 2
N x 02i  Y
Y+YY
;
i
  i i i i
=1 =0 i =1 i =1
2 2 x 2
= 2 ( k i f i ) V ( A0 ) + 2V ( A0 ) et puisque Y = Y
d'o :
2
+
0i
x 2

( ) ( )
n n n
= (Y i Y ) + Y 2 (Y Y ) Y
2
2
Y Y

= 2 ( k i f i ) +V ( A0 ) V ( A0 )
2 i i i
i =1   i =1 
  i =1 
  (1)
0
TOUIJAR 115 ( 2) TOUIJAR (3) 116

Dm : (suite) Dm : (suite)
( ) ( )
n 2 n 2
Y i Yi = Y i Y + Y Yi
i =1 i =1
Do :
n n n

(Y Y ) = (W i W ) + 12 ( x i x )
2 2

) )
2

( (
n n n
= (Y i Y ) + Y 2 (Y Y ) Y
2
2 i
Y Y
i =1 i =1 i =1
i i i
i =1   i =1 
  i =1 

+2 (W i W ) ( x i x
n
() ( 2) (3)
)
1

i =1
Dautre part : pour calculer (1), on a :
E (Y i Y ) = E (W i W ) + 12 ( x 0 i
n n n
)
2 2 2

i =1
i =1 i =1

y i = 0 + 1x i +w i n
+2 ( x i x ) E (W i W )
y i y = (w i w ) + 1 ( x i x ) 
y = 0 + 1x +w i =1
=0
n n n
= E W i 2 + n E W 2 2 E W i W + 12 ( x 0 i )
2

TOUIJAR 117 i =1 TOUIJAR 118 i =1 i =1

Dm : (suite) Dm : (suite) Pour ce qui est de (2) :

(Y Y ) = (Y Y )
2 n 1 n n n n
2 E W i W i + W j + 12 ( x 0i ) = A12 ( xi x )
2 2
= n 2 + n
2 2
i i
n i =1 n j i i =1 i =1 i =1 i =1

2 n




n
i =1
2 n
i =1
(2
E Yi Y = (xi x ) E A12

) ( )
= n 2 + 2 E W i 2 + E W iW j
n i =1 

= 2


j i
 

n 2
= (x0i ) V A1 + 12 (( ) )
=0 i =1
n
+12 ( x 0i )
2

n 2 2 n 2
i =1
n n
( )
= x0i n

+ 1 = 2 + 12 ( x0i )
2

( x0 i )
= n 2 + 2 2 2 + 12 ( x 0i ) = ( n 1) 2 + 12 ( x 0i )
2 2 i =1 2 i =1

i =1 TOUIJAR i =1 119 i =1 TOUIJAR 120

20
D.TOUIJAR 15/03/2016

Dm : (suite) Pour ce qui est de (3) : Dm : (suite)


Pour ce qui est de (1)+(2)-2*(3) :

(Y Y )(Y Y ) = Y (Y Y ) Y (Y Y )
n n n

( )
n 2
E Yi Yi = ( n 2) 2
i i i i i
i =1 i =1 i =1

n n
i =1
= A1 Yi ( xi x ) A1 Y ( xi x )
i =1
 
= ( x0 i ) i Yi
n 2
i =1
 
=0
 1 n
n2 i
E Y Yi( )2 = 2
i =1
i =1
n
i =1


( n
i =1
)2
E (Yi Y ) Yi Y = E A1 ( x0i ) A1




CQFD
On pose donc :
n 2
(( ) n 2
= (x0i ) V A1 + 12 = 2 + 12 ( x0i ) ) 1
i =1 TOUIJAR
i =1 121
S2 =
n2
ei2 ESB de 2
TOUIJAR 122

Distributions des estimateurs


A0 , A1 et Y Remarques :
Puisque Wi est normale, on a 1- Les lois des estimateurs vont nous servir

Yi/Xi=xi N ( 1 xi + 0 , 2) pour la construction des intervalles de


suivent aussi, pour des x confiance et pour les Tests.
Par consquent A0 , A1 et Y i
fixes, des lois Normales : 2- On dmontre que :
A1 N ( 1 , 2

(x ) 0i
2
)
( n 2 ) S 2 = e i2 2 ( n 2)
1 2 2
A0 N ( 0 ,
2
+
x2
)
N ( x 0i )
2
est indpendante de A 0 , A1 et Y
1
Y i N (
1 xi + 0 ,TOUIJAR
2 +
x 02i
N ( x )2
)
123 TOUIJAR 124
0i

II- Tests sur les coefficients du MRLS i)- Formulation des Hypothses :
H 0 : 1 = 0

1- Test sur la rgression #
H : 1 0
On veut tester si la rgression de Y sur X est
1

significative ?

ii)- Statistique utilise et sa loi :


Sous lhypothse 1 = 0 le modle scrit :

Yi = 0 + Wi i = 1,, n On Propose alors A1 estimateur sans biais de 1


et Y ne dpend plus alors de X.
TOUIJAR 125 TOUIJAR 126

21
D.TOUIJAR 15/03/2016

A1
N (0 , 1 ) sous H0 2 =
1
( yi 0 1 xi )2 = 1 ei2
n2 n2
x 0i
2
Le n-2 vient du nombre de paramtres estims
Do, la statistique du test sera, sous H0
Or est inconnu, on doit lestimer;
Si 0 et 1taient connus, la meilleure
TA1 =
A1
; o sA1 =

=
e
i
2

estimation de 2 est : S A1
(x ) n 2 (x )
2 2
0i 0i
1 1
w i2 = ( y i 0 1 x i )
2
qui suit une loi de student n-2 d.d.l.
n n Sous H0, T devient :
A1
Sinon, En remplaant 0 et 1 par A 0 et A1, on T A1 = tn 2
obtient une bonne estimation
TOUIJAR de 2 : 127 TOUIJAR
S A1 128

iii)- R.D. Solution :


: = 0
Si t A > t n 2 ; /2 on rejette H0 F.H. H 0 1

1
#
H
: 0
Si t A1 t n 2 ; /2 on ne rejette pas H0
1 1

A1
Estimateur et sa loi TA1 = t(10)
S A1
Exercice : R.D.
Si t > t10 ;0,025 on rejette H0
Pour lexemple du PNB, 1

Si t1 t10 ; 0,025 on ne rejette pas H0
Tester si la rgression est significative 5% ?
TOUIJAR 129 TOUIJAR 130

A.N. 2- Intervalle de confiance de 1


1 n 2 (x )
2
1 Daprs ce qui prcde, on a :
t1 = =
0i

e I C (1 ) = [1 t n 2; / 2 s1 ; 1 + t n 2; / 2 s1 ]
s1 i
2

0, 2074 10 752
= 4, 06 et t10;0,025 = 2, 23
19, 638 A.N. 19, 638
t10;0,025 = 2, 23 1 = 0, 2074 s1 = 10 = 0, 05
752
On a t calcul suprieur au t tabul donc
I C (1 ) = [ 0, 2074 2, 23 0, 05 ; 0, 2074 + 2, 23 0, 05]
on RH0 la rgression est donc significative
= [ 0,096 ; 0,319]
TOUIJAR 131 TOUIJAR 132

22
D.TOUIJAR 15/03/2016

Remarque : III- Tests et Tableau dAnalyse de la


1 = 0 I C (1 ) = [ 0, 096; 0,319] Variance (ANOVA) dun MRLS
RH 0
1- quation fondamentale de l ANOVA:
Interprtation: 95% de confiance, La notion de liaison entre Y et X, signifie
laugmentation de la demande moyenne se
qune variation de x implique celle de Y.
situe entre 0,1 et 0,32 pour une augmentation
de 1 du PNB La formule de dcomposition de la
Pour 0 on a : variance permet de connatre la part de
variation de Y explique par celle de X :
I C ( 0 ) = 0 t n 2; / 2 s 0 ; 0 + t n 2; / 2 s 0
1 x2

 i (YY) +
(Y Y ) =  2
(Y Y )
 i
2
i i
2

= [ 9, 979 ; 4, 255 ] o s 2 0 = S 2 + = 3,194 ^ 2


TOUIJAR n
x 02i 133
SCT SCE
TOUIJAR SCR = 2
e134
i

en effet : La variabilit totale(SCT)est gale la


(Y Y) = Y Y( )
2 2
+Y
Y
i i i
variabilit explique(SCE) augmente de la
( ) + ( Y Y ) + 2 (Y Y )( Y Y )
2 2
= Y Y

i i i i
variabilit rsiduelle(SCR).
Cette dcomposition va nous permettre de
= (Y ) + (Y
Y ) + 2 e ( Y Y )
2 2
Y i i i i dcider de la qualit de lajustement du modle.
= (Y ) + (Y
Y i
2
i ( Y )
Y ) + 2 e Y
2
i i
Remarque : si la variance explique tend
vers la variance totale (SCR faible), la
= (Y ) + (Y Y ) + 2A e ( x x )
2 2
Y i i 1 i i qualit de lajustement tend tre
meilleure.
( ) + ( Y Y ) + 2A
2 2
= Y Y

i i e x x e
1 i i i Ceci nous donne une ide de tester,

=0 =0
 dune autre faon, la signification de la
=0
rgression: un test quivalent au T-test
= (Y Y

i ) + (
2
Y
TOUIJAR
Yi )
2
135
sur 1 TOUIJAR 136

La variabilit explique SCE nest autre quun Do


H : 1 = 0
estimateur de E(SCE/1) et SCR estimateur de
0

#
E(SCR/n-2); on a : H
1 : 1 0
SCE
E
1


( 2
)
= E A1 x 0 i = + 1 x 0i
2 2 2 2
H
0 : E (S C E 1 ) = E ( S C R n 2 ) ( r g n o n s ig n .)

SCR e i2 #

E = E =
2

n 2 n 2
H
1 : E (S C E 1 ) > E (S C R n 2 ) ( r g s ig n .)

De l, on peut affirmer que si la rgression est La statistique utilise est SCE


SCR
significative( 1 0 ) alors:E(SCE /1) > E(SCR/n-2) Sa loi sous H0?
Par contre, si la rgression nest pas significative On montre que

( 1 = 0) alors: E(SCE/1) = E(SCR/n-2) 2


SCE/ 2(1)
TOUIJAR 137
2
SCR/ TOUIJAR
2(n-2) 138

23
D.TOUIJAR 15/03/2016

Do sous H0 Tableau de l ANOVA


SCE Source Somme Carrs
d.d.l Fisher
F=
1
Y (1 ; n 2) de var des carrs moyens
SCR
n2 x SCE= Yi Y ( )2
1 SCE/1F=
SCE/
R.D.
Si F > Y (1N n 2 ) on rejette H 0 Rsidu SCR= e 2
i n-2 SCR/(n-2) (SCR/(n-2))

Si F Y (1N n 2 ) on ne rejette pas H 0
SCT= (Yi Y )
2
Totale n-1
Remarque :on a vu Y (1;n-2) = [t(n-2)]2
En effet : A
2

(T ) Exercice: on reprend lexo. Prcdent. A laide


2
= 1 = SCE =F
A1
SA SCR n 2 de lANOVA, tester si la rgression est significative
1
TOUIJAR 139 TOUIJAR 140

Solution : sous H0 Une troisime faon de tester la


rgression est de tester le coefficient de
F=
SCE
SCR
Y (1 N n 2) corrlation thorique :
R.D. n2
Si F > F0, 05 (1;10 ) on rejette H 0 F.H. H 0 : = 0

#
Si F F0, 05 (1;10 ) on ne rejette pas H 0 H : 0
1

OrF = SCE 10 = 1 x 0i 10 = 0, 2074 752 = 16, 472


2 2 2
Soit R le coefficient de corrlation simple
SCR 2
ei 1,9638
entre X et Y estimateur de ; R 2 est
Y0,05(1;10) = 4,96 do F > Y0,05(1;10) donc on RH0 appel le coefficient de dtermination
la rgression est donc significative SCE SCR
R2 = =1
Remarque :F = [T]2=(4,06)2=16,484
141 TOUIJAR 142
SCT SCT

En effet, cov( x, Y ) x Y Or on a vu que :


R= =
0i 0i
SCE
X Y
x Y 2
0i
2
0i F=
SCR
1 =
R 2 SCT
SCR
=
SCR
R2
=
R2
1 R2 ( )
R2 =
( x Y ) 0i 0i
2

= 12
x 2
0i
n2 n2 SCT
n2
n2

x Y 2
0i
2
0i Y 2
0i Et sous H0
R n2
12 x02i SCE F = T21 T 1 = t / 2 (n 2 )
=
SCT
=
SCT R.D. (1 R ) 2

Car

( )
Si r > r / 2;n 2 on rejette H 0
( )
2
SCE = = Yi Y
2
Yi Y
Si r r / 2;n 2 on ne rejette pas H 0
= (1 ( xi x )) = 12 x02i
2
TOUIJAR 143 r /
/22; n-2 se trouve sur la tableTOUIJAR
du coefficient de corrlation144

24
D.TOUIJAR 15/03/2016

A.N. : SCE 32, 347


r2 = = = 0, 622 r = 0, 789 IV- PREVISION Sur Un MRLS
SCT 52
Or r = 0,789 > r0,025;10 0,576 on rejette H 0 On sait que Yi est un estimateur de la
moyenne des (Yi) donc de E(Y):
Remarques: Yt = Yt + et = 0 + 1 xt + et t = 1, , n
- On peut tester H0 en utilisant le rapport
R n 2 linstant k=n+1, on a :
critique T = , on lit alors t dans la
(1 )
Yk = 0 + 1 x k = Y + 1 ( x k x )
2
R
table de student n-2 ddl
le r-test sur le coefficient de corrlation est
quivalent au T-test sur la pente( 1 ) quivalent Intervalle de confiance autour de E(Y)
au F-test sur les variances.
TOUIJAR 145 TOUIJAR 146

Proprits de Yk : la loi de Yk est normale  on a alors :


car combinaison des Yi Yk E (Y k )
TY = t /2 ( n 2 )
( )
E Yk = E (Y ) + (x k x ) E (1 )
k
1
+
( xk x )
2


n ( x x )2
= ( 0 + 1 x ) + (x k x ) 1 = E (Yk ) i

( )
V Yk = V(Y ) + (xk x ) V(1 ) =
2 Do

+ (x k x )
1 2
2
2 1 ( x x )2 I C (E (Yk )) = Yk t / 2 (n 2 ) ;
+ ( xk x ) 2
= 2 + k 2
n
n ( x x )2



x x0i
2 i
n 0i
1 (x k x )2
Or 2est inconnue, on lestime par
2
=
e 2
i Yk + t / 2 (n 2 ) +
(xi x )2
n TOUIJAR


TOUIJAR
n2
147
148

Si n : Intervalle de confiance pour E(Yk)


+ (xk x )
1 2
I C (E (Yk )) = Yk z / 2 ;
n ( x x )2 y
i
b.sup =A +AX
Y

+ (xk x )
0 1
1 2

Yk + z / 2
n ( x x )2
i
b.inf

TOUIJAR 149
x
TOUIJAR
X
150

25
D.TOUIJAR 15/03/2016

Exercice: on reprend toujours le mme exo.


Estimer laide dun intervalle de confiance la
moyenne des Y pour un x = 78.
Solution : on a dabord Y78 = 2,862 + 0, 2074 78 = 13,319

1 ( 78 62 )2
I C ( E (Y 78 ) ) = 13,319 2, 23 1,964 + ;
10 752

1 ( 78 62 )2
13,319 + 2, 23 1,964 +
10 752

= [11, 287 ;15,352] TOUIJAR 152

Rgression de Y par X (R=0,622)


18

V- PREVISION Sur Un MRLS


16

Intervalle de prvision autour de Y k


14

12
Soit xk une valeur non observe de X (exple k=n+1)
10
alors la prvision naturelle de Yk est
Y

8
Yk = A0 + A1 xk
6
Or Yk =(Y/X=xk ) N (1 xk + 0 , 2)
Vu que les 2 V.A. Yk(ne dpend que de k) et Yk
4

(ne dpend que des valeurs prcdentes(1,, n)


2
50 55 60 65 70 75 80

TOUIJAR
X
153 TOUIJAR 154
Actives Modle Int. de conf. (Moyenne 95%) Int. de conf. (Obs. 95%) on a :

IV- PREVISION Sur Un MRLS IV- PREVISION Sur Un MRLS


Intervalle de prvision autour de Y k (p )
Intervalle de prvision autour de Y k (p )
Yk ( p ) = Yk + e k e k = Yk ( p ) Y

1 + + ( xk x ) ;
1 2

V (e k ) = V (Yk ( p ) ) + V Y = 2 1 + +
1
() (x k x ) 2
( )
I p Yk ( p ) = Yk t / 2 (n 2)

n (xi x )2



n
(xi x )2
(e k ) = S

1 + 1 + (x k x )2 1
Yk + t / 2 (n 2 ) 1 + +
(xk x )2

(xi x )
2

(xi x )2
n n

Y
I p (Y 78 ) = [9,568 ;17, 07 ]
Yk ( p )
t / 2 (n 2 ) )
S

1 + 1 + (x k x )2

n (xi x )2 TOUIJAR 155 TOUIJAR 156

26
D.TOUIJAR 15/03/2016

IV- PREVISION Sur Un MRLS


Chapitre 2
Remarque :
Cet intervalle de prvision permet de
dtecter les points aberrants( ou
extrmes) afin de les carter pour refaire
une nouvelle rgression sans leurs Rgression Multiple
influence.

TOUIJAR 157 TOUIJAR 158

Introduction : Le modle :

Le but premier de ce deuxime chapitre est la


modlisation (lexplication) dans un but Le modle de rgression linaire multiple
prdictif, dune variable quantitative Y par est une gnralisation de la rgression
plusieurs variables quantitatives X1, X2, , Xp . simple.
Ces dernires sont lies linairement avec Y.
Il sagit l de ce quon appelle : Cest un outil statistique mis en uvre
la rgression linaire multiple. pour ltude de donnes
multidimensionnelles.
TOUIJAR 159 TOUIJAR 160

Le modle : Objectifs Le modle : (aspect empirique)


Une variable quantitative Y (V. expliquer ou
Estimer les paramtres du modle 0 ;1 ; 2 ; ; p endogne) est mise en relation avec p variables
Avec des estimateurs de meilleur qualit. quantitatives X1, X2, , Xp (V. explicatives , exognes
ou rgresseurs).
Mesurer le pouvoir explicatif global du modle.
On mesure sur n individus ces p+1 variables
Faire de la prvision en construisant des intervalles de
reprsentes par des vecteurs de Rn: y, x1, x2, , xp
prvision.
(o n > p+1).
Ce dernier point nous permettra de reprer les points
aberrants et de les supprimer.
Lcriture du modle linaire est alors comme suit :

y i = 0 + 1x i 1 + 2 x i 2 + + p x ip + w i 1 i n
TOUIJAR 161 TOUIJAR 162

27
D.TOUIJAR 15/03/2016

Le modle : Ecriture matricielle Le modle : Les Hypothses


y 1 1 x 11 x 12 x 1 p 0 w 1
On supposera vrai les hypothses suivantes :

x 2 p 1 w 2 H1- Linarit : y i = 0 + 1x i 1 + 2 x i 2 + + p x ip + w i 1 i n
y 2 1 x 21 x 22
La relation entre y et x1, . . . ,xp est linaire.
= +
y i 1 x i 1 x i 2 x ip i w i
H2: Plein rang : La matrice XX est inversible; autrement
det(XX) 0. On peut lexprimer par le fait que les Xi
sont indpendantes linairement (pas statistiquement).

y n 1 x n 1 x n 2 x np p w n

Cette hyp. est ncessaire pour lestimation des paramtres.

Y ( n ,1) X ( n , p +1) ( p +1,1) W ( n ,1) H3: Exognit des variables indpendantes : Les W i
sont des termes derreur desprance conditionnelle
aux ralisations des xi est nulle : E(W i | x1, . . . ,xp) =0.
+W
Y = XTOUIJAR 163 Les xi ninterviennent pas dans la prdiction de W i
TOUIJAR 164

Le modle : Les Hypothses (suite)

H4: Homoscdasticit et absence dautocorrlation:


V(W i) = 2; o 2 est cste et wi nest pas corrl avec
wj pour i j : cov(wi ,wj)=0

H5: Gnration des donnes: Les Xi quelle soient


alatoires ou dterministes (facteurs contrls) ne
changent en rien les rsultats.

H6: Distribution Normale : Les W sont distribus selon la


loi Normale.
TOUIJAR 165 166

Le modle : Mthode des Le modle : Mthode des


Moindres Carrs Moindres Carrs
Comme on a vu dans le chapitre 1, il sagit , afin Autrement :
n
destimer , de minimiser la somme des carres des F ( ) =
rsidus (ei) (voir graphique du chapitre 1) :
e
i =1
i
2
= e e

(y )
2

n
= i 0 1 x i 1 2 x i 2 + p x ip

min e i2 = (Y X ) (Y X ) = Y Y 2' X Y + ' X X


i =1

= Y X
o e = Y Y F
= 0 2 X Y + 2 X X = 0

= ( X X ) X Y
TOUIJAR 167 1 168

28
D.TOUIJAR 15/03/2016

Le modle : Mthode des Le modle : Mthode des Moindres Carrs


Moindres Carrs Exemple : (Modle avec constante)

O:
n x i1 x i 2 x ip 1
X =
1 1.5
Y = 2observations :(1,1.5) et ( 2,2)
x i1 x i 1 x i 1 x i 2 x i 1 x ip 1
2 2 2
X X = 3.5 2 3 5 3
( XX ) =
1
XY = XX =
x ip x ip x i 1 x ip
2 5.5 3 5 3 2
1
        = ( XX ) XY =
1
= X = 1.5
          Y
( p + 1, p + 1 )
0.5
 2
yi =1+0.5x i
yi
1.5 1.5 0
X Y =
x i1y i e = =
2 2 0

e=0R2 : signifie que la droite estime passe par les
ip y i
x TOUIJAR 169 TOUIJAR
deux points (1 , 1.5) et (2 , 2).
170

Le modle : Mthode des Moindres Carrs PROPRIETES ET DISTRIBUTION DE


Exemple : (Modle sans constante)
LESTIMATEUR
1 1.5 Thorme (GAUSS-MARKOV) :
X = Y = 2observations :(1,1.5) et ( 2,2)
2 2
est BLUE de
1
XY = 5.5 XX = 5 ( XX ) =
1

5 Remarque :
5.5
= ( XX ) XY = = 1.1 Y
1
= X = 1.1  ; ; ; ; sont des fonctions linaires des Y

  2.2 0 1 2 p i
5 yi =1.1x i
 La matrice Var-Cov (variance-covariance) de ,
1.5 1.1 0.4
e = =
note , s'crit : = 2 ( XX )
1
2 2.2 0.2
n

On remarque que e i 0 car le modle est sans cste.


i =1

TOUIJAR 171 TOUIJAR 172

Quelques lments de dmonstration :


PROPRIETES ET DISTRIBUTION DE
LESTIMATEUR
 Puisque, = ( XX ) XY et en posant k = ( XX ) X ;
1 1

Matrice de Var-Cov de W et son estimateur


on obtient lcriture : = k Y combinaison des Yi
E (W12 ) E (WW 1 2 ) E (WW 1 n)


E ( ) = kE (Y ) = k ( X ) = (
XX ) XX =
1

E (W2 )
 E (WW2 1)
  2

W == E WW =
= kV (Y ) k = k ( 2 I n ) k = 2 kk
I


= 2 ( XX )
1
X X ( XX )
1
E (WnW1 )
E (Wn )
2


E (W12 ) 0
= 2 ( XX ) [ XX ] ( XX ) = 2 ( XX )
1 1 1 0

0 E (W2 )
2
 Rem : on peut utiliser la dfinition : = = 2I n


= E ( )( )
0

E (Wn )
2
173

TOUIJAR 174

29
D.TOUIJAR 15/03/2016

PROPRIETES ET DISTRIBUTION DE PROPRIETES ET DISTRIBUTION DE


LESTIMATEUR LESTIMATEUR
Matrice de Var-Cov de W et son estimateur
e = Y Y = ( X + W ) ( X ) Estimation de la Matrice de Var-Cov de :
= X +W X ( + ( X X )1 X W )
On a dj vu que :
= I X (X X ) X W ( o est symtrique et idempotente )
1

  

e i2 = e ' e = W ' W E (e ' e ) = 2T r ( ) ( dvelopper )
= 2 ( XX ) = 2 ( XX )
1 1
E (e ' e ) e 2
= 2 ( n ( p + 1) ) 2 = 2 = i

n p 1 n p 1
S CR
= est donc un estimateur san s Biais de 2
n p 1 TOUIJAR 175 TOUIJAR 176

Tableau dAnalyse de la Variance Tableau de l ANOVA


(ANOVA) dun MRLM Source Somme
d.d.l
Carrs
Fisher
de var des carrs moyens
quation fondamentale de l ANOVA: x (
SCE= Yi Y )
2
p SCE/p F=
(SCE/ p)/
La formule de dcomposition de la variance Rsidu SCR= e 2
i n-p-1 SCR/(n-p-1) (SCR/(n-p-1))
permet de connatre la part de variation de Y
Totale SCT= (Yi Y )
explique par celle des Xi : 2
n-1

(Y Y ) = (Y Y ) + (Y Y )
2 2 2
i i i i
  
SCT SCE
TOUIJAR SCR = ei2
177 TOUIJAR 178

Mesure de la Qualit de lajustement Tests et Intervalles de Confiance des


Coefficients du Modle
Lvaluation globale de la rgression est
donne parR 2 le coefficient de Test de Significativit Globale de la
dtermination, qui exprime la part de variabilit Rgression
totale explique par le modle: On vient dvaluer la qualit dun ajustement
SCE SCR par le calcul de R2 (o R est appel coefficient
R2 = =1
SCT SCT de corrlation multiple), mais sur un
Remarque:
R2 doit tre utilis avec prcaution.
chantillon; pour que a soit sur toute la
population; on doit procder une infrence
On ne peut utiliser R2 dans un modle sans constante.
statistique sur le 2 paramtre thorique:
Si p augmente, R2 augmente aussi, mme sil y a des
variables qui nont rien voir avec le phnomne; pour H 0 : 2
= 0
ce on corrige R2 : SCR Cest un F-Test :
( n 1) 1 R 2 = 1 n p 1 #
R 2 =1
( n p 1)
( ) <R2 TOUIJAR
H 1 : 0
TOUIJAR SCT 179 2 180
n 1

30
D.TOUIJAR 15/03/2016

1- Test de Significativit Globale de la 1- Test de Significativit Globale de la


Rgression Rgression
Dune faon analogue au MRLS, a statistique du
test est , sous H0 Le F-Test prcdent est quivalent au F-Test
SCE R2 sur le vecteur coefficient :
p p
F=
SCR
=
1 R 2 Y ( p ; n p 1)
n p 1 n p 1
F.H.
H 0 : 1 = 2 = = p = 0
R.D. si F>F(p;n-p-1), On Rejette H0
# 0
H : j tq 0
1 j

TOUIJAR 181 TOUIJAR 182

2- Test de Significativit individuel des Calcul de : i

coefficients On a vu que


2
Est-ce que la Variable Xi joue significativement 0

2

= ( X X )
1 1
dans lexplication de Y ? On effectue alors un = 2

T-test
F.H. H 0 : i = 0 2
p

#
=
e i
2

( X X )
1
H : 0 n p 1
1 i

( X X )
1
S.U. si o n p o se d ii le s l m e n t d ia g o n a u x d e
i
Ti = t(n-p-1) a lo rs : 2 i =
e i
2

d ii

i
TOUIJAR 183 n p 1 TOUIJAR 184

Tests et Intervalles de Confiance des PREVISION ET INTERVALLE DE


Coefficients du Modle PREVISION
Si on ajoute une observation k =n+1 pour
chacune des variables explicatives, on obtient
Test Modle rduit VS Modle Complet une prvision ponctuelle :
y k = 0 + 1x k 1 + 2 x k 2 + + p x kp
= X k ; o X k = (1 x k 1 x kp )
Et on montre que :
VOIR TD e2 = 2 1 + X k ( XX )
1
X k
k
ek y y k
= k t(n-p-1)
TOUIJAR 185
ek e k TOUIJAR 186

31
D.TOUIJAR 15/03/2016

INTERVALLE DE PREVISION de yk

I p ( y k ) = yk tnp1;/2ek ; yk +tnp1;/2ek

TOUIJAR 187

32

Vous aimerez peut-être aussi