Académique Documents
Professionnel Documents
Culture Documents
Walter Sosa-Escudero
Econ 507. L'analyse conomtrique. Printemps 2009
Hypothse 1 (linarit):
Yi = 1 x1j + 2 x2j + + K xk i + ui , j = 1, . . . , n
Y=X+u
C'est le modle linaire sous forme de matrice.
Avant de poursuivre, nous devons tablir certains rsultats impliquant des matrices et
vecteurs.
Soit A une matrice m n. A : n vecteurs colonnes, ou m vecteurs lignes. La colonne
rang de A est dfini comme le nombre maximum de colonnes linairement dpendante.
De mme, la ligne grade est le nombre maximal de lignes qui sont linairement
dpendantes.
La ligne grade est gale la colonne Grade. Nous allons donc parler, en gnral, sur
le rang d'une matrice, et dsignera comme (A)
Laissez un tre un carr (m M) matrix. Un n'est pas singulier si
|A| = 0. Dans de tels cas, il existe une matrice non singulire
unique A-1 a appel l' inverse d'une tels que
AA-1 = A-1A = JEM .
Un un carr m m matrix.
Si (A) = m |A| = 0
Si (A) < M |A| = 0
(X ) = (X 0 X ) = k
. Y =
YK
E(Y 1 )
E(Y 2 )
E(Y ) = =
.
E(Y K )
V (Y ) = E[(y - )(Y - )0 ]
E(Y 2
1 - 1 ) E(Y 1 - 1 )(Y2 - 2 )
E(Y2 - 2 )2
=..
.
E(Y k - k )2
V (Y
1 ) c ov(Y1 , Y2 ) . . . C ov(Y1 Y K )
V (Y2 ) ...
=
V (YK )
Lle variance d'un vecteur est appel sa matrice de variance-covariance, une k k matrix
Si V (Y ) = et c'est un K 1 vecteur,
V (c0 Y ) = c0 V (Y )c = c0 c.
Prvisions conditionnelles
Z
Y FY |x dy
E(Y |X = x) =
Ide: comment la valeur prvue de Y change lorsque X change. C'est une fonction qui
dpend de X . Si X est une variable alatoire, puis E(Y |X ) es una aleatoria variable.
Proprits
E(g(x )|X ) = g(x )
Y = a + bX + U , puis E(Y |X ) = a + bX + E(U |X ).
E(Y) = E [E(Y |x )] (Loi d'itr Attentes).
E(u i |X ) = 0, J = 1, 2, . . . , n
En cours de base il est prsum que E(ui ) = 0. Dont l'un est plus forte?
E(x jk ui ) = 0, j, i = 1, . . . , n; k = 1, . . . , K
En termes : variables explicatives ne sont pas corrls avec l'erreur
Termes de toutes les observations.
La preuve: comme exercice.
(X ) = k, w.p.1
Rang ?
Toutes les colonnes de la ralisations de X doit tre linairement indpendantes.
Attention : Ceci interdit les relations linaires entre colonnes exacte de X .
Le modle admet la non-relations exact et/ou de relations non-linaires.
Exemples.
V (ui |X ) = E[u2 |x 2 2
I I ] - E(u i |X ) = E(u |x )
C ov(ui , uj |X ) = E(ui uj |X )
Donc pas de corrlation srielle implique que x donn tous les termes d'erreur de toutes les
observations ne sont pas corrles.
Vij = c ov(Zi , Zj ).
Homoscdasticit
J (V (U2 |x ) = 2 ) implique que toutes les
lments' diagonaux de V (u|X ) est gale 2 .
Aucune corrlation sereial implique que tous les lments hors de la diagonale de V (u|X )
sont gales zro.
Rsum
1 linarit : Y = X + u.
2 Strict exognit : E(u|X ) = 0
3 pas de multicollinarit : (X ) = K , w.P.1.
4 Aucune htroscdasticit/ la corrlation en srie : V (u|X ) = 2 IN .
L'Intercept
Considrons le cas x1j = 1, J = 1, . . . , n
Yi = 1 + 2 x2j + + K xk i + ui , j = 1, . . . , n
Puis 1 est l' ordonne l'origine du modle. Prudence avec les interprtations.
Interprtations
E(Y j |X ) = 1 + 2 x2j + + K xk i
Dummy Variables explicatives : Supposons que xki est une variable binaire, prendre deux
valeurs, indiquant que l'i-e observation appartient (1) ou n'appartiennent pas une certaine
classe (0) (mle-femelle, par exemple). Nous ne pouvons pas utiliser le rsultat prcdent pour
une interprtation (POURQUOI?)
Calculer les grandeurs suivantes
Un petit catalogue de modles non-linaires qui peuvent tre traites avec le modle linaire
classique
Quadratique : yi = 2i1 + 2 X2J + 3 X 2 + ui
yi = 1 + 2 X -1 + ui
Inverse : 2i
Interactif : yi = 1 + 2 X2J + 3 X3J + 4 X2ix3jui : ln logarithmique yi =
1 + 2 ln X2J + ui Semilogarithmic : ln yi = 1 + 2 X2J + ui
Nous explorerons des interprtations et des exemples dans les devoirs.
Rsultat : = (X 0 X )-1x 0 Y
SSR() = e 0 e = (Y - X )0 (Y - X )
= Y 0 Y - 0 x 0 y - Y 0 x + 0 X 0 X
= Y 0 Y - 20 X 0 Y + 0 X 0 X
Dans la deuxime ligne, note que -0 x 0 y est un scalaire, et donc il est banalement gale sa transposition, -
Y 0 x , c'est la faon dont nous obtenons le rsultat dans la troisime ligne.
SSR peut tre facilement illustr tre strictement fonction de diffrentiable convexes , de
sorte conditions de premier ordre pour un point stationnaire sont suffisantes pour un
minimum global.
e 0 e 00
= -2X Y + 2X X = 0
Qui est un systme d'quations linaires avec 000 K inconnues (). En rsolvant pour donne
la solution souhaite :
=(X 0 X )-1x 0 Y
Proprits algbriques
-X 0 Y + X 0 X = 0
-X 0 (Y - X ) = 0
-X 0 e = 0
Somme des erreurs : si le modle a une ordonne l'origine, l'une des colonnes de X est un
vecteur de ceux, les SO x 0 e = 0 implique :
XN e
i =0
I=1
L'orthogonalit : X 0 e = 0. Ce qui implique que le BSL rsidus sont non corrls aux toutes
les variables explicatives.
Linarit : estunefonctionlinaire deY, qui est,ilexiste unk n matrice A qui dpend uniquement de x ,
avec (A) = k tel que = AY .
La preuve: triviale. Dfinir un = (X 0 X )-1x 0
Qualit de l'ajustement
Vrifier d'abord certains rsultats facile, lorsqu'il y a une interception dans le modle :
YJ = Yje
'
Commencez par yi = Y + e . Prendre moyennes au cours des deux
cts, II
Ei = 0 par l'ancienne proprit.
J=1 (Y - Y ) +
J=1 (Yj - Y ) = 2
Pn 2 pn pn
J J'
'
Dmarrer avec (Yj - Y)=(Y - Y)+e.Prendredescarrs.Puis J' P J'e = 0 par page
J Afficher P ei (Y - Y)= e 0 X - Y i prcdente
'
Proprits.
X(Y
Jj - Y)2 = X(Y
J - Y)2 + X e2
' '
La variation totale y autour de sa moyenne peut tre dcompos en deux additifs : une
correspondant des termes du modle et la seconde aux erreurs d'estimation.
Si toutes les erreurs sont gales zro, puis tous les varation est due au modle : le modle
linaire explaines mont toutes les variations.
Ceci suggre les mesures suivantes de qualit de l'ajustement :
PN 2
Pn 2
2 - Y
(YJ=1 i) eJ=1 i
R P = 1 - pn
N
J=1 (Yj - Y) J=1 (Yj - Y)
2 2
X Y
200
I = Y Y = (Y + e) (Y + e)
= Y 0 Y+e0 e + 2Y 0 e
= Y 0 Y+e0 e + 20 X 0 e
= Y 0 Y+e0 e
Estimation de 2