C2 ModeloClásico A

Centro de Investigación y Docencia Económicas, A.C.
División de Economía
2. El Modelo de Regresión Lineal Clásico

Sean 𝑦� y 𝒙� = [𝑥�� , 𝑥�� , … , 𝑥�� ]� la observación 𝑖 de una variable dependiente (a explicar) y de 𝐾
variables independientes o explicativas (vector columna) respectivamente. (′ denota la transpuesta)
Considere una muestra o un conjunto de datos con 𝑁 observaciones.
2.1 Supuestos
2.1.1 Linealidad
Existe una relación lineal entre la variable dependiente y las variables explicativas
𝑦� = 𝛽� 𝑥�� + 𝛽� 𝑥�� + ⋯ + 𝛽� 𝑥�� + 𝑢� , 𝑖 = 1,2, … , 𝑁 (2.1)
Donde 𝛽� , 𝑘 = 1,2, … , 𝐾 son parámetros poblacionales desconocidos y representan el efecto
marginal sobre 𝑌 de la variable explicativa 𝑥� :
𝜕𝑦�
= 𝛽� ; 𝑘 = 1,2, … , 𝐾 (2.2)
𝜕𝑥��
𝑢� : Término de error o perturbación aleatorio, no observado
NOTAS: (1) Los efectos marginales son constantes debido al supuesto de linealidad
(2) El término de error o perturbación puede ser visto como la parte de la variable dependiente no
explicada por los regresores
Econometría 1 Programa de Maestría en Economía

Prof. Rodolfo Cermeño
El modelo (2.1) se puede escribir como 𝑦� = 𝒙� ′𝜷 + 𝑢� , 𝑖 = 1,2, … , 𝑁. O, en forma más compacta:

𝒀�×� = 𝑿�×� 𝜷�×� + 𝑼�×� (2.3)
Donde 𝒀, 𝑿, 𝑼, son respectivamente: “vector de datos”, “matriz de datos” y “vector de
perturbaciones”.
2.1.2 Exogeneidad estricta

𝐸 (𝑢� |𝑿) = 0; 𝑖 = 1,2, … , 𝑁 (2.4)
La esperanza es condicional en todas las observaciones de los regresores. Explícitamente:
𝐸 (𝑢� |𝒙�� , 𝒙�� , … , 𝒙�� ) = 0; 𝑖 = 1,2, … , 𝑁 (2.5)
Donde 𝒙� ; 𝑖 = 1,2, … , 𝑁, son vectores columna de 𝐾 elementos (variables explicativas).
Para cada 𝑖, se puede definir la distribución conjunta 𝑓(𝑢� , 𝒙�� , 𝒙�� , … , 𝒙�� ) de (𝑁 × 𝐾 + 1) variables
aleatorias y la distribución condicional 𝑓 (𝑢� |𝒙�� , 𝒙�� , … , 𝒙�� ) .
El supuesto de exogeneidad estricta establece que la esperanza de la distribución condicional a
cero. Es decir, todas y cada una de las variables independientes no se relacionan con 𝑢� .
Equivalentemente, este supuesto descarta cualquier influencia sistemática de 𝑿 sobre 𝑼.

NOTAS: (1) Exogeneidad estricta implica que la media incondicional de cada perturbación es cero
𝐸 (𝑢� ) = 0; 𝑖 = 1,2, … , 𝑁 (2.6)
Por la ley de Expectativas totales: 𝐸 (𝑢� ) = 𝐸 [𝐸(𝑢� |𝑥)] = 𝐸 [0] = 0
𝐿𝑒𝑦 𝑑𝑒 𝐸𝑥𝑝𝑒𝑐𝑡𝑎𝑡𝑖𝑣𝑎𝑠 𝑇𝑜𝑡𝑎𝑙𝑒𝑠: 𝐸 [𝐸(𝑌|𝑋)] = 𝐸(𝑌)

(2) Bajo 2.1.2, los regresores (𝑿) son ortogonales a (𝑼) para todas las observaciones
𝐸�𝑥�� 𝑢� � = 0; 𝑖, 𝑗 = 1,2, … , 𝑁; 𝑘 = 1,2, … , 𝐾 (2.7)
𝑆𝑖 𝐸 (𝑋𝑌) = 0 ⇒ 𝑋 𝑒𝑠 𝑜𝑟𝑡𝑜𝑔𝑜𝑛𝑎𝑙 𝑎 𝑌 ó 𝑌 𝑒𝑠 𝑜𝑟𝑡𝑜𝑔𝑜𝑛𝑎𝑙 𝑎 𝑋
Por la Ley de Expectativas Totales: 𝐸�𝑥�� 𝑢� � = 𝐸�𝐸�𝑥�� 𝑢� �𝑥��

Por la linealidad de Expectativas condicionales: = 𝐸�𝑥�� 𝐸�𝑢� �𝑥�� , 𝑑𝑜𝑛𝑑𝑒 𝐸�𝑢� �𝑥�� ≡ 0
⟹ 𝐸�𝑥�� 𝑢� � = 0
𝐿𝑖𝑛𝑒𝑎𝑙𝑖𝑑𝑎𝑑 𝑑𝑒 𝐸𝑥𝑝𝑒𝑐𝑡𝑎𝑡𝑖𝑣𝑎𝑠 𝑐𝑜𝑛𝑑𝑖𝑐𝑖𝑜𝑛𝑎𝑙𝑒𝑠: 𝐸 [𝑓(𝑥 )𝑌|𝑋] = 𝑓(𝑥 )𝐸(𝑌|𝑋)

(3) Las condiciones de ortogonalidad en (2.7) implican correlaciones iguales a cero entre los
regresores y el término de error para todas las observaciones
𝐶𝑜𝑣�𝑢� , 𝑥�� = 𝐸�𝑥�� 𝑢� � − 𝐸�𝑥�� 𝐸 (𝑢� ) = 𝐸�𝑥�� 𝑢� � [Puesto que 𝐸 (𝑢� ) = 0]
= 0 [Por ortogonalidad (2.7)]
En el caso particular 𝑖 = 𝑗; 𝐶𝑜𝑣�𝑢� , 𝑥�� = 0 se dice que no hay correlación contemporánea
entre los regresores y el término de error.

2.1.3 Rango Completo de la matriz 𝑿

𝑟𝑎𝑛𝑔𝑜 (𝑿�×� ) = 𝐾 (2.8)
Todas las variables explicativas son linealmente independientes
2.1.4 Matriz de Covarianza Escalar-Identidad
𝐸�𝑼𝑼ʹ |𝑿� = 𝜎 � 𝑰� ; 𝜎 � > 0 (2.9)
Este supuesto implica que 𝐸�𝑢�� 𝑿� = 𝜎 � ; 𝑖 = 1,2, … , 𝑁, lo cual se conoce como
“homocedasticidad” o “ausencia de heterocedasticidad”.
Igualmente 𝐸�𝑢� 𝑢� �𝑿� = 0; 𝑖, 𝑗 = 1,2, … , 𝑁; 𝑝𝑎𝑟𝑎 𝑡𝑜𝑑𝑜 𝑖 ≠ 𝑗, lo cual implica “ausencia de
correlación” entre cada par de observaciones
NOTAS:
(1) Para muestras aleatorias los supuestos establecidos en 2.1.2 y 2.1.4 implican
𝐸 (𝑢� |𝑥� ) = 0 & 𝐸�𝑢�� 𝑥� � = 𝜎 � > 0; 𝑖 = 1,2, … , 𝑁
(2) Si la matriz 𝑿 fuese fija, no habría necesidad de distinguir entre la distribución condicional
𝑓(𝑢� |𝒙� , 𝒙� , … , 𝒙� ) y la distribución incondicional 𝑓(𝑢� ). Entonces, 2.1.2 y 2.1.4 se pueden formular
simplemente como:
𝐸 (𝑢� ) = 0; 𝐸 (𝑢� � ) = 𝜎 � , 𝑖 = 1,2, … , 𝑁; 𝐸�𝑢� 𝑢� � = 0; 𝑖, 𝑗 = 1,2, … , 𝑁; 𝑖 ≠ 𝑗

2.2 El Método de Mínimos Cuadrados
2.2.1 Definición general

Sea 𝑦�, 𝑦� , … , 𝑦� una muestra aleatoria tomada de alguna distribución con momentos finitos y sea
𝜇� = 𝐸 [𝑌 � ] el momento 𝑟 de la variable aleatoria 𝑌. Sea 𝑆 la suma de las diferencias al cuadrado
entre 𝑦�� y 𝜇� :
𝑆 = ∑� �
��(𝑦� − 𝜇� )
�
(2.10)
El Estimador de Mínimos Cuadrados es el valor 𝜇̂ � (expresado como función de las variables
aleatorias 𝑦� ) que minimiza 𝑆.
NOTA: Para un conjunto específico de datos 𝜇̂ � es un estimado de mínimos cuadrados.
Algunos ejemplos sencillos:

(i) Sea 𝑌�, 𝑌� , … , 𝑌� una muestra aleatoria de una población con media 𝛽 y varianza finita 𝜎 � .
Estimar el parámetro 𝛽 por el método de mínimos cuadrados.

El estimador de MC del parámetro 𝛽 (primer momento) es obtenido resolviendo el problema:

� �
�
(�)
min 𝑆 = � �𝑌� − 𝜇� � = �(𝑌� − 𝛽 )�
�
��
�
�� ∑ ��
La condición de primer orden es = −2 ∑��(𝑌� − 𝛽 ) = 0. De donde se obtiene: 𝛽� = ��
��
��
La condición de segundo orden es = 2 > 0. Por lo que 𝛽� corresponde a un mínimo.
��
(ii) Considere la relación lineal simple 𝑌� = 𝛽 + 𝑢� . Donde 𝛽 es un parámetro desconocido, 𝑢� es

una perturbación aleatoria con media cero y varianza constante. Esto último se suele denotar como
𝑢� ~ (0, 𝜎 � ). Estimar 𝛽 por mínimos cuadrados.
Dado que 𝐸 (𝑌|𝑋) = 𝛽, este parámetro corresponde al primer momento.
� �
�
(�)
min 𝑆 = � �𝑌� − 𝜇� � = �(𝑌� − 𝛽 )�
�
��
�
�∑ ��
De donde se obtiene: 𝛽� = �� = 𝑌�
�

(iii) Considere ahora una muestra aleatoria (𝑌� , 𝑋� ), 𝑖 = 1, … , 𝑇 y suponga que existe una relación
lineal 𝑌� = 𝑋� 𝛽 + 𝑢� . Donde 𝛽 es un parámetro desconocido y 𝑢� ~ (0, 𝜎 � ). Halle 𝛽� de MC.
Nuevamente, dado que 𝐸 [𝑌� |𝑋� ] = 𝑋� 𝛽 (primer momento), el estimador de MC de 𝛽 se puede

obtener resolviendo el problema:
�
min 𝑆 = �(𝑌� − 𝑋� 𝛽 )�
�
��
Donde (𝑌� − 𝑋� 𝛽 )� = 𝑢�� , lo que equivale a “minimizar la suma de los errores al cuadrado”
��
Condición de primer orden: = −2 ∑��(𝑌� − 𝑋� 𝛽 )𝑋� = 0
��
∑�� 𝑌� 𝑋� − ∑�� 𝑋� � 𝛽 = 0; ∑�� 𝑌� 𝑋� − 𝛽 ∑�� 𝑋� � = 0
⇒ 𝛽� = ∑�� 𝑌� 𝑋� / ∑�� 𝑋� �
��
Condición de segundo orden: = 2 ∑�� 𝑋� � > 0
��
⇒ 𝛽� corresponde a un mínimo

(iv) Considere, finalmente, la muestra aleatoria de (𝑌� , 𝑋� ), 𝑖 = 1, … , 𝑇 y suponga la relación lineal

𝑌� = 𝛽� +𝛽� 𝑋� + 𝑢� . Donde 𝛽� , 𝛽� son parámetros desconocidos y 𝑢� ~ (0, 𝜎 � ). Obtenga el
estimador de MC de los parámetros 𝛽� , 𝛽� .
En este caso, 𝐸 [𝑌� |𝑋� ] = 𝛽� +𝛽� 𝑋� (primer momento), el estimador de MC de 𝛽� , 𝛽� se puede
obtener resolviendo el problema:
�
min 𝑆 = �(𝑌� − 𝛽� − 𝛽� 𝑋� )�
�
��
(Minimizando la suma de errores al cuadrado: ∑�� 𝑢�� )
��
Resolviendo las dos condiciones de primer orden: =0 & = 0 se puede obtener:
��
𝛽�� = 𝑌� − 𝛽�� 𝑋�
� �
𝛽�� = �(𝑌� − 𝑌�)(𝑋� − 𝑋�) / �(𝑋� − 𝑋�)�

��
Para modelos con más variables explicativas, la obtención del estimador de mínimos cuadrados
para cada parámetro del modelo se hace algebraicamente más complicada. Esto nos lleva a
plantear un tratamiento general (matricial) del método de mínimos cuadrados.

2.2.2 Estimación del vector 𝜷 por Mínimos Cuadrados

Retomando el modelo lineal general de la ecuación (2.1):
𝑦� = 𝛽� 𝑥�� + 𝛽� 𝑥�� + ⋯ + 𝛽� 𝑥�� + 𝑢� , 𝑖 = 1,2, … , 𝑁 (2.1)
La suma de las distancias al cuadrado entre 𝑦�� y 𝐸 (𝑌 � ) con 𝑟 = 1 se puede expresar como:
�
�(𝑦� − 𝛽� 𝑥�� − 𝛽� 𝑥�� − ⋯ − 𝛽� 𝑥�� )� (2.11)

��
En términos matriciales la expresión anterior es igual a:

(𝒀 − 𝑿𝜷)� (𝒀 − 𝑿𝜷) = 𝑼� 𝑼 (2.12)
El estimador de mínimos cuadrados de 𝜷 es el que minimiza 𝑼′𝑼. Formalmente,
min 𝑼′𝑼
𝜷
Desarrollando el producto: 𝑼′𝑼 = (𝒀 − 𝑿𝜷)′(𝒀 − 𝑿𝜷)

= 𝒀′𝒀 − 𝜷′𝑿′𝒀 − 𝒀′𝑿𝜷 + 𝜷′𝑿′𝑿𝜷
= 𝒀′𝒀 − 2𝒀′𝑿𝜷 + 𝜷′𝑿′𝑿𝜷
Donde cada uno de los términos son escalares tal como se explicita a continuación:

𝑦�
𝑦�
(1) 𝒀′𝒀 = [𝑦� 𝑦� … 𝑦� ] � ⋮ � = 𝑦�� + 𝑦�� + ⋯ + 𝑦��
𝑦�
𝑥�� 𝑥�� ⋯ 𝑥�� 𝛽� 𝛽�

𝑥 𝑥�� ⋯ 𝑥�� 𝛽� 𝛽
(2) 2𝒀ʹ 𝑿𝜷 = 2[𝑦� 𝑦� … 𝑦� ] � �� = 2[𝒀ʹ𝒙� 𝒀ʹ𝒙� … 𝒀ʹ𝒙� ] � � �
⋮ ⋮ ⋮ ⋮ ⋮
𝑥�� 𝑥�� ⋯ 𝑥�� 𝛽� 𝛽�
= 2[𝒀ʹ𝒙� 𝛽� + 𝒀ʹ𝒙� 𝛽� + ⋯ + 𝒀ʹ𝒙� 𝛽� ]

𝛽�
𝑥�� ⋯ 𝑥�� 𝑥�� ⋯ 𝑥��
(3) 𝜷′𝑿′𝑿𝜷 = [𝛽� 𝛽� … 𝛽� ] � ⋮ ⋱ ⋮ �� ⋮ ⋱ ⋮ � � 𝛽� �
𝑥�� ⋯ 𝑥�� 𝑥�� ⋯ 𝑥�� ⋮
𝛽�
𝛽�
𝒙� ʹ𝒙� ⋯ 𝒙� ʹ𝒙�
𝛽
= [𝛽� 𝛽� … 𝛽� ](�×�) � ⋮ ⋱ ⋮ � � ��
⋮
𝒙� ʹ𝒙� ⋯ 𝒙� ʹ𝒙� (�×�)
𝛽� (�×�)

Tres resultados útiles sobre Derivadas con Matrices:

Sean 𝜽 y 𝒘 vectores columna de dimensión 𝐾 y sea 𝑨 una matriz simétrica de dimensión 𝐾 × 𝐾.
�(𝜽� 𝒘) �(𝒘� 𝜽) �(𝜽� 𝑨𝜽) �� (𝜽� 𝑨𝜽) �� (𝜽ʹ 𝑨𝜽)
(i) = = 𝒘 ; (ii) = 2𝑨𝜽 ; (iii) = 2𝑨 [En general = 𝑨 + 𝑨′]
�𝜽 �𝜽 �𝜽 �𝜽�𝜽� �𝜽�𝜽�
Explícitamente, el primer resultado es:

𝜕𝜽ʹ 𝒘
⎡ ⎤
𝜕𝜃
⎢ �⎥
ʹ ⎥
𝑤�
�
𝜕(𝜽 𝒘) 𝜕 (𝜃� 𝑤� + 𝜃� 𝑤� + ⋯ + 𝜃� 𝑤� ) ⎢ 𝜕𝜽 𝒘 𝑤�
= = ⎢ 𝜕𝜃� ⎥ = � ⋮ � = 𝒘
𝜕𝜽 𝜕𝜽 ⎢ ⎥
⋮
⎢ ʹ ⎥ 𝑤�
⎢𝜕𝜽 𝒘⎥
⎣ 𝜕𝜃� ⎦
Suponiendo 𝐾 = 2, para simplificar, el segundo resultado es:
𝜕(𝜽� 𝑨𝜽)
⎡ ⎤
𝜕(𝜽� 𝑨𝜽) 𝜕(𝜃�� 𝑎�� + 𝜃� 𝜃� 𝑎�� + 𝜃� 𝜃� 𝑎�� + 𝜃�� 𝑎�� ) ⎢ 𝜕𝜃� ⎥ 2(𝜃� 𝑎�� + 𝜃� 𝑎�� )
= =⎢ = � � = 2𝑨𝜽
𝜕𝜽 𝜕𝜽 𝜕(𝜽� 𝑨𝜽)⎥ 2(𝜃� 𝑎�� + 𝜃� 𝑎�� )
⎢ ⎥
⎣ 𝜕𝜃� ⎦

Utilizando los resultados anteriores, la condición de primer orden del problema de minimización es:
𝜕𝑼� 𝑼
= −2𝑿� 𝒀 + 2𝑿� 𝑿𝜷 = 0 (2.13)
𝜕𝜷
De donde se puede obtener:
𝑿� 𝑿[�×�] 𝜷[�×�] = 𝑿� [�×�] 𝒀[�×�] (2.14)
Nótese que (2.14) es un sistema de 𝐾 ecuaciones. Estas son conocidas como “ecuaciones
normales”.
Pre-multiplicando (2.14) por (𝑿� 𝑿)�� se ob�ene el es�mador de mínimos cuadrados de 𝜷:
� ��
𝜷 = (𝑿� 𝑿)��
[�×�] �𝑿 [�×�] 𝒀[�×�] � (2.15)
[�×�]
La condición de segundo orden se satisface puesto que 𝑿′𝑿 es una matriz definida positiva.
Como se demostrará más adelante, un estimador de la varianza del término de error es:
�� 𝑼
𝑼 �
�
𝜎� = =
��
� = 𝒀 − 𝑿𝜷
Donde 𝑼 � , es el vector de residuales estimados y RSS denota la Suma Residual de
Cuadrados (de la regresión de 𝒀 en 𝑿).

2.2.3 Algunos Resultados Algebraicos

(i) Ecuaciones normales y condiciones de ortogonalidad
De la condición de primer orden (2.14):
𝑿� 𝑿𝜷� − 𝑿� 𝒀 = 𝟎
�=𝟎
𝑿� 𝒀 − 𝑿� 𝑿 𝜷
𝑿� �𝒀 − 𝑿𝜷 �� = 𝟎 (2.16)
Donde �𝒀 − 𝑿𝜷 � � es el vector de residuales estimados, denotado por 𝑼
�.
Dado que 𝑿� 𝑼� = 𝟎 implica � ∑ 𝒙� 𝑢�� = 𝟎, las ecuaciones normales se pueden interpretar
�
como el análogo muestral de las condiciones de ortogonalidad 𝐸 (𝑿� 𝑼) = 0 (momentos
poblacionales).
� �� como estimador del Método de Momentos.

A su vez (2.16) permite interpretar a 𝜷
(ii) Vector de valores estimados, ajustados o proyectados

� = 𝑿𝜷
𝒀 �
= 𝑿(𝑿� 𝑿)�𝟏 𝑿� 𝒀
� = 𝑷[�×�] 𝒀[�×�]
𝒀 (2.17)
La matriz 𝑷 = 𝑿(𝑿� 𝑿)�𝟏 𝑿′ se conoce como matriz de proyección y tiene las siguientes
propiedades:

(a) Simétrica: 𝑷 = 𝑷�
[𝑿(𝑿� 𝑿)�𝟏 𝑿� ]� = 𝑿(𝑿� 𝑿)�𝟏 𝑿�
(b) Idempotente: 𝑷𝑷 = 𝑷
𝑿(𝑿� 𝑿)�𝟏 (𝑿� 𝑿)(𝑿� 𝑿)�𝟏 𝑿�
= 𝑿(𝑿� 𝑿)�𝟏 𝑿�
(c) 𝑷𝑿 = 𝑿
𝑿(𝑿� 𝑿)�𝟏 (𝑿� 𝑿) = 𝑿
(iii) Vector de residuales estimados

� [�×�] = 𝒀[�×�] − 𝒀
𝑼 � [�×�]
�
= 𝒀 − 𝑿𝜷
= 𝒀 − 𝑿(𝑿� 𝑿)�𝟏 (𝑿� 𝒀)
= [𝑰 − 𝑿(𝑿� 𝑿)�𝟏 𝑿� ]𝒀
� �×� = �𝑰[�×�] − 𝑷[�×�] �𝒀[�×�]
𝑼
� [�×�] = 𝑴[�×�] 𝒀[�×�]
𝑼 (2.18)

La matriz 𝑴 se denomina matriz aniquiladora (“annihilator matrix”) y tiene las siguientes

propiedades:
(a) Simétrica: 𝑴 = 𝑴ʹ
(b) Idempotente: 𝑴𝑴 = 𝑴
�𝟏 �𝟏
�𝑰 − 𝑿�𝑿ʹ 𝑿� 𝑿ʹ � �𝑰 − 𝑿�𝑿ʹ 𝑿� 𝑿ʹ �
= 𝑰 − 𝑿(𝑿ʹ 𝑿)�𝟏 𝑿ʹ − 𝑿(𝑿ʹ 𝑿)�𝟏 𝑿ʹ + 𝑿(𝑿ʹ 𝑿)�𝟏 𝑿ʹ 𝑿(𝑿ʹ 𝑿)�𝟏 𝑿ʹ
= 𝑰 − 𝑿(𝑿ʹ 𝑿)�𝟏 𝑿ʹ = 𝑴
Alternativamente: (𝑰 − 𝑷)(𝑰 − 𝑷) = 𝑰 − 𝑷 − 𝑷 + 𝑷𝑷 = 𝑰 − 𝑷 − 𝑷 + 𝑷 = (𝑰 − 𝑷)
(c) 𝑴𝑿 = 𝟎
(𝑰 − 𝑷)𝑿 = 𝑿 − 𝑷𝑿 = 𝑿 − 𝑿 = 𝟎
(La matriz 𝑴 “aniquila” a la matriz 𝑿)
� ʹ𝑼
(iv) Suma Residual de Cuadrados (Residual Sum of Squares): 𝑅𝑆𝑆 = 𝑼 � = 𝑼′𝑴𝑼
� = 𝑴𝒀 = 𝑴(𝑿𝜷 + 𝑼)
Utilizando el resultado (iii): 𝑼
= 𝑴𝑿𝜷 + 𝑴𝑼 = 𝟎 + 𝑴𝑼 = 𝑴𝑼
Entonces,
𝑅𝑆𝑆 = (𝑴𝑼)′(𝑴𝑼) = 𝑼� 𝑴� 𝑴𝑼 = 𝑼′𝑴𝑼

� 𝑳𝑺
2.3 Propiedades Estadísticas del Estimador de Mínimos Cuadrados: 𝜷
2.3.1 Insesgamiento
� �� es
Bajo los supuestos de linealidad, exogeneidad estricta y rango completo el estimador 𝜷
insesgado:
� �� |𝑿) = 𝜷
𝐸(𝜷 (2.19)
Sustituyendo 𝒀 = 𝑿𝜷 + 𝑼 en (2.15) se puede obtener:
� �� = 𝜷 + 𝑨𝑼;
𝜷 𝑨 = (𝑿ʹ 𝑿)�𝟏 𝑿ʹ (∗)
Tomando esperanza condicional en 𝑿:
� �𝑿� = 𝐸 (𝜷|𝑿) + 𝐸 (𝑨𝑼|𝑿) = 𝜷 + 𝑨𝐸 (𝑼|𝑿) = 𝜷 + 𝟎
𝐸�𝜷
� �� |𝑿) = 𝜷
⟹ 𝐸(𝜷
2.3.2 Eficiencia (Teorema de Gauss-Markov)
� cualquier estimador de 𝜷 lineal en 𝒀 e insesgado. Bajo los supuestos de linealidad,
Sea 𝜷
exogeneidad estricta, rango completo y matriz de convarianza escalar-identidad, la diferencia:
� �𝐗� − 𝑉𝑎𝑟�𝜷
�𝑉𝑎𝑟�𝜷 � �� 𝐗�� (2.20)
Es una matriz semidefinida positiva (no negativa definida).

� es igual a 𝐸� [𝜷
Por definición, la varianza del estimador 𝜷 � − 𝐸� �𝜷
� �][𝜷
� − 𝐸� �𝜷
� �]′. Entonces,
� �� 𝐗� = 𝐸� �𝜷
𝑉𝑎𝑟�𝜷 � − 𝜷��𝜷
� − 𝜷�′ = 𝐸� [(𝑨𝑼)(𝑨𝑼)′] = 𝐸� [𝑨𝑼𝑼′𝑨]
� �𝑿� = 𝑨𝐸�𝑼𝑼ʹ �𝑿�𝑨ʹ = 𝑨(𝜎 � 𝑰)𝑨ʹ = 𝜎 � 𝑨𝑨ʹ = 𝜎 � (𝑿ʹ𝑿)��
⟹ 𝑉𝑎𝑟�𝜷
NOTA: Se obtiene lo mismo aplicando el operador varianza a la expresión (∗), condicional en 𝑿.
� , lineal e insesgado:
Considere ahora el estimador alternativo 𝜷
� = 𝑪𝒀 = [(𝑿ʹ 𝑿)�� 𝑿ʹ + 𝑪 − �𝑿ʹ 𝑿)�𝟏 𝑿ʹ �𝒀
𝜷
Haciendo 𝑨 = (𝑿ʹ 𝑿)�𝟏 𝑿ʹ y 𝑫 = 𝑪 − (𝑿ʹ 𝑿)�𝟏 𝑿ʹ
� = (𝑨 + 𝑫)𝒀 = (𝑨 + 𝑫)(𝑿𝜷 + 𝑼)
𝜷
� = 𝑨𝑿𝜷 + 𝑫𝑿𝜷 + 𝑨𝑼 + 𝑫𝑼 (**)
𝜷
� = 𝜷 + 𝑫𝑿𝜷 + 𝑨𝑼 + 𝑫𝑼. Aplicando la esperanza condicional en 𝑿:
Pero 𝑨𝑿 = 𝑰. Entonces 𝜷
� �𝑿� = 𝜷 + 𝑫𝑿𝜷 + 𝑨𝐸 (𝑼|𝑿) + 𝑫𝐸 (𝑼|𝑿)
𝐸�𝜷
� sea insesgado se requiere imponer la restricción 𝑫𝑿 = 𝟎.

Dado que 𝐸 (𝑼|𝑿) = 𝟎, para que 𝜷
� �𝑿� = 𝜷
⟹ 𝐸�𝜷

� dado en (**) se puede formular como:

Utilizando los resultados 𝑨𝑿 = 𝑰 y 𝑫𝑿 = 𝟎 el estimador 𝜷
� = 𝜷 + (𝑨 + 𝑫)𝑼 ⟹ (𝜷
𝜷 � − 𝜷) = (𝑨 + 𝑫)𝑼
Aplicando el operador varianza, condicional en 𝑿:

� − 𝜷�𝑿� = 𝑉𝑎𝑟[(𝑨 + 𝑫)𝑼|𝑿]
𝑉𝑎𝑟�𝜷
= (𝑨 + 𝑫)𝑉𝑎𝑟(𝑼|𝑿)(𝑨 + 𝑫)ʹ
Dado que 𝑉𝑎𝑟(𝑼|𝑿) = 𝜎 � 𝑰 se puede obtener:
� − 𝜷�𝑿� = 𝜎 � (𝑨 + 𝑫)�𝑨ʹ + 𝑫ʹ �
𝑉𝑎𝑟�𝜷
= 𝜎 � �𝑨𝑨ʹ + 𝑨𝑫ʹ + 𝑫𝑨ʹ + 𝑫𝑫ʹ �
Utilizando los resultados: 𝑨𝑨ʹ = (𝑿ʹ𝑿)�𝟏 & 𝑫𝑨′ = 𝑫𝑿(𝑿ʹ 𝑿)�𝟏 = 𝟎 = 𝑨𝑫ʹ se obtiene:
� �𝑿� = 𝜎 � [(𝑿ʹ 𝑿)�𝟏 + 𝑫𝑫ʹ ]
𝑉𝑎𝑟�𝜷
Entonces, la diferencia de varianzas es igual a una matriz semidefinida positiva:

� �𝑿� = 𝜎 � ��𝑿ʹ 𝑿)�𝟏 + 𝑫𝑫ʹ �� − {𝑉𝑎𝑟�𝜷
{𝑉𝑎𝑟�𝜷 � �𝑿� = 𝜎 � �𝑿ʹ 𝑿)�𝟏 � = 𝜎 � 𝑫𝑫ʹ
Puesto que para cualquier matriz 𝑫 el producto 𝑫𝑫′ siempre será una matriz semidefinida positiva

� 𝑳𝑺
2.3.3 Media y Varianza Incondicionales de 𝜷
Utilizando la ley de expectativas iteradas:
� � = 𝐸� �𝐸�𝜷
𝐸�𝜷 � �𝑿��
��
= 𝐸� [𝐸(𝜷 + �𝑿ʹ 𝑿� 𝑿ʹ 𝑼)|𝑿]
= 𝜷 + 𝐸� [�𝑿ʹ 𝑿)�𝟏 𝑿ʹ 𝑬(𝑼|𝑿)�
�� = 𝜷
𝐸�𝜷 (2.21)
� 𝑳𝑺 también es insesgado incondicionalmente.
Puesto que 𝐸 (𝑼|𝑿) = 𝟎. ⟹ 𝜷
Utilizando la regla de descomposición de varianza:

� � = 𝐸� �𝑉𝑎𝑟�𝜷
𝑉𝑎𝑟�𝜷 � |𝑿�� + 𝑉𝑎𝑟� �𝐸�𝜷
� �𝑿��
= 𝐸� [𝜎 � �𝑿ʹ 𝑿)�𝟏 � + 𝑉𝑎𝑟� [𝜷]

� � = 𝜎 � 𝐸� [�𝑿ʹ 𝑿)�𝟏 �
𝑉𝑎𝑟�𝜷 (2.22)
Puesto que 𝑉𝑎𝑟� [𝜷] = 𝟎.

� 𝑳𝑺 con Regresores No Estocásticos

2.3.4 Media y Varianza de 𝜷
En este caso 𝑿 es una matriz de constantes por lo que se puede obtener:
�� = 𝜷
𝐸�𝜷
� ) = 𝜎 � (𝑿ʹ𝑿)��
𝑉𝑎𝑟(𝜷
2.4 Un Estimador Insesgado de 𝝈𝟐

Considere la suma residual de cuadrados:
�
� ′𝑼
� 𝑢�� = 𝑼 � = 𝑅𝑆𝑆
��
Utilizando el resultado algebraico (iv) de la sección 2.2.3:

� ʹ𝑼
𝑼 � = 𝑼′𝑴𝑼
Donde 𝑴 = (𝑰𝑵 − 𝑷); 𝑷�×� = 𝑿�×� (𝑿��×� 𝑿�×� )�� 𝑿��×�

NOTA SOBRE TRANSPOSICIÓN DE MATRICES E INTERCAMBIABILIDAD DE tr[.] & E[.]:

(1) Para tres matrices 𝑨, 𝑩, 𝑪 conformables, 𝑡𝑟(𝑨𝑩𝑪) = 𝑡𝑟(𝑪𝑨𝑩) = 𝑡𝑟(𝑩𝑪𝑨)
(2) Para dos matrices 𝑨, 𝑩 conformables, 𝑡𝑟(𝑨𝑩) = 𝑡𝑟(𝑩𝑨)
(3) Dado que 𝑡𝑟[∙] y 𝐸 [∙] son operadores lineales 𝐸 [𝑡𝑟(𝑧)] = 𝑡𝑟(𝐸 [𝑧])
Para cualquier argumento 𝑧
Utilizando los resultados anteriores se puede evaluar la esperanza, condicional en 𝑿:
� ʹ𝑼
𝐸(𝑼 � |𝑿) = 𝐸(𝑼� 𝑴𝑼|𝑿) = 𝐸[𝑡𝑟(𝑼� 𝑴𝑼|𝑿)]
= 𝐸[𝑡𝑟(𝑴𝑼𝑼� |𝑿)]
= 𝑡𝑟[𝐸 (𝑴𝑼𝑼′|𝑿)]
= 𝑡𝑟[𝑴𝐸 (𝑼𝑼′|𝑿)]
= 𝜎 � 𝑡𝑟[𝑴]

Evaluando 𝑡𝑟(𝑴):
𝑡𝑟(𝑴) = 𝑡𝑟[𝑰 − 𝑷] = 𝑡𝑟(𝑰) − 𝑡𝑟(𝑷) = 𝑵 − 𝑡𝑟(𝑷)
𝑡𝑟(𝑷) = 𝑡𝑟[𝑿�𝑿ʹ 𝑿)�𝟏 𝑿ʹ �
Haciendo 𝑨 = 𝑿 𝑦 𝑩 = [�𝑿ʹ 𝑿)�𝟏 𝑿ʹ � y utilizando el resultado (2) de la nota anterior:
𝑡𝑟(𝑷) = 𝑡𝑟[�𝑿ʹ 𝑿)�� 𝑿ʹ 𝑿� = 𝑡𝑟[𝑰� ] = 𝐾
⇒ 𝑡𝑟(𝑴) = 𝑁 − 𝐾
� ʹ𝑼
Por tanto: 𝐸�𝑼 � �𝑿� = 𝐸 (𝑼� 𝑴𝑼|𝑿) = 𝜎 � 𝑡𝑟[𝑴] = 𝜎 � (𝑁 − 𝐾)
El resultado anterior permite formular el siguiente estimador insesgado de 𝜎 � :

�
1 1 1
𝜎� � = � 𝑢�� = � �𝑼
𝑼 �= 𝑅𝑆𝑆 (2.23)
𝑁−𝐾 𝑁−𝐾 𝑁−𝐾
��
� como:
Con el estimador (2.23) podemos definir a la Varianza Estimada de 𝜷
� ) = 𝜎� � (𝑿ʹ𝑿)��
� (𝜷
𝑉𝑎𝑟
� ) será utilizada para hacer inferencia
� (𝜷
NOTAS: (1) 𝑉𝑎𝑟
(2) 𝜎� es conocido como “error estándar de la regresión” y (𝑁 − 𝐾), el número de observaciones
menos el número de parámetros estimados, es denominado “grados de libertad”.
Prueba alternativa de que 𝑬�𝑼′ 𝑴𝑼�𝑿� = 𝝈𝟐 𝒕𝒓[𝑴]:

Dado que 𝑼′𝑴𝑼 es una forma cuadrática, se puede expresar como:
� �
𝑼′𝑴𝑼 = � � 𝑢� 𝑚�� 𝑢�
��
� �
= � � 𝑚�� 𝑢� 𝑢�
��
Entonces, 𝐸 (𝑼� 𝑴𝑼|𝑿) = ∑� � � �

�� ∑�� 𝐸�𝑚�� 𝑢� 𝑢� �𝑿� = ∑�� ∑�� 𝑚�� 𝐸(𝑢� 𝑢� |𝑿)
Pero el supuesto 𝐸 (𝑼𝑼′|𝑿) = 𝜎 � 𝑰 implica que:

𝜎 �, 𝑖 = 𝑗
𝐸�𝑢� 𝑢� �𝑿� = �
0, 𝑖 ≠ 𝑗
Por lo que la forma cuadrática se simplifica a:
� �
𝐸 (𝑼� 𝑴𝑼|𝑿) = � 𝑚�� 𝜎 � = 𝜎 � � 𝑚�� = 𝜎 � 𝑡𝑟(𝑴)

��

NOTA SOBRE FORMA CUADRÁTICA:

Considere la forma cuadrática general: 𝑸 = 𝑿ʹ 𝑨𝑿, donde 𝑿: [𝑁 × 1]; 𝑨: [𝑁 × 𝑁]
� �
𝑸 = � � 𝑋� 𝑎�� 𝑋�
��
Suponiendo que 𝑋� 𝑋� = 𝑐, ∀𝑖 = 𝑗 𝑦 𝑋� 𝑋� = 0, ∀𝑖 ≠ 𝑗,
� �
𝑸 = � 𝑐𝑎�� = 𝑐 � 𝑎�� = 𝑐[𝑡𝑟𝑎𝑧𝑎(𝑨)]

��
En el caso simple 𝐍 = 𝟐:
𝑎�� 𝑎�� 𝑋� 𝑋�
𝑸 = [𝑋� 𝑋� ] �𝑎 � �
𝑎�� 𝑋� � = [ 𝑋� 𝑎�� + 𝑋� 𝑎�� 𝑋� 𝑎�� + 𝑋� 𝑎�� ] � �
�� 𝑋�
� �
= 𝑋� 𝑎�� 𝑋� + 𝑋� 𝑎�� 𝑋� + 𝑋� 𝑎�� 𝑋� + 𝑋� 𝑎�� 𝑋� = � � 𝑋� 𝑎�� 𝑋�

��
Haciendo 𝑋� 𝑋� = 0 y 𝑋� � = 𝑋� � = 𝑐
𝑸 = 𝑐𝑎�� + 𝑐𝑎�� = 𝑐(𝑎�� + 𝑎�� ) = 𝑐[𝑡𝑟𝑎𝑧𝑎(𝑨)]

2.5 Medidas de Bondad de Ajuste y Selección de Modelos

2.5.1 𝑹𝟐 No Centrado: 𝑹𝟐𝑵𝑪
Por definición, cada valor observado de 𝑌 debe ser igual al valor ajustado más un error estimado:
�+𝑼
𝒀=𝒀 �
𝒀ʹ 𝒀 = �𝒀 � �ʹ �𝒀
�+𝑼 �+𝑼
�� = 𝒀
�ʹ𝒀
� + 2𝒀
�ʹ𝑼
� +𝑼
� ʹ𝑼
�=𝒀
� ′𝒀
�+𝑼
� ′𝑼
�
� ′𝑼
Puesto que 𝒀 � = (𝒀� 𝑷� )(𝑴𝒀) = 𝒀� 𝑷� (𝑰 − 𝑷)𝒀 = 𝒀� 𝑷� 𝒀 − 𝒀� 𝑷� 𝒀 = 𝟎
Dividiendo la expresión anterior entre 𝒀′𝒀 se obtiene:

𝒀′𝒀 𝒀� ′𝒀
� 𝑼 � ′𝑼
�
= +
𝒀′𝒀 𝒀′𝒀 𝒀′𝒀
� ′𝒀
𝒀 � ∑� ��
�� 𝑦
� ′𝑼
𝑼 �
𝑹𝟐𝑵𝑪 = = � = 1 − 𝒀′𝒀 (2.24)
𝒀′𝒀 ∑� 𝑦
��
Entonces, el 0 ≤ 𝑹𝟐𝑵𝑪 ≤ 1, se puede interpretar como la fracción de la variación de la variable

dependiente (alrededor de cero) atribuible a la variación de las variables explicativas.
� esté más cerca de 𝒀, la 𝑹𝟐𝑵𝑪 estará más cerca de 1.
Mientras 𝒀

2.5.2 𝑹𝟐 Centrado: 𝑹𝟐𝑪 (Coeficiente de Determinación)

Consideremos el modelo dado por la ecuación (2.1):
𝑦� = 𝛽� 𝑥�� + 𝛽� 𝑥�� + ⋯ + 𝛽� 𝑥�� + 𝑢� , 𝑖 = 1,2, … , 𝑁 (2.1)
Haciendo 𝑥�� = 1 el parámetro 𝛽� será un intercepto. Sea 𝜷� = [𝛽� ⋯ 𝛽� ]′ y
𝑿� = [𝒙� ⋯ 𝒙� ]′.
Matricialmente (2.1) se puede escribir como: 𝒀 = 𝒊� 𝛽� + 𝑿� 𝜷� + 𝑼. Donde 𝒊� = [1 ⋯ 1]′ es
un vector columna de unos de dimensión 𝑁 × 1. Equivalentemente:
𝒀 = 𝒊� 𝛽�� + 𝑿� 𝜷
�� + 𝑼
� (2.1𝑎)
Sea 𝑴� una matriz “aniquiladora” definida como:
𝑴� = 𝑰� − 𝒊� (𝒊� ʹ𝒊� )�� 𝒊� ʹ
Pre-multiplicando (2.1a) por 𝑴� :
𝑴� 𝒀 = 𝑴� 𝒊� 𝛽�� + 𝑴� 𝑿� 𝜷
� � + 𝑴� 𝑼
�
� �×� : Vector de residuales obtenidos de la regresión de 𝒀 en una constante.
𝑴� 𝒀 = 𝒀
� �×(��) : Matriz de residuales de la regresión de cada columna de 𝑿� en una constante.
𝑴� 𝑿� = 𝑿
�=𝑼
𝑴� 𝒊� = 𝟎, puesto que 𝑴� “aniquila” a 𝒊� ; mientras que 𝑴� 𝑼 � �×� .

Entonces,
�=𝑿
𝒀 � 𝜷� + 𝑼
�
� ′ se puede obtener:
Pre-multiplicando por 𝒀
� ʹ𝒀
𝒀 � � ʹ𝑿
�=𝜷 � ʹ𝑿
�𝜷�� + 𝑼
� ʹ𝑼
�
� ʹ𝒀
𝒀 � : 𝑇𝑆𝑆 (Suma total de cuadrados)
� � ʹ𝑿
𝜷 � ʹ𝑿
�𝜷� � : 𝐸𝑆𝑆 (Suma explicada de cuadrados)
� ʹ𝑼
𝑼 � : 𝑅𝑆𝑆 (Suma residual de cuadrados)
��
Dividiendo la expresión anterior entre 𝑇𝑆𝑆: = +
��
𝐸𝑆𝑆 𝑅𝑆𝑆 ∑� � ��
�� 𝑢
𝑹𝟐𝑪 = =1− =1− � (2.25)
𝑇𝑆𝑆 𝑇𝑆𝑆 ∑��(𝑌� − 𝑌�)�
0 ≤ 𝑹𝟐𝑪 ≤ 1: Es la fracción de la variación de 𝒀 (alrededor de la media) explicada por la variación de
los regresores no constantes 𝒙� , … , 𝒙� . Es una medida del poder explicativo de los regresores
excluyendo la constante.
NOTA: Cuando el modelo no incluye una constante, es posible que 𝑹𝟐𝑪 tome valores negativos por
lo que carecerá de interpretación. Por construcción, esto no ocurrirá con el 𝑹𝟐𝑵𝑪 .

�𝟐
2.5.3 𝑹𝟐 -Ajustada: 𝑹
Es la 𝑅�� ajustada por los “grados de libertad” de RSS y TSS respectivamente.
𝑅𝑆𝑆⁄(𝑁 − 𝐾)
𝑅� � = 1 − (2.26)
𝑇𝑆𝑆⁄(𝑁 − 1)
No necesariamente aumenta cuando se incluye un regresor adicional. Aumentará solo sí la
reducción proporcional en RSS es mayor que la reducción proporcional en (𝑁 − 𝐾).
Puede ser negativo si el modelo tiene poco poder explicativo. En este caso:
𝑁 − 1 𝑇𝑆𝑆
>
𝑁 − 𝐾 𝑅𝑆𝑆
2.5.4 Los Criterios de Información de Akaike, Schwarz & Hannan-Quinn
Sirven para comparar el ajuste de modelos con diferente número de regresores.
� ʹ𝑼
𝑼 � 2𝐾
𝐴𝐼𝐶 = 𝑙𝑛 + � � ← 𝑡é𝑟𝑚𝑖𝑛𝑜 𝑑𝑒 𝑝𝑒𝑛𝑎𝑙𝑖𝑧𝑎𝑐𝑖ó𝑛 (2.27)
𝑁 𝑁
𝑼� ʹ𝑼
� 𝐾
𝐵𝐼𝐶 ó 𝑆𝐶 = 𝑙𝑛 + � 𝑙𝑛𝑁� ← 𝑡é𝑟𝑚𝑖𝑛𝑜 𝑑𝑒 𝑝𝑒𝑛𝑎𝑙𝑖𝑧𝑎𝑐𝑖ó𝑛 (2.28)
𝑁 𝑁
� ʹ𝑼
𝑼 �
𝐻𝑄𝐶 = 𝑁 𝑙𝑛 + 2𝐾𝑙𝑛(ln 𝑁) ← 𝑡é𝑟𝑚𝑖𝑛𝑜 𝑑𝑒 𝑝𝑒𝑛𝑎𝑙𝑖𝑧𝑎𝑐𝑖ó𝑛 (2.29)
𝑁


C2 ModeloClásico A

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

C2 ModeloClásico A

Transféré par

Droits d'auteur :

Formats disponibles

Centro de Investigación y Docencia Económicas, A.C.

2. El Modelo de Regresión Lineal Clásico

Econometría 1 Programa de Maestría en Economía

El modelo (2.1) se puede escribir como 𝑦� = 𝒙� ′𝜷 + 𝑢� , 𝑖 = 1,2, … , 𝑁. O, en forma más compacta:

2.1.2 Exogeneidad estricta

Econometría 1 Programa de Maestría en Economía

𝐿𝑒𝑦 𝑑𝑒 𝐸𝑥𝑝𝑒𝑐𝑡𝑎𝑡𝑖𝑣𝑎𝑠 𝑇𝑜𝑡𝑎𝑙𝑒𝑠: 𝐸 [𝐸(𝑌|𝑋)] = 𝐸(𝑌)

𝑆𝑖 𝐸 (𝑋𝑌) = 0 ⇒ 𝑋 𝑒𝑠 𝑜𝑟𝑡𝑜𝑔𝑜𝑛𝑎𝑙 𝑎 𝑌 ó 𝑌 𝑒𝑠 𝑜𝑟𝑡𝑜𝑔𝑜𝑛𝑎𝑙 𝑎 𝑋

Por la Ley de Expectativas Totales: 𝐸�𝑥�� 𝑢� � = 𝐸�𝐸�𝑥�� 𝑢� �𝑥�� ��

𝐿𝑖𝑛𝑒𝑎𝑙𝑖𝑑𝑎𝑑 𝑑𝑒 𝐸𝑥𝑝𝑒𝑐𝑡𝑎𝑡𝑖𝑣𝑎𝑠 𝑐𝑜𝑛𝑑𝑖𝑐𝑖𝑜𝑛𝑎𝑙𝑒𝑠: 𝐸 [𝑓(𝑥 )𝑌|𝑋] = 𝑓(𝑥 )𝐸(𝑌|𝑋)

Econometría 1 Programa de Maestría en Economía

2.1.3 Rango Completo de la matriz 𝑿

Econometría 1 Programa de Maestría en Economía

2.2 El Método de Mínimos Cuadrados

2.2.1 Definición general

NOTA: Para un conjunto específico de datos 𝜇̂ � es un estimado de mínimos cuadrados.

Algunos ejemplos sencillos:

Econometría 1 Programa de Maestría en Economía

El estimador de MC del parámetro 𝛽 (primer momento) es obtenido resolviendo el problema:

(ii) Considere la relación lineal simple 𝑌� = 𝛽 + 𝑢� . Donde 𝛽 es un parámetro desconocido, 𝑢� es

Econometría 1 Programa de Maestría en Economía

Nuevamente, dado que 𝐸 [𝑌� |𝑋� ] = 𝑋� 𝛽 (primer momento), el estimador de MC de 𝛽 se puede

∑���� 𝑌� 𝑋� − ∑���� 𝑋� � 𝛽 = 0; ∑���� 𝑌� 𝑋� − 𝛽 ∑���� 𝑋� � = 0

Econometría 1 Programa de Maestría en Economía

(iv) Considere, finalmente, la muestra aleatoria de (𝑌� , 𝑋� ), 𝑖 = 1, … , 𝑇 y suponga la relación lineal

(Minimizando la suma de errores al cuadrado: ∑���� 𝑢�� )

𝛽�� = �(𝑌� − 𝑌�)(𝑋� − 𝑋�) / �(𝑋� − 𝑋�)�

Econometría 1 Programa de Maestría en Economía

2.2.2 Estimación del vector 𝜷 por Mínimos Cuadrados

�(𝑦� − 𝛽� 𝑥�� − 𝛽� 𝑥�� − ⋯ − 𝛽� 𝑥�� )� (2.11)

En términos matriciales la expresión anterior es igual a:

Desarrollando el producto: 𝑼′𝑼 = (𝒀 − 𝑿𝜷)′(𝒀 − 𝑿𝜷)

Econometría 1 Programa de Maestría en Economía

𝑥�� 𝑥�� ⋯ 𝑥�� 𝛽� 𝛽�

= 2[𝒀ʹ𝒙� 𝛽� + 𝒀ʹ𝒙� 𝛽� + ⋯ + 𝒀ʹ𝒙� 𝛽� ]

Econometría 1 Programa de Maestría en Economía

Tres resultados útiles sobre Derivadas con Matrices:

Explícitamente, el primer resultado es:

Econometría 1 Programa de Maestría en Economía

Econometría 1 Programa de Maestría en Economía

2.2.3 Algunos Resultados Algebraicos

� �� como estimador del Método de Momentos.

(ii) Vector de valores estimados, ajustados o proyectados

Econometría 1 Programa de Maestría en Economía

(iii) Vector de residuales estimados

Econometría 1 Programa de Maestría en Economía

La matriz 𝑴 se denomina matriz aniquiladora (“annihilator matrix”) y tiene las siguientes

Econometría 1 Programa de Maestría en Economía

Econometría 1 Programa de Maestría en Economía

� sea insesgado se requiere imponer la restricción 𝑫𝑿 = 𝟎.

Econometría 1 Programa de Maestría en Economía

� dado en (**) se puede formular como:

Aplicando el operador varianza, condicional en 𝑿:

Entonces, la diferencia de varianzas es igual a una matriz semidefinida positiva:

Econometría 1 Programa de Maestría en Economía

Utilizando la regla de descomposición de varianza:

= 𝐸� [𝜎 � �𝑿ʹ 𝑿)�𝟏 � + 𝑉𝑎𝑟� [𝜷]

Econometría 1 Programa de Maestría en Economía

� 𝑳𝑺 con Regresores No Estocásticos

2.4 Un Estimador Insesgado de 𝝈𝟐

Utilizando el resultado algebraico (iv) de la sección 2.2.3:

Donde 𝑴 = (𝑰𝑵 − 𝑷); 𝑷�×� = 𝑿�×� (𝑿��×� 𝑿�×� )�� 𝑿��×�

Econometría 1 Programa de Maestría en Economía

NOTA SOBRE TRANSPOSICIÓN DE MATRICES E INTERCAMBIABILIDAD DE tr[.] & E[.]:

Por la Ley de Expectativas Totales: 𝐸�𝑥�� 𝑢� � = 𝐸�𝐸�𝑥�� 𝑢� �𝑥��

∑�� 𝑌� 𝑋� − ∑�� 𝑋� � 𝛽 = 0; ∑�� 𝑌� 𝑋� − 𝛽 ∑�� 𝑋� � = 0

(Minimizando la suma de errores al cuadrado: ∑�� 𝑢�� )