Vous êtes sur la page 1sur 36

ECONOMETRA II

Funcin de regresin muestral


(FRM)

En la prctica, lo que se tiene al alcance no es ms que una


muestra de valores de Y que corresponden a algunos
valores fijos de X. Por tanto, la labor ahora es estimar la
FRP con base en informacin muestral.

lneas de regresin muestral

Es posible predecir el consumo semanal promedio Y de la poblacin en su conjunto


correspondiente a los valores de X seleccionados? En otras palabras, se puede
estimar la FRP a partir de los datos de la muestra?

Funcin de regresin muestral


(FRM)

Al igual que la FRP en la cual se basa la lnea de regresin


poblacional, se desarrolla el concepto de funcin de regresin
muestral (FRM) para representar la lnea de regresin muestral.
La contraparte muestral de la ecuacin puede escribirse como:

Funcin de regresin muestral


(FRM)
La FRM se expresa en su forma estocstica de la siguiente manera:

=
donde, adems de los smbolos ya definidos,
denota el trmino
residual (muestral). Conceptualmente, es anlogo a y se considera
una estimacin de , que se introduce en la FRM por las mismas razones
que se introdujo en la FRP.
As, para resumir, concluimos que el objetivo principal del anlisis de
regresin es estimar la FRP.
con base en la FRM
Debido a fluctuaciones muestrales, la estimacin
de la FRP basada en la FRM es, en el mejor de los
casos, una aproximacin.
4

Funcin de regresin muestral


(FRM)

Un sombrero sobre una variable significa un estimador del valor


poblacional pertinente.

Ejemplo
aos de
Nmero
escolarida Salario
de
d
promedio personas
6

4.4567

5.7700

5.9787

15

7.3317

12

10

7.3182

17

11

6.5844

27

12

7.8182

218

13

7.8351

37

14

11.0223

56

15

10.6738

13

16 tabla
10.8361
70
La
proporciona
datos sobre el nivel de estudios (medido en aos de
escolaridad),
el 24
salario promedio por hora devengado por las personas por nivel
17
13.6150
de escolaridad y el nmero de personas en un nivel de estudios.
6
18

13.5310

31

Modelo de regresin con dos variables:


problema de estimacin

Mtodo de mnimos cuadrados ordinarios (MCO)

El mtodo de mnimos cuadrados ordinarios se atribuye a Carl Friedrich Gauss,


matemtico alemn. A partir de ciertos supuestos, el mtodo de mnimos
cuadrados presenta propiedades estadsticas muy atractivas que lo han
convertido en uno de los ms eficaces y populares del anlisis de regresin.

Criterio de
Mnimos
Cuadrados
Muestra
que los (los residuos) son
simplemente
las diferencias entre los
valores observados y los estimados
de Y.

Modelo de regresin con dos variables:


problema de estimacin

Mtodo de mnimos cuadrados ordinarios (MCO)


Dados
n pares de observaciones de Y y X, nos interesa determinar la
FRM de manera que quede lo ms cerca posible de la Y observada.
Con este fi n, se adopta el siguiente criterio: seleccionar la FRM de
modo que la suma de los residuos sea la menor posible
El problema es que todos los residuos reciben el mismo peso, sin
importar la distancia a la FRM, para ello, se eleva al cuadrado para
dar pesos de acuerdo a las distancias a la FRM.

Donde
son los residuos elevados al cuadrado. Al elevar al cuadrado ,
este mtodo da ms peso a los residuos como y
8

Modelo de regresin con dos variables:


problema de estimacin

Mtodo de mnimos cuadrados ordinarios (MCO)


Dados
n pares de observaciones de Y y X, nos interesa determinar la
FRM de manera que quede lo ms cerca posible de la Y observada.
Con este fi n, se adopta el siguiente criterio: seleccionar la FRM de
modo que la suma de los residuos sea la menor posible
El problema es que todos los residuos reciben el mismo peso, sin
importar la distancia a la FRM, para ello, se eleva al cuadrado para
dar pesos de acuerdo a las distancias a la FRM.

Donde
son los residuos elevados al cuadrado. Al elevar al cuadrado ,
este mtodo da ms peso a los residuos como y
9

Determinacin experimental de la FRM

10

Ecuaciones para
estimar :

donde n es el tamao de la muestra. Estas ecuaciones simultneas se


conocen como ecuaciones normales.
Al resolver las ecuaciones normales al mismo tiempo, obtenemos:

Letras
minsculas
representan
desviaciones
respecto de los valores
medios
11

Ecuaciones para
estimar :

Letras
representan
respecto de
medios

minsculas
desviaciones
los valores

12

Estimadores de mnimos
cuadrados
I.
II.
III.

Los estimadores de MCO se expresan nicamente en trminos de las cantidades (es


decir, X y Y ) observables (es decir, muestras). Por consiguiente, se calculan con
facilidad.
Son estimadores puntuales: dada la muestra, cada estimador proporciona un solo
valor (puntual) del parmetro poblacional pertinente
Una vez obtenidos los estimadores de MCO de los datos de la muestra, se obtiene sin
problemas la lnea de regresin muestral.

13

Modelo clsico de regresin lineal:


fundamentos del mtodo de mnimos
cuadrados
Si
deseamos estimar slo y , basta el mtodo

MCO presentado anteriormente.


En el anlisis de regresin el objetivo es no slo
obtener y , sino tambin inferir los verdaderos
y.
Los supuestos sobre la(s) variable(s) y el trmino
de error son relevantes para lograr una
interpretacin vlida de los valores estimados de
la regresin.

14

MCRL

Es un modelo clsico en el
sentido de que Gauss lo
emple por primera vez en
1821 y desde entonces
sirve como norma o patrn
con el cual comparar los
modelos de regresin que no
satisfacen los supuestos
gaussianos.

El modelo de Gauss, modelo clsico o estndar de


regresin lineal (MCRL), es el cimiento de la mayor parte
de la teora economtrica y plantea siete supuestos.
SUPUESTO 1 Modelo de regresin lineal: El modelo de regresin
es lineal en
los parmetros, aunque puede o no ser lineal
en las variables.

SUPUESTO 2 Valores fijos de X, o valores de X independientes del


trmino de error:
Los valores que toma la regresora X pueden
considerarse fijos en
muestras repetidas (el caso de la regresora
fija), o haber muestreados
junto con la variable dependiente Y (el caso
de la regresora estocstica).
En el segundo caso se supone que la(s)
variable(s) X y el trmino de error
son independientes, esto es, COV
()=0
15

MCRL

Es un modelo clsico en el
sentido de que Gauss lo
emple por primera vez en
1821 y desde entonces
sirve como norma o patrn
con el cual comparar los
modelos de regresin que no
satisfacen los supuestos
gaussianos.

SUPUESTO
3 El valor medio de la perturbacin es igual a cero:
Dado el valor
de , la media o el valor esperado del trmino de
perturbacin
aleatoria es cero.

O, si X no es
estocstica

16

MCRL

Es un modelo clsico en el
sentido de que Gauss lo
emple por primera vez en
1821 y desde entonces
sirve como norma o patrn
con el cual comparar los
modelos de regresin que no
satisfacen los supuestos
gaussianos.

SUPUESTO

4
Homoscedasticidad
o
varianza
constante de : La varianza
del trmino de error, o de
perturbacin, es la misma sin
importar el valor de X.
Simblicamente, tenemos que
var (ui) = E[ E(|Xi)]2
= E(|Xi), por el supuesto 3
= E(), si Xi son variables no estocsticas
=
donde var significa varianza.
Supuesto de homoscedasticidad, o igual (homo)
dispersin (cedasticidad), o igual varianza. La palabra
proviene del verbo griego skedanime, que significa
dispersar o esparcir

17

HOMOCEDASTICID
AD

HETEROCEDASTIC
IDAD

18

MCRL

Es un modelo clsico en el
sentido de que Gauss lo
emple por primera vez en
1821 y desde entonces
sirve como norma o patrn
con el cual comparar los
modelos de regresin que no
satisfacen los supuestos
gaussianos.

SUPUESTO 5
No hay autocorrelacin entre las
perturbaciones: Dados dos valores cualesquiera de X, Xi y Xj
(i j ), la correlacin entre dos ui y uj cualesquiera (i j ) es
cero. En pocas palabras, estas observaciones se muestrean de
manera independiente.

19

MCRL

Es un modelo clsico en el
sentido de que Gauss lo
emple por primera vez en
1821 y desde entonces
sirve como norma o patrn
con el cual comparar los
modelos de regresin que no
satisfacen los supuestos
gaussianos.

SUPUESTO 6
El nmero de observaciones n debe ser
mayor que el nmero
de parmetros por estimar:
Sucesivamente, el nmero de
observaciones n debe ser
mayor que el nmero de variables
explicativas.
SUPUESTO 7
La naturaleza de las variables X: No todos los
valores X en una
muestra determinada deben ser iguales.
Tcnicamente, var(X)
debe ser un nmero positivo.
Adems, no puede haber valores
atpicos de la variable X,
es decir, valores muy grandes en
relacin con el resto
de las observaciones.
20

Advertencia sobre estos


supuestos
son realistas todos estos supuestos? La realidad
de los supuestos se cuestiona desde hace
muchos aos en la filosofa de las ciencias.
Algunos argumentan que no importa si los
supuestos son realistas, sino las predicciones
basadas en esos supuestos. Entre quienes apoyan
la tesis de la irrelevancia de los supuestos
sobresale Milton Friedman. Para l, la irrealidad de
los supuestos es una ventaja positiva: para que
una hiptesis sea importante... debe ser
descriptivamente falsa en sus supuestos.
21

Precisin o errores estndar de las


mnimos cuadrados
En
estadstica,
la
precisin de un valor
estimado se mide por
su error estndar (ee)

SCR suma de los


cuadrados de los
residuos

22

Precisin o errores estndar de las


mnimos cuadrados
En
estadstica,
la
precisin de un valor
estimado se mide por
su error estndar (ee)
SCR suma de los
cuadrados de los
residuos

Grados de libertad= La regla general es la


siguiente: gl = (n nmero de parmetros
estimados).

23

Propiedades de los estimadores


de mnimos cuadrados: teorema
de Gauss-Markov
Para
entender este teorema necesitamos

considerar
la
propiedad
del
mejor
estimador lineal insesgado (MELI).
1.

2.
3.

Es lineal, es decir, funcin lineal de una variable


aleatoria, como la variable dependiente Y en el
modelo de regresin.
Es insesgado, es decir, su valor promedio o
esperado, E(), es igual al valor verdadero,
Tiene varianza mnima dentro de la clase de todos
los estimadores lineales insesgados; un estimador
insesgado con varianza mnima se conoce como
estimador eficiente.
24

Teorema de GaussMarkov
Dados los supuestos del modelo clsico de
regresin lineal, los estimadores de
mnimos cuadrados, dentro de la clase de
estimadores lineales insesgados, tienen
varianza mnima, es decir, son MELI.

La varianza o la desviacin estndar da una indicacin de qu tan


cercanos o dispersos estn los valores individuales de X respecto del

25

Coeficiente de determinacin r2: una


medida de la bondad del ajuste
Describe,
la bondad del ajuste de la lnea de

regresin a un conjunto de datos.


Si todas las observaciones cayesen en la lnea de
regresin, obtendramos un ajuste perfecto,
pero rara vez se presenta este caso.
Por lo general hay residuos positivos y negativos.
El coeficiente de determinacin (caso de dos
variables) o (regresin mltiple) es una medida
comprendida que dice cun bien se ajusta la lnea
de regresin muestral a los datos.

26

Coeficiente de determinacin r2: una


medida dela bondad del ajuste

27

Coeficiente de determinacin r2: una


medida de la bondad del ajuste

28

Ejercicio para clculo de


Betas

29

Coeficiente de determinacin : una

medida de la bondad
del ajuste

La cantidad as definida se conoce como coeficiente de determinacin

(muestral), y es la medida ms comn de la bondad del ajuste de una


30
lnea de regresin. Verbalmente, mide la proporcin o el porcentaje
de la variacin total en Y explicada por el modelo de regresin

Propiedades del Coeficiente de


determinacin : una
medida de la
bondad del ajuste

Es
una cantidad no negativa. (Por qu?)

Sus lmites son 0 1. Un de 1 significa un ajuste


perfecto, es decir, = por cada i. Por otra parte, un de cero
significa que no hay relacin alguna entre la variable
regresada y la variable regresora (es decir, 0). En este
caso, = , es decir, la mejor prediccin de cualquier valor de
Y es simplemente el valor de su media. En esta situacin,
por consiguiente, la lnea de regresin ser horizontal al eje
X.
Forma
rpida
de
calcula
r
31

Coeficiente de correlacin

Medida del grado de asociacin entre dos variables.


El coeficiente de determinacin no slo mide la capacidad
explicativa de un modelo, sino que adems permite elegir
entre varios modelos cual es el ms adecuado. As los
modelos tienen la misma variable dependiente y el mismo
nmero de variables explicativas, ser ms adecuado el
tenga un coeficiente de determinacin mayor

32

Coeficiente de correlacin

Patrones de correlacin

33

Coeficiente de correlacin

Patrones de correlacin

34

Ejercicio de aplicacin

35

Ejercicio de aplicacin

36

Vous aimerez peut-être aussi