Vous êtes sur la page 1sur 18




- +
Asociación
positiva. Si
aumenta X
aumenta Y

Estadística Económica
2007-2008. Sara Mateo.
GRÁFICOS DE DISPERSIÓN / RECTA DE REGRESIÓN
Para el cálculo de la recta de regresión se aplica el método de
mínimos cuadrados entre dos variables. Esta línea es la que
hace mínima la suma de los cuadrados de los residuos, es
decir, es aquella recta en la que las diferencias elevadas al
cuadrado entre los valores calculados por la ecuación de la
recta y los valores reales de la serie, son las menores posibles.

y = a + bx
Recta de regresión Pendiente

yn
yn 1 yˆ i
y3
u3 ui
yi
y1 yi
y2

Intercepto
x1 x2 x3 xi xn 1 xn

yi  a  bxi  ui ui  yi  yˆi
Error
yˆ i

y i  a  bxi

n n

u  ( yi  yˆi )2
2
i  i  i i
u 2

i 1
 ( y  ˆ
y
i 1
) 2

 n 2 n n
2
 ui   ( yi  yˆi )    yi  aq bpxi   
2
min
q, p  i 1 i 1 i 1 
n n
  i i  i i
 y
i 1
 a  bx 2
  y  a  bx 2

i 1
El valor que hemos
Errores cometidos al
aproximar por una recta
aproximado para “y” con
la recta de regresión  y*
 na   y b x
i
i
i
i 
 a  y bx

 x y  y bx  x b x
i
i i
i
i
i
2
i

 x y 
 y
 x bxnx b x
i

 yi a bxi 0   y  ab x 
2
 2 i i
i i
n
i i
a 
i i i
i i i i  
 
 x y a x b x   
 

b
 2
i
 yi a bxi xi 0
 i
i i
i
i
i
2
i
 i
xi yi  ynx b

 i
xi2  nx 2 


S xy
S xy bS x2  b 
S x2
y obtenemos que la recta de regresión de Y sobre X: y = a + bx con los
valores a y b anteriormente calculados, o bien la siguiente expresión:

S xy
y y  x  x 
S x2
Aplicando el mismo razonamiento llegaríamos a la expresión de la recta de
regresión de X sobre Y: x = a’ + b’y con los valores a’ y b’ calculados como:

S xy
b'  y a ' x b ' y
S y2

Por tanto, se podría expresar como:

S xy
x x  y y 
Estadística Económica S y2
2007-2008. Sara Mateo.
.

  yi  yˆi 
2

VR = Su2  S R2y 
N

2 Su2 VR
2 Sx 
Sy S y2 VTy .

Su2
R  1 2 rxy  R
SY
2
R
2
S xy S xy  S xy 
2
R bb'   r 2
S x2 S y2  S x S y  xy
: 
1  r  1 1  R  1 0  r 2  1 0  R2  1

: R  r  R2  r 2

 S  S S
: yˆi   y  XY2 x   XY2 xi  y  XY2  xi  x 
 SX  SX SX

S XY S X SY S XY SY SY
yˆi  y  2  i 
x  x  y   i 
x  x  y  r  xi  x 
S X SY S X S X SY S X SX

r  1 1  r  0 r 0 0  r 1 r 1
Estadísiticos de Bondad de ajuste

• Se desea una medición sobre la bondad de ajuste del modelo a los datos.
• El coeficiente de determinación R2 es el más común. Una manera de definir
R2 es decir la correlación al cuadrado entre y y y$ .
• De forma alternativa, se requiere explicar la varianza de la variable endógena,
y , i.e. Por la suma total de cuadrados , STC o TSS:

STC    yt  y 
2

• Se puede dividir la STC en dos partes: 1) la explicada por el modelo


(conocido como suma de cuadrados explicada, SEC) y la parte que no explica
el modelo (SRC).
Definiendo R2

• Esto es, STC = SEC + SRC



 ty  y 2
 
 tˆ
y  y 2
 t
ˆ
u 2

t t t
• La bondad de ajuste es:
SEC
R2 
STC
• Pero como STC = SEC + SRC, se puede escribir:

SEC STC SRC SRC


R2    1
STC STC STC
• R2 siempre estará entre 0 y 1. Considere los dos extremos:
SRC = STC i.e. SEC= 0 así que R2 = SEC/STC = 0
SEC = STC i.e. SRC = 0 así que R2 = SEC/STC = 1
Casos y el límite: R2 = 0 y R2 = 1

yt
yt

xt xt
Problemas con el R2 como medida de bondad de ajuste

• Hay un número de problemas:

1. R2 está definido en términos de la media de y así que el modelo está


reparamétrizado (reacomodado) y la variable dependiente siempre
cambiará, R2 cambiará.

2. R2 nunca cae si se añaden más regresores:


Regresión1: yt = 1 + 2x2t + 3x3t + ut
Regresión 2: y = 1 + 2x2t + 3x3t + 4x4t + ut
R2 siempre será más alto en la regresión 2 relativa a la regresión1.

3. R2 es sospecho para series de tiempo mayores a 0.9 en modelos de series


de tiempo: puede existir problemas de endogenidad, simultaneidad o
operaciones de suma y resta.
R2 Ajustado

• Para tratar los poblemas previos, se utiliza el R2 ajustado. Se conoce como


o R2: ajustado.
R2
 T 1 
R 2 1  (1  R 2 )
T  k 
• Si se añade un regresor extra, k se incrementa y al menos que R2 se
incremente en la misma proporción, R 2 caerá.

• Siguen existiendo algunos problemas con este criterio:


1. Una regla suave.
2. No hay distribuciones para R 2 o R2.
S XY
yˆi  qa  bpxi  y  2  xi  x 
SX

Dado x0 estimar yˆ0

S XY
ˆ 0  aq  bpx0  y  2
y  x0  x 
SX

Vous aimerez peut-être aussi