Vous êtes sur la page 1sur 58

Universidade

de Vigo

Estabilidad de parámetros

Análisis de los cambios estructurales


Estabilidad de parámetros Universidade
de Vigo

 Queremos comprobar si los parámetros se mantienen los


mismos a lo largo de toda la muestra o cambian de un
valor a otro.
 En general el hecho de cambio de parámetros lleva
implícito que existe otra variable independiente que
condiciona el modelo y los parámetros cambian de
acuerdo a esa variable.
 Normalmente el cambio se observa en el tiempo, por
ello se habla de cambio estructural. Trabajaremos como
si el tiempo fuera la variable que indica el cambio (es
decir, el orden en que se observan los datos). Si fuera
otra variable se reordenarían los datos de acuerdo a esa
nueva variable.
Ejemplos de cambio de parámetros Universidade
de Vigo

 Existen muchos motivos por el que pueden cambiar los


parámetros en un modelo:
 Intervenciones externas en un momento de tiempo, por
ejemplo anuncio de una subida del precio del petróleo, cambia
las estructuras que relacionan variables fundamentales, renta
consumo o inflación, o costes producción etc.. . El
hundimiento del Prestige.
 Existen dos grupos que tiene comportamientos diferentes , por
ejemplo dos sectores industriales con relaciones de costes
diferentes.
 Modelos con parámetros cambiantes, cuando estos cambian en
cada momento del tiempo.
Efecto de la no estabilidad Universidade
de Vigo

 El hecho de que no haya estabilidad en los parámetros


genera el mismo efecto que la falta de linealidad, pues el
modelo esta mal especificado y las estimaciones son
sesgadas e inconsistentes.
 Eso significa que el método de estimación deja de ser
válido, por ese motivo detectar la inestabilidad de
parámetros es fundamental.
Ejemplo para dos grupos Universidade
de Vigo

 La estabilidad nos asegura la siguiente relación

b = ( X ' X ) −1 X ' y = ( X ' X ) −1 X ' ( Xβ + ε ) = β + ( X ' X ) −1 X ' ε

 Supongamos que el parámetro cambia según la siguiente relación

y (1) = X (1) β (1) + ε (1) si t < T1  y (1)   X (1) β (1) + ε (1) 


⇒  ( 2 )  =  ( 2 ) ( 2 ) 
( 2) 
y ( 2 ) = X ( 2 ) β ( 2 ) + ε ( 2 ) si t > T1  y   X β +ε 

 Entonces la relación anterior se convierte en


 X (1) β (1) 
b = ( X ' X ) X ' y = ( X ' X ) X ' ( ( 2 ) ( 2 )  + ε ) =
−1 −1

X β 
= ( X (1) ' X (1) + X ( 2 ) ' X ( 2 ) ) −1 ( X (1) ' X (1) β (1) + X ( 2 ) ' X ( 2 ) β ( 2 ) ) =
≠ β + ( X ' X ) −1 X ' ε
 Por lo tanto, los estimadores dejan de ser insesgados y consistentes
Diagnostico de la estabilidad Universidade
de Vigo

 Gráficos
 Residuos respecto a variable de cambio
estructural (tiempo)
 Test de hipótesis
 Test de Chow
Gráficos de residuos respecto a
variable estimada Universidade
de Vigo

 Se representa el
residuo respecto al
tiempo u otra variable 0.4
SHAZAM PLOT

de la que se sospeche 0.3


E

influye en el cambio de 0.2


los parámetros. 0.1

 Si aparece un cambio 0

de tendencia es
E
-0.1

síntoma de cambio -0.2

estructural -0.3

-0.4

-0.5
0 5 10 15 20 25
TIME

Cambio de
tendencia
Test de Chow
Diferentes versiones del test para analizar la estabilidad y la validez
de modelos de regresión lineal

Universidade
de Vigo
Test de hipótesis Universidade
de Vigo

 Intentan delimitar si se produce un cambio en los parámetros.


 También se puede hacer uso de estos test para ver si el modelo
se mantiene el mismo, en un periodo postmuestral, por ello se
habla también de test postmuestrales.
 Pueden ser de dos tipos:
 Fijo: Se establece un valor que se quiere comparar.
 Secuencial: Compara el cambio de parámetros para todos los casos
posibles
 El primero contrasta si existe un cambio en un determinado
punto, mientras que el segundo se utiliza también para detectar
los puntos en los que se producen cambios.
 La construcción de ambos es la misma, sólo cambia el enfoque
del test, por tanto definiremos las versiones del test de Chow
fijo y luego lo extendemos al caso secuencial.
Test de estabilidad Universidade
de Vigo

 La idea intuitiva del test es muy sencilla. Se supone que


existe una observación a partir de la cual los parámetros
son diferentes. Inicialmente el test de Chow suponía
únicamente dos casos, que delimitaban la hipótesis nula y
alternativa del test:
 Que en toda la muestra los parámetros fueran iguales
 A partir de la observación los parámetros son diferentes
 No obstante en la práctica, suele ser interesante diferenciar
entre la constante y las pendientes del modelo. Eso nos
permite establecer cuatro posibles modelos.
Modelos para el Test de validación o
estabilidad de parámetros Universidade
de Vigo

Se contrastan cuatro posibles modelos:


I. Los datos extramuestrales se ajustan perfectamente al modelo
expuesto en el caso muestral.
II. La constante es distinta pero las pendientes son comunes.
III. La constante es común pero las pendientes son distintas.
IV. Tanto la constante como las pendientes son distintas.
 Vamos a analizar cada uno de esos modelos y luego
estableceremos el test.
Matrices de diseño de los modelos Universidade
de Vigo

 Para establecerlos consideraremos que el cambio se da en la


observación j y nos quedan T-j observaciones finales.
 Por consiguiente dividimos la muestra en dos grupos los
primeros T y los últimos m, que se refleja en representar el
vector y la matriz X por matrices particionadas
Corresponde a ij Corresponde a X1
 1 x11 ... xk 1 
  
 Y1   : : ... :  ij X1 *

Y =  X = = *
 Y2  : : ... :   iT − j X 2 

Corresponde a i
 
 1 x1T
T-j ... xkT 
Corresponde a X2
Ejemplo de CENSA Universidade
de Vigo

 Vamos a aplicar los diferentes modelos a un ejemplo para


comprobar si existe un cambio de parámetros en el modelo. CMJ1
 El coste de fabricación de celulosa en una empresa
(CENSA) depende de la cantidad de celulosa producida. Se
recogen datos trimestrales de coste total (Y) y cantidad
producida (X) desde el año 1990 hasta 1999 ambos incluidos.
Se supone que existe una relación lineal ente los costes y la
producción. El segundo trimestre de 1995 ha entrado en
vigor una legislación de costes medioambientales que
incrementa los controles . Analice si eso tiene efectos sobre el
modelo.
Diapositiva 13

CMJ1 aqui
copiar modelo
aplicar matrices
Carlos Maria Jardon; 05/12/2007
Partición de los datos Universidade
de Vigo

 Las matrices particionadas nos quedarán al considerar una


variable independiente y 40 datos, cambiando en le dato 22

 y1  1 x1 
   
  :  : : 
 y21  1 x21 
Y =  X = 
 y22  1 x22 
 :  : : 
   
 y40  1 x40 
Modelo I Universidade
de Vigo

 Los datos extramuestrales se ajustan perfectamente al


modelo expuesto en el caso muestral, y en consecuencia,
se podría estimar el modelo con los datos muestrales y
los extramuestrales, ganando eficiencia en la estimación.
 La forma matricial del modelo será
Y=Xβ+ε
En forma particionada sería

 Y1   i j X *

  =   ⋅ β + ε
1
*
 Y2   iT − j X 2
Modelo I: notaciones Universidade
de Vigo

 Para facilitar la comparación entre los modelos vamos a descomponer


el vector β en dos subvectores: β0que tiene dimensión 1 y representa a
la constante y β 1 que tiene dimensión k y es la pendiente de todas las
variables independientes.
 Consideremos que el conjunto de las primeras j observaciones
corresponden al grupo G1 y el conjunto de las restantes T-j
observaciones corresponden al grupo G2.
 Definimos dos variables ficticias: IG1 y IG2, que valen 1 cuando la
observación pertenece a la muestra primera (G1) y o en el resto o
viceversa 1 si pertenece a G2 y o en el resto.
 Definimos las correspondientes variables multiplicativas XIG1 y XIG2
como resultado de multiplicar X por IG1 y IG2 respectivamente.
 Con estas notaciones el modelo podría escribirse de la siguiente forma
Modelo I: desarrollo Universidade
de Vigo

 Y1   i j X 
*

  =   ⋅ β + ε →
1
*
 Y2   iT − j X 
2

Y = IG1β0 + IG 2 β0 + X1 IG1β1 + X 2 IG 2 β1 + ε →
* *

Y = ( IG1 + IG 2 )β0 + ( X I + X I )β1 + ε →


*
1 G1
*
2 G2

Y = β0 + X β1 + ε
*
Modelo I de celulosas Universidade
de Vigo

 No se introduce ninguna variable adicional es una regresión simple


entre Y y X1
|_ols y x1/resid=e predict=ye rstat noanova
REQUIRED MEMORY IS PAR= 5 CURRENT PAR= 4000
OLS ESTIMATION
40 OBSERVATIONS DEPENDENT VARIABLE= Y
...NOTE..SAMPLE RANGE SET TO: 1, 40
R-SQUARE = 0.5460 R-SQUARE ADJUSTED = 0.5341
VARIANCE OF THE ESTIMATE-SIGMA**2 = 6.2891
STANDARD ERROR OF THE ESTIMATE-SIGMA = 2.5078
SUM OF SQUARED ERRORS-SSE= 238.98
MEAN OF DEPENDENT VARIABLE = 17.076
LOG OF THE LIKELIHOOD FUNCTION = -92.5080
VARIABLE ESTIMATED STANDARD T-RATIO PARTIAL STANDARDIZED ELASTICITY
NAME COEFFICIENT ERROR 38 DF P-VALUE CORR. COEFFICIENT AT MEANS
X1 0.94249 0.1394 6.760 0.000 0.739 0.7389 0.5137
CONSTANT 8.3038 1.357 6.120 0.000 0.705 0.0000 0.4863
Modelo II Universidade
de Vigo

 La constante del modelo extramuestral es


distinta, pero las pendientes son iguales en
ambos modelos
 La forma matricial del modelo será

 β 01 
 Y1   iT 0T X  
*

 =  ⋅  β 02  + ε 2
1
*
 Y2   0m im X   β * 
2
 
Modelo II Universidade
de Vigo

 β 01 
 Y1   i j 0 j X 1   *

  = 0 i ⋅ β + ε2 →
*   02 
 Y2   T − j T − j X 2   β * 
 
Y = I G1β 01 + I G 2 β 02 + X 1 I G1β1 + X 2 I G 2 β1 + ε =
* * * *

= β 0 + I G 2α 02 + X β + ε
* *
Modelo II de celulosas Universidade
de Vigo

 Se introduce una variable ficticia adicional que mide el efecto del


cambio estructural en el segundo trimestre de 1995
|_ols y x1 D22/resid=e predict=ye rstat noanova
REQUIRED MEMORY IS PAR= 5 CURRENT PAR= 4000
OLS ESTIMATION
40 OBSERVATIONS DEPENDENT VARIABLE= Y
...NOTE..SAMPLE RANGE SET TO: 1, 40
R-SQUARE = 0.9219 R-SQUARE ADJUSTED = 0.9176
VARIANCE OF THE ESTIMATE-SIGMA**2 = 1.1117
STANDARD ERROR OF THE ESTIMATE-SIGMA = 1.0544
SUM OF SQUARED ERRORS-SSE= 41.132
MEAN OF DEPENDENT VARIABLE = 17.076
LOG OF THE LIKELIHOOD FUNCTION = -57.3156
VARIABLE ESTIMATED STANDARD T-RATIO PARTIAL STANDARDIZED ELASTICITY
NAME COEFFICIENT ERROR 37 DF P-VALUE CORR. COEFFICIENT AT MEANS
X1 0.67155 0.6203E-01 10.83 0.000 0.872 0.5265 0.3660
D22 4.7134 0.3533 13.34 0.000 0.910 0.6488 0.1311
CONSTANT 8.5865 0.5708 15.04 0.000 0.927 0.0000 0.5029
Modelo III Universidade
de Vigo

 La constante es la misma, pero las pendientes


del modelo extramuestral son distintas.
 La forma matricial del modelo será

 β0 
 Y1   iT X 0T ×k   * 
*
  =  1
 ⋅ β + ε3
*   1 
 Y2   im 0 m×k X 2   β * 
 2
Modelo III Universidade
de Vigo

 β 0 
 Y1   iT X 1 0T ×k   * 
*

 = ⋅ β + ε3 →
*   1 
 Y2   im 0m×k X 2   β * 
 2
Y = I G1β 0 + I G 2 β 0 + X 1 I G1β1 + X 2 I G 2 β 2 + ε =
* * * *

= β0 + X β + X I α + ε
*
1
* *
2 G2
*
2
Modelo III de celulosas Universidade
de Vigo

 Se introduce una variable ficticia adicional que mide el efecto del


cambio estructural en la pendiente en el segundo trimestre de 1995
R-SQUARE = 0.9540 R-SQUARE ADJUSTED = 0.9515
VARIANCE OF THE ESTIMATE-SIGMA**2 = 0.65493
STANDARD ERROR OF THE ESTIMATE-SIGMA = 0.80928
SUM OF SQUARED ERRORS-SSE= 24.232
MEAN OF DEPENDENT VARIABLE = 17.076
LOG OF THE LIKELIHOOD FUNCTION = -46.7338
VARIABLE ESTIMATED STANDARD T-RATIO PARTIAL STANDARDIZED ELASTICITY
NAME COEFFICIENT ERROR 37 DF P-VALUE CORR. COEFFICIENT AT MEANS
X1 0.48966 0.5147E-01 9.513 0.000 0.842 0.3839 0.2669
X12 0.49185 0.2716E-01 18.11 0.000 0.948 0.7307 0.1407
CONSTANT 10.115 0.4491 22.52 0.000 0.965 0.0000 0.5924
Modelo IV Universidade
de Vigo

 Tanto la constante como las pendientes del


modelo extramuestral son distintas.
 La forma matricial del modelo será

 β 01 
 
 β 02 
 Y1   iT 0 m X 1 0T ×k   * 
*
  =   ⋅ β1 + ε 4
* 
 Y2   0T im 0 m×k X 2   β * 
 2
 
 
Modelo IV Universidade
de Vigo

 β 01 
 
 β 02 
 Y1   iT 0m X 1 0T ×k 
*

 = *  ⋅  β 1
*
 + ε4 →
 Y2   0T im 0m×k X 2   β * 
 2
 
 
Y = I G1β 01 + I G 2 β 01 + X 1 I G1β1 + X 2 I G 2 β 2 + ε =
* * * *

= β 0 + I G 2α 0 + X β + X I G 2α + ε
* * * *
1
Modelo IV: resolución practica Universidade
de Vigo

 Este test presupone que la muestra se divide en dos y se


realiza una regresión para toda la muestra conjuntamente y
otra considerando muestras separadas.
 Esto significa que se puede realizar la comparación de dos
formas:
 Generando variables ficticias que nos midan los cambios
estructurales en el periodo prefijado
 Dividiendo el espacio en dos muestra y haciendo regresiones
separadas
Modelo IV de celulosas: Caso 1 Universidade
de Vigo

 Se introduce dos variables ficticias adicionales que miden el


efecto del cambio estructural en el segundo trimestre de 1995
|_ols y x1 D22 X12/resid=e predict=ye rstat noanova
REQUIRED MEMORY IS PAR= 6 CURRENT PAR= 4000
OLS ESTIMATION
40 OBSERVATIONS DEPENDENT VARIABLE= Y
...NOTE..SAMPLE RANGE SET TO: 1, 40
R-SQUARE = 0.9540 R-SQUARE ADJUSTED = 0.9501
VARIANCE OF THE ESTIMATE-SIGMA**2 = 0.67294
STANDARD ERROR OF THE ESTIMATE-SIGMA = 0.82033
SUM OF SQUARED ERRORS-SSE= 24.226
MEAN OF DEPENDENT VARIABLE = 17.076
LOG OF THE LIKELIHOOD FUNCTION = -46.7284
VARIABLE ESTIMATED STANDARD T-RATIO PARTIAL STANDARDIZED ELASTICITY
NAME COEFFICIENT ERROR 36 DF P-VALUE CORR. COEFFICIENT AT MEANS
X1 0.48659 0.6076E-01 8.009 0.000 0.800 0.3815 0.2652
D22 -0.98518E-01 0.9986 -0.9865E-01 0.922-0.016 -0.0136 -0.0027
X12 0.50134 0.1000 5.012 0.000 0.641 0.7448 0.1434
CONSTANT 10.144 0.5421 18.71 0.000 0.952 0.0000 0.5941
Modelo IV de celulosas: Caso 2
Se divide la muestra en dos a partir del segundo trimestre de 1995
|_SAMPLE 1 21 Universidade
|_OLS Y X/NOANOVA de Vigo
21 OBSERVATIONS DEPENDENT VARIABLE= Y
...NOTE..SAMPLE RANGE SET TO: 1, 21
R-SQUARE = 0.9805 R-SQUARE ADJUSTED = 0.9795
VARIANCE OF THE ESTIMATE-SIGMA**2 = 0.45227E-01
STANDARD ERROR OF THE ESTIMATE-SIGMA = 0.21267
SUM OF SQUARED ERRORS-SSE= 0.85930
MEAN OF DEPENDENT VARIABLE = 14.242
LOG OF THE LIKELIHOOD FUNCTION = 3.76191
VARIABLE ESTIMATED STANDARD T-RATIO PARTIAL STANDARDIZED ELASTICITY
NAME COEFFICIENT ERROR 19 DF P-VALUE CORR. COEFFICIENT AT MEANS
X 0.48659 0.1575E-01 30.89 0.000 0.990 0.9902 0.2877
CONSTANT 10.144 0.1405 72.19 0.000 0.998 0.0000 0.7123
|_gen1 SSE4A=$SSE
..NOTE..CURRENT VALUE OF $SSE = 0.85930
|_SAMPLE 22 40
|_OLS Y X/NOANOVA
19 OBSERVATIONS DEPENDENT VARIABLE= Y
...NOTE..SAMPLE RANGE SET TO: 22, 40
R-SQUARE = 0.8166 R-SQUARE ADJUSTED = 0.8058
VARIANCE OF THE ESTIMATE-SIGMA**2 = 1.3745
STANDARD ERROR OF THE ESTIMATE-SIGMA = 1.1724
SUM OF SQUARED ERRORS-SSE= 23.367
MEAN OF DEPENDENT VARIABLE = 20.208
LOG OF THE LIKELIHOOD FUNCTION = -28.9251
VARIABLE ESTIMATED STANDARD T-RATIO PARTIAL STANDARDIZED ELASTICITY
NAME COEFFICIENT ERROR 17 DF P-VALUE CORR. COEFFICIENT AT MEANS
X 0.98793 0.1136 8.700 0.000 0.904 0.9036 0.5029
CONSTANT 10.046 1.199 8.381 0.000 0.897 0.0000 0.4971

|_gen1 SSE4B=$SSE
..NOTE..CURRENT VALUE OF $SSE = 23.367
|_gen1 SSE4T=SSE4A+SSE4B
|_GEN1 F4=((SSE1-SSE4T)/1)/(SSE4T/(DF2))
|_DISTRIB F4/TYPE=F DF1=1 DF2=DF2
Test de estabilidad de los coeficientes Universidade
de Vigo

 El esquema de decisión es similar en todos los test, si la suma


de cuadrados disminuye mucho es que la restricción es falsa.
 La idea intuitiva del test es que si el añadir la diferencia de
constantes apenas aporta información al modelo el valor de la F
será cercano a la unidad, pero si aporta mucha información el
valor de la F tenderá a ser muy grande.
 El estadístico sigue una F de Snedecor donde los grados de
libertad dependen del número de restricciones, bajo las
suposiciones del MRLC .
Test de Diferencia de ordenadas
con pendientes iguales Universidade
de Vigo

Hipótesis a contrastar
H01 :β01 =β02 → α0=0
H11 :β01 ≠β02 → α0≠0
Estadístico de prueba
SCE1 − SCE2
F=
SCE2
T +m−k −2
Ley de distribución
Sigue una F de Snedecor con 1 y T+m-k-2
grados de libertad respectivamente
Test de Diferencia en todos los
coeficientes (Test de Chow)
Chow) Universidade
de Vigo

Hipótesis a contrastar
H04 :β1 =β2 → α=0
H14 :β1 ≠β2 →α≠0

Estadístico de prueba
SCE1 − SCE4
F= k +1
SCE4
T + m − 2k − 2
Ley de distribución
Sigue una F de Snedecor con k+1 y T+m-2k-2
grados de libertad respectivamente
Test de Diferencia entre las pendientes
con ordenadas iguales Universidade
de Vigo

Hipótesis a contrastar
H03 :β11 =β21 → α1=0
H13 :β11 ≠β21 →α1≠0

Estadístico de prueba SCE1 − SCE3


F= k
SCE3
Ley de distribución T + m − 2k − 1
Sigue una F de Snedecor con k y T+m-2k-1
grados de libertad respectivamente
Test de Diferencia entre las
pendientes con ordenadas distintas Universidade
de Vigo

Hipótesis a contrastar
H02 :β11 =β21 → α1=0
H12 :β11 ≠β21 →α1≠0

Estadístico de prueba
SCE2 − SCE4
F= k
SCE4
T + m − 2k − 2
Ley de distribución
Sigue una F de Snedecor con k y T+m-2k-2
grados de libertad respectivamente
Test de estabilidad en CENSA Universidade
de Vigo

|_*modelo 2
|_gen1 DF2=$N-3
|_gen1 SSE2=$SSE
..NOTE..CURRENT VALUE OF $SSE = 41.132
|_GEN1 F2=((SSE1-SSE2)/1)/(SSE2/(DF2))
|_DISTRIB F2/TYPE=F DF1=1 DF2=DF2
F DISTRIBUTION- DF1= 1.0000 DF2= 37.000
MEAN= 1.0571 VARIANCE= 2.4383 MODE= 0.0000
DATA PDF CDF 1-CDF
F2
ROW 1 177.98 0.89769E-16 1.0000 0.10377E-14
|_*modelo 3
|_gen1 SSE3=$SSE
..NOTE..CURRENT VALUE OF $SSE = 24.232
|_GEN1 F3=((SSE1-SSE3)/1)/(SSE3/(DF2))
|_DISTRIB F3/TYPE=F DF1=1 DF2=DF2
F DISTRIBUTION- DF1= 1.0000 DF2= 37.000
MEAN= 1.0571 VARIANCE= 2.4383 MODE= 0.0000
DATA PDF CDF 1-CDF
F3
ROW 1 327.90 0.28485E-20 1.0000 0.56024E-19
|_*modelo 4
|_gen1 SSE4=$SSE
..NOTE..CURRENT VALUE OF $SSE = 24.226
|_GEN1 F4=((SSE1-SSE4)/1)/(SSE4/(DF2))
|_DISTRIB F4/TYPE=F DF1=1 DF2=DF2
F DISTRIBUTION- DF1= 1.0000 DF2= 36.000
MEAN= 1.0588 VARIANCE= 2.4524 MODE= 0.0000
DATA PDF CDF 1-CDF
F4
ROW 1 319.13 0.90207E-20 1.0000 0.17745E-18
Test de Diferencia de ordenadas con
pendientes iguales en mas de dos grupos Universidade
de Vigo

Hipótesis a contrastar
H01 :β01 =β02=…=β0p
H11 :β01 ≠β02 o ….o :β01 ≠β0p

Estadístico de prueba
SCE1 − SCE2
p −1
F=
SCE2
T − p − k −1
Ley de distribución
Sigue una F de Snedecor con p-1 y T-p-k-1
grados de libertad respectivamente
Test secuencial Universidade
de Vigo

 Se hace el test de Chow global anterior, es decir, se divide la


muestra en dos grupos y se hace una regresión con todos los
datos y otra con cada grupo separado, pero se va cambiando
el punto donde se divide la muestra, por lo que se realiza un
test para cada punto, de ahí que se le denomine secuencial.
 Para cada una de las divisiones se contrastan los modelos I y
IV, o sea que se realiza el test de Chow.
 Los resultados de cada test son los que aparecen en las salidas
correspondientes.
SEQUENTIAL CHOW AND GOLDFELD-QUANDT TESTS
N1 N2 SSE1 SSE2 CHOW PVALUE G-Q DF1 DF2 PVALUE
3 37 0.10407 1.1946 0.16074 0.852 3.049 1 35 0.090
4 36 0.10822 1.1814 0.28848 0.751 1.557 2 34 0.225
5 35 0.14855 1.0684 1.3807 0.264 1.529 3 33 0.225
Universidade
6 34 0.23548 1.0670 0.10728 0.899 1.766 4 32 0.160
de Vigo
7 33 0.25269 1.0573 0.39712E-02 0.996 1.482 5 31 0.224
8 32 0.25273 1.0572 0.37878E-02 0.996 1.195 6 30 0.336
9 31 0.25318 1.0569 0.22874E-02 0.998 0.9924 7 29 0.544
10 30 0.25414 1.0558 0.36368E-02 0.996 0.8424 8 28 0.426
11 29 0.35757 0.91204 0.57610 0.567 1.176 9 27 0.349
12 28 0.41705 0.88467 0.11788 0.889 1.226 10 26 0.321
13 27 0.42210 0.88365 0.61943E-01 0.940 1.086 11 25 0.411
14 26 0.42225 0.88276 0.72211E-01 0.930 0.9566 12 24 0.488
15 25 0.46611 0.81564 0.40009 0.673 1.011 13 23 0.473
16 24 0.59156 0.59202 1.9263 0.160 1.570 14 22 0.167
17 23 0.59218 0.58793 1.9850 0.152 1.410 15 21 0.229
18 22 0.59285 0.57254 2.2373 0.121 1.294 16 20 0.289
19 21 0.59598 0.57024 2.2229 0.123 1.168 17 19 0.369

Test de 20
21
22
20
19
18
0.65001
0.65156
0.70655
0.44490
0.44464
0.44280
3.5401
3.5146
2.5198
0.039
0.040
0.095
1.461
1.311
1.277
18
19
20
18
17
16
0.215
0.290
0.313

Chow
23 17 0.78463 0.42915 1.4307 0.252 1.306 21 15 0.302
24 16 0.79515 0.42220 1.3735 0.266 1.198 22 14 0.371
25 15 0.80674 0.40456 1.4702 0.243 1.127 23 13 0.423
26 14 0.81618 0.37273 1.8370 0.174 1.095 24 12 0.452
en 27
28
13
12
0.81725
0.91346
0.35201
0.30762
2.1703
1.3144
0.129
0.281
1.022
1.142
25
26
11
10
0.510
0.433
29 11 0.91369 0.29363 1.5345 0.229 1.037 27 9 0.510

CENSA 30
31
10
9
0.92380
0.92382
0.25100
0.22642
2.0751
2.5039
0.140
0.096
1.052
0.9849
28
29
8
7
0.508
0.441
32 8 1.0131 0.19806 1.4720 0.243 1.023 30 6 0.543
33 7 1.0138 0.19106 1.5746 0.221 0.8558 31 5 0.347
34 6 1.1252 0.13599 0.69948 0.503 1.034 32 4 0.561
35 5 1.1390 0.13386 0.52931 0.594 0.7735 33 3 0.293
36 4 1.1503 0.12981 0.42434 0.657 0.5213 34 2 0.162
37 3 1.2488 0.58998E-01 0.33249E-01 0.967 0.6048 35 1 0.207
Interacción entre Variables ficticias
en la regresión
Soluciones a la no estabilidad:

Universidade
de Vigo
Planteamiento de la regresión con
variables dicotómicas Universidade
de Vigo

 Para formalizar las regresiones anteriores y por consiguiente la


posible solución en caso de fallar al estabilidad debemos recurrir
a las variables ficticias e introducirlas en la regresión.
 Recordemos que para definirlas debemos partir de una variable
cualquiera C que únicamente puede tomar dos valores A y B de
forma que ambos son excluyentes y exhaustivos. Entonces la
variable ficticia se define como

1 si C = A
IA = 
0 si C = B
Regresión con variables dicotómicas Universidade
de Vigo

 En el caso mas simple, se introduciría en el modelo de


regresión como una variable cualquiera
 Modelo sin variable ficticia

y = β0 + β1 X 1 +L+ βk X k + ε
 Modelo con variable ficticia

y = β0 + β1 X 1 +L+ βk X k + αI A + ε
Efecto de la variable
ficticia
Interacción en la Regresión con
variables dicotómicas Universidade
de Vigo

 Si existe interacción, esto es, las variables ficticias


pueden afectar a las pendientes se deben construir unas
nuevas variables como el producto de las variables
exógenas originales y la variable ficticia. El modelo
entonces quedaría como

y = β0 + β1 X 1 +L+ βX k +
+ α0 I A + α1 IX 1 +L+αk IX k + ε

 X j si t ∈ A
Donde IX j =  j = 1... k
0 si t ∉ A
Regresión con variables
multinomiales Universidade
de Vigo

 Cuando la variable, en vez de dos valores


toma mas, existen diferentes técnicas para
analizar como afecta una variable cualitativa a
una cuantitativa, pero dado que nuestro
interés se centra en las variables ficticias
haremos uso de esa técnica.
 Sea ahora una variable categórica C que
toma s valores diferentes, c1,….cs. Entonces
debemos definir una variable ficticia para
cada uno de los distintos valores.
Trampa de las variables ficticias Universidade
de Vigo

 Sin embargo, a la hora de ver el efecto de


cada categoría sobre una determinada
variable dependiente, no se pueden incluir
todas las variables ficticias en la regresión
 Pues entonces la matriz de regresores,
presentaría una colinealidad perfecta.
 Debido a que la suma de las variables ficticias
es el regresor ficticio (los valores que
representan a la constante).
 Se conoce como trampa de las variables
ficticias
Trampa de variables ficticias en
XUMA Universidade
de Vigo

|_OLS Y X1 X2 FS1 FS2 FS3 FS4


REQUIRED MEMORY IS PAR= 5 CURRENT
PAR= 2000
OLS ESTIMATION
20 OBSERVATIONS DEPENDENT
VARIABLE= Y
...NOTE..SAMPLE RANGE SET TO: 1,
20
...MATRIX INVERSION FAILED IN ROW 7
...THIS USUALLY INDICATES PERFECT
MULTICOLLINEARITY WITH VARIABLE CONSTANT
Solución a la trampa de
las variables ficticias Universidade
de Vigo

 Caben dos soluciones:


 Eliminar la constante
 Eliminar una de las variables ficticias
 La primera opción tiene la ventaja de que cada
coeficiente nos cuantifica el impacto de la variable
ficticia global, aunque se mezcla con el valor
promedio,
 Tiene varios problemas por el hecho de eliminar la
constante de la regresión, pues los residuos ya no
tendrán media nula.
Ficticias en XUMA Universidade
de Vigo

|_OLS Y X1 X2 FS1 FS2 FS3 FS4/NOCONSTANT


REQUIRED MEMORY IS PAR= 5 CURRENT PAR= 2000
OLS ESTIMATION
20 OBSERVATIONS DEPENDENT VARIABLE= Y
...NOTE..SAMPLE RANGE SET TO: 1, 20
R-SQUARE = 0.9752 R-SQUARE ADJUSTED = 0.9663
VARIANCE OF THE ESTIMATE-SIGMA**2 = 0.59977E-01
STANDARD ERROR OF THE ESTIMATE-SIGMA = 0.24490
SUM OF SQUARED ERRORS-SSE= 0.83968
MEAN OF DEPENDENT VARIABLE = 13.708
LOG OF THE LIKELIHOOD FUNCTION = 3.32590
RAW MOMENT R-SQUARE = 0.9998
VARIABLE ESTIMATED STANDARD T-RATIO PARTIAL STANDARDIZED ELASTICITY
NAME COEFFICIENT ERROR 14 DF P-VALUE CORR. COEFFICIENT AT MEANS
X1 0.49868 0.2315E-01 21.55 0.000 0.985 0.9510 0.2150
X2 0.75696E-01 0.2308E-01 3.280 0.005 0.659 0.1556 0.0375
FS1 10.146 0.2576 39.38 0.000 0.996 3.3780 0.1850
FS2 10.117 0.2128 47.55 0.000 0.997 3.3684 0.1845
FS3 10.295 0.2225 Recogen46.28
el efecto de la constante
0.000 0.997 3.4276 0.1878
FS4 10.431 0.2359 repartido
44.22 0.000 0.996 3.4729 0.1902
Trampa de las variables ficticias Universidade
de Vigo

 La segunda alternativa es la que se usa habitualmente, pero la


interpretación de los coeficientes es distinta de la anterior.
 Cada uno de ellos mide conjuntamente el efecto diferencial de esa
categoría respecto al promedio y al efecto de la categoría eliminada.
 Para explicarlo más claramente consideremos un modelo donde sólo
intervengan variables ficticias como regresores, para simplificar.
Efectos aislados Universidade
de Vigo

 El modelo sería

c−1
Y t = β 0 + ∑β jI jt + ε t
j=1

Se observa que hemos eliminado la categoría s, para


hacer la regresión. Si queremos ver el efecto diferencial
de cada categoría sobre el regresando, consideremos la
siguiente notación.
Efectos de cada categoría Universidade
de Vigo

 En algunos casos interesa analizar el efecto de cada categoría


independientemente y no respecto a una de ellas.
 En ese caso se puede hacer una transformación posterior.
Efectos aislados de los β Universidade
de Vigo

• Sea µ el efecto promedio de las categorías sobre el


regresando y sea αj el efecto diferencial respecto al
promedio de la categoría cj sobre el regresando. Entonces
debe verificarse que

β0 = µ + αc
βj = αj − αc
c

∑α
j =1
j =0
Efectos aislados de los α Universidade
de Vigo

c−1
 Despejando se obtiene que ∑β j

αc = − j=1

c
c −1

∑β j

α j = βj −
j=1

c
c −1

∑β j

µ = β0 − j=1

c
Regresión con variables
multinomiales Universidade
de Vigo

 En el caso mas simple, se introduciría en el modelo de regresión


cada una de las variables ficticias definidas como una variable
cualquiera. Suponiendo s categorías

y = β0 + β1 X 1 +L+ βk X k +
+ α1 I1 +L+αs −1 I s −1 + ε
Regresión con variables ficticias en
XUMA Universidade
de Vigo

|_OLS Y X1 X2 FS1 FS2 FS3


REQUIRED MEMORY IS PAR= 5 CURRENT PAR= 2000
OLS ESTIMATION
20 OBSERVATIONS DEPENDENT VARIABLE= Y
...NOTE..SAMPLE RANGE SET TO: 1, 20
R-SQUARE = 0.9752 R-SQUARE ADJUSTED = 0.9663
VARIANCE OF THE ESTIMATE-SIGMA**2 = 0.59977E-01
STANDARD ERROR OF THE ESTIMATE-SIGMA = 0.24490
SUM OF SQUARED ERRORS-SSE= 0.83968
MEAN OF DEPENDENT VARIABLE = 13.708
LOG OF THE LIKELIHOOD FUNCTION = 3.32590
VARIABLE ESTIMATED STANDARD T-RATIO PARTIAL STANDARDIZED ELASTICITY
NAME COEFFICIENT ERROR 14 DF P-VALUE CORR. COEFFICIENT AT MEANS
X1 0.49868 0.2315E-01 21.55 0.000 0.985 0.9510 0.2150
X2 0.75696E-01 0.2308E-01 3.280 0.005 0.659 0.1556 0.0375
FS1 -0.28485 0.1743 -1.635 0.124-0.400 -0.0948 -0.0052
FS2 -0.31390 0.1601 -1.961 0.070-0.464 -0.1045 -0.0057
FS3 -0.13611 0.1563 -0.8709 0.398-0.227 -0.0453 -0.0025
CONSTANT 10.431 0.2359 44.22 0.000 0.996 0.0000 0.7609
Interpretación Universidade
de Vigo

 Las pendientes se interpretan igual, pero ahora sería el efecto


independientemente del sector
 La constante β0 sería el coste fijo en la categoría s, la que
queda ausente del modelo
 La suma de β0 y αι sería el efecto fijo en la categoría i
 Por tanto αι mide la diferencia entre los efectos de la
categoría i y la s.
Interacción en la Regresión con
variables multinomiales Universidade
de Vigo

 Si existe interacción, esto es, las variables ficticias pueden


afectar a las pendientes se deben construir unas nuevas
variables como el producto de las variables exógenas originales
y las variables ficticias. El modelo entonces quedaría como

y = β0 + β1 X 1 +L+ βX k +
+ α0 I A + α11 IX 11 +L+αs −1k IX s −1k + ε

 X j si t ∈ Cl
Donde IX lj =  j = 1... k ; l = 1... s − 1
0 si t ∉ A
Interacciones en XUMA Universidade
de Vigo

|_GENR IS21=FS2*X1
|_GENR IS22=FS2*X2
|_OLS Y X1 X2 FS2 IS21 IS22
REQUIRED MEMORY IS PAR= 6 CURRENT PAR= 2000
OLS ESTIMATION
20 OBSERVATIONS DEPENDENT VARIABLE= Y
...NOTE..SAMPLE RANGE SET TO: 1, 20
R-SQUARE = 0.9722 R-SQUARE ADJUSTED = 0.9623
VARIANCE OF THE ESTIMATE-SIGMA**2 = 0.67102E-01
STANDARD ERROR OF THE ESTIMATE-SIGMA = 0.25904
SUM OF SQUARED ERRORS-SSE= 0.93943
MEAN OF DEPENDENT VARIABLE = 13.708
LOG OF THE LIKELIHOOD FUNCTION = 2.20337
VARIABLE ESTIMATED STANDARD T-RATIO PARTIAL STANDARDIZED ELASTICITY
NAME COEFFICIENT ERROR 14 DF P-VALUE CORR. COEFFICIENT AT MEANS
X1 0.51733 0.2560E-01 20.21 0.000 0.983 0.9866 0.2230
X2 0.68416E-01 0.2619E-01 2.612 0.020 0.572 0.1407 0.0339
FS2 0.22659 0.4766 0.4754 0.642 0.126 0.0754 0.0041
IS21 -0.80899E-01 0.9314E-01 -0.8686 0.400-0.226 -0.1511 -0.0078
IS22 0.59235E-02 0.5941E-01 0.9971E-01 0.922 0.027 0.0136 0.0007
CONSTANT 10.228 0.2726 37.52 0.000 0.995 0.0000 0.7461

Vous aimerez peut-être aussi