Vous êtes sur la page 1sur 21

Econometra bsica

Multicolinealidad

CAPITULO 5
MULTICOLINEALIDAD

5.1 NATURALEZA DEL PROBLEMA


La multicolinealidad implica la existencia de una relacin lineal exacta
entre algunas y/o la totalidad de las variables explicativas. Esta ltima es
la denominada multicolinealidad perfecta.
Asumiendo el siguiente modelo:
Yi 1 2 X 2 i 3 X 3i ... k X ki i

[5.1]

Donde:

E ( i ) 0
E ( i , j ) 0

E ( i2 ) u2

Estrictamente, multicolinealidad perfecta implica que:


2 X 2i 3 X 3i ... k X ki 0

[5.2]

El caso ms sencillo de multicolinealidad es aquel en la que dos de las


variables explicativas estn perfectamente correlacionadas. 1Es decir, se
tiene por ejemplo que:

Ya que esta situacin implica la relacin de dos variables por lo general se le atribuye la denominacin de
colinealidad.

Econometra bsica

Multicolinealidad

2 X 2 i 3 X 3i 0

[5.3]

La multicolinealidad, es un problema, por que tiene implicancias negativas


en la estimacin de los parmetros de un determinado modelo. Esto
quiere decir que si existe Multicolinealidad perfecta la estimacin de los
parmetros correspondientes no ser posible. Por ejemplo, dado el
siguiente modelo:
Yi 1 2 X 2i 3 X 3i i

[5.4]

E ( i ) 0
E ( i , j ) 0

E ( i2 ) u2

Si se cumple que,
X 2 X 3i 0

[5.5]

Reemplazando [5.5] en [5.4] se tiene,


Yi 1 2 X 3i 3 X 3i i

Yi 1 ( 2 3 ) X 3i i

[5.6]

En la anterior relacin, slo ( 2 3 ) es estimable. Es decir, no es


posible separar la influencia lineal de las variables exgenas sobre la
variable endgena, de modo que es imposible estimar los parmetros
separados de 2 y 3 .
Efectivamente, es posible mostrar que existen problemas de estimacin
utilizando las frmulas convencionales de estimacin de los parmetros
de la relacin [5.4]. Segn el modelo lineal general se tiene:
X 'Y ( X ' X ) B

yi

3i y i

2i

x
x x

Utilizando [5.5]

2
2i

2i

x x
x
3i

3i

2
3i

2i

2

3

[5.7]

Econometra bsica

Multicolinealidad

x 2 i x 3i

Reemplazando en [5.7]
2
x 3i y i
2

x 3i

x 3i y i

2

3

[5.8]

Obsrvese que
2

Por tanto, no es posible calcular 2 y 3 simultneamente ya que existe


dentro de las ecuaciones normales una redundante. Es decir, existe una
ecuacin normal que se deduce de la otra ecuacin normal. De la relacin
[5.8] se tiene:
x3i y i 2 2 x32i 3 x32i

3i

y i 2 x32i 3 x32i

Ntese que la primera ecuacin se deduce de la primera ecuacin


multiplicndolo por .
As slo tenemos una ecuacin normal
linealmente independiente y dos parmetros por estimar lo cual
matemticamente resulta imposible.
En la prctica, sin embargo, el problema de multicolinealidad se presenta
en todos los grados. Normalmente, lo que encontramos es
multicolinealidad menos perfecta. Es decir, existe alguna relacin lineal no
exacta entre las variables exgenas de la forma siguiente:
2 X 2i 3 X 3i ... k X ki vi 0

En este caso la estimacin correspondiente de los parmetros si es


posible. An cuando esta estimacin sea posible la implicancia de la
multicolinealidad es fundamentalmente que los parmetros estimados

Econometra bsica

Multicolinealidad

tendrn varianzas grandes.2 Por ejemplo, para el modelo dado por [6.4] su
varianza es:
VAR ( 2 )

U2
x 22i (1 r232 )

U2
VAR ( 3 )
x32i (1 r232 )
En estas frmulas dadas, si existe una relacin lineal entre las variables
2
exgenas de forma que r23 es cercano a uno es fcil percibir que las
varianzas de los coeficientes de regresin sern grandes.
5.2 CONSECUENCIAS
Por un lado, en presencia de multiocolinealidad aun cuando los
coeficientes de regresin tienen varianzas grandes 3 es necesario destacar
que no se viola las propiedades estadsticas deseables de los
estimadores obtenidos mediante el mtodo de mnimos cuadrados
ordinarios.4
Por otro lado, es posible tericamente mantener el criterio de que en un
modelo poblacional, las variables explicativas no se encuentran
linealmente relacionadas y posteriormente encontrar para una muestra
determinada, que si lo estn. Por tanto, la multicolinealidad se reducira
fundamentalmente a un problema muestral.
De modo que frente a un problema de multicolinealidad en la prctica nos
enfrentamos a las siguientes consecuencias:
a) Variancias y covariancias grandes para los estimadores mnimos
cuadrticos.
b) Intervalos de confianza sustancialmente amplias
c) "t" de student no significativas.
d) Valor elevado de R2 con "t" de student no significativas.
e) Alto grado de sensibilidad de los estimadores mnimo cuadrticos y
sus errores estndar ante cambios pequeos en los datos.
5.3 DETECCION
2 En general, la multicolinealidad tiene como efecto que sea difcil separar con exactitud las influencias respectivas de
las variables explicativas (exgena) sobre la variable explicada (endgena).

3 tericamente el problema de multicolinealidad es similar a un problema de reducidas observaciones, en el que


tambin los parmetros estimados tienen varianzas grandes
4 Asumiendo el modelo dado en (4.6) es posible mostrar que los estimadores mnimo cuadrticos siguen siendo los
mejores estimadores, lineales, insegados y ptimos. El hecho de que un estimador tenga una variancia grande no
implica que no sea mnimo.

Econometra bsica

Multicolinealidad

En general, es complicado identificar el grado de multicolinealidad, en


especial en aquellos modelos en el que estn involucrados ms de dos
variables exgenas. Por ello es que solo se cuenta con algunas reglas
generales que implican un sntoma de multicolinealidad, como las
siguientes:
a) Un R2 alto pero pocas "t" de student significativas. 5
b) Altas correlaciones de orden cero entre las variables exgenas. 6
c) Coeficientes de determinacin mltiple elevados y coeficientes de
correlacin parcial bajos.
d) Determinante de la matriz de correlacin de las variables exgenas
aproximadamente igual a cero.
e) Alta sensibilidad de los coeficientes parciales de regresin y de sus
errores estndar frente a algunos cambios no sustanciales en los
valores numricos de alguna variable exgena.
En algunos casos, conviene realizar regresiones auxiliares entre las
variables exgenas. As podemos calcular el coeficiente de determinacin,
R 2 , y realizar una prueba de hiptesis de significancia global. Por
ejemplo, si estamos frente a un modelo de 4 variables exgenas ( X 2i ,
X 3i , X 4i y X 5i ) debemos adoptar el siguiente procedimiento:
Efectuar la regresin X 2i 0 3 X 3i 4 X 4i 5 X 51
Calcular el coeficiente de regresin mltiple: R22.345
Determinar el estadstico

FC

R22.345 /( k 2)
(1 R22.345 ) /( N k 1)

El cual posee distribucin FC con k-2 y N-k+1 grados de libertad.


Realizar la prueba de hiptesis:
HO :

Ha :

3 4 5 0
3 4 5 0

Si F (de tablas) excede al FC a un nivel de significancia escogido, se


dice que X 2 es colineal con X 3i , X 4i y X 5i
5 Si resulta que, excluyendo del modelo una variable explicativa de un par dado de ellas, la que queda es significativa,
pero que cuando se incluye el par las dos no son significativas, es tambin evidencia de multicolinealidad.

6 Este no es un mtodo infalible. Por ejemplo, si estamos frente a un modelo Y i=1+2X2+3X3+4X4+Ui. Si resulta que
X2+X3=X4 tendramos una situacin de multicolinealidad perfecta. No obstante, los coeficientes de correlacin simple
entre cualquier par de estas X seran bastante bajos.

Econometra bsica

Multicolinealidad

Si F (de tablas) no excede al FC a un nivel de significancia escogido, se


dice que X 2 no es colineal con X 3i , X 4i y X 5i . En este caso debemos
retener la variable X 2 en el modelo especificado.7
f) Existen otras reglas generales ms sofisticadas, como por ejemplo, el
de valores caractersticos e ndice de condicin, que aparentemente
es el mejor instrumento de dignstico del problema de
multicolinealidad.
5.4 MEDIDAS REMEDIALES
Puesto que el problema de multicolinealidad es un problema
esencialmente muestral no existe guas infalibles para remediarlas as
como para detectarlas. Sin embargo, general se pueden adoptar las
siguientes medidas remediales:
a)
b)
c)
d)
e)
f)
g)

Utilizar informacin a priori.


Combinacin de series de corte transversal y de series de tiempo.
Eliminacin de algunas variables.
Transformacin de variables.
Aadir datos nuevos o adicionales.
Utilizar la tcnica de polinomios ortogonales.
Utilizar la tcnica de anlisis factorial y la de componentes principales.

CONCLUSION
En presencia de multicolinealidad, siendo el R 2 alto, si el objetivo no
es obtener la estimacin confiable de los parmetros, sino la
prediccin, entonces este problema no es necesariamente mala.
Siendo el problema el problema de multicolinealidad un problema de
grado no es inmediatamente detectable de forma numrica.
Para detectar el problema de multicolinealidad no existen mtodos
seguros solamente algunas reglas generales. Por ello en algunos
casos mediante un mtodo determinado es posible que se muestren
que existe multicolinealidad y en otros no.
La multicolinealidad menos que perfecta es un problema de datos
defectuosos. En general, en economa generar un conjunto de datos
adicionales es complicado por ello su solucin suele apuntar con ms
frecuencia a obtener ms datos enfrentando el problema de
multicolinealidad como un problema de nmero de observaciones
reducidas.
7 Si el FC

es estadsticamente significativo es necesario consideraciones adicionales a fin de decidir si la variable X 2


se debe eliminar o no del modelo.

Econometra bsica

Multicolinealidad

ANEXO E
NOCIONES BASICAS DE EVIEWS 3.1
MULTICOLINEALIDAD
5.1 PRUEBA DE MULTICOLINEALIDAD IMPERFECTA
a) Sntomas clsicos del problema

Econometra bsica

Multicolinealidad

Estando en el Workfile8

Seleccionar la variable endgena seguida de las exgenas


presionando la tecla ctrl.
Seleccionar Open/as Equation
En la ventana activa (Equation Specification) pulsar OK.
Asignarle un nombre al objeto ecuacin: EQ01

Anlisis de los resultados:

El coeficiente de determinacin es relativamente alto


Con base a la prueba t, existen tres coeficientes de regresin parcial
estadsticamente no significativos al nivel de significancia del 5%.
Con base en la prueba F, se rechaza la hiptesis de que todos los
parmetros de regresin parcial simultneamente son iguales a cero.
Existen indicios o seales de multicolinealidad.

b) Examen de los coeficientes de correlacin simple


Estando en la ventana del objeto ecuacin:

Seleccionar Procs/Make Regressor Group


Estando en la ventana del objeto grupo:

Seleccionar View/Correlations

8 Para esta seccin utilice el Archivo en formato Eviews: Capitulo 5_Multicolinealidad

Econometra bsica

Multicolinealidad

Anlisis de los resultados:

Existe hasta tres coeficientes de correlacin de orden cero, superiores


a 0.8 (PBIR-CSP, PBIR-RIN, CSP-RIN)
Puesto que, las correlaciones de orden cero son elevadas, y siendo
esta una condicin necesaria pero no suficiente para la existencia de
multicolinealidad, existen indicios de multicolinealidad.

c) Clculo del determinante de la matriz de correlacin


Estando en la ventana del objeto grupo:

Seleccionar View/Group Members


Borrar la variable endgena
Actualizar los miembros del grupo (Pulsar UpdateGroup)
Nombrar el nuevo grupo seleccionado (Group01)

En la lnea de comandos escribir:


Sym mcorrel=@cor(Group01)

Econometra bsica

Multicolinealidad 10

En la lnea de comandos escribir:


Scalar detmcorrel=@det(mcorrel)

Anlisis de los resultados:

El determinante de la matriz de correlaciones de las variables


exgenas est cercano a cero.
Si la correlacin entre cada par de variables exgenas es igual a 1, el
determinante de R es igual a cero; y, alternativamente, si la
correlacin fuera cero, el determinante de la matriz R es igual a 1.
Entonces, se deduce que el grado de multicolinealidad parece
considerable.

Econometra bsica

Multicolinealidad 11

d) Analizar la significacin individual y conjunta de las variables


exgenas.
Estando en el objeto ecuacin EQ01:

Procs/Specify/Estimate
Realizar sendas regresiones entre el total de variables exgenas
Introducimos los cambios deseados haciendo que
alternativamente cambie una variable exgena a endgena.

Anlisis de los resultados:

En un modelo de regresin simple, tanto el coeficiente del GG como


de las RIN, resultan ser estadsticamente significativas
En un modelo conjunto, donde las variables explicativas son el GG y
las RIN, los coeficientes de regresin parcial resultan tambin ser
estadsticamente significativas.
En un modelo conjunto, donde las variables explicativas son el GG,
PBIR, CSP y las RIN, slo el coeficiente de regresin parcial del GG
resulta ser estadsticamente no significativa.
En un modelo conjunto, donde las variables explicativas son el GG y el
TCR, los coeficientes de regresin parcial son estadsticamente
significativas. Es decir, la no significancia estadstica del coeficiente
del GG, en el anterior modelo, al parecer se debe a que est
probablemente relacionada con alguna de las variables o todas las
que le acompaan.
En un modelo conjunto, donde las variables explicativas son el GG,
CSP y las RIN, slo el coeficiente de regresin parcial del CSP resulta
ser estadsticamente no significativa.
En un modelo conjunto, donde las variables explicativas son el PBIR,
CSP y las RIN, todos los coeficientes de regresin parcial resultan ser
estadsticamente significativas.
En un modelo conjunto, donde las variables explicativas son el GG,
PBIR y las RIN, los coeficientes de regresin parcial del GG y del
PBIR resultan ser estadsticamente no significativas.
En un modelo conjunto, donde las variables explicativas son el GG,
PBIR y el CSP, todos los coeficientes de regresin parcial resultan ser
estadsticamente significativas.
Siendo la variable GG en casi todas las regresiones estadsticamente
significativa existen indicios de que esta variable es superflua y por
tanto generadora de la presencia de multicolinealidad.

e) Reestimar con algunas observaciones menos y ver si se


producen grandes cambios en los valores numricos y en el
signo de las estimaciones.
Estando en la ventana de workfile:

Econometra bsica

Multicolinealidad 12

Con el ratn pulsar dos veces sobre el icono de EQ01

Estando en la ventana del objeto ecuacin:

Pulsar Procs/Especify Estimate


En la ventana activa cambiar la muestra: 1993.01 2003.08
Pulsar OK

Anlisis de los resultados:

No se produce cambios en los signos de los coeficientes de regresin


parcial.
Existen algunos cambios cuantitativos que nos indican la presencia de
multicolinealidad.

f) Examen de correlaciones parciales

Calcular las siguientes correlaciones parciales:


R M CSP . PBI GG RIN TCR

= 0.30113286
R M PBI .CSP GG RIN TCR
= 0.34898567
R M GG .CSP . PBI RIN TCR = 0.11087831
R M RIN .CSP PBI GG TCR
= 0.03778889
RM TCR . PBI CSP GG RIN
= - 0.63929805
Ejemplo para calcular RM TCR . PBI CSP GG RIN :
Estando en el Workfile

Seleccionar la variable endgena (M) seguida de las exgenas


(CSP,GG,PBIR,RIN) presionando la tecla ctrl.
Seleccionar Open/as Equation

Econometra bsica

Multicolinealidad 13

En la ventana activa (Equation Specification) pulsar OK.


Cerrar la ventana del objeto ecuacin

Estando en el Workfile

Seleccionar el comando Genr


En la ventana activa, escribir la ecuacin: e1=resid
Pulsar OK

Estando en el Workfile

Seleccionar la variable exgena (TCR) seguida de las exgenas


(CSP,GG,PBIR,RIN) presionando la tecla ctrl.
Seleccionar Open/as Equation
En la ventana activa (Equation Specification) pulsar OK.
Cerrar la ventana del objeto ecuacin

Econometra bsica

Multicolinealidad 14

Estando en el Workfile

Seleccionar el comando Genr

En la ventana activa, escribir la ecuacin: e2=resid

Pulsar OK

Estando en el Workfile

Seleccionar el objeto serie e1 seguida del objeto serie e2 presionando


la tecla ctrl.
Seleccionar Open/as Equation
En la ventana activa (Equation Specification) pulsar OK.

Econometra bsica

Multicolinealidad 15

Estando en el objeto ecuacin anterior:

En la lnea de comandos escribir scalar r1=0.408702^0.5


Visualizar dicho coeficiente de correlacin parcial haciendo doble
click sobre el cono del escalar r1. Recuerde que el signo del
coeficiente de correlacin parcial es igual del coeficiente de regresin
parcial asociado.

Anlisis de los resultados:

Frente a un coeficiente de determinacin mltiple alto (superior a 0.8)


se tiene coeficientes de correlacin parcial bajos (menor a 0.13) a
excepcin de una (0.408702).
Es probable que exista multicolinealidad entre las variables GG, PBIR,
RIN y CSP y que por lo menos una de estas variables es superflua.

g) Regresiones auxiliares
Estando en el Workfile

Seleccionar una variable exgena (GG) seguida del resto de variables


exgenas (CSP,PBIR,RIN, TCR) presionando la tecla ctrl.
Seleccionar Open/as Equation
En la ventana activa (Equation Specification) pulsar OK.

Econometra bsica

Multicolinealidad 16

Anlisis de los resultados:

Todas las variables exgenas son colineales con el resto de variables


exgenas.
Dado que la variable GG y la variable RIN son altamente colineales
con el resto de variables es necesario evaluar la posibilidad de
eliminarlas previa evaluacin de su relevancia.

h) Clculo de los factores de tolerancia de la varianza


Estando en el Workfile

Seleccionar una variable exgena (RIN) seguida del resto de


variables exgenas (CSP,GG,PBIR,TCR) presionando la tecla ctrl.

Seleccionar Open/as Equation

En la ventana activa (Equation Specification) pulsar OK.

Econometra bsica

Multicolinealidad 17

Estando en la ventana del objeto ecuacin:

En la lnea de comandos digitar scalar IT 1 0.928403


En la lnea de comandos digitar scalar FIV 1 / IT
Con el ratn pulsar dos veces sobre el icono del escalar IT y FIV y
visualizar 0.071597 y 13.9670656592 respectivamente.

Anlisis de los resultados:

Como FIV es superior a 10 existe las variables exgenas muestran la


presencia de multicolinealidad alta.

i) Valores propios e ndice de condicin


En la lnea de comandos escribir sucesivamente

Group Group02 1 GG CSP PBI RIN TCR

Sym XX=@inner(Group02)

Vector VP=@eigenvalues(XX)
Con el ratn pulsar dos veces sobre el icono de VP, y en la lnea de
comandos escribir sucesivamente.

Scalar k1=1.95E+10/0.313803
= 62,140897,314.6
Scalar IC1=k1^0.5
= 249,280.760017

Con el ratn pulsar dos veces sobre el icono de IC.


Anlisis de los resultados:

Al pulsar con el ratn dos veces sobre el icono de IC nuestras


conclusiones respecto a la multicolinealidad son sesgadas.
Se recomienda normalizar las columnas de XX dividiendo la
mencionada matriz por la raz cuadrada de su diagonal principal.

En la lnea de comandos escribir sucesivamente

Vector V=@getmaindiagonal(XX)

Sym MD=@makediagonal(V)

Sym S=@inverse(sqr(MD))

Sym XXn=S*XX*S

Vector VPRO=@eigenvalues(XXn)
Con el ratn pulsar dos veces sobre el icono de VPRO, y en la lnea de
comandos escribir sucesivamente.

Scalar k2=5.867601/0.001040
= 5641.92403846

Econometra bsica

Multicolinealidad 18

Scalar IC2=(k2)^0.5
= 75.1127421844

Anlisis de los resultados:

Existe una multicolinealidad severa.

5.2 SOLUCION DE LA MULTICOLINEALIDAD IMPERFECTA


a) Eliminacin de una variable

b) Transformacin de variables
Una de las razones por la cual existe alta multicolinealidad entre las
variables es que en el tiempo estas tienden a moverse en la misma
direccin. Se puede reducir el grado de dependencia recurriendo al
siguiente procedimiento:
S la relacin:

Econometra bsica

Multicolinealidad 19

M t 1 2 CSPt 3 PBIRt 4 GGt 5 RIN t 6TCRt t

Se cumple para el periodo t, tambin puede cumplirse para el periodo t-1,


entonces:
M t 1 1 2 CSPt 1 3 PBIRt 1 4 GGt 1 5 RIN t 1 6TCRt 1 t 1 Si se

resta, la primera menos la segunda, se obtiene la siguiente relacin a


estimar:
M t 1 2 CSPt 1 3 PBIRt 1 4 GGt 1 5 RIN t 1 6 TCRt 1 t 1

Estando en el Workfile

Pulsar el comando GENR del men correspondiente


En la ventana activa escribir:
DM=M-M(-1)
Pulsar OK
Anlogamente, transformar el resto de variables exgenas en sus
primeras diferencias.

Estando en el Workfile
Seleccionar la variable endgena transformada (DM) seguida del resto
de variables exgenas transformadas
(DCSP,DGG,DPBIR,DTCR,DRIN) presionando la tecla ctrl.

Seleccionar Open/as Equation

En la ventana activa (Equation Specification) suprimir la c

pulsar OK.

Econometra bsica

Multicolinealidad 20

ANEXO C
Varianza del coeficiente de Regresin Parcial
Considerando el siguiente modelo:
Yi 1 2 X 2i 3 X 3i 4 X 4i i

Dado una muestra, segn el mtodo de mnimos cuadrados ordinarios, la


formula para estimar sus parmetros correspondientes es:
B ( X ' X ) 1 X ' Y

y su varianza:
var( B ) ( X ' X ) 1 u2

Esta ltima se puede escribir como:

var( B ) x x
x x

x x
x
x x

2
2i

2i

3i

2i

4i

2i

x x
x x
x

3i

2
3i

4i

4i

3i

4i

2
4i

3i

2i

u2

De donde:

x
x x
x x
x
x
x x x x
x x
x
x x
x x x x
x
2
3i

var( 2 )

4i

2
2i

3i

4i

3i

3i

2i

3i

2
3i

2i

2i

4i

2
4i

4i

2
u

2i
3i

3i

4i
4i

2
4i

nS 3 S 3 r33 nS 3 S 4 r34 2
u
nS 4 S 3 r43 nS 4 S 4 r44

var( 2 )
nS 2 S 2 r22 nS 2 S 3 r23 nS 2 S 4 r24
nS 3 S 2 r32
nS 4 S 2 r42

nS 3 S 3 r33
nS 4 S 3 r43

nS 3 S 4 r34
nS 4 S 4 r44

Econometra bsica

var( 2 )

n S3S4
n3S2 S3S4

Multicolinealidad 21
S3
S 4 r34
S 3 r43
S4
u2
S2
S 3 r23 S 4 r24
S 2 r32
S 2 r42

1
var( 2 )
nS 2

S 3 r33
S 3 r43

S3
S 3 r43

S 4 r34
S4

S2
S 2 r32

S 3 r23
S3

S 4 r24
S 4 r34

S 2 r42

S 3 r43

S4

S 4 r34
S4

u2

S 3 S 4 (1 r342 )
1

var( 2 )
u2
2
nS 2 S 2 S 3 S 4 (1 r34 ) S 2 S 3 S 4 r23 ( r23 r34 r24 ) S 2 S 3 S 4 r24 (r23 r34 r24 )
var( 2 )

(1 r342 )
1
u2
2
2
nS 2 (1 r34 ) r23 (r23 r34 r24 ) r24 (r23 r34 r24 )

var( 2 )

(1 r342 )
1
u2
2
2
2
2
x 2i (1 r34 ) [r23 r23 r34 r24 r24 r23 r34 r24 )

var( 2 )

1
1
[
] u2
2
2
2
2
x
(
1

r
)

[
r

r
r
r

r
r
r

r
)
2i
34
23
23 34 24
24 23 34
24
2
(1 r34 )

var( 2 )

1
1
[
] u2
2
2
2
x 2i 1 [r23 2r23 r34 r24 r24 )
(1 r342 )

var( 2 )

1
1
[
] u2
2
2
x 2i 1 R2.34

var( 2 )

u2
x 22i (1 R22.34 )

Vous aimerez peut-être aussi