Vous êtes sur la page 1sur 16

Ph.D. Rafael Arce M., Escuela de Geografa, UCR. 25/04/2016.

Curso GF-0102 Anlisis Espacial

Tema 6. Prediccin espacial mediante modelos


de regresin convencionales y geogrficos.
Rafael Arce Mesn
Escuela de Geografa, Universidad de Costa Rica
Febrero, 2015.

Introduccin:

La correlacin entre dos variables, y la autocorrelacin espacial de una variable consigo misma
pero con un desplazamiento en el espacio, pueden ser representadas de forma grfica mediante
Diagrama de dispersin del Calcio y Potasio un diagrama de dispersin
1.2
(Figura 1), o pueden ser medidas
y = 0.0208x + 0.1487
R = 0.5697 mediante ndices de correlacin
1
o autocorrelacin numricos,
0.8 tales como R de Pearson o I de
Moran. Cabe preguntarse: Hay
Potasio

0.6
K (X3) forma de predecir el valor de
Lineal (K (X3))

0.4
una variable a partir del
conocimiento de otra variable
0.2 con la que est correlacionada?.

0
0 5 10 15 20 25 30 35 40
La respuesta es s; para ello lo
Calcio que se hace es ajustar un modelo
Figura 1. Regresin bivariada entre el Potasio (regresando), y el Calcio de regresin entre las dos
(regresor). variables. El tipo ms comn y
simple es una regresin lineal
AGCS de tipo:
70.0

60.0 Y = a0 + a1X +
y = -6.616ln(x) + 62.67
50.0
R = 0.5266
Donde: Y es conocida como la
40.0
variable dependiente o
AGCS

30.0
"regresando"; X es la variable
independiente o regresor;
20.0

10.0
representa los residuos de la
0.0
0.00 5000.00 10000.00 15000.00 20000.00 25000.00
regresin. Adems, a0 y a1 son
-10.0
Densidad coeficientes que deben ser
calculados.
Figura 2. Regresin logartmica entre las variables AGCS (regresando) y la
variable Densidad (Regresor).

1
Ph.D. Rafael Arce M., Escuela de Geografa, UCR. 25/04/2016.

Debe indicarse desde ya que no siempre el modelo lineal es el que mejor describe la relacin entre
dos variables, existiendo otros modelos simples, como: regresiones polinmicas, regresin
logstica; regresin logartmica, regresin exponencial; regresin potencial, etc. La figura 2 ilustra
un caso de ajuste mediante una regresin logartmica. Claramente la relacin no es lineal y, con
regresin logartmica se logra ajustar el modelo regresivo pero se debe tener cuidado al escoger el
modelo, pues en este caso lleva a estimaciones negativas del ndice AGCS, lo cual no es posible.!

Regresin lineal mltiple ordinaria por mnimos cuadrados (OLS: Ordinary Least Squared):

De manera anloga a lo ilustrado para dos variables (Figura 2), es posible fijar una regresin lineal
con mltiples variables independientes y una sola variable dependiente. A menudo esto es
necesario porque en la naturaleza todo est relacionado con todo, de modo que casi cualquier
evento de inters ser el resultado de numerosos otros eventos subyacentes que actan como sus
variables causales.

Para tres variables, el


modelo OLS tiene la
apariencia que se muestra
en la figura 3.

Cada una de las variables


representa un eje en el
sistema de coordenadas
cartesianas tridimensional.
La combinacin P(xi,yi,zi)
define un punto en el
espacio tridimensional,
Figura 3. Plano de regresin Z = f(X,Y) y coeficientes de regresin 0, 1 y 2.
donde (i) se refiere a una
tripleta de datos relacionados, mientras (X,Y,Z) (X1, X2, X3) son las tres variables consideradas.
Por costumbre la variable independiente (Z) o regresando se suele representar en el eje "z", o
como se denota en la figura, el eje "Y", habiendo usado un X1, X2 para definir el plano horizontal.
Note que as como fue definido un plano matemtico (Z) sobre el plano (X,Y), a partir de las
observaciones discretas (puntuales) que se poseen, es posible definir un plano matemtico (X)
sobre el plano definido por (YZ), o un plano matemtico (Y) sobre el plano definido por las
coordenadas ordenadas (XZ).

Note que 0 es la interseccin del plano matemtico de la variable (Z) sobre el plano definido por
las variables (XY) en la ubicacin (X0,Y0); 1 y 2 pueden ser vistas en un modelo geomtrico como
las pendientes del plano matemtico (Z) a lo largo de los ejes (XY) o de forma ms general, como
una medida de la fortaleza y tipo de relacin. Si 1 o 2 se hacen cero, esto indica que el valor de
(Z) no es sensible a dicha variable y por tanto dicha variable no debe ser utilizada en la prediccin

2
Ph.D. Rafael Arce M., Escuela de Geografa, UCR. 25/04/2016.

de (Z). En la situacin particular cuando 1 y 2 tienen valor cero, Z = f(X,Y) toma el valor constante
0.

En la figura 3 se representan tambin los residuos () como lneas que conectan cada punto
P(xi,yi,zi) con el plano (Z), los cuales representan las diferencias entre el valor observado (Zi) en
cada localidad del espacio (XYZ) y el valor predicho para dicha localidad por el modelo Z = f(XY).

En forma generalizada, la ecuacin de regresin mltiple es:

Y = 0 + 1X1 + 2X2 + 3X3 + ... + nXn +

Donde: Y es la variable dependiente o regresando y Xi son variables independientes o regresores.


Los coeficientes i son valores desconocidos que se obtienen resolviendo un sistema de (n+1)
ecuaciones lineales. Como antes, , son los residuos o diferencias entre valores observados y
valores estimados por la regresin.

En forma matricial explcita, la ecuacin de regresin es:

Fuente: https://onlinecourses.science.psu.edu/stat501/node/382

Aunque la ecuacin de regresin Z = f(XY) es un modelo predictivo, su calibracin requiere de un


mnimo de (n+1) conjuntos de observaciones de las variables Y y Xi. En la prctica siempre es
mejor calibrar el modelo Z = f(XY) usando una muestra sustancialmente ms grande que el mnimo
mediante una tcnica conocida como ajuste por mnimos cuadrados, que en esencia permite
determinar la pendiente de la superficie multidimensional que minimiza la suma del cuadrado de
los residuos entre valores observados y valores predichos. Una vez calibrado, el modelo especfico
Z = f(XY) puede ser usado para predecir valores (Z) conociendo nicamente sus valores (XY).

Es posible resolver Y = X , asumiendo temporalmente que = 0, calculando los valores de en un


segundo momento.

Los coeficientes se obtienen haciendo:

i = (XT X)-1 XT z

Cada valor Zi se obtiene con la expresin matricial:

3
Ph.D. Rafael Arce M., Escuela de Geografa, UCR. 25/04/2016.

yi = Xi *

Donde Xi es cada vector fila de la matriz X y es el vector columna de los coeficientes de


regresin.

Regresin lineal mltiple local ponderada geogrficamente (GWR: Geographically Weighted


Regression):

La regresin OLS descrita es no espacial, en el sentido de que puede hallarse un modelo de


regresin Z = f(XY) muy slido para una regin, pero que cuando se aplica a otra regin fracasa
completamente ya que los coeficientes calculados no son de valor universal. Esta situacin se
explica porque el modelo de regresin establecido es global; se ajust a la totalidad de datos
disponibles y no tiene en cuenta de forma explcita la localizacin de cada dato en el espacio.

Como alternativa, existen modelos de regresin anlogos que son localizados (locales, no
globales), que toman en cuenta de forma explcita la localizacin de los datos en el proceso de
anlisis. Dichos modelos de regresin son conocidos como Modelos de Regresin Ponderados por
la Geografa.

La ecuacin general del modelo GWR es:

Y(si) = 0 (si) + 1(si)X1 + 2(si)X2 + 3(si)X3 + ... + n(si) Xn +

Donde (si) se refiere a la localizacin de los elementos de la muestra que ser utilizada para
calibrar la ecuacin de regresin.

Aunque es importante conocer la localizacin absoluta (en coordenadas) de los elementos de la


muestra que permitir calibrar la ecuacin de regresin, en la prctica, siguiendo la "primera ley
de la geografa", lo importante es la ubicacin relativa y no la localizacin absoluta de las
observaciones. La localizacin relativa se
puede expresar mediante las conocidas
relaciones de distancia (euclideana o
Mannhattan), de contigidad espacial
(vecindades de diverso orden) u otras.

Como su nombre indica, el modelo GWR es


sensible a las variaciones locales y para ello
debe aplicarse en forma iterativa a cada
objeto o cada coordenada para la cual se
desea obtener una ecuacin de regresin.
Finalmente, se tendr una ecuacin de
regresin calibrada localmente, para cada
objeto o punto de inters, como muestra la
Figura 4. Entorno local para la calibracin del modelo GWR
en el objeto central del vecindario.

4
Ph.D. Rafael Arce M., Escuela de Geografa, UCR. 25/04/2016.

figura 4.

La aplicacin iterativa para calcular un modelo de regresin local para cada elemento del mapa o
cada punto de una malla sistemtica requiere un mecanismo para asignar un peso diferenciado a
cada elemento del vecindario, ya sea como funcin de la distancia (dij) punto-objeto o como una
funcin del orden de vecindad (primero, segundo, tercero, etc.). Dentro de las tcnicas que
permiten definir lo local (el vecindario), se hallan aquellas basadas en un radio de bsqueda
(kernel) que puede ser de ancho fijo o variable. Otra estrategia consiste en definir un ancho de
banda optimizado, definido a partir del criterio del AIC o del criterio de Validacin Cruzada (CV).

Para asignar los pesos a cada punto de apoyo existen diversos algoritmos; uno de ellos toma en
cuenta la razn de distancia punto-objeto y el ancho de banda usado para la seleccin de los
puntos (elementos del vecindario):

Donde: dij es la distancia entre cada elemento del vecindario y el objeto cuya ecuacin de
regresin se est calibrando; b es el ancho de banda utilizado. En este caso, si la distancia dij hasta
un elemento del mapa es superior al ancho de banda b se considerar que dicho elemento no es
parte del vecindario para efectos del ajuste del modelo de regresin y su influencia o peso es
cero.

Cuando el ancho de banda b tiende a infinito, el peso de las observaciones tiende a uno para todos
los puntos del vecindario de modo que el parmetro estimado se vuelve uniforme y GWR se hace
equivalente a OLS. Contrariamente, si b es pequeo la estimacin de los parmetros depender
crecientemente de los vecinos ms prximos a la localidad (i) y se tendr una mayor varianza. El
problema es por lo tanto, cmo seleccionar un apropiado ancho de banda o funcin de
decaimiento de la distancia para el modelo GWR. Figura 5.

5
Ph.D. Rafael Arce M., Escuela de Geografa, UCR. 25/04/2016.

Figura 5. Efecto del ancho de banda y la ecuacin considerada en la asignacin de pesos a los puntos del vecindario.

En nuestro ejercicio prctico (TP5) nicamente hicimos variar el parmetro ancho de banda (b)
para observar los cambios en los parmetros , pero no llegamos a optimizar b. Para ello se debe
utilizar una tcnica conocida como validacin cruzada (CV) que no se discute ac pero se puede
consultar en Fotheringhan et al.,2002:60, ec. 2.31. La figura 6 ilustra dos posibles soluciones
para anchos de banda b de 700 m y 561 m (distacia promedio punto-objeto).

0 16.2813 0 2.3232
1 0.5834 1 0.7885
2 -0.8513 2 -0.7616
3 -0.4539 3 -0.7953
4 -0.8140 4 -0.8003
Figura 6. Coeficientes obtenidos con anchos de banda de 700 m (izquierda) y 561 m (derecha), durante la
realizacin del TP5 (Curso anlisis espacial, 2016).

La ecuacin matricial que representa el modelo GWR es:

Donde: es un operador lgico de multiplicacin donde cada elemento es multiplicado por su


correspondiente elemento X.

Para hallar el vector de coeficientes se resuelve:

Donde:

6
Ph.D. Rafael Arce M., Escuela de Geografa, UCR. 25/04/2016.

Para obtener el valor estimado Y(si):

z(Si) = X0 (si)*

Evaluacin de la calidad del modelo de regresin lineal (OLS GWR):

Determinar una funcin de regresin lineal global (OLS) o mltiples funciones de regresin lineal
local (GWR) es solo una parte pequea de la tarea general de definir un buen modelo de
regresin. Para esto ltimo hay que conocer los diversos tipos de problemas que puede tener un
modelo de regresin mltiple, que pueden afectar su credibilidad; tambin se requiere evaluar la
calidad del modelo mediante el uso de variados ndices que han sido definidos dentro de la ciencia
Estadstica y estn disponibles en todos los paquetes estadsticos.

Los tipos de problemas que frecuentemente presentan los modelos OLS y GWR son:

Omisin de variables explicativas relevantes.


Modelar relaciones no lineales usando mtodos lineales.
Efectos introducidos por valores extremos generados por errores en los datos.
No estacionaridad de la relacin.
Multicolinearidad.
Varianza inconsistente en los residuos.
Residuos afectados por autocorrelacin espacial.
Influencia de la distribucin normal.

La omisin de variables explicativas relevantes tiene por consecuencia que no se pueda confiar en
los valores de probabilidad P, ni en los coeficientes . Para solucionar esta situacin se debe
recordar que el proceso de definir un modelo de regresin robusto es iterativo y es vlido probar
nuevas variables explicativas, as como abandonar el uso de aquellas que resulten irrelevantes. En
algunas ocasiones resulta valioso realizar anlisis de autocorrelacin (hot spot) para determinar si
hay agrupamientos de autocorrelacin y con base en estas concentraciones tratar de descubrir
cules son las variables locales que estn afectando.

7
Ph.D. Rafael Arce M., Escuela de Geografa, UCR. 25/04/2016.

Para detectar la presencia de relaciones no lineales, especialmente entre las variables


independientes y la variable dependiente, construya un grfico de matriz de diagramas de
dispersin (Figura 7) como primer paso del
anlisis y evale cuidadosamente los tipos
de relacin existentes. Ocasionalmente se
puede "linearizar" una relacin entre
variables, haciendo una transformacin
logartmica o exponencial de una de ellas
segn el tipo de sesgo que presenten
(Figura 8). En ltima instancia, considere el
ajuste de un modelo de regresin no lineal.

Figura 7. Grfico de matriz de diagramas de dispersin e


histogramas de frecuencias del modelo.
Los valores atpicos (outliers) que
resultan de errores experimentales
(error del instrumento, de transcripcin
de datos, etc.) deben ser eliminados de
la serie de datos pues afectan
fuertemente los coeficientes de
regresin e invalidan el modelo. Desde
luego, no se pueden eliminar del registro
los valores atpicos que no se deban a
errores experimentales. Esto valores
extremos se notan bien en los diagramas
de dispersin (Figura 9).

Figura 8. Diagramas de dispersin con fuerte sesgo y


procedimiento para linearizacin.

Figura 9. Efecto de valores atpicos en el


2
parmetro R .

8
Ph.D. Rafael Arce M., Escuela de Geografa, UCR. 25/04/2016.

La condicin de no estacionaridad de la relacin (Figura 10) hace que el error estndar del modelo
OLS se incremente artificialmente. Si la prueba Koenker es estadsticamente significativa (p0.05)
se tiene una variacin regional estadsticamente significativa de la relacin y debe consultar las
probabilidades robustas (Robust Pr) para determinar si una variable es estadsticamente
significativa o no. Bajo esta condicin por lo general se tienen mejores resultados si se construye
un modelo de regresin usando GWR que OLS.

La multicolinearidad indica que una variable o una combinacin de variables explicativas es


redundante. Se detecta mediante la prueba del Factor de Inflacin de la Varianza (VIF). Si este
valor es superior a 7.5, la redundancia o colinearidad es un problema y las variables que la
provocan deben combinarse o eliminarse del modelo. El problema suele ser ms comn en
muestras pequeas.

Se espera que los residuos de la regresin


tengan una distribucin aleatoria y sus
magnitudes sean similares, tanto cuando se
predicen valores de baja magnitud, como
cuando se predicen valores de elevada
magnitud; una condicin llamada

Figura 10. Variacin regional en la forma de la relacin entre


las variables independientes y la variable dependiente.
homocedasticidad. En la prctica a menudo el
modelo OLS puede mostrar varianza creciente en
los residuos conforme se predicen valores de
magnitud mayor. Los residuos adoptan una
distribucin cnica tambin conocida como "alas de
mariposa" cuando se les grafica contra las

magnitudes de los valores observados (Figura 11). A Figura 11. Heterocedasticidad de los residuos.

esta condicin se le llama heterocedasticidad y en tal caso se debe utilizar la tabla de los errores
estndar robustos y la tabla de probabilidad slida, para valorar la validez del modelo.

9
Ph.D. Rafael Arce M., Escuela de Geografa, UCR. 25/04/2016.

Cuando los residuos de la prediccin muestran autocorrelacin espacial se exagera la relacin y


el modelo es poco confiable. Haga siempre una prueba I de Moran global sobre los residuos de
regresin para determinar si los residuos muestran tendencia al agrupamiento o dispersin
estadsticamente significativa. Si la I de Moran es significativa casi siempre indica que el modelo
est mal especificado y deben revisarse las variables utilizadas.

Cuando los residuos de la regresin se alejan de


la distribucin normal (Figura 12), con media
diferente de cero, los valores de probabilidad P
de los coeficientes son poco confiables. Si el
estadstico Jarque-Bera es significativo (p < 0,05)
es probable que el modelo de regresin est mal
especificado (falta alguna variable significativa) o
que incluya relaciones no lineales. Para mejorar
la especificacin del modelo puede revisar el
mapa de los residuos y quizs tambin el mapa
de los coeficientes de la regresin GWR para
tratar de determinar cul o cules variables clave
de marcado efecto local podran estar afectando
el modelo. Igualmente revise el grafico de matriz Figura 12. Residuos de regresin sesgados , con 0.
de dispersin para hallar posibles relaciones no lineales.

Revisin del informe OLS generado por la herramienta Spatial statistics tool de ArcGIS

El orden de revisin sugerido por ESRI se muestra en la figura 13 y se resume al final de la misma:
1. Determine el rendimiento (performance) del modelo usando la lnea del R2 mltiple o el R2
mltiple ajustado. Este ltimo se usa cuando la prueba BP de Koenker sea estadsticamente
significativa.

2. Analice cada variable explicativa mediante la tabla resumen de los resultados OLS.

3. Evale la significancia global del modelo mediante los estadsticos Joint F y Wald. Si aparecen
con (*) indican significancia global del modelo con p < 0.05. Si la prueba Koenker (BP) es
estadsticamente significativa use estrictamente el estadstico Wald en vez de Joint F para
determinar la significancia global del modelo.

10
Ph.D. Rafael Arce M., Escuela de Geografa, UCR. 25/04/2016.

Tabla 1. Resumen de resultados y elementos diagnsticos de la calidad y fiabilidad del modelo de regresin OLS.

4. Analice la condicin de estacionaridad del modelo mediante la prueba Koenker (BP). Cuando
este estadstico es significativo (p<0.05), las relaciones modeladas nos son consistentes ya sea por
no estacionaridad, por heterocedasticidad o por ambas.

5. Evalue el sesgo del modelo mediante el estadstico Jarque-Bera. Cuando el estadstico es


significativo (p<0.05) las predicciones del modelo son sesgadas (los residuos no se distribuyen
normalmente).

6. Use una prueba I de Moran global para verificar que los residuos no estn espacialmente
correlacionados.

Siguiendo las recomendaciones se analiza ahora el resultado de la regresin ordinaria (OLS) para el
archivo Muestra2000SR25, que contiene 25 objetos del centro de San Ramn extrados de forma
ms o menos arbitraria del archivo Censo2000SR, que contiene 173 objetos.

El modelo de regresin OLS se estableci entre cinco variables: SERVET, SEV, COM, SERVP, SERVPE,
la primera de las cuales fue definida como la variable dependiente o regresando, y las otras cuatro
se asumieron como variables independientes (explicativos o regresores). La expresin matemtica
sera entonces:

SERVET = 0 + 1*SEV + 2*COM + 3*SERVP + 4*SERVPE

11
Ph.D. Rafael Arce M., Escuela de Geografa, UCR. 25/04/2016.

El anlisis de rendimiento del modelo (paso 1) usando R2 mltiple indica que 90% de la variacin
de SERVET es explicada por las variables SEV, COM, SERVP y SERVPE. En este caso la prueba (BP)
de Koenker no fue estadsticamente significativa, por lo que es innecesario utilizar R2 ajustado.
Este rendimiento se considera muy bueno.

El resumen de los resultados OLS se muestra en la tabla 2. Del anlisis de cada una de las variables
explicativas (paso 2) se obtiene la siguiente informacin:

Tabla 2. Resumen de resultados OLS para las diversas variables del modelo.

La ecuacin especfica OLS calibrada con la muestra de 24 objetos (se excluy de la calibracin el
objeto SEC_ID 16803 con el propsito de usarlo como elemento de control) queda como sigue
(para abreviar se usan solo dos decimales):

SERVET = 3.23 + 0.79*SEV - 0.86*COM - 0.78*SERVP - 0.78*SERVPE

Es decir, el valor de la variable SERVET es 3.23 cuando las variables SEV, COM, SERVP y SERVPE
asumen valor cero.

Los valores i resultaron bastante alejados de cero y son estadsticamente significantes (columnas
Probability y Robust_Pr(obability), de modo que las cuatro variables independientes hacen
aportes valiosos a la estimacin de SERVET.

El aporte de las variables al Factor de Inflacin de la Varianza (VIF) en ningn caso supera el lmite
establecido VIF 7.5, por lo que se concluye que no existe colinearidad (correlacin) significativa
entre las variables explicativas.

Para las etapas subsiguientes de la evaluacin de resultado se usa la tabla 3.

12
Ph.D. Rafael Arce M., Escuela de Geografa, UCR. 25/04/2016.

Tabla 3. Elementos diagnsticos de la calidad global del modelo de regresin OLS

El estadstico de Wald result significativo (marcado con *), paso 3, a ms de un 95% de confianza
(p<0.05), por lo el modelo OLS fijado es muy confiable.

El anlisis de estacionaridad (paso 4), basado en la prueba de Koenker (BP), no result


estadsticamente significativo por lo que la relacin entre SERVET y las variables explicativas se
muestra estable en la pequea rea estudiada.

El estadstico Jarque-Bera result no significativo,


por lo que los residuos del modelo OLS son
insesgados (paso 5); es decir, tienen una distribucin
aproximadamente normal con media cero o muy
cercana.

El ltimo paso del anlisis (paso 6) consiste en hacer


una prueba de hiptesis para la I de Moran Global
para determinar si hay una tendencia significativa al
agrupamiento o dispersin de los residuos de
regresin OLS. Esta tarea no necesariamente se
realiz durante el desarrollo del TP5, pero se reporta
ac de todos modos (figura 13). La prueba arroj un
valor estandarizado de la I de Moran de 0.27, que
claramente est en la regin de aceptacin de la
hiptesis nula: los residuos estn repartidos al azar
y no presentan autocorrelacin espacial
Figura 13. Prueba de autocorrelacin significativa.
espacial global con la I de Moran, para
los residuos de la regresin OLS.

Resultados de regresin lineal GWR:

La regresin GWR s fue realizado en clase. El mapa de residuos estandarizados del modelo GWR,
clasificado segn niveles de significancia se muestra en la figura 14.

13
Ph.D. Rafael Arce M., Escuela de Geografa, UCR. 25/04/2016.

Figura 14. Nivel de significancia de los residuos estandarizados de la regresin GWR

En color verde limn se muestran los polgonos en cuyo entorno no se detecta una organizacin
local espacialmente autocorrelacionada de los residuos de la regresin ponderada
geogrficamente (GWR).

Los dems colores muestran polgonos en cuyo entorno existe autocorrelacin espacial de los
residuos de la regresin GWR a niveles de significancia de 0.1, 0.5, 0.01 y menos en ambas colas
de la distribucin normal de probabilidad.

El software ArcGIS devuelve una tabla (un registro por cada elemento del mapa) con los
coeficientes i resultantes de la regresin, adems de los residuos, errores estndar y residuos
estndar (Figura 15).

El polgono seleccionado, para el cual se muestran los datos en la lnea en color cyan, es el
analizado con Excel en el TP5 (SEC_ID 16803), dando la siguiente ecuacin:

SERVET = -2.05 + 0.90*SEV - 0.90*COM - 0.80*SERVP - 0.84*SERVPE

El valor R2 local es 0.91 y el residuo estandarizado es 0.08, lo que indica que el modelo de
regresin GWR ajusta muy bien los valores locales y que el residuo no es estadsticamente
significativo.

14
Ph.D. Rafael Arce M., Escuela de Geografa, UCR. 25/04/2016.

Figura 15. Mapa y registro de resultados de la regresin GWR en el entorno del elemento SEC_ID 16803.

Con relacin al modelo de regresin global OLS, el modelo de regresin local GWR en el entorno
del objeto SEC_ID 16803, los coeficientes i mantienen signos equivalentes; la variable SEV est
positivamente relacionada con SERVET, mientras las variables COM, SERVP y SERVPE estn
relacionadas de forma inversa con la variable SERVET.

Otra prueba no realizada en el TP5, pero mencionada en la


discusin terica y tambin durante la realizacin del
ejercicio prctico, es que la regresin GWR permite hacer
predicciones para cualquier punto (XY) del terreno, y no
solo para los objetos de un shape vectorial. En ArcGIS esto
se logra generando una imagen por cada uno de los
coeficientes i calculados. Las figuras 16, 17, 18, 19 y 20,
correspondes a los coeficientes i resultantes de la

regresin GWR para la


variable SERVET.

De arriba hacia abajo,


y de izquierda a
derecha, se tienen los
coeficientes 0, 1, 2,
3 , 4.

Figura 16. Imgenes de los coeficientes 0, 1, 2, 3 , 4 del modelo GWR para la variable SERVET, usando Censo2000SR.

15
Ph.D. Rafael Arce M., Escuela de Geografa, UCR. 25/04/2016.

Para poder obtener una imagen de valores de regresin espacialmente ponderados, conocidos los
coeficientes 0, 1, 2, 3 , 4 hace falta nicamente generar imgenes de igual cobertura y
resolucin de las variables independientes SEV, COM, SERVP y SERVPE, lo cual se puede hacer
utilizando un algoritmo de interpolacin espacial adecuado. Finalmente se hace:

Donde Xi son todas y cada una de las variables independientes.

Para finalizar este tema diremos que el algoritmo GWR de ArcGIS no genera una tabla resumen de
resultados ni una tabla de elementos diagnsticos, como s hace para el OLS. Esto puede deberse a
que el anlisis pierda un poco su sentido cuando se trata de una regresin local (por ejemplo,
porque la muestra suele ser pequea), o porque es mucho ms laborioso, pues habra que generar
un documento por cada polgono del
mapa. Otra razn podra ser puramente
terica al tener que adaptar los
estadsticos a las consideraciones
particulares de la regresin espacial.

Finalmente, se corri la I de Moran


Global para probar si los residuos de la
regresin local (GWR) muestran
autocorrelacin espacial
estadsticamente significativa, prueba
equivalente al paso 6 de la validacin de
los resultados del OLS. Los resultados,
figura 17, dan un Z-score de 1.46 que no
es estadsticamente significativo y por
tanto los residuos no estn
autocorrelacionados.
Figura 17. Prueba de autocorrelacin espacial global con la I de
Moran, para los residuos de la regresin ponderada
geogrficamente GWR.

16

Vous aimerez peut-être aussi