Académique Documents
Professionnel Documents
Culture Documents
Fondo
Glosario
estadstica bayesiana Una rama de la estadstica que incorpora informacin previa
Geogrficamente regresin ponderada (GWR) es una forma local de anlisis
acerca de los fenmenos con los datos actuales en un modelo estadstico para
espacial introducido en la literatura geogrfica dibujo de enfoques estadsticos
realizar inferencias sobre los parmetros del modelo.
para aplicaciones de suavizado curva fi tting y. Funciona el mtodo basado en
la idea simple pero potente de la estimacin de modelos locales utilizando
El ajuste de Bonferroni Una tcnica que disminuye el valor fi significacin
subconjuntos de observaciones se centraron en un punto focal. Mediante la
estadstica de las pruebas individuales en una situacin en la que mltiples
colocacin de GWR en el contexto de la geografa analtica, este enfoque de
pruebas fi significacin se llevan a cabo simultneamente.
modelado ha hecho un llamamiento a la imaginacin geogrfica mediante la
implementacin, dentro de un marco de regresin lineal a nivel local, el efecto
colinealidad La presencia de correlacin entre las variables
de desintegracin distancia popularizado por Tobler con la primera ley de la
explicativas en un modelo estadstico que puede interferir con la
geografa.
inferencia estadstica.
Validacin cruzada Una tcnica de estimacin de parmetro de modelo que elimina
autocorrelacin espacial Una relacin de dependencia entre los valores de Este modelo es un ed simplifica y representacin estilizada de la realidad,
una variable debido a la disposicin geogrfica de las unidades en un mapa. desarrollado para describir o explicar la variacin sistemtica de un fenmeno,
permitiendo al mismo tiempo la incertidumbre. El modelo relaciona un nmero ( k)
La heterogeneidad espacial La variacin de una condicin o de la relacin de variables relevantes explicativas (o independientes) X a una respuesta (o
de un lugar a otro. variable dependiente) y por unidad de observacin i (i 1,
La interpolacin espacial Un mtodo para la prediccin de un valor
desconocido de una variable espacialmente continuo en un lugar que utiliza 2, Y, norte). Las relaciones entre las variables de respuesta y explicativas
los valores de los lugares vecinos. estn dadas por coe fi cientes segundo k que representan la respuesta
media. El modelo se llama una regresin, ya que 'regresa' las variables
no estacionariedad espacial Una condicin en la que la relacin entre hacia la media. Adems de esta estructura media, la incertidumbre entra a
variables no es constante a travs de un rea de estudio. travs de un conjunto de trminos mi yo, diversamente llamado residuales,
errores o perturbaciones. Estos trminos, estimables partir de los datos
estacionariedad La presencia de un medio constante y una funcin de una vez que el modelo haya especi fi, miden la diferencia entre la
covarianza que depende slo de la distancia entre ubicaciones en un descripcin sistemtica (media) del proceso, y el resultado observado.
proceso espacial.
407
408 Regresin ponderada geogrficamente
Los supuestos habituales relativas a los residuos mi en el anlisis de regresin son GWR, consisti en la seleccin de submuestras de datos en funcin de la
aleatoriedad (es decir, se supone que toda la variacin sistemtica de tenerse en cuenta en el distancia en el espacio geogrfico, y la nocin de que, a diferencia de la mayora
modelo), un valor esperado de cero, la independencia y varianza constante. Pronto gegrafos de las aplicaciones en las estadsticas cuya principal preocupacin es la curva de
dieron cuenta de que algunos de estos supuestos, en particular, la independencia, eran a fi tting (en un sentido predictivo), las relaciones no estacionarios podran ser
menudo insostenible cuando se introdujo la ubicacin de las observaciones. Los desarrollos investigados, as , en un sentido exploratorio o explicativo.
tcnicos se centraron inicialmente en anlisis inferencial de patrones espaciales (por ejemplo,
estadsticas C de Geary de autocorrelacin espacial I de Moran y), y las herramientas GWR se define como un modelo que es localmente lineal en la media:
posteriores para modelar patrn espacial (autorregresin espacial, y la regresin con errores
de 1990, gracias en parte a un nuevo software, el anlisis espacial haban encontrado y yo segundo 0 yo X segundo ki X ki mi yo 2
para convertirse habitualmente utilizado en otros lugares, sobre todo en la ingeniera civil, la
Los elementos del modelo son como se ha definido anteriormente, excepto que
economa de bienes races, y los estudios regionales y urbanas. Sin embargo, algunos
ahora los coeficientes segundo ki no son estacionarias sino que corresponden a la
analistas se dieron cuenta de que, a pesar de su capacidad de capturar los patrones de
ubicacin yo, denominado el punto focal, que es el punto seleccionado para la
mapas, las tcnicas en uso (estadsticas de autocorrelacin, anlisis de regresin, regresin
estimacin del modelo local. En general, el nmero de modelos locales metro no se
espacial) fueron todava insu fi cientemente geogrfica. estadsticas de autocorrelacin fueron
fija y un nmero arbitrario de ellos ( metro Z 1) puede, en principio, ser estimada para
capaces de detectar patrones de mapa, pero no produjeron resultados asignables. En otras
una regin. En muchas aplicaciones, el punto focal para cada estimacin local, se
palabras, no se identificaron lugares en los efectos espaciales eran relevantes o fuerte. El
hace coincidir con la ubicacin de una observacin yo, aunque esto no es
modelo de regresin en la ecuacin [1] ilustra esta situacin asumiendo que las relaciones (los
necesariamente el caso. En este sentido, coe fi cientes pueden estimarse para
coe fi cientes regresin espacial) eran todava insu fi cientemente geogrfica. estadsticas de
cualquier lugar dentro del rea de estudio, independientemente de si los datos se han
autocorrelacin fueron capaces de detectar patrones de mapa, pero no produjeron resultados
recogido en ese momento - por ejemplo, un punto focal genrica o. Teniendo en
asignables. En otras palabras, no se identificaron lugares en los efectos espaciales eran
cuenta los datos de covarianza, la respuesta puede ser estimado en ubicaciones no
relevantes o fuerte. El modelo de regresin en la ecuacin [1] ilustra esta situacin asumiendo
muestreadas, as, una caracterstica del modelo que lo hace atractivo para los
que las relaciones (los coe fi cientes regresin espacial) eran todava insu fi cientemente
propsitos de interpolacin espacial que se parecen mucho a los orgenes de GWR.
geogrfica. estadsticas de autocorrelacin fueron capaces de detectar patrones de mapa, pero
La caracterstica principal de GWR de inters en la literatura geogrfica se refiere a
no produjeron resultados asignables. En otras palabras, no se identificaron lugares en los
los coeficientes en la ecuacin [2], que son especfica a la ubicacin yo.
efectos espaciales eran relevantes o fuerte. El modelo de regresin en la ecuacin [1] ilustra esta situacin asumiendo que las relaciones (los coe fi cientes segundo k) son estacionarios o constante a travs del espacio.
B3_GWR (PctRural)
- 0,1000 a - 0,0510
- 0,0510 a - 0,0432
- 0,0432 a - 0,0374
- 0,0374 a - 0,0320
- 0,0320 a - 0,0000 0 20 40
60
kilmetros
Figura 1 Ejemplo de una variable espacialmente coeficiente estimada usando el enfoque GWR.
espacio estn ms relacionadas que otros eventos. En esencia, la funcin del dnde re ij es la distancia entre las observaciones yo y j, y
ncleo coloca una ventana sobre las observaciones, por lo tanto la seleccin de una re es una distancia de corte que define el tamao de la ventana. A pesar de su
submuestra de puntos. La ventana posteriormente puede ser desplazado para simplicidad, esta funcin kernel no ha sido ampliamente utilizado. En cambio, la
reestimacin local del modelo. Un nmero de diferentes funciones del ncleo se han mayora de aplicaciones de GWR han favorecido funciones continuas que
propuesto y utilizado en la prctica. En quizs el caso ms simple, un sistema de producen pesos montonamente decreciente, como la exponencial negativa:
ponderacin binaria podra ser utilizado de la siguiente manera:
( !
Si re ij r re re 2 ij
w ij 1; 3 w ij exp 4
0; de otra manera 2 gramo 2
410 Regresin ponderada geogrficamente
con R ij como el rango de j cuando las observaciones se ordenan por el aumento de la nmero de vecinos ms cercanos. En pocas palabras, la validacin cruzada intenta
distancia del punto focal yo. Como alternativa, tambin es posible para definir la funcin hallar el tamao de la ventana que da la mejor correspondencia (minimiza la
del ncleo en trminos de vecinos ms cercanos a la ubicacin yo: diferencia) entre los valores predichos y observados de y. El protocolo de dejar uno
fuera (observacin eliminacin yo en validacin cruzada) es seguido de impedir los
estimadores locales de envolver alrededor de un solo punto de datos, es decir, la
8> <>:
marido yo 2; estimacin de un punto de datos perfectamente. Una vez que el tamao de la
Si j es uno de norte th ms cercana
re ij = re 2
vecinos de yo ventana ha sido validado coeficientes locales pueden estimarse utilizando la
w ij 1 7
ecuacin [8].
0; de otra manera
el par observacin yo
y j.
Un punto a tener en cuenta es que los estimadores de la ecuacin [8] son una
extensiones
funcin de datos conocidos (la X y y observaciones), as como la matriz de peso,
lo que depende de la distancia conocida entre las observaciones, sino tambin un Adems del marco de regresin lineal, la idea de aplicar pesos
parmetro desconocido que define el tamao de la ventana. En general, se acepta geogrficos se ha extendido a una variedad de otras tcnicas, para
que, en trminos de estimacin, la seleccin de una forma funcional para el ncleo producir estadsticas descriptivas geogrficamente ponderados, anlisis
es menos crtica que la seleccin de un tamao de la ventana. Por lo tanto, hay discriminante, regresin logstica, regresin de Poisson, y modelos
una necesidad de criterios para guiar la determinacin de la distancia crtica d ( en probit geogrficamente ponderados. Con respecto a modelar espec fi
el caso de la ecuacin [3]), el valor de g ( en las ecuaciones [4] - [6]), o el nmero cacin y estimacin, se han propuesto modelos GWR mixtos que
de vecinos ms cercanos (en el caso de la ecuacin [7]) en aplicaciones combinan coeficientes espacialmente estacionarias y no estacionarias,
especficas. mientras que la investigacin ms reciente ha introducido expansin
lineal local de los coeficientes.
Validacin cruzada
Cuestiones
Se han propuesto dos mtodos generales (asignacin directa de tamao de la
ventana o validacin de tamao de la ventana) para determinar un tamao de Una serie de cuestiones relacionadas con el desarrollo y uso de GWR
ventana apropiado para la estimacin. mencin mrito. El primero se refiere al tema de la
Regresin ponderada geogrficamente 411
inferencia con respecto a los coe fi cientes de regresin locales. Un enfoque marco que puede detectar cundo y dnde hay altos niveles de cientes de
para el desarrollo de un marco de pruebas ha sido la adopcin de la regresin correlaciones deficiente debido a la colinealidad. Estimacin de
formulacin paramtrica del mtodo y los conceptos afines, desarrollado coe fi cientes de regresin desde ubicaciones de calibracin que se
principalmente en la literatura estadstica, del nmero efectivo de las diagnostican como problemtica se deben interpretar con precaucin y
observaciones y nmero efectivo de coeficientes. Estos conceptos son anlisis adicionales pueden ser necesarios en estas reas para comprender
analogas de las contrapartes de regresin globales, y proporcionan la base la naturaleza de las relaciones en estudio.
para la obtencin de intervalos de con fi anza y otras estadsticas. Un segundo
enfoque para desarrollar pruebas ha sido ver el mtodo como un conjunto de Una cuestin ms prctica con GWR es con el tiempo de ejecucin
modelos de regresin locales. Esto da lugar a un tema diferente cada vez que de clculo de las implementaciones de la tcnica. La estimacin de los
el nmero de modelos locales que ser estimado superior a un ( metro 4 1), ya metro parmetros del modelo GWR a travs de la validacin cruzada puede
hiptesis necesitan ser probados simultneamente. El problema es que, como ser computacionalmente intensivo para conjuntos de datos
el nmero de pruebas se incrementa, hay una probabilidad creciente de que relativamente modestas de miles de ubicaciones calibracin del modelo
algunos se suba significativo, aunque slo sea por casualidad. Por tanto, existe y varias covariables. Sin embargo, la naturaleza del algoritmo de
una necesidad de dar proteccin al grupo de instrucciones a travs de las tasas estimacin de GWR se presta bien a las soluciones de computacin en
de error de grupo en comparacin con las tasas de error individuales - en otras paralelo, donde los diferentes equipos pueden realizar clculos de las
palabras, el nivel individual de significacin necesita ser ajustado para predicciones del modelo en diferentes lugares y las respuestas pueden
comparaciones mltiples. Se han propuesto varios procedimientos para ser combinados para evaluar la funcin objetivo para un tamao de
proporcionar el tipo de proteccin necesario cuando se realiza la inferencia ventana dada. Convenientemente, hay mltiples implementaciones del
simultnea. Un procedimiento simple se basa en la desigualdad probabilidad mtodo de GWR. Si bien no es libre, GWR 3.0 est disponible de
Bonferroni, un procedimiento simple que divide el nivel general fi significacin un Fotheringham y sus coinvestigadores. Una, la implementacin de
( tolerancia de error de grupo) por el nmero de pruebas metro para obtener un cdigo abierto de GWR escrito por Roger Bivand est disponible como
nivel significacin fi ajustado un/ m ( hiptesis individuo tolerancia de error). un paquete R. En adicin,
Aunque este procedimiento rpido y spero no requiere supuestos de
distribucin y es simple de usar, las pruebas resultantes carecen de potencia y
son excesivamente conservadores cuando las pruebas estn altamente
correlacionados (es decir, no es independiente), que es ciertamente el caso en
GWR debido a la utilizacin de subconjuntos de superposicin de datos.
Existen otros mtodos que mejoran el poder de las pruebas mediante la
introduccin de multiplestep esquemas de rechazo que ajustan el tamao de la
pena con el nivel de significacin de una manera secuencial. debates
Mientras GWR ha ofrecido la posibilidad de entender las relaciones entre las variables ms
ambas bases tericas y prcticas. Una de las preocupaciones que dice GWR no es un fi
cada uni, modelo estadstico formal que ofrece un enfoque bien definido para la inferencia
Un segundo problema con GWR se refiere a los altos niveles de variabilidad donde la dependencia entre coe fi cientes de regresin en diferentes ubicaciones de datos
espacial frente los profesionales, una situacin que suscita la preocupacin de no es especificados en el modelo, lo que resulta en un modelo de efectos fijada sin puesta
que los resultados pueden ser engaosos si no interpretados con precaucin. en comn en las estimaciones. Algunos estadsticos prefieren el marco unificado de los
Una fuente de coef regresin variabilidad fi ciente en GWR proviene de modelos jerrquicos bayesianos. Adems, la reutilizacin de los datos para estimar la
colinealidad, o correlacin en las variables explicativas del modelo. Colinealidad regresin coef coe fi en diferentes ubicaciones crea una situacin comparaciones mltiples
se ha encontrado en el trabajo emprico a ser un problema en los modelos de que invalida los intervalos de con fi anza habituales de los coe fi cientes de regresin. Los
GWR a nivel local, incluso en casos en que no es un problema en el modelo de debates que rodean el desarrollo y uso de GWR se han complicado por el hecho de que los
regresin tradicional, o global, lineal con los mismos datos. Adems de la alta modelos con GWR de estilo diferentes coe fi cientes se pueden derivar de separacin de un
variabilidad de los coeficientes estimados coef regresin fi, no puede ser fuerte marco de regresin ponderada, como un modelo no paramtrico, o como un modelo con
covariacin en las GWR cientes coe fi para diferentes parmetros (efectos de varianza no constante. Mientras que todas estas alternativas producen exactamente las
covarianza o el intercepto), al menos en parte debido a la colinealidad. El inflado mismas expresiones de los estimadores, se diferencian conceptual y tcnicamente en cmo
coef regresin variabilidad deficiente asociada con la colinealidad local puede y en qu medida la inferencia puede ser llevado a cabo. Esta caracterstica de la difieren
conducir a coef reveses y una sobreestimacin de las magnitudes de efecto, conceptual y tcnicamente en cmo y en qu medida la inferencia puede ser llevado a cabo.
ambos de los cuales podran dar lugar a interpretaciones incorrectas de Esta caracterstica de la difieren conceptual y tcnicamente en cmo y en qu medida la
relaciones de regresin de signos fi cientes. herramientas de diagnstico de inferencia puede ser llevado a cabo. Esta caracterstica de la
los coe fi cientes de regresin, conocido como equi fi nalidad, ha hecho que sea di fi culto siendo un enfoque ventanas en movimiento y el mtodo de expansin de una
para algunos investigadores estn de acuerdo en que las propiedades del modelo. forma de anlisis de la covarianza.
Un segundo desarrollo en el anlisis espacial local que es anterior
En relacin con el punto anterior, una cuestin de inters que rodea a la popularizacin de GWR en la geografa es el uso de modelos
GWR para algunos investigadores es la cuestin de grados de libertad, que jerrquicos. Esta es una tcnica de anlisis similar al mtodo de
est directamente relacionado con la complejidad del modelo. Aunque el expansin que permite coeficientes a varan segn la ubicacin,
concepto de nmero efectivo de grados de libertad es uno aceptada en el mientras que la introduccin de la variacin aleatoria de los
anlisis estadstico (por ejemplo, por mtodos vecino y regularizacin ms coeficientes. El mtodo es atractivo porque los modelos pueden ser
cercanos, entre otros), y el concepto ha sido adoptado en algunas simultneamente definido en varios niveles que incorporan
presentaciones de GWR, algunos investigadores siguen siendo incmodo explcitamente contextos (por ejemplo, sociales) geogrficas y otros en
con el tema de grados de libertad de los residuos en GWR, y los posibles el anlisis. En modelos multinivel, un tipo de modelo jerrquico, las
resultados de compartir datos a travs de ponderacin espacial para regiones (o clases) en cada nivel debe ser de fi nido, por lo que las
estimar coe fi cientes de regresin en diferentes lugares. observaciones individuales pueden ser 'anidados' de acuerdo con
algn tipo de categorizacin (por ejemplo, zonas geogrficas, los
rangos de edad, tipo de trabajo, etc.). Adems de las preocupaciones
Sin embargo, otro debate sobre GWR est en la naturaleza de la habituales con unidades capaces de rea modi fi,
aplicacin de la tcnica en s. Se ha sugerido, por ejemplo, que GWR se
adapta bien para la estimacin y prediccin de la variable de respuesta, pero
es tal vez menos til para la explicacin de, o inferencia estadstica formal
sobre, potencialmente espacialmente diferentes efectos de regresin. Dadas
las races de GWR en la regresin lineal local, que fue desarrollado para
estimar una variable de respuesta a nivel local, este debate no es del todo
sorprendente. Cuando interpolacin de una variable de respuesta en el En relacin con el modelo jerrquico es el modelo Bayesiano
espacio es de inters, problemas de estimacin, como colinealidad ya no son jerrquica, en la que la informacin acerca de las relaciones se puede
una preocupacin importante. incorporar en el modelo a travs de distribuciones previas de los
parmetros. Si se utilizan poco informativos (o vagos) priors para los
parmetros del modelo y los coeficientes de regresin fi son espec fi
ed como independiente en el modelo, los coe fi cientes de regresin
estimados derivados de muestras de la distribucin posterior parmetro
Alternativas conjunta sern, en teora, el mismo que en la no modelo jerrquico
-Bayesian. Hay modelos jerrquicos bayesianos con efectos aleatorios,
GWR ha puesto de manifiesto la existencia de patrones potencialmente tanto para la intercepcin y pistas para covariables, donde los efectos
complejas, no estacionarios, relacionales en el modelado geogrfico. Por aleatorios pueden ser independientes a priori y pedir la fuerza a travs
otro lado, el enfoque no es nico en su capacidad para modelar las de observaciones a nivel mundial o de fi ne a tener una estructura
relaciones espaciales diferentes, ya que hay algunos antes y tambin espacial y la fuerza prestado a nivel local. La principal alternativa
despus desarrollos que cumplen el mismo objetivo, aunque de diferentes dentro de esta clase de modelos es la Bayesiano variable
maneras, tanto tcnica como conceptualmente. espacialmente coef fi modelo ciente, que define la estructura espacial
en los coeficientes de regresin fi a travs de un previo condicional
Un ejemplo temprano de una forma local de anlisis espacial es el especfica de cationes de los coeficientes que utiliza observaciones
mtodo de expansin, en el que se permite que los coeficientes de un vecinos nica o a travs de un previo fi especificacin conjunta de los
modelo de variar en funcin de las variables de expansin definido coe fi cientes que los modelos de los coeficientes como un proceso
analista-de, tpicamente usando las coordenadas de las unidades de espacial (SVCP). En cuanto a la forma en que se modela la
anlisis. Las variables de expansin se introducen usando dependencia de coe fi cientes, la especificacin condicional cacin del
formulaciones polinmicos (lineal, cuadrtico, etc.), de tal manera que modelo bayesiano es similar a un modelo GWR con un ncleo vecino
los coe fi cientes expandido incorporan variacin contextual a travs de ms cercano con un pequeo ancho de banda de los vecinos
localizaciones para producir un conjunto de resultados locales, adyacentes y la especificacin conjunta del modelo bayesiano es
mapeables tiles para detectar la deriva espacial. El mtodo de similar a una GWR modelo con un decaimiento distancia, o
expansin es una manera simple e intuitiva de los modelos de geoestadstica, la funcin kernel.
construccin, pero se limite de otra en que las expansiones son
deterministas y, dependiendo de la forma de la expansin,
posiblemente podra perder variaciones espaciales ms complejas.
Mientras GWR se ha llamado una evolucin natural del mtodo de
expansin,
Regresin ponderada geogrficamente 413
modelado. comparaciones basados en la simulacin de la exactitud de usar para sacar conclusiones con respecto a los procesos espaciales
estimados los coeficientes de regresin fi tanto de GWR y el modelo sustantivas debe siempre que sea posible ser apoyado con otras formas de
Bayesiano SVCP sugieren que el modelo Bayesiano puede ser preferible anlisis, como el mtodo de expansin, y / o de niveles mltiples o modelos
GWR para la inferencia sobre los efectos en estudio, en trminos de la bayesianos jerrquicos. Este punto de vista del mtodo sera alinearlo ms
proporcin de los intervalos estimados coeficiente de confianza que estrechamente con otras herramientas utilizadas para el anlisis de datos
contienen los valores verdaderos. Uno de los inconvenientes del modelo exploratorio. Ms apoyo proporcionado por otras tcnicas ayudara a
bayesiano se incrementa el tiempo de clculo y ms dif aplicacin fi cil para incrementar el nivel de confianza con respecto a cualquier conclusin sobre
la inferencia. Sin embargo, ms programas generalpurpose de inferencia el carcter, la naturaleza y posibles orgenes de la variacin espacial
bayesiana se est convirtiendo en disponible a travs de paquetes de cdigo relaciones entre las variables.
abierto tales como R y WinBUGS.