Vous êtes sur la page 1sur 217

Estadstica Espacial Teora y

Aplicaciones

Carlos Eduardo Melo Martnez

Universidad Distrital Francisco Jos de Caldas


Facultad de Ingeniera
Programa de Ingeniera Catastral y Geodesia
Bogot, Julio de 2015
Las ideas en estadstica espacial tienen un atractivo
esttico que puede ser apreciado por cualquiera que
tenga el tiempo y dedicacin para investigar. Temas de
interpolacin espacial se presentan en las categoras de
palabras, imgenes, frmulas, demostraciones,
aplicaciones, soluciones y problemas sin resolver. Los
lectores descubrirn emocionantes temas de estadstica
espacial: modelos de dependencia espacial, ajuste de
modelos, interpolacin determinstica local y global,
mtodos kriging y muestreo espacial. Quin debera leer
este libro? No es algo nuevo para cualquier persona de
con formacin matemtica intermedia. Los estudiantes
universitarios en especial aquellos en reas afines a
ciencias de la tierra, encontrarn motivacin para
aprender acerca del tema espacial.
Contenido

Lista de figuras v

Lista de tablas ix

Abreviaturas 1

1 Conceptos bsicos del anlisis de datos geoestadsticos 3

1.1 Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.2 Anlisis geoestadstico tradicional . . . . . . . . . . . . . . . . 5

1.2.1 Definiciones bsicas . . . . . . . . . . . . . . . . . . . . 5

1.2.2 El covariograma . . . . . . . . . . . . . . . . . . . . . 11

1.2.3 El variograma . . . . . . . . . . . . . . . . . . . . . . 11

1.2.4 El correlograma . . . . . . . . . . . . . . . . . . . . . 12

1.2.5 Parmetros del variograma . . . . . . . . . . . . . . . 13

1.3 Estimacin del variograma y del covariograma . . . . . . . . . 14

1.3.1 Estimador clsico . . . . . . . . . . . . . . . . . . . . 15

1.3.2 Estimador robusto . . . . . . . . . . . . . . . . . . . . 16

i
ii CONTENIDO

1.3.3 Estimador media recortada . . . . . . . . . . . . . . . 17

1.4 Principales modelos de variogramas y covariogramas isotrpicos 19

1.5 Estimacin de los parmetros del variograma . . . . . . . . . 23

1.5.1 Estimacin por mnimos cuadrados . . . . . . . . . . . 23

1.5.2 Estimacin mediante mxima verosimilitud . . . . . . 25

1.5.3 Anidamiento de Modelos de Semivarianza . . . . . . . 28

1.6 Pocket plot . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

1.7 Modelado Semivariograma Experimental . . . . . . . . . . . . 37

1.8 Modelado Semivariograma Anisotrpico . . . . . . . . . . . . 41

1.8.1 Estrategia general para la correccin de la anisotropa . 49

1.9 Interpolacin Espacial . . . . . . . . . . . . . . . . . . . . . . 59

1.10 Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . 61

2 Mtodos de Interpolacin Determinsticos 67

2.1 Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

2.2 Interpolacin a partir de funciones de base radial (RBF) . . . 69

2.2.1 Funciones de base radial . . . . . . . . . . . . . . . . . 70

2.2.2 Mtodo de interpolacin con RBF . . . . . . . . . . . . 76

2.2.3 Prediccin espacial con funciones de base radial . . . . 79

2.2.4 Ejemplo interpolacin con RBF . . . . . . . . . . . . . 82

2.2.5 Aplicacin interpolacin con RBF . . . . . . . . . . . . 87

2.3 Distancia Inversa Ponderada (IDW) . . . . . . . . . . . . . . . 90

2.3.1 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . 91
CONTENIDO iii

2.3.2 Aplicacin . . . . . . . . . . . . . . . . . . . . . . . . . 93

2.3.3 IDW Resumen y conclusiones . . . . . . . . . . . . . . 96

2.4 Polgonos de Voronoi (Thiessen) . . . . . . . . . . . . . . . . . 96

2.4.1 Construccin Polgonos . . . . . . . . . . . . . . . . . 97

2.4.2 Declustering . . . . . . . . . . . . . . . . . . . . . . . 98

2.4.3 Interpolacin con polgonos de Voronoi . . . . . . . . . 102

2.5 Interpolacin con Regresiones Polinomicas . . . . . . . . . . . 108

2.5.1 Cuando utilizar las regresiones Polinomicas . . . . . . . 109

2.5.2 Formulacin matemtica . . . . . . . . . . . . . . . . . 110

2.6 Diagnstico mediante validacin cruzada . . . . . . . . . . . . 112

2.6.1 Validacin cruzada leave-one-out . . . . . . . . . . . . 113

2.6.2 Validacin cruzada usando K grupos . . . . . . . . . . 116

2.7 Generalidades de las RBFs . . . . . . . . . . . . . . . . . . . . 116

2.8 Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . 118

3 Prediccin Espacial Kriging 121

3.1 Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121

3.2 Kriging Simple . . . . . . . . . . . . . . . . . . . . . . . . . . 122

3.2.1 Propiedades del predictor Z0 . . . . . . . . . . . . . . 123

3.2.2 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . 127

3.2.3 Programacin en R . . . . . . . . . . . . . . . . . . . . 131

3.3 Kriging Ordinario . . . . . . . . . . . . . . . . . . . . . . . . 132

3.3.1 Propiedades del predictor Z0 . . . . . . . . . . . . . . 133


iv CONTENIDO

3.3.2 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . 138

3.3.3 Programacin en R . . . . . . . . . . . . . . . . . . . . 141

3.4 Kriging Universal . . . . . . . . . . . . . . . . . . . . . . . . 142

3.4.1 Propiedades del predictor Z0 . . . . . . . . . . . . . . 144

3.4.2 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . 151

3.4.3 Programacin en R . . . . . . . . . . . . . . . . . . . . 154

3.4.4 Aplicacin: Temperatura media terrestre diaria en


Croacia . . . . . . . . . . . . . . . . . . . . . . . . . . 154

3.5 Kriging Indicador . . . . . . . . . . . . . . . . . . . . . . . . 158

3.5.1 Propiedades del predictor Z0 . . . . . . . . . . . . . . 161

3.5.2 Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . 163

3.5.3 Programacin en R . . . . . . . . . . . . . . . . . . . . 166

3.5.4 Aplicacin: Proteccin de Especies . . . . . . . . . . . 167

3.6 Muestreo de Datos para Interpolacin . . . . . . . . . . . . . . 176

3.6.1 Diseo de Red . . . . . . . . . . . . . . . . . . . . . . . 177

3.7 Diagnstico mediante validacin cruzada . . . . . . . . . . . . 178

3.7.1 Validacin cruzada leave-one-out . . . . . . . . . . . . 178

3.7.2 Validacin Cruzada del Modelo . . . . . . . . . . . . . 181

3.8 Ejercicios Propuestos . . . . . . . . . . . . . . . . . . . . . . . 182

Referencias 193
Lista de figuras

1.1 Forma general del variograma y covariograma de un proceso


espacial homogneo . . . . . . . . . . . . . . . . . . . . . . . . 14

1.2 Semivariograma experimental diseminacin de nquel . . . . . 30

1.3 Estimacin del alcance y meseta del semivariograma


experimental . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

1.4 Modelos experimental (en azul) y exponencial (en magenta) . 31

1.5 Seleccin de intervalos . . . . . . . . . . . . . . . . . . . . . . 32

1.6 Modelo anidado, en rojo modelo anidado, en azul modelo


experimental . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

1.7 Ubicacin espacial de una muestra de cenizas de carbn


(coal-ash), las unidades estn en % en ubicaciones reorientadas
(Cressie, 1993) . . . . . . . . . . . . . . . . . . . . . . . . . . 34

1.8 POCKET-PLOT en direccin sur-norte. . . . . . . . . . . . . 36

1.9 Localizacin de los puntos del yacimiento mineral de hierro . . 38

1.10 Construccin Semivariograma: Identificando todas las parejas


a una separacin de h pies en la direccin este-oeste . . . . . . 39

v
vi LISTA DE FIGURAS

1.11 Semivariogramas experimentales en las dos direcciones


principales para el ejemplo de mineral de hierro. . . . . . . . . 42

1.12 Ejemplos de variogramas con anisotropa; (a), anisotropa


geomtrica en direccin 30 . (b), rango anisotrpico en
direccin 30 , (c), meseta (en direccin 30 ) y rango (en
direccin 90 ) anisotrpicos, y (d), estructuras anisotrpicas
de rangos anidados en direcciones 90 y 150 . . . . . . . . . . 44

1.13 Anisotropa geomtrica. El rango mximo esta en la direccin


. Los puntos Pi y Pj estn separados a la distancia hij en la
direccin ij = ij + . [Adaptado de (Eriksson & Siska 2000).] 45

1.14 Variogramas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

1.15 Variogramas direccionales para V . . . . . . . . . . . . . . . . 52

1.16 Rangos direccionales interpolados . . . . . . . . . . . . . . . . 56

1.17 Variogramas de anisotropa corregida . . . . . . . . . . . . . . 57

1.18 Variogramas isotrpicos finales . . . . . . . . . . . . . . . . . . 58

1.19 Ejemplos de variogramas con anisotropa; (a), Localizacin


espacial muestras de zinc. (b), Teselacin de las muestras, (c),
Construccin contornos, y (d), Superficie de interpolacin . . . 60

1.20 Explicacin interpolacin bivariada . . . . . . . . . . . . . . . 61

2.1 Localicacin muestra de precipitacin . . . . . . . . . . . . . . 84

2.2 Optimizacin de , en algunas FBR . . . . . . . . . . . . . . . 85

2.3 Mapa de prediccin TPS . . . . . . . . . . . . . . . . . . . . . 86

2.4 Optimizacin de p, en IDW . . . . . . . . . . . . . . . . . . . 92


LISTA DE FIGURAS vii

2.5 Interpolacin Distancia Inversa Ponderada de la Precipitacin


(P=2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

2.6 Construccin de polgonos de Voronoi . . . . . . . . . . . . . . 98

2.7 Polgonos de Voronoi y Triangulacin de Delaunay (en trazo


continuo) a partir de una muestra . . . . . . . . . . . . . . . . 99

2.8 Localizacin de los puntos de muestreo . . . . . . . . . . . . . 100

2.9 Polgonos de Thiessen . . . . . . . . . . . . . . . . . . . . . . 102

2.10 Construccin de los pesos (reas) a partir de los polgonos de


Thiessen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104

2.11 reas de polgonos de Voronoi en Croacia . . . . . . . . . . . 105

2.12 Interpolacin Voronoi para temperatura media diaria terrestre


en Croacia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106

2.13 Ajuste conceptual de una pieza de papel a una superficie . . . 108

2.14 Ajuste polinomios en librera spatial del programa R . . . . . 112

2.15 Ajuste polinomios datos precipitacin anual 1986 en


Cundinamarca con librera spatial del programa R . . . . . . . 113

3.1 Configuracin espacial del problema. . . . . . . . . . . . . . . 127

3.2 Configuracin espacial del problema. . . . . . . . . . . . . . . 129

3.3 Configuracin espacial del problema. Los nmeros al lado de


cada lnea son distancias . . . . . . . . . . . . . . . . . . . . . 139

3.4 Localizaciones de las estaciones meteorolgicas en Croacia . . 156


viii LISTA DE FIGURAS

3.5 Mapas del variograma anisotrpico y modelos de variograma


ajustados (azimut del semieje mayor es 135 y azimut del
semieje menor es de 45 ) para los residuales de la temperatura
media terrestre. . . . . . . . . . . . . . . . . . . . . . . . . . . 157

3.6 Variograma experimental de media recortada para los


residuos, ajustando un modelo de Matrn por WLS, OLS y
REML . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158

3.7 Mapas de la temperatura media diaria terrestre en Croacia . . 159

3.8 Protocolo de observacin. Los observadores (cada uno a un


lado del avin) escanean una franja de 230 m ubicada por las
marcas en el ala. La tira se subdividi en tres franjas. . . . . . 167

3.9 Localizaciones de los puntos de muestreo (costa de Barcelona) 169

3.10 Grfico de anlisis estructural (tendencia y normalidad) de la


geodata . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170

3.11 Variograma experimental de media recortada para los


residuos, ajustando un modelo Gaussiano por WLS, WLS1
y OLS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172

3.12 Mapas de la presencia-ausencia especie Larus Michahellis


Enero 2006 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173

3.13 Mapas de la presencia-ausencia especie Larus Michahellis


Enero 2006 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175

3.14 Tipos de muestreo: a) regular, b) aleatorio, c) estratificado . . 177

3.15 Diseos de red obtenidos con kriging ordinario . . . . . . . . . 178

3.16 Configuracin espacial de 4 puntos para kriging . . . . . . . . 186


Lista de tablas

1.1 Semivariogramas experimentales para datos de concentracin


de cloruro. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

1.2 Formas funcionales de algunos variogramas . . . . . . . . . . . 21

1.3 Formas funcionales de algunos covariogramas . . . . . . . . . . 22

1.4 Ponderaciones para ajuste de la funcin de semivarianza. . . . 25

1.5 Datos para el anlisis de diseminacin de nquel . . . . . . . . 29

1.6 Clculo del semivariograma experimental en las dos


direcciones principales, para el ejemplo de la cuadrcula del
mineral de hierro. . . . . . . . . . . . . . . . . . . . . . . . . . 41

1.7 Semivarianza experimental omnidireccional . . . . . . . . . . . 62

2.1 Formas funcionales de algunas RBFs . . . . . . . . . . . . . . 75

2.2 Datos de precipitacin . . . . . . . . . . . . . . . . . . . . . . 83

2.3 Muestreo de la llanura alta de un acufero en una parte de


Kansas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

2.4 Precipitacin: Prediccin IDW usando observaciones s1 a s5 .


CDI es el cuadrado de la distancia inversa . . . . . . . . . . . 93

ix
x LISTA DE TABLAS

2.5 Datos de estaciones climticas del ro Ariari (Dpto del Meta) . 94

2.6 Calculos Declustering distancias . . . . . . . . . . . . . . . . . 101

2.7 Clculos interpolacin polgonos de Voronoi (reas) . . . . . . 104

3.1 Datos asociados a Figura 3.2 . . . . . . . . . . . . . . . . . . . 130

3.2 Calculo distancias y covarianzas (Modelo exponencial) . . . . 130

3.3 Datos asociados a Figura 3.3 . . . . . . . . . . . . . . . . . . . 139

3.4 Calculo distancias y semivarianzas (Modelo esfrico) . . . . . . 140

3.5 Calculo distancias y semivarianzas (Modelo esfrico) . . . . . . 152

3.6 Datos de precipitacin y variable indicadora . . . . . . . . . . 164

3.7 Calculo distancias y semivarianzas I (Modelo esfrico) . . . . 165


Abreviaturas

ASE: Average Standard Error (Error estndar promedio)


CRS: Completely Regularized Spline (Spline completamente regularizada)
DEM: Digital Elevation Models (Modelos digitales de elevacin)
DSEA: Distance (km) from the coast line (Distancia topogrfica en kilmetros ponderada
desde la lnea a la costa)
EXP: Exponential (Exponencial)
GAU: Gaussian (Gaussiana)
GAU: Gaussian (Gaussiana)
GLS: Generalized Least Squares (Mnimos cuadrados generalizados)
IDW: Inverse Distance Weighting (Distancia Inversa Ponderada)
IMQ: Inverse Multiquadratic (Multicuadrtica inversa)
LOESS: LOcal regrESSion (Regresin Local)
LOOCV: Leave-One-Out Cross Validation (Validacin cruzada dejando uno fuera)
MPE: Mean Prediction Errors (Media de los errores de prediccin)
MSPE: Mean Standarized Prediction Errors (Media estandarizada de los errores de
prediccin)
MQ: Multiquadratic (Multicuadrtica)
OLS: Ordinary Least Squares (Mnimos cuadrados ordinarios)
ST: Spline with Tension (Spline con tensin)
TPS: Thin Plate Spline (Spline capa delgada)
TWI: Topographic Wetness Index (ndice de humedad topogrfica)
RMSPE: Root Mean Square Prediction Errors (Raz media del cuadrado de los errores
de prediccin)
RMSSPE: Root Mean Square Standarized Prediction Errors (Raz media estandarizada del
cuadrado del error de prediccin)
RBF: Radial Basis Function (Funcin base radial)
WLS: Weighted Least Squares (Mnimos cuadrados ponderados)

1
2 ABREVIATURAS
Captulo 1

Conceptos bsicos del anlisis de


datos geoestadsticos

1.1 Introduccin

La estadstica espacial ha venido tomando fuerza en diferentes reas del


conocimiento en los ltimos aos, y en ste caso la presente propuesta se
genera a partir de una de las ramas que all se desarrollan como lo es
la geoestadstica. Esta ciencia rene mtodos que permiten modelar las
estructuras de relacin espacial en funciones denominadas variogramas o
covariogramas, y posteriormente, con la informacin que se extrae de tales
funciones se realizan interpolaciones espaciales en los mtodos denominados
kriging.

El modelamiento de variables medidas en diferentes sitios de una regin


con continuidad espacial y que presentan alguna estructura de correlacin
espacial, ha sido desarrollada desde los aos sesenta (Cressie 1993), con el
desarrollo de los anlisis geoestadsticos (Matheron 1962), incrementndose
4 Captulo 1. Conceptos bsicos del anlisis de datos geoestadsticos

su uso en diferentes disciplinas cientficas como la minera (Journel &


Huijbregts 1978), geologa (Samper & Carrera 1993), ecologa (Robertson
1987)), ciencias ambientales (Cressie & Majure 1995, Diggle et al. 1995, Paez
et al. 2005), salud pblica (Haining 2004), y climatologa (Perec Tadi
2010, Hengl et al. 2012, Yavuz & Erdogan 2012). Los anlisis geoestadsticos
convencionales contemplan una serie de pasos (Isaaks & Srisvastava 1989),
que van desde el anlisis estructural, el cual se realiza en el anlisis del
variograma (Samper & Carrera 1993), obteniendo en lo posible un modelo
de variograma terico (esfrico, exponencial, Gaussiano, circular o de Matrn,
entre otros que estn disponibles), el cual es usado en la interpolacin de la
variable en los sitios no muestreados.

En este captulo se presentan algunos conceptos bsicos en su mayora


tomados de Cressie (1993) y Martnez (2008), sobre anlisis geoestadstico
que son tiles para el desarrollo de las metodologas propuestas en cada
uno de los siguientes captulos. Por lo tanto, se describe brevemente los
principales conceptos y resultados utilizados en el anlisis de datos espaciales,
muchos de los cuales se generalizarn con el fin de poder aplicarlos a procesos
espacio-temporales. En estos ltimos se definen los principales conceptos
involucrados en su estudio y sus propiedades, as como los diferentes
procedimientos de ajuste y prediccin.

La Seccin 1.2 introduce los conceptos ms relevantes que se utilizaran en


el anlisis espacial, como son la estacionariedad, la isotropa, el covariograma
o el variograma. En la Seccin 1.3 se muestran los principales estimadores
del variograma y covariograma. En la Seccin 1.4 se presentan los principales
modelos de variogramas y covariogramas isotrpicos. En las Secciones
1.5 y 1.7 se profundiza en el ajuste de los modelos anteriores mediante
las principales tcnicas de estimacin, se introducen las herramientas de
prediccin espacial ms relevantes, y se muestra algunas herramientas de
1.2 Anlisis geoestadstico tradicional 5

diagnstico de los modelos ajustados, respectivamente.

1.2 Anlisis geoestadstico tradicional

Cressie (1993) muestra una formulacin general que permite la modelizacin


de todas estas posibilidades. Sea s una localizacin cualquiera del espacio
Euclidiano d-dimensional Rd (en general d = 2, aunque no necesariamente),
suponga que se esta interesado en analizar un determinado fenmeno de
inters que toma un valor aleatorio Z(s) en cada localizacin s. Si ahora se
permite que s vare sobre un determinado conjunto D Rd , se tendr el
proceso aleatorio {Z(s), s D}, que es el objeto de estudio de la estadstica
espacial. La geoestadstica estudiar aquellos fenmenos en los que el ndice
espacial s vare de forma continua sobre toda la regin de estudio D. En
este sentido, en esta tesis se supondr que D es una determinada regin fija
y continua de estudio y que el ndice espacial s vara de forma continua en
D, es decir, existe un nmero infinito de posibles localizaciones en las que
se observa el proceso. El proceso objeto de estudio Z(s) podra representar,
por ejemplo, la temperatura media diaria observada en una determinada
localizacin s.

1.2.1 Definiciones bsicas

A lo largo de todo este captulo se supondr que, para cada localizacin


s D, existe la media y la varianza del proceso que se denotarn por

(s) = E(Z(s)) < Var(Z(s)) <

Definicin 1.1. Se dice que el proceso Z(s) es Gaussiano si para cualquier


conjunto de localizaciones {s1 , . . . , sn } D, el vector aleatorio Z s =
(Z(s1 ), . . . , Z(sn ))0 sigue una distribucin normal multivariante.
6 Captulo 1. Conceptos bsicos del anlisis de datos geoestadsticos

Definicin 1.2. Sea Z(s) un proceso estocstico de segundo orden. Se define


su funcin de covarianza como

C(si , sj ) = C(Z(si ), Z(sj )), si , sj D

Generalmente en la prctica slo se dispone de un conjunto


{z(s1 ), . . . , z(sn )} de observaciones del proceso aleatorio {Z(s), s D}
obtenidas sobre un conjunto de localizaciones {s1 , . . . , sn }, que pueden
distribuirse de forma regular sobre una rejilla o de forma irregular sobre
la regin de estudio D Rd . Por lo tanto, slo se dispone de una nica
realizacin incompleta del proceso aleatorio que se quiere analizar, por lo que
sera necesario asumir algn tipo de hiptesis simplificadora de la naturaleza
del proceso que asegure cierta regularidad en los datos y permita hacer
estimaciones e inferencias del modelo a partir de los datos observados. Esta
condicin es la de estacionariedad, que permite que el proceso se repita
a si mismo en el espacio, proporcionando la replicacin necesaria para la
estimacin e inferencia del modelo. A continuacin se ver los principales
tipos de estacionariedad que generalmente se asume en los procesos a
analizar.

Definicin 1.3. Se dice que el proceso Z(s) es estrictamente estacionario (o


estacionario en sentido fuerte) si, para cualquier conjunto de localizaciones
{s1 , . . . , sn } D, la funcin de distribucin conjunta de las variables
aleatorias {Z(s1 ), . . . , Z(sn )} permanece invariable ante una traslacin.
Sea Fs1 ,...,sn (z1 , ..., zn ) = P (Z(s1 ) z1 , . . . , Z(sn ) zn ) la funcin de
distribucin conjunta, entonces se cumple que

Fs1 ,...,sn (z1 , . . . , zn ) = Fs1 +h,...,sn +h (z1 , . . . , zn ), h Rd

Esta condicin es demasiado restrictiva para la mayora de los fenmenos


observados en la naturaleza, por lo que se necesita algn tipo de relajacin
1.2 Anlisis geoestadstico tradicional 7

de la misma, como la estacionariedad de segundo orden o la estacionariedad


intrnseca.

Definicin 1.4. Se dice que un proceso espacial Z(s) es estacionario de


segundo orden (o estacionario en sentido dbil o simplemente estacionario)
si

1. La funcin media existe y no depende de la localizacin, esto es, (si ) =


, si D.

2. La funcin de covarianza existe y slo depende de la distancia entre


las localizaciones involucradas, esto es, C(si , sj ) = C(h), si , sj D,
siendo h = si sj el vector distancia entre dichas localizaciones. La
funcin C() recibe el nombre de covariograma (o autocovarianza).

De la definicin se deduce que si un proceso de segundo orden es


estrictamente estacionario, entonces es estacionario de segundo orden. El
recproco es falso en general, aunque se cumple para los procesos Gaussianos,
que quedan completamente caracterizados por su media y su covariograma.

La estacionariedad de segundo orden implica que la varianza del proceso


no depende de la localizacin, es decir, que

Var(Z(s)) = C(0) = 2 , s D,

donde C(0) recibe el nombre de varianza a priori del proceso.

Definicin 1.5. Se dice que el proceso Z(s) es intrnsecamente estacionario


si

i. La funcin media existe y no depende de la localizacin, esto es, (si ) =


, si D.
8 Captulo 1. Conceptos bsicos del anlisis de datos geoestadsticos

ii. La varianza de la diferencia de dos variables aleatorias para dos


localizaciones cualesquiera depende nicamente de la distancia entre
las localizaciones involucradas, esto es, Var(Z(si ) Z(sj )) =
2(h), si , sj D, con h = si sj . La funcin 2() recibe el nombre
de variograma, mientras que () se conoce como semivariograma.

Esta condicin es la menos restrictiva de las ltimas tres definiciones


dadas, ya que dado un proceso estacionario Z(s) de segundo orden con
covariograma C(), entonces

Var(Z(si ) Z(sj )) =Var(Z(si )) + Var(Z(sj )) 2Cov(Z(si ), Z(sj ))


=2C(0) 2C(si sj )

por lo que el proceso Z(s) es intrnsecamente estacionario con variograma

2(h) = 2C(0) 2C(h) (1.1)

Para que un proceso intrnsecamente estacionario lo sea tambin de


segundo orden, deber tener un semivariograma acotado, esto es, con
lim (h) = M < +, en cuyo caso su covariograma existe y es igual a
h
C(h) = M (h).

Definicin 1.6. Se dice que el proceso Z(s) es isotrpico si la dependencia


espacial del proceso entre dos localizaciones cualesquiera depende nicamente
de la distancia existente entre ellas y no de su localizacin. En caso contrario
se dice que el proceso es anisotrpico.

Definicin 1.7. Se dice que el proceso Z(s) es homogneo si es


intrnsecamente estacionario e isotrpico.

Si Z(s) es un proceso homogneo, entonces su semivariograma es una


funcin que, para cada par de localizaciones, depende nicamente de la
1.2 Anlisis geoestadstico tradicional 9

longitud del vector distancia entre ellas, esto es, (h) = (h), h Rd ,
siendo h khk. En cambio si un proceso intrnsecamente estacionario Z()
es anisotrpico, la dependencia entre Z(s) y Z(s + h) ser funcin tanto de
la magnitud como de la direccin de h, por lo que el variograma no ser
nicamente una funcin de la distancia entre dos localizaciones espaciales.
Las anisotropas estn causadas por procesos subyacentes que se comportan
de forma diferente en el espacio. Hay varias formas de trabajar con procesos
anisotrpicos, considerndolos como generalizaciones ms o menos directas
de procesos isotrpicos. A continuacin se presentan las ms usuales.

Definicin 1.8. Se dice que el proceso Z(s) tiene anisotropa geomtrica si


su variograma es de la forma

2(h) = 20 (kAhk) , h Rd ,

siendo 0 un semivariograma isotrpico y A una matriz d d que representa


una determinada transformacin lineal en Rd .

De otro lado, se tiene que dados Z1 (), . . . , Zn (), n procesos


intrnsecamente estacionarios independientes, entonces Z1 () + + Zn ()
es un proceso intrnsecamente estacionario con semivariograma dado por
(h) = 1 (h) + + n (h), siendo i (h) el semivariograma del proceso Zi ().
Esta propiedad permite definir la siguiente generalizacin de la anisotropa
geomtrica.

Definicin 1.9. Se dice que el proceso Z(s) tiene anisotropa zonal si su


variograma es de la forma
n
X
2(h) = 2 0 (kAi hk)
i=1

siendo 0 un semivariograma isotrpico y A1 , ..., An matrices d d.


10 Captulo 1. Conceptos bsicos del anlisis de datos geoestadsticos

Otro tipo de tratamiento de la anisotropa es la de suponer que, dado


el proceso original Z(s), existe una funcin no lineal g(s), de forma que
el proceso Z(g(s)) es un proceso isotrpico estacionario. Esta idea permite
analizar tanto la anisotropa como la no estacionariedad, como se puede ver
en Sampson & Guttorp (1992).

En ocasiones se trabaja con procesos en los que la hiptesis de


estacionariedad no podra ser admitida, por lo que muchas de las tcnicas de
la geoestadstica clsica no sern directamente aplicables. En los ltimos
aos han surgido gran nmero de mtodos para modelizar este tipo de
procesos no estacionarios. Probablemente el ms estudiado es el propuesto
por Sampson & Guttorp (1992), que presenta un procedimiento de estimacin
no paramtrica para la estructura de covarianza espacial no estacionaria.
Haas (1995) introduce una tcnica de kriging de ventanas mviles para
la estimacin en procesos no estacionarios. Higdon et al. (1999) proponen
una alternativa usando una representacin de medias mviles de un proceso
Gaussiano. Nychka & Saltzman (1998) y Holland et al. (1999) desarrollan
mtodos que extienden la tcnica de funciones ortogonales empricas, muy
utilizada por los meteorlogos. Otro modelo para procesos no estacionarios
es el propuesto por Fuentes (2001), Fuentes (2002a), Fuentes (2002b) y
desarrollado tambin en Fuentes & Smith (2001). En este modelo, se
considera que el proceso es localmente un campo aleatorio estacionario e
isotrpico, que se representar con un modelo cuyos parmetros variaran a
lo largo de la regin de estudio, lo que permite la realizacin de predicciones
sobre el campo aleatorio no estacionario con una nica realizacin del proceso.
1.2 Anlisis geoestadstico tradicional 11

1.2.2 El covariograma

Dado un proceso estacionario de segundo orden Z(), se ha definido su


covariograma como
C(h) = Cov(Z(si ), Z(sj ))

con si , sj D y h = si sj el vector distancia entre dichas localizaciones.


De su definicin se deduce fcilmente que C(h) = C(h). Adems, por la
desigualdad de Cauchy-Schwartz se cumple que |C(h)| C(0), h Rd .

La funcin de covarianza C() de un proceso estacionario de segundo


orden debe ser definida positiva, esto es, debe cumplir
n X
X n
i j C(si sj ) 0 (1.2)
i=1 j=1

para cualquier nmero finito de localizaciones espaciales {si , i = 1, . . . , n}


y de nmeros reales {i , i = 1, . . . , n}. Esto es evidente de la definicin de
covariograma, ya que
n X
n n
!
X X
i j C(si sj ) = V ar i Z(si ) 0
i=1 j=1 i=1

1.2.3 El variograma

Se ha definido el variograma de un proceso intrnsecamente estacionario Z()


como la funcin
2(h) = V ar(Z(si ) Z(sj )) (1.3)

con si , sj D y h = si sj el vector distancia entre dichas localizaciones.


De (1.3) se deduce fcilmente que (h) = (h) y que (0) = 0. Obsrvese
que el variograma, al contrario del covariograma, no depende de la media del
proceso, lo que como se ver tendr implicaciones en la estimacin de ambos.
12 Captulo 1. Conceptos bsicos del anlisis de datos geoestadsticos

Una condicin necesaria que debe cumplir el variograma es que debe ser
una funcin condicionalmente definida negativa, esto es,
n X
X n
i j 2(si sj ) 0 (1.4)
i=1 j=1

para cualquier conjunto finito de localizaciones espaciales {s1 , . . . , sn } Rd


P n
y para cualquier conjunto de nmeros reales {1 , . . . , n } R con i = 0.
i=1
n
P
Esto es evidente de su definicin, ya que dados {1 , . . . , n } R con i =
i=1
0, entonces
n X
X n n X
X n
i j 2(si sj ) = 2 i j Cov(Z(si ), Z(sj ))
i=1 j=1 i=1 j=1
n
!
X
= V ar i Z(si ) 0
i=1

Otra condicin que debe satisfacer un variograma (Matheron 1971) es que


debe tener un ritmo de crecimiento inferior al de h2 , esto es

2(h)
lim =0
h h2

1.2.4 El correlograma

Sea Z() un proceso estacionario de segundo orden con funcin de covarianza


C(). Se tiene que C(0) = Cov(Z(s), Z(s)) = Var(Z(s)), por lo que C(0) > 0
a no ser que Z() sea un proceso constante en D. Se define el correlograma
(o funcin de autocorrelacin) como

C(h)
(h) =
C(0)

De la definicin se desprende que (h) = (h) y que (0) = 1.


1.2 Anlisis geoestadstico tradicional 13

1.2.5 Parmetros del variograma

El semivariograma representa un ndice del cambio que una variable muestra


con la distancia. Generalmente, el semivariograma crece con la distancia, ya
que en la mayora de procesos existen mayores similitudes en los valores
observados en localizaciones prximas, que disminuyen al aumentar la
distancia.

En ocasiones, este crecimiento del semivariograma con la distancia se


estabiliza alrededor de un determinado valor cs > 0, que es una cota superior
de la funcin (esto es, cs = lim (h)). En este caso se dice que el variograma
h
es acotado y el valor alrededor del cual se estabiliza recibe el nombre de
meseta o varianza a-priori (sill, en ingls), que es igual por (1.1) a C(0), siendo
C() el covariograma del proceso. Se llama rango (range, en ingls) al valor
hr en el que el semivariograma alcanza su meseta, esto es, la distancia para el
que (hr ) = cs y que representa el valor a partir del cual el covariograma se
anula. Para algunos semivariogramas transitivos, la meseta cs slo se alcanza
asintticamente en el lmite, por lo que estrictamente hablando el variograma
tendr rango infinito. En este caso se utilizar el trmino de rango efectivo,
que se define como la distancia en la que el semivariograma alcanza el 95%
de su meseta.

Se sabe que el semivariograma es una funcin que debe cumplir que


(0) = 0, pero en la prctica suele ocurrir que lim (h) = c0 > 0, donde
h0
c0 recibe el nombre de pepita (nugget, en ingls). Esta discontinuidad en
el origen puede estar causada por variaciones de pequea escala (que slo
tienen sentido en procesos que no son L2 -continuos), o por errores de medida
(es decir, que si se realizan varias observaciones en una misma localizacin,
los valores observados fluctan alrededor de un determinado valor, que es el
valor real). En la prctica, slo se habrn observado un conjunto de datos
{z(si ), i = 1, ..., n}, por lo que no se puede conocer nada del comportamiento
14 Captulo 1. Conceptos bsicos del anlisis de datos geoestadsticos

del variograma a distancias menores de min{ksi sj k, 1 i < j n}


y se suele determinar el valor de c0 extrapolando el comportamiento del
variograma a distancias cercanas a cero. En este caso, se define la meseta
parcial (partial sill, en ingls) como cs c0 .

Si el proceso Z() es isotrpico, entonces 2(h) = 2(h), es decir, el


variograma depende nicamente de la distancia entre dos localizaciones y no
de la direccin. En la Figura 1.1 se muestra la forma tpica del variograma
de un proceso homogneo y de su covariograma asociado, donde se puede
observar la interpretacin de los parmetros introducidos anteriormente.

Figura 1.1: Forma general del variograma y covariograma de un proceso espacial


homogneo

1.3 Estimacin del variograma y del


covariograma

Dado un proceso espacial Z() intrnsecamente estacionario, se va obtener


una estimacin del variograma 2() (y del covariograma C() si el proceso
1.3 Estimacin del variograma y del covariograma 15

es adems estacionario de segundo orden) a partir de los valores observados


sobre un conjunto de localizaciones {s1 , . . . , sn }. Del conjunto de estimadores
propuestos en la literatura para la estimacin de estas medidas de variabilidad
espacial, se vera a continuacin el estimador clsico propuesto por Matheron
(1962) o el estimador robusto de Cressie & Hawkins (1980).

1.3.1 Estimador clsico

La estimacin del variograma ms sencillo es la obtenida mediante el


estimador del mtodo de los momentos, que recibe el nombre de estimador
clsico del variograma. Se tiene que, bajo la hiptesis de estacionariedad
intrnseca y por tanto de media del proceso constante, se cumple que

2(h) = V ar(Z(s + h) Z(s)) = E[(Z(s + h) Z(s))2 ]

Si los puntos de muestreo {s1 , . . . , sn } estuviesen localizados sobre una


rejilla regular, el estimador del mtodo de los momentos vendr definido por
1 X
2(h) = (Z(si ) Z(sj ))2 (1.5)
|N (h)|
(si ,sj )N (h)

donde N (h) denota todos aquellos pares (si , sj ) para los que si sj = h y
|N (h)| denota el cardinal de N (h). Obsrvese que no es necesario estimar la
media del proceso.

Debido a que (1.5) es esencialmente una media muestral, tiene todas


las desventajas asociadas comnmente a este tipo de estimadores como
la no robustez. Se trata de un estimador no paramtrico que es ptimo
cuando se dispone de una malla regular de muestreo que sea representativa
y la distribucin es normal. No obstante, en la prctica el empleo de
este estimador produce en ocasiones variogramas experimentales errticos,
debido a desviaciones del caso ideal para la aplicacin del mismo, como son
16 Captulo 1. Conceptos bsicos del anlisis de datos geoestadsticos

distribuciones alejadas de la normalidad, heterocedasticidad, desviaciones en


el muestreo o existencia de valores atpicos.

Para la covarianza, el estimador obtenido por el mtodo de los momentos


sera
X
C(h)
b = |N (h)| (Z(si ) Z)(Z(sj ) Z)
(si ,sj )N (h)
n
1
P
donde Z = n
Z(si ) es un estimador de la media del proceso y N (h) se
i=1
define como antes.

1.3.2 Estimador robusto

Como se coment anteriormente, aunque el mtodo de estimacin clsico


presenta la ventaja de su facilidad de clculo, tiene algunos inconvenientes
prcticos como que no es robusto frente valores extremos de Z(s). Cressie
& Hawkins (1980) presentan una variacin de (1.5) de mayor robustez como
estimador insesgado del variograma y que se define como
4
1 1
X
2(h) = |Z(si ) Z(sj )|1/2 (1.6)
0.457 + 0.494/|N (h)| |N (h)|
(si ,sj )N (h)

Los coeficientes de la expresin (1.6) se introducen para asegurar la


insesgadez del estimador propuesto. En Cressie (1993) se encuentra un
anlisis detallado de este estimador comparado con el anterior, as como otras
variantes robustas para la estimacin emprica del variograma, a continuacin
una de ellas.
1.3 Estimacin del variograma y del covariograma 17

1.3.3 Estimador media recortada

Los dos estimadores anteriores son generalmente sesgados en presencia de


informacin atpica, afectando la estimacin, por lo cual es recomendable el
uso de estimadores robustos como el de (Cressie & Hawkins 1980) o la media
recortada (trim.m) establecida en (Bardossy et al. 1997) y dado por
h  1
i4
trim.m |Z(si ) Z(sj )| 2
2(h) = (1.7)
0.457 + 0.494/N (h)

Una vez que el variograma experimental se encuentra, se ajusta el modelo


del variograma. Hay varios mtodos de estimacin de parmetros, tales
como mnimos cuadrados ordinarios (OLS), mnimos cuadrados ponderados
(WLS), mxima verosimilitud (ML) y mxima verosimilitud restringida
(REML). Los dos ltimos requieren la normalidad, mientras que los dos
primeros no.

Ejemplo: variograma media recortada

Para el caso de la media recortada se programo la funcin 1.7, modificando


la suma de la formula de Cressie-Hawkins por la media recortada, en esta
propuesta el usuario puede escoger el porcentaje de recorte. En el caso en que
el porcentaje sea del 50%, este estimador coincidir con el de la mediana, el
cual es ms robusto frente a la presencia de datos atpicos, mientras que si
el porcentaje de recorte es del 0%, el estimador coincidir con el estimador
robusto de Cressie-Hawkins. En (Brdossy 2001) se compara el estimador
clsico, robusto y de la media recortada (con un 10% de recorte), se considera
un atpico, ver Tabla 1.1 bajo. Se encuentra que el estimador de la media
recortada arroja mejores resultados ante la presencia de datos atpicos y
por ende es ms robusto, resultados similares se muestran por medio de
simulaciones en (Roustant et al. 2007).
18 Captulo 1. Conceptos bsicos del anlisis de datos geoestadsticos

Tabla 1.1: Semivariogramas experimentales para datos de concentracin de


cloruro.

FUENTE: Tomado de la Tabla 3.2 (Brdossy 2001)

Clasico Cressie-Hawkins Media recortada


Distancia Datos Con un Datos Con un Datos Con un
(km) atpico atpico atpico
1 128.3 128.3 49.6 49.6 33.0 33.0
2 294.2 9903.1 152.0 220.0 120.5 120.5
3.0 405.8 405.8 298.9 298.9 196.4 196.4
4.0 484.4 6523.4 307.0 374.4 243.1 243.1
5.0 349.1 13197.7 236.8 385.7 152.8 156.8
6.0 442.5 18273.1 256.2 455.9 184.3 184.3
7.0 344.4 4674.6 255.6 295.7 165.1 165.1
8.0 435.3 22363.6 313.0 618.7 212.5 212.5
9.0 424.6 12184.0 301.0 439.7 202.4 202.4
10.0 395.6 22347.6 251.3 525.5 168.5 168.5

La funcin est.variograms() del paquete geospt esta construida a


partir de la funcin est.variogram() del paquete sgeostat en https://
cran.r-project.org/web/packages/sgeostat, se implementa la media
recortada en su funcionamiento. Como ejemplo se considera la base de datos
maas del paquete sgeostat, especificando un recorte del 10% a continuacin:

library(sgeostat)
library(geospt)
data(maas)
maas.point <- point(maas)
maas.pair <- pair(maas.point, num.lags=24, maxdist=2000)
maas.v <- est.variograms(maas.point,maas.pair,zinc,trim=0.1)
maas.v
1.4 Principales modelos de variogramas y covariogramas isotrpicos 19

El resultado es el siguiente:

lags bins classic robust med trimmed.mean n


1 41.66667 101947.2 65465.76 36286.13 57015.22 31
2 125.00000 113158.9 61238.92 33444.66 51991.43 184
3 208.33333 143501.3 79790.82 53728.38 67770.61 279
4 291.66667 177257.6 101478.44 63406.79 86754.46 336
5 375.00000 239373.8 144476.65 103685.85 125286.53 367
6 458.33333 233764.5 145387.50 115946.06 125355.24 404
7 541.66667 273382.4 194285.17 186095.48 177289.00 421
8 625.00000 280300.4 197139.93 215218.63 180371.19 441
9 708.33333 308830.8 227925.27 273564.52 207709.69 455
10 791.66667 297263.4 225228.13 240608.52 210802.15 447
11 875.00000 337402.5 250439.56 276672.91 230168.09 461
12 958.33333 321287.9 226290.79 246422.02 199083.61 433
13 1041.66667 342465.0 252177.03 262795.80 229030.66 417
14 1125.00000 371965.3 289594.79 303591.84 271317.58 387
15 1208.33333 309236.5 232539.63 234756.15 212280.02 386
16 1291.66667 315844.0 239704.08 238300.05 217875.01 360
17 1375.00000 347594.5 239448.38 246261.11 210848.17 343
18 1458.33333 300932.6 226781.23 226889.51 203460.52 354
19 1541.66667 290834.7 210952.98 183415.61 190246.32 330
20 1625.00000 260444.7 197217.81 163738.82 174456.98 327
21 1708.33333 315371.1 228165.97 206878.84 205701.77 319
22 1791.66667 270525.7 198176.63 163732.14 181498.03 323
23 1875.00000 255374.6 174233.92 147363.74 155691.27 288
24 1958.33333 275440.4 193038.79 168454.22 171184.29 277

1.4 Principales modelos de variogramas y


covariogramas isotrpicos

En la seccin anterior se vio algunos estimadores del variograma o


covariograma de los procesos espaciales. El problema es que estas
estimaciones no se pueden utilizar directamente en la prctica geoestadstica
ya que no satisfacen en general la condicin de ser condicionalmente definidas
negativas que deben verificar los variogramas (o definidas positivas para
los covariogramas). Su uso tendr efectos no deseables, como la obtencin
20 Captulo 1. Conceptos bsicos del anlisis de datos geoestadsticos

de varianzas negativas en la prediccin espacial mediante kriging. Es por


ello que, en lugar de utilizar directamente las predicciones, se ajustar a
las estimaciones obtenidas anteriormente uno de los modelos vlidos de
variograma o covariograma que se vern en esta seccin.

En las Tablas 1.2 y 1.3 se presentan algunos de los principales modelos


de variogramas isotrpicos ms utilizados en la prctica geoestadstica, junto
con sus covariogramas. Como se ha visto, para obtener los correspondientes
variogramas bastara con multiplicar por 2 cada una de las funciones
de semivariograma. Estos modelos, adems de constituir una herramienta
esencial del tratamiento de los datos geoestadsticos, servirn como base para
la posterior construccin de modelos espacio-temporales. Como se ha dicho,
todos los variogramas y covariogramas que se muestran en dichas tablas
son isotrpicos, es decir, dependen de la distancia h entre localizaciones
nicamente por su mdulo h = khk), ya que son el punto de arranque sobre
los que se construyen modelos ms complejos.
1.4 Principales modelos de variogramas y covariogramas isotrpicos 21

Tabla 1.2: Formas funcionales de algunos variogramas

Modelo Funcin de Semivariograma Variograma

2.0
con Efecto pepita

1.5

c0 si h > 0

Variograma
1.0
(h) =

0.5
0 si h = 0

0.0
0.0 0.2 0.4 0.6 0.8 1.0
Distancia

1.0

0 si h = 0

0.8

Variograma

0.6

h

(h) = c0 + cs si 0 < h al
meseta

0.4
al
Lineal

0.2


c + c si h > al
0 s

0.0
0.0 0.2 0.4 0.6 0.8 1.0
Distancia

1.0

0 si h = 0

0.8

Variograma

Esfrico

0.6

3 h 1 h 3

(h) = c0 + cs 2 ( as ) 2 ( as ) si 0 < h as

0.4

0.2


c + c si h > as
0 s

0.0
0.0 0.2 0.4 0.6 0.8 1.0
Distancia
Exponencial

1.0
0.8

c0 + cs 1 exp(3h/ae )
Variograma
si h > 0
0.6

(h) =
0.4

0 si h = 0
0.2
0.0

0.0 0.2 0.4 0.6 0.8 1.0


Distancia
1.0
Gaussiano

0.8


c0 + cs 1 exp(3h2 /ag 2 )
Variograma

si h > 0
0.6

(h) =
0.4

0 si h = 0
0.2
0.0

0.0 0.2 0.4 0.6 0.8 1.0


Distancia


0 si h = 0
1.0




0.8



c0 + cs 1 2 cos1 ( h )+
Variograma
Circular


0.6

ac
(h) =
0.4

q
2h h

a (1 a )
2 si 0 < h ac
0.2


c c

0.0


c0 + cs si h > ac
0.0 0.2 0.4 0.6 0.8 1.0
Distancia
1.5


1.0

sin(h) 
Variograma

c0 + cs 1 si h > 0
agujero

h
(h) =
Efecto

0.5

0 si h = 0
0.0

0.0 0.5 1.0 1.5


Distancia
22 Captulo 1. Conceptos bsicos del anlisis de datos geoestadsticos

Tabla 1.3: Formas funcionales de algunos covariogramas

Modelo Funcin de Covariograma Covariograma

2.0
con Efecto pepita

1.5

Covariograma
0 si h > 0

1.0
C(h) =

0.5
c si h = 0
0

0.0
0.0 0.2 0.4 0.6 0.8 1.0
Distancia

1.0

c + cs si h = 0

0.8

0

Covariograma

0.6
C(h) = cs 1 ah

si 0 h al
meseta

0.4
Lineal

0.2


0 si h > al

0.0
0.0 0.2 0.4 0.6 0.8 1.0
Distancia

1.0

c + cs si h = 0

0.8

0

Covariograma

Esfrico

0.6
C(h) = cs 1 23 ( ah ) + 12 ( ah )3

si 0 < h as

0.4
s s

0.2


0 si h > as
0.0
0.0 0.2 0.4 0.6 0.8 1.0
Distancia
1.2
Exponencial

1.0


0.8
Covariograma

cs exp(3h/ae ) si h > 0
0.6

C(h) =
0.4

c + c si h = 0
0 s
0.2
0.0

0.0 0.2 0.4 0.6 0.8 1.0


Distancia
1.2
1.0
Gaussiano


0.8
Covariograma

cs exp(3h2 /ag 2 ) si h > 0


0.6

C(h) =
0.4

c + c si h = 0
0 s
0.2
0.0

0.0 0.2 0.4 0.6 0.8 1.0


Distancia
1.2


c0 + cs si h = 0
1.0




0.8


Covariograma

c1 2 cos1 ( h )
Circular


ac
0.6

C(h) = q
0.4

2h h


ac (1 ac )2 si 0 < h ac
0.2




0.0


0 si h > ac
0.0 0.2 0.4 0.6 0.8 1.0
Distancia
1.0


Covariograma

cs sin(h)  si h > 0
0.5
agujero

h
(h) =
Efecto

c + c si h = 0
0 s
0.0

0.0 0.5 1.0 1.5


Distancia
1.5 Estimacin de los parmetros del variograma 23

1.5 Estimacin de los parmetros del


variograma

Sea Z() un proceso observado sobre un conjunto de localizaciones


{s1 , . . . , sn }. Sean (hj ) los valores estimados del semivariograma a partir de
los datos aplicando alguno de los mtodos que se han visto en la Seccin 1.2.
Aunque son muchas las buenas propiedades de estos estimadores, carecen
de la propiedad de ser semidefinidos positivos, con lo que sera posible
que algunas predicciones espaciales derivadas a partir de tales estimadores
presenten varianzas negativas. La forma ms comn de evitar esta dificultad
es reemplazando el semivariograma emprico por algn modelo paramtrico
(h, ) de los que se han presentado anteriormente que se aproxime a la
dependencia espacial encontrada por el semivariograma emprico, y del que
se sabe cumple la condicin de ser semidefinido positivo. Obsrvese que, en
general, no es necesario restringirse a modelos isotrpicos, aunque suelen ser
los primeros que son considerados.

El objetivo ser elegir de entre todos los semivariogramas posibles


{(h, ), } aqul que mejor se ajuste a las observaciones realizadas,
obteniendo con ello un modelo de semivariograma que ms tarde ser
utilizado en el proceso de prediccin espacial. En esta seccin se ver los
principales mtodos de estimacin.

1.5.1 Estimacin por mnimos cuadrados

La estimacin por mnimos cuadrados ordinarios (OLS) consiste en obtener


el valor que minimiza
n
X
((hj ) (hj , ))2 = [ ()]0 [ ()]
j=1
24 Captulo 1. Conceptos bsicos del anlisis de datos geoestadsticos

siendo = [(h1 ), . . . , (hn )]0 y () = [(h1 , ), . . . , (hn , )]0 . Un


problema que presenta este procedimiento es que en este caso las estimaciones
estn correladas y tienen varianzas diferentes.

Una solucin es aplicar mnimos cuadrados generalizados (GLS), que


consiste en minimizar

[ ()]0 V ()1 [ ()]

siendo V () la matriz de varianzas-covarianzas de , que depende del valor


desconocido y cuyos elementos pueden ser adems difciles de estimar.

Un compromiso entre las dos anteriores es la estimacin por mnimos


cuadrados ponderados (WLS), que consiste en minimizar
n
X
wj [(hj ) (hj , )]2 = [ ()]0 W ()1 [ ()] (1.8)
j=1

siendo W () una matriz diagonal cuyos elementos son las varianzas de , las
cuales pueden aproximarse bajo la hiptesis que el proceso es Gaussiano y las
estimaciones son incorreladas por 2(hj , )2 /N (hj ), con N (hj ) el nmero de
localizaciones a distancia hj . Por tanto, los pesos de (1.8) vendrn dados por
wj = N (hj )/(2(hj , )2 ). En la prctica en el programa R se suele usar de
la libreria gstat la funcin fit.variogram los pesos se muestran en la siguiente
Tabla:
1.5 Estimacin de los parmetros del variograma 25

Tabla 1.4: Ponderaciones para ajuste de la funcin de semivarianza.

Tomado de (Pebesma 2001)

Ajuste Programa Ponderacin


0 - - (no fit)
1 gstat N (hj )
2 gstat N (hj )/(2(hj )2 )
3 gnuplot N (hj )
4 gnuplot N (hj )/(2(hj )2 )
5 gstat REML
6 gstat No weights (OLS)
7 gstat N (hj )/(hj )2

En general, los tres estimadores OLS, WLS y GLS aparecen en orden


creciente de eficiencia pero decreciente en simplicidad, siendo la estimacin
por mnimos cuadrados ponderados la ms utilizada en la prctica estadstica
debido a la facilidad de su implementacin y a las ventajas computacionales
que presenta. No obstante, presenta inconvenientes prcticos como, por
ejemplo, depende de las estimaciones del semivariograma, son correladas,
muy sensibles a la seleccin de las distancias y las regiones de tolerancia
utilizadas para su clculo.

1.5.2 Estimacin mediante mxima verosimilitud

Supngase que el proceso espacial analizado es un proceso Gaussiano, el cual


se puede escribir como

Z(si ) = (si ) + (si ) i = 1, . . . , n (1.9)


26 Captulo 1. Conceptos bsicos del anlisis de datos geoestadsticos

donde la media del proceso (si ) = 0 + v(si )0 es una funcin lineal de un


conjunto de p regresores y (si ) representa el error espacial, con v(si ) =
(v1 (si ), . . . , vp (si ))0 es un vector que contiene las variables explicativas
asociadas a la localizacin espacial si , 0 es el parmetro desconocido asociado
al intercepto, y = (1 , . . . , p )0 es un vector de parmetros desconocidos.
En este caso es bastante sencillo obtener la forma exacta de la verosimilitud
y maximizarla numricamente.

En forma matricial el modelo (1.9) se puede expresar como:

Z s = V + s (1.10)

donde Z s = (Z(s1 ), . . . , Z(sn ))0 , V = (1, V1 , . . . , Vn ) es la matriz de diseo


de dimensin n (p + 1) con el vector de intercepto 1 de dimensin n 1 y p
variables explicativas Vj = (vj (s1 ), . . . , vj (sn ))0 de dimensin n 1, con j =
1, . . . , p. Adems, = (0 , 0 )0 el vector de dimensin (p+1)1 de parmetros
desconocidos, s = ((s1 ), . . . , (sn ))0 y la matriz de varianzas-covarianzas
de las observaciones. La estimacin mediante mxima verosimilitud consiste
en obtener de forma simultnea los valores de y que maximizan la funcin
de distribucin conjunta normal multivariante, o lo que es lo mismo, que
minimizan 2 veces la log-verosimilitud
   0  
L , = Z s V 1 Z s V + log| | + nlog(2) (1.11)

Minimizar la ecuacin anterior puede ser computacionalmente demasiado


costoso si se tienen muchos parmetros en . Generalmente, slo incluye
tres parmetros (la pepita, la meseta parcial y el rango). Se puede lograr un
ahorro computacional minimizando (1.11) en dos fases: en una primera etapa
se supone que conocido, y por tanto tambin, con lo que la estimacin
de se obtendra mediante el estimador de mnimos cuadrados generalizado
= V 0 1 V 1 V 0 1 Z . Ahora se puede sustituir este estimador en la
s
1.5 Estimacin de los parmetros del variograma 27

expresin (1.11), obteniendo


0
LM L () = Z s V 1 + log| | + nlog(2)
  
Z s V (1.12)

Ahora la expresin (1.12) a minimizar nicamente depende de , lo que


hace el proceso ms sencillo y permite obtener . Para obtener bastara
con sustituir esta estimacin en la expresin del estimador de mnimos
cuadrados generalizado. Aunque la estimacin por mxima verosimilitud
es asintticamente insesgada, presenta un sesgoconsiderable
1 para muestras
0 1
pequeas porque los elementos de la diagonal de V V son demasiado
pequeos, lo que produce infraestimaciones de los parmetros .

La estimacin por mxima verosimilitud restringida (REML) tiene


muchas mejores propiedades de sesgo que la anterior. La funcin a minimizar
en este caso viene dada por la expresin
   0  
L , = Z s V 1 Z s V + log| |

+ log(|V 0 1
V |) + (n p)log(2) (1.13)

Como antes, se sustituye el parmetro desconocido por el estimador de


mnimos cuadrados generalizado obtenido a partir de unos valores iniciales
de , con lo que la funcin a minimizar sera
0

  
1
L() = Z s V Z s V + log| |

+ log(|V 0 1
V |) + (n p)log(2) (1.14)

Despus de minimizar esta expresin se obtiene una estimacin , que se


sustituye en la expresin del estimador de mnimos cuadrados generalizado
1


para obtener = V 0 1

V V 0 1

Z s.

Cuando la matriz de diseo V contiene nicamente una columna de unos


y un nico parmetro que representa la media general del proceso, entonces
28 Captulo 1. Conceptos bsicos del anlisis de datos geoestadsticos

el variograma emprico es insesgado respecto al variograma terico, y el


mtodo de mnimos cuadrados funciona suficientemente bien (Cressie 1993).
En cambio, cuando tiene mltiples parmetros se necesita ajustar un
variograma a los residuos del modelo de regresin y las estimaciones dejan
de ser insesgadas. Aunque los procedimientos de mxima verosimilitud
se han desarrollado bajo la hiptesis de que los datos provienen de una
distribucin normal multivariante, desviaciones en la distribucin del error
del modelo no afectan demasiado a sus estimaciones con estos mtodos por
ser suficientemente robustos. Otra ventaja es que no se necesitan condiciones
previas en el proceso de estimacin, tales como distancias mximas y regiones
de tolerancia. Adems, de estas tcnicas se pueden utilizar procedimientos
de diagnstico clsicos para los modelos ajustados (Faraway 2005) como el
valor de menos dos veces la log-verosimilitud asociada (2LL), el criterio de
informacin de Akaike (AIC, Akaike (1973) y Akaike (1974)) o el criterio de
informacin Bayesiano (BIC, Schwarz (1978)).

1.5.3 Anidamiento de Modelos de Semivarianza

Una vez calculado el modelo de semivarianza experimental, este se compara


con los modelos tericos para determinar si se ajusta en un alto grado de
similaridad a alguno de los tericos, en caso afirmativo se procede a la eleccin
del mtodo de interpolacin, en caso contrario es necesario anidar varios
modelos (es decir, generar un modelo de semivarianza definido a trozos) en
busca de un mejor ajuste para los datos experimentales. Para ilustrar este
proceso se tomarn los datos de la Tabla 1.5, los cuales son tomados de
(Clark 2001).
1.5 Estimacin de los parmetros del variograma 29

Tabla 1.5: Datos para el anlisis de diseminacin de nquel

h (h) N (h) h (h) N (h)


0 0 42 2.48 814
2 0.74 1222 44 2.52 787
4 1.1 1194 46 2.56 779
6 1.34 1186 48 2.55 767
8 1.58 1152 50 2.49 750
10 1.72 1137 52 2.59 736
12 1.81 1120 54 2.61 722
14 1.87 1095 56 2.64 705
16 1.9 1077 58 2.68 689
18 1.93 1055 60 2.62 675
20 1.92 1026 62 2.52 657
22 1.95 1011 64 2.59 639
24 2.01 990 66 2.53 628
26 2.09 969 68 2.47 612
28 2.16 950 70 2.56 597
30 2.25 919 72 2.62 582
32 2.29 899 74 2.64 563
34 2.38 886 76 2.75 552
36 2.35 860 78 2.93 539
38 2.36 848 80 3.06 514
40 2.39 825
h: Distancia entre parejas
(h): Semivarianza experimental
N (h): Nmero de parejas

Una primera estimacin del modelo y los parmetros a tener en cuenta se


realiza mediante la observacin del grfico resultante y su comparacin con
30 Captulo 1. Conceptos bsicos del anlisis de datos geoestadsticos

Figura 1.2: Semivariograma experimental diseminacin de nquel

los modelos tericos descritos anteriormente.

Figura 1.3: Estimacin del alcance y meseta del semivariograma experimental

En primera instancia la forma del semivariograma sugerira emplear un


modelo exponencial con C0 = 0.4, C1 = 2.1 y a = 40. Luego (h) = 0.4 +
1.5 Estimacin de los parmetros del variograma 31

3h
2.1(1 e 40 )

Figura 1.4: Modelos experimental (en azul) y exponencial (en magenta)

Al comparar los semivariogramas experimental y exponencial, la Figura


1.4 muestra diferencias significativas entre los dos. Dado que la aplicacin
del mtodo de interpolacin kriging emplea el modelo terico ajustado, las
predicciones que se realicen tendrn un bajo grado de confiabilidad, si el
modelo de semivarianza no llegase a ser el mejor. Con el fin de mejorar
el ajuste del modelo se emplea la metodologa aplicada por Clark (2001), se
determinan intervalos en los cuales se evidencia un comportamiento diferente
de la funcin.

Se logran definir tres momentos en el semivariograma: Los intervalos


[0, 14], [14, 50] y [50, ); en el primer intervalo se evidencia un crecimiento
rpido del semivariograma experimental, lo cual sugerira el uso de un modelo
de semivarianza esfrico para este intervalo. Para el intervalo [14, 50] la grfica
sugiere el uso de un modelo esfrico con un rango mayor (denotado por a2 )
al empleado en el primer intervalo (a1 ), o el uso de un modelo exponencial,
y en el intervalo [50, ) se aprecia el alcance de la meseta. As la funcin de
32 Captulo 1. Conceptos bsicos del anlisis de datos geoestadsticos

Figura 1.5: Seleccin de intervalos

semivarianza anidada sera la siguiente:




0 si h=0
  ! 3 !
1 h 3
    

3 h 3 h 1 h
C0 + C1 + C2 si 0 < h 14



2 14 2 14 2 50 2 50
(h) =   !
1 h 3
 
3 h
C0 + C1 + C2 si 14 < h 50





2 50 2 50


C +C +C si h > 50
0 1 2

Figura 1.6: Modelo anidado, en rojo modelo anidado, en azul modelo


experimental
1.6 Pocket plot 33

De la figura 1.5 de (h) se establece que: C0 = 0.4, C1 = 1.47, C2 =


0.62, a1 = 14, a2 = 50

El grfico obtenido mediante el modelo anidado de la figura 1.6 en


adelante se llamar anidado 1. Se observa que el modelo terico anidado
tiende a captar los valores experimentales de la semivarianza, sin embargo
an es deficiente puesto que existen diferencias significativas en el intervalo
[10, 40] entre los valores experimentales y tericos. Es de notar que la forma
de la funcin anidada es la empleada en (Clark 2001), es decir para distancias
menores o iguales a 14 se considera parte del segundo modelo esfrico. En
el siguiente captulo de resultados se dar continuidad a lo expresado en el
presente capitulo, y all se explicar el funcionamiento de una funcin de
semivarianzas anidada que se propone como alternativa a la ya presentada
en esta seccin.

1.6 Pocket plot

El Pocket Plot (llamado as debido a su uso en la deteccin de bolsillos de no


estacionariedad) es una tcnica necesaria para identificar un rea localizada
atpica con respecto al modelo de estacionariedad, es construida para
aprovechar la naturaleza espacial de los datos a travs de las coordenadas de
filas y columnas (estes "x" y nortes "y" respectivamente). Para la ilustracin
de este ejemplo, ver la siguiente Figura 1.7

En geoestadstica se pretende estimar las relaciones espaciales entre los


datos de los puntos (modelamiento del variograma). Luego este estimado es
usado para el desarrollo del mtodo kriging y para estimar la variabilidad
del predictor. Aunque el estimador de Cressie & Hawkins (1980), ofrece una
estimacin robusta para el variograma, hay aun una fraccin de las diferencias
(Zi Zj ), que resulta ser inapropiada en la estimacin del variograma
34 Captulo 1. Conceptos bsicos del anlisis de datos geoestadsticos

8.59 9 11.86 8.91 9.99

11.62 10.91 8.76 8.89 9.1 7.62 9.65

10.39 10.65 10.36 9.58 10.66 8.92 7.8 7.84 9.03 8.6
20

9.79 9.06 10.7 11.21 8.98 9.27 8.19 7.88 7.61 8.2 8.77

10.74 12.8 10.03 9.36 8.57 9.01 9.04 7.28 9.58 9.69 9.96 9.91

11.21 9.89 10.34 8.2 9.82 10.06 8.58 8.89 8.64 7.04 8.81 7.95

9.97 9.7 9.84 10.29 9.84 10.01 9.01 7.68 9.25 7.83 9.14 7.63 9.07

11.17 10.14 9.93 10.27 10.21 11.09 10.63 8.82 10.18 9.34 8.61
15

9.92 10.82 11.65 8.96 9.88 8.9 10.18 9.34 10.56 9.06

10.21 10.73 9.46 9.35 9.78 10.38 9.79 8.91 9.22 11.43

12.5 9.63 10.82 10.12 9.4 9.48 10.99 9.92 7.85 8.21
y

9.92 11.05 10.11 11.46 10.41 8.45 8.9 8.07 7.96 7 7.9

11.31 9.41 9.37 11.21 9.93 10.7 9.27 9.28 10.13 8.61 8.78
10

11.15 9.91 10.17 10.55 11.61 9.16 10.04 11.19 8.1 11.3

10.82 11.75 9.78 11 9.79 10.19 9.15 8.15 9.2

10.01 8.23 11.04 10.28 13.07 10.47 11.58 9.46 8.54 10.87

10.39 11.11 10.96 10.83 10.09 8.69 11.17 9.39 9.56

10.41 10.82 17.61 10.87 13.06 11.41 9.96 9.15


5

9.76 11.1 10.8 8.86 9.48 9.22 9.61 8.2

10.93 10.94 9.53 10.61 10.27 9.59 9.82 7.81

9.64 9.52 10.06 12.65 9.63

9.29 8.75 8.96 8.27 8.14

10.59 10.43 9.32

5 10 15

Figura 1.7: Ubicacin espacial de una muestra de cenizas de carbn (coal-ash),


las unidades estn en % en ubicaciones reorientadas (Cressie, 1993)

de Cressie. Las ubicaciones sobre la grilla que exhiben diferentes medidas


del resto se deben identificar. Estos bolsillos de no estacionariedad, una
vez descubiertos, pueden ser removidos de la estimacin del variograma,
pero naturalmente eventualmente deben ser modelados e incorporados en
las apreciaciones finales del recurso analizado. El Pocket Plot Grfico de
1.6 Pocket plot 35

Bolsillo", es una simple idea que se ilustrar sobre las diferencias norte-sur
de los datos de coal-ash 1 concentrados sobre la fila j de la grilla, para alguna
otra fila, k por ejemplo, hay un cierto nmero Njk , de diferencias de datos
definidas, cuyas localizaciones estn a una distancia h =| jk | en la direccin
norte-sur. Sea Y jk la media de estas | dif erencias |1/2 , promediadas sobre
los Njk trminos, y se define:

1 X
Yh = | Zi Zj |1/2 (1.15)
| N (h) |
N (h)

Y h es una media ponderada de los Y jk s tales que | j k |= h. Luego se define

Pjk = Y jk Y h (1.16)

(Pjk : k = 1, 2, . . .), es la contribucin del residual de la fila j, al estimador


del variograma en la diferencia de rezagos. Idealmente, estos puntos sern
repartidos a ambos lados del cero, pero si hay algo inusual en la fila j, entonces
se dar una singular contribucin en todos los rezagos y tpicamente mostrar
una dispersin de puntos por encima del nivel cero. Ahora la fila j vara y
dispersa los puntos, lo que constituye el diagrama de bolsillo, ilustrado en la
Figura 1.8, donde la parte central de la dispersin se sustituye por la caja de
un diagrama de caja (Velleman & Hoaglin 1981, chap. 3)

Una modificacin adicional del pocket plot sera graficar valores


normalizados de Pjk , el grfico puede ser obtenido a partir de:
( ! )
1/2 Y jk
Qjk =Njk 1 (1.17)
Yh
A partir de los resultados de (Cressie 1985), var(Pjk ) = (2(h))(1/2) /Njk la
cual justifica el clculo de Qjk . Este cambio slo afectar la diseminacin
1
Este registro de datos del porcentaje de coal ash encontrado en muestras mineras
originalmente reportadas por Gomez & Hazen (1970) y posteriormente utilizado Cressie
(1993). Los datos se pueden descargar de la librera gstat o sp del programa R"
36 Captulo 1. Conceptos bsicos del anlisis de datos geoestadsticos

2
1.0

2.0
6 2 6

22 2
0.8

6 6

1.5
6 3 23 14 8 2 6 6
6
6 8
8 2
22 2
0.6

6 6 6
6 8 6 6

1.0
6 6 6
6 6 6 2 6
12 6 6 12
23 23
6 2
0.4

9 8 2 23 6
8 6 6
6 22 6 10
3

Q(jk)
P(jk)

2 22 6

0.5
2
8 2
0.2

0.0
0.0

0.5
0.2

1.0
21
21 21
0.4

21

1 3 5 7 9 11 13 15 17 19 21 23 1 3 5 7 9 11 13 15 17 19 21 23

Row Number Row Number

(a) Probabilidad: Unidades sobre el eje vertical (b) Varianzas estandarizadas.

estn en (%coalash)1/2

Figura 1.8: POCKET-PLOT en direccin sur-norte.

de los puntos y no el panorama general de estar por encima del nivel cero
(Cressie 1993).

Funcin pocket.plot()

Para este caso, consideraremos la base de datos coalash mencionada


anteriormente. La funcin requiere el nombre del data.frame, el tipo de grfico
asociado con la probabilidad o la varianza estandarizada del pocket plot
en las direcciones sur-norte o este-oeste; pocketplot de probabilidades por
fila, es decir, horizontal sur-norte" PPR", pocketplot de probabilidades por
columnas, es decir, vertical este-oeste" PPC", pocketplot de varianza por
filas, es decir horizontal sur-norte" PVR" y pocketplot de varianzas por
columnas, es decir vertical este-oeste" PVC", las coordenadas X" y Y",
el nombre de la variable a analizar Z", y la identificacin de los atpicos
1.7 Modelado Semivariograma Experimental 37

(automtica F" o personal T"). En la Figura 1.8 claramente las filas 2, 6, y 8


son atpicas, esto sirve como verificacin de que estas filas son potencialmente
problemticas. El siguiente cdigo en R, describe la situacin de un anlisis de
estacionariedad local en probabilidades del % ceniza de carbn en direccin
sur-norte:

library(gstat)
library(geospt)
data(coalash)
pocket.plot(coalash,"PPR",coalash$x,coalash$y,coalash$coalash, F)

El resultado obtenido se muestra en la Figura 1.8a y el asociado con


varianzas estndar se muestra en la Figura 1.8b.

1.7 Modelado Semivariograma Experimental

Consideremos los datos que se muestran en la Figura 1.9a. Tenemos aqu


un yacimiento de hierro estratiforme, a travs del cual un conjunto de
perforaciones se han realizado, perpendiculares a la inclinacin del depsito.
El valor dado en cada lugar es el valor medio de Fe (peso en %) sobre la
interseccin de la perforacin con el mineral (ver Figura 1.9b). Esencialmente,
este es un problema de dos dimensiones, de modo que la h en la definicin
del semivariograma depende de la distancia entre el par de muestras,
y su orientacin relativa en un plano de dos dimensiones (Clark 2001).
Se considera la direccin este-oeste, y se construye un semivariograma
experimental para esta orientacin relativa. La rejilla en la cual los agujeros
han sido convenientemente ubicados es 100 pies por 100 pies, por lo que slo
se pueden calcular los valores del semivariograma experimental, (h) para
las distancias que son mltiplos de 100. En el cero se sabe que (0) = 0. A
38 Captulo 1. Conceptos bsicos del anlisis de datos geoestadsticos

44 40 42 40 39 37 36
600

42 43 42 39 39 41 40 38
500

37 37 37 35 38 37 37 33 34
400
y

35 38 35 37 36 36 35
300

36 35 36 35 34 33 32 29 28
200

100 ft

38 37 35 30 29 30 32
100

100 ft

200 400 600 800

(a) Cuadrcula para el clculo del semivariograma (b) Seccin transversal a travs del

experimental del hierro yacimiento de mineral hierro.

Figura 1.9: Localizacin de los puntos del yacimiento mineral de hierro

100 pies se deben encontrar todos los pares de muestras a una separacin de
100 pies en la direccin este-oeste. Esto se muestra en la Figura 1.10a.

El clculo segn la definicin dice: tome cada par; meda la diferencia


de valor entre las dos muestras; eleve al cuadrado esta; sumar todos los
cuadrados; divida esta suma por dos veces el nmero de pares. En este
ejemplo es:
1.7 Modelado Semivariograma Experimental 39

44 40 42 40 39 37 36 44 40 42 40 39 37 36
600

600
42 43 42 39 39 41 40 38 42 43 42 39 39 41 40 38
500

500
37 37 37 35 38 37 37 33 34 37 37 37 35 38 37 37 33 34
400

400
y

y
35 38 35 37 36 36 35 35 38 35 37 36 36 35
300

300
36 35 36 35 34 33 32 29 28 36 35 36 35 34 33 32 29 28
200

200
38 37 35 30 29 30 32 38 37 35 30 29 30 32
100

100
200 400 600 800 200 400 600 800

x x

(a) h = 100. (b) h = 200.

Figura 1.10: Construccin Semivariograma: Identificando todas las parejas a una


separacin de h pies en la direccin este-oeste

(100) =[(40 42)2 + (42 40)2 + (40 39)2 + (39 37)2 + (37 36)2 +
(43 42)2 + (42 39)2 + (39 39)2 + (39 41)2 + (41 40)2 +
(40 38)2 + (37 37)2 + (37 37)2 + (37 35)2 + (35 38)2 +
(38 37)2 + (37 37)2 + (37 33)2 + (33 34)2 + (35 38)2 +
(35 37)2 + (37 36)2 + (36 36)2 + (36 35)2 + (36 35)2 +
(35 36)2 + (36 35)2 + (35 34)2 + (34 33)2 + (33 32)2 +
(32 29)2 + (29 28)2 + (38 37)2 + (37 35)2 + (29 30)2 +
(30 32)2 ]/(2 36)
(100) =1.46

Esto nos da un punto que podemos trazar en un grfico del


40 Captulo 1. Conceptos bsicos del anlisis de datos geoestadsticos

semivariograma experimental (h) frente a la distancia entre las muestras


(h), es decir (100 pies, 1.46 (%)). Ahora consideremos una distancia entre
las muestras a 200 pies.

La Figura 1.10b muestra los pares que se encuentran a esta distancia en


la direccin este-oeste, y el clculo se muestra a continuacin:

(200) =[(44 40)2 + (40 40)2 + (42 39)2 + (40 37)2 + (42 43)2 +
(39 36)2 + (43 39)2 + (42 39)2 + (39 41)2 + (39 40)2 +
(41 38)2 + (37 37)2 + (37 35)2 + (37 38)2 + (35 37)2 +
(38 37)2 + (37 33)2 + (37 34)2 + (38 35)2 + (35 36)2 +
(37 36)2 + (36 35)2 + (36 36)2 + (35 35)2 + (36 34)2 +
(35 33)2 + (34 32)2 + (33 29)2 + (32 28)2 + (38 35)2 +
(35 30)2 + (30 29)2 + (29 32)2 ]/(2 33)
(200) =3.30

Luego surge la pregunta, hasta que distancia se debe calcular?. Se podra


continuar hasta la distancia de 800 pies, para la cual se tendran 7 pares. En
la practica, rara vez se va ms all de la mitad de la extensin total de la
muestra - en este caso, por ejemplo, 400 pies.
1.8 Modelado Semivariograma Anisotrpico 41

Tabla 1.6: Clculo del semivariograma experimental en las dos direcciones


principales, para el ejemplo de la cuadrcula del mineral de hierro.

Direccin Distancia (h) np


100 1.46 36
200 3.30 33
Este-Oeste 300 4.31 27
400 6.70 23
100 5.35 36

Norte-Sur 200 9.87 27


300 18.88 21

La Tabla 1.6 muestra los puntos calculados para el semivariograma


experimental en las direcciones este-oeste y norte-sur, y la Figura 1.12
muestra el comportamiento de la (h) en las dos direcciones.

Como se puede observar en la Figura 1.12 la estructura de correlacin


espacial no slo depende de la distancia entre los diferentes sitios, sino de su
orientacin. Razn por la cual este fenmeno podra presentar una estructura
anisotrpica.

1.8 Modelado Semivariograma Anisotrpico

Existen tres conceptos de anisotropa que son confusos entre ellos en


la presentacin de (Isaaks & Srisvastava 1989), anisotropa geomtrica,
anisotropa zonal y estructuras anidadas. (Zimmerman 1993) sealo
adems un uso inconsistente, en la literatura, de los trminos de anisotropa
geomtrica y zonal. l sugiere en cambio, adoptar los trminos de anisotropa:
pepita, rango y meseta.
42 Captulo 1. Conceptos bsicos del anlisis de datos geoestadsticos

30
25
NorteSur
EsteOeste

20
Semivarianza

15
10
5
0

0 200 400 600 800

Distancia

Figura 1.11: Semivariogramas experimentales en las dos direcciones principales


para el ejemplo de mineral de hierro.

Los ejemplos de rango y meseta son mostrados mediante un modelo


esfrico en la Figura 1.10a y 1.10b, en ambos, la direccin del mximo
meseta o rango es de rumbo N 30 E.

En la Figura 1.10c, se combinan anisotropas de rango y meseta en un


modelo esfrico, la direccin de la meseta mxima es de 30 y la direccin
del rango mnimo es de 90 .

Los modelos de variogramas complejos son usualmente construidos


con la suma de modelos ms simples, dichos modelos simples se conocen
como estructuras anidadas, en la Figura 1.10d se muestra un variograma
construido como la suma de dos modelos esfricos, el primero con rango
1.8 Modelado Semivariograma Anisotrpico 43

mximo de 100 en direccin 90 y el segundo con rango mximo de 50 en


direccin 150 .

Para cada una de las figuras, los ejes son las distancias rezagadas h,
ngulo de separacin y valor del variograma de 2(h, ). Se asume que
los ngulos son medidos en el sentido contrario a las manecillas del reloj
desde el este. Algunos variogramas e implementaciones Kriging emplean los
ngulos en grados azimutales, es decir, en sentido horario empezando en el
norte.

La anisotropa geomtrica se caracteriza por presentar las siguientes


propiedades: 1) los semivariogramas direccionales tienen la misma forma y
meseta, pero diferentes rangos; 2) el semivariograma en la direccin tiene el
rango mximo de cualquier direccin, amax , y perpendicular a esta direccin,
la semivariograma en la direccin 90 tiene el rango el mnimo de cualquier
direccin, amin , y todos los rangos delinean una elipse con semiejes mayor y
menor iguales a amax y amin , respectivamente. De acuerdo a la Figura 1.13
se adapt un modelo de semivariograma isotrpico con geometra elptica
aplicado a uno con semivariograma anisotrpico definido condicionalmente
negativo, como se muestra a continuacin:

Siendo u y v los semiejes de la elipse amax y amin , entonces la ecuacin


de la elipse es
(u/amax )2 + (v/amin )2 = 1 (1.18)

Convirtiendo u y v de coordenadas rectangulares a coordenadas polares


tenemos:
a = u2 + v 2 u = a cos
= tan1 (v/u) v = a sin
Antes de precisar amax y amin , la mayora de los modelados de variogramas
44 Captulo 1. Conceptos bsicos del anlisis de datos geoestadsticos

(a) Meseta vara (b) Rango vara

(c) Meseta y rango varan (d) Dos estructuras

Figura 1.12: Ejemplos de variogramas con anisotropa; (a), anisotropa


geomtrica en direccin 30 . (b), rango anisotrpico en direccin
30 , (c), meseta (en direccin 30 ) y rango (en direccin 90 )
anisotrpicos, y (d), estructuras anisotrpicas de rangos anidados
en direcciones 90 y 150
Fuente: Tomado de (Eriksson & Siska 2000)

requieren que el usuario defina la magnitud a ya sea, anisotropa mxima o


mnima y el factor que relaciona dicha magnitud (a) entre amax y amin .
Donde, si > 1, entonces amin = a y amax = a o, si < 1, amax = a
y amin = a. Para hacer los clculos ms fciles, se asume que < 1. De
acuerdo con lo anterior y reemplazando en (1.18) tenemos

a2 cos2 a2 sin2
+ =1 (1.19)
a2 (a)2
1.8 Modelado Semivariograma Anisotrpico 45

Figura 1.13: Anisotropa geomtrica. El rango mximo esta en la direccin .


Los puntos Pi y Pj estn separados a la distancia hij en la direccin
ij = ij + . [Adaptado de (Eriksson & Siska 2000).]
Fuente: Tomado de (Haining 2004)

Y el rango en direccin con respecto al sistema coordenado uv es:


q
a = a / 2 cos2 + sin2 (1.20)

Ahora, considerando los puntos Pi y Pj con coordenadas q locales


(xi , yi ), (xj , yj ), tenemos que la distancia entre estos es hij = yij + x2ij y
2

el ngulo de separacin ij = ij +, que en relacin con el sistema coordenado


u, v es el ngulo ij = ij por lo tanto, el rango en la direccin es
q
a = amax amin / a2min cos2 (ij ) + a2max sin2 (ij ) (1.21)
46 Captulo 1. Conceptos bsicos del anlisis de datos geoestadsticos

Por otro lado, si cambiamos a la relacin anisotrpica, obtenemos


q
a = a/ 2 cos2 (ij ) + sin2 (ij ) (1.22)

Los sub-ndices ij se usan para enfatizar que las distancias y ngulos se


definen y calculan por el par de puntos Pi y Pj . El parmetro del rango,
usualmente simboliza que a es una ecuacin de variograma isotrpico y
puede ser reemplazado utilizando la ecuacin (1.22) para obtener un modelo
de variograma anisotrpico. Por ejemplo, usando un modelo esfrico con
meseta unitaria y efecto pepita cero, un modelo de anisotropa geomtrica
puede ser escrito como,


0 para h=0





p !
a2min cos2 ( ) + a2max sin2 ( )




3 h
2 amax amin









p !3
(h, ; ) = 1 h a2min cos2 ( ) + a2max sin2 ( )

2 amax amin









p
a2min cos2 ( ) + a2max sin2 ( )




para 0 h a max a min /






1 en otro caso

(1.23)
Donde = (amin , amax , )0.

En primer lugar se deben rotar los ejes coordenados para que estn
alineados con el eje mayor y menor de la elipse, entonces, stos se reducen
de modo que la elipse es ahora una circunferencia con radio 1, teniendo en
1.8 Modelado Semivariograma Anisotrpico 47

cuenta lo siguiente:
" #" #" #
1/amax 0 cos sin xij
h0 =
0 1/amin sin cos yij
" #" #
1/amax 0 uij
, (1.24)
0 1/amin vij

Donde uij y vij son componentes de distancia de si sj en las direcciones u


y v en relacin con los ejes u y v, y xij y yij son los mismos componentes de
distancia en las direcciones x e y en relacin a los ejes coordenados x, y. Luego
de transformar la elipse en una circunferencia de radio 1, se utiliza el modelo
de semivariograma isotrpico con las distancias transformadas. Continuando
con el ejemplo de un modelo esfrico sin efecto pepita, el resultado del modelo
anisotrpico en varias direcciones es igual al valor de un semivariograma
isotrpico con rango 1 usando
s
u2ij vij2
kh0k = + (1.25)
a2max a2min

La cantidad kh0k dada en la ecuacin (1.25) es llamada como distancia


reducida, donde los valores del modelo de semivariograma anisotrpico dados
en la ecuacin (1.23) son iguales a



0, kh0k = 0





Sph1 (kh0k) = (3/2)kh0k (1/2)kh0k3 , 0 kh0k 1 (1.26)







1, en otro caso

Donde Spha () denota un modelo de semivariograma isotrpico esfrico con


efecto pepita de cero, meseta unitaria y rango a (Isaaks & Srisvastava 1989).
De la formulacin anterior, la dependencia en la direccin no es obvia pero
48 Captulo 1. Conceptos bsicos del anlisis de datos geoestadsticos

est implcita en la distancia reducida (cada par de puntos debe tener una
componente de distancia diferente).

La anisotropa zonal se refiere al caso donde la meseta vara pero el


rango permanece constante. Este tipo de anisotropa es comn con procesos
espaciales tridimensionales, ya que, la direccin vertical (profundidad,
altura o tiempo) se comporta diferente con respecto a las dos direcciones
horizontales. Para modelar la anisotropa zonal, se asume que en la direccin
, la meseta es cmax y sta es perpendicular a , adems del rango, denotado
por a.

Usualmente se modela la anisotropa zonal, por medio de la suma de


dos modelos de semivariogramas isotrpicos, referidos como estructuras, la
primera estructura es un modelo isotrpico con meseta cmin y rango a; la
segunda, es un modelo geomtrico artificial con meseta cmax cmin . El rango
en la direccin del valor mximo de la meseta es usualmente tomado como
el rango a y al rango con el valor mnimo de la meseta se le ajusta un valor
muy grande, por lo tanto, esa estructura no contribuye al modelo general en
la direccin del valor mnimo de la meseta. Por ejemplo, supongamos que el
mximo de la meseta es 9 con direccin y que el mnimo de la meseta es
5, observado en direccin perpendicular; asumimos que un modelo esfrico
puede ser usado para ajustar ambas direcciones y tambin que el valor del
rango es constante igual a 100, entonces los valores para el modelo zonal
pueden calcularse as:
s
u2ij vij2
5 Sph1 (h/100) + 4 Sph1 (kh0k) con kh0k = +
100 100, 000

En la direccin del mnimo de la meseta, el primer componente de la


distancia reducida usado en la segunda estructura es cero, y la contribucin
al segundo trmino es insignificante debido al gran rango en esa direccin.
1.8 Modelado Semivariograma Anisotrpico 49

Por lo tanto, se obtiene un modelo esfrico con rango 100 y meseta de 5.

En direccin de la meseta mxima, ambas estructuras influyen en los


clculos, pero el segundo componente de la distancia reducida empleado en
la segunda estructura es insignificante, por tal razn, los valores se pueden
obtener mediante 5Sph1 (h/100)+4Sph1 (h/100) = 9Sph(h/100) (Haining
2004).

1.8.1 Estrategia general para la correccin de la


anisotropa

1. Si el patrn de correlacin espacial es isotrpico, modelar el variograma


omnidireccional.

2. Si el patrn de correlacin espacial es anisotrpico, identificar el tipo


de anisotropa (geomtrica o zonal).

3. Si existe anisotropa geomtrica, entonces:

a) Se debe identificar los semiejes mayor y menor de la elipse y hacer


la respectiva rotacin a estos.
b) Corregir la anisotropa presente ajustando la distancia de
separacin en la direccin del rango mximo y mnimo.
c) Ajustar un modelo de variograma isotrpico al variograma
emprico resultante a partir de las distancias parametrizadas.

4. Si el patrn de correlacin espacial es geomtrico con una anisotropa


zonal, corregir la parte zonal con una estructura de variograma
y la anisotropa geomtrica restante con una segunda estructura
de variograma. Para el caso donde existan mltiples anisotropas
50 Captulo 1. Conceptos bsicos del anlisis de datos geoestadsticos

zonales, cada direccin correspondiente, generalmente requiere su


propia estructura de variograma.

Ajuste del variograma con anisotropa: En esta seccin se explican


tcnicas del modelamiento de variogramas isotrpicos para un ejemplo
que presenta anisotropas. El ejemplo considerado es del Lago Walker con
informacin de concentracin-V.

Lago Walker con datos de concentracin-V: Tenga en cuenta que la


muestra contempla 470 mediciones a lo largo del Lago Walker y contiene
tres variables (U, V, T ). Los valores de concentracin-V fueron medidos en
un patrn muy similar sobre la regin muestreada y el modelo de variograma
resultante tiene un comportamiento ptimo. Como un recordatorio de la
estructura de correlacin espacial en la informacin, se muestran en la
Figura 1.14 los valores de la ventana de desplazamiento del variograma y el
mapa de curvas de nivel de los valores de variograma.

En la parte a) de la Figura 1.14 se muestra el mapa del variograma, el


mapa se construye localizando los valores de variograma muestral agrupados
para diferentes rezagos, como se muestra. Los valores de variograma se han
agrupado en 100 rezagos con un incremento de rezago de 10 metros y una
tolerancia rezago de 5 m en ambas direcciones. En la parte b) de la Figura
1.14 se muestra un mapa de contorno de los valores variograma agrupados,
los valores de curvas de nivel estn en miles de partes por milln cuadrado.

Con base en la Figura anterior, la asuncin de estacionariedad de la


media parece razonable, por lo tanto, el proceso de detrending (remocin
de tendencia) no fue realizado en las concentraciones. Adems, las curvas
de nivel indican la existencia de diferentes grados de correlacin espacial
1.8 Modelado Semivariograma Anisotrpico 51

95.7 81.1 76.5 86 88.6 84.1 105.5 115.7 99.6 103.7

40
110
40

96.4 80.9 77.6 75.4 80.3 79.5 93.6 107.7 106.5 101.6 80
90 70
110
Distancia de separacin NorteSur

Distancia de separacin NorteSur


87.6 83 89.5 73.8 63.1 71.8 81.2 110.1 111.5 108.4

20
90
20

93 94.2 95.9 73.2 57.7 74.4 94.1 104.2 106.9 116


100 50
108.5 104.4 102.4 80.9 44.1 50.7 82.4 94.7 93.9 108
0

0
108 93.9 94.7 82.4 50.7 44.1 80.9 102.4 104.4 108.5
100
60
116 106.9 104.2 94.1 74.4 57.7 73.2 95.9 94.2 93
20

20
90
108.4 111.5 110.1 81.2 71.8 63.1 73.8 89.5 83 87.6
110

90
101.6 106.5 107.7 93.6 79.5 80.3 75.4 77.6 80.9 96.4 80
40

40
110
103.7 99.6 115.7 105.5 84.1 88.6 86 76.5 81.1 95.7

40 20 0 20 40 40 20 0 20 40

Distancia de separacin EsteOeste Distancia de separacin EsteOeste

(a) Mapa del Variograma (b) Mapa de Contorno

Figura 1.14: Variogramas

en diferentes direcciones (anisotropa). De hecho, los rumbos de N74 E y


N14 W fueron identificados como las direcciones aproximadas de correlacin
espacial mxima y mnima, respectivamente. Un variograma omnidireccional
y una serie de variogramas direccionales fueron generados, todo esto, con su
correspondiente cdigo en R, como se muestra a continuacin.

# Se fija la base de datos walk470.


attach(walk470)
coordinates(walk470) = ~x+y
# Calcula el variograma de los valores de V con un rezago de separacin y una mxima
# distancia especificadas.
walk.var2 <- variogram(v ~ x+y,data=walk470,width=10,cutoff=100)
plot(walk.var2,cex=1.3,pch=16,col=1, xlab="Distancia",ylab="Semivarianza", main="")
# Secuencia de numeros desde 10 hasta 170 cada 20.
az <- seq(10,170,20)
# Calcula el variograma de los valores de V con un rezago de separacin de 10, una mxima
# distancia de 100, y azimutes en "az" con una tolerancia horizontal de 15-grados.
walk.var3 <- variogram(v~x+y, data=walk470, width=10, cutoff=100, alpha=az, tol.hor=15)
plot(walk.var3,cex=1.1,pch=16,col=1, xlab="Distancia",ylab="Semivarianza", main="")
52 Captulo 1. Conceptos bsicos del anlisis de datos geoestadsticos

20 40 60 80

130 150 170

100000
80000
60000
40000
20000

70 90 110

100000
Semivarianza

80000
60000
40000
20000

10 30 50

100000
80000
60000
40000
20000

20 40 60 80 20 40 60 80

Distancia

Figura 1.15: Variogramas direccionales para V

El variograma omnidireccional (espaciamiento del rezago=10) es muy


estable, indica un valor de meseta cercano a 95000, un rango aproximado
de 40 y una pepita de mas o menos 20000. Los variogramas anisotrpicos son
ligeramente ms errticos (como era de esperarse, ya que menos puntos son
utilizados), pero parece que tienen ms o menos la misma meseta como en
el variograma omnidireccional. Una inspeccin ms detallada revela que los
1.8 Modelado Semivariograma Anisotrpico 53

rangos para esos variogramas omnidireccionales son diferentes, posiblemente


sugieren la presencia de anisotropa geomtrica. Para investigar ms a fondo,
un diagrama de rosa usando un valor del variograma de 80000 fue generado,
como se muestra abajo.

rose(walk.var3,80000)

Este diagrama de rosa tiene una clara


forma elptica, con ejes mayor y menor
aproximadamente en 14 y 76 grados
como lo sugiri el grfico de curvas de
nivel anteriormente. Con base en este
diagrama de rosa y la meseta casi constante
en el variograma direccional, el patrn
de correlacin espacial parece ser uno de
anisotropa geomtrica.

Cabe mencionar que una prueba formal para la presencia de anisotropa


geomtrica fue desarrollada para el caso de datos lattice por (Lu &
Zimmerman 1994). Esta prueba no paramtrica no se consider aqu se
confi en un anlisis visual para determinar si se presentaba o no anisotropa
con forma geomtrica.

Rotacin de los ejes: Teniendo identificada las direcciones 14 y 76


grados como las direcciones de mayor y menor rango, ahora se tiene la opcin
de rotar los ejes para ajustarlos con las direcciones de 0 y 90 grados, o retener
el sistema de coordenadas original y utilizar los grados 14 y 76 como los
ejes mismos. Si existe algn valor para conservar el sistema de coordenadas
verdadero, es mejor no realizar la rotacin. Por otro lado, rotando los ejes
mayor y menor a las direcciones N S y E W se puede simplificar las
54 Captulo 1. Conceptos bsicos del anlisis de datos geoestadsticos

interpretaciones. El camino para rotar los ejes en R ser presentado.


Para rotar la ubicacin coordenada de acuerdo con algn ngulo de rotacin
especfico , la funcin rotateaxis. Para la informacin del lago Walker, los
siguientes comandos fueron empleados:

xy <- coordinates(walk470)
# Gira los ejes en sentido horario 14 grados y crea una lista con el nuevo (x, y), v, u, y t.
walk470.rot <- cbind(rotateaxis(xy,14), v=v, u=u, t=t)

Para verificar esta rotacin se reorienta la informacin con la mayor y


menor continuidad espacial en las direcciones 0 y 90 grados, un diagrama de
rosa es dibujado con las nuevas coordenadas, como se muestra a continuacin:

# Define azimutes en el intervalo 0-165 cada 15.


az <- seq(0,165,15)
coordinates(walk470.rot) <- ~newx+newy
# Calcula el variograma para los valores de V sobre las coordenadas rotadas.
walk.var4 <- variogram(v~newx+newy, data=walk470.rot, width=10, alpha=az, tol.hor=15,
cutoff=100)
# Generates a rose diagram for g=80000.
ranges <- rose(walk.var4,80000)

Correccin de la anisotropa : Una vez que las


direcciones del rango mximo y mnimo han
sido orientadas a lo largo de las direcciones 0 y
90 grados, dicho rango, necesita ser calculado
y la distancia ajustada pero, en lugar de
calcularlo en las direcciones x e y y despus
dividir la separacin de las distancias por sus
respectivos rangos (i.e.: hx /rx & hy /ry ), el
software R se enfoca en encontrar la relacin
de los rangos en las direcciones x e y.
Un camino para determinar esa relacin de los rangos entre los ejes mayor y
1.8 Modelado Semivariograma Anisotrpico 55

menor es a travs de una inspeccin visual del diagrama de rosa.

Un segundo mtodo ms cuantitativo para determinar el rango correcto


de relacin es estimar dicho rango a partir de los variogramas direccionales,
esto puede hacerse fcilmente en R por medio de una funcin panel
llamada panel.gamma() unindola con la funcin xyplot. La primera
funcin realiza una interpolacin LOESS (por sus siglas en ingls "LOcal
regrESSion", fundamentalmente es un ajuste de regresin local) para un
valor dado del variograma y devuelve los rangos interpolados para cada
direccin examinada. La segunda funcin dibuja ese ajuste LOESS junto
con los respectivos rangos interpolados para cada direccin. Para ver como
se utiliza, los siguientes comando fueron empleados para los datos rotados
V del Lago Walker, dando el conjunto de variogramas direccionales con el
ajuste LOESS mostrado abajo.

# Plots directional variograms with loess # fits through the data and prints interpolated
# range at gamma specified.
xyplot(gamma ~ dist|as.factor(dir.hor), data=walk.var4,layout=c(4,3), panel =panel.gamma0,
gamma0=80000,pch=16, main="Interpolated Directional Ranges",col=1)

Basados en los rangos interpolados obtenidos de la figura anterior, el


rango de relacin es: 47.40/19.96 2.4. Cabe sealar que la funcin
rosa tambin reporta los rangos interpolados para un valor dado
pero, dicha interpolacin es linear. Una interpolacin linear parece ser
suficiente para un incremento inicial en las funciones de variograma,
donde es generalmente un aproximado linear. Si se utilizara los valores
interpolados de la rosa, el rango de relacin sera 47.09/16.15 2.9, un
tanto mayor que el resultado del ajuste LOESS.
56 Captulo 1. Conceptos bsicos del anlisis de datos geoestadsticos

20 40 60 80 20 40 60 80

120 135 150 165


120000

100000

80000

60000

40000 d0=23.8304 d0=35.9089


d0=42.479 d0=48.7268
60 75 90 105
120000
Semivarianza

100000

80000
d0=19.805 60000
d0=19.9648 d0=22.585
d0=18.6012 40000

0 15 30 45
120000

100000

80000

60000
d0=26.2852
40000
d0=47.4003 d0=39.5269 d0=30.9462

20 40 60 80 20 40 60 80

Distancia

Figura 1.16: Rangos direccionales interpolados

La eleccin del rango de relacin no es terriblemente importante


siempre y cuando represente la diferencia en la continuidad espacial
para diferentes direcciones. Se debe tener en cuenta que se est tratando
de mejorar el uso del variograma omnidireccional para describir la
estructura general de la correlacin espacial.

Ajuste del variograma isotrpico final: Una vez que el rango de relacin
ha sido seleccionado el cual corrije la anisotropa geomtrica presente, un
modelo de variograma puede ser ajustado al variograma isotrpico resultante
(Figura 1.17).
1.8 Modelado Semivariograma Anisotrpico 57

20 40 60 80 20 40 60 80

120 135 150 165

100000
80000
60000
40000
20000

60 75 90 105

100000
Semivarianza

80000
60000
40000
20000

0 15 30 45

100000
80000
60000
40000
20000

20 40 60 80 20 40 60 80

Distancia

Figura 1.17: Variogramas de anisotropa corregida

Para definir el "variograma final" representando el ajuste del rango,


tenemos que ejecutar los comandos:

# Range ratio based on rose diagram.


ratio <- ranges[az==0]/ranges[az==90]
# Fits an anisotropic variogram model with major axis
# at 0-degrees, and range ratio given by "ratio".
model1.out <- fit.variogram(walk.var4, vgm(70000,"Sph",40,20000,anis=
c(0,1/ratio)),fit.method=2)
# Plots the directional variograms with fitted corrected variogram models.
plot(walk.var4,model1.out,pch=16,col=1, main="Anisotropy-Corrected Variograms")

Hay que tener en la cuenta que la anisotropa geomtrica esta siendo


58 Captulo 1. Conceptos bsicos del anlisis de datos geoestadsticos

corregida para todas las direcciones simultneamente, por lo tanto,


corrige las diferencias en los rangos "en la media" sobre todas las
direcciones. El modelo sigue usando slo 3 parmetros asi que no
debera esperarse ajustar los variogramas direccionales perfectamente.

Para ver qu tan bien se esta realizando el proceso, es til hacer una
grfica del modelo de variograma final como un modelo isotrpico
corregido para anisotropa geomtrica (Figura 1.18a). Esto se puede
realizar mediante el cdigo siguiente:

plot(walk.var2,model1.out,cex=1.3,main="Final Isotropic Variogram",pch=16, col=1)

100000

8e+04
80000

6e+04
Semivarianza

Semivarianza

60000

4e+04 40000

2e+04 20000

20 40 60 80 20 40 60 80

Distancia Distancia

(a) Corregido (b) Corregido con geoR

Figura 1.18: Variogramas isotrpicos finales

Tambin se puede usar la funcin coords.aniso en geoR para


calcular las coordenadas transformadas para graficar el variograma
de anisotropa corregido (Figura 1.18b) como un variograma
omnidireccional. El cdigo para hacer esto se encuentra a continuacin.
1.9 Interpolacin Espacial 59

coords.new <- coords.aniso(coordinates(walk470.rot), aniso.pars=c(0, ratio))


walk470.ani <- data.frame(anix=coords.new[,1],aniy=coords.new[,2],v=v)
coordinates(walk470.ani) <- ~anix+aniy
walk.var5 <- variogram(v~anix+aniy,data=walk470.ani,width=10,cutoff=100)
plot(walk.var5,model1.out,cex=1.3,main="Final Isotropic Variogram",pch=16)

Como con los modelos de regresin, el principio de parsimonia


aplica a los modelos de variogramas: los modelos ms simples que
proporcionen un adecuado ajuste al variograma son generalmente
preferido sobre los modelos ms complicados. Muchos modeladores
tienen una tendencia (especialmente con variogramas) a sobre-ajustar
el modelo con estructuras anidadas complejas. Si un estructura simple
describe adecuadamente el patrn de correlacin espacial, debera
usarse. Teniendo en cuenta lo anterior, se eligi el modelo de variograma
anterior con un modelo de variograma esfrico simple.

1.9 Interpolacin Espacial

La interpolacin es uno de los aspectos fundamentales para generar


pronsticos y mapas de pronstico, tanto en los mtodos geoestadsticos como
en los determinsticos. A continuacin en la Figura 1.19, se muestran las
posibilidades de visualizacin de los datos en el programa R, con el paquete
akima (Akima et al. 2013) instrucciones; plot, tripack , contour e image):

R interpola con 4 o ms puntos, estos no deben ser colineales. En R a


partir del paquete akima es posible una interpolacin bivariada sobre una
grilla espaciada regular, este paquete da opciones para interpolacin bilineal
o spline bicbico usando diferentes versiones de algoritmos, a continuacin
se dar explicacin a la interpolacin bilineal:

En este caso z12 = 1 z2 + (1 1 )z1 , y z43 = 1 z3 + (1 1 )z4 . Luego para


z0 , se tiene:
60 Captulo 1. Conceptos bsicos del anlisis de datos geoestadsticos

20

20
6.6 6.5
2

1.2
2.9 3.7

18

18
1.8

2.3
5.5 5.7
16

16
y

y
6 5.2
4.6
14

14
3.2
3.4

5.4
5.4
12

12
3.8 4.2

4.4

0 2 4 6 8 10 0 2 4 6 8 10

x x

(a) akima (b) tripack


20

20
6
3
3.5
1.5
18

18
4

2 4.5

5
16

16

2.5 5.5
y

5.5
5
4.5
4
14

14

3.
5
12

12

4 5

0 2 4 6 8 10 0 2 4 6 8 10

x x

(c) contour (d) image

Figura 1.19: Ejemplos de variogramas con anisotropa; (a), Localizacin espacial


muestras de zinc. (b), Teselacin de las muestras, (c), Construccin
contornos, y (d), Superficie de interpolacin

z0 = 2 z12 + (1 2 )z43 , reemplazando z12 y z43 , se obtiene:


z0 = 2 (1 z2 + (1 1 )z1 ) + (1 2 )(1 z3 + (1 1 )z4 ).
1.10 Ejercicios Propuestos 61

Figura 1.20: Explicacin interpolacin bivariada

1.10 Ejercicios Propuestos

1. Dado el siguiente semivariograma omnidireccional (ver Tabla 1.7) y su


correspondiente rezago

(a) Encuentre el mejor modelo simple por medio de mnimos


cuadrados ordinarios
(b) Es un modelo anidado doble esfrico mejor que un modelo
simple?
62 Captulo 1. Conceptos bsicos del anlisis de datos geoestadsticos

Tabla 1.7: Semivarianza experimental omnidireccional

Tomado de (Olea 1999)

Obs h (h) Obs h (h)


1 1039.02941 185.55762 12 9594.10504 608.88869
2 1671.37619 222.71608 13 10398.11004 588.75490
3 2411.96731 283.78858 14 11206.04916 603.36585
4 3238.55621 350.41225 15 11990.76099 624.89485
5 3986.34431 409.28920 16 12809.31622 607.05642
6 4798.25527 425.10046 17 13593.52361 622.04279
7 5622.82245 479.82902 18 14406.22013 619.60402
8 6390.44643 515.66721 19 15195.65893 599.43991
9 7219.57553 512.68859 20 15992.80252 589.11388
10 7991.70332 557.21386 21 16799.44020 601.43822
11 8818.26894 553.13395 22 17603.98278 582.36187
h: Distancia entre parejas (h): Semivarianza experimental

2. Suponga que dos puntos mustrales, s1 y s2 , estn distantes a 200m.


Calcule la varianza de una combinacin lineal Z = Z(s1 )+Z(s2 ) donde
Z(s) es una variable estacionaria con un semivariograma esfrico con
un rango de 300m y una meseta de 5.
Cul debera ser la varianza si el rango es de 30m en vez de 300m.?
Cul debera ser la varianza si el semivariograma fuera un efecto
pepita puro de 5.0?
Porqu es el mismo valor como cuando el rango es 30m?

3. Sean 3 puntos que forman un tringulo issceles con lados 0.8, 0.8 y
1.0, y sea Z(Xi ) un promedio ponderado de los valores de las esquinas
del tringulo dado por Z(xi ) = Z(xi ) 0.5Z(x2 ) 0.5Z(x3 ) y con el
1.10 Ejercicios Propuestos 63

siguiente modelo de semivarianza:

Calcule la varianza de la combinacin lineal. Concluya acerca de la


suma de las ponderaciones.

4. Sea Z(si ) una funcin aleatoria estacionaria y sea Z(si ) un promedio


ponderado de los valores en cuatro esquinas de un cuadro de 50 50m
(tal como se muestra abajo), dado por: Z(si ) = 0.5Z(s1 ) + 0.27Z(s2 ) +
0.27Z(s3 )+0.1Z(s4 ). Considerando la siguiente funcin exponencial de
covarianza de Z(si ): C(h) = 2.5 exp(h/200)

(a) Estime la varianza del promedio ponderado Z(si ).


(b) Estime la varianza de un punto que se encuentra en el centro de
tal cuadro, considere las coordenadas de este punto en (0, 0)
(c) Asuma un punto fuera de este cuadro a una distancia de 1m de
una de las esquinas, tanto en direccin Sur como en Este y repita
el procedimiento realizado en (a)

5. Encuentre la funcin de la semivarianza y grafquela tomando como


64 Captulo 1. Conceptos bsicos del anlisis de datos geoestadsticos

referencia el siguiente modelo de covarianza .


(
3.0 si h = 0
C(h) =
2.5 exp(h/200) si h > 0

Recuerde que C(h) = 2 (h)

6. Construir la funcin de correlacin asociada a la siguiente funcin de


semivarianza:

0 si h = 0
(h) =
  
R h
C0 + C1 1 sen si h > 0
h R

Recuerde que C(h) = 2 (h)

7. Sean "a" y "b" dos semiejes de una elipse, con a = 4 y b = 3.


Estimar los ponderadores , mediante el mtodo kriging ordinario.
Si se desea estimar el punto en el centro de la elipse a partir de los
puntos generados por el corte de la elipse con los ejes, considerando el
modelo de semivarianza esfrico de parmetros; rango a = 3 y meseta

Z2

Z3 Z1 Z5

Z4
1.10 Ejercicios Propuestos 65

C1 = 2. Que sucedera si el rango fuera 4 en vez de 3. Cambiaran los


resultados anteriores en el caso de cambiar el modelo de semivarianza
a uno exponencial o Gaussiano?

8. La siguiente matriz considera un conjunto de mediciones (por ejemplo


relativas a la humedad) sobre una grilla regular vertical (y) y horizontal
(x) con distancia 1 entre puntos vecinos. Calcule el semivariograma
experimental clsico y robusto para azimutes de 0o y de 45o , y realice
una breve comparacin.

0.23 0.29 0.35

0.34 0.29 0.36

0.46 0.44 0.47

9. A partir de los datos establecidos en la Tabla 2.5 del Capitulo 2,

(a) a) Construir y graficar el variograma experimental omnidireccional


clsico y robusto, en 5 direcciones (0, 30, 45, 60 y 90 grados).
(b) b) Estimar por los mtodos OLS, LM, WLS y REML las funciones
de semivarianzas tericas dadas en la librera gstat el programa R
y seleccionar la que ms se ajusta al semivariograma experimental.
66 Captulo 1. Conceptos bsicos del anlisis de datos geoestadsticos
Captulo 2

Mtodos de Interpolacin
Determinsticos

2.1 Introduccin

Debido a que hoy en da existe un gran desarrollo de instrumentos de


medicin en tiempo real y de recursos de almacenamiento de datos, las
funciones generadas a partir de experimentos aleatorios se pueden observar
y procesar. De esta manera, los mtodos globales (tales como el anlisis
de tendencias de superficie) utilizan todos los datos disponibles para la
prediccin, mientras que los mtodos locales como las funciones de base radial
(radial basis functions "RBF"), los y la distancia inversa ponderada, suelen
utilizar slo un subconjunto de los datos para hacer cada prediccin. Una
de las ventajas de los mtodos locales es que el tiempo de clculo se reduce
en la prediccin, al trabajar con los datos asociados a vecindarios. Algunos
mtodos hacen uso de todos los datos disponibles, pero nicamente tienen
en cuenta las distancias a partir de la localizacin de la prediccin. Estos
mtodos todava se pueden considerar locales, es decir que muchas de las
68 Captulo 2. Mtodos de Interpolacin Determinsticos

tcnicas de interpolacin utilizadas son mtodos locales.

Las funciones de base radial (RBF) tales como la multicuadrtica (MQ)


o completamente regularizada spline (CRS) son tiles en la construccin
de modelos digitales de elevacin (DEM), como se muestra en Mitsov
& Hofierka (1993), en el que se incorpora el spline en un sistema de
informacin geogrfica para estudiar la erosin del suelo. Una variacin de la
funcin multicuadrtica se llama la funcin inversa multicuadrtica (IMQ),
introducida por Hardy & Gopfert (1975). Luego, el spline capa delgada (TPS)
fue introducido en el diseo geomtrico por Duchon (1976). El nombre TPS
se refiere a una analoga fsica que implica la flexin de una hoja delgada de
metal. (Franke 1982) desarroll un programa de ordenador para la solucin
del problema de interpolacin de datos dispersos; el algoritmo se basa en
una suma ponderada de TPS definidos localmente, obtenindose una funcin
de interpolacin que es diferenciable. Ms tarde, Thibaux & Pedder (1987)
describieron la TPS como una superficie de dos dimensiones llamada spline
cbico. Otra variante popular de la TPS es la aproximacin Gaussiana (GAU)
utilizada por Schagen (1979). Otra funcin de base radial es la interpolacin
spline cbica y exponencial (EXP) que permite evitar los puntos de inflexin
y contiene splines cbicos como un caso especial (Sph 1969). Por ltimo,
Mits & Mitsov (1988), Mitsov & Hofierka (1993) y Mitsov & Mits
(1993) desarrollan la formulacin de spline con tensin (ST) e implementan
un algoritmo de segmentacin con un tamao flexible de la superposicin del
vecindario.

Investigaciones recientes utilizan RBF sobre dominios irregulares en dos


dimensiones a travs del proceso de conformacin de trasplante (Heryudono &
Driscoll 2010). Zhang (2011) desarrolla un algoritmo rpido para el estimador
de suavizado spline univariado en una regresin multivariante mediante el uso
de funciones de base radial de soporte compacto. Yavuz & Erdogan (2012)
2.2 Interpolacin a partir de funciones de base radial (RBF) 69

realizan un anlisis de tendencias de las precipitaciones mensuales y anuales,


utilizando los mtodos de interpolacin kriging ordinario, distancia inversa
ponderada y spline completamente regularizado. Estos estudios demuestran
la utilidad de trabajar con RBF.

Adems, en los estudios anteriormente presentados con frecuencia se tiene


que lidiar con variables explicativas de diferente naturaleza asociadas con
una variable respuesta espacial. Dichas variables independientes pueden ser:
categricas, binarias y continuas; sin embargo, los mtodos mencionados
anteriormente no son totalmente apropiados cuando se modela una mezcla
de variables explicativas.

2.2 Interpolacin a partir de funciones de base


radial (RBF)

Las funciones de base radial son interpoladores determinsticos


moderadamente rpidos y exactos. Ellos son mucho ms flexibles que
IDW, pero hay ms parmetros decisores. Estas funciones permiten crear
una superficie que captura tendencias globales teniendo en cuenta las
variaciones locales. Esta es utilizada en los casos en que las tcnicas de
ajuste con los planos no representan de manera precisa la superficie.

Para crear la superficie, es necesario suponer que se tiene la habilidad


de curvar y expandir la superficie modelada, tal que esta pase a travs de
todos los valores medidos. Hay muchos caminos para predecir la forma de la
superficie entre los puntos medidos. Por ejemplo se puede forzar la superficie
a formar curvas suaves (tiras suaves - thin plate spline (TPS)).

Las RBFs son conceptualmente similares a ajustar una membrana rugosa


a travs de los valores medidos mientras se minimiza la curvatura total de la
70 Captulo 2. Mtodos de Interpolacin Determinsticos

superficie. La funcin bsica seleccionada determina cmo la membrana ser


ajustada entre los valores.

Como ya se menciono los mtodos RBF son interpoladores exactos, hecho


que hace que difieren de los interpoladores globales y locales polinomicos
(Regresiones lineales), los cuales son ambos interpoladores inexactos que no
requieren que la superficie pase a travs de los puntos medidos. Cuando se
comparan los mtodos de RBF, IDW y Polgonos de Voronoi (PV), otros
interpoladores exactos, IDW y PV nunca predecirn valores por encima del
valor mximo medido o por debajo del valor mnimo medido. De cualquier
manera, la RBF puede predecir valores por encima del mximo y por debajo
del mnimo.

Volviendo con las limitaciones de los mtodos se tiene nuevamente que


para la RBF no hay valoracin de los errores de prediccin, los parmetros
ptimos son determinados utilizando validacin cruzada (p.e. leave one out)
en una forma similar, tal como se muestra para el IDW (ver seccin 2.3) y
la interpolacin local polinmica; el mtodo provee superficies de prediccin
que son comparables a la forma exacta de Kriging.

Las RBFs expuestas, IDW y PV no permiten que se analice la


autocorrelacin de los datos, haciendo estos mtodos menos flexibles y ms
automticos que kriging (Johnston et al. 2001).

2.2.1 Funciones de base radial

En esta seccin se realiza un breve estudio terico sobre las funciones de base
radial aplicadas al problema de interpolacin espacial.

Definicin 2.1. Una funcin : Rd R se llama radial, si existe una


2.2 Interpolacin a partir de funciones de base radial (RBF) 71

funcin invariante (s) = [0, ) tal que:

(s) = (), donde = ksk

y k k es la norma Euclidiana en Rd . Esto significa que el valor de la funcin


en el punto s Rd nicamente depende de la norma de s.

A continuacin se presentan algunas funciones de base radial espaciales


que sern utilizadas en los siguientes captulos, y que son adaptadas
directamente a funciones de base radial espacio-temporales.

Multicuadrtica (MQ)

Hardy (1990) llamo multicuadrtico al mtodo porque considero que la


caracterstica principal es la de ser una superposicin de superficies cudricas.

Definicin 2.2. Dado un conjunto de n puntos distintos {xi }ni=1 Rd


y sus correspondientes valores escalares {fi }ni=1 R, el interpolador
multicuadrtico de los datos tiene la siguiente forma:
n
X q
p(si ) = bj i2 + i2 , j = 1, . . . , n
j=1

donde los coeficientes bj se determinan mediante la imposicin de las


condiciones de interpolacin p(si ) = fi , para i = 1, . . . , n, y j es un
parmetro de suavizado. De aqu se obtiene el siguiente sistema de ecuaciones
lineales y simtricas
b = f
q
donde b = (b1 , . . . , bn )0 y las entradas de estn dadas por ij = 2 + ij2 .

Particularmente, dado un conjunto de medidas dispersas provenientes de


un conjunto de puntos en una superficie topogrfica (por ejemplo, medidas de
72 Captulo 2. Mtodos de Interpolacin Determinsticos

la elevacin de una montaa), se construye de forma satisfactoria una funcin


continua que representa la superficie. Por satisfactoria se entiende una funcin
que consigue realizar un ajuste exacto de los datos y proporciona una buena
aproximacin de las caractersticas de la superficie, es decir, localizacin
de las cumbres, llanuras y desembocaduras. Parte de la motivacin para
construir esta funcin fue crear un mtodo automtico que permitiese generar
los mapas del contorno de una superficie cartogrfica (Ortega-Prez 2009).

Adems de crear de forma automtica y de manera objetiva los mapas del


contorno, se obtuvo una motivacin matemtica para construir una funcin
continua que representase una superficie topogrfica, ya que teniendo esta
funcin continua se podran utilizar mtodos analticos y geomtricos que
permitiesen determinar volmenes de tierra, cumbres, llanuras, distancias a
lo largo de una curva (Hardy 1971, Hardy 1990).

Multicuadrtica inversa (IM)

Una variacin de la funcin multicuadrtica fue introducida por (Hardy &


Gopfert 1975), y esta dada por
p
() = 1/ 2 + 2

donde 6= 0 es un parmetro de suavizado de libre escogencia. Franke (1982)


encuentra que esta funcin de base radial puede proporcionar excelentes
aproximaciones, incluso cuando el nmero de centros (vecinos ms cercanos)
es pequeo.

Spline con tensin (ST)

Esta funcin esta dada por la expresin

() = ln( /2) + K0 ( ) + CE
2.2 Interpolacin a partir de funciones de base radial (RBF) 73

donde K0 (x) es la funcin modificada de Bessel (Abramowitz & Stegun 1965,


R
pg. 374) y CE = 0 (ln(x)/ex )dx = 0.5772161 es la constante de Euler
(Abramowitz & Stegun 1965, pg. 255).

Spline capa delgada (TPS)

Este spline fue introducido en el diseo geomtrico por Duchon (1976). El


nombre, spline capa delgada, se refiere a una analoga fsica que implica la
flexin de una hoja delgada de metal. Ms tarde Thibaux & Pedder (1987)
describi la TPS como un spline cbico de 2 dimensiones (superficie). En el
caso de un espacio Euclidiano con d = 2, la TPS tendr la siguiente forma:

( )2 log( ) si 6= 0 y > 0
() =
0 si = 0

Franke (1982) desarrolla un programa informtico para la solucin del


problema de interpolacin de datos dispersos. El algoritmo se basa en una
suma ponderada de splines capa delgada definidos localmente y se obtiene
una funcin de interpolacin que es diferenciable.

Completamente regularizada spline (CRS)

Una variante de la TPS que usa la funcin base spline regularizada, se


denomina CRS y viene dada por

X (1)k ( )2k
() = = ln( /2)2 + E1 ( /2)2 + CE
k=1
k!k

donde E1 () es la funcin integral exponencial (Abramowitz & Stegun 1965,


pg. 227) y CE es la constante de Euler definida anteriormente.
74 Captulo 2. Mtodos de Interpolacin Determinsticos

Gaussiana (GAU)

Una de las funciones de base radial ms popular, junto con la TPS, es la


Gaussiana. Schagen (1979) fue el primero en usar la Gaussiana como funcin
de base radial. Esta funcin esta dada por
2
() = e

donde 6= 0 es el parmetro de suavizado de libre eleccin.

Franke (1982) encuentra que es muy sensible a la eleccin del parmetro


, como se podra esperar. En particular, parece que los usuarios de esta
funcin se dejan seducir por su suavidad y rpida descomposicin. Adems,
la matriz de interpolacin Gaussiana es definida positiva si los centros son
distintos, y tambin es adecuado su uso en tcnicas iterativas (Baxter 1992).

Exponencial

La funcin de base radial til en la interpolacin espacial es la exponencial


que permite evitar los puntos de inflexin y contiene splines cbicos como un
caso especial (Sph 1969). La funcin esta viene dada por

() = e

donde 6= 0 es el parmetro de suavizado.

Esta funcin en interpolacin espacial se caracteriza por no generar


predicciones fuera del rango muestral.

En la Tabla 2.1 se presentan algunas RBFs, el parmetro de suavizamiento


ptimo , el cual es un parmetro de libre eleccin, se encuentra al minimizar
la raz del cuadrado medio del error de prediccin (RMSPE) haciendo uso
de la validacin cruzada. Algunas descripciones adicionales de RBFs y sus
2.2 Interpolacin a partir de funciones de base radial (RBF) 75

relaciones con los splines y kriging se pueden encontrar en Bishop (1995, p.


164), Chils & Delfiner (1999, pag. 272) y Cressie (1993, pag. 180).

Las funciones de base radial se recomiendan utilizar para calcular


superficies suavizadas de un gran nmero de datos. Las funciones producen
buenos resultados para variaciones superficiales suaves tales como la
elevacin. Las tcnicas son inapropiadas cuando hay grandes cambios en los
valores de la superficie dentro de una distancia horizontal corta y/o cuando
se sospecha que los datos son propensos a error o a incertidumbre.

Tabla 2.1: Formas funcionales de algunas RBFs

RBF Forma funcional RBF Forma funcional


2
EXP () = e , >0 GAU () = e , 6= 0
p p
MQ () = 2 + 2 , 6= 0 IMQ () = 1/ 2 + 2 , 6= 0
RBF Forma funcional

( )2 log( ) si > 0, > 0
TPS () =
0 si = 0


ln( /2)2 + E1 ( /2)2 + CE si > 0, > 0
() =
0 si = 0
CRS
donde ln es el logaritmo natural, E1 (x) es la funcin integral exponencial
y CE es la constante de Euler.

ln( /2) + K0 ( ) + CE si > 0
() =
0 si = 0
ST
donde K0 (x) es la funcin modificada de Bessel y CE es la constante de
Euler.
76 Captulo 2. Mtodos de Interpolacin Determinsticos

2.2.2 Mtodo de interpolacin con RBF

El proceso aleatorio Gaussiano se puede expresar en forma general por


Z(si ) = g(si ) + (si ), i = 1, . . . , n (2.1)
donde g(si ) es una funcin de valor-real, dada por
k
X n
X
g(si ) = l fl (si ) + j (si sj ), i = 1, . . . , n
l=0 j=1

o en forma matricial,
g = F + (2.2)
donde g = (g(s1 ), . . . , g(sn ))0 , F = (1, F1 , . . . , Fk ) es una matriz n (k + 1)
con elementos 1 y Fl = (fl (s1 ), . . . , fl (sn ))0 , l = 1, . . . , k, y con cada fl (si )
una funcin de valor real; = (0 , 1 , . . . , k )0 donde cada l corresponde
al l-simo coeficiente del modelo de tendencia; es una matriz n n con
elementos (si sj ), (.) es una funcin de base radial, es decir una funcin
escalar de la distancia Euclidiana entre si y sj ; finalmente, = (1 , . . . , n )0 ,
con i un peso desconocido.

Los parmetros y pueden ser estimados por mnimos cuadrados


penalizados, minimizando la siguiente expresin
Xn Z
2
[Z(si ) g(si ))] + Jm (g(s))ds (2.3)
i=1 R2

donde Jm (g(s)) es una medida de la rugosidad de la funcin spline g (definida


en trminos de las m-simas derivadas de g) y > 0 acta como un parmetro
de suavizamiento.

La expresin (2.3) se puede expresar al hacer los respectivos reemplazos


como
Z
0 2
L(, ) =(Z F ) (Z F ) + [g 00 (s)] ds
R2

=(Z F )0 (Z F ) + kP gk2
2.2 Interpolacin a partir de funciones de base radial (RBF) 77

donde Z = (Z(s1 ), . . . , Z(sn ))0 y P es el espacio que genera y kP gk2 =


hP g, Ps gi = 0 qq 0 = 0 con = qq 0 . Por lo tanto,

L(, ) =(Z F )0 (Z F ) + 0
=Z 0 Z 2Z 0 F 2Z 0 + 0 F 0 F + 2 0 0 F
+ 0 0 + 0

Al derivar parcialmente con respecto a los vectores y e igualar a cero,


se encuentra que
L(, )
= 2F 0 Z + 2F 0 F + 2F 0 =0

F + =Z (2.4)
L(, )
= 20 Z + 20 F + 20 + 20 =0

F + ( + I) =Z (2.5)

donde I es la matriz identidad de orden nn y puede ser interpretado como


ruido blanco adicionado a las varianzas en las localizaciones de los datos, pero
no la varianza en la localizacin donde se predice (Wackernagel 2003).

Not aqu que si es definida positiva entonces hay unicidad de


los coeficientes en el interpolador g(si ). Con el fin de generalizar los
interpoladores, es necesario considerar las formas ms generales de las
matrices definidas positivas.

Definicin 2.3. Sean f0 , f1 , . . . , fk funciones linealmente independientes de


valor-real definidas sobre Rd y una matriz simtrica real. Luego, es
definida positiva con respecto a f0 , f1 , . . . , fk si y slo si para todos los
n P
n
conjuntos de puntos s1 , . . . , sn en Rd se tiene que
P
qi qj (si sj ) 0
i=1j=1
para todo qi (i = 1, . . . , n), donde qi es un escalar (no todos cero), y tales que
Pn
fl (sj )qj = 0 para l = 1, . . . , k.
j=1
78 Captulo 2. Mtodos de Interpolacin Determinsticos

Como por la definicin 2.3, es definida positiva, entonces + I es


invertible y as (2.5) se puede escribir como:

s = ( + I)1 (Z F ) (2.6)

Reemplazando (2.6) en (2.4) se obtiene

F + ( + I)1 (Z F ) =Z
I ( + I)1 F = I ( + I)1 Z
   
(2.7)

Observe que
 1
1
I ( + I)1 = = ( + I)1
 
I+ (2.8)

Premultiplicando por F 0 la expresin (2.7) y reemplazando por (2.8), se


encuentra que
1 0
b = F 0 ( + I)1 F F ( + I)1 Z

(2.9)

y reemplazando (2.8) en (2.6), se encuentra finalmente que


n 1 0 o
1
 0 1 1

b = ( + I) I F F ( + I) F F ( + I) Z (2.10)

Al premultiplicar por F 0 a (2.10), se obtiene

F 0 = 0

y al combinarlo con el sistema (2.5), se encuentra que (, ) son la solucin


del siguiente sistema de ecuaciones lineales
! ! !
+ I F Z
= (2.11)
F0 0 0
2.2 Interpolacin a partir de funciones de base radial (RBF) 79

Si no hay tendencia, F se convierte en un vector de unos y en un parmetro


de sesgo. Luego el predictor estar dado por
n
X k
X
Z(s
b 0) = i Z(si ) + i fl (s0 ) = 0 Z + 0 f (s0 ) (2.12)
i=1 l=0

donde f (s0 ) = (f0 (s0 ), . . . , fk (s0 ))0 son funciones linealmente


independientes como en el estimador kriging y F define la tendencia y
usualmente se expresa en trminos de las coordenadas "x" y "y".

2.2.3 Prediccin espacial con funciones de base radial

Hay un enlace entre los mtodos espaciales splines y kriging, el cual fue
llamado equivalentemente cercano (Cressie 1989) porque el TPS (una clase
de spline) corresponde a una covarianza generalizada especfica, mientras
que el estimador kriging y el interpolador RBF slo requieren el uso de un
kernel con propiedades adecuadas como la de definida positiva. En general,
esto permite adaptar la funcin kernel a un conjunto de datos particular
(Cressie 1989, Myers 1992). La mayor diferencia es que el usuario establece
el parmetro de suavizamiento en los splines, mientras en el caso de kriging, el
suavizamiento se determina de forma objetiva. A continuacin se desarrollan
los procesos algebraicos que permiten expresar las funciones de base radial
en forma de ecuaciones tipo kriging (ver Capitulo 3).

El objetivo es ahora predecir el valor de Z(s0 ) basado en un conjunto


de observaciones Z. Para esto, el predictor de la funcin de base radial esta
dado por

n
X
Z(s
b 0 ) = gb(s0 ) = i Z(si ) = 0 Z (2.13)
i=1
80 Captulo 2. Mtodos de Interpolacin Determinsticos

sujeto a la condicin
n
X
i fl (si ) = 0 f = fl (s0 ), l = 0, . . . , k
i=1

donde = (1 , . . . , n )0 , Z = (Z(s1 ), . . . , Z(sn ))0 y f = (fl (s1 ), . . . , fl (sn ))0 .

El error esperado es igual a cero, es decir,


 
E Z(s0 ) Z(s0 ) = 0

2
y el error cuadrtico medio de la prediccin del krigeado, K , al utilizar la
aproximacin con funciones de base radial esta dado por
h i2 
2
K (s0 ) =E Z(s0 ) Z(s0 )
n X
n n

X X
= i j (si sj ) + 2 i (si s0 )
i=1 j=1 i=1

0
= + 2 0 0
(2.14)

donde 0 = ((s1 s0 ), . . . , (sn s0 ))0 corresponde al vector de funcin de


base radial evaluado entre los vecinos y el punto donde se quiere predecir, es
decir (si s0 ).

Los pesos se determinan minimizando la siguiente expresin penalizada


n X
X n n
X Z
l(, ) = i j (si sj ) 2 i (si s0 ) + Jm (g(s))ds
i=1 j=1 i=1 R2

k n
!
X X
+2 l i fl (si ) fl (s0 )
l=0 i=1

o equivalentemente, la expresin anterior se convierte en

l(, ) =0 ( + I) 20 0 + 20 (F 0 f (s0 ))
2.2 Interpolacin a partir de funciones de base radial (RBF) 81

donde = (0 , . . . , k )0 es el vector de k + 1 multiplicadores de Lagrange


asociado con la restriccin insesgamiento, F fue definida en (2.2) y f (s0 )
definida en (2.12).

Despus de diferenciar con respecto a y , igualando el resultado a


cero y realizando algunos procedimientos algebraicos, el siguiente sistema
matricial se encuentra
! ! !
+ I F 0
= (2.15)
F0 0 f (s0 )

Resolviendo el sistema, los coeficientes para y estn dados por


n 1  o0
b 0 = 0 + F F 0 ( + I)1 F f (s0 ) F 0 ( + I)1 0 ( + I)1


1
b = F 0 ( + I)1 F [f (s0 ) F 0 ( + I)1 0 ]


(2.16)

Por otro lado, para obtener una expresin aproximada del error cuadrtico
de la prediccin, se premultiplica la parte superior de (2.15) por 0 y se
encuentra que 0 ( + I) + 0 F = 0 0 , ste trmino se reemplaza en la
expresin (2.14) y se llega a

2
K (s0 )
= 0 + 20 0

= 0 0 + 0 + 0 F + 20 0

=0 0 + 0 + f 0 (s0 )

donde F 0 = f (s0 ).

Una vez estimados y en (2.13), una expresin aproximada del error


cuadrtico de la prediccin estimado se puede escribir como
n n k

X X X
2

bK (s0 ) = bi (si s0 ) +
b2i
+
bl fl (s0 ) (2.17)
i=1 i=1 l=0
82 Captulo 2. Mtodos de Interpolacin Determinsticos

El paquete esta implementado en el programa (Team (2015)) y se


encuentra disponible en el Comprehensive R Archive Network (CRAN)
en http://cran.r-project.org/web/packages/geospt, con su respectivo
manual (Melo et al. 2015). Para interpolacin espacio temporal con RBF ver
Melo & Melo (2015).

El procedimiento presentado en esta seccin se puede resumir en la


practica as:

1. Optimizar los parmetros y del interpolador espacial con funciones


de base radial, mediante el uso del estadstico RM SP E establecido en
la expresin 2 de la subseccin 2.6.1 por medio de la validacin cruzada
(leave-one-out), empleando las expresiones (2.16) en los diferentes
vecindarios de tamao prefijado. El tamao del vecindario, n, tambin
se puede escoger dentro del mismo proceso de optimizacin.

2. Hacer las predicciones en los puntos muestreados y no muestreados


para generar el mapa de prediccin usando la interpolacin mediante
funciones de base radial, es decir, haciendo Z(s0 ) = 0 Z.

En la siguiente seccin se enfatiza en el uso de la librera geospt en el


programa R, asociado con los conceptos tericos definidos en esta seccin.

2.2.4 Ejemplo interpolacin con RBF

En este caso se considera una base de datos emprica denominada "preci" de


la librera geospt, estos datos corresponden a 10 estaciones pluviometricas y
en la ltima columna se encuentra la precipitacin denotada como "prec". A
continuacin se muestran los datos:

library(geoR)
2.2 Interpolacin a partir de funciones de base radial (RBF) 83

Tabla 2.2: Datos de precipitacin

Tomado de la librera geospt

Obs x y prec
1 1 4 420
2 1 2 410
3 3 3 405
4 3 0 415
5 5 1 430
6 5 3 425
7 6 4 415
8 6 1 435
9 6 3 425
10 7 2 430
84 Captulo 2. Mtodos de Interpolacin Determinsticos

library(geospt)
data(preci)
preci.geoR <- as.geodata(preci, coords.col = 2:3, data.col = 4)
points.geodata(preci.geoR, x.leg=3, y.leg=5, xlab="X", ylab="Y", main="", col.main=3,
pt.div="quintile")
points.geodata(preci.geoR, x.leg=3, y.leg=5, main="", col.main=3, pt.div="quintile",
add.to.plot = TRUE, panel.first = grid())

# Valores de precipitacin, desplazados para no superponerlos con los puntos


attach(preci)
text(x,y+0.18,prec,cex=0.8)
5

[405.00, 414.00)
[414.00, 418.00)
420 [418.00, 425.00) 415
[425.00, 430.00)
4

[430.00, 435.00)
405 425 425
3

410 430
Y

430 435
1

415
0
1

1 2 3 4 5 6 7

Figura 2.1: Localicacin muestra de precipitacin

A continuacin, se muestra el comportamiento del parmetro en la


Figura 2.2, obtenida a partir de graph.rbf() en la librera geospt con cinco
funciones de base radial implementadas. Como se puede ver el menor valor del
estadstico RM SP E = 4.0253 corresponde a la funcin TPS. Sin embargo,
como se muestra a continuacin si se optimizan los dos parmetros y se
2.2 Interpolacin a partir de funciones de base radial (RBF) 85

puede obtener un mejor resultado1

##-----------------------------------
## Optimizacin RBF: Ejemplo TPS:
##-----------------------------------

# Optimizacin de eta y rho


library(geospt)
data(preci)
coordinates(preci)<-~x+y
tps.lo <- graph.rbf(prec~1, preci, eta.opt=TRUE, rho.opt=TRUE, n.neigh=9, func="TPS",
eta.dmax=2, rho.dmax=2, x0=c(0.1,0.1), iter=300)
tps.lo$Opt

Esto genera un RM SP E = 0.000585458, para valores de = 0.1503636


y = 0.01118802.

Figura 2.2: Optimizacin de , en algunas FBR

1
Actualmente en el programa ArcGIS 10.1 (ESRI 2013) no es posible optimizar
simultneamente los dos parmetros
86 Captulo 2. Mtodos de Interpolacin Determinsticos

Para construir el mapa de predicciones de la precipitacin se genera


una grilla de 241001 puntos dentro de la regin analizada. En el caso
de disponer de un limite (un borde o shapefile "shp") se deber usar la
funcin spsample() del paquete sp para la creacin de la grilla. Luego,
las predicciones son generadas con la funcin rbf(), esta funcin requiere
el valor de los parmetros "eta" y "rho", la variable de anlisis "z", las
coordenadas de los puntos muestreados coordinates, las coordenadas de los
nuevos puntos newdata, el nmero de vecinos n.neigh, y el tipo de funcin
de base radial func. Estas predicciones son luego convertidas a un objeto
de clase SpatialPixelsDataFrame y sp, con la instruccin coordinates(), del
paquete sp, y finalmente con la funcin spplot() se obtiene el mapa de las
predicciones de la variable analizada, el cual se muestra en la Figura 2.3

435

430

425
Norte

420

415

410

405
Este

Figura 2.3: Mapa de prediccin TPS

El cdigo realizado en el programa R, se muestra a continuacin:

##---------------------------------------------------------------
## Interpolacin RBF: Ejemplo prediccin precipitacin "TPS":
##---------------------------------------------------------------

data(preci)
coordinates(preci) <- ~x+y
puntos<-expand.grid(x=seq(min(preci$x),max(preci$x),0.01), y=seq(min(preci$y), max(preci$y),
2.2 Interpolacin a partir de funciones de base radial (RBF) 87

0.01))
coordinates(puntos) <- ~x+y
pred.rbf <- rbf(prec~1, preci, eta=0.150363689103249, rho=0.0111879409181372, newdata=puntos,
n.neigh=10, func="TPS")
coordinates(pred.rbf) = c("x", "y")
gridded(pred.rbf) <- TRUE
# show prediction map
spplot(pred.rbf["var1.pred"], cuts=80, col.regions=rev(bpy.colors(100)), main="",
key.space=list(space="right", cex=0.8))

Por ultimo, si se desea evaluar la bondad de ajuste del mtodo de


interpolacin RBF se deben utilizar las funciones rbf.tcv y criterio.cv as:

tabla.cv <- rbf.tcv(prec~1, preci, eta=0.150363689103249, rho=0.0111879409181372, n.neigh=9,


func="TPS")
criterio.cv(tabla.cv)[,c(1,3,6:9)]
# Comparacin con el obtenido al optimizar slo eta:
tabla.cv1 <- rbf.tcv(prec~1, preci, eta=0.1460814, rho=0, n.neigh=9, func="TPS")
criterio.cv(tabla.cv1)[,c(1,3,6:9)]

Con lo cual se obtiene


MPE RMSPE MAPPE CCPE R2 pseudoR2
4.766955e-06 3.457817e-05 5.802416e-08 1.0000000 1.0000000 1.0000000
0.8069262 4.025405 0.008273694 0.9066594 0.8070966 0.8220313

Es claro, que el interpolador funciona mejor cuando se optimizan los dos


parmetros y

2.2.5 Aplicacin interpolacin con RBF

Muestreo en la altiplanicie de un Acufero: Este muestreo es un subconjunto


de una gran medicin anual de los niveles de agua en la parte de Kansas de
la altiplanicie del acufero. La encuesta fue realizada por la Junta Estatal de
Agricultura de Kansas y el estudio geolgico de los Estados Unidos durante el
perodo comprendido entre diciembre de 1980 a marzo de 1981. La altiplanicie
88 Captulo 2. Mtodos de Interpolacin Determinsticos

del acufero es de finales del terciario al cuaternario y consiste en aluviales,


dunas de arena y el valle de los depsitos llenos de corrientes que fluyen hacia
el este de las Montaas Rocosas. En la siguiente Tabla 2.3, LSE (por sus siglas
en ingls, land surface elevation) es sinnimo de elevacin de la superficie
terrestre, WD (wather depth) para la profundidad salada, y WTE (water
table elevation) para la elevacin fretica. Los datos estn en la direccin de
Internet http://www.kgs.ku.edu/Mathgeo/Books/Geostat/index.html y
pueden ser descargados desde ese sitio Olea (1999).

Tabla 2.3: Muestreo de la llanura alta de un acufero en una parte de Kansas

Tomado de (Olea 1999)

Obs Condado Este Norte LSE WD WTE


(millas) (millas) (pies) (pies) (pies)
993 Rawlins 61.60748 197.84683 3219.0 154.0 3065.0
1002 Rawlins 62.94145 194.81029 3267.0 167.6 3099.4
1003 Rawlins 55.68056 193.55966 3220.0 20.0 3200.0
1502 Thomas 64.96323 189.76530 3245.0 130.1 3114.9
1504 Thomas 74.79759 190.60039 3408.0 190.9 3217.1
1505 Thomas 59.11987 189.47089 3360.0 170.3 3189.7

Con fines de mostrar el funcionamiento se estimar la variable WTE en


s0 = (60, 193). Para ello se considera el sistema matricial 2.14 en el vecindario
de tamao 6 definido a continuacin:
2.2 Interpolacin a partir de funciones de base radial (RBF) 89

1
1 11 12 13 14 15 16 1 f11 f12 f13 10

2 21 22 23 24 25 26 1 f21 f22 f23 20

3 31 32 33 34 35 36 1 f31 f32 f33 30


42 43 44 45 46 1 f41 f42 f43
4 41 40

5 51 52 53 54 55 56 1 f51 f52 f53 50
=
62 63 64 65 66 1 f61 f62 f63
6 61 60

0 1 1 1 1 1 1 0 0 0 0 f00

1 f11 f21 f31 f41 f51 f61 0 0 0 0 f10


f f22 f32 f42 f52 f62 0 0 0 0 f
2 12 20
3 f13 f23 f33 f43 f53 f63 0 0 0 0 f30

Aqu f00 = 1, lo cual indica que la suma de los ponderadores es 1.

1
1 0.00 2.98 4.56 4.92 6.00 4.91 1 61.61 197.9 154.0 3.84 0.178

2.98 0.00 4.57 3.96 5.64 4.34 1 62.94 194.8 167.6 3.06 0.358
2

3 4.56 4.57 0.00 5.19 6.50 3.93 1 55.68 193.6 20.0 3.52 0.044

4.92 3.96 5.19 0.00 5.16 4.11 1 64.96 189.8 130.1 4.14 -0.003
4

5
= 6.00 5.64 6.50 5.16 0.00 6.09 1 74.80 190.6 190.9
5.99 -0.049
3.16 = 0.472

4.91 4.34 3.93 4.11 6.09 0.00 1 59.12 189.5 170.3
6

0 1 1 1 1 1 1 0 0 0 0 1 2.002

61.61 62.94 55.68 64.96 74.80 59.12 0 0 0 0 60 -0.086
1

2 197.9 194.8 193.6 189.8 190.6 189.5 0 0 0 0 193 0.011
3 154.0 167.6 20.0 130.1 190, 9 170, 3 0 0 0 0 159 0.011

Luego la prediccin en el punto s0 para Z esta dada por:

Z(s0 ) = 0.178 3065.0 + 0.358 3099.4 + 0.044 3200.0 0.003 3114.9


0.049 3217.1 + 0.472 3189.1 = 3134.437

##---------------------------------------------------------------
## Interpolacin RBF: Ejemplo vecindario local con funcin CRS:
##---------------------------------------------------------------

library(geospt)
ejercRBF <- read.table("D:/Calculos Libro/RBF/ejercRBF.txt",header =T, sep="")
names(ejercRBF)[3:4] <- c("x","y")
coordinates(ejercRBF) <- ~x+y
90 Captulo 2. Mtodos de Interpolacin Determinsticos

So <- data.frame(60,193,159)
names(So) <- c("x","y","WD")
coordinates(So) <- ~x+y
rbf(WTE~x+y+WD, ejercRBF, eta=2, rho=0, newdata=So, n.neigh=6, func="CRS")

2.3 Distancia Inversa Ponderada (IDW)

Este mtodo de interpolacin considera que el valor de un punto, se


puede obtener a partir de la suma ponderada de los valores de la variable
regionalizada de los vecinos ms cercanos. Y la formula general para el IDW
(por sus siglas en ingls) est dada por:
n
X
Z(s0 ) = i Z(si ) (2.18)
i=1

Donde:

Z(s0 ) es el valor a predecir para la posicin s0 .

n es el nmero de puntos muestreados que rodean el puntos s0 y que


sern usados en la prediccin.

i son los pesos asignados a cada medicin realizada sobre los puntos
que se utilizarn en la prediccin. Estos pesos decrecen con la distancia.

Z(si ) es el valor observado de determinada variable en la localizacin


si

La expresin para determinar los pesos es la siguiente:


dp
i = n i0 (2.19)
X p
di0
i=1

Donde:
2.3 Distancia Inversa Ponderada (IDW) 91

Pn
i=1 i = 1.

El peso es controlado por un factor p con cada incremento de la


distancia.

La cantidad di0 es la distancia entre la posicin de prediccin y cada


una de las posiciones medidas si .

El parmetro p influencia el peso de los valores medidos en el punto a predecir;


de tal manera que, si la distancia se incrementa entre las posiciones medidas
y la posicin a predecir, el peso (o influencia) que el punto medido tiene en
la prediccin decrecer exponencialmente.

El valor ptimo para p es determinado minimizando la raz cuadrada


media del error de prediccin (RMSPE), tal como se muestra en la Figura
2.4. El RMSPE es uno de los estadsticos de la validacin cruzada (ver seccin
2.5).

El cdigo en R es el siguiente (considerando los datos de la aplicacin


dada en esta seccin)

library(geospt)
ejercIDW <- read.table("D:/Calculos Libro/IDW/ejercIDW1.txt", header =T, sep="")
graph.idw(PRECI_TOT~ 1, ~x+y, data=ejercIDW, np=50, p.dmax=4, nmax=15, nmin=15, P.T=T)

2.3.1 Ejemplo

En esta seccin, se da un ejemplo prctico del mtodo IDW con cinco


observaciones, con el objetivo de predecir en otro lugar. Este es un ejemplo
de la prediccin local y el procedimiento debera seguirse en todos los lugares
de prediccin utilizando un vecindario de cinco observaciones. Sin embargo,
este es un tamao muestral muy pequeo, en la practica, el nmero mnimo
de vecinos mas cercanos que se utiliza es probable que sea ms grande. Los
92 Captulo 2. Mtodos de Interpolacin Determinsticos

28.5
28.0
Optimal p = 2.0735
27.5 RMSPE = 26.1672
RMSPE

27.0
26.5

0 1 2 3 4

Figura 2.4: Optimizacin de p, en IDW

datos se muestran en la Tabla 2.3, donde la observacin s0 es desconocida y la


prediccin se realiza con las otras 5 observaciones. Aqu IDW se implementa
con una potencia p = 2, la columna CDI muestra los cuadrados de las
distancias inversas, la columna contiene los pesos para cada uno de los
vecinos al punto s0 (como se puede observar estos suman 1), y la ltima
columna los valores de precipitacin multiplicados por los respectivos pesos
de cada una de las observaciones. Luego la prediccin obtenida en la ubicacin
s0 es Z(s0 ) = 19, 49.

Los calculos en el programa R son los siguientes:

##------------------------------------------------
## Interpolacin IDW: Ejemplo vecindario local:
##------------------------------------------------

DF <- read.table("D:/Calculos Libro/IDW/ejercIDW2.txt",header =T,sep="")


library(gstat)
2.3 Distancia Inversa Ponderada (IDW) 93

Tabla 2.4: Precipitacin: Prediccin IDW usando observaciones s1 a s5 . CDI es


el cuadrado de la distancia inversa

ID x y Precipita- Distancia CDI i Zi


(m) (m) cin (mm) desde s0
s1 1024410 875692 6 18689,65 2,86E-09 0,219 1,31
s2 1019602 882206 15 20747,84 2,32E-09 0,178 2,67
s3 1026073 910933,6 31 28559,51 1,23E-09 0,094 2,91
s4 1026973 905583 16 23520,13 1,81E-09 0,138 2,21
s5 1049356 875108 28 14358,64 4,85E-09 0,371 10,4
s0 1040000 886000 ? Suma 1,31E-08 1,000 19,5

library(fields)

Dist.s0 <- rdist(DF[,3:4])[6,1:5]


# Caso p=2
CDI <- (Dist.s0^(-2))
Lambda <- CDI/sum(CDI)
Z.est <- DF[1:5,6]%*%Lambda
# Con la libreria gstat
idw.p2 <- idw(PRECI_TOT~ 1, ~ x+y, DF[1:5,], DF[6,], nmax=5, nmin=5, idp=2)

2.3.2 Aplicacin
##----------------------------------------------------
## Aplicacin IDW: Ro Ariari (Estaciones climticas)
##----------------------------------------------------
ejercIDW <- read.table("D:/Calculos Libro/IDW/ejercIDW1.txt", header =T, sep="")
library(maptools)
utm.18 <- "+proj=utm +zone=18 +datum=WGS84 +units=m +no_defs +ellps=WGS84 +towgs84=0,0,0"
ariari<- readShapePoly("D:/Calculos Libro/IDW/Ariari",,CRS(utm.18))
plot(ariari)
puntos <- spsample(ariari,20000,"regular")
plot(puntos)
94 Captulo 2. Mtodos de Interpolacin Determinsticos

Tabla 2.5: Datos de estaciones climticas del ro Ariari (Dpto del Meta)

Obs Nombre x y ELEV PRECI


_TOT
1 PUERTO LLERAS 1078279 853121.8 245 25.0
2 MESETAS 1003838 865519.1 620 10.0
3 VISTA HERMOSA 1035957 836811.2 325 0.0
4 LEJANIAS 1005572 882047.6 680 3.2
5 AGUAS CLARAS 1024410 875692.0 520 6.0
6 SAN JUAN DE ARAMA 1020621 864971.2 410 18.0
7 MESA DE YAMANES 1019602 882206.0 600 15.0
8 SAN LUIS DE CUBARRAL 1026073 910933.6 600 31.0
9 CALIME 1026973 905583.0 800 16.0
10 PTO ANGOSTURAS 1017221 911146.6 854 100.0
11 CAMPO ALEGRE 1036402 845614.7 260 0.0
12 LOS MICOS 1020598 858490.1 500 47.0
13 FUENTE DE ORO 1049356 875108.0 300 28.0
14 TIERRA GRATA 1094613 833206.8 191 10.0
15 PEAS BLANCAS 1017875 858511.1 440 73.0
16 MESA DE FERNANDEZ 1005285 873978.4 650 7.0
17 PTO RICO 1096479 817264.9 230 59.0
18 LEJANIAS CASTILLO 1001985 887210.9 840 2.0
2.3 Distancia Inversa Ponderada (IDW) 95

Figura 2.5: Interpolacin Distancia Inversa Ponderada de la Precipitacin (P=2)

library(gstat)
library(fields)
idw.p <- idw(PRECI_TOT~ 1, ~ x+y, ejercIDW, puntos, nmax=15, nmin=15, idp=2)
coordinates(idw.p) = c("x", "y")
pal2 <- colorRampPalette(c("snow3","royalblue1", "blue4"))
#Interpolaciones IDW de la Precipitacin (P=2)
p1 <- spplot(idw.p[1], col.regions=pal2(100), cuts =60, scales = list(draw =T), xlab ="Este
(m)", ylab = "Norte (m)", main = "", auto.key = F)
split.screen( rbind(c(0, 1,0,1), c(1,1,0,1)))
96 Captulo 2. Mtodos de Interpolacin Determinsticos

split.screen(c(1,2), screen=1)-> ind


screen( ind[1])
p1
screen( ind[2])
image.plot(legend.only=TRUE,legend.width=0.5,col=pal2(100),smallplot=c(0.6,0.68,0.5,0.75),
zlim=c(min(idw.p$var1.pred),max(idw.p$var1.pred)), axis.args = list(cex.axis = 0.7))
close.screen( all=TRUE)

2.3.3 IDW Resumen y conclusiones

El interpolador IDW es popular en muchas disciplinas ya que es un mtodo


conceptualmente simple, no requiere de un modelado o de la estimacin
de parmetros, y suele ser computacionalmente rpido. Puede ser un
interpolador exacto (es decir, la superficie interpolada pasa a travs de las
observaciones originales), o un suavizador espacial (es decir, las predicciones
en los lugares observados se ajustan al promedio del vecindario). Sin embargo,
las superficies asignadas tienden a tener picos de cimas planas y valles
de fondo plano que da un patrn caracterstico de ojo de buey producido
por contornos concntricos alrededor de los puntos observados que pueden
interferir con la interpretacin visual del mapa. Adems, dado que no
existe un modelo estadstico subyacente, no hay una medida fcil de la
incertidumbre asociada con el valor interpolado (Haining (2004)).

2.4 Polgonos de Voronoi (Thiessen)

Los polgonos de Thiessen, de uso habitual en el anlisis climatolgico


cuando las observaciones locales no estn disponibles, asociando a cada zona
los valores de la estacin climtica ms cercana. Se denominan polgonos
de Thiessen (en honor de Alfred Thiessen, meteorlogo estadounidense)
conforman una estructura conocida como teselacin de Voronoi (en honor
2.4 Polgonos de Voronoi (Thiessen) 97

a Georgy Voronoi, matemtico ruso) o teselacin de Dirichlet (por el


matemtico Gustav Lejeune Dirichlet). La cual est ntimamente ligada a
la denominada triangulacin de Delaunay, base para la construccin de TIN
(Triangulated Irregular Network, por sus siglas en ingls). Los polgonos de
Thiessen definen las "regiones de influencia" individuales alrededor de cada
uno de los conjuntos de puntos de tal manera que cualquier ubicacin dentro
de un particular polgono, estar ms cerca a un punto de ese polgono que
a cualquier otro punto, y por lo tanto, tendr el mismo valor (Heywood
et al. 2006).

2.4.1 Construccin Polgonos

La Figura 2.6 muestra paso a paso cmo se definen de forma nica los lmites
del polgono de influencia (polgono de Voronoi). La mediatriz de un segmento
de lnea es una lnea en la que los puntos son equidistantes de los extremos
del segmento de lnea; puntos a ambos lados de la bisectriz perpendicular
tienen que estar ms cerca de un extremo o el otro. Las mediatrices entre
una muestra y sus vecinos forman los lmites del polgono de influencia

Los bordes de la regin requieren un tratamiento especial. Una muestra


situada cerca del borde de la zona de inters no puede ser completamente
rodeada por otras muestras y las mediatrices con sus vecinos no pueden
formar un polgono cerrado. Una solucin es elegir un lmite natural, tales
como un lmite de un accidente geogrfico o un contacto geolgico, para
servir como un lmite para toda la zona; esto, entonces se puede utilizar para
cerrar los polgonos fronterizos (Isaaks & Srisvastava 1989). En la Figura 2.7
se observa el resultado de aplicar el proceso explicado anteriormente a un
conjunto de puntos muestreados (en azul) en la construccin de los polgonos
Voronoi (en trazos discontinuos).
98 Captulo 2. Mtodos de Interpolacin Determinsticos

(a) Puntos muestreados (b) Lineas de conexin entre

los puntos muestreados

(c) Construccin de mediatrices (bisectrices (d) Construccin del polgono

perpendiculares) entre lneas de conexin

Figura 2.6: Construccin de polgonos de Voronoi

2.4.2 Declustering

Declustering k-vecinos ms cercanos

Dado que en ocasiones las muestras asociadas a las localizaciones "s" se


concentran ms en unas regiones que en otras. Una buena alternativa o
2.4 Polgonos de Voronoi (Thiessen) 99

Figura 2.7: Polgonos de Voronoi y Triangulacin de Delaunay (en trazo


continuo) a partir de una muestra

estrategia para construir la media es considerar los k vecinos ms cercanos.


El procedimiento es el siguiente:
Considere la Figura 2.8.

Primero se calculan las distancias entre todas las observaciones y


posteriormente se seleccionan los k-vecinos ms cercanos, por ejemplo 3
vecinos, luego a partir de las distancias ms cercanas se suman stas,
obteniendo "S.dist. Finalmente, con las sumas para cada observacin se
procede a calcular los pesos wi , as:
S.disti
wi = P
n
S.disti
i=1

Para el ejemplo n = 10, se obtienen los pesos wi en la ltima columna de la


Tabla 2.5.
100 Captulo 2. Mtodos de Interpolacin Determinsticos

Figura 2.8: Localizacin de los puntos de muestreo

Para obtener un promedio de z asi:


n
P
wi Zi
i=1
Z= n
P (2.20)
wi
i=1

Con los datos dados Z = 419.5986 y la varianza con los pesos wi = 1 es:
n
(Zi Z)2
P
i=1
Z2 = = 85.96384
n
Como en este caso hay pesos asociados a las observaciones, entonces la
2.4 Polgonos de Voronoi (Thiessen) 101

Tabla 2.6: Calculos Declustering distancias

Pto Coord-x Coord-y Z (k vecinos S.dist wi


knn )
1 1 4 420 (2,3,6) 2.786391 0.1463
2 1 2 410 (1,3,4) 2.354032 0.1236
3 3 3 405 (6,1,2) 2.157379 0.1132
4 3 0 415 (5,2,3) 2.688165 0.1411
5 5 1 430 (8,6,10) 1.745356 0.0916
6 5 3 425 (9,7,5) 1.471405 0.0772
7 6 4 415 (9,6,10) 1.550094 0.0814
8 6 1 435 (5,10,9) 1.471405 0.0772
9 6 3 425 (7,6,10) 1.138071 0.0597
10 7 2 430 (9,8,7) 1.688165 0.0886

varianza muestral estar dada por:


n
wi (zi z)2
P
i=1
z2 = n
P (2.21)
wi
i=1

Lo cual, para el ejemplo es z2 = 82.06468.

Declustering por reas

En ste mtodo primero se generan los polgonos de Thiessen , denominados


tambin "polgonos de Voronoi", los cuales se construyen de los trazos
generados por las perpendicularidades entre los puntos equidistantes de las
muestras observadas. Un ejemplo de sto se muestra en la Figura 2.9.

A partir de los polgonos, se determinan las diferentes reas asociadas a


cada uno de stos, siendo as Ai el rea asociada al punto o muestra i, luego
102 Captulo 2. Mtodos de Interpolacin Determinsticos

Figura 2.9: Polgonos de Thiessen

el peso wi estar dado por


Ai
wi = P
n
Ai
i=1

n
P
Es claro que wi = 1 para encontrar el promedio muestral ponderado, se
i=1
consideran los pesos wi en la expresin (2.14) y para la varianza muestral la
expresin (2.15).

2.4.3 Interpolacin con polgonos de Voronoi

Este mtodo de interpolacin con vecinos naturales encuentra un subconjunto


de muestras ms cercanas al punto donde se desea interpolar y luego aplica
pesos a ellos, basados en las reas de los polgonos de voronoi generados a
partir de la interseccin entre el polgono generado en el nuevo punto (o punto
a interpolar) y los polgonos de voronoi ya existentes asociados a la muestra
ms cercana (Sibson 1981), este mtodo tambin se conoce como Sibson. Sus
2.4 Polgonos de Voronoi (Thiessen) 103

propiedades bsicas son que es local, utiliza slo un subconjunto de muestras


que rodean un punto de consulta, y que las predicciones de las interpolaciones
se garantiza que estarn dentro del rango de los valores de las muestras
observadas. No infieren tendencias y no producir picos, fosas, crestas o valles
que no estn representados por los valores de las muestras observadas. La
superficie pasa a travs de los valores de las muestras observadas y es lisa en
todas partes excepto en los lugares de la muestra. Funciona igual de bien con
los datos distribuidos de forma regular irregular.

Ejemplo

Tal como se indica en la Figura 2.10, los puntos utilizados para estimar el
valor de un atributo en la ubicacin s0 son los vecinos naturales de s0 , y el
peso de cada vecino wi es igual al rea de interseccin entre el polgono de
Thiessen asociado al punto s0 y los poligonos de Thiessen asociados a sus
puntos vecinos (P1 , P2 , P3 , P4 , P5 y P6 ).

Los datos asociados a la Figura 2.10 se muestran en la Tabla 2.7 y la


prediccin en s0 esta dada como en el mtodo IDW por:
n
X
Z(s0 ) = wi Z(si )
i=1

Aqu wi corresponde al peso del vecino en la ubicacin si del punto s0 . Y tal


Ai
como se explico anteriormente wi = n
P .
Ai
i=1

Luego la prediccin en s0 es Z(s0 ) = 24.45.

Programacin en R

Considerando los datos de la subseccin 3.4.4, primero se construyen los


polgonos de Voronoi asociados a la muestra de datos tal como se indica en
104 Captulo 2. Mtodos de Interpolacin Determinsticos

Figura 2.10: Construccin de los pesos (reas) a partir de los polgonos de


Thiessen

Tabla 2.7: Clculos interpolacin polgonos de Voronoi (reas)

Obs x y Z rea (Ai ) wi Z(si ) wi


1 3 5 17 19.84 0.08 1.36
2 4.8 4.5 30 62.00 0.25 7.50
3 5 1 24 19.84 0.08 1.92
4 3.2 0 25 62.00 0.25 6.25
5 0 0.9 18 19.84 0.08 1.44
6 1 4.3 23 64.48 0.26 5.98
s0 3.1 2.6 248.0 1.00 24.45

la parte (a) de la Figura 2.11. Para generar las predicciones en la regin de


estudio es necesario crear un conjunto de puntos dentro del limite y luego
para cada uno de los puntos seguir el procedimiento explicado en el anterior
ejercicio, en la parte (b) de la Figura 2.11 se muestran los polgonos de
Voronoi interceptados con Croacia y en la parte (b) de la Figura 2.12 los
2.4 Polgonos de Voronoi (Thiessen) 105

polgonos de Voronoi de slo Croacia removiendo lo externo.

(a) Polgonos de Voronoi (b) Interseccin limite Croacia y polgonos de Voronoi

Figura 2.11: reas de polgonos de Voronoi en Croacia

Al aplicar el cdigo

##------------------------------------------------
## Interpolacin Areas Voronoi: Ejemplo Croatia:
##------------------------------------------------

# cargar funcin voronoipolygons


voronoipolygons <- function(x,poly) {
require(deldir)
if (.hasSlot(x, coords)) {
crds <- x@coords
} else crds <- x
bb = bbox(poly)
rw = as.numeric(t(bbox(poly)))
z <- deldir(crds[,1], crds[,2],rw=rw)
w <- tile.list(z)
polys <- vector(mode=list, length=length(w))
require(sp)
106 Captulo 2. Mtodos de Interpolacin Determinsticos

16
5100000
14

12
5000000

10
Norte (m)

8
4900000

4
4800000

4e+05 5e+05 6e+05 7e+05 8e+05

Este (m)

(a) Prediccin de la temperatura (b) Polgonos Voronoi en Croacia

Figura 2.12: Interpolacin Voronoi para temperatura media diaria terrestre en


Croacia

for (i in seq(along=polys)) {
pcrds <- cbind(w[[i]]$x, w[[i]]$y)
pcrds <- rbind(pcrds, pcrds[1,])
polys[[i]] <- Polygons(list(Polygon(pcrds)), ID=as.character(i))
}
SP <- SpatialPolygons(polys)
voronoi <- SpatialPolygonsDataFrame(SP, data=data.frame(x=crds[,1], y=crds[,2], row.names=
sapply(slot(SP, polygons), function(x) slot(x, ID))))
return(voronoi)
}

#### Creacin de la grilla con los puntos de prediccin y ploteo


library(geosptdb)
data(croatia)
df.pts<-spsample(croatia, n=25000, type="regular")
loc1 <- df.pts@coords
colnames(loc1) <- c("x","y")
plot(croatia)
points(loc1)
2.4 Polgonos de Voronoi (Thiessen) 107

# Cargar datos de diciembre 2008 temperatura media terrestre en Croatia


Datos <- read.table("D:/CARLOS/datos/dif.IDSTA3.txt", header=T,sep="",dec = ",")
points(Datos$X,Datos$Y, pch=19, cex=0.3)

locations1 <- Datos[,4:5]


colnames(locations1) <- c("lon","lat")
v5 <- voronoipolygons(locations1)
#proj4string(v5) <- CRS("+proj=longlat +ellps=WGS84 +no_defs+ellps=WGS84 +towgs84=0,0,0 ")
int1<-matrix(nrow=nrow(loc1), ncol=nrow(Datos))
system.time(
#pb <- txtProgressBar(min = 0, max = nrow(loc1), char = "=",style = 3)
for (i in 1:nrow(loc1)){
loc.temp<-rbind(locations1, loc1[i,])
vor.temp<-voronoipolygons(loc.temp)
#proj4string(vor.temp)<- CRS("+proj=longlat+ellps=WGS84+no_defs+ellps=WGS84 +towgs84=0,0,0 ")
for (j in 1:nrow(locations1)){
overlay.poly <- nrow(loc.temp)
pol.poly <- SpatialPolygons(vor.temp@polygons[overlay.poly])
s<-gIntersection(pol.poly, SpatialPolygons(v5@polygons[j]))
int1[i,j] <- ifelse(is.null(s), 0, gArea(s)/pol.poly@polygons[[1]]@Polygons[[1]]@area)
}
#setTxtProgressBar(pb, i)
}
#close(pb)
)

pred1 <- int1%*%Datos$TEMP


predicc <- data.frame(loc1,pred1)
names(predicc) <- c("x","y","var1.pred")
coordinates(predicc) <- ~x+y
gridded(predicc) <- TRUE
spplot(predicc, "var1.pred", main="Temperatura Media Terrestre Croatia\nPredicciones
Interpolacin Areas", col.regions= bpy.colors(100), cuts=40, cex.main=0.2, scales =
list(draw =T), xlab="Este (m)", ylab = "Norte (m)", key.space=list(space="right", cex=0.6))
108 Captulo 2. Mtodos de Interpolacin Determinsticos

2.5 Interpolacin con Regresiones Polinomicas

Este mtodo se caracteriza por ser un interpolador determinstico rpido,


suavizador e inexacto, al igual que con el IDW las decisiones que puede
tomar el investigador sobre los parmetros del modelo son muy pocas.

En algunos casos existen variaciones locales en las ubicaciones de las


muestras, por ejemplo en una falda de montaa con pendiente moderada
(ver Figura 2.13a) puede presentarse el caso de que la muestras estn sobre
pequeos montculos o suaves depresiones. La IPG suele ser empleada cuando
se trabajan superficies que cambian lenta y gradualmente. Usando los vecinos

(a) Ajuste polinomio orden 1 (b) Ajuste polinomio orden 2

Figura 2.13: Ajuste conceptual de una pieza de papel a una superficie


Fuente: Tomado de (Johnston et al. 2001)

locales para predecir una ubicacin puede sobre o subestimar el modelo.


La habilidad para identificar y modelar estructuras locales y tendencias de
las superficies, puede incrementar la precisin de la prediccin. Al basar
la prediccin en la tendencia dominante, se puede ajustar un plano entre
los puntos muestreados. Un plano es un caso especial de una familia de
formulas matemticas llamadas polinomiales. Se determina entonces la
2.5 Interpolacin con Regresiones Polinomicas 109

altura desconocida del valor sobre el plano para la ubicacin pronosticada.


El plano puede estar sobre ciertos puntos y debajo de otros. La meta para la
interpolacin es minimizar el error. El error se puede calcular, restando cada
punto medido de su valor pronosticado sobre el plano, elevndolo al cuadrado
y sumndolos todos juntos, es decir, evaluando el RMSPE. Este proceso da la
base terica para la interpolacin polinomial global de primer orden.

La Figura 2.13b muestra conceptualmente un polinomio de segundo orden


adaptado a un valle.

Pero qu pasa si se trata de ajustar el plano a un paisaje que es una


cuenca? Se tiene alta dificultad en obtener una buena superficie a partir de
un plano. Sin embargo, si se permite una curva en el plano (ver Figura 2.13b),
es posible obtener una mejor superficie. Permitir una curva es la base para
la interpolacin polinomial global de segundo orden. Dos curvas en el
plano sern una interpolacin polinomial global de tercer orden y as
sucesivamente.

Sin embargo, el mtodo tiene algunas limitaciones como el hecho de que


no realiza valoracin directa de los errores de prediccin y las localizaciones
en el borde de los datos pueden tener un gran efecto sobre la superficie.

2.5.1 Cuando utilizar las regresiones Polinomicas

El resultado de ste mtodo es una superficie matemtica suavizada, que


representa tendencias graduales en la superficie sobre el rea de inters.

La interpolacin global es utilizada para: Ajustar una superficie a los


puntos medidos cuando la superficie vara suavemente de una regin a otra
sobre el rea de inters (por ejemplo, la polucin sobre un rea industrial).
Examinar y/o remover los efectos de tendencias globales o de amplio rango.
En tales circunstancias la tcnica es a menudo renombrada como anlisis de
110 Captulo 2. Mtodos de Interpolacin Determinsticos

tendencia de superficie. Las superficies calculadas son altamente susceptibles


a los puntos extremos (valores extremadamente altos y bajos, especialmente
en los ejes).

2.5.2 Formulacin matemtica

La interpolacin por polinomios globales simplemente usa mtodos de


regresin mltiple sobre todos los datos. Una respuesta o tendencia superficial
es ajustada a las coordenadas x y y, las cuales son covariadas. Para una
tendencia de primer orden, el modelo es:

Z(si ) = Z(xi , yi ) = 0 + 1 xi + 2 yi + (xi , yi ) (2.22)

Donde: Z(xi , yi ) es el datum en la localizacin, (xi , yi ).


j son parmetros, y
(xi , yi ) es un error aleatorio.
Para una tendencia de segundo orden, el modelo es:

Z(si ) = Z(xi , yi ) = 0 + 1 xi + 2 yi + 3 x2i + 4 yi2 + 5 xi yi + (xi , yi ) (2.23)

Para una tendencia de tercer orden, el modelo es:

Z(si ) = Z(xi , yi ) = 0 + 1 xi + 2 yi + 3 x2i + 4 yi2 + 5 xi yi + 6 x3i + 7 yi3


+ 8 x2i yi + 9 x2i yi2 + (xi , yi ) (2.24)

Y as sucesivamente hasta orden diez (10) en el anlisis geoestadstico. El


ajuste a los modelos de regresin por la estimacin de los parmetros i usan
mnimos cuadrados ordinarios.

Programacin en R

A continuacin, se presenta un ejemplo de la interpolacin polinomial de


orden 1 y 2. La superficie de interpolacin espacial se genera inicialmente
2.5 Interpolacin con Regresiones Polinomicas 111

desde la librera spatial y posteriormente desde la librera gstat, esta ultima


permite trabajar con un borde de la regin.

library(maptools)
estaciones <- readShapeSpatial("D:/LibroEstadsticaEspacial/Cundinamarca/estaciones.shp")
limite <- readShapePoly("D:/LibroEstadsticaEspacial/Cundinamarca/limite.shp")
estaciones1 <- data.frame(estaciones@coords[,1:2],estaciones@data)
names(estaciones1)[1:2] <- c("x","y")

library(spatial)
attach(estaciones1)
pa.ls <- surf.ls(1,x,y,PREC_AN)
pa.trsurf <- trmat(pa.ls, xl=x[which.min(x)], xu=x[which.max(x)], yl=y[which.min(y)], yu=
y[which.max(y)], n=100)
contour(pa.trsurf, xlab= "Este (m)", ylab= "Norte (m)")
points(estaciones,pch=20)
# Polinomio orden 2
pa.ls2 <- surf.ls(2,x,y,PREC_AN)
pa.trsurf2 <- trmat(pa.ls2, xl=x[which.min(x)], xu=x[which.max(x)], yl=y[which.min(y)], yu=
y[which.max(y)], n=100)
contour(pa.trsurf2, xlab= "Este (m)", ylab= "Norte (m)")
points(estaciones1,pch=20)

library(gstat)
coordinates(estaciones1) <- ~ x+y
cun.grid <- spsample(limite, 25000, "regular")
cun.df <- data.frame(cun.grid@coords)
names(cun.df) <- c("x","y")
gridded(cun.df) <- ~x+y
# Superficie de tendencia de primer orden
x <- gstat(formula=PREC_AN ~ 1, data=estaciones1, degree=1)
kt <- predict(x, newdata=cun.df)
spplot(kt[1], contour=TRUE,main="", xlab="Este (m)", ylab = "Norte (m)", sp.layout=
list("sp.points", estaciones1, pch=19, col=2), scales = list(draw =T), cuts=40)

# Superficie de tendencia de segundo orden


X <- gstat(formula=PREC_AN ~ 1, data=estaciones1, degree=2)
kt2 <- predict(X, newdata=cun.df)
spplot( kt2[1], contour=TRUE, main="",sp.layout=list("sp.points", estaciones1, pch=19,
col=2),xlab="Este (m)", ylab = "Norte (m)",scales = list(draw =T), cuts=40)
112 Captulo 2. Mtodos de Interpolacin Determinsticos

0 500
1100000

1100000

00
40
00
0

35
50 00
15
00
10

00
30
1050000

1050000
0
2 00

00
1000

25
Norte (m)

Norte (m)

00
20
1000000

1000000
00

00
00
20

35
30

0 0
40
00
00

25
25

00

00
15

45
00
00
15

50
950000

950000

00
55
00
60
00
65
950000 1000000 1050000 950000 1000000 1050000

Este (m) Este (m)

(a) Orden 1 (b) Orden 2

Figura 2.14: Ajuste polinomios en librera spatial del programa R

2.6 Diagnstico mediante validacin cruzada

Debido a que los mtodos determinsticos son exactos, es decir los valores
de los pronsticos coinciden con los valores observados para los puntos
muestreados, se hace necesario el uso de un mtodo que permita evaluar
el grado de ajuste de estos interpoladores determinsticos. Por lo cual la
validacin cruzada es til ya que brinda informacin acerca del grado de
ajuste del mtodo de interpolacin.

La validacin cruzada es una tcnica que permite evaluar la capacidad


predictiva del modelo seleccionado. Supngase que se ha observado el valor
del proceso Z(s) sobre un conjunto de localizaciones {s1 , . . . , sn }. Sean Z(si )
el valor predicho para la localizacin si obtenida a partir de las observaciones
{s1 , . . . , si1 , si+1 , . . . , sn }.
2.6 Diagnstico mediante validacin cruzada 113

6000
1100000 2500 1100000

5000
2000

1050000 1050000
4000
Norte (m)

Norte (m)
1500

3000
1000000 1000000
1000

2000

500
950000 950000
1000

950000 1000000 1050000 1100000 950000 1000000 1050000 1100000

Este (m) Este (m)

(a) Orden 1 (b) Orden 2

Figura 2.15: Ajuste polinomios datos precipitacin anual 1986 en Cundinamarca


con librera spatial del programa R

2.6.1 Validacin cruzada leave-one-out

La validacin cruzada leave-one-out (LOOCV, por sus siglas en ingls)


consiste en excluir la observacin de uno de los n puntos mustrales (por
lo general asociados a un vecindario), y con los n 1 valores restantes y la
funcin de base radial con sus parmetros y , predecir va splines el valor
de la variable en estudio en la ubicacin del punto que se excluy. Si la funcin
de base radial presenta un buen funcionamiento, entonces la diferencia entre
el valor observado y el valor predicho debe ser pequea y se podr producir
el mapa. Este procedimiento se realiza en forma secuencial con cada uno de
los puntos mustrales y as se obtiene un conjunto de n errores de prediccin.
Entonces el conjunto de predicciones se puede resumir por alguna medida de
precisin de la prediccin. La idea se remonta por lo menos a (Mosteller &
Wallace 1963, Stone 1974).
114 Captulo 2. Mtodos de Interpolacin Determinsticos

Sea Z[i] (si ) el valor predicho a partir de la validacin cruzada, y sea


[i] (si ) la prediccin para la desviacin estndar en la localizacin si , con
estos estadsticos se construyen los siguientes contrastes de bondad de ajuste:

1. La media de los errores de prediccin (MPE) debe ser igual a cero.


n 
P 
Z[i] (si ) Z(si )
MPE = i=1
n

2. La raz media del cuadrado de los errores de prediccin (RMSPE).


v 
uP n 2
u
t Z (s
[i] i ) Z(s i )
RMSPE = i=1
n

3. El coeficiente de determinacin esta dado por:


n  n
 .X
2
X 2
R =1 Z [i] (si ) Z(si ) Z(si ) Z
i=1 i=1

n
P
donde Z = Z(sj )/n
j=1

Este ltimo se encuentra en Bivand et al. (2008). Las dems funciones


estn referenciadas en Johnston et al. (2001). Luego se selecciona el mtodo
de interpolacin que mejores resultados estadsticos arroje, as para un
modelo que provea predicciones exactas; el M P E debera ser cercano a 0
si las predicciones son insesgadas, el RM SP E se espera sea muy pequeo y
cercano a 0 si las predicciones son cercanas a los valores observados, y el R2
debera ser cercano a 1, en la medida en que esto suceda el modelo presentar
un buen ajuste. Los criterios a los que se les suele dar mas peso son los 2
ltimos.

El proceso anterior de eliminar un dato y ajustar con los restantes es


un caso particular del mtodo Jacknife. Si se dispone de suficientes datos
2.6 Diagnstico mediante validacin cruzada 115

espacialmente distribuidos de forma homognea del proceso espacial Z(s), se


puede entonces dividir los datos en dos subconjuntos, uno de modelizacin y
otro de validacin, sobre el que se analizara las diferencias entre los valores
observados y las predicciones obtenidas mediante el modelo ajustado con
el primer subconjunto. A continuacin se mencionan algunas ventajas y
desventajas de este mtodo:

Ventajas:

La estimacion del error no tiende a ser muy variable, es decir la


estimacin de error tiende a ser estable.

No se tiende a sobrestimar la estimacin del error.

Desventajas:

La programacin suele ser mucho ms complicada.

El tiempo de ejecucin puede ser muy alto, dado que el proceso se debe
repetir n veces.

A continuacin se muestra un breve ejemplo en R de la LOOCV

Programacin en R

# funcin multicuadrtica
library(geospt)
data(preci)
coordinates(preci) <- ~x+y

# eta predefinido
tab <- rbf.tcv(prec~x+y,preci,eta=1.488733, rho=0, n.neigh=9, func="M")
criterio.cv(tab)

El resultado obtenido es
116 Captulo 2. Mtodos de Interpolacin Determinsticos

MPE ASEPE RMSPE MSPE RMSSPE MAPPE CCPE R2 pseudoR2


0.01198021 NA 8.996199 NA NA 0.01393097 0.5522097 0.0365286 0.3049356

2.6.2 Validacin cruzada usando K grupos

Este mtodo es ms conocido como "K-fold cross-validation". En la validacin


cruzada de K iteraciones los datos se dividen en K subconjuntos (folds). Uno
de los subconjuntos se utiliza como datos de prueba y el resto (K-1) como
datos de entrenamiento. As con los datos de entrenamiento se construye un
modelo y se predice el resultado para el conjunto restante (datos de prueba),
se hace esto K veces dejando un conjunto diferente cada vez.

Luego es natural preguntarse Qu tan grande debe ser K? Se desea


construir modelos para que el problema sea realista, por lo que se debe dejar
afuera una pequea proporcin de datos. No se desea demasiado trabajo. As
que por lo general K oscila entre el 30% y el 100%, como es un numero entero
para 10 datos tendremos a K oscilando entre 3 y 10. Cuando K sea igual al
tamao muestral la validacin cruzada K-fold coincidir con la validacin
cruzada "leaveone-out".

2.7 Generalidades de las RBFs

Una de las ventajas de las funciones de base radial es que el clculo es rpido
(utiliza pocos puntos para realizar la interpolacin), los valores interpolados
obtenidos por medio de "splines" son muy prximos al valor real (errores son
pequeos). En contraste con los mtodos basados en el clculo de un tipo de
promedio, "splines" conservan la informacin de alta frecuencia (detalles).
La continuidad e igualdad "smoothness" de una funcin "spline" permite el
clculo de derivadas de una manera rpida y eficiente; por lo tanto, estas
funciones son ideales para anlisis topolgicos y geomtricos.
2.7 Generalidades de las RBFs 117

Entre las desventajas de las funciones de base radial podemos mencionar


que el uso de "B- splines" crea complicaciones en el clculo de reas y
permetros. Otro problema es la decisin de utilizar los datos como "break
points" o no. En funcin de esta decisin, resultados totalmente diferentes
pueden ser obtenidos con el mismo conjunto de datos.

Para verificar los resultados de las tcnicas determinsticas de una


manera cuantitativa hay que proporcionar estimaciones de la calidad de la
interpolacin tanto a las posiciones originales como a las posiciones donde los
valores de la variable bajo estudio han sido interpolados. Desviaciones a las
posiciones originales se las obtiene fcilmente pero ninguna de estas tcnicas
proporciona una estimacin de la varianza a las posiciones donde solamente
se conoce el valor interpolado. En este caso, la nica manera de obtener una
estimacin de desviaciones es de usar un conjunto de datos independientes, un
subconjunto de datos originales pero que no fueron usados en la interpolacin.

En las tcnicas determinsticas un punto importante a considerar es que


si en la recoleccin de datos se ha utilizado una muestra densa y se posee
por lo tanto un conjunto de puntos abundantes, la mayora de las tcnicas de
interpolacin dan resultados similares. En el caso de una muestra no densa,
los resultados obtenidos dependen fuertemente en las hiptesis aceptadas
acerca de la naturaleza de la variable bajo estudio, el mtodo de interpolacin
usado y en los valores adoptados para los parmetros intrnsecos al mtodo
de interpolacin.

Otra debilidad de las tcnicas determinsticas es que no permiten tampoco


evaluar de antemano y de una manera ptima algunos de los parmetros de
control; por ejemplo:

El orden del polinomio en una interpolacin por medio de polinomios.

El tamao, la orientacin y la forma de la regin a definir alrededor de


118 Captulo 2. Mtodos de Interpolacin Determinsticos

la ubicacin donde el valor del atributo debe ser calculado.

El numero de puntos a utilizar para calcular los promedios locales.

La funcin matemtica ptima.

La anisotropa presente en los datos.

Las debilidades mostradas en las tcnicas determinsticas llevaron al


matemtico francs G. Matheron y al ingeniero de minas sudafricano D. G.
Krige a desarrollar alrededor del ao 1960 lo que ahora llamamos mtodos
geoestadsticos o Kriging.

2.8 Ejercicios Propuestos

1. Dada la presente configuracin de muestreo, si se conocen los siguientes


valores vecinos al punto a estimar de la variable regionalizada s1 =
1.5, s2 = 1.7 y s3 = 2.8.

(a) Estimar el valor para s0 empleando la RBF TPS con parmetro


= 0.3
2.8 Ejercicios Propuestos 119

(b) Estimar el valor para s0 empleando IDW. Considere p = 1.7.

2. Asuma cinco polgonos de voronoi con los siguientes valores


(15, 13, 18, 20, 10), vecinos a un polgono central de valor (15). Estimar
la entropa para el polgono central.

3. Suponga que se han tomado muestras en 5 puntos P1 , P2 , P3 , P4 y P5


que estn regularmente espaciados a 1 metro sobre una lnea recta.
Estime el valor del punto medio P0 , que est entre P3 y P4 , empleando
la RBF Multicuadrtica con parmetros = 0.6 y = 0.001 para
P1 = 0, P2 = 1, P3 = 0, P4 = 5 y P5 = 0.

4. A partir de los datos dados en la Tabla 2.5 y con la librera geospt del
programa R,

(a) Encontrar para las RBFs los valores ptimos de los parmetros
y .
(b) Conforme a lo obtenido en (a), genere la superficie de interpolacin
asociada a la RBFs de menor error.
120 Captulo 2. Mtodos de Interpolacin Determinsticos
Captulo 3

Prediccin Espacial Kriging

3.1 Introduccin

La informacin espacial se recoge en muchas aplicaciones de disciplinas


tales como; la minera, la hidrogeologa, ecologa, ciencias de la tierra y el
medio ambiente. Estas aplicaciones consideran tcnicas como kriging simple,
ordinario, universal e indicador. Estos mtodos de interpolacin se han
utilizado en la literatura para meta-modelos en geoestadstica por Sacks et al.
(1989), Cressie (1993), Jin et al. (2001), Santner et al. (2003), Wackernagel
(2003), Le & Zidek (2006), Joseph et al. (2008) y van de Kassteele et al.
(2009), entre otros. En este captulo, se consideran los diferentes tipos de
kriging y en cada uno se desarrolla la teora que da sustento al mtodo, se
presentan ejemplos numricos, estos a su vez se desarrollan en el lenguaje R
y en algunos casos se presentan aplicaciones, finalizando con una seccin de
ejercicios afines al capitulo.
122 Captulo 3. Prediccin Espacial Kriging

3.2 Kriging Simple

Sea Z(s) = (s) + (s), un proceso aleatorio Gaussiano donde E((s)) = 0


y E((s)2 ) = 2 , con media conocida (s). Por lo general (s) no siempre
esta asociado a un muestreo aleatorio espacial y las ubicaciones "s"
suelen concentrarse en las zonas ms pobladas, como es el caso de las
estaciones meteorolgicas. Razn por la cual es importante realizar un
proceso denominado "declustering" o de desagrupamiento asignando pesos
a cada una de las observaciones conforme a su representatividad en el espacio.

En ste mtodo se considera la media del proceso Z(s) conocida y


constante. Sin embargo, no siempre se conoce y dada la distribucin
espacial en las muestras se hace necesario realizar el declustering para una
aproximacin de la media de Z(s).

Consideremos :
Z(s) = (s) + (s) (3.1)

con (s) = x(s)0 , Si no hay tendencia entonces x(s)0 = 1 y = 0 . De la


regresin lineal se tiene que Z = 0 .

As para un conjunto de n observaciones:

Z = X + (3.2)

Donde Z es un vector n 1 de los valores asociados a la variable


regionalizada, X ser la tendencia, dado que no hay tendencia X = 1 siendo
1 un vector de unos de tamao n 1 y un vector de parmetros de
tamao p1, en ste caso = 0 y es un vector de errores de tamao n1.
3.2 Kriging Simple 123

En la expresin (3.2), E() = 0n1 y E(Z) = X, la prediccin para


un punto de coordenadas s0 = (x0 , y0 ), sto es un plano o espacio R2 , estar
dada por:
Z(s0 ) = + (s0 ) (3.3)

Aqu = x0 (s0 ) con = Z, en ste caso Z = (Z es la media aritmtica en


caso de ser obtenida directamente de la muestra y ser la media ponderada
en caso de realizar un declustering).

n
P
En la expresin (3.3) (s0 ) = i (si ), sto en trminos de vectores
i=1
es: (s0 ) = 0 donde 0 = (1 , 2 , ..., n ) y 0 = ((s1 ), (s2 ), ..., (sn ))

3.2.1 Propiedades del predictor Z0

Insesgamiento

Un predictor de un parmetro es insesgado si E() = donde es el


parmetro poblacional y es el parmetro estimado. As:

E(Z(s0 )) = (3.4)

Luego reemplazando (3.3) en (3.4) tenemos:


E( + (s0 )) = , como (s0 ) = 0 , entonces:

E( + 0 ) =
+ 0 E() =
0 0 = 0
124 Captulo 3. Prediccin Espacial Kriging

Este resultado indica que los ponderadores pueden tomar cualquier valor,
por lo cual no hay restricciones para el insesgamiento.

Varianza de la prediccin del error

A la prediccin (3.3) le asociaremos una varianza, la cual nos permitir


evaluar qu tan buena es la prediccin y ms adelante realizar la validacin
cruzada.

El proceso para definir la varianza de la prediccin del error nos dar


el vector de ponderadores , con los cuales se resuelve (3.3).

2
Sea KS (s0 ) la varianza de la prediccin del error va Kriging Simple
en la localizacin s0 , luego:
2
KS (s0 ) = V (Z(s0 ) Z(s0 )) (3.5)

Reemplazando (3.3) en (3.5)


2
KS (s0 ) = V ( + 0 Z(s0 )) (3.6)

Dado que Z(s0 ) = + (s0 ), entonces


2
KS (s0 ) = V ( + 0 (s0 ))
= V (0 (s0 ))
2
KS (s0 ) = V (0 ) + V ((s0 )) 2Cov(0 , (s0 )) (3.7)

Del teorema 3.1 del apndice A se tiene que:

V (0 ) = 0 (3.8)
3.2 Kriging Simple 125

Con

c11 c1n
. .
. . ...

= . Esta matriz es simtrica y definida positiva
.

cn1 cnn

Donde cij = Cov((si ), (sj )) con i, j = 1, 2, , n.

El trmino V ((s0 )) = Cov((s0 ), (s0 )) = C(0). Dado que C(0) = 2


(0) y (0) = 0, entonces V ((s0 )) = 2 la cual corresponde a la meseta en
el variograma o covariograma, en el caso que estos sean acotados o de meseta
finita. Del ltimo trmino de la expresin (3.7) se tiene:

Cov(0 , (s0 )) = 0 Cov(, 0 )



c10
.
..

= 0 c donde c = cr0

.
.
.
cn0

con

ci0 = Cov((si ), (s0 ))

Reemplazando estos resultados en (3.7) se obtiene:

2
KS (s0 ) = 0 + 2 20 c (3.9)

Ahora se diferencia (3.9) y se aplican algunas propiedades de matrices y


vectores mencionadas en el apndice A.
126 Captulo 3. Prediccin Espacial Kriging

2
KS (s0 ) = 0 ( ) + 0 20 c
= ()0 + 0 2()0 c
= 0 + 0 2c0
2
KS (s0 ) = 20 2c0 (3.10)

Luego factorizando y simplificando se obtiene


2
KS (s0 )
= 20 2c0 (3.11)

Realizando la segunda derivada con respecto a
00 KS
2
(s0 )
00 = 2 > 0 (3.12)

Luego en (3.11) tenemos un mnimo. Al igualar a 0 la expresin (3.11) se


obtiene

20 2c0 = 0
0 = c0
= c (3.13)

Despejamos , obteniendo:
= 1
c (3.14)
Con estos ponderadores podemos encontrar la prediccin en la localizacin
s0 dada en (3.3).
La varianza de la prediccin del error en s0 estar dada por (3.9).
Considerando (3.13) en sta expresin se tiene:
2
KS (s0 ) = 0 Z + 2 20 c
= 0 c + 2 20 c
2
KS (s0 ) = 2 0 c (3.15)
3.2 Kriging Simple 127

Cabe sealar que la utilidad de simple kriging es limitada como en la prctica,


la media no se conoce y necesita ser estimada. Sin embargo, como en el caso
de las minas de oro de Sudfrica o en el caso de los campos de oro de Kolar
en la India, donde la actividad minera ha sido llevada a cabo por un gran
nmero de aos, podemos esperar lo que significa ser conocida en cada mina
o para cada una de las regiones en la misma mina (Sarma 2010).

3.2.2 Ejemplo

a) Asuma dos puntos mustrales con coordenadas (1, 0) y (2, 0). Suponga
que se quiere estimar un valor en un punto arbitrario (1, y). Si se sabe que
el semivariograma es gaussiano y tiene una meseta de 1.0 y un factor de
escala de 1. Encuentre los ponderadores de kriging simple para los dos puntos
mustrales.
2.5

Y
2.0
1.5

P0
1.0
0.5

P1 P2
0.0

X
0.5

0.5 0.0 0.5 1.0 1.5 2.0 2.5

Figura 3.1: Configuracin espacial del problema.


128 Captulo 3. Prediccin Espacial Kriging

Dado a = 1 y c0 = 0, entonces el modelo Gaussiano es:



1 exp(3h2 ) si h > 0
(h) =
0 si h = 0

Luego, la funcin de covarianza estar dado por:



exp(3h2 ) si h > 0
C(h) =
1 si h = 0

La distancia entre P1 y P2 es 1, entonces c12 = exp(3). Por simetra


c12 = c21 . Como en el origen h = 0, luego c11 = c22 = 1. Entre P0 y P1 la
distancia es y y entre P0 y P2 la distancia es 1 + y 2 . Lo cual produce c10 =
exp(3y 2 ) y c20 = exp(3(1 + y 2 )). As, reemplazando en (3.13) tenemos:
! ! !
1 exp(3) 1 exp(3y 2 )
=
exp(3) 1 2 exp(3(1 + y 2 ))

Ahora se expande el sistema de la siguiente manera:

1 + 2 exp(3) = exp(3y 2 ) (3.16)


1 exp(3) + 2 = exp(3(1 + y 2 )) (3.17)

De (3.16) tenemos

1 = exp(3y 2 ) 2 exp(3) (3.18)

Reemplazamos en (3.17)

(exp(3y 2 ) 2 exp(3)) exp(3) + 2 = exp(3(1 + y 2 ))


2 (1 exp(6)) = exp(3(1 + y 2 )) exp(3y 2 ) exp(3)
exp(3(1 + y 2 )) exp(3(1 + y 2 ))
2 =
(1 exp(6))
2 = 0
3.2 Kriging Simple 129

Al reemplazar este resultado en (3.18) obtenemos:

1 = exp(3y 2 )

El resultado indica que cualquier punto a una distancia igual o superior


al rango del semivariograma tendr un peso igual a 0 (vlido slo para
kriging simple). Adems, vale la pena recordar que en este mtodo los
ponderadores pueden sumar cualquier cantidad, ya que no hay restricciones
para los mismos.

b) Dada la siguiente muestra de la Figura 3.2, para un determinado


atributo Z con media 110 y funcin de covarianza C(h) = 2000exph/250 . Si
la localizacin de estimacin es s0 = (180, 120), hacer lo siguiente mediante
kriging simple:
300

130
2
250
200
150
y

90
? 160
3
S0 4
100
50

40
1
0

0 50 100 150 200 250 300 350

Figura 3.2: Configuracin espacial del problema.

1 Calcular la estimacin de los pesos.


130 Captulo 3. Prediccin Espacial Kriging

2 Encontrar la estimacin Z(s0 ).


2
3 Determine la estimacin de la varianza KS (s0 ).

Tabla 3.1: Datos asociados a Figura 3.2

Obs x y Z(si )
1 10 20 40 -70
2 30 280 130 20
3 250 130 90 -20
4 360 120 160 50
s0 180 120 ?

Tabla 3.2: Calculo distancias y covarianzas (Modelo exponencial)

Relacin Distancia Covarianza


1-2 260.768 704.741
1-3 264.008 695.668
1-4 364.005 466.324
2-3 266.271 689.399
2-4 366.742 461.247
3-4 110.454 1285.738

1-s0 197.231 908.667


2-s0 219.317 831.835
3-s0 70.711 1507.277
4-s0 180.000 973.505

Ahora, reemplazando estos resultados en la ecuacin de kriging simple


3.14, tenemos:
= 1
c
3.2 Kriging Simple 131

1
1 c11 c12 c13 c14 c10

c22 c23 c24

2 c21 c20
=
c c32 c33 c34 c
3 31 30
4 c41
c42 c43 c44
c40

1
1 2000 704.74 695.67 466.32 908.667 0.1847

2 704.74 2000 689.40 461.25 831.835 0.1285
=
695.67 689.40 2000 1285.74 1507.277 = 0.6458

3
4 466.32 461.25 1285.74 2000 973.505 0.0011

As la prediccin en el punto s0 para Z esta dada por:

Z(s0 ) = 110 + 0.1847 (70) + 0.1285 (20) + 0.6458 (20) 0.0011 (50)
= 86.6689

2
Y la varianza KS (s0 ) se obtiene a partir de la expresin 3.15. As:

2
KS (s0 ) = 2 0 c = 2000 (0.1847 908.667 + 0.1285 831.835 + 0.6458
1507.277 0.0011 973.505) = 752.9537

3.2.3 Programacin en R
Obs <- c(1,2,3,4)
x <- c(10,30,250,360)
y <- c(20,280,130,120)
Z <- c(40,130,90,160)

DF <- data.frame(Obs,x,y,Z)
names(DF) <- c("Obs","x","y","Z")

So <- data.frame(180,120)
names(So) <- c("x","y")

library(gstat)
132 Captulo 3. Prediccin Espacial Kriging

library(sp)
coordinates(DF) = ~x+y
coordinates(So) = ~x+y
var <- vgm(2000,"Exp",250,0)
p.So <- krige(Z~1, DF, So, model=var,beta=110)
p.So

3.3 Kriging Ordinario

ste kriging asume que la media del proceso Gaussiano Z(s) es desconocida
y constante. A diferencia del kriging simple, aqu no es necesario realizar el
declustering dado que no se considera el conocimiento de la media de Z(s).
Sea
Z(s) = (s) + (s) (3.19)
Con (s) tal como se explic en la seccin (3.1) y (s) con E((s)) = 0.
Para un vector de observaciones ya mencionado en la seccin (3.1)

Z = X + (3.20)

Se tiene que E(Z) = X y E() = 0n1 .


Al no considerar tendencia, la matriz X pasa a ser un vector de unos (X = 1).
Luego la prediccin para un punto de coordenadas s0 , estar dada por:
n
X
Z(s0 ) = i Z(si ) (3.21)
i=1

sta expresin es similar a la ya indicada en el captulo anterior (mtodos


determinsticos), para los mtodos IDW e interpolacin por polgonos de
voronoi.
En trminos vectoriales la ecuacin (3.21) se puede expresar como:

Z = 0 Z (3.22)
3.3 Kriging Ordinario 133

Donde Z = (z1 , z2 , , zn )0 y el vector ya fue explicado anteriormente.

3.3.1 Propiedades del predictor Z0

Insesgamiento

El estimador de la prediccin (3.22) sera insesgado si:

E(Z(s0 )) = (3.23)

Entonces reemplazando (3.22) en (3.23) tenemos:

E[0 Z] =
0 E(Z) = como E(Z) = X = entonces:
0 = dado que n1 = 1 , tenemos ahora:

0 1 = = 1 as la restriccin ser:

0 1 = 1 (3.24)

sta misma restriccin se di por naturaleza en los mtodos IDW e


interpolacin por polgonos de voronoi.

Varianza de la prediccin del error

Para encontrar los pesos i dados en el vector , es necesario minimizar la


varianza del error de la prediccin. Por lo cual, a continuacin se desarrollar
el proceso que permitir esto y de paso nos dar la varianza de la prediccin
del error.
134 Captulo 3. Prediccin Espacial Kriging

2
Sea KO (s0 ) la varianza de la prediccin del error en la localizacin
s0 , entonces.
2
KO (s0 ) = V (Z(s0 ) Z(s0 )) (3.25)

Ahora reemplazando (3.22) en (3.25)

2
KO (s0 ) = V (0 Z Z(s0 )) (3.26)
= V (0 Z) + V (Z(s0 )) 2Cov(0 Z, Z(s0 )) (3.27)

Del teorema (3.1) del apndice A se tiene que:



cz11 cz1n
. .
V (0 Z) = 0 z . . ...

con z = .. (3.28)

z z
cn1 cnn
Donde czij = cov(Z(si ), Z(sj )) para i, j = 1, 2, , n; z es simtrica y
definida positiva.

El segundo trmino de (3.27) V (Z(s0 )) = Cov(Z(s0 ), Z(s0 )) = C(0). Por


lo cual, C(0) = 2 , es decir corresponde a la meseta del variograma.
Y del ltimo trmino de la expresin (3.27) se tiene

Cov(0 Z, Z(s0 )) = = 0 Cov(Z, Z(s0 ))



cZ10
.
= 0 c donde c= .
.
cZn0

Con cZi0 = Cov(Z(si ), Z(s0 )). Reemplazando stos trminos en (3.27)


tenemos:
2
KO (s0 ) = 0 Z + 2 20 c (3.29)
3.3 Kriging Ordinario 135

Con el fin de obtener los ponderadores dados en , se formula la siguiente


funcin Lagrangiana:

L(, m) = 0 Z + 2 20 c 2m(0 1 1) (3.30)

Donde m es el multiplicador de Lagrange. Ahora se diferencia (3.30) con


respecto a y se aplican algunas propiedades de vectores y matrices.

L(, m) = 0 Z + 0 Z 20 c 2m0 1
= ()0 Z + 0 Z 2()0 c 2m()0 1
= 0 Z + 0 Z 2c0 2m10
L(, m) = 20 Z 2c0 2m10

Por lo cual, la derivada de lagrangiano con respecto a es:


L(, m)
= 20 Z 2c0 2m10 (3.31)

La segunda derivada con respecto a es:


00 L(, m)
= 2Z > 0
00

Luego en (3.31) se tiene un mnimo. Igualando a cero y dividiendo por 2 la


expresin (3.31) obtenemos:

0 Z c0 m10 = 0 (3.32)

Derivando (3.30) con respecto a m tenemos:


L(, m)
= 2(0 1 1)

136 Captulo 3. Prediccin Espacial Kriging

Igualando a cero se obtiene:


0 1 = 1 (3.33)

Para expresar (3.32) en trminos de semivarianzas, consideremos que cij =


2 ij , caso particular ci0 = 2 i0 . Luego

c11 c1n 1 1 11 1n
. . . . .. . .
.. . . ...

= . . . .. = ..
2
. ..
. .
cn1 cnn 1 1 n1 nn
= 2 110 (3.34)

Por otro lado,



c10 1 10
. . .
. 2 . . 2
. = . . = 1
c= (3.35)
cn0 1 n0

As la expresin (3.32) pasa a ser:

0 ( 2 110 Z ) ( 2 1 )0 m10 = 0
2 0 110 0 Z 2 10 + 0 m10 = 0 (3.36)

Dado que por (3.33) 0 1 = 1 = 10 = 1, considerando sto en (3.36).

2 10 0 Z 2 10 + 0 m10 = 0 (3.37)

Multiplicando por menos uno (3.33) obtenemos:

0 Z + m10 = 0 (3.38)
3.3 Kriging Ordinario 137

Al trasponer (3.38) se obtiene:

Z + m1 = (3.39)

Trasponiendo (3.33) y considerando (3.39) se llega al siguiente sistema:

Z +m1 =
(3.40)
10 =1

En trminos matriciales tenemos:


! ! !
Z 1
= (3.41)
10 m 1
GKO WKO = LKO

Despejando WKO se tiene

WKO = G1
KO LKO (3.42)

Para vecindarios grandes (n grande) el sistema (3.42) suele ser no muy


eficiente computacionalmente. A continuacin se obtendr y m con el fin
de hacer un clculo ms eficiente para el sistema (3.40).
Despejando en (3.39).

= 1
Z ( m1) (3.43)

Al premultiplicar (3.43) por 10

10 = 10 1
Z ( m1) (3.44)

Dado que 10 = 1 entonces (3.44) pasa a ser:

10 1
Z ( m1) = 1
138 Captulo 3. Prediccin Espacial Kriging

Ahora se despejar m

10 1 0 1
Z 1 Z m1 = 1

10 1 0 1
Z 1m = 1 Z 1

m = (10 1 1 0 1
Z 1) (1 Z 1) (3.45)

Por ltimo reeplazamos m en (3.43).

= 1 0 1 1 0 1
Z { (1 Z 1) [1 Z 1]} (3.46)

La expresin (3.29) se puede expresar en trminos de semivarianzas as:


2
KO (s0 ) = 0 ( 2 110 Z ) + 2 20 ( 2 1 )
= 2 0 110 0 Z + 2 2 2 0 1 + 20 (3.47)

Dado que 0 1 = 10 = 1, entonces (3.47) pasa a ser:

2
KO (s0 ) = 2 0 Z + 2 2 2 + 20
2
KO (s0 ) = 0 Z + 20 (3.48)

De (3.39) 0 Z = 0 m1 entonces reemplazando en (3.48)

2
KO (s0 ) = 0 ( m1) + 20
= 20 0 + 0 m1
= 0 + m0 1
2
KO (s0 ) = 0 + m (3.49)

3.3.2 Ejemplo

Como ejemplo, se considera la configuracin espacial de la Figura 3.3. El


punto s0 se considera en el origen de coordenadas x0 = 0 y y0 = 0. Luego, a
3.3 Kriging Ordinario 139

los dems puntos les corresponden las coordenadas establecidas en la Tabla


3.3.

Figura 3.3: Configuracin espacial del problema. Los nmeros al lado de cada
lnea son distancias

Tabla 3.3: Datos asociados a Figura 3.3

Obs x y Z(si )
1 0 1 2
2 1 1 -3
3 1 0 3
4 0.5 -1 -4
5 -1 0 2
s0 0 0 ?

Posteriormente, se realiza la prediccin de Z(s0 ) y la varianza del


2
predictor en dicho punto denotada por KO (s0 ). Para ello se considera un
140 Captulo 3. Prediccin Espacial Kriging

semivariograma esfrico con parmetros C0 = 0, C1 = 1, y a = 1.5.

Entonces, primero se calculan las distancias entre los puntos del vecindario
y entre el vecindario y el punto s0 , tal como se muestra en la Tabla 3.4.
Junto a estas distancias en dicha tabla se muestra tambin los valores de
semivarianza (resultado de evaluar la funcin del modelo esfrico en dichas
distancias). Luego ubicando estos resultados en las ecuaciones de kriging

Tabla 3.4: Calculo distancias y semivarianzas (Modelo esfrico)

Relacin Distancia Semivarianza


1-2 1.000 0.852
1-3 1.414 0.995
1-4 2.062 1,000
1-5 1.414 0.995
2-3 1.000 0.852
2-4 2.062 1.000
2-5 2.236 1.000
3-4 1.118 0.911
3-5 2.000 1.000
4-5 1.803 1.000

1-s0 1.000 0.852


2-s0 1.414 0.995
3-s0 1.000 0.852
4-s0 1.118 0.911
5-s0 1.000 0.852

ordinario (es decir, reemplazando en la expresin 3.42), tenemos:

WKO = G1
KO LKO
3.3 Kriging Ordinario 141

1
12 13 14 15 1
1 11 10
22 23 24 25 1
20

2 21

3 31 32 33 34 35 1
30

=
42 43 44 45 1
40

4 41

5 51 52 53 54 55 1
50


m 1 1 1 1 1 0 1

1
0.000 0.852 0.995 1.000 0.995 1 0.8519 0.2570
1
0.852 0.000 0.852 1.000 1.000 1 0.9952 0.0496
2

3 0.995 0.852 0.000 0.911 1.000 1 0.8519 0.2417
= =
1.000 1.000 0.911 0.000 1.000 1 0.9110 0.1862
4

5 0.995 1.000 1.000 1.000 0.000 1 0.8519 0.2656

m 1 1 1 1 1 0 1 0.1186

Luego la prediccin en el punto s0 para Z esta dada por:

Z(s0 ) = 0.25702+0.0496(3)+0.24173+0.1862(4)+0.26562 = 0.8767

2
Y la varianza KO (s0 ) se obtiene a partir de la expresin 3.49. As:

2
KO (s0 ) = 0 + m = 0.2570 0.8519 + 0.0496 0.9952 + 0.2417 0.8519
+ 0.1862 0.9110 + 0.2656 0.8519 + 0.1186 = 0.9886

3.3.3 Programacin en R
Obs <- c(1,2,3,4,5)
x <- c(0,1,1,0.5,-1)
y <- c(1,1,0,-1,0)
Z <- c(2,-3,3,-4,2)

DF <- data.frame(Obs,x,y,Z)
names(DF) <- c("Obs","x","y","Z")
142 Captulo 3. Prediccin Espacial Kriging

So <- data.frame(0,0)
names(So) <- c("x","y")

library(gstat)
library(sp)
coordinates(DF) = ~x+y
coordinates(So) = ~x+y
var <- vgm(1,"Sph",1.5,0)
p.So <- krige(Z~1, DF, So, model=var)
p.So
coordinates var1.pred var1.var
1 (0, 0) 0.876718 0.98863

Intuitivamente, una buena suposicin para el valor en s0 es 0 (el promedio


de estos valores). Pero como se evidencio anteriormente, al considerar un
modelo de relacin espacial (semivariograma), el valor suele ser diferente a
la media aritmtica.

La prediccin ser cero, slo si el semivariograma es pepita o para el caso


del esfrico el rango es menor o igual a la distancia mnima entre los vecinos
y el punto s0 . Es decir a 1, lo cual en R es:

var1 <- vgm(1,"Sph",1,0)


p.So1 <- krige(Z~1, DF, So, model=var1)
p.So1
# coordinates var1.pred var1.var
# (0, 0) 0 1.2

3.4 Kriging Universal

Este mtodo de interpolacin corresponde a un proceso no estacionario, por


lo cual, se asume hay tendencia, generalmente asociadas a las coordenadas
espaciales. Sin embargo, en muchas ocasiones es natural que la tendencia est
3.4 Kriging Universal 143

en funcin de variables complementarias o covariables (variables continuas,


categricas y binarias), por ejemplo: si se modela la precipitacin es comn
que sta dependa de las coordenadas espaciales (e.d. la ubicacin) de la
altura, la temperatura media terrestre y posiblemente la cercana a algn
afluente (ver Hengl et al. (2012)).

Sea Z(s) = (s) + (s) un proceso aleatorio Gaussiano en donde (s)


describe la tendencia en el espacio de la variable regionalizada Z.
Para un punto ubicado en si , se tiene:

Z(si ) = (si ) + (si ) (3.50)

Aqu E((si )) = 0 y V ((si )) = 2 .

Dado que hay tendencia (si ) = x(si )0 , con x(si )0 = (1, xi , yi ) y


= (0 , 1 , 2 ), para una tendencia de primer orden que slo este en funcin
de las coordenadas espaciales x e y.

Luego el vector asociado a la variable regionalizada Z se puede expresar


como:
Z = X + (3.51)

En este caso E() = 0nn y V () = E(0 ) =


P
.

Si deseamos generar la prediccin en un punto de coordenadas s(0) = (x0 , y0 ),


entonces:
Z0 = Z(s0 ) = 0 Z (3.52)

El predictor (3.52) debe cumplir 0 1 = 1 para que sea insesgado tal como
veremos a continuacin.
144 Captulo 3. Prediccin Espacial Kriging

3.4.1 Propiedades del predictor Z0

Insesgamiento

Para que sea insesgado Z0 se debe cumplir que:

E(Z0 ) = E(Z0 ) = (s0 ) (3.53)

Luego reemplazando (3.52) en (3.53) tenemos:

E[0 Z] = E(Z0 ) (3.54)

considerando (3.51) en (3.54)

E[0 (X + )] = E(Z0 )
E(0 X) + E(0 ) = E(Z0 ) (3.55)

Como E() = 0, entonces (3.55) se puede expresar:

E(0 X) = E(Z0 )

y como (s0 ) = x(s0 )0 entonces

0 E(X) = E(x(s0 )0 + 0 )

dado que E(0 ) = 0

0 X = x(s0 )0 (3.56)

De (3.56) es claro que para que Z0 sea insesgado

0 X = x(s0 )0 (3.57)
3.4 Kriging Universal 145

En el caso en que no exista tendencia x(s0 )0 = 1 y X = 1. Esto indicara que


la restriccin (3.57) pasara a ser 0 1 = 1, la cual coincide con la restriccin
en Kriging Ordinario, es decir, Kriging Ordinario es un caso particular de
Kriging Universal.

Varianza del error de la prediccin

La prediccin Z0 tiene una varianza asociada a la localizacin s0 . A


continuacin se estimar dicha varianza y simultneamente este proceso
dar el vector de ponderadores ptimo que har mnima la varianza de
la prediccin del error en s0 . Sea
2
KU (s0 ) = V (Z(s0 ) Z(s0 )) (3.58)

Reemplazando (3.52) y (3.50) para el caso en que i = 0 en (3.58) tenemos:


2
KU (s0 ) = V [0 Z ((s0 ) + (s0 ))]
= V [0 (X + ) (x(s0 )0 + (s0 ))]
= [0 X x(s0 )0 + 0 (s0 )] (3.59)

Los dos primeros trminos se cancelan por la igualdad (3.56), luego:


2
KU (s0 ) = V [0 (s0 )] (3.60)
= V (0 ) + V ((s0 )) 2Cov(0 , (s0 )) (3.61)

Aqu el vector de errores se diferencia del mencionado en Kriging Simple


en que este caso si presenta tendencia y se obtiene de la diferencia entre
la prediccin en un modelo de tendencia y el vector de observaciones.

En (3.61)
146 Captulo 3. Prediccin Espacial Kriging


c11 c1n
. .
V (0 ) 0 , con . . ... donde cij

= = .. =

cn1 cnn
Cov((si ), (sj ))

V ((s0 )) = Cov((s0 ), (s0 )) = C(0) = 2


c10
.
Cov(0 , (s0 )) = 0 c con c = .
. , aqu ci0 = Cov((si ), (s0 ))
cn0

Reemplazando en (3.61) estas igualdades tenemos:

2
KU (s0 ) = 0 + 2 20 c (3.62)

A partir de esta expresin y de la restriccin dada en (3.57) transpuesta se


formula la siguiente funcin Lagrangiana.

L(, m) = 0 + 2 20 c + 2m0 (X 0 x(s0 )) (3.63)

Aqu m es un vector de tamao p 1.


Ahora diferenciando con respecto a

L(, m) = 0 + 0 20 c + 2m0 X 0
= ()0 + 0 2()0 c + 2m0 X 0
= 0 + 0 2c0 + 2m0 X 0
= 20 2c0 + 2m0 X 0
3.4 Kriging Universal 147

Luego:

L(, m)
= 20 2c0 + 2m0 X 0 (3.64)

Ser el vector el que nos genera una varianza mnima si la segunda derivada
es positiva. As:
00 L(, m)
= 2
00

Dado que es definida positiva, sta segunda derivada es positiva.

Igualando (3.64) a cero y dividiendo por 2 tenemos:

0 c0 + m0 X 0 = 0 Ahora se despeja
0 + m0 X 0 = c0
+ Xm = c (3.65)
= c Xm
= 1
(c Xm) (3.66)

Derivando (3.63) con respecto a m

L(, m)
= 2(0 X x(s0 )0 )
m

Igualando a cero y dividiendo por 2 se obtiene

0 X = x(s0 )0
X 0 = x(s0 ) (3.67)
148 Captulo 3. Prediccin Espacial Kriging

Considerando las expresiones (3.65) y (3.66), se construye el sistema solucin


siguiente:

+ Xm = c
X 0 = x(s0 )

En trminos matriciales:
! ! !
X c
= (3.68)
X0 0 m x(s0 )
CKU WKU = DKU

Despejando WKU se tiene:

1
WKU = CKU DKU (3.69)

Computacionalmente (3.69) no es muy eficiente, por lo cual se suele obtener


y m por separado. A continuacin se tienen expresiones para hacer el
clculo ms eficiente.

Al premultiplicar (3.66) por X 0 se obtiene:

X 0 = X 0 1
(c Xm) (3.70)

y ahora al considerar (3.67) en (3.70)

X 0 1 (c Xm) = x(s0 )
X 0 1 0 1
c X Xm = x(s0 ) (3.71)
3.4 Kriging Universal 149

Despejando m se llega a:

m = (X 0 1 1 0 1
X) [X c x(s0 )] (3.72)

Finalmente, reemplazando m en (3.66)

= 1
{c X(X X)1 [X 0 1
1 1
c x(s0 )]} (3.73)

Expresiones como (3.65), (3.68) y (3.73) se pueden reescribir en trminos de


semivarianzas utilizando (3.46) y (3.47). En particular, si reemplazamos en
(3.65) se obtiene:

( 2 110 ) + Xm = 2 1
2 110 + Xm = 2 1 (3.74)

Dado que 0 1 = 1 = 10 , entonces (3.74) se puede expresar como

2 1 + Xm = 2 1
Xm = (3.75)

Asumiendo que en el Lagrangiano (3.63) la restriccin se hubiese podido


considerar negativa, con lo cual (3.75) sera:

+ Xm = (3.76)

Ahora al realizar los mismo clculos anteriores, pero con (3.76) tenemos que
(3.72) y (3.73) en trminos de semivarianzas sern:

m = (X 0 1 1 0 1
X) [X x(s0 )] (3.77)
= { X(X 0 1 1
X) [X
1 1
x(s0 )]} (3.78)
150 Captulo 3. Prediccin Espacial Kriging

Y el sistema (3.68) pasa a ser:


! ! !
X
= (3.79)
X0 0 m x(s0 )

Por ltimo, encontraremos la expresin para la varianza del error, a partir


de (3.62) a continuacin.

2
KU (s0 ) = 0 + 2 20 c

Reemplazando (3.46) y (3.47) aqu, tenemos:

2
KU (s0 ) = 0 ( 2 110 ) + 2 20 ( 2 1 )
= 0 2 110 0 + 2 20 2 1 + 2
= 2 0 11 0 + 2 2 2 0 1 + 20
= 2 + 2 2 2 0 + 20
2
KU (s0 ) = + 20 (3.80)

La varianza del error dada en (3.62) se puede simplificar considerando la


expresin (3.65) as:

2
KU (s0 ) = 0 (c Xm) + 2 20 c
= 0 c 0 Xm + 2 20 c
= 2 0 Xm 0 c (3.81)

Dado que en (3.67) X 0 = x(s0 ), entonces 0 X = x(s0 )0 al reemplazar en


(3.81) tenemos:

2
KU (s0 ) = 2 (x(s0 )0 m + 0 c) (3.82)
3.4 Kriging Universal 151

sta expresin en trminos de semivarianzas es:

2
KU (s0 ) = 0 + m0 x(s0 ) (3.83)

3.4.2 Ejemplo

El ejemplo que se muestra a continuacin, se realiza con los datos de la


Tabla 2.2 de la seccin 2.2.4. En este caso la funcin de semivarianza (o
covarianza) se debe construir a partir del vector de errores obtenidos de la
diferencia entre las observaciones y los pronsticos obtenidos de un modelo
de deriva (o tendencia, es decir se debe correr una regresin de un polinomio
de orden 1, 2 o 3 "lo cual depender de la tendencia observada y de la
cantidad de puntos disponibles". En esta regresin la variable regionalizada
Z es la variable respuesta y las variables asociadas a las coordenadas x y y
son las variables independientes 1 ). El variograma fue ajustado previamente
en el programa ArcGIS 9.2 (ESRI 2007), se selecciono un modelo esfrico con
pepita c0 = 0, meseta c1 = 53.064 y rango a = 53.064.

En este ejercicio se desea estimar el valor de Z en la localizacin s0 = (3, 4)


con su correspondiente varianza, dada or el kriging universal. As, lo primero
que se calcula es las distancias entre los puntos ms cercanos al punto s0
y las distancias entre los vecinos mas cercanos, para el caso se consideran
5 vecinos al punto s0 . Con dichas distancias se calculan las semivarianzas
entre los puntos a partir del semivariograma ya establecido. Los resultados
se muestran en la Tabla 3.5 a continuacin:

Estas semivarianzas se emplean en la expresin 3.69 para obtener el


vector de ponderadores y multiplicadores de Lagrange, tiles para obtener la
1
En general suelen usarse las coordenadas espaciales, pero siempre y cuando sea posible
es recomendable considerar otras variables diferentes
152 Captulo 3. Prediccin Espacial Kriging

Tabla 3.5: Calculo distancias y semivarianzas (Modelo esfrico)

Relacin Distancia Semivarianza


1-2 2.000 46.332
1-3 2.236 49.332
1-4 4.123 53.064
1-5 5.000 53.064
2-3 2.236 49.332
2-4 4.123 53.064
2-5 5.385 53.064
3-4 2.000 46.332
3-5 3.162 53.064
4-5 1.414 35.884

1-s0 2.000 46.332


2-s0 2.828 53.033
3-s0 1.000 26.478
4-s0 2.236 49.332
5-s0 3.000 53.064

prediccin y la varianza en la localizacin s0 . A continuacin se muestran las


expresiones asociadas a este caso local:

1
WKU = CKU DKU
3.4 Kriging Universal 153

1
1 11 12 13 14 15 1 x11 x12 10

2 21 22 23 24 25 1 x21 x22 20


3 31 32 33 34 35 1 x31 x32 30

42 43 44 45 1 x41 x42
4 41 40
=


5 51 52 53 54 55 1 x51 x52 50

m0 1 1 1 1 1 0 0 0 1


m1 x11 x21 x31 x41 x51 0 0 0 x10

m2 x12 x22 x32 x42 x52 0 0 0 x20

Reemplazando por los valores de semivarianza de la Tabla 3.5, se obtiene

1
1 0 46.3 49.3 53.1 53.1 1 1 4 46.3 0.518

2 46.3 0 49.3 53.1 53.1 1 1 2 53.0 -0.233


3 49.3 49.3 0 46.3 53.1 1 3 3 26.5 0,.556

53.1 53.1 46.3 0 35.9 1 5 3 49.3 -0.089
4
= =


5 53.1 53.1 53.1 35.9 0 1 6 4 53.1
0.249

m0 1 1 1 1 1 0 0 0 1 -33.030


m1 1 1 3 5 6 0 0 0 3 -1.911


m2 4 2 3 3 4 0 0 0 4 14.045

Luego la prediccin en el punto s0 para Z esta dada por:

Z(s0 ) = 0.518 420 0.233 410 + 0.556 405 0.089 425 + 0.249 415
= 412.3023

2
Y la varianza KU (s0 ) se obtiene a partir de la expresin 3.83. As:

2
KU (s0 ) = 0 + m0 x(s0 ) = 0.518 46.33 0.233 53.03 + 0.556 26.48
= 0.089 49.33 + 0.249 53.06 33.030 1 1.911 3 + 14.045 4
= 52.5576
154 Captulo 3. Prediccin Espacial Kriging

3.4.3 Programacin en R
library(geospt)
data(preci)
names(preci)[4] <- "z"
So <- data.frame(3,4)
names(So) <- c("x","y")
coordinates(So) = ~x+y
coordinates(preci) = ~x+y

# KU Orden 1
krige(z~x+y, preci, SpatialPoints(So), vgm(53.064, "Sph", 2.8858), nmax=5)
# coordinates var1.pred var1.var
# (3, 4) 412.3023 52.55755

# KU Orden 2
krige(z~x+y+x*y+I(x^2)+I(y^2), preci, SpatialPoints(So), vgm(19.201, "Sph", 1.5823), nmax=6)

A partir del orden 3 tendramos ms parmetros que ecuaciones, o si


consideramos menos observaciones en el vecindario con un orden 2 podramos
tener problemas de singularidad.

krige(z~x+y+x*y+I(x^2)+I(y^2), pts, SpatialPoints(So), vgm(19.201, "Sph", 1.5823), nmax=5)

3.4.4 Aplicacin: Temperatura media terrestre diaria


en Croacia

En 153 estaciones meteorolgicas, la temperatura media terrestre diaria en


Croacia fue medida el 1 de diciembre de 2008. Esta informacin es tomada
de http://spatial-analyst.net/book/HRclim2008 y esta fue proporcionada
por Melita Perec Tadi, de la Organizacin Meteorolgica y de Servicios
Hidrolgicos Croatas (Hengl 2009). Croacia es un pas relativamente pequeo,
pero cuenta con varias regiones de clima diferente que son el resultado de su
posicin especfica en el mar Adritico y de la topografa muy diversa que
va desde las llanuras en el este, a travs de una zona central montaosa que
3.4 Kriging Universal 155

separa el territorio continental de la parte martima del pas. La regin de


estudio se caracteriza por una amplia gama de caractersticas topogrficas y
climticas, lo que permite evaluar correctamente la metodologa propuesta
con respecto a la tradicional, ya que las temperaturas promedio de la tierra
en tal regin se ven fuertemente influenciadas por la topografa.

Las mediciones de temperatura se recogen automticamente en 159


estaciones meteorolgicas, pero dado que hay datos perdidos para el 1 de
diciembre de 2008 se dispone de informacin slo en 153 estaciones. En
la mayora de las estaciones meteorolgicas, la temperatura se mide tres
veces al da, a las 7 am, 1 pm y 9 pm (Hengl et al. 2012). La media de la
temperatura diaria (T en un da) se calcula como un promedio ponderado
(Hiebl et al. 2009), de acuerdo a la siguiente expresin

T(7am) + T(1pm) + 2 T(9pm)


T =
4

La distribucin espacial de las estaciones no es optima (Zaninovic


et al. 2008), hay un cierto submuestreo a mayor altitud y en reas con
menor densidad de poblacin; por razones prcticas, a las zonas de mayor
densidad de poblacin se les dio prioridad. Por lo tanto, se podra esperar
que la precisin de la cartografa ser menor a mayor altitud y en las tierras
altas (Hengl 2009, Perec Tadi 2010). Las coordenadas geogrficas (latitud
y longitud) fueron transformadas a un sistema de coordenadas cartesianas
(x, y). La ubicacin de las 153 estaciones meteorolgicas se muestra en la
Figura 3.4.

Con las dos coordenadas espaciales, se realiz una regresin lineal de


primer y segundo orden teniendo en cuenta como variable respuesta la
temperatura media de la tierra; en este caso, el modelo de orden 1 mostr un
mejor ajuste. Posteriormente, se construy un mapa del variograma ajustado
a partir de los residuos obtenidos teniendo en cuenta el mejor modelo.
156 Captulo 3. Prediccin Espacial Kriging

Figura 3.4: Localizaciones de las estaciones meteorolgicas en Croacia

Adems, los variogramas ajustados obtenidos en las direcciones de 45 y 135


grados se muestran en la Figura 3.5; en ambos mapas de variograma de los
residuales se observa un comportamiento anisotrpico.

El variograma experimental asociado a los residuos que presento el mejor


ajuste fue la media recortada, considerando un recorte del 10%. El modelo
terico ajustado fue en ambos casos el de Matrn con parmetros: 12 = 1.197,
12 = 5.637, 1 = 36775.12 y k1 = 0.5. Este modelo mostro el ms bajo
cuadrado medio del error (Mean Square Error, MSE). Los parmetros fueron
estimados utilizando los procedimientos de OLS, WLS y REML. En.el caso
de WLS, dos pesos se consideraron: la ponderacin asignada por Nj 2 (hj )
y denotada por WLS, y los pesos dados por Nj /h2j y denotados por WLS1.
3.4 Kriging Universal 157

50000 150000

45 135
+
var1 12

2e+05 6
10
+ +++
1e+05 8 + ++

semivariance
+
6
+ ++ + +
+ ++
dy

0e+00 4
++ +++
4 + ++++
1e+05 ++
2
2e+05 +
2
0
2e+05 0e+00 2e+05

dx

50000 150000

distance

Figura 3.5: Mapas del variograma anisotrpico y modelos de variograma


ajustados (azimut del semieje mayor es 135 y azimut del semieje
menor es de 45 ) para los residuales de la temperatura media
terrestre.

WLS proporciona mejores resultados que WLS1, con M SE = 1.035 para los
residuos del modelo de orden 1 (ver Figura 3.6).

Una vez que el variograma es definido, este es utilizado en el krigeado


universal para la generacin de los mapas de predicciones de la temperatura
media terrestre y de las varianzas de los errores predichos, los resultados
obtenidos se presentan en la Figura 3.7.

La Figura 3.7 muestra los mapas de prediccin de la varianza del error


para el krigeado universal de orden 1. El mtodo kriging universal subestima
la varianza en las zonas fronterizas (e.d. zonas de extrapolacin). Finalmente
en esta aplicacin, para evaluar la bondad de ajuste del krigeado se realiza la
158 Captulo 3. Prediccin Espacial Kriging

10
8
Semivariance

MSE Values
TRIMMED MEAN
4

WLS = 1.0348
REML = 3.2272
WLS1 = 1.0692
OLS = 1.1933
2

0 50000 100000 150000 200000

Distance

Figura 3.6: Variograma experimental de media recortada para los residuos,


ajustando un modelo de Matrn por WLS, OLS y REML

validacin cruzada "leave one out", con la funcin "criterio.cv" de la libreria


geospt, obteniendo los siguientes resultados:

3.5 Kriging Indicador

Tal como se menciona en Samper & Carrera (1993). El kriging indicador


es un mtodo no paramtrico, al cual no es necesario imponerle ninguna
hiptesis sobre la distribucin de la variable.
3.5 Kriging Indicador 159

(a) Prediccin de la temperatura (b) Prediccin de las varianzas del error

Figura 3.7: Mapas de la temperatura media diaria terrestre en Croacia

El uso de las funciones indicadoras se da por primera vez en Stwitzer


(1977), quien las usa para estimar funciones de distribucin de
variables correlacionadas. Las funciones si estn asociadas con los datos
originales Z(s) ver Journel (1983) mediante una transformacin de una
funcin indicadora y se analiza la distribucin espacial de las mismas,
mediante un kriging se denominar dicho mtodo como kriging indicador
(Journel 1984, Lemmer 1984).

En algunas ocasiones se desea analizar las frecuencias de una variable


espacial y stas frecuencias se asocian a la probabilidad que el valor de
una variable en el espacio est por debajo o por arriba de un valor crtico
denominado umbral. Es en stos casos en donde el uso del mtodo Kriging
Indicador es recomendable.

Casos prcticos como los niveles de un contaminante son relevantes en


estudios ambientales, si el nivel de contaminante sobrepasa el umbral crtico,
160 Captulo 3. Prediccin Espacial Kriging

sto en un periodo de tiempo prolongado, puede llegar a ser perjudicial


para la salud de la poblacin expuesta al mismo. En anlisis ecolgicos
es importante determinar las presencias o ausencias de una determinada
especie, con fines de preservacin de la especie, dado que se pueden hacer
desarrollos en el espacio como por ejemplo ubicar molinos de viento con fines
de generacin de energa y en ste caso las aves podran llegar a desaparecer
si se ubican molinos en zonas donde las aves pasan con frecuencia. En otro
caso, por ejemplo en la pesca si no se analiza la presencia de los peces,
algunas especies podran desaparecer al no controlar los lmites de la misma.
En los casos anteriores es importante la aplicacin de mtodos como el
kriging indicador. A continuacin se explicar el mtodo.

Sea Z(s) un proceso Gaussiano, el cual se transforma a travs de una


funcin indicadora I(Z(s)) de la siguiente manera:
(
1 si Z(si ) Zc
I(Z(si )) =
0 si Z(si ) > Zc

Donde Zc es el umbral o nivel crtico. Normalmente la funcin indicadora


se construye asociada a la situacin en donde la variable no excede el nivel
crtico. A sta funcin indicadora se le asocia la siguiente media o valor
esperado:

E(I(Z(si )) = 1 P (Z(si ) Zc ) + 0 P (Z(si ) > Zc )


= P (Z(si ) Zc ) = FZ (Zc ) (3.84)

Por lo cual el valor esperado de la funcin indicadora corresponde a la funcin


de distribucin de probabilidad. En ste kriging el predictor est dado por:
n
X

I(Z(s 0 )) = i I(Z(si )) (3.85)
i=1
3.5 Kriging Indicador 161

n es el tamao del vecindario. La expresin (3.85) debe satisfacer las


siguientes propiedades:


a) 0 I(Z((s 0 ))) 1


b) Si Z(si ) Z(sj ) entonces I(Z(s
i )) I(Z(sj ))

En trminos vectoriales (3.85) se puede expresar como:


I(Z(s 0
0 )) = I (3.86)

3.5.1 Propiedades del predictor Z0

Insesgamiento

Veamos ahora si el predictor (3.86) es insesgado. Para ello


E(I(Z(s 0 ))) = Fz (zc ) (3.87)

Reemplazando (3.86) en (3.87)


E(I(Z(s 0
0 )) = E( I) = FZ (zc )

= 0 E(I) = FZ (zc )
= 0 FZ (zc )1 = FZ (zc )
= 0 1 = 1 (3.88)

Luego, al igual que en kriging ordinario hay restriccin por insesgamiento


y es la misma.
162 Captulo 3. Prediccin Espacial Kriging

Varianza del error de la prediccin

Con el fin de encontrar el predictor (3.86), es necesario minimizar la varianza


del error de la prediccin. Luego la expresin asociada a esto es:

2
KI
(s0 ) = V (I(Z(s 0 )) I(Z(s0 ))) (3.89)

Reemplazando (3.86) en (3.89)

2
KI (s0 ) = V (0 I) + V (I(Z(s0 ))) 2Cov(0 I, I(Z(s0 )) (3.90)

Realizando un proceso anlogo al ya realizado en la seccin (3-2) Kriging


Ordinario llegamos a que el sistema solucin es:
! ! !
I 1 0 I
= (3.91)
10 0 m 1
GKI WKI = LKI (3.92)

Despejando se tiene:

WKI = G1
KI LKI (3.93)

Donde
I I I

11 1n i0
. .
. . ...
.
I = . y I = . (3.94)
. .
I I I
n1 nn n0

Con ijI = (I(Z(si )), I(Z(sj ))) y i0


I
= (I(Z(si )), I(Z(sj ))).
Luego el semivariograma ahora es entre unos y ceros. Por lo cual, entre dos
localizaciones diferentes se dan las siguientes posibilidades.
3.5 Kriging Indicador 163

1 1
Si I(Z(si )) = 1 y I(Z(sj )) = 0 = ij = (1 0)2 =
2 2
1 1
Si I(Z(si )) = 0 y I(Z(sj )) = 1 = ij = (0 1)2 =
2 2
1
Si I(Z(si )) = 1 y I(Z(sj )) = 1 = ij = (1 1)2 = 0
2
1
Si I(Z(si )) = 0 y I(Z(sj )) = 0 = ij = (0 0)2 = 0
2

Al realizar el proceso anlogo, en la estimacin de la varianza del error tal


como se hizo en la seccin (3.2) se llega a:
2
KI (s0 ) = 0 I + m (3.95)

3.5.2 Ejemplo

Para el ejemplo se considera de nuevo los datos de la seccin 2.2.4 En este caso
la funcin de semivarianza (o covarianza) se debe construir a partir del vector
de valores de la variable indicadora, para construirla es necesario definir un
valor limite denominado umbral. En la practica este valor es definido por el
investigador, quien deber tener conocimiento sobre el umbral de inters (por
2
ejemplo, en el tema de salud publica suelen tenerse ya unos valores limite
definidos para variables como P M2.5 , o CO2 establecidos por la Organizacin
Mundial de la Salud (OMS)).

Para el caso con fin ilustrativo se asumir el umbral de 420 para la variable
precipitacin. Los datos se muestran en la Tabla 3.6 a continuacin:

Con la variable indicadora I(Z(si )) ya construida se pasa a ajustar el


variograma. Esto se hizo en el programa ArcGIS 9.2 (ESRI 2007), obteniendo
2
Los valores limite son aquellos niveles extremos del contaminante, hasta donde las
personas pueden tolerar en un determinado periodo tiempo sin que sea perjudicial para la
salud
164 Captulo 3. Prediccin Espacial Kriging

Tabla 3.6: Datos de precipitacin y variable indicadora

Obs x y Z(si )=prec I(Z(si ))


1 1 4 420 1
2 1 2 410 1
3 3 3 405 1
4 3 0 415 1
5 5 1 430 0
6 5 3 425 0
7 6 4 415 1
8 6 1 435 0
9 6 3 425 0
10 7 2 430 0

un modelo esfrico con parmetros c1 = 0.28306, c0 = 0.09293 y a = 6.9642,


el nmero de vecinos empleados en este caso es 5. A continuacin en la Tabla
se muestran los resultados obtenidos de; las distancias entre los vecinos y el
punto s0 , las distancias entre los vecinos y en la ltima columna se muestran
las semivarianzas I .

Con estas semivarianzas a partir la expresin 3.93 se obtiene el vector de


que contiene los ponderadores y el multiplicador de Lagrange, los cuales se
utilizaran para estimar la prediccin y la varianza en la localizacin s0 . A
continuacin se muestran las expresiones para este caso local:

WKI = G1
KI LKI
3.5 Kriging Indicador 165

Tabla 3.7: Calculo distancias y semivarianzas I (Modelo esfrico)

Relacin Distancia Semivarianza (I )


1-2 2.000 0,212
1-3 2.236 0.225
1-4 4.123 0,315
1-5 5.000 0,345
2-3 2.236 0,225
2-4 4.123 0,315
2-5 5.385 0,356
3-4 2.000 0,212
3-5 3.162 0,272
4-5 1.414 0,178

1-s0 2.000 0.212


2-s0 2.828 0.256
3-s0 1.000 0.153
4-s0 2.236 0.225
5-s0 3.000 0.265

1
I I
12 I
13 I
14 I
15 1 I
1 11 10
I I
22 I
23 I
24 I
25 1 I
2 21 20
I I I I I
I
3 31 32 33 34 35 1
30

=
I I
42 I
43 I
44 I
45 1 I
40

4 41

5 I I
52 I
53 I
54 I
55 1 I
50

51
m 1 1 1 1 1 0 1

Luego, reemplazando por los valores de semivarianza de la Tabla 3.6, se


obtiene
166 Captulo 3. Prediccin Espacial Kriging

1
0 0.21 0.22 0.31 0.35 1 0.21 0.259
1
0.21 0 0.22 0.31 0.36 1 0.26 0.055
2

3 0.22 0.22 0 0.21 0.27 1 0.15 0.410
=
0.22 =

0.31 0.31 0.21 0 0.18 1 0.152
4

5 0.35 0.36 0.27 0.18 0 1 0.26 0.125

m 1 1 1 1 1 0 1 0.017

La prediccin en el punto s0 para I(Z(s0 )) esta dada por:

Z(s0 ) = 0.259 1 + 0.055 1 + 0.410 1 + 0.152 0 + 0.125 1


= 0.8480858

2
Y la varianza KI (s0 ) establecida en la expresin 3.95 es:

2
KI (s0 ) = 0 I + m = 0.259 0.212 0.055 0.256 + 0.410 0.153+
= 0.152 0.225 + 0.125 0.265 + 0.017 1 = 0.2157079

3.5.3 Programacin en R
library(geospt)
data(preci)
names(preci)[4] <- "z"
So <- data.frame(3,4)
names(So) <- c("x","y")
coordinates(So) = ~x+y
coordinates(preci) = ~x+y

krige(I(z<=420)~1,preci,SpatialPoints(So),vgm(0.28306,"Sph",6.9642,nugget=0.09293),nmax=5)
# coordinates var1.pred var1.var
# (3, 4) 0.8480858 0.2157079
3.5 Kriging Indicador 167

Figura 3.8: Protocolo de observacin. Los observadores (cada uno a un lado del
avin) escanean una franja de 230 m ubicada por las marcas en el
ala. La tira se subdividi en tres franjas.
Fuente: Tomado de (Certain & Bretagnolle 2008)

3.5.4 Aplicacin: Proteccin de Especies

Para el ejemplo, se considera un anlisis de proteccin de especies ubicadas en


la costa de Barcelona. En esta zona se pensaba instalar unos molinos de viento
con el fin de generar energa elica, para ello es importante evaluar antes el
posible dao ecolgico que generara dicha instalacin. As que se utiliza un
avin y un grupo de expertos que cuantifican las diferentes especies. Al conteo
realizado se le asignan coordenadas geogrficas dadas por el GPS, para dar
mayor claridad se muestra en la Figura 3.8 como los datos son tomados
en varias franjas en ambos lados del avin (en algunas localizaciones slo
se conto a un lado) y la franja es de 250 m, la cual es subdividida en 2
franjas (la zona asociada a x0 es un rea ciega), en este caso los datos son
tomados entre Abril 2005 y Marzo 2006. Se cuentan especies de aves; Larus
Michahellis (LM), Sterna Hirundo y Larus Audouinii. Para esta aplicacin,
se considera slo la especie LM en enero de 2006. El objetivo es cuantificar
168 Captulo 3. Prediccin Espacial Kriging

la presencia-ausencia de la especie con el fin de cuantificar el posible dao


ecolgico. Para analizar la presencia-ausencia de la especie se trabajar con
el mtodo kriging indicador, asociando 1 a presencia y 0 con ausencia. Dado
lo anterior, se construir un variograma indicador y se realizara el kriging
indicador con algunos estadsticos que permiten evaluar la bondad de ajuste
del mtodo.

x y time Lar_mic ILM


296143 4468190 200601 0 0
296643 4468190 200601 0 0
281143 4467690 200601 5 1
283643 4467690 200601 2 1
286143 4467690 200601 6 1
289143 4467690 200601 1 1
289643 4467690 200601 0 0
291643 4467690 200601 0 0
294143 4467690 200601 0 0
. . . . .
. . . . .

La lectura de los datos se hace de la siguiente manera:

Dat <- DatosEspecies[(DatosEspecies$month %in% "1"),][,c(3,4,1,6)]


Dat1 <- na.omit(Dat)
Dat1$IML <- ifelse(Dat1$Lar_mic>0,1,0)
names(Dat1) <- c("x","y","time","Lar_mic","ILM")
library(geoR)
esp.geo<-as.geodata(Dat1, coords.col = 1:2, data.col = 4, covar.col = 3:4, covar.names =
c("time","IML"))
plot(esp.geo)

La Figura 3.10 es el resultado de este proceso y como se puede observar en


el panel de 4 grficas, en la parte superior derecha e inferior izquierda se tienen
los cortes de la variable conteo de la especie LM con relacin a las coordenadas
Y y X respectivamente (es de notar la gran cantidad de ceros observados).
En la parte inferior derecha se observa el grfico de densidad del conteo de
3.5 Kriging Indicador 169

la especie LM, este indica lo dicho anteriormente (es clara la asimetra a


derecha). Por ltimo, en la parte superior izquierda se encuentra el grfico
de la distribucin espacial de las muestras. Con las siguientes instrucciones se
puede tambin visualizar de una mejor manera la localizacin de las muestras,
el resultado se observa en la Figura 3.9.

#### Creacin de la grilla con los puntos de prediccin y ploteo


library(maptools)
pol_esp <- readShapePoly("D:/LibroEstadsticaEspacial/Borde.shp")
points(sp)
df.pts<-spsample(pol_esp, n=20000, type="regular")
par(mar=c(0,0,0,0))
plot(pol_esp, axes=T, xlab= "Este (m)", ylab= "Norte (m)")
points(esp.geo$coords, pch=19, cex=0.3)
points(df.pts)
4520000
4500000
Norte (m)

4480000
4460000

280000 300000 320000 340000

Este (m)

Figura 3.9: Localizaciones de los puntos de muestreo (costa de Barcelona)


170 Captulo 3. Prediccin Espacial Kriging

4520000

4520000
Y Coord
Y Coord
4490000

4490000
4460000

4460000
280000 300000 320000 340000 0 20 40 60 80 100 120
X Coord data

0.10
100

0.08
40 60 80

0.04 0.06
Density
data

0.02
20
0

0.00

280000 300000 320000 340000


X Coord 0 20 40 60 80 100
data

Figura 3.10: Grfico de anlisis estructural (tendencia y normalidad) de la


geodata

Se ajustaron varios modelos de variogramas tericos (Esfrico,


Exponencial, Gaussiano y Matern), a la vez se consideraron los diferentes
variogramas experimentales (clsico, robusto, mediana y media recortada
"recorte del 10 %"). Luego estos variogramas tericos se ajustaron a los
variogramas experimentales, considerando los mtodos de ajuste: OLS,
WLS y WLS1 (es decir, pesos de; 1, N (hj )/(2(hj )2 ) y N (hj )/(hj )2
respectivamente). Como se puede observar en la Figura 3.11 los tres ajustes
presentan un comportamiento similar, prcticamente OLS y WLS producen
los mismos resultados, en este caso se decide trabajar con modelo Gaussiano
3.5 Kriging Indicador 171

ajustado por WLS y con variograma experimental media recortada (este


modelo tiene un RM SP E = 4.985913e 07), se escoge con el fin de
ver claramente el cambio en las predicciones ocasionado por el tamao
de vecindario (El modelo ajustado por OLS es mejor estadsticamente
RM SP E = 4.966359e 07. Sin embargo, no permite ver tan claro el cambio
en las predicciones).

# A continuacion se ajustan algunos semivariogramas teoricos al semivariograma experimental:


midataframe <- Dat1[,-c(3,4)]
library(sgeostat)
library(geospt)
names(midataframe) <- c("x", "y", "p")
P.L.point <- point(midataframe)
P.L.pair <- pair(P.L.point,num.lags=30,maxdist=15000)
P.L.v <- est.variograms(P.L.point,P.L.pair,"p",trim=0.1)
dir.hor <- seq(0, 0, length.out=30)
dir.ver <- seq(0, 0, length.out=30)
id <- seq (length.out=30)
id <- rep("var1",30)

##GAUSSIANO MEDIA RECORTADA


y.t <- data.frame (P.L.v$n, P.L.v$bins, P.L.v$trimmed.mean, dir.hor, dir.ver,id)
names(y.t) <- c("np", "dist", "gamma", "dir.hor","dir.ver","id")
class(y.t) <- c("variogram","gstatVariogram","data.frame")

Gaut.wls <- fit.variogram(y.t, vgm(0.02, "Gau", 1500, 0.005), fit.method=2) # metodo 2 MCP
Gaut.ols <- fit.variogram(y.t, vgm(0.02, "Gau", 1500, 0.005), fit.method=6) # metodo 6 MCO
Gaut.wls1 <-fit.variogram(y.t, vgm(0.02, "Gau", 1500, 0.005), fit.method=7) # metodo 7 MCP
print(list(Gaut.wls,Gaut.ols,Gaut.wls1))

dist.s <- P.L.v$bins


Gaut.WLS <- variogramLine(vgm(Gaut.wls[2,][,2], "Gau",
Gaut.wls[2,][,3],Gaut.wls[1,][,2]), min=0, dist_vector=dist.s)
Gaut.WLS1 <- variogramLine(vgm(Gaut.wls1[2,][,2], "Gau",
Gaut.wls1[2,][,3],Gaut.wls1[1,][,2]), min=0, dist_vector=dist.s)
Gaut.OLS <- variogramLine(vgm(Gaut.ols[2,][,2], "Gau",
Gaut.ols[2,][,3],Gaut.ols[1,][,2]), min=0, dist_vector=dist.s)
MSE.Gaut.WLS <- sum((P.L.v$trimmed.mean-Gaut.WLS$gamma)^2)/7
MSE.Gaut.OLS <- sum((P.L.v$trimmed.mean-Gaut.OLS$gamma)^2)/7
MSE.Gaut.WLS1 <- sum((P.L.v$trimmed.mean-Gaut.WLS1$gamma)^2)/7
print(data.frame(MSE.Gaut.WLS,MSE.Gaut.OLS,MSE.Gaut.WLS1))
172 Captulo 3. Prediccin Espacial Kriging

plot(P.L.v$bins,P.L.v$trimmed.mean,lty=4,pch=1,lwd=2,bg="yellow",type="p",col=1,font.main=3,
main = "",xlab="Distancia",ylab="Semivarianza")
lines( Gaut.WLS, col =2,lty=1,lwd=2)
lines( Gaut.WLS1, col =3,lty=2,lwd=2)
lines( Gaut.OLS, col =4,lty=3,lwd=2)
legend(locator(1), legend = c("MEDIA RECORTADA", "WLS","WLS1","OLS"), pch=c(1,-1,-1,-1),
lty = c(-1,1,2,3), col=1:4, lwd=2)
0.004
0.003
Semivarianza

0.002

MEDIA RECORTADA
WLS
WLS1
OLS
0.001

0 5000 10000 15000

Distancia

Figura 3.11: Variograma experimental de media recortada para los residuos,


ajustando un modelo Gaussiano por WLS, WLS1 y OLS

La Figura 3.12 muestra claramente en los dos mapas las predicciones fuera
del intervalo [0, 1], a la vez se observa que con menos vecinos (10 vecinos, parte
(a) de la Figura 3.12) los valores de las probabilidades "excesivas" (aquellas
> 1) y las menores de 0 son mas extremas que en el caso de un vecindario de
tamao 20 (parte (b) de la Figura 3.12). Por lo tanto, una solucin comn
al problema de probabilidades negativas con kriging indicador es disminuir
3.5 Kriging Indicador 173

la zona de bsqueda (o disminuir el tamao del vecindario). A menudo, esto


tambin puede corregir el problema de las probabilidades "excesivas". Si esto
no funciona, otra correccin comn es restablecer los valores irreales a su ms
prximo salto, ya sea 0 para probabilidades negativas o 1 para probabilidades
excesivas (Haining 2004). En la prctica, se utilizan diversas correcciones (ver
Goovaerts (1997)), algunas de las cuales obligan los pesos del kriging a ser
positivos. Los pesos negativos del kriging generalmente se producen cuando
la influencia de un valor de datos se reduce o se proyecta por un valor ms
cercano.

1.4
1.2

1.2
4520000 4520000 1.0

1.0
0.8
0.8

0.6
4500000 0.6 4500000
Norte (m)

Norte (m)

0.4
0.4

0.2 0.2
4480000 4480000
0.0 0.0

0.2
0.2

4460000 0.4 4460000


0.4

280000 290000 300000 310000 320000 330000 340000 280000 290000 300000 310000 320000 330000 340000

Este (m) Este (m)

(a) Prediccin con 10 vecinos (b) Prediccin con 20 vecinos

Figura 3.12: Mapas de la presencia-ausencia especie Larus Michahellis Enero


2006

KO.gaus <- krige(ILM ~ 1, ~x+y, Dat1, df.pts, Gaut.wls, nmax=20)


KO.gaus@data$var1.pred<-ifelse(KO.gaus@data$var1.pred>1,1,ifelse(KO.gaus@data$var1.pred<0,0,
KO.gaus@data$var1.pred))
# length(KO.gaus@data$var1.pred[KO.gaus@data$var1.pred>1])
# length(KO.gaus@data$var1.pred[KO.gaus@data$var1.pred<0])
174 Captulo 3. Prediccin Espacial Kriging

gridded(KO.gaus) <- TRUE


# KO Gaussiano Predicciones Probabilidades Ene-2006 (Larc_mic)
p2<- spplot(KO.gaus, "var1.pred", main="", cuts=80, col.regions= bpy.colors(100), scales =
list(draw =T), xlab ="Este (m)", ylab = "Norte (m)")
# KO Gaussiano Predicciones Varianzas Ene-2006 (Larc_mic)
p2v<- spplot(KO.gaus, "var1.var", main="", cuts=80, col.regions= bpy.colors(100), scales =
list(draw =T), xlab ="Este (m)", ylab = "Norte (m)")

print(p2, split = c(1, 1, 2, 1), more = T)


print(p2v, split = c(2, 1, 2, 1), more = F)

KO.gaus.cv <- krige.cv(ILM~ 1, ~ x+y, Dat1, Gaut.wls, nmax=20)


criterio.cv(KO.gaus.cv)
concor1 <- nrow(KO.gaus.cv[KO.gaus.cv$var1.pred>=0.5 & KO.gaus.cv$observed>0,])
concor0 <- nrow(KO.gaus.cv[KO.gaus.cv$var1.pred<0.5 & KO.gaus.cv$observed<1,])
concurrencias <- concor1 + concor0
discor10 <- nrow(KO.gaus.cv[KO.gaus.cv$var1.pred>=0.5 & KO.gaus.cv$observed<1,])
discor01 <- nrow(KO.gaus.cv[KO.gaus.cv$var1.pred<0.5 & KO.gaus.cv$observed>0,])
discordancias <- discor10 + discor01

Gamma<-(concurrencias-discordancias)/(concurrencias+discordancias)
# 0.7094595

El indice de asociacin Gamma es un ndice de relacin entre las


probabilidades observadas y las probabilidades predichas. Este es un buen
indicador del grado de ajuste del kriging indicador, este ndice es de uso
frecuente en el anlisis de modelos logsticos (aqu la variable respuesta toma
valores de 0 y 1). El coeficiente Gamma oscila entre 1 y 1 y se puede
interpretar como la reduccin proporcional del error cometido al predecir el
ordenamiento de los casos de una variable mediante el conocimiento de la
ordenacin en la otra, el ndice esta dado por:

C D
Gamma =
C +D
Aqu C es el nmero de parejas concordantes (aciertos) y D es el nmero
de parejas discordantes (desaciertos). Al realizar el calculo en el programa
3.5 Kriging Indicador 175

R se obtiene Gamma = 0.709, lo cual indica que predominan las parejas


concordantes sobre las parejas discordantes.

Los estadsticos de validacin cruzada mejoran cuando se incrementa el


nmero de vecinos y empeoran si disminuye el tamao del vecindario. A
continuacin se muestra el resultado obtenido considerando 40 vecinos con
el variograma ajustado previamente.

MPE ASEPE RMSPE MSPE RMSSPE MAPPE CCPE R2 pseudoR2


0.0001903705 0.02080855 0.3325422 0.01911748 16.00122 NaN 0.4735552 0.2059371 0.2242545

Finalmente, se muestran los mapas de probabilidad de la


presencia-ausencia y prediccin de la varianza del error.

1.0

0.0030
4520000
4520000

0.8
0.0025

4500000 0.6 4500000 0.0020


Norte (m)

Norte (m)

0.4 0.0015

4480000 4480000

0.0010
0.2

0.0005
4460000
4460000 0.0

280000 290000 300000 310000 320000 330000 340000


280000 290000 300000 310000 320000 330000 340000
Este (m)
Este (m)

(a) Probabilidad de la presencia-ausencia (b) Prediccin de las varianzas del error

Figura 3.13: Mapas de la presencia-ausencia especie Larus Michahellis Enero


2006

Algunas veces se pierde informacin al usar una funcin indicadora y no


los valores de datos originales, cokriging indicador (Journel 1983), el cual usa
176 Captulo 3. Prediccin Espacial Kriging

k conjuntos de indicadores correspondiente a diferentes niveles de umbral, zk ,


y kriging probabilstico (Sullivan 1984), que utiliza tanto el indicador de los
datos como los datos originales para estimar las probabilidades condicionales,
ha sido sugerido como una mejora alternativa. Sin embargo, no hay garanta
incluso con estos mtodos que las probabilidades predichas estarn en el
intervalo [0,1] como debera ser (Haining 2004).

3.6 Muestreo de Datos para Interpolacin

Una vez realizada la interpolacin espacial se suele preguntar si hubiese sido


posible obtener un mejor resultado?, esta pregunta hace pensar directamente
en el muestreo, ya que el resultado obtenido depende de la calidad y cantidad
de los datos. Los datos provienen muchas veces de fuentes externas las cuales
son imposibles de modificar por el investigador directamente, tal es el caso de
las estaciones meteorolgicas o climticas, las cuales se encuentran ubicadas
en sitios preestablecidos y no se pueden ni ampliar ni ubicar a criterio de
cualquier investigador externo a las empresas que las fijan. Adems, las
estaciones suelen ubicarlas en donde hay ms poblacin o en general donde
hay ms presencia de los individuos a analizar.

As que realizar un estudio de muestreo en las condiciones anteriores lleva


a utilizar el muestreo en estudios posteriores, considerando en el caso de la
geoestadstica el modelo de dependencia espacial y el mtodo de interpolacin
en determinadas configuraciones espaciales. Sin embargo, hay ocasiones en
donde los datos an no han sido tomados y se tiene libertad para realizar un
diseo de muestreo econmico y eficiente (en trminos de tiempo, recursos
econmicos y grado de ajuste estadstico).

El estudio de muestreo puede orientarse tanto a un nuevo estudio (para


generar un conjunto de datos base), as como tambin a incrementar o
3.6 Muestreo de Datos para Interpolacin 177

disminuir la cantidad de puntos ya establecido.

Figura 3.14: Tipos de muestreo: a) regular, b) aleatorio, c) estratificado


Fuente: Tomado de (Olaya 2011)

3.6.1 Diseo de Red


# Creando la malla de puntos co la prediccin del ASEPE y la grfica de del diseo
library(geospt)
library(geoR)
data(ca20)
Sr1 <- Polygon(ca20$borders)
Srs1 = Polygons(list(Sr1), "s1")
Polygon = SpatialPolygons(list(Srs1))
vgm2 <- vgm(112.33, "Sph", 15000,0)
# network: ordinary kriging (with boundary)
par(mar=c(0,0,0,0))
set.seed(104)
netb1.ok <- network.design(z~1, vgm2, npoints=50, boundary=Polygon, nmax=6)
set.seed(104)
netb2.ok <- network.design(z~1, vgm2, npoints=100, boundary=Polygon, nmax=6)
set.seed(104)
netb3.ok <- network.design(z~1, vgm2, npoints=150, boundary=Polygon, nmax=6)

n ASEPE
50 1.110443
100 0.909571
150 0.818971
178 Captulo 3. Prediccin Espacial Kriging

a) n = 50 b) n = 100 c) n = 150

Figura 3.15: Diseos de red obtenidos con kriging ordinario

3.7 Diagnstico mediante validacin cruzada

Tal como se dij en la seccin 2.3 la validacin cruzada es una tcnica que
permite evaluar la capacidad predictiva del modelo seleccionado. Supngase
que se ha observado el valor del proceso Z(s) sobre un conjunto de
localizaciones {s1 , . . . , sn }. Sean Z(si ) y (si ) el valor predicho y el error
tpico de la prediccin para la localizacin si obtenida a partir de las
observaciones {s1 , . . . , si1 , si+1 , . . . , sn }.

Esta tcnica se justifica debido a que los mtodos de interpolacin kriging


son exactos, es decir los valores de los pronsticos coinciden con los valores
observados para los puntos muestreados y da una idea de qu tan buenos son
los pronsticos.

3.7.1 Validacin cruzada leave-one-out

La validacin cruzada leave-one-out (LOOCV) consiste en excluir la


observacin de uno de los n puntos mustrales, y con los n 1 valores
restantes y el modelo de semivarianza o covarianza escogido, predecir va
3.7 Diagnstico mediante validacin cruzada 179

kriging el valor de la variable en estudio en la ubicacin del punto que se


excluy. Si el modelo de semivarianza o covarianza elegido describe bien la
estructura de autocorrelacin espacial, entonces la diferencia entre el valor
observado y el valor predicho debe ser pequea y se podr producir el mapa.
Este procedimiento se debe realizar para cada uno de los puntos mustrales
y as se obtendr el conjunto de n errores de prediccin.

Sea Z[i] (si ) el valor predicho a partir de la validacin cruzada, y sea


[i] (si ) la prediccin para la desviacin estndar en la localizacin si , con
estos estadsticos se construyen los siguientes contrastes de bondad de ajuste
algunos ya mencionados en la subseccin 2.6.1:

1. La media de los errores de prediccin (MPE) debe ser igual a cero.


n 
P 
Z[i] (si ) Z(si )
i=1
MPE =
n

2. La raz media del cuadrado de los errores de prediccin (RMSPE).


v 
uP n 2
u
t Z[i] (si ) Z(si )
i=1
RMSPE =
n

3. Error estndar promedio de los errores de prediccin (ASEPE).


n
P
[i] (si )
i=1
ASEPE =
n

4. La media estandarizada de los errores de prediccin (MSPE) debe ser


muy cercana a cero.
n 
P . 2
Z[i] (si ) Z(si ) [i] (si )
i=1
MSPE =
n
180 Captulo 3. Prediccin Espacial Kriging

5. La raz media estandarizada del cuadrado del error de prediccin


(RMSSPE) debe ser muy cercana a uno 1.
v 
uP n . 2
u
t Z[i] (s i ) Z(s i ) [i] (s i )
RMSSPE = i=1
n

6. El coeficiente de determinacin esta dado por:


n  n
 .X
2
X 2
R =1 Z [i] (si ) Z(si ) Z(si ) Z
i=1 i=1

n
P
donde Z = Z(sj )/n
j=1

Luego se selecciona el mtodo de interpolacin que mejores resultados


estadsticos arroje, as; el RM SP E se espera sea muy cercano al ASEP E,
en la medida en que esto suceda el modelo presentar un buen ajuste. El
criterio al que se da mayor peso es al 5, seguido del criterio 4 y el 6.

Tal como se dijo anteriormente en subseccin 2.6.1, para un modelo


que provea predicciones exactas, el M P E debera ser cercano a cero, el
RM SP E y el ASEP E deberan ser tan pequeos como sea posible (lo cual
es recomendable cuando se comparan modelos), y el RM SSP E debera ser
cercano a 1. El trmino error de prediccin es usado para las diferencias
entre la prediccin y el valor observado actual. Para un modelo que provea
predicciones exactas, el RM SSP E debera ser cercano a 1 si los errores
estndar son exactos y el RM SP E debera ser pequeo si las predicciones
son cercanas a los valores observados.

A continuacin se muestra un breve ejemplo en R de la LOOCV

Programacin en R

# definiendo el variograma esfrico


3.7 Diagnstico mediante validacin cruzada 181

library(gstat)
data(meuse)
coordinates(meuse) <- ~x+y
m <- vgm(.59, "Sph", 874, .04)

# caso kriging ordinario


out <- krige.cv(log(zinc)~1, meuse, m, nmax = 40)
criterio.cv(out)

El resultado asociado al anterior cdigo es el siguiente

MPE ASEPE RMSPE MSPE RMSSPE MAPPE CCPE R2 pseudoR2


0.006674145 0.4188814 0.3873933 0.01150903 0.924489 0.04821387 0.8428837 0.7101429 0.7104529

3.7.2 Validacin Cruzada del Modelo

Cuando est en modo de prediccin (es decir, kriging), hacer la validacin


cruzada del modelo es una manera de diagnosticar los problemas que ocurren
con el ajuste del modelo.

El propsito de chequear el modelado del variograma mediante la


validacin cruzada es para exponer los errores obvios, y para ver donde el
modelo tiene posibles problemas para predecir.

Esto no prueba que el modelo sea adecuado; slo muestra dnde falla el
modelo. Del mismo modo, no se recomienda para confirmar la exactitud de
los diferentes tipos de modelos, por ejemplo, esfrico frente a los modelos de
potencia.

Una variacin de la metodologa previa consiste en dividir la muestra en


dos submuestras; la primera submuestra es usada para modelar el variograma,
y la otra submuestra es utilizada para validar el mtodo kriging. Despus de
eso, las medidas de validacin se pueden construir a partir de los valores
observados y pronosticados (Bivand et al. 2008). Es de recordar que si todo
182 Captulo 3. Prediccin Espacial Kriging

va bien, el RM SP E debera ser lo ms pequeo posible (cercano a cero) y


R2 debe estar cerca de 1.

# Validando Modelo Kriging por Submuestreo:


library(gstat)
data(meuse)
set.seed(123)
sel100 <- sample(1:155, 100)
m.model <- meuse[sel100,]
m.valid <- meuse[-sel100,]
coordinates(m.model) <- ~ x+y
coordinates(m.valid) <- ~ x+y
v100.fit <- fit.variogram(variogram(log(cadmium)~1, m.model), vgm(.5, "Exp",800, 1.7))
m.valid.pr <- krige(log(cadmium)~1, m.model, m.valid, v100.fit)
# Prediciendo en m.valid
resid.kr <- log(m.valid$cadmium)- m.valid.pr$var1.pred
# residuals
summary(resid.kr)
resid.mean <- log(m.valid$cadmium) - mean(log(m.valid$cadmium))
R2 <- 1 - sum(resid.kr^2)/sum(resid.mean^2)

3.8 Ejercicios Propuestos

1. Asuma dos puntos mustrales con coordenadas (1, 1) y (2, 1). Suponga
que se quiere estimar un valor en un punto arbitrario (x, 1). Si se sabe
que el semivariograma es gaussiano y tiene una meseta de 1.0 y un
factor de escala de 1. Encuentre los ponderadores de kriging ordinario
para los dos puntos mustrales.

2. Asuma dos puntos mustrales con coordenadas (1, 0) y (2, 0). Suponga
que se quiere estimar un valor en un punto arbitrario (x, y). Si se sabe
que el semivariograma tiene una meseta de 2.0 y un rango de 0.75.
Muestre que los ponderadores de kriging ordinario estn dados por:
1 20 10 1 10 20
1 = + y 2 = +
2 212 2 212
3.8 Ejercicios Propuestos 183

2
3. Dada la siguiente tabla, calcular Z y KU para el punto p.
C(h)

Punto X Y Z
1 1 2 420 2

2 0 -1 425
3 3 1 415
p 0 0 ?
2 h

4. La siguiente figura muestra 4 mediciones para puntos h1 = 2, h2 =


1, h3 = 1 y h4 = 2, ordenados en una lnea recta. Escriba las
ecuaciones de un sistema kriging ordinario para una estimacin de Z
en un punto h0 = 0. Y encuentre el pronstico y la varianza para
dicha localizacin considerando la siguiente funcin de semivarianza
(h) = h.

5. Considere los datos de la Tabla 3.1 y mediante kriging ordinario estime


2
Z(s0 ) y la varianza KO (s0 ) en la localizacin s0 = (180, 120), dada la
funcin de covarianza C(h) = 2000exph/250 . Por ultimo, realice una
comparacin con los resultados obtenidos previamente en la seccin 3.2
de kriging simple.

6. Suponga que se han tomado muestras en 5 puntos P1 , P2 , P3 , P4 y P5


que estn regularmente espaciados a 1.5 metros sobre una lnea recta.
184 Captulo 3. Prediccin Espacial Kriging

(a) Estime el valor del punto medio P0 , que est entre P4 y P5


empleando Kriging Indicador para un modelo variograma 2(h) =
h, con P1 = 0, P2 = 1, P3 = 0, P4 = 5 y P5 = 0.
(b) Estime la varianza en la localizacin P0 , para un modelo
variograma 2(h) = h2 , mediante kriging universal (orden 1),
concluya sobre el resultado.

7. A partir de los siguientes datos Z(xi ) = {12.2, 15.6, 20.2, 18.6, 14.1,
10.5, 11.8, 16.4}, de una variable regionalizada, con coordenadas
en x = {0, 1, 2, 4, 5, 6, 7, 10} respectivamente. Construir la variable
indicadora I[Z(xi )], cuando se busca modelar la probabilidad de que
regionalizada sea inferior a 14.1.
la variable (
si Z(xi )
I[Z(xi )] = I[Z(xi )] = { , , , , , , , }
si Z(xi )
Y pronosticar la probabilidad en el punto con la coordenada x0 = 9,
as como su varianza. A partir de la siguiente funcin exponencial de
covarianza de I[Z(xi )]: C(h) = 0.6 exp(h/200)

8. Al construir el variograma indicador, modelando la probabilidad que no


exceda el umbral Zc , este variograma indicador cambiar si se modela
la probabilidad que exceda. Responda (F/V). Justifique su respuesta:

9. Dado el enunciado del problema 8 del capitulo 1. Calcule el


semivariograma experimental indicador para azimutes de 0o y de 90o
para una distancia de h = 1, usando en el indicador un umbral de 0.34
y 0.4.

10. Considere la Figura 3.16 y asuma el siguiente modelo de semivarianza


3.8 Ejercicios Propuestos 185

0.23 0.29 0.35

0.34 0.29 0.36

0.46 0.44 0.47

lineal con meseta:





0 si h = 0

h

(h) = 0.1 + 3 30
si 0 < h 30m



0.1 + 3 si h > 30m

(a) Estime mediante kriging simple el valor en la localizacin s0 (es


decir, estime Z(s0 )), el punto se encuentra rodeado de 4 puntos
vecinos Z1 = 4, Z2 = 6, Z3 = 2 y Z4 = 1.
2
(b) Encuentre la varianza KS (s0 ).

11. Dada la configuracin de muestreo del ejercicio 1 del Capitulo 2,


Estimar a partir de Kriging Ordinario el valor de s0 , si se conocen los
siguientes valores vecinos al punto a estimar de la variable regionalizada
s1 = 1.5, s2 = 1.7 y s3 = 2.8. Adems se conoce el semivariograma
esfrico con C0 = 0, C1 = 3 y a = 10. Luego estime la varianza del
punto en la localizacin s0 .
186 Captulo 3. Prediccin Espacial Kriging

Figura 3.16: Configuracin espacial de 4 puntos para kriging

12. Explique cmo se disea una red y suponga que se han tomado
muestras en 4 puntos P1 = 1, P2 = 0, P3 = 1 y P4 = 1
que estn regularmente espaciados a 1 metro sobre una lnea recta,
para un modelo de semivarianza (h) = h1.5 . Calcule el Average
Standard Error Prediction Errors (ASEPE) de una red con la siguiente
configuracin (2, 4, 6, 8) en h.
Apndice A

# La funcin rose genera un diagrama de rosa con las longitudes de los rayos dadas al final
# de cada uno de ellos. Esta funcin considera dos argumentos: un objecto variograma y el
# valor del semivariorama (gamma) en el cual el diagrama de rosa se desea.
# ==========================================================================================

rose <- function(dat.var,critgam){


numcases <- length(dat.var$dist)
numdirec <- length(unique(dat.var$dir.hor))
rose.len <- rep(0,numdirec)
rose.azi <- rep(0,numdirec)
j <- 1
for (i in 1:(numcases-1)){
prod <- (dat.var$gamma[i] - critgam)*(dat.var$gamma[i+1] - critgam)
if (dat.var$dir.hor[i] != dat.var$dir.hor[i+1]) prod <- 0
if (j > 1){
if (rose.azi[j-1] == dat.var$dir.hor[i]) prod <- 0
}
if (prod < 0){
rose.len[j] <- dat.var$dist[i] + (critgam - dat.var$gamma[i])*
(dat.var$dist[i+1] - dat.var$dist[i])/
(dat.var$gamma[i+1] - dat.var$gamma[i])
rose.azi[j] <- as.numeric(unique(dat.var$dir.hor)[j])
j <- j + 1
}
}
rose.azi <- rose.azi*pi/180
dscale <- max(rose.len)
rose.len <- rose.len/dscale
plot(0,0,type="n",axes=F,xlim=c(-1.1,1.1),ylim=c(-1.1,1.1),
xlab="Direccin E-W",ylab="") # E-W Direction
for (j in 1:(length(rose.len))){

187
188 Captulo 3. Prediccin Espacial Kriging

segments(0,0,(rose.len[j]*sin(rose.azi[j])),(rose.len[j]*cos(rose.azi[j])))
text((rose.len[j]*sin(rose.azi[j]) + (.1*sin(rose.azi[j]))),
(rose.len[j]*cos(rose.azi[j]) + (.1*cos(rose.azi[j]))),
(format(round(rose.len[j]*dscale,2))))
segments(0,0,-(rose.len[j]*sin(rose.azi[j])),
-(rose.len[j]*cos(rose.azi[j])))
}
maxx <- max(rose.len*sin(rose.azi))
text(-(maxx+.25),0,"Direccin N-S",srt=90,crt=90) # N-S Direction
title("",srt=0,crt=0) # Diagrama de Rosa
print("Rose Lengths")
rose.len*dscale
}

# Esta funcin toma una matrix nx2 de coordenadas (x,y) y rota las coordenadas al ngulo
# theta. La funcin produce el nuevo conjunto de coordendas rotada bajo el nombre asignado a
# la funcin. As, al escribir: "newxy <- rotateaxis(xy,30)", newxy ser la matrix nx2 de
# las coordendas rotadas (x,y) (rotadas a 30 grados)
# ==========================================================================================

rotateaxis <- function(xy, theta)


{
pimult <- (theta * 2 * pi)/360
newx <- c(cos(pimult), sin(pimult))
newy <- c( - sin(pimult), cos(pimult))
XY <- as.matrix(xy) %*% cbind(newx, newy)
as.data.frame(XY)
}

panel.gamma0 <- function(x,y,gamma0=gamma0,span=2/3, ...){


lofit <- loess.smooth(x,y,span=span)
panel.xyplot(x,y,...)
panel.xyplot(lofit$x,lofit$y,type="l")
nump <- round(length(lofit$x)/2)
dist0 <- approx(lofit$y[1:nump],lofit$x[1:nump],xout=gamma0)$y
panel.segments(0,gamma0,dist0,gamma0)
panel.segments(dist0,0,dist0,gamma0)
parusr <- par()$usr
panel.text(max(x),min(y),paste("d0=",format(round(dist0,4)),sep=""),adj=1)
}

# ==========================================================================================
# MOVEWIN
3.8 Ejercicios Propuestos 189

# Esta funcin calcula medias y varianzas al desplazar la ventana a lo largo de la muestra de


# los datos. Los argumentos de esta funcin son:
# x = un vector de las coordenadas x de los datos
# y = un vector de las coordenadas y de los datos
# v = un vector de los valores de la variable respuesta
# wx = ancho de la ventana en la direccin x
# wy = ancho de la ventana en la direccin y
# wo = ancho de la superposicin entre las ventanas adyacentes
# La funcin retorna un data frame con las nuevas coordenadas correspondientes a los puntos
# medios de las ventanas, el nmero de puntos en cada ventana (numvals), las medias de las
# ventanas mviles (means), y las desviaciones estndar de las ventanas mviles (sdevs).
# ==========================================================================================
movewin <- function(x=x,y=y,v=v,wx=wx,wy=wy,wo=wo){
edge <- min(x[x!=min(x)]-min(x))/2
dimx <- max(x) - min(x) + 2*edge
dimy <- max(y) - min(y) + 2*edge
numx <- trunc((dimx-wx)/(wx-wo) + 1)
numy <- trunc((dimy-wy)/(wy-wo) + 1)
xmid <- matrix(rep(min(x)-edge+(0:(numx-1))*(wx-wo),numy),nrow=numx)+(wx/2)
ymid <- matrix(rep(min(y)-edge+(0:(numy-1))*(wy-wo),numx),nrow=numx,byrow=T)+(wy/2)
isin <- array(dim=c(numx,numy,length(x)))
for (i in 1:length(x)) isin[,,i] <- (abs(x[i]-xmid)<=(wx/2))+(abs(y[i]-ymid)<=(wy/2))==2
numvals <- apply(isin,c(1,2),sum)
means <- matrix(nrow=numx,ncol=numy)
sdevs <- matrix(nrow=numx,ncol=numy)
for (i in 1:numx){
for (j in 1:numy){
if (numvals[i,j]>0){
means[i,j] <- mean(v[isin[i,j,]==T])
sdevs[i,j] <- sd(v[isin[i,j,]==T])
}
}
}
data.frame(x=c(xmid),y=c(ymid),numvals=c(numvals),means=c(means),sdevs=c(sdevs))
}
190 Captulo 3. Prediccin Espacial Kriging
Apndice B

Teorema 3.1. Matriz varianza-covarianza de un vector estocstico


Sea Y un vector estocstico dado por Y = (Y1 , Y2 , , Yn )0 con vector de
medias = (1 , 2 , , n )0 . De tal manera que se define la varianza de Y
como:
V (Y ) = E[(Y )(Y )0 ]

Definicin 3.1. Sean A y B dos matrices de constantes y sea un escalar


que pertenece a R 6= 0. Y sea X un vector estocstico, con lo cual del Teorema
3.1, se satisfacen las siguientes propiedades:

a) V (X) = 2 x , aqui x es la matriz varianza-covarianza del vector X.

b) V (AX) = Ax A0

c) V (AX + Y B) = Ax A0 + B 0 x B + 2AB 0 xy

Teorema 3.2. Diferencial de un vector estocstico Sea X un vector


estocstico n 1, dado por X = (x1 , x2 , , xn )0 , entonces de definen las
siguientes propiedades:

a) X 0 = (X)0

b) = 0

191
192 Captulo 3. Prediccin Espacial Kriging

Entonces:
x x
1 1
x2 x2
X = . = .

.. ..

xn xn

De la definicin 3.1 siempre y cuando A y B sean 2 matrices multiplicables


entre s, se cumple:

(A + B)0 = A0 + B 0

(AB)0 = B 0 A0

0 =
Referencias

Abramowitz, M. & Stegun, I. A. (1965), Handbook of Mathematical


Functions, Dover, New York.

Akaike, H. (1973), Information theory and the maximum likelihood principle,


In International Symposium on Information Theory, Akademiai Kido,
Budapest.

Akaike, H. (1974), A new look at the statistical model identification, IEEE


Transactions on Automatic Control 19, 716723.

Akima, H., Gebhardt, A., Petzoldt, T. & Maechler, M. (2013), akima:


Interpolation of irregularly spaced data. R package version 0.5-11.

Brdossy, A. (2001), Introduction to Geostatistics, Institut fr Wasserbau der


Universitt Stuttgart.

Bardossy, A., Haberlandt, U. & Grimm-Strele, J. (1997), Interpolation of


groundwater quality parameters using additional information, Technical
report, In GeoENV I (Geostatistics for Environmental Applications),
189-200, Kluwer Academic Publ., Dordrecht.

Baxter, B. (1992), The interpolation theory of radial basis functions, PhD


thesis, Department of Applied Mathematics and Theoretical Physics,
University of Cambridge.

193
194 REFERENCIAS

Bishop, C. M. (1995), Neural Networks for Pattern Recognition, Oxford Press,


Oxford.

Bivand, R., Pebesma, E. & Rubio, V. (2008), Applied Spatial Data Analysis
with R, Springer, New York.

Certain, G. & Bretagnolle, V. (2008), Monitoring seabirds populations in


marine ecosystems: the use of strip-transect aerial surveys., Remote
Sensing of Environment (112), 33143322.

Chils, J. P. & Delfiner, P. (1999), Geostatistics: Modeling Spatial


Uncertainty, John Wiley & Sons, New York.

Clark, I. (2001), Practical Geostatistics, Applied Science Pub.

Cressie, N. (1985), Fitting variogram models by weighted least squares,


Joumal of the Intemational Association for Mathematical Geology
17, 563586.

Cressie, N. (1989), Geostatistics., The American Statistician 43, 197202.

Cressie, N. (1993), Statistics for Spatial Data, Revised Edition. John Wiley
& Sons Inc., New York.

Cressie, N. & Hawkins, D. M. (1980), Robust estimation of the variogram,


Mathematical Geology 12, 115125.

Cressie, N. & Majure, J. (1995), Non-point source pollution of surface


watersover a watershed, in Programme Abstracts of the third SPRUCE
International Conference. Merida, Mexico.

Diggle, P., Harper, L. & Simon, S. (1995), Geostatistical analysis of residual


contamination from nuclear weapons testing, in Abstracts of the third
SPRUCE international conference, Mrida, Mxico.
REFERENCIAS 195

Duchon, J. (1976), Interpolation des fonctions de deux variables suivant le


principe de la flexion des plaques minces, Rairo Analyse Numerique
10, 512.

Eriksson, M. & Siska, P. P. (2000), Understanding anisotropy computations,


Mathematical geology 32(6), 683700.

ESRI (2007), ArcGIS 9.2, Los ngeles, Estados Unidos: Environmental


Systems Research Institute, Inc., [Software de procesamiento digital de
imgenes satelitales].

ESRI (2013), ArcGIS 10.1, Los ngeles, Estados Unidos: Environmental


Systems Research Institute, Inc., [Software de procesamiento digital de
imgenes satelitales].

Faraway, J. (2005), Linear Models with R, Chapman and Hall, London.

Franke, R. (1982), Smooth interpolation of scattered data by local thin plate


splines, Computer and Mathematics with Appllications 8, 273281.

Fuentes, M. (2001), A high frequency kriging approach for nonstationary


environmental processes, Environmetrics 12, 469483.

Fuentes, M. (2002a), Modeling and prediction of nonstationary spatial


processes, Statistical Modelling: An International Journal 2, 281298.

Fuentes, M. (2002b), Spectral methods for nonstationary spatial processes,


Biometrika 89, 197210.

Fuentes, M. & Smith, R. (2001), A new class of nonstationary models,


Technical report, Technical report no. 2534, North Carolina State
University, North Carolina State.
196 REFERENCIAS

Gomez, M. & Hazen, K. (1970), Evaluating sulfur and ash distribution in


coal seems by statistical response surface regression analysis, Technical
report, U.S. Bureau of Mines Report RI 7377.

Goovaerts, P. (1997), Geostatistics for natural resources evaluation, Oxford


University Press, New York.

Haas, T. C. (1995), Local prediction of a spatio-temporal process with


an application to wet sulfate deposition, Journal of the American
Statistical Association 90, 11891199.

Haining, R. (2004), Spatial Data Analysis: Theory and Practice, Cambridge


University Press, Cambridge.

Hardy, R. & Gopfert, W. (1975), Least squares prediction of gravity


anomalies, geodial undulations, and detections of the vertical
with multiquadric harmonic functions, Geophysical Research Letters
2, 423426.

Hardy, R. L. (1971), Multiquadric equations of topography and other


irregular surfaces, Journal of Geophysical Research 76, 19051915.

Hardy, R. L. (1990), Theory and applications of the multiquadric-biharmonic


method. 20 years of discovery 1968-1988, Computers & Mathematics
with Applications 19, 163208.

Hengl, T. (2009), A Practical Guide to Geostatistical Mapping, 2nd edn,


University of Amsterdam, Amsterdam.

Hengl, T., Heuvelink Gerard, B. M., Perec Tadi, M. & Pebesma,


E. J. (2012), Spatio-temporal prediction of daily temperatures using
time-series of MODIS LST images, Theoretical and Applied Climatology
107, 1-2, 265277.
REFERENCIAS 197

Heryudono, A. & Driscoll, T. (2010), Radial basis function interpolation


on irregular domain through conformal transplantation, Journal of
Scientific Computing 44(3), 286300.

Heywood, D., Cornelius, S. & Carver, S. (2006), An Introduction to


Geographical Information Systems, Pearson educacin, Pearson Prentice
Hall.

Hiebl, J., Auer, I., Bhm, R., Schner, W., Maugeri, M., Lentini, G., Spinoni,
J., Brunetti, M., Nanni, T. Perec Tadi, M., Bihari, Z., Dolinar, M. &
Mller-Westermeier, G. (2009), A high-resolution 1961-1990 monthly
temperature climatology for the greater alpine region, Meteorologische
Zeitschrift 18, 507530.

Higdon, D., Swall, J. & Kern, J. (1999), Non-stationary spatial modeling,


Technical report, In Bayesian Statistics, 761-768, Oxford University
Press, Oxford.

Holland, D., Saltzman, N., Cox, L. H. & Nychka, D. (1999), Spatial prediction
of sulfur dioxide in the eastern United States, Technical report, In
GeoENV II - Geostatistics for Environmental Applications, 65-76,
Kluwer Academic Publ., Dordrecht.

Isaaks, E. & Srisvastava, R. (1989), An Introduction to Applied Geostatistics,


Oxford Univ. Press, New York.

Jin, R., Chen, W. & Simpson, T. (2001), Comparative studies of


metamodeling techniques under multiple modeling criteria, Journal of
Structural & Multidisciplinary Optimization 23, 113.

Johnston, K., Ver, J., Krivoruchko, K. & Lucas, N. (2001), Using ArcGIS
Geostatistical Analysis, ESRI.
198 REFERENCIAS

Joseph, V. R., Hung, Y. & Sudjianto, A. (2008), Blind kriging: A new method
for developing metamodels., Journal of Mechanical Design 3, 31102.

Journel, A. (1983), Non-parametric estimation of spatial distributions,


Math. Geol. 69(5), 673687.

Journel, A. G. (1984), The place of non-parametric geostatistics, In: Verly


et al., eds., Geostatistics for Natural Resources Characterization, NATO
ASI Series, Reidel, Dordrecht pp. 307355.

Journel, A. G. & Huijbregts, C. J. (1978), Mining Geoestatistics, Academic


Press, New York.

Le, N. & Zidek, J. (2006), Statistical Analysis of Environmental Space-Time


Processes, Springer.

Lemmer, I. C. (1984), Estimating local recoverable reserves via indicator


kriging, In Verly et al., eds., Geostatistics for natural resources
characterization, Part 1: Reidel, Dordrecht, pp. 349364.

Lu, N. & Zimmerman, D. (1994), A nonparametric approach to testing


for directional symmetry of spatial correlation, Technical Report 234,
University of Iowa, Iowa City, Iowa.

Martnez, F. (2008), Modelizacin de la funcin de covarianza en procesos


espacio-temporales: anlisis y aplicaciones., PhD thesis, Universidad de
Valencia-Espaa.

Matheron, G. (1962), Trait de Gostatistique Applique, Editions Technip,


Paris.

Matheron, G. (1971), The theory of regionalized variables and its applications,


Cahiers du Centre de Morphologie Mathematique, 5, Fontainebleau,
Paris.
REFERENCIAS 199

Melo, C. & Melo, O. (2015), geosptdb: Spatio-Temporal Radial Basis


Functions with distance-based regression and Inverse Distance
Weighting. R package version 0.5-0.

Melo, C., Santacruz, A. & Melo, O. (2015), geospt: Geostatistical Analysis


and Design of Optimal Spatial Sampling Networks. R package version
1.0-1.

Mits, L. & Mitsov, H. (1988), General variational approach to the


interpolation problem, Computers and Mathematics with Applications
16, 983992.

Mitsov, H. & Hofierka, J. (1993), Interpolation by regularized spline


with tension: II. Application to terrain modeling and surface geometry
analysis, Mathematical Geology 25, 657669.

Mitsov, H. & Mits, L. (1993), Interpolation by regularized spline


with tension: I. Theory and implementation, Mathematical Geology
25, 641655.

Mosteller, F. & Wallace, D. L. (1963), Inference in an authorship problem,


Journal of the American Statistical Association 58(302), 275309.

Myers, D. (1992), Kriging, cokriging, radial basic functions and the role of
positive definiteness, Computers Mathematical Application 24, 139148.

Nychka, D. & Saltzman, N. (1998), Design of air quality networks, Technical


report, In Case Studies in Environmental Statistics, 51-76, Springer
Verlag, New York.

Olaya, V. (2011), Sistemas de Informacin Geogrfica, Vol. I.

Olea, R. (1999), Geostatistics for Engineers and Earth Scientists, Springer


US.
200 REFERENCIAS

Ortega-Prez, M. (2009), Mtodo de registro no rgido basado en funciones de


base radial. Aplicacin a neurociruga utilizando atlas cerebrales, PhD
thesis, Universitat Politcnica de Valncia. Departamento de Sistemas
Informticos y Computacin.

Paez, M., Gammerman, D. & De Oliveira, V. (2005), Interpolacion


performance of a spatio temporal model with spatially varying
coefficents: Application to pm10 concentration in rio de janeiro,
Environmental and Ecological Statistics 12, 169193.

Pebesma, E. (2001), gstat Users Manual, Department of Physical Geography,


Utrecht University: The Netherlands. version 2.3.3. [2.0].

Perec Tadi, M. (2010), Gridded croatian climatology for 1961-1990,


Theoretical and Applied Climatology pp. 14344483.

Robertson, G. (1987), Geostatistics in ecology. interpolating with know


variance, Ecology 68(3), 744748.

Roustant, O., Dupuy, D. & Helbert, C. (2007), Robust estimation of the


variogram in computer experiments, Technical report, Ecole des Mines,
Dpartement 3MI, 158 Cours Fauriel, 42023 Saint-Etienne, France.

Sacks, J., Welch, W., Mitchell, T. J. & Wynn, H. P. (1989), Design and
analysis of computer experiments, Statistical Science 4, 409423.

Samper, F. & Carrera, J. (1993), Geoestadstica. Aplicaciones a la


Hidrogeologa Subterrnea, Centro Internacional de Mtodos Numricos
en Ingeniera.

Sampson, P. D. & Guttorp, P. (1992), Nonparametric estimation of


nonstationary spatial covariance structure, Journal of American
Statistical Association 87, 108119.
REFERENCIAS 201

Santner, T., Williams, B. & Notz, W. (2003), The Design and Analysis of
Computer Experiments, Springer-Verlag, New York.

Sarma, D. (2010), Geostatistics with Applications in Earth Sciences, Springer.

Schagen, I. P. (1979), Interpolation in two dimensions: a new technique,


Journal of the Institute of Mathematics and its Applications 23, 5359.

Schwarz, G. (1978), Estimating the dimension of a model, Annals of


Statistics 6, 461464.

Sibson, R. (1981), A Brief Description of Natural Neighbor Interpolation,


Wiley series in probability and mathematical statistics: Applied
probability and statistics, Interpreting Multivariate Data, John Wiley
& Sons, New York, chapter 2, pp. 2136.

Sph, H. (1969), Exponential spline interpolation, Computing 4, 225233.

Stone, M. (1974), Cross-Validatory Choice and Assessment of Statistical


Predictions, Journal of the Royal Statistical Society. Series B
(Methodological) 36(2), 111147.

Stwitzer, P. (1977), Estimation of distribution function a from correlated


data, Bull. Inst. Stat. Inst. 47(2), 123137.

Sullivan, J. (1984), Conditional recovery estimation through probability


kriging-theory and practice, in Geostatistics for natural resources
characterization, Springer, pp. 365384.

Team, R. D. C. (2015), R: A Language and Environment for Statistical


Computing, R Foundation for Statistical Computing, Vienna, Austria,
URL http://www.R-project.org/.
202 REFERENCIAS

Thibaux, H. & Pedder, M. (1987), Spatial Objective Analysis: With


Applications in Atmospheric Science., Academic Press. London.

van de Kassteele, J., Stein, A., Dekkers, A. & Velders, G. (2009), External
drift kriging of NOx; concentrations with dispersion model output in a
reduced air quality monitoring network, Environmental and Ecological
Statistics 16, 321339.

Velleman, P. F. & Hoaglin, D. C. (1981), Applications, Basics, and


Computing of Exploratory Data Analysis., Duxbury, Boston, MA.

Wackernagel, H. (2003), Multivariate Geostatistics: An Introduction with


applications, Third Completely Revised Edition. Springer-Verlag, New
York.

Yavuz, H. & Erdogan, S. (2012), Spatial analysis of monthly and


annual precipitation trends in Turkey, Water Resources Management
26, 609621.

Zaninovic, K., Gajic-Capka, M. & Percec-Tadic, M. (2008), Klimatski atlas


Hrvatske, climate altas of Croatia 1961, 1990, 1971 2000., Technical
report, Meteorological and Hydrological Service Republic of Croatia,
Zagreb.

Zhang, G. (2011), Smoothing splines using compactly supported, positive


definite, radial basis functions, Computational Statistics pp. 112.

Zimmerman, D. (1993), Another look at anisotropy in geostatistics,


Mathematical Geology 25(4), 453470.
REFERENCIAS 203