Vous êtes sur la page 1sur 31

Introduccin al anlisis

geoestadstico con Geostatistical


Analyst
Que estudia la geoestadstica
Procesos naturales interpretados mediante teora funciones
aleatorias (variables regionalizadas)
Variable aleatoria: es una variable que puede tomar valores de
acuerdo a cierta distribucin de probabilidades.
Variable regionalizada: es una variable aleatoria caracterizada,
adems de por el conjunto de valores que puede tomar, por su posicin
en el espacio.
Concepto matemtico: una variable regionalizada, es, simplemente una
funcin f(x) que toma valores en todos los puntos x de coordenadas (xi,
yi, zi) en el espacio tridimensional.
Estas variables cumplen con el principio siguiente: aquellas cosas
que estn ms cerca se pueden parecer ms que aquellas ms
separadas. Esto quiere decir que la correlacin entre valores de una
propiedad medida en puntos cercanos tiende a ser mayor que la
correlacin de valores medidos en punto distantes.
La estadstica tradicional no es capaz de incorporar este principio de
ah el origen del estudio de la geoestadstica.
Geoestadstica: planteamiento (1)

La teora de la variable regionalizada considera la variable (atributo)


como una variable aleatoria Z(x), donde x representa las
coordenadas espaciales. Los valores de Z, de los que hay uno para
cada posicin, constituyen una particular realizacin de un proceso
aleatorio.

(x) componente estructural


componente aleatorio, espacialmente
(media local desconocida)
correlacionado, cuya varianza viene
dada por la siguiente expresin:

Se asume:
Varianza depende
Variable y sus derivadas son solo de distancia.
continuas
NO de la posicin de
Media y varianza constantes los puntos.
Geoestadstica: planteamiento (2)
Consideremos Z xi , i 1,2, N puntos en los cuales se tiene
informacin de determinada propiedad y la estimacin de
a partir de los puntos Z xi
Se quiere conocer el valor en un punto sin informacin

Z xi

Variables ambientales continuas,


observables solo en puntos
concretos.

Estimar, o predecir espacialmente, sin sesgo y con un error mnimo.


Geoestadstica: planteamiento (3)

Planteamiento bsico de la estimacin (por Kriging):

Considerar la estimacin de como una combinacin lineal de las


observaciones disponibles
n y escoger los pesos bajo un criterio en
Z * ( x) i Z ( xi ) el cual se considera que dicha
i 1
estimacin es ptima. Este es que el
Valor a
estimador sea insesgado y que
estimar en
*


valor en
varZ x Z x
algn punto
especfico puntos

Peso o ponderacin que


muestreados
cercanos al
se le da a cada uno de lugar a sea mnima
los valores observados interpolar consecuentemente los valores s
de la variable en el adecuados son los que minimizan la
lugar Xi varianza.
Que es un estudio Geoestadstico?
Pasos para un correcto estudio geoestadstico:
Estadstica descriptiva
1. Anlisis exploratorio de los datos Anlisis grfico
Anlisis de tendencias

Clculo (semi)variograma
2. Anlisis estructural o variogrfico experimental
Ajuste del (semi)variograma a
un modelo vlido

3. Interpolacin o estimacin espacial

4. Validacin del modelo geoestadstico


Anlisis Exploratorio de Datos
Primer paso de cualquier anlisis -(geo)estadstico o no- de datos.
Sirve a familiarizarse con el conjunto de datos.
Representar los datos en figuras y diagramas en vez de analizar directamente listados en
formato tabular
Cul es la distribucin de los datos?, Existen valores anmalos?, El histograma es
simtrico o sesgado?, Los datos presentan alguna tendencia? Son istropos o anistropos?
Para esto es necesario conocer:

La distribucin espacial (estadsticos de base, histogramas)


Presencia de tendencias (anlisis de tendencias)
Bsqueda de valores anmalos (box-plot)

El AED permite entender en profundidad las observaciones del fenmeno para poder tomar
decisiones sobre como tratarlos.

Las herramientas que se pueden usar en ArcGIS son: Histogram, Normal QQPlot, Trend
Analysis, General QQPlot.
Anlisis Exploratorio de Datos

K= Nmero de intervalos
h = Tamao intervalo
K= 10*logN
= Desviacin estndar
A= (val.mx)/K A=rango/K
n = nmero de muestras
Anlisis Exploratorio de Datos
Normal QQplot: grfico que
compara la distribucin de la
variable con la de una distribucin
normal.

Trend Analysis: proyeccin 3D de


los datos para identificar
tendencias y anisotropas en los
datos.
El valor de
Voronoi map: construccin de
cada polgono
puede ser polgonos formados entorno a
calculado un punto (dato).
usando
cualquiera de
mtodos:
simple, mean,
mode, cluster,
entropy,
median
standard
deviation, IQR
Anlisis estructural o variogrfico
El variograma
Describe como vara la variable en funcin de la distancia y
direccin
Se calcula: N h
h
1
i
2
z x z x i h
2 N (h) i 1

Se ajusta a un modelo por que el variograma experimental no


permite evaluar en distancias o direcciones intermedias

Los modelos utilizados habitualmente en el ajuste del variograma


son:Gaussiano, Exponencial, Esfrico, Polinomial, etc
Kriging
El kriging es un mtodo geoestadstico muy difundido y del cual existen
un gran nmero de modificaciones.
Estos algoritmos estn basados en la descripcin de la variacin espacial
de los datos que se modela mediante el variograma.

En ArcGIS el ajuste del semivariograma se realiza una vez


elegido el mtodo de interpolacin.
Kriging
Existen varios tipos de kriging:

Kriging simple: media m conocida


Kriging ordinario: media m desconocida
Kriging con deriva: media desconocida que depende de cada posicin m(u)
Kriging universal - intrnseco: la deriva es un polinomio de las coordenadas
Kriging trigonomtrico: la deriva es una funcin peridica
Kriging con deriva externa: la deriva es proporcional a una variable secundaria
Kriging no lineal: aplica kriging a una transformada de la variable
Kriging lognormal: cuando el logaritmo de los datos tiene una distribucin normal
Kriging de indicadores: aplica kriging a datos binarios (indicadores) que codifican
probabilidades de pertenecer a un tipo de roca o de sobrepasar una ley de corte
Kriging disyuntivo: aplica kriging a factores que descomponen la variable a estimar
Kriging multi-Gaussiano: aplica kriging a la transformada Gaussiana de los datos
Kriging multivariable = cokriging
Etc.
Mapas en ArcGIS

Prediction maps (interpolacin): estiman valores donde las medidas no han sido
tomadas.
Standard error maps: (mapa de la raz cuadrada de la varianza de las estimaciones)
muestra la distribucin del error de la interpolacin. Este tiende a ser mayor en
sitios donde hay poca o ninguna informacin de la variable estudiada.
Quantile maps : mapa de los valores donde las predicciones exceden (o no exceden)
los valores del percentil especificado.
Probability maps : mapas de probabilidades que los valores exceden (o no exceden)
un umbral especificado. Esta probabilidad es determinada a partir de las
estimaciones, del error de distribucin y del umbral elegido.
Algunas referencias

Samper, F.J. & J. Carrera 1990. Geoestadstica. Aplicaciones a la


Hidrogeologa Subterrnea. Centro Internacional de Mtodos Numricos en
Ingeniera. Universitat Politcnica de Catalunya. Barcelona.

Myers, D. E. 1987. Optimization of Sampling Locations for Variogram


Calculations. Water Resources Research. 23(3): 283(93).

Isaaks, E. & R. M. Srivastava. 1989. Applied Geostatistics. Oxford


University Press, New York.

Cressie, N. 1993. Statistical for Spatial Data. John Wiley & Sons, New York.

Daz-Francs, E. (1993). Introduccin a Conceptos Bsicos de


Geoestadstica. Memorias Seminario Estadstica y Medio Ambiente. Centro
de Investigacin en Matemticas, CIMAT. Guanajuato, Mxico.

Christakos, G. (2000), Modern Spatio Temporal Geostatistics, Oxford


University Press, New York.
Algunas referencias

Burrough, P.A. (2001). GIS and geostatistics: essential partners for


spatial analysis. Environmentaland Ecological Statistics, 8, pp. 361-
377.

Chica Olmo, M. y Luque Espinar, J.A. (2002). Interpolacin espacial en


la creacin de cubiertas temticas en SIG. En: HUERTA, L. (Ed.). Los
SIG en la gestin de los riesgos geolgicos y el medio ambiente.
IGME, pp. 181-198.

Webster, R. y Oliver, M.A. (2001). Geostatistics for Environmental


Scientists. John Wiley and Sons Ltd, Chichester, 271 pp.

Pilz J.(2009). Interfacing Geostatistic and GIS. Springer-Verlag, Berlin


Anlisis y preparacin de los datos
Cargar la extensin Geosttical Analyst
Aadir el mapa base y crear la capa de puntos de estaciones
meteorolgicas.
Observar la distribucin de los datos.
Calcular estadsticos bsicos (open attributa table ->atributo-> (botn
secundario -> Statistics)
Comprobar la distribucin de los datos
En la barra de herramientas Geostatical Analyst-> Explore data->
Histogram
Seleccionar la media para los valores repetidos.
Seleccionar la capa de puntos y en Attribute el campo que
corresponda.
En la pestaa Transformation probar a cambiar entre las opciones
Calcular tamao y nmero de intervalos con las frmulas propuestas
Cmo cambia el histograma?
Cmo podemos definir la distribucin de estos datos?
Es necesaria una transformacin que nos acerque a una distribucin normal?
Comprobar la distribucin de los datos
Selecciona los intervalos para saber cules son los puntos que lo
forman. Comprobar con las reas de mximos y mnimos
selecccionanado el primer y el ltimo intervalo.
Comprobamos el diagrama normalQQ, para ello: Geosttical Analyst
-> Eplore Data-> NormalQQPlot
Seleccionar el archivo y la variable correctos
En la transformacin cambiar a Log Cambia algo?Es mejor?
Anlisis de tendencias
Permite representar los datos en 3D, dibujando regresin de la variable en
los planos E-O y N-S.
Objetivo: visualizar los datos en conjunto, observar tendencias globales y
decidir eliminar durante la interpolacin (slo eliminar si se minimizan
notablemente los errores de las estimaciones)
Geostatistical Analyst -> Explore Data -> Trend Anlisis.
En la pantalla que se abre asegurarse de seleccionar el archivo y la variable
Correctos.
Definir las tendencias presentes. Cmo varan los datos en el rea de estudio? Cul
es la tendencia global de los datos?
Observar si todas las variables presentan la misma tendencia cambiando la variable
en la pestaa Attribute
Anlisis del semivariograma
Geostatistical Analyst -> Explore Data -> Semivariogram/Covariance
Cloud.
En la pantalla que se abre asegurarse de seleccionar el archivo y la
variable correctos.
Seleccionar el tamao y el nmero de intervalos que definirn el
variograma
Son adecuados los valores que vienen por defecto?
Anlisis del semivariograma
Geostatistical Analyst -> Explore Data -> Semivariogram/Covariance Cloud.
En la pantalla que se abre asegurarse de seleccionar el archivo y la variable
correctos.
Para reducir el nmero de puntos en el semivariograma emprico se lleva a cabo
un proceso de agrupacin de aquellos pares de localizaciones presentes en el
semivariograma en base a la distancia entre ellos. Este proceso genera una serie
de grupos de pares de puntos denominados Bins a lo largo de todo el rea de
estudio.
El control de las condiciones en que se va a realizar este proceso de agrupacin se
realiza mediante la modificacin del tamao y nmero de intervalos (Lag size,
Number of Lags).
Seleccionar el tamao y el nmero de intervalos que definirn el variograma
Son adecuados los valores que vienen por defecto?
Anlisis del semivariograma
Cmo podemos determinar qu valores de intervalo pueden proporcionar
un buen ajuste del semivariograma? Para concretar el tamao (TI) y
nmero (NI) numerosos estudios geoestadsticos coinciden en que se
deben cumplir dos condiciones:
La mitad de la distancia mxima entre puntos (DMAX/2) debe ser aproximadamente
igual al producto del nmero de intervalos (NI) por el tamao de los mismos.
La distancia media entre vecinos prximos (DMED) multiplicada por dos debe ser
menor o igual al tamao del intervalo. De esta manera se garantiza que tenemos una
probabilidad de al menos el 95% de encontrarnos con tres puntos por cada intervalo.
Por tanto, para establecer unos valores adecuados de tamao y distancia
de intervalo tenemos en primer lugar que conocer la distancia mxima
entre puntos, as como la distancia media entre puntos cercanos.
Anlisis del semivariograma
Activar Show search direction y mover con el puntero la direccin
Observar las diferencias que existen entre los semivariogramas
realizados para la direccin NE-S- .
Crear el semivariograma siguiendo la direccin de la tendencia global
que hemos observado anteriormente. Qu cambia?

Mover con el
puntero para
cambiar la direccin
de observacin de
la correlacin
espacial
Anlisis del semivariograma
El tamao del intervalo (Lag) controla la distancia para agrupar
muestras.
Si el tamao del lag es muy grande, se omitir parte de la correlacin espacial
en los datos.
Si el tamao del lag es muy pequeo, no se conseguirn muchos pares de
puntos para el anlisis.
Una forma aceptada de elegir estos parmetros es que el tamao de
lag multiplicado por el nmero de lags, sea ms o menos, la mitad de
la distancia mxima entre los puntos que se estn estudiando.
Anlisis del semivariograma
Seleccionar un punto con un alto valor en el eje Y.
Qu se observa? y que cambia si se seleccionan unos puntos en la parte
derecha del diagrama?
En las figuras a continuacin se representan estas dos situaciones. En
el grfico los puntos seleccionados son destacados en azul y en el
mapa se representan las dos posiciones que representan el punto
elegido del variograma. Esto es como el programa calcula la distancia
(el eje de abscisas) de cada par de puntos y su valor de
semivariograma (el eje de ordenadas).
Anlisis del semivariograma

los puntos estn a una distancia las distancias son mayores y se


pequea (el punto destacado est mantiene la diferencia entre los
cerca del cero sobre el eje de
abscisas). Los valores, sin embargo, valores medidos.
son diferentes.
Anlisis Geoestadstico: ajuste del
semivariograma y creacin de mapas.
Geostatistical Analyst ->
Explore Data->
Geostatistical Wizard.
En esta primera pantalla se
decide el archivo que se
usa, el atributo que se
quiere interpolar y el
mtodo que se quiere usar.
Kriging -> Next-> Ordinary
Kriging-> Prediction Map
->next.
Anlisis Geoestadstico: ajuste del
semivariograma y creacin de mapas.
Seleccionar el modelo
esfrico y activar la casilla
Anisotropy, fijndola en
True.
Por ahora dejarlos valores
que vienen por defecto y
pulsar Next.
Anlisis Geoestadstico: ajuste del
semivariograma y creacin de mapas.
El paso 4 permite decidir el
nmero de puntos
cercanos a incluir en el
clculo y el tipo de sector
de bsqueda.
Pulsar Next
Anlisis Geoestadstico: ajuste del
semivariograma y creacin de mapas.
En ltima pantalla que se abre es posible ver los valores de los errores
asociados a esta interpolacin.
Valorar si las estimaciones efectuadas son adecuadas.
Estos estadsticos indican si el modelo y los parmetros usados son
adecuados para la variable estudiada y en qu medida es buena la
interpolacin. Unas estimaciones correctas deberan cumplir con lo
siguiente:
Mean y Mean Standardized: prximos a cero.
Root-Mean-Square Standardized: prximo a 1.
Si el valor es mayor estamos infravalorando la variabilidad,
Si el valores menor estamos sobreestimando la variabilidad de nuestras
estimaciones.
Average Standard Error: debera ser parecido al Root-Mean Square.
Si el Average Standard Errores mayor que el Root-Mean Square estamos
sobrevalorando la variabilidad de las estimaciones,
en caso contrario estamos subestimando la variabilidad.
Anlisis Geoestadstico: ajuste del
semivariograma y creacin de mapas.
Ya tenemos un primer mapa de la distribucin de nuestra variable
volvemos atrs y calculamos otros ajustes para nuestro semivariograma.
Crear un mapa con el mismo mtodo y usar otro nmero y tamao de lag.
Aumentar el nmero de puntos incluidos en la estimacin.

Vous aimerez peut-être aussi