Vous êtes sur la page 1sur 37

DEPENDENCIA ESPACIAL

Concepcin G C i Gonzlez Garca (2008) l G

DEPENDENCIA ESPACIAL
Anlisis Exploratorio de Datos Espaciales: OBJETIVO: > Revisar las herramientas para el anlisis de dependencias de las variables de las que se han obtenido datos datos, Como paso previo a la aplicacin de tcnicas de interpolacin espacial.

Anlisis de dependencias l d d d

Los procesos con variables dependientes que evolucionan en el tiempo y/o espacio requieren tcnicas propias de anlisis para modelizarlas y obtener predicciones de valores futuros, (modelos dinmicos). dinmicos)

Teora estadstica para el estudio de modelos dinmicos ( ) (i) Procesos estocsticos, aleatorios o probabilsticos. Estocstico (del griego stokhastes = adivino) ~ lo
que est ligado al azar. t li d l

Estudio de dependencias p Estudio de la variacin del proceso entre dos puntos de T

Teora estadstica para el estudio de modelos dinmicos ( ) (ii) Un proceso estocstico es un conjunto (o p j familia) de variables aleatorias(1) indexadas por un conjunto T, { Xt X(t) / t T }, T de R n } Si T es de R, ser variacin en una dimensin. ( (caso de las series de tiempo) p )
(1) una variable aleatoria (VA) es una variable que puede tomar ciertos valores de acuerdo a cierta distribucin de probabilidades.

Trminos en el tratamiento de la variacin espacial Procesos estacionarios: Atendiendo a su comportamiento al movernos sobre el conjunto de ndices: Bajo traslaciones : La covarianza slo depende de h (vector que une s y t) dos variables Xs y entre s y t.

Bajo rotaciones o istropo: la variacin entre

Xt slo depende de la distancia p

No estacionaridad: por variaciones de la dependencia segn la direccin : anisotropa

Dependencia espacial p p
> La dependencia espacial se considera, desde el p p p , punto de vista de la Geoestadstica, como la prctica de la teora de las variables regionalizadas. Variable regionalizada: -Es una variable aleatoria caracterizada, adems de por , p el conjunto de valores que puede tomar, por su posicin en el espacio. -Desde el punto de vista matemtico, una variable regionalizada, es, simplemente una funcin f(x) que toma valores en todos los puntos x de coordenadas (xi, yi, zi) en el espacio tridimensional.

Variable regionalizada (muestra)


El valor medido en cada punto xi es considerado como una realizacin z(xi) de una VA Z(xi) cuya media es m(xi). El conjunto de todas las mediciones z(x) en el rea de j ( ) estudio de la variable regionalizada se considera como una realizacin particular del conjunto de variables aleatorias: l t i (Z(x), x rea de estudio)

Conceptos de Variable regionalizada (i)


Regin: se refiere al espacio en el cual existe y se estudia el fenmeno natural, geogrfico o sociolgico. Localizacin: Es el punto de una regin en la cual se define una variable aleatoria regionalizada. regionalizada Soporte Geomtrico: determinado por el elemento fsico sobre el cual se realiza la determinacin de la variable aleatoria regionalizada, esto es la muestra unitaria sobre regionalizada es, unitaria, la cual estudiaremos el atributo de inters.

Conceptos de Variable regionalizada (ii)


Momentos de primer orden: Si la funcin de distribucin de Z(xi) tiene una media definida, d fi id ser una f funcin d l l i de la localizacin xi li i m(xi) = E{Z(xi)} Momento de segundo orden: Si la varianza (Var) de Z(xi) existe, entonces se define como el momento de segundo orden y ser tambin una funcin de la localizacin xi Var {Z(xi)} = E{[Z(xi) - m(xi)] 2}

Conceptos de Variable regionalizada (iii)


Si la varianza de las variables Z(xi) y Z(xj) existe entonces su covarianza (Cov) tambin existe y es funcin de las localizaciones xi y xj Cov[Z(xi) Z(xj)] = E{[Z(xi) - m(xi)][Z(xj) - m(xj)]} ), si xi = xj ; Cov[Z(xi), Z(xj)] = Var {Z(xi)}

Conceptos de Variable regionalizada (iv)


La funcin variograma o funcin estructural se define como la varianza de la diferencia Z(xi) - Z(xj) 2 (xi, xj) = V {Z( i) - Z( j)} = 2 (xi, xj) ( i j) Var{Z(x Z(x (

El semivariograma (xi, xj) se define como:


1 ( x i , x j) = E [Z(x i) - Z(x j) ]2 2
O bien,

(xi, xj} = Var{Z(xi) - Z(xj)}

Conceptos de Variable regionalizada (v)


Cuando l f C d la funcin es estrictamente estacionaria (l i ti t t t i i (la funcin de distribucin del vector aleatorio es invariante respecto a cualquier traslacin h del vector) vector), el semivariograma tambin es estacionario y se cumple que:

1 (x + h, x) = (h) = E [Z(x + h) - Z(x) ]2 = V[Z] - C(h) 2


h = distancia entre puntos (lag)

Conceptos de Variable regionalizada (vi)


Tambin se puede definir el correlograma estandarizando, la covarianza para los valores xi - xj = h = 0 como: (h) = C(h)/C(0) ( ) ( ) ( ) donde: C(h) es la covarianza a la distancia h, C(0) es la covarianza en el origen. Existen relaciones entre estas medidas de dependencia: ( } (h} = C(0) - C(h) ( ) ( ) con (0) = 0 ( ) (h) = 1 - (h)/C(0) -1 1

Conceptos de Variable regionalizada (vii)

Cuando la covarianza se expresa en ( p ) funcin de h (distancia entre dos puntos) se llama autocovarianza:

(h) = C(si , si+h ), i T


La distancia h de separacin se llama retardo (lag) (lag).

Hiptesis de la Geoestadstica (i)


La Geoestadstica se construye asumiendo condiciones y de estacionaridad, debido a que la forma en que se presenta la informacin es muy diversa. Estacionaridad Estricta: si la funcin de distribucin de probabilidades de las variables aleatorias regionalizadas Z(xi) es la misma, independiente de la localizacin xi Estacionaridad de Segundo Orden: ms frecuente en la prctica, supone que 1) E{Z(xi)} = m existe y no depende de la localizacin xi. m, 2) La funcin covarianza, Cov{Z(xi) - Z(xj)}, exista y slo dependa de la longitud del vector h = xi - xj o sea sea. C(h) = Cov{Z(xi), Z(xj)} = E{Z(xi), Z(xi+h)} - m2

Hiptesis de la Geoestadstica (ii)


Estacionaridad de Segundo Orden (cont ) (cont.) Esta hiptesis requiere la estacionaridad slo para la media y para la funcin de covarianza de la variable aleatoria regionalizada. La segunda condicin implica, estacionaridad de la implica varianza y del variograma. Se demuestra que, S d t (h) = C(0) - C(h)

De aqu que (h) y C(h), son dos herramientas que p permiten expresar la correlacin entre las variables p aleatorias regionalizadas Z(xi) y Z(xi+h), separadas por

Concepto de Estacionaridad: Ejemplos grficos en R (i) Proceso no estacionario en sentido estricto Cuatro realizaciones de un proceso estocstico
Temperatura

1 2

t+k

480

Tiempo (das) (d )

Concepto de Estacionaridad: Ejemplos grficos en R (ii) Serie no estacionaria:

Serie de demanda semanal de plstico


8400 7400

plastic

6400 5400 4400 0 20 40 60 80 100

Concepto de Estacionaridad: Ejemplos grficos en R (iii) Serie no estacionaria:


Ventas en IBM
610 570

ibm

530 490 450 1/85 1/87 1/89 1/91 1/93 1/95

Serie no estable: Con tendencia (positiva)

Concepto de Estacionaridad: Ejemplos grficos en R (iv)

Series estacionarias: Los valores de la serie oscilan alrededor de un valor constante


Serie estable = estacionaria adj justed ev vapmilk
80 50 20 -10 -40 -70 1/02 1/05 1/08 1/11 1/14 1/17

Hiptesis de la Geoestadstica (iii)


Procesos Cuasiestacionarios: En la prctica la funcin estructural covarianza o estructural, semivariograma, es slo usada por lmites |h| b El lmite b representa la extensin de la regin en la que el fenmeno estudiado conserva cierta homogeneidad del comportamiento de Z(xi) ). En otros casos, b pudiera ser la magnitud de una zona casos homognea y dos variables Z(x) y Z(x+h) no pueden ser consideradas en la misma homogeneizacin de su variabilidad si |h| > b.

Hiptesis de la Geoestadstica (iv)


Estas condiciones de estacionaridad se asumen en el desarrollo terico, en la prctica deben ser verificadas en los datos antes de d comenzar un estudio geoestadstico t di t d ti para l que se puede realizar un anlisis estadstico d lo d li li i t d ti de la informacin, de modo que se pueda tener cierto grado de confiabilidad en la aplicacin de estos mtodos.

El anlisis estructural
Est compuesto por: El clculo del semivariograma experimental experimental. El ajuste a este de un modelo terico conocido. ter co conoc do. El clculo del semivariograma experimental es l l l d l i i i t l la herramienta geoestadstica ms importante en la determinacin de las caractersticas de variabilidad y correlacin espacial del fenmeno estudiado.

El semivariograma experimental (i)


El variograma se define como la media aritmtica de todos los cuadrados de las diferencias entre pares de valores experimentales separados una distancia h p p o lo que es lo mismo, q , Var{Z(x+h)-Z(x)} = 2(h) La varianza de los incrementos de la variable regionalizada en las localizaciones separadas una distancia h.

El semivariograma experimental (ii)


La f L funcin *(h) se d i denomina semivariograma emprico, i i i i puede obtenerse por la expresin.

1 N(h) 2 * (h) = [Z(xi ) Z(xi + h)] 2N(h) i=1


donde: d d N(h) h Z(xi) xi es el nmero de pares a la distancia h. es el incremento (lag) (lag). son los valores observados localizaciones donde son medidos los valores z(xi)

El semivariograma experimental: Ejemplo


Para ilustrar el proceso de clculo se considera un ejemplo sencillo (de Samper y Carrera, 1990): Sea Z la variable definida Carrera sobre un dominio unidimensional que toma los valores :
x 1 2 3 4 5 6 7 8 9 10 11 12 Z(x) 7 10 11 13 12 14 12 13 10 11 9 8 Z(x+1) [Z(x+1) Z(x)]2 [Z(x+1)-Z(x)] 10 9 11 1 13 4 12 1 14 4 12 4 13 1 10 9 11 1 9 4 8 1 N(1)=11 39

x
h=1; [Z(x+1)-Z(x)]2=39

El semivariograma experimental: Ejemplo


El valor estimado del semivariograma, para h=1, resulta ser: 1/2(39/11) = 1,78. El proceso se repite para las parejas distantes dos unidades, etc. El clculo se resume en l siguiente t bl l l la i i t tabla:
h 1 2 3 4 5 6 N(h) [ Z(x
1 N(h ) i

+ h) Z(x i ) ]

*(h) (h)
1,78
*(h)

9 8

11 10 9 8 7 6

39 46 88 89 108 73

7 6

2,30 4,89 5,56 7,71 6,08

5 4 3 2 1 0 1 2 3 4 5 6

El semivariograma experimental (iii)


El grfico de (h) tiene las siguientes caractersticas Pasa por el origen (para h=0, (h)=0) Es en general una funcin creciente de h h. (h)
meseta

alcance l Forma clsica del semivariograma

En la mayor parte de los casos (h) crece hasta cierto lmite llamado meseta, en otros casos puede crecer indefinidamente.

El semivariograma experimental (iv)


El comportamiento en el origen puede tener diferentes formas, las cuales son segn distintos autores: g Parablico: Caracteriza a una variable muy regular, siendo continua y diferenciable (a). Lineal: Caracteriza a una variable continua pero no diferenciable es decir continua, diferenciable, menos regular (b). Discontinuidad en el origen: Efecto de pepita (c), es el caso en que (h) no tiende a cero cuando h tiene a cero Representa a una variable muy cero. irregular. Discontinuo puro: o ruido blanco(d), representa el caso de mayor discontinuidad, discontinuidad es el caso lmite de ausencia de estructura, donde los valores estructura de dos puntos cualesquiera no tienen correlacin alguna.

(h)

(h)

(h)

(h)
h

El semivariograma experimental (v)


En la prctica, y especialmente cuando se trabaja en dos o tres dimensiones, las distancias entre los puntos de cada pareja son distintos y puede no haber dos parejas de puntos situados a la misma di t i P i distancia. Por l t t no es posible aplicar con lo tanto, ibl li fiabilidad la frmula anterior.
Lo que se hace es definir una serie de valores hj y asignar para el clculo de *(hj) todas las parejas cuya distancia est contenida en el intervalo (hj-hj hj+hj) Lo ms comn es (hj-hj, hj). repetir el clculo con varias amplitudes y elegir aqulla que permita una buena definicin del semivariograma, de forma que los l hj no estn t separados que no se pueda di t tan d d discernir, ni t i i tan juntos que el nmero de parejas sea pequeo y las oscilaciones g p del semivariograma experimental resulten excesivas.

Construccin del semivariograma experimental en 2D (i)


Para datos distribuidos en dos dimensiones.
Z(x) una funcin aleatoria con N variables aleatorias regionalizadas Z(xi) donde x = {x, y} es la localizacin y Z(xi) es el valor medido correspondiente.

Aunque el programa lo va a calcular automticamente, los primeros pasos del p proceso son: 1.- Clculo de la cantidad de pares de datos posibles por: Np = N(N-1)/2 2.- Para cada par, clculo de la distancia entre las localizaciones correspondientes 2 2 i = 1, . . . , Np d = X X + Y Y
i

almacenando para cada i: - P1: N Nmero d l primer punto d l par, del del - P2: Nmero del segundo punto del par, - d: Valor de la distancia entre los dos puntos del par. -A Angulo que fij l di l fija la direccin d l recta que pasa por l d i de la t los dos puntos del par.

Construccin del semivariograma experimental en 2D (ii)


Se evala la expresin del semivariograma para todos los pares de localizaciones separadas a l di l li i d la distancia h y que cumplan las condiciones i l l di i siguientes : 1. 1 - La distancia entre las localizaciones xi y xi+h sea mayor que h-dh y menor h dh que h+dh, o lo que es lo mismo, el segundo punto del par est incluido en el espacio definido por h-dh y h+dh encontrndose el primer punto del par en el origen 0 este origen se mueve entre las muestras a analizar analizar.

dh

Espacio definido por la tolerancia lineal

h 0 dh 00

Construccin del semivariograma experimental en 2D (iii)


2.- El ngulo formado entre la lnea que une los dos puntos del par y la direccin 0 d b estar i l id entre -d y +d (fi di i debe incluido d d (figura A ) ). 3.- La distancia entre el segundo punto del par y la lnea que define la direccin de clculo del semivariograma no debe superar el ancho de banda (Deutsch y Journel, 1998) (figura B).
Ancho de banda

dh

d d h 0 dh 00
A) Espacio definido por la tolerancia lineal y angular

Construccin del semivariograma experimental en 2D (iv)


Finalmente se representan grficamente los valores de (h) en p g ( ) funcin de h, en un grfico X-Y donde en la abscisa se representan los valores de h y en la ordenada los de (h). Obteniendo s l semivariograma experimental o emprico Obt ni nd as el s mi i m xp im nt l mp i para una direccin, incremento y tolerancias definidas.

(h)
C Ct C0 a h Parmetros del semivariograma

Problemas ms comunes encontrados en el clculo de semivariograma g El valor idneo del incremento h Distribuciones con valores extremos La existencia de poblaciones mixtas La Por ello es necesario el anlisis exploratorio descriptivo ello, inicial de la informacin.

Fuentes
http://descargas.cervantesvirtual.com/servlet/SirveObr as/46860175104026839600080/006458_8.pdf as/46860175104026839600080/006458 8 pdf Cap.7: Sistemas de Informacin Geogrfica: Pasado, presente y futuro (tesis doctoral) ,p ( ) www.geogra.uah.es/~joaquin/curso-quito/SIG-OdelT.pdf www.monografas com www monografas .com. Elementos de Geoestadstica Geoestadstica. CUADOR GIL, J.Q. Universidad de Pinar del Ro (Cuba).

Vous aimerez peut-être aussi