Vous êtes sur la page 1sur 0

UNIVERSIDAD CENTRAL DE VENEZUELA

FACULTAD DE CIENCIAS
ESCUELA DE MATEMTICA
POSTGRADO EN MODELOS ALEATORIOS



Anlisis Estadstico de Datos de Contaminacin
Ambiental del Lago de Valencia



Trabajo de Grado presentado por el
Lic. Pedro Pacheco para optar al
ttulo de Magster Scientiarum en
Modelos Aleatorios.

Tutor: Dr. Jos Rafael Len.



Caracas, Venezuela
Diciembre de 2008
ii

AGRADECIMIENTO

Este trabajo, si bien ha requerido de mucho esfuerzo y dedicacin no
hubiese sido posible su finalizacin sin la cooperacin de todas y cada una
de las personas que a continuacin citar.
A Dios por estar siempre a mi lado, darme salud, paz, amor, fortaleza e
iluminacin para vencer todos los obstculos y poder as alcanzar esta meta.
A mis padres, hermana y sobrino, porque gracias a sus consejos y apoyo
he logrado alcanzar esta meta. Quiero que estn al tanto que este logro, es
el logro de ustedes y que mi esfuerzo es motivado por ustedes.
A mi novia y amiga Yuceny Mata, porque gracias al fruto del inmenso
apoyo, amor y confianza que en mi depositaste, me ayudo a culminar con
xito el postgrado.
A mi tutor y amigo, Dr. Jos Rafael Len, muchas gracias por todo su
tiempo invertido en la direccin de este trabajo y por confiar en m.
A mi amigo, Dr. Nelson Merentes, por brindarme su ayuda en los
momentos difciles, de verdad muchas gracias por su apoyo.
A toda mi familia, por transmitirme energas positivas durante todo el
postgrado, de verdad que les agradezco mucho por motivarme siempre.
A mis amigos en general, en especial a Jhonny Escalona, Rommel
Gonzlez y Mara Teresa, por sus consejos y apoyo durante el postgrado.
Al Fondo Nacional de Ciencia, Tecnologa e Innovacin, por otorgarme la
beca Misin Ciencia para la realizacin de estos estudios de postgrado.
A la Universidad Central de Venezuela, por brindarme la oportunidad de
culminar el postgrado en dicha institucin.
iii

RESUMEN

En este trabajo, se va a estudiar un conjunto de mediciones efectuadas
en el Lago de Valencia, con el objeto de determinar la contaminacin
ambiental que se presenta en el mencionado lago. Para realizar esta
investigacin aplicamos tcnicas estadsticas modernas como la
geoestadstica que es el estudio de las variables numricas distribuidas en el
espacio (Chauvet, 1994), series temporales entendida como un conjunto de
tcnicas estadsticas que permiten, adems de estudiar y modelar el
comportamiento de un fenmeno que evoluciona a lo largo del tiempo,
realizar previsiones de los valores que se alcanzarn en el futuro, y el
anlisis de fluctuacin sin tendencia, el cual es un mtodo que cuantifica la
presencia o ausencia de correlaciones de largo alcance (Ho, 1997). Con la
aplicacin de las tcnicas estadsticas modernas, se puede obtener una
mejor comprensin de los datos de muestras de agua y temperatura tomadas
en el Lago de Valencia.
Es importante sealar, que las mediciones han sido tomadas de distintas
estaciones de monitoreo ubicadas en el Lago de Valencia, y captadas de
acuerdo a parmetros tcnicos establecidos. Partiendo del conjunto de
mediciones tomadas, se van a realizar las siguientes actividades; en primer
lugar predecir los valores de las sustancias en posiciones no
muestreadas, en esta parte haremos uso de las tcnicas de la
geoestadstica para predecir la concentracin de sustancias posiblemente
contaminantes en sitios donde no se haya muestreado, y en segundo lugar
ajustar un modelo adecuado para predecir valores futuros de la
temperatura y determinar si existen correlaciones de largo alcance en
las series temperaturas, para realizar esto usamos las teoras de series de
tiempo y anlisis de fluctuacin sin tendencia. A travs de la realizacin de
las actividades sealadas, se va a lograr determinar una parte de la
iv

contaminacin ambiental que presenta el Lago de Valencia. Estos resultados


pueden ser considerados por los organismos competentes en el rea, al
momento de buscar soluciones que ayuden a mantener el equilibrio
ambiental del Lago de Valencia.

























v

NDICE

LISTA DE FIGURAS.... ix
LISTA DE TABLAS.. xvii
INTRODUCCIN..... 1
1 GEOESTADSTICA
1.1 Variables aleatorias regionalizadas. 5
1.2 Hiptesis de la geoestadstica... 7
1.3 Conceptos necesarios de estadstica bsica.. 7
1.3.1 Estadstica descriptiva. 7
1.3.2 Construccin de grficos estadsticos.. 11
1.4 El semivariograma experimental.. 12
1.5 Problemas ms comunes encontrados en el clculo de
semivariograma... 17
1.6 Parmetros del semivariograma... 19
1.7 Modelos tericos de semivariogramas 21
1.7.1 Modelo Efecto de Pepita. 21
1.7.2 Modelo Esfrico 21
1.7.3 Modelo Exponencial 22
1.7.4 Modelo Gaussiano... 23
1.7.5 Modelo Potencia... 24
vi

1.8 Validacin del modelo terico... 25


1.9 Anlisis de anisotropa... 26
1.10 Estimacin.. 27
1.11 Ecuaciones del krigeaje... 28
1.11.1 Krigeaje Simple.. 29
1.11.2 Krigeaje Ordinario.. 29
2 ANLISIS GEOESTADSTICO
2.1 rea de estudio... 32
2.2 Recoleccin de los datos... 33
2.3 Anlisis geoestadstico... 34
2.4 Anlisis exploratorio de los datos. 36
2.5 Anlisis estructural. 45
2.6 Predicciones 70
2.6.1 Nitrgeno Total. 72
2.6.2 Nitrato. 74
2.6.3 Clorofila a 75
2.7 Evolucin temporal de la clorofila a.. 75
2.7.1 Clorofila a, ao 1998. 77
2.7.2 Clorofila a, ao 1999. 78
2.7.3 Clorofila a, ao 2001. 80
vii

2.7.4 Clorofila a, ao 2002. 81


2.7.5 Clorofila a, ao 2004. 83
2.8 Prediccin idnea... 83
3 SERIES TEMPORALES Y ANLISIS DE FLUCTUACIN SIN
TENDENCIA
SERIES TEMPORALES
3.1 Conceptos de series de tiempo. 87
3.2 Componentes de una serie de tiempo 89
3.3 Modelos de series temporales.. 90
3.3.1 Modelos de medias mviles (MA).. 94
3.3.2 Modelos autorregresivos (AR).... 95
3.3.3 Modelos autorregresivos de medias mviles (ARMA)... 95
3.3.4 Modelos autorregresivos integrado de medias mviles
(ARIMA).... 96
ANLISIS DE FLUCTUACIN SIN TENDENCIA
3.4 Correlaciones de corto alcance 97
3.5 Correlaciones de largo alcance 98
3.6 Anlisis de fluctuacin sin tendencia..... 99
4 ESTUDIO DE LAS SERIES TEMPERATURAS Y APLICACIN
DEL ANLISIS DE FLUCTUACIN SIN TENDENCIA
4.1 Recoleccin de los datos... 104
viii

4.2 Metodologa.. 104


4.3 Anlisis preliminar de las series temperaturas.. 106
4.4 Ajuste de modelos... 117
4.5 Predicciones 121
4.6 Anlisis de fluctuacin sin tendencia. 123
CONCLUSIONES Y RECOMENDACIONES.... 126
BIBLIOGRAFA 129













ix

LISTA DE FIGURAS

Figura N Pgina
1 Carcter mixto de una funcin aleatoria. 3
2 Espacio definido por la tolerancia lineal..... 14
3 Espacio definido por la tolerancia lineal y angular....... 15
4 Espacio definido por las tolerancias y el ancho de banda... 15
5 Forma tpica del semivariograma...... 16
6 Comportamiento del semivariograma en el origen, a. Parablico,
b. Lineal, c. Efecto de Pepita, d. Discontinuo Puro.... 17
7 Parmetros del semivariograma........ 19
8 Modelo Efecto de Pepita..... 21
9 Modelo Esfrico... 22
10 Modelo Exponencial...... 23
11 Modelo Gaussiano..... 24
12 Modelo Potencia..... 24
13 Anisotropa Geomtrica y Zonal respectivamente.... 27
14 Efecto Proporcional.... 27
15 Localizacin geogrfica del Lago de Valencia...... 32
16 Superficie del Lago de Valencia con sus estaciones de monitoreo
y tributarios.... 33
17 Grficos de caja para las variables nitrgeno total y nitrito..... 37
x

18 Grficos de caja para las variables nitrato y fsforo total..... 37


19 Grfico de caja para la variable clorofila a....... 38
20 Histograma para la variable nitrgeno total........ 40
21 Histograma para la variable nitrito....... 40
22 Histograma para la variable nitrato....... 41
23 Histograma para la variable fsforo total..... 41
24 Histograma para la variable clorofila a..... 42
25 Posiciones de las observaciones en el plano XY para la variable
nitrgeno total (la unidad de medida es mg/l).. 45
26 Posiciones de las observaciones en el plano XY para la variable
nitrito (la unidad de medida es mg/l). 46
27 Posiciones de las observaciones en el plano XY para la variable
nitrato (la unidad de medida es mg/l).... 46
28 Posiciones de las observaciones en el plano XY para la variable
fsforo total (la unidad de medida es mg/l).. 47
29 Posiciones de las observaciones en el plano XY para la variable
Clorofila a (la unidad de medida es mg/m
3
)... 47
30 Posiciones de las observaciones en el espacio para la variable
nitrgeno total .. 48
31 Posiciones de las observaciones en el espacio para la variable
nitrito.. 49
32 Posiciones de las observaciones en el espacio para la variable
nitrato..... 49
xi

33 Posiciones de las observaciones en el espacio para la variable


fsforo total 50
34 Posiciones de las observaciones en el espacio para la variable
Clorofila a 50
35 Nube de variogramas para la variable nitrgeno total...... 51
36 Muestras contiguas en el plano XY para la variable nitrgeno
total. 52
37 Nube de variogramas para la variable nitrito..... 54
38 Nube de variogramas para la variable nitrato.... 55
39 Nube de variogramas para la variable fsforo total.. 55
40 Nube de variogramas para la variable clorofila a... 56
41 Estructura del semivariograma omnidireccional para la variable
nitrgeno total (tomando como incremento inicial h = 2)....... 59
42 Estructura del semivariograma omnidireccional para la variable
nitrgeno total (tomando como incremento inicial h = 2 y
eliminando los valores extremos).. 60
43 Estructura del semivariograma omnidireccional para la variable
nitrgeno total (tomando como incremento inicial h = 2.12)..... 60
44 Estructura del semivariograma omnidireccional para la variable
nitrgeno total (tomando como incremento inicial h = 2.12 y
eliminando los valores extremos).. 61
45 Estructura del semivariograma omnidireccional para la variable
nitrgeno total (tomando como incremento inicial h = 2.36)..... 62
xii

46 Estructura del semivariograma omnidireccional para la variable


nitrgeno total (tomando como incremento inicial h = 2.36 y
eliminando los valores extremos).. 62
47 Estructura del semivariograma omnidireccional para la variable
nitrito (tomando como incremento inicial h = 2.12 y eliminando
los valores extremos)... 63
48 Estructura del semivariograma omnidireccional para la variable
nitrato (tomando como incremento inicial h = 2.36 y eliminando
los valores extremos)....... 64
49 Estructura del semivariograma omnidireccional para la variable
fsforo total (tomando como incremento inicial h = 2 y eliminando
los valores extremos)... 64
50 Estructura del semivariograma omnidireccional para la variable
clorofila a (tomando como incremento inicial h = 2.36 y
eliminando los valores extremos).. 65
51 Modelo gaussiano ajustado a los datos del semivariograma
omnidireccional para la variable nitrgeno total..... 68
52 Modelo efecto de pepita ajustado a los datos del semivariograma
omnidireccional para la variable nitrito..... 68
53 Modelo gaussiano ajustado a los datos del semivariograma
omnidireccional para la variable nitrato.... 69
54 Modelo efecto de pepita ajustado a los datos del semivariograma
omnidireccional para la variable fsforo total.. 69
55 Modelo esfrico ajustado a los datos del semivariograma
omnidireccional para la variable clorofila a... 70
xiii

56 Rejilla de datos estimados para la variable nitrgeno total..... 71


57 Mapa de contornos para la variable nitrgeno total con la
superficie del Lago de Valencia y su tabla de niveles de
concentracin. . 71
58 Imagen de contornos para la variable nitrgeno total con la
superficie del Lago de Valencia y su tabla de niveles de
concentracin. . 72
59 Mapa de contornos para la variable nitrato con la superficie del
Lago de Valencia y su tabla de niveles de concentracin................ 73
60 Imagen de contornos para la variable nitrato con la superficie del
Lago de Valencia y su tabla de niveles de concentracin.... 73
61 Mapa de contornos para la variable clorofila a con la superficie
del Lago de Valencia y su tabla de niveles de concentracin. 74
62 Imagen de contornos para la variable clorofila a con la superficie
del Lago de Valencia y su tabla de niveles de concentracin..... 75
63 Mapa de contornos para la variable clorofila a con la superficie
del Lago de Valencia y su tabla de niveles de concentracin (ao
1998)................................................................................................. 76
64 Imagen de contornos para la variable clorofila a con la superficie
del Lago de Valencia y su tabla de niveles de concentracin (ao
1998)................................................................................................. 76
65 Mapa de contornos para la variable clorofila a con la superficie
del Lago de Valencia y su tabla de niveles de concentracin (ao
1999)................................................................................................. 77
xiv

66 Imagen de contornos para la variable clorofila a con la superficie


del Lago de Valencia y su tabla de niveles de concentracin (ao
1999)...... 78
67 Mapa de contornos para la variable clorofila a con la superficie
del Lago de Valencia y su tabla de niveles de concentracin (ao
2001)................................................................................................. 79
68 Imagen de contornos para la variable clorofila a con la superficie
del Lago de Valencia y su tabla de niveles de concentracin (ao
2001)................................................................................................. 79
69 Mapa de contornos para la variable clorofila a con la superficie
del Lago de Valencia y su tabla de niveles de concentracin (ao
2002)................................................................................................. 80
70 Imagen de contornos para la variable clorofila a con la superficie
del Lago de Valencia y su tabla de niveles de concentracin (ao
2002)................................................................................................. 81
71 Mapa de contornos para la variable clorofila a con la superficie
del Lago de Valencia y su tabla de niveles de concentracin (ao
2004)................................................................................................. 82
72 Imagen de contornos para la variable clorofila a con la superficie
del Lago de Valencia y su tabla de niveles de concentracin (ao
2004)................................................................................................. 82
73 Mapa de contornos idneo para la variable clorofila a con la
superficie del Lago de Valencia y su tabla de niveles de
concentracin................................................................................... 84
xv

74 Imagen de contornos idneo para la variable clorofila a con la


superficie del Lago de Valencia y su tabla de niveles de
concentracin......................................................................... 84
75 Se divide el perfil de la serie en ventanas de longitud k, y para
cada ventana se realiza ajustes lineales que constituye la
tendencia local.................................................................................. 101
76 Grficos de caja de las series temperaturas para las estaciones
Sucre y Tacarigua respectivamente.......... 106
77 Histograma de la serie temperaturas para la estacin Sucre..... 108
78 Histograma de la serie temperaturas para la estacin Tacarigua.. 108
79 Q-Q plot para la distribucin normal aplicada a la serie
temperaturas para la estacin Sucre.... 109
80 Q-Q plot para la distribucin normal aplicada a la serie
temperaturas para la estacin Tacarigua..... 109
81 Grfico de secuencia de la serie temperaturas para la estacin
Sucre...... 110
82 Grfico de secuencia de la serie temperaturas para la estacin
Tacarigua...... 111
83 Grficos de cajas por da de la serie temperaturas para la
estacin Sucre.. 112
84 Grficos de cajas por da de la serie temperaturas para la
estacin Tacarigua.. 112
85 Funcin de autocorrelacin parcial de la serie temperaturas
para la estacin Sucre. 114
xvi

86 Funcin de autocorrelacin parcial de la serie temperaturas


para la estacin Tacarigua. 115
87 Grfico de dispersin por nivel de temperatura por da para la
estacin Sucre.. 116
88 Grfico de dispersin por nivel de temperatura por da para la
estacin Tacarigua.. 116
89 Funcin de autocorrelacin simple de la serie diferenciada
para la estacin Sucre. 117
90 Funcin de autocorrelacin parcial de la serie diferenciada
para la estacin Sucre..... 118
91 Funcin de autocorrelacin simple de la serie diferenciada
para la estacin Tacarigua. 118
92 Funcin de autocorrelacin parcial de la serie diferenciada
para la estacin Tacarigua. 119
93 Modelo AR(4) ajustado a la serie temperaturas para la estacin
Sucre y su prediccin.. 121
94 Modelo AR(7) ajustado a la serie temperaturas para la estacin
Tacarigua y su prediccin... 122
95 Grfico log-log del resultado del anlisis AFST para la estacin
Sucre.. 123
96 Grfico log-log del resultado del anlisis AFST para la estacin
Tacarigua.. 124
xvii

LISTA DE TABLAS

Tabla N Pgina
1 Valores de las sustancias por estacin... 36
2 Estadstica descriptiva para las sustancias. 39
3 Prueba de normalidad Shapiro-Wilks.. 43
4 Modelos de regresin lineal mltiple para evaluar la
estacionaridad.. 44
5 Muestras contiguas y sus distancias... 52
6 Muestras y localizaciones de valores extremos en el grfico
de nube.. 54
7 Muestras contiguas y sus distancias para cada una de las
variables 57
8 Muestras y localizaciones de valores extremos en los grficos
de nube para cada variable 58
9 Parmetros de los modelos ajustados para los datos de los
semivariogramas omnidireccionales 66
10 Estadstica descriptiva para las series temperaturas 107
11 Medida de tendencia central para cada periodo de tiempo. 113
12 Parmetros de los modelos ajustados para las series
temperaturas. 120
13 Valores del exponente de escala

obtenidos de los ajustes


lineales de las fig. 95 y 96. 124
1

INTRODUCCIN

En la actualidad ha aumentado incontrolablemente la contaminacin
ambiental producto de las actividades llevadas a cabo por el hombre. Las
aguas de ros, mares, lagos, etc. se han visto afectadas por la
contaminacin, producto de los vertidos de desechos industriales y de aguas
servidas.
Gran parte de los desechos que contaminan las aguas son consecuencia
de las actividades econmicas, y a pesar del significado social que ellas
tienen en la generacin de riquezas, se debe tomar conciencia sobre la
contaminacin ambiental que ellas causan y as buscar soluciones que
ayuden a mantener el equilibrio ambiental.
En Venezuela, el Lago de Valencia est presentando un alto ndice de
contaminacin ambiental, producto de las grandes descarga de sustancias
qumicas que se realizan en los complejos industriales, las zonas
residenciales y agrcolas que lo bordean. Estos desechos son vertidos por la
mayora de los ros tributarios del referido lago. Esta situacin ha provocado
un desequilibrio ambiental y con ello una serie de problemas ecolgicos.
En tal sentido, nos proponemos estudiar a travs de la aplicacin de
tcnicas estadsticas modernas como la geoestadstica, series temporales y
anlisis de fluctuacin sin tendencia, un conjunto de mediciones hechas en el
Lago de Valencia para la determinacin de su contaminacin ambiental.
Dentro de este marco, el resultado de nuestra investigacin se ha dividido
en los siguientes captulos:
En el captulo I, que lleva por nombre Geoestadstica, se presenta los
elementos conceptuales de esta ciencia con sus distintos componentes, la
aplicacin de esta teora nos va a permitir en primer lugar, estudiar las
2

mediciones de las sustancias muestreadas en el Lago de Valencia sin tener
en cuenta su distribucin geogrfica, en segundo lugar, calcular el
semivariograma experimental, en tercer lugar, ajustar al mismo el
semivariograma terico que mejor explica la variabilidad espacial de los
datos, y por ltimo se toma en consideracin los modelos ajustados para
predecir los valores de las sustancias en posiciones no muestreadas, usando
el mtodo de krigeaje puntual.
En el captulo II, denominado Anlisis Geoestadstico, se exponen los
resultados arrojados de la aplicacin de la teora Geoestadstica a los datos
de muestras de agua, as como tambin algunas consideraciones y
comentarios sobre los diferentes resultados.
El captulo III, titulado Series Temporales y Anlisis de Fluctuacin sin
Tendencia, se desarrollan las teoras de Series Temporales y Anlisis de
Fluctuacin sin Tendencia con sus distintos componentes. La aplicacin de
estos conceptos nos va a permitir ajustar un modelo adecuado para predecir
valores futuros de una serie temporal y detectar la presencia o ausencia de
correlaciones de largo alcance en una serie, es por esto que se suelen usar
estas teoras en economa (mercados financieros), adems de en diversas
disciplinas cientficas y de la ingeniera.
En el captulo IV, que se titula Estudio de las Series Temperaturas y
Aplicacin del Anlisis de Fluctuacin sin Tendencia, se presentan los
resultados obtenidos luego de aplicarles a los datos de temperatura las
teoras de Series Temporales y Anlisis de Fluctuacin sin Tendencia. Es
importante sealar, que para complementar los anlisis efectuados, se
presentan algunas consideraciones y comentarios sobre lo obtenido.



3

CAPTULO 1
GEOESTADSTICA

La Geoestadstica se define como la aplicacin de la Teora de Funciones
Aleatorias al reconocimiento y estimacin de fenmenos naturales (Journel y
Huijbregts, 1978), o simplemente, el estudio de las variables numricas
distribuidas en el espacio (Chauvet, 1994), siendo una herramienta til en el
estudio de estas variables (Zhang, 1992). Su punto de partida es asumir una
intuicin topo-probabilista (Matheron, 1970). Los fenmenos distribuidos en
el espacio, la mineralizacin en un yacimiento mineral por ejemplo, presentan
un carcter mixto, un comportamiento catico o aleatorio a escala local, pero
a la vez estructural a gran escala (figura 1).

Figura 1. Carcter mixto de una funcin aleatoria

Se puede entonces sugerir la idea de interpretar este fenmeno en
trminos de Funcin Aleatoria (FA), es decir, a cada punto x del espacio se le
asocia una Variable Aleatoria (VA) Z(x), para dos puntos diferentes x e y, se
tendrn dos VAs Z(x) y Z(y) diferentes pero no independientes, y es
precisamente su grado de correlacin el encargado de reflejar la continuidad
de la mineralizacin, o de cualquier otro fenmeno en estudio, de modo que
4

el xito de esta tcnica es la determinacin de la funcin de correlacin
espacial de los datos (Zhang, 1992). Su estimador, el Krigeaje, tiene como
objetivo encontrar la mejor estimacin posible a partir de la informacin
disponible, y en efecto, el valor estimado obtenido Z*(x) de un valor real y
desconocido Z(x), consiste en una combinacin lineal con pesos asociados a
cada localizacin donde fue muestreado un valor Z(x
i
) (i = 1,,n) del
fenmeno estudiado. Observando dos condiciones fundamentales: 1.- que el
estimador sea insesgado. E(Z* - Z) = 0, y 2.- que la varianza Var(Z* - Z) sea
mnima, consiguindose de este modo minimizar la varianza de error de
estimacin.

A diferencia de otros mtodos de interpolacin, como por ejemplo el
inverso de la distancia, el krigeaje utiliza en la estimacin las caractersticas
de variabilidad y correlacin espacial del fenmeno estudiado, por lo que su
uso implica un anlisis previo de la informacin con el objetivo de definir o
extraer de esta informacin inicial un modelo que represente su continuidad
espacial. Una vez logrado esto, estamos en condiciones de obtener el mejor
valor posible en cada localizacin o bloque a estimar a partir de los datos
medidos, acompaada de la varianza de krigeaje como medida del error de
la estimacin realizada (Armstrong y Carignan, 1997), lo que distingue al
krigeaje de otros mtodos de interpolacin (Abasov et al., 1990; de Fouquet,
1996; Carr, 1995).

En este sentido, son referidos a continuacin los conceptos y la
aplicabilidad de los distintos componentes que comprende la teora
geoestadstica.



5

1.1 Variables aleatorias regionalizadas
Una variable aleatoria regionalizada, es una funcin que describe un
fenmeno natural geogrficamente distribuido (Ovalles, 1991). La
caracterstica fundamental que distingue a este tipo de variables, adems de
su valor, es una posicin en el espacio, hecho ste al que Matheron
denomin Variable Aleatoria Regionalizada (Matheron, 1970), la cual est
presente en la mayor parte de los estudios geolgicos (Pawlowsky et al.,
1995) y fenmenos naturales (de Fouquet, 1996).

En el estudio de las variables aleatorias regionalizadas es importante
presentar conceptos que se sealan en Journel y Huijbregts (1978) y David
(1977) y que son utilizados por la mayora de los autores donde se aplican
los mtodos geoestadsticos como herramienta fundamental de trabajo.
Estos conceptos son:
Regin: se refiere al espacio en el cual existe y se estudia el
fenmeno natural.
Localizacin: Es el punto de una regin en la cual se define una
variable aleatoria regionalizada.
Soporte Geomtrico: Est determinado por el elemento fsico
sobre el cual se realiza la determinacin de la variable aleatoria
regionalizada, esto no es ms que la muestra unitaria, sobre la
cual estudiaremos el atributo de inters.
Momentos de primer orden: Si la funcin de distribucin de Z(x
i
)
tiene una media definida, ser una funcin de la localizacin x
i
.
m(x
i
) = E(Z(x
i
)).
Momento de segundo orden: Si la varianza (Var) y la esperanza
de Z(x
i
) existe, entonces se define el momento de segundo orden
6

como E(Z(x
i
)
2
) = Var(Z(x
i
)) + [E(Z(x
i
)]
2
y ser tambin una funcin
de la localizacin x
i
.
La covarianza (Cov) de las variables Z(x
i
) y Z(x
j
) se define como
Cov(Z(x
i
),Z(x
j
)) = E([Z(x
i
) - E(Z(x
i
))][Z(x
j
) - E(Z(x
j
))]) y es funcin de
las localizaciones x
i
y x
j
.
Si x
i
= x
j
, entonces Cov(Z(x
i
),Z(x
i
)) = Var(Z(x
i
)).
La funcin variograma o funcin estructural se define como la
varianza de la diferencia Z(x
i
) - Z(x
j
), o sea
Var(Z(x
i
) - Z(x
j
)) = 2(x
i,
,x
j
).
La magnitud (x
i,
,x
j
) = Var(Z(x
i
) - Z(x
j
)) se denomina
semivariograma.
Tambin se puede definir el correlograma como
(h) = C(h)/C(0), -1 (h) 1 donde C(h) es la covarianza a la
distancia h y C(0) es la covarianza en el origen.
Existen relaciones entre estas medidas de correlacin:
(h) = C(0) - C(h) con (0) = 0
(h) = 1 - (h)/C(0).
Esta nocin puede ser definida siempre y cuando el proceso
espacial Z sea estacionario al orden dos. Es decir la media sea
constante y la covarianza entre Z(x) y Z(y) slo dependa de la
diferencia x - y.



7

1.2 Hiptesis de la geoestadstica
La forma en que se presenta la informacin es muy diversa (Journel y
Huijbregts, 1978), la geoestadstica se construye asumiendo condiciones de
estacionaridad. Por lo que es necesario aceptar el cumplimiento de ciertas
hiptesis sobre el carcter de la funcin aleatoria o procesos estocsticos
estudiados, llamadas Hiptesis de la Geoestadstica. Estas son segn
Journel y Huijbregts (1978) y David (1977): La Estacionaridad Estricta, La
Estacionaridad de Segundo Orden, La Hiptesis Intrnseca y los Procesos
Cuasiestacionarios.

En la prctica segn Armstrong y Carignan (1997) y Chica (1987) las
hiptesis que ms se presentan son: La Estacionaridad de Segundo Orden y
la Hiptesis Intrnseca. Estas condiciones de estacionaridad se asumen en el
desarrollo terico, en la prctica deben ser verificadas en los datos antes de
comenzar un estudio geoestadstico, por lo que se puede realizar un anlisis
estadstico de la informacin, de modo que se refleje el grado de
confiabilidad en la aplicacin de estos mtodos.

1.3 Conceptos necesarios de estadstica bsica
Con el objetivo de conocer la informacin disponible se puede hacer un
anlisis de la estadstica descriptiva (Krajewski y Gibbs, 1993; Journel y
Huijbregts, 1978; David, 1977). A continuacin se presenta un resumen de
los conceptos necesarios de estadstica bsica.
1.3.1 Estadstica descriptiva: Permite determinar la distribucin de los
datos, los ejemplos ms comunes son: normal, lognormal, etc.
Tambin se puede usar para ver si los datos no se ajustan a una
distribucin estadstica. Para los anlisis es necesario tener
conocimiento de:
8

Nmero de casos: Es el nmero de valores muestreados del
fenmeno en estudio, representados por n y los datos por x
i
,
i = 1,,n. El conjunto de valores lo llamamos muestra. Este
conjunto permite construir la distribucin emprica.
Amplitud de la distribucin: Es la diferencia entre el valor
mximo y el mnimo.
Media muestral: Es la media aritmtica de los valores de la
muestra, dada por la frmula:
1
1
n
i
n
i
x x
=
=


Moda: Es el valor ms frecuente de la distribucin. La moda
puede no existir, e incluso no ser nica en caso de existir.
Mediana: Es el valor para el cual la mitad de los datos son
menores y la otra mitad estn por encima de este valor. Si
ordenamos los datos de la muestra en orden ascendente
podemos calcular la mediana como:
1
2
1
2 2
2
n
n n
x si n es impar
M
x x
si n es par
+
+

=

La mediana es tambin llamada percentil 50, adems los
datos no slo se dividen en dos grupos, sino que se pueden
dividir en cuatro partes, cuartiles, donde Q
1
= percentil 25,
Q
2
= Mediana y Q
3
= percentil 75, si los datos se dividen en 10,
9

tenemos los deciles. De forma general estas medidas se
pueden calcular por: [p(n+1)/100] sima observacin de los
datos ordenados ascendentemente, donde p es el percentil que
se desea calcular.
Varianza muestral: Describe la variabilidad de la distribucin
muestral. La varianza muestral utiliza a la media
x
como el
parmetro de la muestra respecto el cual se mide la
concentracin de los datos. La varianza muestral est dada por:
( )
2
1
2
1
1
n
i
n
i
x x
S

=
=


La razn principal por la que se aboga por la divisin entre
n-1 en la estimacin de la varianza, es porque proporciona un
mejor estimado; si dividimos por n-1 nos referimos a la varianza
muestral S
2
como un estimador insesgado de la varianza
poblacional
2
.
Desviacin estndar muestral: Describe la tendencia o
dispersin de la distribucin muestral. Es la medida de
desviacin alrededor de la media y est dada por:
2
S S =

Coeficiente de asimetra: Describe la simetra de la
distribucin relativa a la distribucin normal y est dada por:
( )
3
1
1
3 3
n
i
n
i
x x
S

=

10

En la distribucin normal la asimetra tiene valor
asintticamente cero, un valor negativo indica una cola a la
izquierda y un valor positivo indica una cola a la derecha.
Curtosis: Describe el grado de esbeltez de la distribucin,
tomado por lo general en relacin a una distribucin normal, y
est dada por:
( )
4
1
1
4 4
n
i
n
i
x x
S

=

La distribucin normal tiene curtosis igual a tres, y es
llamada mesocrtica. A las distribuciones ms agudas, con
colas relativamente anchas, se les llama leptocrticas, tienen
valores de curtosis mayores que tres, y las distribuciones ms
bien achatadas en el centro se llaman platicrticas, tienen
valores menores que tres, en ocasiones se acostumbra a definir
la curtosis como
4
- 3.
Error estndar: Describe el grado de conocimiento de los
datos y est dada por:
S
n
=

Coeficiente de variacin: Es una medida de la variacin
relativa de los datos y est dada por:
S
CV
x
= y en
porcentaje como: 100 100 %
S
CV
x
= .
11

Proporciona una comparacin entre la variacin de grandes
valores y la variacin de pequeos valores. Las tcnicas de
Geoestadstica Lineal que predominan en el campo de las
geociencias producen los mejores resultados cuando el
coeficiente de variacin es menor que uno, CV < 1. Para CV > 1
se recomiendan tcnicas de Geoestadstica no Lineal (Cuador,
2004).
Prueba Chi-Cuadrado: Esta prueba permite determinar si la
distribucin es normal, lognormal o alguna otra distribucin
probabilstica, en su lugar puede ser usada la prueba
Kolmogorov-Smirnov. Muchos autores la consideran ms
robusta.
Prueba Shapiro-Wilks: Esta prueba es menos conocida pero
es la que se recomienda para contrastar el ajuste de datos a
una distribucin normal, sobre todo cuando la muestra es
pequea (Molinero, 2003).
1.3.2 Construccin de grficos estadsticos: Estos grficos permiten
ilustrar y entender las distribuciones de los datos, identificar datos
errados, valores extremos, incluyen:
Grficos de caja: Son grficos que suministran informacin
sobre la mediana, el primer y tercer cuartil, sobre la existencia
de datos atpicos y la simetra de la distribucin. Adems son
muy populares porque proporcionan de manera visual toda esta
informacin.
Histogramas: Son usados para ver las caractersticas
descriptivas de la distribucin. Es un grfico de barras donde en
12

las abscisas aparecen los lmites de las clases y en las
ordenadas las frecuencias correspondientes a cada clase.
Q-Q plots: Son una herramienta visual para comparar la
distribucin de dos conjuntos de datos. Si las distribuciones en
cuestin estn relacionadas por un cambio de ubicacin y
escala, la grfica ser aproximadamente recta. En la grfica de
un Q-Q plot se representan los cuantiles de una distribucin
contra los cuantiles correspondiente de la otra.

Todos estos elementos permiten decidir sobre las condiciones de
estacionaridad vistas anteriormente. Muchos autores slo toman como
elementos fundamentales de estadstica bsica que la media y la mediana
tomen valores prximos; el coeficiente de variacin sea inferior a 1; la
distribucin de los datos se ajuste a la curva normal y no existan valores
extremos que afecten el desarrollo del anlisis estructural.

1.4 El semivariograma experimental
El variograma se define como la media aritmtica de todos los cuadrados
de las diferencias entre pares de valores experimentales separados por una
distancia h (Journel y Huijbregts, 1978), o lo que es lo mismo, la varianza de
los incrementos de la variable regionalizada en las localizaciones separadas
por una distancia h.
Var(Z(x) - Z(x+h)) = 2(h)

La funcin (h) = Var(Z(x) - Z(x+h)) se denomina semivariograma, una
versin experimental (o muestral) puede ser obtenida por la expresin:
13

( )
( )
2
1

( ) ( ( ) ( ))
2
p
N h
i i
i 1
p
h Z x Z x h
N h

=
= +


Donde N
p
(h) es el nmero de pares a la distancia h, h es el incremento,
Z(x
i
) son los valores experimentales y x
i
localizaciones donde son medidos
los valores Z(x
i
).
Esta expresin

( ) h
representa la herramienta ms importante en todo
estudio geoestadstico (Armstrong y Carignan, 1997; Weerts, y Bierkens,
1993; Chica, 1987). Su clculo no consiste en una simple evaluacin de su
expresin, segn se plantea en (Krajewski y Gibbs, 1993; Journel y
Huijbregts, 1978; David, 1977; Xie y Myers, 1995a; Pannatier, 1993) esta
operacin est relacionada con los elementos siguientes:
La direccin en la que ser calculado el semivariograma, uno o dos
ngulos que definen una direccin y/o en el espacio con
tolerancias angulares d y/o d. El semivariograma calculado
usando tolerancia angular de 90 se denomina semivariograma
omnidireccional. El clculo de un semivariograma
omnidireccional, proporciona una idea inicial de variabilidad
espacial de los datos, siendo el ms idneo para representar u
obtener una estructura clara y definida. El semivariograma
omnidireccional se puede pensar como el promedio de los distintos
posibles semivariogramas experimentales que se pueden realizar
para diferentes direcciones.
El incremento o paso en el clculo del semivariograma h y su
tolerancia lineal dh, se recomienda que el incremento h inicial sea
la distancia promedio entre las muestras contiguas y el valor de dh
sea la mitad del incremento inicial.
14

Una distancia, que representa la distancia mxima a que pueden
estar alejados los segundos puntos del par con respecto a la lnea
que define la direccin de clculo, conocido como ancho de banda.
La distancia L
mx
hasta la cual ser calculado el semivariograma.
Se recomienda que sta sea la mitad de la distancia entre las
muestras ms alejadas (Armstrong y Carignan, 1997; Krajewski y
Gibbs, 1993), aunque dependiendo de la geometra del fenmeno
regionalizado en algunos casos puede ser calculado hasta una
distancia superior.

Definido los elementos anteriores, se evala la expresin del
semivariograma para todos los pares de localizaciones separadas a la
distancia h que cumplan las siguientes condiciones:
a. La distancia entre las localizaciones x
i
y x
i
+h sea mayor o igual que
h-dh y menor que h+dh, o lo que es lo mismo, el segundo punto del
par est incluido en el espacio definido por h-dh y h+dh
encontrndose el primer punto del par en el origen o (figura 2),
este origen se mueve entre las muestras a analizar.

Figura 2. Espacio definido por la tolerancia lineal
15

b. El ngulo formado entre la lnea que une los dos puntos del par y
la direccin 0
o
debe estar incluido entre -d y +d (figura 3).


Figura 3. Espacio definido por la tolerancia lineal y angular

c. La distancia entre el segundo punto del par y la lnea que define la
direccin de clculo del semivariograma no debe superar el ancho
de banda (Deutsch y Journel, 1998) (figura 4).

Figura 4. Espacio definido por las tolerancias y el ancho de banda

16

Finalmente se representan grficamente los valores de

( ) h
en funcin
de h.

El grfico de (h) tiene las siguientes caractersticas segn (Armstrong y
Carignan, 1997; Krajewski y Gibbs, 1993; Curran y Atkinson, 1998) (figura 5).
Pasa por el origen (para h = 0, (h) = 0).
Es en general una funcin creciente de h.

Figura 5. Forma tpica del semivariograma

En la mayor parte de los casos (h) crece hasta cierto lmite llamado
meseta, en otros casos puede crecer indefinidamente. El comportamiento en
el origen puede tener diferentes formas, las cuales son segn Journel y
Huijbregts (1978), Armstrong y Carignan (1997), Chica (1987) (figura 6):
Parablico: Caracteriza a una variable muy regular, siendo
continua y diferenciable.
Lineal: Caracteriza a una variable continua, pero no diferenciable,
es decir menos regular.
17

Discontinuidad en el origen: Efecto de Pepita, es el caso en
que (h) no tiende a cero cuando h tiende a cero. Representa a
una variable muy irregular.
Discontinuo puro: Llamado tambin ruido blanco, representa el
caso de mayor discontinuidad, siendo el caso limite de ausencia de
estructura, donde los valores de dos puntos cualesquiera no tienen
correlacin alguna.

Figura 6. Comportamiento del semivariograma en el origen, a. Parablico, b.
Lineal, c. Efecto de Pepita, d. Discontinuo Puro

1.5 Problemas ms comunes encontrados en el clculo de
semivariograma
De lo expresado hasta aqu, adems de lo planteado en muchos textos de
geoestadstica, se puede obtener la impresin de que es fcil el clculo del
semivariograma experimental (Armstrong y Carignan, 1997). La fuente de
problemas que se pueden presentar en la realizacin de un anlisis
estructural es muy variada, lo que est en correspondencia con la variedad
de casos que se presentan en la naturaleza. Algunos de los problemas ms
comunes discutidos en Armstrong y Carignan (1997) son:
18

El valor idneo del incremento h: Una inadecuada seleccin de
h puede proporcionar un semivariograma experimental errtico,
aunque no se puede dar un criterio exacto o aproximado sobre
cul es el mejor valor de h, es recomendable calcular

( ) h
para
distintos valores de h, hasta encontrar una forma suavizada del
mismo.
Distribuciones con valores extremos: La existencia de valores
extremos, altos o bajos, en una distribucin, puede conducir a la
obtencin de un variograma fuertemente errtico. En este caso la
solucin puede ser simple, eliminar los datos extremos, porque
pueden ser ocasionados por errores. Una herramienta til para
detectar valores extremos y encontrar el incremento adecuado
puede ser, calculando la Nube de Variogramas (Armstrong y
Carignan, 1997), el cual consiste en representar los valores de h
contra
2
( ( ) ( ))
2
i i
Z x Z x h +
, para cada par posible de la
informacin inicial. Ntese que la nube de variogramas no debe ser
calculada con valores de h ms grande que la mitad de los pares
ms alejados en el conjunto de datos. Tambin es importante
saber que un valor extremo sera un punto en el grfico de nube
que es mucho ms alto o bajo que los otros puntos para esa
distancia.

En Krajewski y Gibbs (1993) se presentan otras razones por los que los
semivariogramas son errticos, las cuales son: 1.- No hay suficientes
muestras, 2.- Las muestras no son representativas del fenmeno, 3.- Las
clasificaciones de las muestras no son vlidas, 4.- El rea estudiada es no
homognea, 5.- Pequeos o largos conjuntos de datos son necesarios, 6.-
19

Pequeas o largas distancia deben ser calculadas, 7.- Ms o menos
distancias deben ser calculadas, 8.- Pequeas tolerancias son necesarias,
9.- Las muestras pueden tener localizaciones incorrectas, 10.- Los valores
muestreados pueden ser errneos.
El problema fundamental en la obtencin de un semivariograma correcto
es, la eleccin adecuada de los intervalos de distancias para los cuales ser
calculado el semivariograma, de modo que en stos la cantidad de pares
encontrados sea suficiente desde el punto de vista estadstico.

1.6 Parmetros del semivariograma
Los parmetros del semivariograma caracterizan tres elementos
importantes en la variabilidad de un atributo que son: la discontinuidad en el
origen (existencia de efecto de pepita), el valor mximo de variabilidad
(meseta), y el rea de influencia de la correlacin (alcance), (figura 7). Como
se presentan en Krajewski y Gibbs (1993), Journel y Huijbregts (1978), David
(1977), Echaabi (1995), Lamorey y Jacobsom (1995), Wallace y Hawkims
(1994), Pannatier (1993), Arik (1990), Pitard (1994), y se describen a
continuacin.

Figura 7. Parmetros del semivariograma

20

El Efecto de Pepita (Nugget Effect): El semivariograma por
definicin es nulo en el origen, pero en la prctica las funciones
obtenidas pueden presentar discontinuidad en el origen, a esta
discontinuidad se le llama efecto de pepita, en ingles (nugget
effect). Puede ser obtenido trazando una lnea recta entre los
primeros puntos del semivariograma emprico y extender sta
hasta que se intercepte con el eje Y. Si esta interseccin ocurre
por debajo de cero, el valor asumido por este efecto es cero, pues
valores negativos de (0) no tienen significado y no son comunes.
El efecto de pepita se representa como C
o
.
La Meseta (Sill): Es el valor de (h) para el cual con el aumento de
h su valor permanece constante, se representa como C
t
= C + C
o

y se denomina meseta. Puede obtenerse trazando una lnea
paralela a la abscisa y que se ajuste a los puntos de mayor valor
del semivariograma, su valor se lee en la interseccin de esta lnea
con la ordenada.
El Alcance (Range): La distancia h para la cual las variables Z(x)
y Z(x+h) son no correlacionadas, se denomina alcance y se
representa por a, es decir, las distancias para la cual los valores de
la variable dejan de estar correlacionados, o lo que es lo mismo, la
distancia para la cual el semivariograma alcanza su meseta. El
alcance siempre tiene valor positivo y puede ser obtenido a partir
de la interseccin de las lneas descritas en los puntos anteriores,
ese punto ledo en la abscisa es una fraccin del propio alcance,
fraccin que se detallara posteriormente en la explicacin de los
modelos tericos.


21

1.7 Modelos tericos de semivariogramas
Los modelos tericos de semivariogramas admisibles o autorizados ms
utilizados en la prctica se presentan en Journel y Huijbregts (1978).
Atendiendo a las dos caractersticas ms importantes en el modelado de
semivariogramas que son segn Journel y Huijbregts (1978): 1.- Su
comportamiento en el origen, el cual puede ser lineal, parablico y con efecto
de pepita y 2.- La presencia o ausencia de meseta. Estos modelos son:
1.7.1 Modelo Efecto de Pepita: Corresponde a un fenmeno puramente
aleatorio (ruido blanco), sin correlacin entre las muestras,
cualquiera sea la distancia que las separe (figura 8), donde C
representa el valor de la meseta.
( )
0 0
C 0
si h
h
si h

=
=




Figura 8. Modelo Efecto de Pepita

1.7.2 Modelo Esfrico: Este modelo es probablemente el ms utilizado,
es una expresin polinomial simple, en su forma representada en
la figura 9, se puede observar un crecimiento casi lineal y despus
22

a cierta distancia finita del origen se alcanza una estabilizacin, la
meseta. La tangente en el origen encuentra a la meseta en el
punto de abscisa (2/3)a, donde a representa el valor del alcance.
( )
3
3
3 1
C a
2 a 2 a
C a
h h
si h
h
si h


=
>



Figura 9. Modelo Esfrico

1.7.3 Modelo Exponencial: Este modelo a diferencia del esfrico crece
inicialmente ms rpido y despus se estabiliza de forma asinttica
(figura 10). Como la meseta no se alcanza a una distancia finita, se
usa con fines prcticos el alcance efectivo o alcance prctico a,
valor que se obtiene en el punto de abscisa para el cual el modelo
obtiene el 95% de la meseta, con un valor a = 3a, donde a es el
23

parmetro de escala. La tangente en el origen encuentra a la
meseta en el punto a = (1/3)a.
( )
a
C 1
h
h e






=



Figura 10. Modelo Exponencial

1.7.4 Modelo Gaussiano: Este es un modelo muy regular (figura 11),
inicialmente presenta un comportamiento parablico en el origen,
despus al igual que en el modelo Exponencial se alcanza la
meseta de forma asinttica. El alcance prctico tiene un valor de
a = 1.73a, que es el valor de la abscisa donde se alcanza el 95%
de la meseta.
( )
2
2
a
C 1
h
h e






=


24


Figura 11. Modelo Gaussiano

1.7.5 Modelo Potencia: Este es un modelo sin meseta y sin alcance, su
forma se representa en la figura 12, para valores de
correspondientes a 0.5, 1 y 1.5. Este modelo representa
fenmenos no estacionarios.
( )
( ) 0, 2 0 h m h con y m es el factor de escala

=



Figura 12. Modelo Potencia

Para el valor de = 1 en el modelo anterior se obtiene el
modelo Lineal, el cual no tiene ni meseta ni alcance.
25

Se han presentado los modelos ms usados en la prctica, aunque se
debe sealar que existen otros modelos.
La seleccin del modelo y sus parmetros debe seguir fielmente los
aspectos que se suponen importantes del semivariograma experimental
(Wackernagel, 1995), que sern usados en la interpolacin geoestadstica
que veremos posteriormente, adems, esta seleccin es fundamental en el
estudio geoestadstico. Muchos autores se refieren al efecto negativo que
pudiera tener la estimacin con el uso del krigeaje sin un estudio de
estructura espacial y la seleccin adecuada del modelo de semivariograma y
sus parmetros.

1.8 Validacin del modelo terico
El ajuste de los modelos tericos al semivariograma experimental, se
puede realiza de forma visual o interactiva, variando los valores C
o
(efecto de
pepita), C + C
o
(meseta) y a (alcance), hasta coincidir con los parmetros
que mejor se ajustan; despus se valida el modelo seleccionado y los
parmetros meseta y alcance escogidos.

Tambin se puede realizar el ajuste de los modelos tericos al
semivariograma experimental de forma automtica. Este ajuste ha sido
presentado por varios autores, en la que se sugieren aplicar los mtodos de
mnimos cuadrados, bondad de ajuste u otras variantes, para as validar el
modelo y sus parmetros, teniendo en cuenta que el modelo obtenido sea
definido positivo, es decir que ajustemos realmente un semivariograma.
Ntese que no siempre se verifica la condicin de que el semivariograma
ajustado sea siempre de tipo positivo, siendo insatisfactorio (Genton, 1998),
por lo que se recomienda el uso de modelos autorizados. La efectividad de
estos se describe y argumenta en Gotway (1991) y Zhang (1995). Un criterio
26

decisivo, independiente de la forma utilizada en la eleccin del modelo
terico y sus parmetros, es sin lugar a dudas, emplear los mtodos de
mnimos cuadrados, bondad de ajuste u otras variantes.

1.9 Anlisis de anisotropa
Conviene aqu realizar un anlisis sobre el comportamiento de la
variabilidad del atributo en estudio. Se conoce que el semivariograma
describe las caractersticas de continuidad espacial de la variable
regionalizada en una direccin, pero este comportamiento pueden variar
segn la direccin que se analice, como se discute en Journel y Huijbregts
(1978), David (1977), Zimmerman (1993), Krajewski y Gibbs (1993). Se exige
por este motivo un anlisis del comportamiento de la continuidad en distintas
direcciones, el Anlisis de Anisotropa.

Cuando el semivariograma calculado en diferentes direcciones (norte-sur,
este-oeste, y en direcciones intermedias de 45 o de 22.5, con tolerancia de
22.5
o
), muestra similar comportamiento, se dice que el fenmeno es
Isotrpico, cuando muestran diferentes comportamientos es Anisotrpico
(Krajewski y Gibbs, 1993). Los tipos de anisotropas ms comunes son la
Geomtrica y la Zonal (Krajewski y Gibbs, 1993; Journel y Huijbregts, 1978;
Armstrong y Carignan, 1997).
Anisotropa Geomtrica: Est presente cuando los
semivariogramas en diferentes direcciones tienen la misma meseta
pero distintos alcance (figura 13).
Anisotropa Zonal: Est presente cuando los semivariogramas en
diferentes direcciones tienen diferentes mesetas y alcances (figura
13).
27


Figura 13. Anisotropa Geomtrica y Zonal respectivamente

Otro tipo de anisotropa que existe, es el efecto proporcional que est
presente cuando los semivariogramas en diferentes direcciones tienen el
mismo alcance pero distintas mesetas (figura 14).

Figura 14. Efecto Proporcional

1.10 Estimacin
Todo lo expresado hasta aqu tiene un nico objetivo, conocer la
informacin disponible para realizar estimaciones (Journel y Huijbregts, 1978;
David, 1977; Armstrong y Carignan, 1997), es decir, estimar valores
desconocidos a partir, no slo de los conocidos, sino tambin de su
estructura de continuidad espacial.

28

El krigeaje, es un interpolador de la geoestadstica, que utiliza los
resultados discutidos en el anlisis estructural. Inicialmente, Matheron
denomin a esta tcnica Krigeage (en francs) que en ingles se convierte en
Kriging y en espaol se escribe Krigeaje. Este trmino que tiene su origen
en el apellido de D.G. Krige, reconociendo de esta forma su aporte. El
krigeaje es una tcnica de estimacin que proporciona el mejor estimador
lineal imparcial (BLUE, en ingles, Best Linear Unbiased Estimator), (Schaug
et al.,1993; Christensen et al.,1993; Abasov et al., 1990), y que adems
proporciona un error de estimacin conocido como varianza de krigeaje que
depende del modelo de semivariograma obtenido y de las localizaciones de
los datos originales (Armstrong y Carignan, 1997; Journel y Huijbregts, 1978;
David, 1977; Abasov et al., 1990). Esto brinda la posibilidad de hacer anlisis
sobre la calidad de las estimaciones (Weerts y Bierkens, 1993; Haas, 1992).

1.11 Ecuaciones del krigeaje
Se dispone de los valores muestreados Z(x
i
), i = 1,,n, y deseamos
estimar un valor de la caracterstica observada en el panel Z(v) por una
combinacin lineal de Z(x
i
).
*
1
( ) ( )
n
i i
i
Z v Z x
=
=


Donde Z*(v) es el valor estimado y
i
son los pesos de krigeaje, de modo
que los
i
sean obtenidos de tal forma que proporcione un estimador:
insesgado E(Z*(v) - Z(v)) = 0 y de varianza mnima Var(Z*(v) - Z(v)).

La estimacin en geoestadstica por el krigeaje exige como primera etapa
y fundamental, el conocimiento del comportamiento estructural de la
informacin, es decir, se debe contar con el modelo de semivariograma
29

terico que refleje fielmente las caractersticas de variabilidad y correlacin
espacial de la informacin disponible.

Las ecuaciones del krigeaje se obtienen de acuerdo a las hiptesis de la
geoestadstica que deben ser supuestas y verificadas como ya se indic.
Teniendo en cuenta las hiptesis de la geoestadstica se pueden obtener las
ecuaciones del krigeaje para los siguientes casos: funcin aleatoria
estacionaria de esperanza nula o conocida, mtodo conocido como Krigeaje
Simple, para una funcin aleatoria estacionaria de esperanza desconocida, y
una funcin aleatoria intrnseca, mtodo conocido como Krigeaje Ordinario. A
continuacin se presenta el sistema krigeaje para estos casos:
1.11.1 Krigeaje Simple
Estimador:
*
1
1
( ) ( ) 1
n
n
i i i
i
i
Z v Z x m
=
=

= +



, donde
E(Z(v)) = m y m es conocida
Sistema:
( )
1
( )
n
j i i j
i
C x v C x x
=
=

, j = 1,,n
Varianza de Krigeaje:
( )
2
1
0 ( )
n
i i
k
i
C C x v
=
=



1.11.2 Krigeaje Ordinario

En trminos de la covarianza
Estimador:
( )
( )
*
1
n
i i
i
Z v Z x
=
=


30

Sistema:
( ) ( )
1
n
j i i j
i
C x v C x x
=
=

, j = 1,,n
donde

es el multiplicador de Lagrange y
1
1
n
i
i

=
=


Varianza de Krigeaje:
( )
( )
2
1
0
n
i i
k
i
C C x v
=
= +



En trminos del semivariograma
Estimador:
( )
( )
*
1
n
i i
i
Z v Z x
=
=


Sistema:
( ) ( )
1
n
j i i j
i
x v x x
=
= +

, j = 1,,n
donde

es el multiplicador de Lagrange y
1
1
n
i
i

=
=


Varianza de Krigeaje:
( )
2
1
n
i i
k
i
x v
=
= +



En todos los casos el sistema puede ser escrito matricialmente de la
forma:
0 0 0
= (1)
Donde
( )
1
0
, , ,
t
n
= K ,

es el multiplicador de Lagrange que


asegura que
1
1
n
i
i

=
=

,
0 1
( ( ), , ( ),1)
t
n
v x v x = K ,

31

0
( ) 1,..., , 1, ,
1 1 , 1, ,
0 1 , 1
i j
x x si i n j n
si i n j n
si i n j n

= =
= = + =
= + = +
K
K y
0
es una
matriz simtrica de orden (n+1) x (n+1).

La ecuacin (1) es equivalente a:

( ) ( )
( ) ( )
( ) ( )
( )
( )
( )




1 0 1 1 1 1
1 0
1 0
1 0
2
1
2
1
2 1
2 1 2
1 2 1
n n n n
n
n
x v
x v
x v
x x x x
x x x x
x x x x




M M
K
M M K M M
K
K


Por ltimo tenemos el intervalo de prediccin que est dado por:
* *
( ( ) 1.96 , ( ) 1.96 )
k k
A Z v Z v = + , donde este intervalo A
es un intervalo de confianza con un nivel de confianza de 95% para Z(v).
Bajo la suposicin de que Z(v) es gaussiano, se satisface que
P(Z(v) A) = 95%.








32

CAPTULO 2
ANLISIS GEOESTADSTICO

2.1 rea de estudio
El Lago de Valencia es el lago de agua dulce natural sin desage al mar
ms grande de Venezuela, est situado en la parte centro-norte del pas en
una cuenca endorreica que cubre 2646 Km
2
, equivalente a 0.29% del
territorio de Venezuela. El Lago se form por una depresin existente entre la
Cordillera de la Costa y la Serrana del Interior. Las principales islas dentro
del Lago son: el Burro, Otama, Caiguire, el Horno, el Zorro y el Bagre. Su
rea de superficie se estima en 350 km
2
con un volumen de 6.3 km
3
,
profundidad mxima est cerca de 40 m con una profundidad promedio de
18 m, la longitud de la lnea de costa es aproximadamente 117 km
(http://www.ilec.or.jp/database/sam/sam-05.html).


Figura 15. Localizacin geogrfica del Lago de Valencia
33


Figura 16. Superficie del Lago de Valencia con sus estaciones de monitoreo
y tributarios


2.2 Recoleccin de los datos
Para realizar el anlisis geoestadstico se tomaron en los aos 1998,
1999, 2001, 2002 y 2004 muestras de agua en las estaciones de monitoreo
ubicadas en el Lago de Valencia, dichas muestras fueron captadas a travs
de botellas especficas, por el Laboratorio de Calidad Ambiental del estado
Aragua del MANR, de acuerdo al parmetro o los parmetros a ser
analizados, con la debida preparacin (Valles, 2005).

Luego las botellas fueron llevadas al Laboratorio de Calidad Ambiental
adscrito a la Direccin General Estadal Ambiental Aragua - Ministerio del
Ambiente y de los Recursos Naturales (MARN), donde se les aplic la
espectrometra de absorcin atmica, la cual es una tcnica analtica para la
determinacin de elementos basada en la absorcin de energa radiante por
34

tomos libres en su estado basal. La cantidad de energa es medible y es
proporcional a la concentracin de tomos que la absorben (Loon V. y
Barfoot, 1989. Laboratorio de Geoqumica).

Es necesario mencionar, que en algunas estaciones de monitoreo fueron
tomadas varias muestras de agua, en las cuales se hallaron diferentes
valores en la medicin de una misma sustancia, lo que nos llev a
promediarlas para obtener un valor nico por estacin, ya que el estudio
requiere tener un dato por estacin para poder aplicar las tcnicas
geoestadsticas. Estos datos son las que se analizan en el presente captulo,
y el propsito central es predecir los valores de las sustancias en
posiciones no muestreadas. Sin embargo, es importante sealar que en
este captulo nos limitamos a trabajar con las siguientes sustancias:
nitrgeno total, nitrito, nitrato, fsforo total y clorofila a. Esta seleccin se
realiz al azar dentro del grupo de sustancias posiblemente contaminantes,
que se encuentran en el Lago de Valencia.


2.3 Anlisis geoestadstico
Empleamos las tcnicas geoestadsticas expuestas en el marco terico,
para las estimaciones de los valores de las sustancias en localizaciones
donde no se tiene informacin. El anlisis geoestadstico se llev a cabo en
tres etapas:
a. Anlisis exploratorio de los datos. En esta etapa, se estudian
los datos sin tener en cuenta su distribucin geogrfica, o sea se
realizan grficos de caja para detectar observaciones atpicas,
utilizando el software Matlab 7, luego se efecta un anlisis
estadstico descriptivo, histogramas y una prueba Shapiro-Wilks
para verificar si las muestras provienen de una poblacin normal,
35

por ltimo se realiza una prueba de significacin para comprobar la
estacionaridad en las muestras, para todo esto se utiliza el
programa SPSS 15.
b. Anlisis estructural. Durante esta etapa, se lleva a cabo el
estudio de la continuidad espacial de la variable. Se calcula el
semivariograma experimental y luego se ajusta al mismo, el
semivariograma terico que mejor explica la variabilidad espacial
de los datos. Esto se efecta utilizando el paquete geoestadstico
Variowin.
c. Predicciones. En esta ltima etapa, se realizan las estimaciones
de las variables en los puntos no mustrales, considerando la
estructura de correlacin espacial seleccionada e integrando la
informacin que se obtiene de forma directa en los puntos
mustrales, as como la que se consigue indirectamente en forma
de tendencias conocidas. Para estas predicciones se utiliza el
paquete geoestadstico Surfer 8.












36

2.4 Anlisis exploratorio de los datos

En la tabla 1 se presenta la distribucin de la muestra por estacin para el
ao 2004.

Tabla 1. Valores de las sustancias por estacin
Variable
Estacin
Nitrgeno
Total
(mg/l)
Nitrito
(mg/l)
Nitrato
(mg/l)
Fsforo
Total
(mg/l)
Clorofila
a
(mg/m
3
)
N 0 1.9 0.2 0.44 0.97 71
N 3 3.4 0.01 0.1 0.95 32
N 5 1.3 0.19 0.1 0.91 41
N 6 3.65 0.19 0.1 0.82 78.5
N 12A 2.63 0.29 1.07 0.97 20
N 16 1.3 0.01 0.35 0.96 93
N 17 1.53 0.2 0.39 0.92 37
N 20 3.51 0.09 0.95 0.93 43
N 24 2.27 0.88 0.88 0.93 39
N 33 4.65 0.21 0.1 1.09 67
N 34 1.5 0.37 0.1 0.71 76
N 39 10.3 0.01 0.1 0.92 82.5
N 40 2.8 0.01 0.1 0.82 50

Ntese que la unidad de medida para las variables nitrgeno total, nitrito,
nitrato y fsforo total es el miligramos por litro (mg/l), mientras que para la
variable clorofila a es el miligramos por metro cbico (mg/m
3
). Es
37

importante resaltar que para el ao 2004 no se tom muestras en las
estaciones nmero 2, 4A, 7 y 25.
Veamos si se cumple la estacionaridad en las muestras. Primero
realizamos los grficos de caja para cada variable, esto con la finalidad de
verificar si existen observaciones atpicas en las variables.


Figura 17. Grficos de caja para las variables nitrgeno total y nitrito




Figura 18. Grficos de caja para las variables nitrato y fsforo total
38


Figura 19. Grfico de caja para la variable clorofila a


En estos grficos de cajas observamos algunas flechas indicando las
observaciones atpicas, o sea la variable fsforo total tiene dos
observaciones atpicas que son 0.71 y 1.09. Tambin se pudo hallar en cada
una de las variables nitrgeno total y nitrito una observacin atpica, las
cuales son 10.3 y 0.88 respectivamente. Ahora eliminamos estas
observaciones de la tabla 1 y hallamos los estadsticos de estas nuevas
variables.









39

Tabla 2. Estadstica descriptiva para las sustancias
Variable
Estadstico Nitrgeno
Total
Nitrito Nitrato Fsforo
Total
Clorofila
a
Media 2.54 0.15 0.37 0.92 56.15
Mediana 2.45 0.19 0.1 0.93 50
Moda 1.3 0.01 0.1
0.82, 0.92,
0.93 y 0.97
No Existe
Varianza 1.19 0.02 0.13 0.003 522.93
Desviacin
Estndar
1.09 0.14 0.36 0.05 22.87
Coeficiente de
Variacin
0.43 0.93 0.97 0.05 0.41
Error Estndar 0.31 0.04 0.1 0.02 6.34
Mnimo 1.3 0.01 0.1 0.82 20
Mximo 4.65 0.37 1.07 0.97 93
Amplitud 3.35 0.36 0.97 0.15 73
Coeficiente de
Asimetra
0.52 0.22 1.1 -1.26 0.1
Curtosis -0.7 -0.88 -0.35 0.7 -1.33
Primer Cuartil 1.51 0.01 0.1 0.91 38
Tercer Cuartil 3.48 0.21 0.66 0.96 77.25

En esta tabla se aprecia que todas las variables tienen coeficiente de
variacin menor que uno, adems observamos que los valores de la media y
la mediana estn cercanos en cada una de las variables. Ahora realizamos
40

histogramas para ver si la distribucin de los datos de cada variable se ajusta
a la curva normal.


Figura 20. Histograma para la variable nitrgeno total




Figura 21. Histograma para la variable nitrito
41


Figura 22. Histograma para la variable nitrato




Figura 23. Histograma para la variable fsforo total
42


Figura 24. Histograma para la variable clorofila a


Observando estos histogramas notamos rpidamente que la distribucin
de los datos de cada variable no se ajusta a la curva normal, esto puede
estar pasando puesto que tenemos muy pocos datos en cada variable. Ahora
bien sabemos que para muestras pequeas se puede utilizar la prueba de
normalidad Shapiro-Wilks (S.W.), as que aplicamos esta prueba para ver
qu ocurre y planteamos la prueba de la siguiente manera: H
0
: la
distribucin de los datos se ajusta a la curva normal Vs H
a
: la distribucin
de los datos no se ajusta a la curva normal. A continuacin presentamos en
la tabla 3 la prueba de normalidad Shapiro-Wilks.






43

Tabla 3. Prueba de normalidad Shapiro-Wilks
Variable
Estadstico
S.W.
Valor p
Nitrgeno Total 0.92 0.32
Nitrito 0.88 0.09
Nitrato 0.98 0.29
Fsforo Total 0.97 0.39
Clorofila a 0.94 0.47

Para esta prueba se tom un nivel de significancia = 0.05. Ntese que la
hiptesis nula H
0
se rechaza si el valor p < 0.05 y se acepta si el
valor p > 0.05. Ahora si se considera esto y se observa la tabla, se concluye
que aceptamos la hiptesis nula H
0
en cada una de las variables, es decir, la
distribucin de los datos de cada variable se ajusta a la curva normal, lo que
nos parece indicar que tenemos muestras que provienen de una poblacin
normal. Es importante explicar el por qu queremos ver que los datos se
ajusten a una distribucin normal, esto es debido a que los resultados de
prediccin son ms precisos con esta distribucin de probabilidad que con
otra.

Veamos ahora si se cumple la estacionaridad en las muestras. La
estacionaridad considera que el nivel promedio de la variable debe ser
constante en todos los puntos del rea de estudio, es decir, no deben existir
tendencias (Giraldo, 2003). El cumplimiento de la estacionaridad se verifica
de acuerdo a la metodologa que consiste en el desarrollo de modelos de
regresin lineal mltiple de la forma: variable = a + bX + cY, en las cuales se
describe la relacin entre la variable dependiente y dos variables
independientes, donde X y Y corresponden a las coordenadas planas. Para
44

establecer la estacionaridad a partir de los modelos de regresin se realiza la
prueba de significacin para determinar si la regresin es no significativa, es
decir, si las variables regresoras no aportan nada a la variable de respuesta.
Esta prueba de significacin se plantea de la siguiente forma: H
0
: b = c = 0
Vs H
a
: b 0 c 0. A continuacin presentamos en la tabla 4 los modelos
de regresin lineal mltiple para evaluar la estacionaridad.

Tabla 4. Modelos de regresin lineal mltiple para evaluar la estacionaridad
Modelo R
2
(%) Valor p
Nitrgeno Total = 2.55 0.04X + 0.06Y 11 0.59
Nitrito = 0.13 + 0.007X - 0.008Y 22.7 0.31
Nitrato = 0.42 + 0.008X - 0.02Y 7.8 0.67
Fsforo Total = 0.92 + 0.004X - 0.005Y 46.9 0.08
Clorofila a = 40.04 + 0.58X + 1.13Y 13.5 0.48

Ntese que para el clculo de esta tabla se seleccion un nivel de
significancia = 0.05, adems la hiptesis nula H
0
se rechaza si el
valor p < 0.05 (modelo de regresin significativo) y se acepta si el
valor p > 0.05 (modelo de regresin no significativo). Como se puede
observar en esta tabla los R
2
de los modelos son bajos. Sin embargo, con
base en el valor p se puede apreciar que los modelos de todas las variables
son no significativos, es decir, no existen tendencias y en consecuencia se
cumple la estacionaridad en las muestras. Esto nos indica que los mejores
modelos tericos que se ajustaran a los semivariogramas experimentales
tendrn los parmetros meseta y alcance finito.


45

2.5 Anlisis estructural

En la figura 16 observamos la superficie del Lago de Valencia y sus
estaciones de monitoreo, de aqu se toma como centroide estas estaciones,
esto con la finalidad de conocer las coordenadas X e Y. Luego de conocer
las coordenadas X e Y de los centroides, se colocan las observaciones de
cada variable y una orientacin de los datos como se muestra en las
siguientes figuras.


Figura 25. Posiciones de las observaciones en el plano XY para la variable
nitrgeno total (la unidad de medida es mg/l)



46


Figura 26. Posiciones de las observaciones en el plano XY para la variable
nitrito (la unidad de medida es mg/l)




Figura 27. Posiciones de las observaciones en el plano XY para la variable
nitrato (la unidad de medida es mg/l)
47


Figura 28. Posiciones de las observaciones en el plano XY para la variable
fsforo total (la unidad de medida es mg/l)




Figura 29. Posiciones de las observaciones en el plano XY para la variable
Clorofila a (la unidad de medida es mg/m
3
)
48

En estas figuras observamos muchas posiciones en la cuadrcula donde
no se tienen valores de las sustancias, pues son pocas las estaciones con
respecto a la superficie del Lago, por esta razn estimamos estos valores
con el mtodo de krigeaje puntual, pero antes debemos calcular los
semivariogramas omnidireccionales. No hallamos los semivariogramas
direccionales puesto que los resultados son deficientes y esto es debido a
que en cada variable no existen valores a la distancia h, como se puede ver
las observaciones de cada variable estn irregularmente espaciados. Ahora
bien antes de calcular los semivariogramas omnidireccionales, veremos el
posicionamiento de las observaciones de cada variable en el espacio.



Figura 30. Posiciones de las observaciones en el espacio para la variable
nitrgeno total



49


Figura 31. Posiciones de las observaciones en el espacio para la variable
nitrito




Figura 32. Posiciones de las observaciones en el espacio para la variable
nitrato
50


Figura 33. Posiciones de las observaciones en el espacio para la variable
fsforo total




Figura 34. Posiciones de las observaciones en el espacio para la variable
Clorofila a
51

Ahora se hallan las nubes de variogramas para cada una de las variables.


Figura 35. Nube de variogramas para la variable nitrgeno total


La distancia mxima de un par de observaciones en la variable nitrgeno
total es 21.63, entonces 21.63 / 2 = 10.82 11, por esta razn vemos en el
grfico de nube que el mximo valor que puede tomar h es 11 (recuerde que
la nube de variogramas y el semivariograma experimental no deben ser
calculados con valores de h ms grande que la mitad de los pares ms
alejados en el conjunto de datos). Es importante resaltar que gracias a este
grfico de nube podemos conocer las muestras contiguas y sus distancias.





52

Tabla 5. Muestras contiguas y sus distancias
Variable Nitrgeno Total
Z(x
i
) Z(x
i
+h) h
1.3 1.5 2
1.53 1.3 2
4.65 1.5 2.24
1.53 1.5 2.83



Figura 36. Muestras contiguas en el plano XY para la variable nitrgeno total

Por la teora desarrollada anteriormente sabemos lo siguiente:
El incremento h inicial se recomienda como la distancia promedio
entre las muestras contiguas.
No se puede dar un criterio exacto o aproximado sobre cul es el
mejor incremento h inicial, por lo que es recomendable calcular
53

( ) h
para distintos valores de h, hasta encontrar una forma
suavizada del semivariograma experimental.

Ahora bien, tomando en cuenta todo esto, los posibles incrementos
inciales son: h = 2, h = (2+2.24) / 2 = 2.12 y h = (2+2.24+2.83) / 3 = 2.36.

Si tomamos h = 2, entonces la tolerancia dh es 1, los intervalos de
distancia son: [1,3); [3,5); [5,7); [7,9) y [9,11). La cantidad de
intervalos de distancia y de puntos a procesar en el
semivariograma experimental es 5.
Si tomamos h = 2.12, entonces la tolerancia dh es 1.06, los
intervalos de distancia son: [1.06,3.18); [3.18,5.3); [5.3,7.42) y
[7.42,9.54). La cantidad de intervalos de distancia y de puntos a
procesar en el semivariograma experimental es 4.
Si tomamos h = 2.36, entonces la tolerancia dh es 1.18, los
intervalos de distancia son: [1.18,3.54); [3.54,5.9); [5.9,8.26) y
[8.26,10.62). La cantidad de intervalos de distancia y de puntos a
procesar en el semivariograma experimental es 4.

En este grfico de nube tambin se observan tres flechas indicando los
valores extremos altos, la cual debemos identificar para extraerlos en el
clculo del semivariograma omnidireccional. A continuacin presentamos en
la tabla 6 las muestras que nos proporcionan estos valores extremos altos y
las localizaciones en el grfico de nube.



54

Tabla 6. Muestras y localizaciones de valores extremos en el grfico de nube
Variable Nitrgeno Total
Z(x
i
) Z(x
i
+h) h
2
( ( ) ( ))
2
i i
Z x Z x h +
4.65 1.5 2.24 4.96
1.53 4.65 4.12 4.87
4.65 1.3 4.12 5.61


Ahora procedemos de la misma manera para las otras variables.


Figura 37. Nube de variogramas para la variable nitrito
55


Figura 38. Nube de variogramas para la variable nitrato




Figura 39. Nube de variogramas para la variable fsforo total
56


Figura 40. Nube de variogramas para la variable clorofila a


Para las variables nitrito, nitrato y clorofila a, la distancia mxima de un
par de observaciones es 21.63, mientras que para la variable fsforo total es
21.1, lo que justifica que h llegue hasta 11 en los anteriores grficos de nube.
Ntese adems que en estos grficos de nube se puede ver una lnea
punteada, que es la lnea de covarianza. Ahora presentamos en la tabla 7 las
muestras contiguas y sus distancias para cada variable.









57

Tabla 7. Muestras contiguas y sus distancias para cada una de las variables
Variable Z(x
i
) Z(x
i
+h) h
Nitrito
0.2 0.01 2
0.01 0.37 2
0.21 0.37 2.24
0.2 0.37 2.83
Nitrato
0.39 0.35 2
0.35 0.1 2
0.1 0.1 2.24
0.39 0.1 2.83
Fsforo Total
0.92 0.96 2
Clorofila a
93 76 2
37 93 2
67 76 2.24
37 76 2.83

Observando la tabla se concluye que los posibles incrementos inciales
para las variables nitrito, nitrato y clorofila a son: h = 2, h = 2.12 y h = 2.36,
mientras que para la variable fsforo total es h = 2. Por otra parte, si
apreciamos detalladamente el grfico de nube para la variable nitrato,
notaremos que la mayora de los valores se concentran por debajo de la
lnea de covarianza para distancias menores que h = 5 y para distancias
mayores o iguales a h = 5 se concentran por arriba, por esta razn existen
valores extremos altos y bajos, como lo indican las flechas. En la siguiente
58

tabla mostramos los valores extremos y las localizaciones de los valores
extremos en los grficos de nube para cada variable.

Tabla 8. Muestras y localizaciones de valores extremos en los grficos de
nube para cada variable
Variable Z(x
i
) Z(x
i
+h) h
2
( ( ) ( ))
2
i i
Z x Z x h +

Nitrito
0.01 0.37 2 0.065
Nitrato
0.1 0.88 3.61 0.3
0.1 0.1 5 0
0.1 0.1 5.83 0
0.44 0.35 7 0.0041
0.39 0.44 7.28 0.0013
0.88 0.95 9 0.0024
0.44 0.1 9 0.06
0.1 0.1 9.22 0
Fsforo Total
0.82 0.93 3.61 0.0061
0.91 0.82 4 0.0041
0.82 0.95 5 0.0084
0.92 0.82 5.83 0.005
0.93 0.82 11 0.0061
Clorofila a
37 93 2 1568
20 93 6.4 2664.5
59

Se calcula ahora los semivariogramas omnidireccionales para cada uno
de los incrementos inciales encontrado, hasta conseguir la mejor estructura
de correlacin espacial.


Figura 41. Estructura del semivariograma omnidireccional para la variable
nitrgeno total (tomando como incremento inicial h = 2)


Como podemos ver esta estructura del semivariograma omnidireccional
no posee una forma suave, puesto que tiene un decrecimiento pronunciado,
que no se supone que pasa, pues los grficos de los semivariogramas
experimentales por lo general aumentan con distancia hasta un punto y
despus llegan a ser ms o menos plano. Ahora eliminaremos los valores
extremos para ver si suaviza esta estructura.



60


Figura 42. Estructura del semivariograma omnidireccional para la variable
nitrgeno total (tomando como incremento inicial h = 2 y eliminando los
valores extremos)


Todava se mantiene el decrecimiento pronunciado y por lo tanto no es
una buena estructura de correlacin espacial, as que descartamos el
incremento inicial h = 2 y veamos que ocurre cuando tomamos h = 2.12.


Figura 43. Estructura del semivariograma omnidireccional para la variable
nitrgeno total (tomando como incremento inicial h = 2.12)
61

Cuando cambiamos de incremento inicial observamos un punto menos
calculado en este semivariograma experimental y una estructura que no
posee una forma suave, puesto que existe un decrecimiento pronunciado. A
continuacin se extraern las observaciones atpicas para ver si se logra
suavizar esta estructura.


Figura 44. Estructura del semivariograma omnidireccional para la variable
nitrgeno total (tomando como incremento inicial h = 2.12 y eliminando los
valores extremos)


En este caso podemos apreciar que esta estructura tiene una forma un
poco ms suave comparada con las anteriores estructuras, por lo que se
puede decir que es una buena estructura de correlacin espacial. Tomemos
ahora h = 2.36 para ver si nos arroja una estructura de correlacin espacial
mucho mejor que esta.

62


Figura 45. Estructura del semivariograma omnidireccional para la variable
nitrgeno total (tomando como incremento inicial h = 2.36)


Ac podemos observar que no es una buena estructura de correlacin
espacial, ya que posee un decrecimiento pronunciado. Ahora eliminaremos
los valores extremos para ver si toma una forma ms suave que la estructura
de la figura 44.


Figura 46. Estructura del semivariograma omnidireccional para la variable
nitrgeno total (tomando como incremento inicial h = 2.36 y eliminando los
valores extremos)
63

Como se puede apreciar esta estructura tiene una forma ms suave que
la estructura de la figura 44, puesto que demuestra un crecimiento hasta un
punto y despus alcanza una cierta estabilidad, por esta razn consideramos
que es la mejor estructura de correlacin espacial. Ntese tambin que el
semivariograma es casi plano ms all de la distancia 4.5, sugiriendo que el
alcance de autocorrelacin espacial termina en esa distancia (los puntos ms
all de 4.5 unidades de distancia no demuestra ningn cambio en el
semivariograma y as no est correlacionada espacialmente).

Ahora procedemos de la misma manera para las otras variables y a
continuacin presentamos los grficos de los semivariogramas
omnidireccionales de las otras variables con sus mejores estructuras de
correlacin espacial.


Figura 47. Estructura del semivariograma omnidireccional para la variable
nitrito (tomando como incremento inicial h = 2.12 y eliminando los valores
extremos)
64


Figura 48. Estructura del semivariograma omnidireccional para la variable
nitrato (tomando como incremento inicial h = 2.36 y eliminando los valores
extremos)



Figura 49. Estructura del semivariograma omnidireccional para la variable
fsforo total (tomando como incremento inicial h = 2 y eliminando los valores
extremos)
65


Figura 50. Estructura del semivariograma omnidireccional para la variable
clorofila a (tomando como incremento inicial h = 2.36 y eliminando los
valores extremos)


Ntese que para la figura 49 observamos nada ms tres puntos
calculados en el semivariograma, en lugar de cinco, esto ocurre ya que la
cantidad de pares encontrados en los dos primeros intervalos de distancia es
muy poco, por lo que el programa Variowin lo considera insuficiente desde el
punto de vista estadstico y por esa razn no calcula estos puntos. Tambin
es bueno tener claro que el programa Variowin realiza lo siguiente: cada
valor que toma h en los grficos de los semivariogramas, es la distancia
promedio de los pares de valores que genera el punto

( ) h
en la grfica.

Es importante resaltar que se pone en evidencia, en el estudio anterior,
que los semivariogramas experimentales son extremadamente sensibles a
valores extremos y que no se puede dar un criterio exacto o aproximado
sobre cul es el mejor incremento h inicial.
66

A partir de los semivariogramas omnidireccionales con las mejores
estructuras de correlacin espacial, se procede a probar los distintos
modelos tericos. Se elige aquel que presente el mejor ndice de bondad de
ajuste. Los resultados se muestran en la tabla 9.

Tabla 9. Parmetros de los modelos ajustados para los datos de los
semivariogramas omnidireccionales
Variable Modelo Alcance Meseta Pepita Pend. Anis. Dir.
Bondad
de
Ajuste
Nitrgeno
Total

Esfrico 4.7 1 0 ---- 1.7 90 0.094
Exponencial 4.7 1.03 0 ---- 2.4 90 0.12
Gaussiano 4.7 1.03 0 ---- 1.4 90 0.0625
Lineal ---- ---- 0.008 0.132 1 90 0.1273
Nitrito
Lineal ---- ---- 0.012 0 1 90 0.0313
Nitrato
Esfrico 7.1 0.35 0 ---- 2.2 90 0.5499
Exponencial 7.1 0.35 0 ---- 3.5 90 0.8096
Gaussiano 7.1 0.35 0 ---- 1.6 90 0.236
Lineal ---- ---- 0 0.032 1 90 0.4465
Fsforo
Total

Lineal ---- ---- 0.00032 0 1 90 0.00068
Clorofila
a

Esfrico 4.7 503 0 ---- 1 90 0.03
Exponencial 4.7 505 0 ---- 1 90 0.0485
Gaussiano 4.5 523 3 ---- 1 90 0.0365
Lineal ---- ---- 465 0 1 90 0.0752
(Pend. = Pendiente, Anis. = Anisotropa, Dir. = Direccin)
67

El ndice de bondad de ajuste se calcula de acuerdo a la siguiente
expresin:
2
2
0
0

( ) ( ) ( )
( )
( )
n
n
i
j
P i D i i
IBA
d i
P j

=
=



Donde n es el nmero de intervalos de distancia, D es la mxima
distancia, P(i) es el nmero de pares para el intervalo i, d(i) es la media de
los pares en el intervalo i,

( ) i
es la medida experimental para de la
continuidad para el intervalo i,
( ) i
es la medida del modelo para de la
continuidad para el intervalo i, y
2
es la varianza a priori (Pannatier, 1996).
Ntese que el mejor ndice de bondad de ajuste, es aquel que est prximo a
cero, as que para la variable nitrgeno total se selecciona el modelo
gaussiano y sus parmetros. Para las variables nitrito, nitrato, fsforo total y
clorofila a, los modelos tericos seleccionados con sus respectivos
parmetros son: lineal, gaussiano, lineal y esfrico respectivamente. Es
importante explicar por qu a las variables nitrito y fsforo total se les ajusta
solamente un modelo que es la lineal con pendiente nula, esto es debido a la
clara estructura que poseen, adems este modelo no es ms que el modelo
efecto de pepita. Ntese tambin que se fija la direccin a 90, que se
requiere para el semivariograma omnidireccional en el programa Variowin.
Los grficos con los mejores modelos tericos ajustados a los datos de los
semivariogramas omnidireccionales se muestran a continuacin.

68


Figura 51. Modelo gaussiano ajustado a los datos del semivariograma
omnidireccional para la variable nitrgeno total




Figura 52. Modelo efecto de pepita ajustado a los datos del semivariograma
omnidireccional para la variable nitrito
69


Figura 53. Modelo gaussiano ajustado a los datos del semivariograma
omnidireccional para la variable nitrato




Figura 54. Modelo efecto de pepita ajustado a los datos del semivariograma
omnidireccional para la variable fsforo total
70


Figura 55. Modelo esfrico ajustado a los datos del semivariograma
omnidireccional para la variable clorofila a


2.6 Predicciones

Tomando como base los modelos ajustados y utilizando el software
Surfer 8, se realizan las interpolaciones por el mtodo de krigeaje puntual y
los mapas e imgenes de contornos para el ao 2004. Es importante resaltar
que no realizamos predicciones a las variables nitrito y fosforo total, puesto
que se les ajust un modelo efecto de pepita; este modelo describe un
fenmeno puramente aleatorio, sin correlacin entre las muestras, cualquiera
sea la distancia que las separe. Los resultados de las predicciones del ao
2004 para las variables nitrgeno total, nitrato y clorofila a se presentan a
continuacin.



71


Figura 56. Rejilla de datos estimados para la variable nitrgeno total




Figura 57. Mapa de contornos para la variable nitrgeno total con la
superficie del Lago de Valencia y su tabla de niveles de concentracin
72


Figura 58. Imagen de contornos para la variable nitrgeno total con la
superficie del Lago de Valencia y su tabla de niveles de concentracin


2.6.1 Nitrgeno Total
Se observa que los valores de esta sustancia varan de 1.2 a
6.8 mg/l (ver figura 57), aunque la mayora de los valores oscila
principalmente entre 1.2 y 4 mg/l en casi toda la superficie del Lago
(ver figura 58). Tambin se puede ver una concentracin de
valores bastante alto por la zona de Maracay (observe las figuras
57 y 58). Ntese adems que en cada nodo de la rejilla de la figura
56, se encuentra un valor estimado de esta sustancia.



73


Figura 59. Mapa de contornos para la variable nitrato con la superficie del
Lago de Valencia y su tabla de niveles de concentracin




Figura 60. Imagen de contornos para la variable nitrato con la superficie del
Lago de Valencia y su tabla de niveles de concentracin
74

2.6.2 Nitrato
En este caso se puede apreciar rpidamente la concentracin
de valores bastante alto por las zonas de Valencia y el sur del
Lago (observe las figuras 59 y 60) esta zona es la contigua a la
poblacin de Gigue donde hay abundante actividad agrcola.
Adems podemos ver en la figura 59 el intervalo de variacin que
es de 0 a 1.2 mg/l. Ntese tambin que la mayora de los valores
oscila principalmente entre 0 y 0.6 mg/l en casi toda la superficie
del Lago (ver figura 60).



Figura 61. Mapa de contornos para la variable clorofila a con la superficie
del Lago de Valencia y su tabla de niveles de concentracin
75


Figura 62. Imagen de contornos para la variable clorofila a con la superficie
del Lago de Valencia y su tabla de niveles de concentracin


2.6.3 Clorofila a
Para esta sustancia se observa una gran cantidad de valores
intermedios y altos en casi toda la superficie del Lago (ver figura
62). Ntese que por las zonas de Valencia, Maracay y el norte del
Lago existen concentraciones de valores bastante altos (observe
las figuras 61 y 62). Tambin podemos ver en la figura 61 los
lmites de concentracin que son 25 y 95 mg/m
3
.


2.7 Evolucin temporal de la clorofila a

Como la clorofila a es una de la sustancia que ms abunda en el Lago,
por esta razn se estudia a continuacin cmo ha evolucionado esta
sustancia en el tiempo a travs de mapas e imgenes de contornos.
76


Figura 63. Mapa de contornos para la variable clorofila a con la superficie
del Lago de Valencia y su tabla de niveles de concentracin (ao 1998)




Figura 64. Imagen de contornos para la variable clorofila a con la superficie
del Lago de Valencia y su tabla de niveles de concentracin (ao 1998)
77

2.7.1 Clorofila a, ao 1998
Para este ao se observan valores altos por las zonas de
Valencia y el norte del Lago (observe la figura 63). Ntese adems
que los valores intermedios y altos cubren casi toda la superficie
del Lago (ver figura 64).



Figura 65. Mapa de contornos para la variable clorofila a con la superficie
del Lago de Valencia y su tabla de niveles de concentracin (ao 1999)



78


Figura 66. Imagen de contornos para la variable clorofila a con la superficie
del Lago de Valencia y su tabla de niveles de concentracin (ao 1999)


2.7.2 Clorofila a, ao 1999
Se aprecia que para este ao disminuyeron los valores altos y
el intervalo de variacin, pues los niveles de concentracin varan
de 27 a 45 mg/m
3
(ver figura 65). Tambin se puede apreciar la
concentracin de valores altos por la zona de Valencia (observe
las figuras 65 y 66).



79


Figura 67. Mapa de contornos para la variable clorofila a con la superficie
del Lago de Valencia y su tabla de niveles de concentracin (ao 2001)




Figura 68. Imagen de contornos para la variable clorofila a con la superficie
del Lago de Valencia y su tabla de niveles de concentracin (ao 2001)
80

2.7.3 Clorofila a, ao 2001
En este ao se puede observar el gran crecimiento en los
valores altos y en el intervalo de variacin, pues los niveles de
concentracin varan de 36 a 82 mg/m
3
(ver la figura 67). Adems
podemos apreciar que una gran parte del Lago est cubierta por
valores altos, as como tambin se puede ver los bajos niveles de
concentracin de esta sustancia en la zona sur del Lago (observe
la figura 68).



Figura 69. Mapa de contornos para la variable clorofila a con la superficie
del Lago de Valencia y su tabla de niveles de concentracin (ao 2002)



81


Figura 70. Imagen de contornos para la variable clorofila a con la superficie
del Lago de Valencia y su tabla de niveles de concentracin (ao 2002)


2.7.4 Clorofila a, ao 2002
Para este ao se sigue observando el gran crecimiento en los
valores altos y en el intervalo de variacin, pues los niveles de
concentracin varan de 10 a 170 mg/m
3
(ver figura 69). Ntese
tambin una concentracin de valores bastante alto por la zona de
Valencia y los bajos niveles de concentracin de esta sustancia por
la zona de Maracay (observe las figuras 69 y 70).



82


Figura 71. Mapa de contornos para la variable clorofila a con la superficie
del Lago de Valencia y su tabla de niveles de concentracin (ao 2004)




Figura 72. Imagen de contornos para la variable clorofila a con la superficie
del Lago de Valencia y su tabla de niveles de concentracin (ao 2004)
83

2.7.5 Clorofila a, ao 2004
Para este ltimo ao que se estudio, se observa un
decrecimiento en los valores altos y en el intervalo de variacin,
pues los niveles de concentracin varan de 25 a 95 mg/m
3
(ver
figura 71). Observ que por las zonas de Valencia, Maracay y el
norte del Lago existen concentraciones de valores bastante altos
(observar las figuras 71 y 72).


2.8 Prediccin idnea

Con la finalidad de obtener una prediccin apropiada de la clorofila a
para el ao 2004, se procede a realizar hasta diez predicciones continuas,
partiendo de los datos predichos del ao 2004, este mtodo se le conoce
como re-muestre. Despus de realizar los diez re-muestreos, tomamos los
valores que se encuentran ubicados en un mismo nodo en cada una de las
rejillas predichas, para luego promediar estos valores. Esto mismo se realiza
para los dems nodos y todos estos valores promediados se pudiera decir
que es una mejor prediccin comparada con la primera prediccin realizada.
Ntese tambin que se puede realizar el nmero de re-muestre que se
desee, pues mientras ms re-muestre se realice mejor es la prediccin. A
continuacin presentamos la prediccin idnea representada por un mapa e
imagen de contornos, con la metodologa expuesta anteriormente ya
aplicada.

84


Figura 73. Mapa de contornos idneo para la variable clorofila a con la
superficie del Lago de Valencia y su tabla de niveles de concentracin




Figura 74. Imagen de contornos idneo para la variable clorofila a con la
superficie del Lago de Valencia y su tabla de niveles de concentracin
85

Al comparar detalladamente las figuras 71 y 73, notamos que en la figura
73 ya no son continuas las lneas de contornos y estas tienden a tener
diferentes direcciones, por lo que se concluye que estas ltimas
estimaciones estn ms ajustadas a los verdaderos valores.


























86

CAPTULO 3
SERIES TEMPORALES Y ANLISIS DE FLUCTUACIN SIN TENDENCIA

SERIES TEMPORALES
Cuando hablamos de una secuencia de valores observados a lo largo del
tiempo, y por tanto ordenados cronolgicamente, la denominamos en un
sentido amplio, serie temporal. Los valores de una serie temporal van ligados
a instantes de tiempo, de manera que el anlisis de una serie implica el
manejo conjunto de dos variables; la variable en estudio propiamente dicha y
la variable tiempo.
Las series pueden tener una periodicidad anual, semestral, trimestral,
mensual, etc., segn los perodos de tiempo en los que estn recogidos los
datos que la componen. Las mediciones diarias de la temperatura ambiental,
el nmero de pasajeros anuales registrado en una aerolnea, la cantidad de
alumnos semestrales que ingresan a una universidad, el ndice de la bolsa
segundo a segundo, son ejemplos de series temporales con diferentes
periodicidades.
El anlisis de series temporales presenta un conjunto de tcnicas
estadsticas que permiten, adems de estudiar y modelar el comportamiento
de un fenmeno que evoluciona a lo largo del tiempo, hacer previsiones de
los valores que se alcanzarn en el futuro.
Con el anlisis de series temporales se pretende extraer las regularidades
que se observan en el comportamiento pasado de la variable, es decir,
obtener el mecanismo que la genera y as tener un mejor conocimiento de la
misma en el tiempo. Adems, bajo el supuesto de que las condiciones
estructurales que conforman la serie objeto de estudio permanecen
constantes, tambin se trata de predecir el comportamiento futuro.
87

El estudio de una serie temporal puede tener distintas motivaciones. El
tipo de anlisis, as como los modelos en los que basemos el estudio,
dependern en gran medida del tipo de preguntas que queramos responder.
Cuando las observaciones corresponden a una nica variable, el anlisis de
series temporales suele tener como objetivo construir un modelo para
explicar la estructura (descripcin) y prever la evolucin (prediccin) de la
variable de inters. Cuando se observa simultneamente un grupo de
variables, el objetivo que se persigue consiste generalmente en analizar las
posibles relaciones entre las variables observadas y su evolucin conjunta.
Este ltimo punto, debe ser tratado mediante tcnicas multivariantes de
anlisis de series temporales, pero en la presente investigacin no
cubriremos este punto, solamente nos referiremos al anlisis univariante de
series temporales.

3.1 Conceptos de series de tiempo
Tendencia y nivel de la serie
El nivel de una serie es una medida local de tendencia central,
como por ejemplo la mediana, de cada perodo de tiempo que
consideremos.
Una vez calculado el nivel de la serie, debemos observar su
estabilidad, es decir, ver si la medida de tendencia central elegida
tiene valores similares en los perodos de tiempo que
consideremos. Tambin tendremos que observar su tendencia, o
sea, si presenta una direccin constante de cambio de nivel.
88

Estable
Sin tendencia
Creciente
Inestable
El nivel de una serie puede ser: Con tendencia
Decreciente
Circunstancial El fenomeno tiene un nivel estable
salvo comportamie

ntos estacionales.


Estacionalidad
Corresponde a fluctuaciones peridicas de la serie temporal, en
perodos relativamente cortos de tiempo (cada ao, cada mes, etc.,
dependiendo de las unidades de tiempo en que vengan recogidos
los datos). Una herramienta muy til para detectar patrones y
periodicidades en series temporales es la funcin de
autocorrelacin que veremos ms adelante.

Dependencia entre variabilidad y nivel
Es importante analizar la dependencia entre variabilidad y nivel
a la hora de realizar un anlisis preliminar a una serie de tiempo. Si
existe dependencia de este tipo la serie no es estacionaria en
varianza, de manera que debemos transformarla. En estos casos,
cuando la variabilidad depende del nivel, se realizan
transformaciones de la familia de Box-Cox. Cuando estamos ante
una serie no estacionaria en nivel se consigue que la serie sea
estacionaria diferencindola. Diferenciar una serie X
t
consiste en
aplicarle el operador diferencia (

) que hace lo siguiente:


89

1 t t t
X X X

=

Es posible que, tras diferenciar una serie, esta siga siendo no
estacionaria, en cuyo caso es posible que necesite una nueva
diferencia.
Para estudiar la dependencia existente entre variabilidad y nivel
se emplea el grfico de dispersin por nivel. Si los puntos de la
grfica pueden ajustarse a una lnea recta decimos que existe una
dependencia entre variabilidad y nivel. Este grfico es un diagrama
de dispersin en el que se representa el logaritmo neperiano de la
mediana (medida de tendencia central) frente al logaritmo
neperiano de la diferencia entre los percentiles 80 y 20 (medida de
la dispersin) de cada uno de los perodos considerados en la
serie.

3.2 Componentes de una serie de tiempo
Se dice que una serie de tiempo es el resultado de la integracin de
cuatro componentes fundamentales (aunque no siempre aparecen todas)
que no son directamente observables, de los cuales nicamente se pueden
obtener estimaciones. Estas cuatro componentes son: tendencia (T
t
), ciclo
(C
t
), estacionalidad (S
t
) e irregularidad (E
t
). De esta manera podemos
considerar que una serie de tiempo X
t
es una funcin de estas cuatro
componentes.
( )
, , ,
t t t t
t
X f C T S E =

Tendencia (T
t
) es la direccin general de la serie temporal en el
perodo de observacin, es decir el cambio a largo plazo de la
90

media de la serie. Refleja la direccin del movimiento de una
determinada variable; creciente, decreciente o estable.
Ciclo (C
t
) consiste en variaciones superiores al ao que no son
estrictamente peridicas. Se trata de un factor de tipo oscilante
caracterizado por movimientos recurrentes en torno a la tendencia,
y suele aparecer fundamentalmente en series de tipo econmico.
Estacionalidad (S
t
) son los movimientos regulares de una serie que
se repite peridicamente en un tiempo relativamente corto. Recoge
las oscilaciones que ao a ao se repiten en una serie de forma
peridica.
Irregularidad (E
t
) son movimientos errticos que no siguen un
patrn especfico y que obedecen a causas diversas. Esta
componente es prcticamente impredecible. De esta forma la
irregularidad lo compone todo lo que no queda explicado por la
tendencia, el ciclo y la estacionalidad.
Este mtodo clsico de anlisis de series temporales tiene la ventaja de
no ser excesivamente complejo, aunque como contrapartida responde a
preguntas menos ambiciosas. Se pueden emplear para realizar predicciones
a corto plazo, pero no a medio o largo plazo. Por ejemplo, en series
mensuales se utilizan para predecir uno o dos meses, no un ao completo.

3.3 Modelos de series temporales
Antes de estudiar una serie temporal es importante suponer que la serie
esta generada por un proceso estocstico.
91

Un proceso estocstico o proceso aleatorio es un concepto matemtico
que sirve para caracterizar y estudiar todo tipo de fenmenos aleatorios
(estocsticos) que evolucionan generalmente con el tiempo.
Se define en matemtica un proceso estocstico como un conjunto de
variables aleatorias { }
t
t Z
X

que describen la evolucin de algn proceso
a travs de t, donde t es la variable tiempo y a cada X
t
le corresponde una
funcin de distribucin de probabilidad. De esta forma una serie temporal con
n observaciones estara generada por X
1
,, X
n
variables aleatorias, y sus
valores concretos x
1
,, x
n
seran una realizacin del proceso estocstico.
Un proceso estocstico queda determinado si conocemos la funcin de
distribucin de las variables aleatorias que lo componen y todas las posibles
funciones de distribucin conjuntas de dichas variables.
La determinacin de las caractersticas de un proceso estocstico a partir
de las funciones de distribucin es en general, un procedimiento complicado,
por lo que se acostumbra a caracterizarlos a partir de los momentos de
primer y segundo orden (media y covarianza).
Media o momento de primer orden:
( )
Z
t
t
E X t =
Covarianzas o momentos de segundo orden:
( )
,
ov , , Z
t s
t s
C X X t s =

Para poder efectuar inferencias sobre los parmetros de un proceso
estocstico a partir de los datos obtenidos de una sola realizacin, es preciso
imponer restricciones al proceso. Las restricciones que se imponen
habitualmente son que sean estacionario y ergdico.
92

Un proceso estocstico es estacionario en sentido estricto si la funcin de
distribucin conjunta de cualquier subconjunto de variables es constante
respecto a un desplazamiento en el tiempo.
, , , ,
1 1
( ) ( ) N , Z
n h n h
F X X F X X n h
+ +
= K K

Limitarnos a los procesos estacionarios estrictos sera excesivo, de
manera que se opta por una solucin intermedia, con los llamados procesos
estocsticos estacionarios en sentido dbil, o simplemente, procesos
estacionarios de segundo orden.
Un proceso es estacionario en sentido dbil cuando se verifica que la
media terica es independiente del tiempo y las funciones de
autocovarianzas de orden h slo vienen afectadas por el lapso de tiempo
transcurrido entre los dos periodos, adems no dependen del tiempo.
( )
( ) ( )
1.
2. ov ,
t
t
t h t
E X es independiente de t
h C X X es independiente de t para cada h

+
=
=

Antes de introducir la definicin de proceso estocstico ergdico
necesitamos definir la funcin de autocorrelacin.
Se le llama autocorrelacin de orden h, a la correlacin entre dos
variables aleatorias del proceso estocstico, distanciados un lapso de tiempo
h. La autocorrelacin de orden h est dada de la siguiente manera:
( )
( ) ( )
,
( )
( ) Z , Z
(0)
t h t
t h t
Cov X X
h
h h t
Var X Var X

+
+
= =


93

Propiedades de la autocorrelacin:
a. ( ) ( )
b. (0) 1
c. ( ) 1
h h
h

=
=


La funcin de autocorrelacin simple es la representacin de
( ) h
frente
a h. Al observar la parte a. de las propiedades anteriores se concluye que la
funcin de autocorrelacin simple es simtrica, por esta razn se suele
representar nicamente la parte positiva.
Se denomina autocorrelacin parcial de orden h, a la correlacin de dos
variables aleatorias cualesquiera del proceso estocstico, distanciados un
lapso de tiempo h, pero sin considerar los efectos lineales de las variables
aleatorias intermedias. Es decir, para calcular la autocorrelacin parcial entre
X
t
y X
t+h
eliminamos la influencia que sobre ambas tienen X
t+1
, X
t+2
,, X
t+h-1
.
La autocorrelacin parcial de orden h est dada por:
( )
1 2 1
, | , , ,
t t h t t t h
hh
corr X X X X X
+ + + +
= K

La funcin de autocorrelacin parcial es la representacin de
hh

frente a
h.
La aplicacin de las funciones de autocorrelacin simple y parcial, tal y
como veremos ms adelante, constituyen uno de los instrumentos ms
importante para sugerir el ajuste de un modelo a una serie temporal.
94

Un proceso es ergdico cuando conforme h se hace ms grande la
autocorrelacin
( ) h
, se hace ms pequea, es decir que lo que ocurre
hoy, conforme va pasando el tiempo va teniendo menos importancia.
( ) 0
h
h
+


Ahora bien, cuando estamos ante un proceso estacionario y ergdico,
todo el problema de inferencia se simplifica de forma considerable.
Nuestro objetivo al analizar una serie temporal es estimar el proceso
estocstico que la genera y para ello, segn hemos visto hasta ahora,
debemos partir del supuesto de que dicho proceso estocstico es
estacionario y ergdico.

3.3.1 Modelos de medias mviles (MA)
1 -1 2 - 2 - t t t t q t q
X Z Z Z Z = + + + + K

Un proceso de medias mviles de orden q es un proceso en el
que la variable X
t
se obtiene como un promedio de variables de
ruido blanco (Z
i
), siendo los
i
sus coeficientes de ponderacin.
Todos los procesos de medias mviles son procesos
estacionarios.
A continuacin proporcionaremos algunas directrices generales
para identificar este modelo en las funciones de autocorrelacin
simple y parcial:
El modelo de medias mviles posee barras significativas en los
primeros o ms Lags cuando aplicamos la funcin de
autocorrelacin simple.
95

La funcin de autocorrelacin parcial de un modelo de medias
mviles tiene un decaimiento exponencial.

3.3.2 Modelos autorregresivos (AR)
1 -1 2 - 2 - t t t t p t p
X Z X X X = + + + + K

Un proceso autorregresivo de orden p es un proceso en el que
la variable X
t
se obtiene efectuando una regresin sobre valores
pasados de la misma ms un trmino de perturbacin o error (Z
t
)
que suponemos se comporta como ruido blanco.
Todos los procesos autorregresivos son procesos invertibles.
Ahora presentaremos algunos lineamientos generales para
identificar este modelo en las funciones de autocorrelacin simple
y parcial:
El modelo autorregresivo tiene un decaimiento exponencial
cuando empleamos la funcin de autocorrelacin simple.
La funcin de autocorrelacin parcial de un modelo
autorregresivo posee barras significativas en los primeros Lags.

3.3.3 Modelos autorregresivos de medias mviles (ARMA)
1 -1 - 1 -1 - t t p t p t t q t q
X X X Z Z Z = + + + + + + K K

Los modelos autorregresivos de medias mviles, ARMA(p,q),
estn dados por una ecuacin donde aparece la suma de una
autorregresin de orden p y una media mvil de orden q.
96

El comportamiento general que suele tener el modelo ARMA es
que posee un decaimiento exponencial cuando aplicamos las
funciones de autocorrelacin simple y parcial.

3.3.4 Modelos autorregresivos integrado de medias mviles
(ARIMA)
Un proceso { }
t
t Z
X

es un proceso ARIMA(p,d,q) si satisface
una ecuacin de diferencia de la forma:
*
( ) ( )(1 ) ( )
d
t t t
B X B B X B Z =

Donde
{ }
t
Z

~
2
(0, ) WN
,
( ) z
y
( ) z
son polinomios
de grado p y q respectivamente, y
( ) 0 z
para
1 z
. El
polinomio
*
( ) z
tiene un cero de orden d en 1 z = .
La notacin que se emplea a este modelo es ARIMA(p,d,q),
donde p es el nmero de parmetros autorregresivos, d es el
nmero de diferenciaciones para que la serie original sea
estacionaria y q es el nmero de parmetros de medias mviles.

ANLISIS DE FLUCTUACIN SIN TENDENCIA
El anlisis de fluctuacin sin tendencia (AFST) es un mtodo que
cuantifica la presencia o ausencia de correlaciones de largo alcance (Ho,
1997). Es til para analizar series de tiempo que parecen ser procesos de
larga memoria (divergiendo la correlacin en el tiempo, como por ejemplo la
funcin de autocorrelacin decae en forma de ley de potencia) o de ruido 1/f.
97

Este mtodo nos proporciona un nico parmetro cuantitativo y podr ser
aplicado a series cuya estadsticas fundamentales (tales como media y
varianza) o dinmicas no son estacionarias (cambiando con el tiempo). Esto
est relacionado con medidas basadas en tcnicas espectrales tales como
autocorrelacin y transformada de Fourier.
El AFST fue introducido por Peng, 1994 y representa una extensin del
anlisis de fluctuacin (AF) (ordinario), que es afectado por la no
estacionaridad.

3.4 Correlaciones de corto alcance
Dada una serie temporal
{ }
1 2
, , ,
n
T x x x = K con varianza
2 1
2 2
1
n
t
n
t
x x

=

=



, se define la funcin de autocorrelacin muestral
como ( )
1 2 1
2
1
n k
t t k
n k
t
C k x x x

=

=



. Esta funcin mide la
dependencia del valor en la posicin t con el valor en la posicin t + k. Para
variables que son independientes se satisface qu
( )
0 C k =
, pero el
reciproco no es cierto.
Cuando una serie es tal que
a
( )
k
C k e

se dice que la serie tiene


correlaciones de corto alcance, ya que el valor de la serie en t slo tiene
efecto sobre los valores de la serie hasta t + a, y la intensidad de estos
efectos decae exponencialmente.
Los modelos AR, MA, ARMA y ARIMA se usan generalmente para
predecir valores futuros de una serie temporal, y por eso se suelen usar en
98

economa, adems de en diversas disciplinas cientficas. Sin embargo, sean
del tipo que sean, su caracterstica comn es que aunque sirven para
generar series con correlaciones, stas caen siempre de forma exponencial,
con lo que tenemos siempre correlaciones de corto alcance.
En la naturaleza, aparecen muchos sistemas en los que las correlaciones
no son de corto alcance, sino que decaen mucho ms lentamente que de
forma exponencial: ADN, dinmica del corazn, propiedades fsicas en las
transiciones de fase, etc.

3.5 Correlaciones de largo alcance
Cuando las correlaciones decaen asintticamente (es decir para k grande)
como una ley de potencia,
( ) 0 1 C k k con

< <
(2)
Se dice que la serie posee correlaciones de largo alcance. Esto significa
que la influencia del valor de la serie en t se extiende sobre todos los valores
en r > t, y que esta influencia decae muy lentamente, tan lentamente que las
correlaciones no son sumables:
( )
1 1
1
k k
C k k k dk



= =



diverge.
Si en (2) se toma
1 >
, a pesar que las correlaciones decaen como una
ley de potencia, no se considera que las correlaciones sean de largo alcance
dado que son sumables.
Es conocido que la estimacin directa de la funcin de autocorrelacin
C(k) de una serie temporal es limitada a k pequeos por efectos de ruido
(Beran, 1994). Esto es un problema grave si la serie tiene correlaciones de
99

largo alcance, dado que en este caso lo caracterstico est dado por el
comportamiento asinttico (es decir para k grande) de C(k).
Series que poseen correlaciones de largo alcance aparecen por doquier:
en seales biofsicas, ruidos en circuitos, series econmicas, geofsicas, etc.
Sin embargo, estadsticamente hablando, la funcin de autocorrelacin no es
un buen estimador de las correlaciones presentes en una serie, por lo que se
usan herramientas alternativas. Una de las ms destacadas es el uso de la
Transformada de Fourier.
Si una serie es estacionaria, se pueden aplicar tcnicas de anlisis
espectral, y calcular el espectro de potencia S(f) de la serie como funcin de
la frecuencia f. Puede demostrarse que una serie con correlaciones de largo
alcance posee un espectro de potencia de la forma:
( )
S f f


Donde

est relacionado con el exponente

de las correlaciones por


medio de la siguiente expresin:
1 =


3.6 Anlisis de fluctuacin sin tendencia
Los dos mtodos antes mencionados para determinar las correlaciones, el
clculo de C(n) y de S(f), son adecuados slo si la serie es estacionaria (Witt,
1998). Recientemente fue desarrollado un mtodo (Peng, 1994), llamado
anlisis de fluctuacin sin tendencia, para detectar correlaciones de largo
alcance en series no estacionarias. Este mtodo provee un nico parmetro
cuantitativo, el exponente

, para cuantificar el comportamiento de las


correlaciones en una serie. La ventaja del AFST reside en que puede
100

eliminar sistemticamente tendencias de diferentes rdenes, y as detectar
correlaciones de largo alcance en series contaminadas con tendencias
polinomiales que pueden enmascarar la verdadera naturaleza de las
correlaciones. A continuacin se dar una breve explicacin del AFST.
El procedimiento para implementar el AFST consiste de varias etapas.
Primero se construye el perfil y(i) de la serie temporal
{ }
1 2
, , ,
n
T x x x = K :
( )
( )
1
1, ,
i
t
t
y i x x con i n
=
= =

K

Donde
x
es la media de la serie. El perfil y(i) se puede considerar como
la posicin de una caminata al azar sobre una cadena lineal despus de i
etapas. Las fluctuaciones del perfil en una ventana de tamao k estn
vinculadas a la funcin C(k). Segundo, el perfil y(i) se divide en n
k
= [n/k]
series no solapadas y

(i) de igual tamao k. Tercero, para cada y

(i),
v = 1,,n
k
, se calcula la tendencia local t

(i) con el polinomio de grado 1


obtenido por mnimos cuadrados, y se calcula la varianza de y

(i) - t

(i).
( )
( ) ( ) ( )
2
1
2
1
k
v v
k
k
i
F v y i t i
=
=



La siguiente figura ilustra este paso para k = 100 y k = 250.

101


Figura 75. Se divide el perfil de la serie en ventanas de longitud k, y para
cada ventana se realiza ajustes lineales que constituye la tendencia local

Es importante destacar que el ancho de la ventana ms grande, es una
cuarta parte de la longitud de la serie original para asegurar una buena
estadstica.
Finalmente, se promedian todas estas varianzas y se toma la raz
cuadrada, obteniendo as la funcin de fluctuacin del AFST:
( )
( )
1 2
1
k
k
n
k
n
v
F k F v
=
=


Este clculo se repite durante todas las escalas de tiempo (tamaos de
las ventanas), para caracterizar la relacin entre el promedio de fluctuacin,
F(k), y el tamao de la ventana, k. Normalmente, F(k) se incrementar con el
tamao de la ventana k. Una relacin lineal en un grfico log-log de k contra
F(k) indica la presencia de ley de potencia escalar que esta expresada como:
102

( )
F k k


El exponente

se calcula como la pendiente de una lnea recta que se


ajusta al grfico log-log de k contra F(k) usando mnimos cuadrados. Este
exponente puede tener diferentes valores:
0.5 < , significa que la serie es anti-correlacionada
0.5 , significa que en la serie no existen correlaciones, es decir,
la serie es ruido blanco
0.5 > , significa que en la serie existen correlaciones
1 , significa que la serie es ruido 1/f o ruido rosa
1.5 , significa que la serie es ruido Browniano

El exponente

es llamado exponente de escala, se vincula con el


exponente de las correlaciones

y con el exponente

del espectro de
potencia por medio de sencillas relaciones:
1
1 ,
2 2


+
= =

Debe tenerse presente que estas dos ecuaciones son exactas cuando
n , y que slo puede esperarse una concordancia limitada entre los
tres exponentes por efecto de la finitud de la serie temporal bajo estudio.
Una generalizacin del AFST, llamada AFST de orden m y denotada por
AFSTm, la cual consiste en calcular la tendencia local t

(i) con un polinomio


103

de grado m, de modo de tener una jerarqua de mtodos, AFST1 (coincide
con el original AFST), AFST2, AFST3,..., que difieren entre ellos en el tipo de
no estacionariedades en T que pueden eliminar.
En resumen, si la serie es estacionaria las correlaciones estn
relacionadas con las fluctuaciones alrededor del valor medio que presenta la
serie, esto implica que se pueden medir las correlaciones midiendo las
fluctuaciones, pero si la serie no es estacionaria en lugar de analizar las
fluctuaciones en torno a la media las analizamos alrededor del ajuste por
mnimos cuadrados del perfil y(i) dentro de cada ventana de tamao k.




















104

CAPTULO 4
ESTUDIO DE LAS SERIES TEMPERATURAS Y APLICACIN DEL
ANLISIS DE FLUCTUACIN SIN TENDENCIA

4.1 Recoleccin de los datos
Para efectuar este captulo se cont con 2 bases de datos
correspondientes a los resultados obtenidos por la medicin de la
temperatura para el ao 2008 en dos estaciones de monitoreo ubicadas en el
Lago de Valencia, las cuales llevan los nombres de Sucre y Tacarigua.
Especficamente, en la primera estacin referida, las muestras fueron
tomadas desde el 01/02/2008 al 11/02/2008 y en la segunda desde el
09/01/2008 al 23/01/2008, estas muestras fueron captadas a travs de
dispositivos llamados termistores encargados de medir y registrar valores de
temperatura. Asimismo, es importante resaltar que la medicin de la
temperatura se realiz cada 5 minutos durante los das antes referidos.
Los datos arrojados de las mediciones realizadas en las estaciones Sucre
y Tacarigua, son las que se analizan en el presente captulo con la finalidad
de ajustar un modelo adecuado para predecir valores futuros de la
temperatura y determinar si existen correlaciones de largo alcance en
las series temperaturas.


4.2 Metodologa
Utilizamos los mtodos expuesto en el captulo 3, para las estimaciones
de los valores futuros de la temperatura y para detectar la presencia o
ausencia de correlaciones de largo alcance en las series temperaturas. Este
estudio se llev a cabo en cuatro etapas:
105

a. Anlisis preliminar de las series temperaturas. En primer lugar,
realizamos grficos de caja para detectar observaciones atpicas,
utilizando el software Matlab 7, en segundo lugar, efectuamos un
anlisis estadstico descriptivo, histogramas y grficos Q-Q plot
para verificar si las muestras provienen de una poblacin normal,
en tercer lugar, empleamos los grficos de secuencia para
observar el comportamiento de las series, en cuarto lugar,
aplicamos los grficos de cajas por da y la funcin de
autocorrelacin parcial para detectar si existen tendencias y
periodicidades en las series y por ltimo realizamos grficos de
dispersin por nivel para ver si se consigue que las series sean
estacionarias diferencindolas, para todo esto se utiliz el paquete
SPSS 15.
b. Ajuste de modelos. En esta etapa, nuevamente empleamos la
funcin de autocorrelacin parcial y la funcin de autocorrelacin
simple para verificar si eliminamos la componente estacional y
para ver qu modelo nos sugera para el ajuste de nuestros datos,
esto se efectu utilizando el programa SPSS 15. Luego se realizan
los ajustes de modelos a las series.
c. Predicciones. Durante esta etapa, efectuamos las estimaciones
de los valores futuros de la temperatura, tomando como base los
modelos ajustados. Para estas predicciones se utiliz el software
SPSS 15.
d. Anlisis de fluctuacin sin tendencia. En esta ltima etapa,
realizamos grficos log-log para estimar el valor del exponente de
escala

, utilizando un programa escrito en Matlab por Guan


Wenye, 2008 (guanwenye@tju.edu.cn).

106

4.3 Anlisis preliminar de las series temperaturas

Debemos ver si las series temperaturas para las estaciones Sucre y
Tacarigua son estacionarias, pero antes realizamos los grficos de caja, esto
con la finalidad de verificar si existen observaciones atpicas en estas series.


Figura 76. Grficos de caja de las series temperaturas para las estaciones
Sucre y Tacarigua respectivamente


Como se puede apreciar estas series temperaturas no poseen
observaciones atpicas. Ntese tambin que la unidad de medida para este
conjunto de observaciones de la temperatura es el grado centgrado (C).




107

Tabla 10. Estadstica descriptiva para las series temperaturas
Estacin
Estadstico
Sucre Tacarigua
Media 24.69 25.23
Mediana 24.3 24.6
Moda 21.8 22.8 y 23.3
Varianza 11.84 5.95
Desviacin Estndar 3.44 2.44
Coeficiente de Variacin 0.14 0.1
Error Estndar 0.06 0.04
Mnimo 17.2 20.1
Mximo 32.7 31.1
Amplitud 15.5 11
Coeficiente de Asimetra 0.17 0.52
Curtosis -0.88 -0.86
Primer Cuartil 22.1 23.2
Tercer Cuartil 27.48 27.2

Se puede observar en esta tabla que los valores de la media y la mediana
estn cercanos en cada una de las estaciones, adems se puede ver que el
coeficiente de asimetra de la estacin Sucre est cercano a cero, lo que
pudiramos decir que la muestra para esta estacin se ajusta a una
distribucin normal. A continuacin realizaremos histogramas y grficos Q-Q
plot para la distribucin normal, esto con miras a verificar si los datos de cada
estacin provienen de una poblacin normal.
108


Figura 77. Histograma de la serie temperaturas para la estacin Sucre




Figura 78. Histograma de la serie temperaturas para la estacin Tacarigua
109


Figura 79. Q-Q plot para la distribucin normal aplicada a la serie
temperaturas para la estacin Sucre




Figura 80. Q-Q plot para la distribucin normal aplicada a la serie
temperaturas para la estacin Tacarigua
110

En los histogramas podemos ver que la distribucin de los datos no se
ajusta muy bien a la curva normal, pero cuando observamos los grficos Q-Q
plot notamos que existe una tendencia a ajustarse a la lnea recta, lo que nos
parece indicar que los datos de cada estacin constituyen muestras
aleatorias que provienen de una poblacin normal. Esta condicin permite
continuar con el proceso de modelizacin sin transformar las series.

Veamos ahora si estas series temperaturas son estacionarias,
grafiquemos y observemos el comportamiento de este conjunto de
observaciones para cada una de las estaciones.


Figura 81. Grfico de secuencia de la serie temperaturas para la estacin
Sucre




111


Figura 82. Grfico de secuencia de la serie temperaturas para la estacin
Tacarigua


Observando estos grficos de secuencia vemos que diariamente se
repiten unos picos, esto es debido a que aproximadamente a la hora del
medio da alcanza su mayor temperatura en estas estaciones.

Ahora estudiaremos el nivel de las series. Como las observaciones de la
temperatura fueron tomadas cada 5 minutos, consideraremos periodos de
tiempo de un da, esto con la finalidad de hallar la mediana diaria.

112


Figura 83. Grficos de cajas por da de la serie temperaturas para la estacin
Sucre




Figura 84. Grficos de cajas por da de la serie temperaturas para la estacin
Tacarigua
113

Tabla 11. Medida de tendencia central para cada periodo de tiempo
Estacin Da Mediana
Sucre
1 23.3
2 23.3
3 23.6
4 24,15
5 24.6
6 23.4
7 24.35
8 24.65
9 25.3
10 25.1
11 24.95
Tacarigua
9 24.3
10 24.6
11 24.2
12 25.2
13 25.3
14 25.6
15 24.6
16 24.65
17 24.5
18 25.1
19 24.2
20 24.15
21 24.3
22 24.55
23 24.2
114

La lnea que aparece en el interior de cada una de las cajas de un box-
plot representa la mediana, es decir, el nivel de la serie, pues esta es una de
las posibles medidas de tendencia central. Una vez representado el nivel de
la serie lo estudiamos para determinar si es o no estable. Cuando
observamos los grficos de cajas y la tabla 11 concluimos que los niveles de
las series son estables, puesto que los valores de las medianas son similares
en cada uno de los das. Ahora si tomamos en cuenta que las series poseen
unos picos que se repiten peridicamente, se concluye entonces que las
series tienen un nivel circunstancial.

Comprobemos ahora que las series temperaturas poseen una
componente estacional. Para verificar esto debemos aplicar la funcin de
autocorrelacin parcial (FACP).


Figura 85. Funcin de autocorrelacin parcial de la serie temperaturas para
la estacin Sucre

115


Figura 86. Funcin de autocorrelacin parcial de la serie temperaturas para
la estacin Tacarigua


Al observar estos grficos de autocorrelacin parcial vemos que se
marcan los intervalos de confianza para ayudar a detectar las barras
significativas, adems notamos que existe una tendencia a que en cada Lag
se tenga una barra significativa, esto significa que diariamente se repite un
patrn similar, lo que quiere decir que existe una componente estacional en
estas series, por lo que se concluye que las series no son estacionarias.

Ahora estudiaremos la dependencia entre variabilidad y nivel, esto se
realiza con la finalidad de determinar si la serie no es estacionaria en
varianza o en nivel. A continuacin mostraremos los grficos de dispersin
por nivel de cada una de las estaciones.

116


Figura 87. Grfico de dispersin por nivel de temperatura por da para la
estacin Sucre




Figura 88. Grfico de dispersin por nivel de temperatura por da para la
estacin Tacarigua
117

Como podemos ver no existe dependencia entre variabilidad y nivel en las
estaciones Sucre y Tacarigua, pues los puntos en ambas grficas no se
ajustan a una lnea recta, as que podemos decir que las series no son
estacionarias en nivel, o sea se consigue que ambas series sean
estacionarias diferencindolas.


4.4 Ajuste de modelos

Tomando en cuenta lo dicho anteriormente aplicamos el operador
diferencia a nuestras series y a estas series diferenciadas le empleamos la
funcin de autocorrelacin simple (FACS) y la funcin de autocorrelacin
parcial para verificar si eliminamos la componente estacional y para ver qu
modelo nos sugiere para el ajuste de nuestros datos.


Figura 89. Funcin de autocorrelacin simple de la serie diferenciada para la
estacin Sucre
118


Figura 90. Funcin de autocorrelacin parcial de la serie diferenciada para la
estacin Sucre




Figura 91. Funcin de autocorrelacin simple de la serie diferenciada para la
estacin Tacarigua
119


Figura 92. Funcin de autocorrelacin parcial de la serie diferenciada para la
estacin Tacarigua


Cuando apreciamos los grficos de autocorrelacin parcial notamos que
eliminamos la periodicidad diaria, pues ahora no se observa una tendencia
de barras significativas en cada Lag, ni un patrn de regularidad en las
barras significativas. Ahora si miramos los grficos de autocorrelacin simple
vemos que existe un comportamiento a decaer exponencialmente, tpico en
los modelos autorregresivos. Por otro lado, es importante resaltar dos cosas,
primero toda funcin de autocorrelacin muestra una barra significativa en
Lag 1, es un patrn tpico de series de tiempo, y segundo el nmero de
barras significativas en una funcin de autocorrelacin parcial indica el orden
del modelo. As que para nuestras series les ajustaremos un AR(4) para la
estacin Sucre y un AR(7) para la estacin Tacarigua. Los resultados se
muestran en la tabla 12.


120

Tabla 12. Parmetros de los modelos ajustados para las series temperaturas
Estacin Modelo
i


R
2
Estacionario
Sucre
AR(4) -1.01 0.85
-1.01
-1.07
-0.83
Tacarigua
AR(7) -0.82 0.88
-0.72
-0.75
-0.48
0.35
0.07
0.07

En esta tabla se observan los valores del R
2
estacionario, el cual nos
proporciona una idea de lo bien que los modelos se ajustan a los datos. Este
estadstico ofrece una estimacin de la proporcin de la variacin total en la
serie que es explicada por el modelo. Para el programa SPSS es preferible el
R
2
estacionario que el R
2
comn cuando existe un patrn de tendencia o
estacionalidad, como es el caso aqu. Valores ms grandes del R
2

estacionario (hasta un valor mximo de 1) indican un mejor ajuste, as que
los valores de 0.85 y 0.88 significa que los modelos hacen un buen trabajo
de explicar la variacin observada en las series.



121

4.5 Predicciones

Ahora que ajustamos los modelos a nuestras series temperaturas,
procedemos a realizar las predicciones. A continuacin presentamos los
grficos de secuencia para las estaciones Sucre y Tacarigua con los
modelos ajustados a los datos y las predicciones.



Figura 93. Modelo AR(4) ajustado a la serie temperaturas para la estacin
Sucre y su prediccin
122


Figura 94. Modelo AR(7) ajustado a la serie temperaturas para la estacin
Tacarigua y su prediccin


Como se puede apreciar en estas grficas el futuro conserva algunas de
las caractersticas de su evolucin en el pasado, es decir, conserva los picos
diarios, adems vemos que existe una tendencia a aumentar los niveles de la
temperatura a medida que pasa el tiempo en el futuro para la estacin Sucre
y existe una tendencia a mantenerse para la estacin Tacarigua. Ntese que
para la estacin Sucre realizamos predicciones para 18 das y as completar
el mes de febrero del 2008 y para la estacin Tacarigua 17 das y as
completar el mes. Es importante resaltar que para cada 5 minutos realizamos
estas predicciones en esos das, adems de que se realiz estas
predicciones a corto plazo, debido a que estos modelos producen
correlaciones de corto alcance, que caen de forma exponencial. Es por esto
que se observa en las predicciones una disminucin en las ondas a medida
que transcurre el tiempo.

123

4.6 Anlisis de fluctuacin sin tendencia

La inspeccin visual de los grficos de secuencia de las figuras 81 y 82
revelan la naturaleza fluctuante de stas, que induce a analizarlas como si
fueran el resultado de algn proceso estocstico. Por otra parte, como
sabemos que las series temperaturas no son estacionarias, esto nos indica
que en las series existen correlaciones temporales que no son triviales, y
merecen un estudio ms cuidadoso, as que emplearemos el mtodo del
anlisis de fluctuacin sin tendencia, para verificar si nuestras series poseen
correlaciones de largo alcance. Los resultados de este estudio se presentan
a continuacin.



Figura 95. Grfico log-log del resultado del anlisis AFST para la estacin
Sucre


124


Figura 96. Grfico log-log del resultado del anlisis AFST para la estacin
Tacarigua


Tabla 13. Valores del exponente de escala

obtenidos de los ajustes


lineales de las fig. 95 y 96
Estacin

Sucre 0.88
Tacarigua 0.28

Para la estacin Sucre el valor de

esta prximo a 1, lo que implica que


en la serie existen correlaciones de largo alcance con el exponente de las
correlaciones

prximo a cero, y as esta serie es ruido rosa


(
1
( ) S f f

), mientras que para la estacin Tacarigua las correlaciones


en la serie son de corto alcance, es decir las correlaciones decaen
125

exponencialmente. Se ha demostrado (Koscielny Bunde, 1996 y 1998) que
los datos de temperatura atmosfrica (uno elegido aleatoriamente de 14
regiones continentales) muestran fuertes correlaciones cuando aplicamos el
AFST con exponente 0.65 = , esto es considerado como el
comportamiento de persistencia universal de los datos de temperatura.
Usando este resultado como un punto de referencia, concluimos que los
datos de temperatura para las estaciones Sucre y Tacarigua muestran
menos y mayores desviaciones respectivamente, del comportamiento
universal previamente observado (exponente) de 0.65.




















126

CONCLUSIONES Y RECOMENDACIONES

Conclusiones

Despus de haber analizado e interpretado los resultados arrojados en la
presente investigacin, se pueden sealar las siguientes conclusiones:
En los mapas e imgenes de distribucin anual de la clorofila se
detectaron concentraciones bastante altas por la zona de Valencia, esto
es debido posiblemente a la presencia de complejos industriales y zonas
residenciales ubicadas en esta zona. Adems existe una tendencia a
aumentar los niveles de concentracin de la clorofila a medida que han
pasado los aos.
Los mapas e imgenes contienen las mejores estimaciones en los puntos
no mustrales, ya que se basan en unos datos que se ajustan a una
distribucin normal, suponiendo adems que los semivariogramas
elegidos describen lo ms realmente posible la variabilidad espacial.
Con esta investigacin se ilustra como la geoestadstica constituye una
herramienta muy til en el estudio de las distribuciones espaciales de las
variables naturales, lo cual es esencial cuando se deben tomar decisiones
que afectan al medio ambiente.
De acuerdo a los resultados arrojados en las predicciones realizadas a
los datos de temperatura para las estaciones Sucre y Tacarigua, se infiere
que se podra registrar en el Lago aumento o disminucin de los niveles
de agua, modificaciones en las precipitaciones y cambios en la qumica
del lquido. Si se registra un aumento persistente en los niveles de agua,
esto traera como consecuencia inundaciones en las poblaciones
adyacentes, de lo contrario obtendramos un Lago seco o una baja sin
precedente de sus niveles. Las ramificaciones ecolgicas de estos
127

cambios seguramente sern graves y se harn sentir en todo el
ecosistema del Lago y sus zonas contiguas.

Recomendaciones

Partiendo de los resultados arrojados en esta investigacin, se mencionan
a continuacin algunas recomendaciones que pudieran ser tomadas en
cuenta:
Muestrear una cantidad de estaciones de monitoreo en el Lago de
manera que sea suficiente desde el punto de vista geoestadstico,
adems tomar en cuenta las localizaciones de las estaciones de tal
manera que la distribucin espacial se considere representativa de cada
zona lacustre, considerando factores externos que pueden influir en la
calidad del agua como es el ingreso cercano de aguas residuales
(urbanas, industriales y agropecuarias), as como tambin muestrear con
un GPS las coordenadas geogrficas de estas estaciones. Tomando en
cuenta todo esto, se obtendra una mejor estimacin en las posiciones no
muestreadas, usando el mtodo de krigeaje puntual.
Ya que no podemos influenciar directamente en las actividades
industriales, urbanas y agropecuarias que se llevan a cabo, las cuales
son las causantes de las grandes concentraciones de sustancias
qumicas que se estn descargando en el Lago de Valencia, es
recomendable que se realicen e implementen obras pblicas orientadas a
desviar a otro lugar menos vulnerable todas las aguas residuales que
caen al Lago.
Los organismos e instituciones competentes en el rea, debieran de
realizar jornadas divulgativas sobre la no contaminacin del Lago de
128

Valencia para que pensemos un poco en las consecuencias que ya se
detectaron y en las que se puedan detectar en un futuro.
Se deben buscar soluciones inmediatas para el saneamiento del Lago de
Valencia, ya que a medida que pasa el tiempo se incrementa la
contaminacin en el mismo y los efectos podran ser irreparables.
Los resultados arrojados en esta investigacin, deberan ser
considerados por los organismos competentes en el rea, al momento de
buscar soluciones que ayuden a mantener el equilibrio ambiental del Lago
de Valencia.













129

BIBLIOGRAFA

Abasov M.T., Djafarov I.S. y Askerov G.I., 1990, Computer Based
System for Exploration, Optimization, and Reserve Estimation at the
Bakhar Field, South Apsheron, Azerbaijan, SSR, Computers &
Geosciences, Vol. 16, No. 2, pp. 245-249.
Anselin L., 2003, An Introduction to Variography using Variowin.
Arik A., 1990, Effects of Search Parameters on Kriged Reserve
Estimates, International Journal of Mining and Geological Engineering,
Vol. 8, No.12, pp. 305-318.
Armstrong M. y Carignan J., 1997, Gostatistique Linaire, Application
au Domaine Minier., cole de Mines de Paris, 112 p., Gostatistique
Linaire, Application au Domaine Minier., cole de Mines de Paris, 112 p.
Beran J., 1994, Statistics for Long-Memory Processes, Chapman & Hall,
New York.
Brockwell P.J. y Davis R.A., 1996, Introduction to Time Series and
Forecasting. Springer.
Carr J.R., 1995, Numerical Analysis for the Geological Sciences, Prentice
Hall Inc, 592p.
Castillo J., Larrazbal G. y Torres C., (s.f.), Understanding Three-
Dimensional Circulation in Lake Valencia, Venezuela: A Numerical
Approach.
Chauvet P., 1994, Aide-Memoire de Gostatistique Miniere, cole des
Mines de Paris, 210 p.
Chica-Olmo M., 1987, Anlisis Geoestadstico en el Estudio de la
130

Explotacin de Recursos Minerales, Tesis Doctoral, Universidad de
Granada, Espaa, 387 p.
Christensen R., 1993, Quadratic Covariance Estimation and Equivalence
of Predictions, Mathematical Geology, Vol. 25, No. 5, pp. 541-558.
Cressie N., 1991, Statistics for Spatial Data. Wiley series.
Cuador J.Q., 2004, Elementos de Geoestadstica, Departamento de
Informtica, Universidad de Pinar del Ro, Cuba. Correo Electrnico:
cuador@info.upr.edu.cu. Disponible en Internet:
http://www.monografias.com/trabajos14/geoestadistica/geoestadistica.sht
ml - [Consultada: 15/11/2007].
Curran P.J. y Atkinson P.M., 1998, Geoestatistics and Remote Sensing,
Progress in Physical Geography, 22, 1, pp. 61-78.
David M., 1977, Geostatistical Ore Reserve Estimation, Elsevier,
Amsterdam, 364 p.
de Fouquet C., 1996, Quelques Rappels Sur les Mthodes
Gostatistiques, Centre de Gostatistique, Ecole des Mines de Pars,
Fontainebleau, France, 4 p.
Deutsch C.V. y Journel A.G., 1998, GSLIB: Geostatistical Software
Library and Users Guide, Second Edition, Oxford University Press, 369
p.
Echaabi J., Trochu F. y Gauvim R., 1995, A General Strength Theory
for Composite Materials Based on Dual Kriging Interpolation, Journal of
Reinforced Plastics and Composites, Vol.14, pp.211-232.
Genton M.G., 1998, Variograms Fitting by Generalized Least Squares
Using an Explicit Formula for the Covariance Structure, Mathematica
131

Geology, Vol. 30. No. 4. pp. 323-345.
Giraldo H., R. 2003, Introduccin a la Geoestadstica. Bogot:
Universidad Nacional de Colombia. 94 p.
Gotway C.A., 1991, Fitting Semivariogram Models by Weigmted Least
Squares, Short Note, Computers & Geosciences, Vol. 17, No. 1, pp.171-
172.
Haas T.C., 1992, Redesigning Continental-Scale Monitoring Networks,
Atmospheric Environment, Vol. 26A, No. 18, pp. 3323-3333.
Hamilton J.D., 1994, Time Series Analysis, Princeton University Press.
Ho K.K.L., Moody G.B., Peng C-K., Mietus J.E., Larson M.G., Levy D.,
y Goldberger A.L., 1997, Predicting survival in heart failure cases and
controls using fully automated methods for deriving nonlinear and
conventional indices of heart rate dynamics. En: Circulation, 96, pp. 842-
848.
Journel A.G. y Huijbregts C.J., 1978, Mining Geostatistics, Academic
Press, New York, 600 p.
Kirchgssner G. y Wolters J., 2007, Introduction to Modern Time Series
Analysis, Springer.
Koscielny Bunde E., Bunde A., Havlin S. y Goldreich Y., 1996, Physica
A 231, 393.
Koscielny Bunde E., Bunde A., Havlin S., Roman H.E., Goldreich Y. y
Schellenhuber H.-J., 1998, Phys. Rev. Lett. 81, 729.
Krajewski S.A. y Gibbs B.L., 1993, A Variaogram Primer, Gibbs
Associates, 93 p.
132

Lamorey G. y Jacobsom E., 1995, Estimation of Semivariogram
Parameters and Evaluation of the Effects of Data Sparsity, Mathematical
Geology, Vol.27, No.3, pp. 327-358.
Loon V. y Barfoot, 1989, Laboratorio de Geoqumica. Disponible en
Internet: http://geologia.cicese.mx/labs/lab_geoquim.htm - [Consultada:
12/12/2007].
Matheron G., 1970, La Thorie des Variables Regionalises et ses
Applications Les Cahiers du Centre de Morphologie Mathematique de
Fontainebleau, Fascicule 5, Ecole de Mines de Paris, 212 p.
Molinero L.M., 2003, Y si los datos no siguen una distribucin normal?...
Bondad de ajuste a una normal. Transformaciones. Pruebas no
paramtricas. Correo Electrnico: bioestadstica@alceingenieria.net.
Disponible en Internet: http://www.seh-lelha.org/noparame.htm -
[Consultada: 17/05/2008].
Obando F.H., Villegas A.M., Betancur J.H. y Echeverri L., 2006,
Variabilidad Espacial de Propiedades Qumicas y Fsicas en un Typic
Udivitrands, Arenoso de la Regin Andina Central Colombiana. Revista
Facultad Nacional de Agronoma, Medelln, Vol.59, No.1. p.3217-3235.
Facultad de Ciencias Agropecuarias, Universidad Nacional de Colombia.
Disponible en internet:
http://www.scielo.org.co/scielo.php?script=sci_arttext&pid=S0304-
28472006000100009&lng=en&nrm=iso&tlng=es - [Consultada:
12/12/2007].
Ovalles V., F. A. 1991, Evaluacin de la Variabilidad de Suelos a Nivel de
Parcela, para el Establecimiento en Lotes Comerciales en el Estado
Cojedes. En: Agronoma Tropical. Vol. 41, no. 1; p. 5-22.
Pannatier Y., 1993, Ms-Windows Program for exploratory variography
133

and variogram modelling in 2D, International Workshop on Statistics of
Spatial Processes-Theory and Applications, Bari, Italy 27-30 September
1993.
Pannatier Y., 1996, Variowin. Software for Spatial Data Analysis in 2D.
Springer, Statistics and Computing.
Pawlowsky V., Olea R.A. y Davis J.C., 1995, Estimation of Regionalized
Composition: A Comparison of Three Methods, Mathematical Geology,
Vol.27, No. 1, pp.105-127.
Peng, C.-K., Buldyrev S.V., Havlin S., Simons M., Stanley H.E. y
Goldberger A.L., 1994, Phys. Rev. E 49, 1685.
Perazzo C.A., Fernndez E.A., Chialvo D.R. y Willshaw P., 2000,
Fractals, pp. 297-312.
Pitard F.F., 1994, Exploration of the Nugget Effect, R. Dimitrakopolous
(de.) Geostatistics for the Next Century, pp.124-136.
Schaug J., Iversen T. y Pedersem U., 1993, Comparison of
Measurements and Model Results for Airborne Sulphur and Nitrogen
Components with Kriging, Atmospheric Environment, Vol.27A, No. 6, pp.
831-844.
Shumway R.H. y Stoffer D.S., 2006, Time Series Analysis and Its
Applications With R Examples, Second Edition, Springer.
Uriel E., 1985, Anlisis de series temporales. Modelos ARIMA, Paraninfo.
Valles A., 2005, Caracterizacin de los Tributarios en la Cuenca del Lago
de Valencia. Ministerio del Ambiente y de los Recursos Naturales.
Direccin General Estadal Ambiental Aragua. Laboratorio de Calidad
Ambiental. Venezuela.
134

Wackernagel H., 1995, Multivariate Geostatistic, an Introduction with
applications, Berlin: Springer, 256 p.
Wallace M.K. y Hawkims D.M., 1994, Applications of Geostatistics in
Plant Nematology, Supplement to Journal of Nematology 26 (45), pp. 626-
634.
Weerts H.J.T. y Bierkens M.F.P., 1993, Geostatistical Analysis of Over
Bank Deposits of Anatomising and Meandering Fluvial Systems; Rhine-
Meuse Delta, The Netherlands, Sedimentary Geology, 85, Elsevier
Sciences Publishers B.V., pp. 221-232.
Witt A., Kurths J. y Pikovsky A., 1998, Phys. Rev. E 58, 1800.
Xie T. y Myers D.E., 1995, Fitting Matrix-Valued Variogram Models by
Simultaneous Diagonalization (Part I: Theory), Mathematical Geology, Vol.
27, No. 7, pp. 867-875.
Zhang R., Myers D. E. y Warrick A. W., 1992, Estimation of the Spatial
Distribution of Soil Chemical Using Pseudo Cross-Variograms, Soil
Science Society of America Journal, Vol. 56, No. 5, pp.1444-1452.
Zhang X.F., Van Eijkeren J.C.H. y Heemink A.W., 1995, On the
Weighted Least Squares Method for Fitting a Semivariogram Model, Short
Note, Computers & Geosciences, Vol. 21, No. 4, pp. 605,608.
Zimmerman D.L., 1993, Another Look at Anisotropy in Geostatistics,
Mathematical Geology, Vol. 25, No. 4, pp. 453-470.

Pginas de Internet consultadas:

http://geologia.cicese.mx/labs/lab_geoquim.htm - [12/12/2007].
135

http://giscenter.isu.edu/training/geostats/Probsets.pdf - [09/01/2008].
http://www.gisits.com/docs/Mini_manual_surfer.PDF - [09/01/2008].
http://www.ilec.or.jp/database/sam/sam-05.html - [12/12/2007].
http://www.mathworks.com/matlabcentral/fileexchange/19795#comment -
[22/07/2008].
http://www.monografias.com/trabajos14/geoestadistica/geoestadistica.sht
ml - [15/11/2007].
http://www.scielo.org.co/scielo.php?script=sci_arttext&pid=S0304-
28472006000100009&lng=en&nrm=iso&tlng=es - [12/12/2007].
http://www.scielo.org.pe/scielo.php?script=sci_arttext&pid=S1561-
08882006000200009&lng=en&nrm=is - [09/01/2008].
http://www.seh-lelha.org/noparame.htm - [17/05/2008].
http://www.telefonica.net/web2/biomates/explora/explora_shapirow/explor
a_shapirow.htm - [17/05/2008].

Vous aimerez peut-être aussi