Proyecto de Investigacion

FACULTAD DE INGENIERA, ARQUITECTURA Y URBANISMO
ESCUELA ACADMICO PROFESIONAL DE INGENIERA CIVIL
PROYECTO DE INVESTIGACIN
APLICACIN DE REDES NEURONALES PARA LA

MODELIZACIN Y GENERACIN DE SERIES HIDROLGICAS
EN LA CUENCA DEL RIO CHICAMA
AUTORES:
Chingay Gonzales, Gary A.
Malhaber Montenegro Miguel.
Pea Becerra Enjhor Thaylor.
ASESOR:
ING. CIVIL GUILLERMO GUSTAVO ARRIOLA CARRASCO
PIMENTEL, JULIO DEL 2016
1
Aplicacin de redes neuronales para la modelizacin y generacin de
series hidrolgicas en la Cuenca del Rio Chicama
Aprobacin del proyecto

___________________________________________
Apellidos y Nombres:.
Autor
___________________________________________
Grado/ Apellidos y Nombres:.
Asesor Metodolgico
___________________________________________
Asesor Especialista
___________________________________________
Presidente de Jurado
___________________________________________
Secretario(a) de Jurado
___________________________________________
Vocal/Asesor de Jurado
2
DEDICATORIA
A Dios
Gracias a Dios por darnos la vida, por estar con nosotros en cada paso que
damos, por mostrarnos cada da que tan bella puede ser la vida, que siempre
hay una luz para creer en nuestra existencia.
A nuestra familia
Por estar siempre apoyndonos en los momentos de prosperidad y difciles,

brindndonos sus nimos para seguir adelante y poder lograr alcanzar nuestros
objetivos planteados.
Al Ing. Arriola Carrasco Guillermo Gustavo
Por los conocimientos que nos brinda semana a semana, por el apoyo
desinteresado y la fomentacin para la investigacin cientfica en al rea de
hidrologa.

3
AGRADECIMIENTO
Queremos agradecer a Dios por estar siempre en esos momentos difciles as

como tambin en aquellos buenos, por iluminarnos da a da, conducindonos
por el camino del bien y la sabidura.
A nuestros padres por ese gran amor, apoyo y dedicacin que nos brindan en
cada momento para que podamos realizar nuestros sueos y anhelos
convirtindonos en unas personas exitosas.
Por ltimo nuestro agradecimiento hacia su persona Ing. Guillermo G. Arriola

Carrasco por brindarnos el conocimiento necesario para la realizacin de
nuestro presente proyecto y su apoyo en el laboratorio de hidrulica.

4
RESUMEN
Las Redes Neuronales Artificiales (RNA) constituyen una herramienta que se

ha aplicado en las ltimas dcadas a distintos campos del conocimiento (desde
la robtica a la psicologa), con buenos resultados. La Hidrologa utiliza las
RNA fundamentalmente para problemas de prediccin de lluvias, caudales,
transformacin lluvia-escorrenta, optimizacin en el proceso de planeamiento,
gestin y monitoreo de aguas superficiales y subterrneas.
La ventaja principal en la aplicacin de tal herramienta en Hidrologa es la

posibilidad de mapear relaciones no-lineales. Dentro del amplio espectro de las
RNA, este trabajo presenta una aplicacin especfica de las redes para la
modelizacin y generacin de series hidrolgicas en la cuenca del rio
Chicama y plantea una metodologa que permitir explorar la potencialidad de
las RNA para hacer regionalizacin hidrolgica de caudales a partir de
relaciones estadsticas entre los pesos de las neuronas que conforman la red y
las variables geomorfolgicas de las reas tributarias a las estaciones
hidromtricas.
El modelo propuesto presenta una arquitectura de red multicapa (feedforward)

que comprende tres capas (entrada, oculta y salida), el nmero de neuronas de
entrada y ocultas varan de acuerdo al modelo. La funcin de entrenamiento
para el modelamiento de las cuencas el Bayesian regulation backpropagation.
La fase de entrenamiento y validacin de los modelos con redes neuronales
artificiales se realizaron utilizando diferentes cantidad datos de entrada.
5
INDICE GENERAL
DEDICATORIA ................................................................................................................................ 3
AGRADECIMIENTO........................................................................................................................ 4
RESUMEN ...................................................................................................................................... 5
INDICE GENERAL ........................................................................................................................... 6
INTRODUCCIN ............................................................................................................................ 8
CAPTULO I: PLANTEAMIENTO DEL PROBLEMA ........................................................ 11
1.1. SITUACIN PROBLEMTICA ....................................................................................... 11
1.1.2. A NIVEL NACIONAL .............................................................................................. 12
1.2. FORMULACIN DEL PROBLEMA................................................................................. 15
1.3. DELIMITACIN DE LA INVESTIGACIN....................................................................... 15
1.4. JUSTIFICACIN E IMPORTANCIA ................................................................................ 15
1.5. LIMITACIONES DE LA INVESTIGACIN ....................................................................... 16
1.6. OBJETIVO .................................................................................................................... 16
1.6.1. OBEJETIVO GENERAL ........................................................................................... 16
1.6.2. OBJETIVO ESPEFICFICO....................................................................................... 17
CAPTULO II: MARCO TERICO ........................................................................................ 19
2.1. ANTECEDENTES DE ESTUDIO ...................................................................................... 19
2.2. BASE TERICA CIENTFICA .......................................................................................... 23
2.2.1. Redes Neuronales Artificiales.............................................................................. 23
CAPITULO III: MARCO METODOLGICO ........................................................................ 51
3.1. Tipo y diseo de la investigacin: ................................................................................... 51
3.1.1. Tipo de la investigacin: ............................................................................................ 51
3.1.2. Diseo de la investigacin: ........................................................................................ 51
3.2. Poblacin y muestra: ....................................................................................................... 51
3.3. Hiptesis .......................................................................................................................... 51
3.4. Variables: ......................................................................................................................... 52
3.5. Mtodos, tcnicas e instrumentos de recoleccin de datos: ........................................ 52
3.5.1 Mtodos de Investigacin: ......................................................................................... 52
3.5.2. Tcnicas de recoleccin de los datos: ....................................................................... 53
3.5.3. Descripcin de los instrumentos utilizados:.............................................................. 53
CAPITULO IV: ANALISIS E INTERPRETACIN DE RESULTADOS ........................... 55
4.1 Ubicacin y caractersticas generales del rea de la cuenca en estudio. ...................... 55
4.1.1. Ubicacin. .................................................................................................................. 55
4.1.2 Caractersticas climticas ........................................................................................... 55
6
4.1.3 El uso del suelo. ......................................................................................................... 55
4.1.4. Precipitacin media:.................................................................................................. 56
4.1.5 Caractersticas hidrolgicas de la cuenca................................................................... 57
4.2 Materiales y Mtodos ...................................................................................................... 57
4.2.1 Materiales.................................................................................................................. 57
4.2.2 Definicin de los datos. .............................................................................................. 57
4.2.3 Identificacin de variables de entrada. ...................................................................... 58
4.2.4 Implementacin de arquitecturas de redes neuronales. ........................................... 58
4.2.5 Mtodos. .................................................................................................................... 59
4.2.6 Desarrollo de los mtodos. ........................................................................................ 60
4.2.7 Modelo Presentado para su anlisis. ......................................................................... 63
4.2.8 Anlisis con la herramienta de identificacin de sistemas de Matlab. ...................... 63
4.2.9 Implementacin en Matlab herramienta de redes neuronales NNTool. ............. 63
4.2.10 Anlisis microcuenca el Perejil. ................................................................................ 67
4.2.11 Anlisis cuenca Chicama........................................................................................... 68
4.3 Anlisis De Resultados...................................................................................................... 68
4.3.1 Microcuenca El Perejil. ............................................................................................... 70
CONCLUSIONES ........................................................................................................................... 72
RECOMENDACIONES .................................................................................................................. 73
BIBLIOGRAFA ............................................................................................................................. 74
7
INTRODUCCIN
La disponibilidad de agua en cantidad y calidad insuficientes para la atencin
de los diversos usos y usuarios es sin duda uno de los ms serios problemas a
ser enfrentados en el manejo de los recursos hdricos en una cuenca
hidrogrfica. Generalmente, la asignacin de agua para la atencin de las
demandas est condicionada por la disponibilidad de agua en el espacio y
tiempo, por lo que se hace necesario conocer con aproximacin la
disponibilidad presente y futura del recurso hdrico, con la finalidad de formular
propuestas actuales y futuras para una adecuada gestin de stos (Laqui,
2008). Debido a la escasa y limitada informacin de caudales de los ros del
altiplano peruano, especialmente en la cuenca del ro Huancan, en general se
ha utilizado modelos de transformacin lluvia-caudal, como Tmez (Sovero,
1991) y Lutz Scholz (Nina, 2008). La transformacin de lluvia en caudal es uno
de los procesos ms difciles de ser entendidos, debido al gran nmero de
variables que se modifican en el espacio y tiempo (Weigert, 2005), as como
la limitacin de datos hidrometeorolgicos y la no linealidad del proceso que
dificultan la utilizacin de este tipo de modelos (Santos & Pereira, 2003).
El anlisis y previsin de caudales estacionales es de fundamental importancia
en el planeamiento y operacin de sistemas de recursos hdricos. Una de las
dificultades en la previsin de esas series es su naturaleza no estacionaria
debido a los periodos de lluvia y estiaje durante el ao. Estas previsiones son
realizadas, actualmente, por metodologas basadas en modelos de series
temporales y se recomienda los modelos autorregresivos peridicos (Ballini et
al., 2003). Dada la importancia de la modelizacin y previsin de caudales
medios mensuales, durante las ltimas dcadas se han propuesto gran
variedad de modelos, y muy recientemente se han introducido nuevos modelos,
que manejan de una manera eficiente la aleatoriedad de los caudales y
presentan una fcil adaptabilidad a nuevos datos, sin la necesidad de recurrir a
laboriosas formulaciones matemticas. Entre estos modelos se incluyen las
tcnicas de inteligencia artificial, que comprenden las tcnicas de Redes
Neuronales Artificiales, Sistemas Fuzzy y Neuro-Fuzzy (Ziga & Jordn,
2005), Teora Nebulosa, Sistemas Multi-Agentes.
8
Los modelos de Redes Neuronales Artificiales (RNA) tienen entre sus
principales caractersticas: tratan incertezas de fcil adaptabilidad a nuevos
datos y abstraen el conocimiento fsico de los sistemas a ser modelados, ya
que el modelo puede ser generado nicamente a partir de datos de entrada y
salida (Ballini, 2000). Con el objetivo de superar las deficiencias de los modelos
matemticos se ha incrementado el nmero de trabajos que utilizan modelos
basados en redes neuronales artificiales (Figueiredo et al., 2007). Entre sus
principales aplicaciones en la solucin de problemas relacionados a recursos
hdricos, tenemos la previsin de caudales (Ballini, 2000; Zuiga & Jordn,
2005; Laqui, 2008; Bravo et al., 2008; Gomes & Lima, 2010, Cruz et al.,
2010 ), modelamiento lluvia-caudal (Baganha, 1999; Tokar & Markus, 2000;
Weigert, 2005), operacin de reservorios (Kilin & Ciizolu, 2003) y otras
aplicaciones relacionadas a los recursos hdricos (Magalhes, 2004; Hillman
et al., 2004; Ovanto et al., 2005; Jaimes, 2006; Gibilini, 2006), obtenindose en
todos buenos resultados.
Debido a la gran importancia que tiene la determinacin y previsin de

caudales, es necesaria la adopcin de estos nuevos modelos como
instrumentos de modelizacin y posterior previsin, para que permitan conocer
con cierta exactitud y facilidad los caudales medios mensuales actuales y
futuros del ro Huancan, que permitir su uso racional para diferentes fines.
Esta investigacin se enfoca en la aplicacin de redes neuronales artificiales a
la modelizacin y previsin de caudales medios mensuales del ro Huancan,
el desarrollo de modelos basados en redes neuronales artificiales para la
modelizacin y previsin de caudales medios mensuales, a partir de datos
medios mensuales de caudales, precipitacin y evaporacin; as como la
determinacin de la capacidad de desempeo de estos modelos como
instrumento de previsin de caudales medios mensuales del ro Huancan
frente a modelos de series temporales estocsticas.
9
CAPTULO I
PLANTEAMIENTO DEL
PROBLEMA
10
CAPTULO I: PLANTEAMIENTO DEL PROBLEMA
1.1. SITUACIN PROBLEMTICA
1.1.1. A NIVEL INTERNACIONAL
En la actualidad los profesionales e investigadores de los recursos hdricos,

enfrentan la problemtica de escasez de datos hidrolgicos, para
desarrollar los diversos estudios y trabajos dentro de cada campo al que
ellos se dediquen, convirtiendo esto en una necesidad imperativa para
poder realizar los clculos requeridos. En vista de esta problemtica y para
poder solucionarla, se emplean metodologas de simulacin hidrolgica
como un instrumento para generar informacin que les permita la toma de
decisiones en la planificacin y gestin de los recursos naturales dentro de
una cuenca hidrogrfica.
Siendo de gran importancia la modelacin y prediccin de caudales medios

mensuales, para conocer crecidas mximas y sequias en las diversas
cuencas de estudio, se han empleado mtodos estadsticos basados en
modelos como el Box- Jenkins, los cuales son efectivos, pero demandan
variables estacionarias, normalmente distribuidas, adems que requieren
de un complejo trabajo para encontrar un modelo estructural adecuado,
manejo de varios parmetros y dificultades en la estimacin de los valores
adecuados .
En vista a estos inconvenientes en la modelizacin se ha optado por utilizar

Redes Neuronales Artificiales (RNA), las cuales intentan ser una emulacin
inteligente del comportamiento de los sistemas biolgicos del cerebro, en
donde la neurona es el elemento fundamental. Los modelos de Redes
Neuronales Artificiales (RNA) tienen como una de sus principales
caractersticas: tratan incertezas de fcil adaptabilidad a nuevos datos y
abstraen el conocimiento fsico de los sistemas a ser modelados, ya que el
modelo puede ser generado nicamente a partir de datos de entrada y
salida.
11
La presente investigacin tiene como propsito el desarrollo de modelos de
simulacin hidrolgica usando redes neuronales artificiales, el
entrenamiento se efectuar a partir de datos de precipitacin y caudales
antecedentes de las cuencas.
Las redes neuronales sern utilizadas para la obtencin de caudales, de la

cuenca Chicama, dados los datos de precipitacin, y datos histricos de
caudal como variables de entrada. Este modelo recibe la informacin de
cada estacin. Para elaborar un modelo matemtico distribuido es
necesario tener informacin ms a detalle de la cuenca, como tipo de suelo,
pendientes del terreno, vegetacin, uso del suelo, evaporacin,
evapotranspiracin, etc., lo que hace dificultoso su implementacin debido a
la falta de estos parmetros.
Por esta razn al utilizar las redes neuronales para la elaboracin de un

modelo distribuido, tenemos la ventaja de la independencia de estas
variables, debido a que esta busca la funcin de ajuste de los datos de
entrada con los de salida, en este caso, los datos de entrada serian la
precipitacin y los caudales histricos, y los datos de salida son los
caudales futuros.
1.1.2. A NIVEL NACIONAL
En el Per el primer programa de Manejo de Cuencas, fue organizado por el

Ministerio de Agricultura en 1974, pero es en 1980 cuando se inician las
acciones con el Programa Nacional de Conservacin de suelos y Agua en
Cuencas Hidrogrficas financiado por el AID, programa que dio origen a lo que
ahora se conoce como PRONAMACHS (Entidad que forma parte del Ministerio
de Agricultura). Tambin es necesario rescatar que en nuestros andes
peruanos se tiene como componente principal de la ecorregin andina: El
sistema de montaas que presentan una infinidad de cuencas hidrogrficas.
Cabe mencionar que el desarrollo poltico y econmico de una regin

depender en muchos casos de las decisiones y de una adecuada gestin del
12
recurso de agua. Es por ello que la hidrologa nos brinda los conocimientos
necesarios para realizar un Estudio Integral de las Cuencas para as
aprovechar los recursos Hdricos que disponemos de la manera adecuada.
El Per se ubica en la zona ecuatorial de Amrica del Sur, pero su clima no

corresponde a su ubicacin geogrfica por dos factores fundamentales, la
Cordillera de los Andes y la fra corriente marina de Humboldt, llamada tambin
corriente peruana.
La corriente Peruana y el relieve geogrfico del Per condicionan las

caractersticas climatolgicas para tres grandes zonas (de oeste a este), la
costa, la zona andina o sierra, y la zona amaznica o selva, correspondiendo
para cada una de ellas caractersticas particulares climticas.
La costa presenta un clima templado en general, clido en el norte, algo ms

fro al centro y sur. Las lluvias son casi inexistentes a excepcin de la zona
norte, en donde se presentan fuertes precipitaciones en los meses de verano.
En algunas zonas de la costa central y sur, como las ciudades
de Lima y Arequipa, en los meses de invierno son notorias la presencia de
precipitaciones muy tenues, llamadas gara o chachani.
La zona andina o sierra tiene en general un clima fro y seco, en la zona norte
las precipitaciones son ms intensas.
La zona amaznica o selva tiene un clima tropical, caluroso y hmedo, con

presencia de lluvias torrenciales, que se incrementan en los meses de verano.
Considerando que las descripciones anteriores son muy genricas y los

relieves geogrficos son muy variados, acudiremos a presentar la clasificacin
climtica internacional de Kppen, que establece 11 climas principales, de los
cuales el Per posee 8, motivo por el cual el Per posee una diversidad
climtica nica en el mundo.
Clima semiclido muy seco: (desrtico, rido, subtropical). Temperatura

promedio es de 19C. - 66.2F. Este clima se presenta en casi toda la
regin de la costa, desde Piura hasta Tacna y desde el litoral marino
hasta los 2,000 msnm. (6,060 pies). La corriente Peruana de aguas fras
13
transmite su frialdad a la costa, y es la causa de la ausencia de lluvias
durante todo el ao.
Clima clido muy seco: (desrtico o rido tropical). Temperatura
promedio es 24C. - 75.2F. Este clima se presenta en la costa del norte
del Per desde Piura hasta Tumbes y desde el litoral marino hasta
zonas a 1,000 msnm. (3,030 pies). Presencia de fuerte lluvias entre los
meses de diciembre hasta abril, y muy seco desde mayo a noviembre,
debido a la influencia de la corriente marina del Nio.
Clima templado subhmedo: (estepa y valles interandinos bajos).
Temperatura promedio es 20C. - 68F., con lluvias estacionales. Este
clima se presenta en la zona andina y fundamentalmente se da en los
valles interandinos ubicados entre los 1,000 y 3,000 msnm. (3,030 y
9,090 pies).
Clima fro o boreal: (valles mesoandinos). Temperatura promedio es
12C. - 53.6F., veranos lluviosos e inviernos secos con fuertes heladas.
Este clima corresponde a la zona andina entre los 3,000 y 4,000 msnm.
(9,090 12,121 pies).
Clima frgido: (tundra) Temperatura promedio es 6C. - 42.8F., con
veranos muy fros y secos. Este clima corresponde a la zona andina
entre los 4,000 y 5,000 msnm. (12,121 y 15,151 pies).
Clima de nieve: (glido) Temperatura promedio es 0C. - 32F. o
menores. Este clima corresponde a la zona andina desde los 5,000
msnm. (15,151 pies) a ms. El clima est influido por las grandes masas
de nieve y hielo que se forman normalmente en las altas cumbres
andinas; en esta zona se originan las lagunas y glaciares que dan origen
a los ros de las cuencas del Pacfico o del Amazonas.
Clima semiclido muy hmedo: (vertiente oriental andina). Temperatura
promedio es 22C. - 71.6F., con tendencia a aumentar en territorios de
menores alturas, permanentes precipitaciones durante todo el ao. Este
clima corresponde a la selva alta, ubicada sobre zona andina oriental
entre los 1,000 y los 400 msnm. (3,030 y 1,212 pies).
Clima clido hmedo: (llanura amaznica). Temperatura promedio es
25C. - 77F., sin diferencias notables de temperatura durante todo el
ao. Este clima corresponde a la selva baja, ubicada sobre la llanura
14
amaznica entre los 400 y los 80 msnm. (1,212 y 242 pies). Las lluvias
son torrenciales, especialmente en los meses de verano, originando una
exuberante flora y una rica fauna.
1.2. FORMULACIN DEL PROBLEMA
Cmo modelar y generar series hidrolgicas aplicando redes neuronales

en la Cuenca del Rio Chicama?
1.3. DELIMITACIN DE LA INVESTIGACIN
La cuenca del Ro Chicama se ubica geogrficamente entre los

paralelos 7 21 y 7 59 de latitud sur y los meridianos 78 14 y 79 20
de longitud oeste. Siendo su extensin total de 5,822 Km 2.
Altitudinalmente se extiende desde el nivel del mar hasta la lnea de las
cumbres de la cuenca del Rio Maran llegando a una altura
aproximada de 4,297 m.s.n.m.
Esta investigacin estuvo a cargo por los estudiantes de la Escuela de

Ingeniera civil de la Universidad Seor de Sipn: Malhaber Montenegro
Miguel, Chingay Gonzales Gary y Pea enjhor. Este proyecto de
investigacin tendr una duracin aproximadamente de 14 semanas,
empezando desde abril hasta julio del 2016.
1.4. JUSTIFICACIN E IMPORTANCIA
Tres son las razones principales que hacen importante la investigacin que se
desarrolla en este trabajo.
Como primera motivacin del tema es que desde el punto de vista

netamente cientfico es relevante la validacin de modelos frente a la
realidad fsica. Como se ha mencionado anteriormente, en este trabajo
el modelo a ser validado es el de redes neuronales para la prediccin de
15
caudales en un punto de la cuenca del rio Chicama, con un tiempo de
avance de un da.
La segunda es netamente funcional, ya que el tener una herramienta

computacional confiable en tiempo real para prediccin de caudales con
tiempo de avance de un da es muy importante para operaciones y
maniobras dentro de algn proyecto hidroelctrico.
La tercera es incursionar en el uso de modelos data driven, por

razones de facilidad de implementacin, ya que no se necesita la
informacin requerida por los modelos fsicos o matemticos, y por su
costo relativamente inferior al de los modelos citados anteriormente.
1.5. LIMITACIONES DE LA INVESTIGACIN
Nuestra presente investigacin se vio limitada con los datos de estaciones

pluviomtricas.
Los datos de las mismas fueron analizados con modelos probabilsticos,

excluyendo los otros tipos de modelos existentes.
1.6. OBJETIVO
1.6.1. OBEJETIVO GENERAL
Aplicar redes neuronales, para la generacin de series hidrolgicas en la

Cuenca del Rio Chicama.
16
1.6.2. OBJETIVO ESPEFICFICO
Utilizar el concepto de redes neuronales para la obtencin de datos

hidrolgicos.
Determinar una red neuronal ptima, para la prediccin de caudales

en la Cuenca del Rio Chicama.
Comprobar la validez de los modelos aplicados, por medio de

anlisis estadsticos.
17
CAPTULO II
MARCO TERICO
18
CAPTULO II: MARCO TERICO
2.1. ANTECEDENTES DE ESTUDIO
Aplicacin de Redes Neuronales Artificiales a la Modelizacin y

Previsin de Caudales Medios Mensuales del Ro Huancan - En
este trabajo se desarrollaron modelos basados en redes neuronales
artificiales del tipo retro propagacin, para la modelizacin y previsin de
los caudales medios mensuales del ro Huancan, a partir de datos
medios mensuales de caudales, precipitacin y evaporacin. El
entrenamiento y la validacin de los modelos de redes neuronales
artificiales se realizaron utilizando 39 aos de informacin meteorolgica
correspondiente a estaciones localizadas en la cuenca del ro Huancan,
separados en 33 aos como conjunto de datos de entrenamiento y 6
aos como conjunto de datos de validacin. Los modelos de redes
neuronales artificiales para la modelizacin y previsin de los caudales
medios mensuales del ro Huancan mostraron un excelente
comportamiento en trminos de medidas de error, frente a un modelo
autorregresivo peridico de primer orden - PAR (1).
Sistemas Inteligentes para el ajuste de Modelos Hidrolgicos.

Aplicacin al Ro Paran - El objetivo principal de esta tesis doctoral
es la implementacin de sistemas inteligentes para el ajuste de modelos
hidrolgicos, utilizando para ello series temporales y redes neuronales,
aplicados a modelos hidrolgicos o de onda cinemtica, que permitan el
aprendizaje y ajuste de parmetros para la obtencin de modelos que
realicen predicciones optimas de las alturas del ro Parana, en
perodos crticos de inundaciones. Se realiza un anlisis con series
temporales que permite establecer las variables y factores que
determinan las alturas hidromtricas, en perodos crticos de inundacin
en la localidad de Corrientes. Posteriormente se presenta un pronstico
a corto plazo en perodos de crecidas, que predice las alturas
hidromtricas a tres das implementando redes neuronales con funcin
19
de penalizacin modificada. Se finaliza con un pronstico a mediano
plazo, para perodos de inundacin, de alturas hidromtricas a siete das
que se realiza con redes neuronales que integran redes neuronales con
diferentes arquitecturas. El inters de este proyecto radica en su
aplicacin para el pronsticos de crecidas en la provincia de Corrientes,
Repblica Argentina, que actualmente no dispone de ningn sistema de
pronstico de crecidas del Ro Parana en organismos oficiales de la
provincia, por lo cual el desarrollo del mencionado trabajo sera de gran
importancia provincial y regional para una mejor prediccin de las
crecidas del Ro, que ocasionan perdidas de gran importancia en la
economa de la regin. As mismo, el problema genrico planteado en
este proyecto es comn a otras muchas situaciones, donde se podran
aplicar los resultados obtenidos en la realizacin de esta tesis, como son
las dems provincias que se encuentran en las mrgenes del Ro
Paran.
MATLAB en hidrologa - El presente trabajo de investigacin tiene

como finalidad simular informacin de caudales medios mensuales en
las cuencas hidrogrficas: Ro Guayllabamba, Ro Quijos, Ro Chico, Ro
Pindo, adems datos diarios de la cuenca Catamayo, y la El Limn,
mediante el uso de redes neuronales artificiales, para la obtencin de
nuevos caudales, tomando como datos de entrada las precipitaciones y
caudales histricos de las cuencas. El modelo propuesto presenta una
arquitectura de red multicapa (feedforward) que comprende tres capas
(entrada, oculta y salida), el nmero de neuronas de entrada y ocultas
varan de acuerdo al modelo. La funcin de entrenamiento para el
modelamiento de las cuencas el Bayesian regulation backpropagation.
La fase de entrenamiento y validacin de los modelos con redes
neuronales artificiales se realizaron utilizando diferentes cantidad datos
de entrada, dependiendo de la cuenca.
20
modelos matemticos hidrodinmicos de calidad de aguas - el inh
con el fin de contribuir a la divulgacin de informacin de inters,
relevante para el desarrollo de estudios hidrulicos en el pas, ha
querido contribuir con el presente documento para presentar un listado y
breve resea del los modelos (software) hidrodinmico ms utilizados
actualmente por la comunidad internacional. dado el gran desarrollo que
ha experimentado esta rea en los ltimos 10 aos, donde actualmente
existen numerosos modelos, la mayora especializados en una
problemtica o rea en particular, es que, en esta ocasin, se
presentarn aquellos modelos aplicables a los estudios de hidrodinmica
ambiental en zonas costeras y estuarios. a futuro, se presentarn
publicaciones similares a aquellos modelos relevantes en otras reas de
inters como por ejemplo, el area fluvial, la modelacin en estudios de
inundacin en ros y costas, modelos para la propagacin de tsunamis,
modelos de calidad de aguas en embalses, modelos para la propagacin
de oleaje ocenico y local, hidrologa y aguas subterrneas.
Redes Neuronales Artificiales para la simulacin, estimacin y

control de caudales impulsados por estaciones de bombeo en
zonas regables - En este trabajo se propone la prediccin de la
demanda en las prximas 24 horas en un sistema de distribucin de
agua para riego, y se utilizan, junto con los mtodos tradicionales de
prediccin de Regresiones Lineales Mltiples (RLMs), los modelos
heursticos de Redes Neuronales Artificiales (RNAs). Se dispone de los
datos de los caudales diarios impulsados, desde mayo de 2005 hasta
abril de 2008, de la estacin de bombeo del sector II de la zona regable
de Palos de la Frontera (Huelva). Los modelos se establecen
considerando la relacin entre los datos presentes y pasados de los
caudales impulsados, y tambin se analiza la influencia de datos
climticos diarios (temperatura mxima, temperatura mnima,
temperatura media, humedad relativa mxima, humedad relativa
mnima, humedad relativa media, velocidad del viento, direccin del
viento, radiacin solar, precipitacin y evotranspiracin potencial). Las
21
mejores estimaciones se consiguen con el modelo neuronal que
considera como variables de entrada los caudales de los siete das
previos, las temperaturas mximas de nueve y diez das anteriores al de
estimacin, las temperaturas mnimas de uno y dos das anteriores, la
humedad relativa mnima del da anterior, la precipitacin del da anterior
y la evotranspiracin potencial de diez das previos al de estimacin.
Esta aproximacin neuronal implica magnitudes de evaluacin muy
satisfactorias (coeficiente de determinacin de R2=0.72 e ndice de
persistencia de PI=0.25) y mejores que la del modelo de regresin
(coeficiente de determinacin de R2=0.69 e ndice de persistencia de
PI=-0.25).
Redes neuronales artificiales. Prediccin de alturas del rio Paran -

El objetivo del trabajo es la prediccin de alturas del rio Paran con
redes neuronales, en perodos de inundacin, en ciudades ribereas de
la provincia de Corrientes, Argentina, con el fin de proteger las ciudades
costeras de inundaciones del mencionado rio, como la ciudad capital de
Corrientes y ciudades del interior de la provincia que son afectadas por
las inundaciones que ocasionan grandes prdidas en las econmicas
regionales. Se comenz con un anlisis con redes neuronales
estndares y con el fin de reducir el error de prediccin, se implemento
una funcin de penalizacin no estndar, que se vuelve asimtrica
segn se incrementa la altura del rio, que considera el hecho de que una
sobreestimacin es menos riesgosa que una subestimacin, aun cuando
ambas son indeseables. Los resultados finales con redes neuronales
con funcin de penalizacin no estndar, presentan un error medio de
prediccin absoluta de 0,12 m, que es un valor bastante aceptable; la
subestimacin se produce en el 15% de las predicciones,
correspondiendo los mayores errores en valores absolutos a las
predicciones sobreestimadas. Estos resultados hacen que la prediccin
de altura del rio en periodos de inundacin sea confiable, dando al
modelo gran utilidad y aplicabilidad en periodos crticos de crecidas.
22
2.2. BASE TERICA CIENTFICA
2.2.1. Redes Neuronales Artificiales
Son modelos computacionales que tratan de replicar, de manera simplificada,

el complejo funcionamiento del cerebro humano. Su capacidad de aprendizaje
a travs de ensayos repetidos las hace muy utilizables en una amplia variedad
de aplicaciones en todas las ciencias. Han demostrado ser una herramienta
muy til por su sorprendente habilidad para capturar relaciones no lineales
entre variables. De hecho, pueden aproximar cualquier funcin no lineal si son
correctamente especificadas.
En 1943, Warren McCulloc y Walter Pitts originaron el primer modelo de

operacin neuronal, el cual fue mejorado en sus aspectos biolgicos por
Donald Hebb en 1948. En 1962 Bernard Widrow propuso la regla de
aprendizaje Widrow-Hoff, posteriormente Frank Rosenblatt desarroll una
prueba de convergencia y defini el rango de problemas para los que su
algoritmo aseguraba una solucin, el propuso los Perceptrones como
herramienta computacional.
El cerebro humano continuamente recibe seales de entrada de muchas

fuentes y las procesa a manera de crear una apropiada respuesta de salida;
nuestros cerebros cuentan con millones de neuronas que se interconectan para
elaborar redes neuronales, estas redes ejecutan los millones de instrucciones
necesarias para mantener una vida normal. Las neuronas son las clulas que
forman la corteza cerebral de los seres vivos, cada una est formada por
elementos llamados cuerpo, axn y dendritas, como se muestra en la Figura 1.
Las dendritas forman una estructura de filamentos muy fina que rodean el
cuerpo de la neurona, el axn es un tubo largo y delgado que se ramifica en su
extremo en pequeos bulbos finales que casi tocan las dendritas de las clulas
vecinas, la pequea separacin entre los bulbos finales y las dendritas se le
denomina sinapsis.
23
Figura 1: Descripcin de una neurona natural.
Las neuronas, al igual que las dems clulas del cuerpo, funcionan a travs de
impulsos elctricos y reacciones qumicas. Los impulsos elctricos que utiliza
una neurona para intercambiar informacin con las dems viajan por el axn
que hace contacto con las dendritas de la neurona vecina mediante las
sinapsis; la intensidad de la corriente transmitida depende de la eficiencia de la
transmisin sinptica. Una neurona en especial transmitir un impulso elctrico
por su axn; adems cada neurona en un tiempo corto recibe varias seales de
las neuronas vecinas que transmiten a travs de sus dendritas; la seal que se
transmite a la neurona podr ser adems inhibitoria o excitatoria. La neurona
manda el impulso por su axn si la excitacin que recibe de sus neuronas
vecinas excede su inhibicin por un valor crtico, que supera el umbral de
activacin de la neurona. Las redes neuronales artificiales estn compuestas
de gran cantidad de procesadores conectados entre si y actuando en paralelo.
Los modelos neuronales biolgicos son mucho ms complejos que los modelos
computacionales actuales, estando el comportamiento de la red determinado
por su topologa, los pesos de las conexiones y la funcin caracterstica de las
neuronas.
24
En la Figura 2, puede observarse una comparacin entre los procesos de una
neurona natural y una artificial.
Figura 2: Comparacin entre neurona natural y neurona artificial.
Funcin de Activacin
La funcin de activacin de un nodo define la salida de ese nodo dada una
entrada o un conjunto de entradas, la neurona necesita saber si se activa o
inhibe; de activarse emite o transfiere un impulso a las neurona s adyacentes y
para ello debe cumplirse la condicin para activarse y ejecutar la expresin de
salida que transmite a otra neurona. Ambas funciones son del tipo f(xi, wi, dj),
que dependen de las entradas, sus pesos y de un parmetro variable de ajuste.
Esto se entiende de la siguiente manera: para cada grupo de entradas i hay
otro grupo de salidas j. Las Funciones de Activacin pueden ser:
Funciones Lineales:
f(x) = x
25
Funciones Paso: Dan una salida binaria dependiente de si el valor de
entrada est por encima o por debajo del valor umbral.
Funciones Sigmoidales: Funciones montonas acotadas que dan una

salida gradual no lineal.
La funcin logstica de 0 a 1, ver la grfica en la Figura 3:
Figura 3: La funcin logstica de 0 a 1.
La funcin tangente hiperblica de 1 a 1, ver la grfica en la Figura 4:
Figura 4: La funcin tangente hiperblica de 1 a 1.
26
2.2.2. Neurona o Unidad Procesadora
Todo modelo de red neuronal consta de dispositivos elementales de

procesamiento: las neuronas. A partir de ellas, se pueden generar
representaciones especficas, de tal forma que un estado conjunto de ellas
pueda significar una letra, un nmero o cualquier otro objeto.
Generalmente se pueden encontrar tres tipos de neuronas:
Figura 5: Descripcin de una Neurona Artificial.
1. Aquellas que reciben estmulos externos, relacionas con el aparato

sensorial, que tomaran la informacin de la entrada, denominadas
unidades de entrada.
2. Dicha informacin se transmite a ciertos elementos internos que se

ocupan de su proceso. Es la sinapsis y neuronas correspondientes a
27
este segundo nivel donde se genera cualquier tipo de representacin
interna de la informacin. Puesto que no tienen relacin directa con la
informacin de entrada y de salida, estos elementos se denominan
unidades ocultas.
3. Una vez finalizado el periodo de procesado, la informacin llega a las

unidades de salida, cuya misin es dar la respuesta del sistema.
La neurona artificial, que se detalla en la Figura 5, intenta modelar el

comportamiento de la neurona biolgica, aqu el cuerpo de la neurona se
representa como una sumatoria lineal de los estmulos externos zj, seguida de
una funcin no lineal yj = f(zj). La funcin f(zj), es llamada la funcin de
activacin o funcin neuronal y es la funcin que utiliza la suma de estmulos
para determinar la actividad de salida de la neurona.
Red Neuronal Artificial
Una red neuronal artificial (RNA) es un par (N, U), donde N es un conjunto de
nodos y U es un conjunto de unidades procesadoras sobre N que satisface la
siguiente condicin: cada nodo Xi N tiene que ser un nodo de entrada o de
salida de al menos una unidad procesadora de U. Analizando la red neuronal
de la Figura 6, se tendra el siguiente conjunto de unidades procesadoras U,
sobre N.
28
Figura 6: Descripcin de una Red Neuronal Artificial.
Arquitecturas de Red
Las redes neuronales artificiales replican el comportamiento de las redes

neuronales naturales, interconectando neuronas artificiales organizadas en
capas, presentando arquitecturas diferentes, como puede apreciarse en la
Figura 7, que presenta un perceptron simple y un perceptron multicapa.
La arquitectura de una red neuronal se forma conectando mltiples

procesadores elementales, organizados en diferentes capas, como puede
observarse en la Figura 8, siendo este un sistema adaptivo que posee un
algoritmo para ajustar sus pesos (parmetros libres) para alcanzar los
requerimientos de desempeo del problema, basado en muestras
representativas. Por lo tanto se puede sealar que es un sistema de
computacin distribuida que se caracteriza por:
29
Figura 7: Arquitecturas de redes neuronales artificiales.
Un conjunto de unidades elementales, cada una de las cuales posee

bajas capacidades de procesamiento.
Una densa estructura interconectada usando enlaces ponderados.

Parmetros libres que deben ser ajustados para satisfacer los
requerimientos de desempeo.
Un alto grado de paralelismo.
Figura 8: Ejemplo de una red neuronal que realiza un diagnostico medico.
30
La arquitectura de las redes neuronales consiste en la organizacin y
disposicin de las neuronas formando capas ms o menos alejadas de la
entrada y salida de la red, como puede observarse en la Figura (2.16), siendo
en este sentido, los parmetros fundamentales de la red: el nmero de capas,
el nmero de neuronas por capa, el grado de conectividad y el tipo de
conexiones entre neuronas. Segn los tipos de conexiones que conectan a las
neuronas de cada capa o de distintas capas, se identifican los siguientes tipos
de conexiones:
Conexiones hacia Delante: Existe una capa de entrada con n neuronas y

una capa de salida con m neuronas y al menos una capa oculta de
neuronas internas. Cada neurona de una capa, excepto las de entrada,
recibe entradas de todas las neuronas de la capa anterior y enva su
salida a todas las neuronas de la capa posterior, excepto las de salida.
No hay conexiones hacia atrs ni laterales entre neuronas de la misma
capa. La estructura de este tipo de redes puede observarse en la Figura
9.
Conexiones Laterales: Un ejemplo tpico de este tipo es el circuito el

ganador toma todo, que cumple un papel importante en la eleccin del
ganador. La estructura de este tipo de redes se presenta en la Figura 10.
Conexiones hacia Atrs o Recurrentes: Adems de la red contar con las

conexiones hacia adelante estas redes incorporan conexiones hacia
atrs y llevan los datos de las neuronas de una capa superior a otras de
la capa inferior. La estructura de este tipo de redes puede observarse en
la Figura 11.
31
Figura 9: Conexiones hacia delante.
Figura 10: Conexiones laterales.
Figura 11: Conexiones hacia atrs o recurrentes.
32
Entrenamiento de una Red Neuronal
En el entrenamiento se presentan las entradas y respuestas deseadas,

entonces la red neuronal partiendo de un conjunto de pesos sinpticos
iniciales, inicia el proceso de aprendizaje que busca un conjunto de pesos que
permitan a la red desarrollar correctamente la salida deseada, minimizando los
errores. Los valores de entrada se recomiendan que previamente sean de
algn modo transformados a una escala.
Existen dos fases en el entrenamiento de toda aplicacin de las redes

neuronales: la fase de aprendizaje y la fase de prueba, con las siguientes
caractersticas:
Fase de Aprendizaje: Una caracterstica de las redes neuronales es su

capacidad de aprender. Aprenden por la actualizacin o cambio de los pesos
sinpticos que caracterizan a las conexiones. Los pesos son adaptados de
acuerdo a la informacin extrada de los patrones de entrenamiento nuevos
que se van presentando. Normalmente, los pesos ptimos se obtienen
optimizando (minimizando o maximizando) alguna funcin de energa. Por
ejemplo, un criterio popular en el entrenamiento supervisado es minimizar el
error cuadrtico medio, entre el valor deseado y el valor de salida de la red.
Fase de Prueba: Una vez calculados los pesos de la red, las neuronas de la
ultima capa se comparan con la salida deseada para determinar la validez del
diseo. Una buena implementacin prctica radica en el nmero adecuado de
neuronas, en el nmero idneo de capas ocultas, la extensin de la funcin de
activacin, el tiempo de entrenamiento de la red, las implicaciones de la
generacin de ruido.
Mtodos de Aprendizaje en Redes Neuronales
Es importante sealar que la propiedad ms importante de las redes

neuronales artificiales es su capacidad de aprender a partir de un conjunto de
patrones de entrenamientos, es decir, es capaz de encontrar un modelo que
33
ajuste los datos. El proceso de aprendizaje tambin conocido como
entrenamiento se realiza mediante patrones-ejemplo, siendo dos los tipos de
aprendizaje: supervisado y no supervisado.
El Aprendizaje Supervisado: consiste en entrenar la red a partir de un

conjunto de datos o patrones de entrenamiento compuesto por patrones de
entrada y salida. El objetivo del algoritmo de aprendizaje es ajustar los pesos
de la red w de manera tal que la salida generada sea lo ms cercanamente
posible a la verdadera salida dada una cierta entrada. Es decir, la red neuronal
trata de encontrar un modelo al proceso desconocido que gener la salida y.
Este aprendizaje se llama supervisado pues se conoce el patrn de salida el
cual hace el papel de supervisor de la red. Se debe proporcionar parejas de
patrones entrada-salida y la red neuronal aprende a asociarlos. En terminologa
estadstica equivale a los modelos en los que hay vectores de variables
independientes y dependientes, por ejemplo tcnicas de regresin y modelos
de series temporales.
Aprendizaje No Supervisado: se presenta solo un conjunto de patrones y el

objetivo del algoritmo de aprendizaje es ajustar los pesos de la red de manera
tal que la red encuentre alguna estructura o configuracin presente en los
datos. nicamente se debe suministrar a la red los datos de entrada para que
extraiga los rasgos caractersticos esenciales. En terminologa estadstica
equivale a los modelos en los que solo hay vectores de variables
independientes y buscan el agrupamiento de los patrones de entrada, por
ejemplo anlisis de conglomerados o clster.
Validacin del Modelo
Una vez que ha terminado el proceso de aprendizaje y los pesos de la red

neuronal han sido calculados, es importante comprobar la calidad del modelo
resultante, siendo algunas medidas estndar del error las siguientes:
1. La suma de los cuadrados de los error es definida como:
34
2. La raz cuadrada del error cuadrtico medio definida como:
3. El error mximo, definido como:
donde bp es la salida de la red para el vector de entrada ap. Ntese que en el

caso de una nica salida, la funcin norma II : II se reduce a la funcin valor
absoluto | : | usual.
Sobreajuste Overfitting
En estadstica es conocido que cuando se utiliza un modelo con muchos

parmetros para ajustar un conjunto de datos procedente de proceso con
pocos grados de libertad, el modelo obtenido puede no descubrir las
tendencias reales del proceso original, aunque pueda presentar un error
pequeo. Las diferentes curvas resultantes pueden observarse y compararse
en la Figura 12:
La curva (a) pasa exactamente por los puntos de entrenamiento.
La curva (b) muestra el comportamiento sobre un conjunto alternativo.
La curva (c) es un polinomio de tercer grado. La diferencia entre ambos

modelos puede verse en (d).
35
Figura 12: Sobreajuste de Redes Neuronales.
Se puede identificar el comienzo del Sobreajuste a travs del uso de la

validacin cruzada, para lo cual los ejemplos de entrenamiento se separan en
un subset de estimacin y un subset de validacin. El subset de estimacin se
utiliza para entrenar a la red en el modo usual, excepto por una modificacin
menor: la sesin de entrenamiento se detiene peridicamente, cada tantas
repeticiones y se evala la red con el set de validacin despus de cada
perodo de entrenamiento. Ms especficamente, el proceso peridico de
estimacin seguida de validacin, se denomina mtodo de entrenamiento con
detencin temprana y procede de la siguiente manera.
Despus del perodo de estimacin (entrenamiento), se fijan todos los

pesos y los umbrales del Perceptrn multicapa y la red opera en su
modo hacia delante. El error de validacin se mide as para cada
ejemplo en el set de validacin.
Cuando la fase de validacin se completa, la estimacin (entrenamiento)

se reanuda para otro perodo y el proceso se repite.
En la Figura 13, se muestra las formas conceptualizadas de dos curvas de

aprendizaje, una perteneciente a las medidas sobre el subset de estimacin y
36
la otra sobre el subset de validacin. Normalmente, el modelo no trabaja tan
bien sobre el subset de validacin como lo hace sobre el set de estimacin, en
el cual se bas su diseo. La curva de aprendizaje de estimacin decrece
montonamente para un nmero creciente de repeticiones en la forma
acostumbrada. En contraste, la curva de aprendizaje de validacin decrece
montonamente hasta un mnimo, entonces empieza a incrementarse mientras
contine el entrenamiento. Cuando miramos a la curva de aprendizaje de
estimacin puede parecer que podramos mejorar si vamos ms all del punto
mnimo sobre la curva de aprendizaje de validacin. En realidad, lo que la red
est aprendiendo ms all de ese punto es esencialmente ruido contenido en el
set de entrenamiento. Esta heurstica sugiere que el punto mnimo sobre la
curva de aprendizaje de validacin sea utilizado como un criterio para detener
la sesin de entrenamiento.
Figura 13: Ilustracin de la regla de detencin temprana basada en la

validacin cruzada.
37
Optimizacin de Ajuste de Perceptrn. Adaptaciones de la Funcin de
Error
Los mtodos de ajuste son un punto importante en la implementacin de las

redes neuronales, donde se plantearon algunas medidas estndar del error
como la suma de los cuadrados de los errores, la raz cuadrada del error
cuadrtico medio, el error mximo y como tcnica de ajuste un descenso
gradiente de la funcin de error.
El objetivo comn es que la funcin de error se anule en el caso de predecir

con exactitud la respuesta del sistema y sea positiva en cualquier otro punto,
con mayor valor cuanto ms lejos est del mejor ajuste. La funcin de error
elegida condiciona el resultado ya que, en general, el mnimo no serla el
mismo, la funcin de error cuadrtica es de uso comn pero no resulta
aconsejable cuando el ruido no es gaussiano o hay muchos valores errneos
en la muestra. Los mtodos de ajuste deben ser computacionalmente eficaces,
deben converger, es decir, acercarse hacia un mnimo en forma estable y que
este mnimo sea global, evitando valles locales que pueda tener la funcin
objetivo. Los mtodos de ajuste se pueden clasificar segn:
La amplitud de la bsqueda. Los algoritmos que realizan la bsqueda

por todo el espacio de pesos se denominan globales, y aquellos que
buscan el mnimo en las proximidades del punto inicial, se designan
locales.
El grado de derivadas que utiliza el algoritmo:
Grado 0, no utilizan derivadas,

Grado 1, usan la primera derivada,
Grado 2, utilizan la segunda derivada.
A mayor grado, el algoritmo es ms veloz y complejo. Existen diversos mtodos

de optimizacin de grado cero y bsqueda global, como son, el algoritmo de
cristalizacin, algoritmos genticos, algoritmos de perturbacin, etc., que se
38
pueden utilizar para la obtencin preliminar de los pesos a partir de los cuales
se aplique otro mtodo de ajuste ms eficaz (basado en derivadas). A
continuacin se describen los mtodos de ajuste ms comnmente utilizados
en el mbito de las redes neuronales.
Descenso de Gradiente Conjugado
Es un algoritmo de grado 1 y bsqueda local, trata de solventar la poca

eficiencia que presenta el descenso de gradiente al avanzar en direcciones
ortogonales. Las direcciones conjugadas son suficientemente decrecientes a
pesar de que no sean las del gradiente y no son ortogonales. En cada
momento se conoce el gradiente, gi, y la direccin a tomar di. La primera
direccin es la del gradiente cambiado de signo y la siguiente direccin se
calcula segn:
Donde:
En cada paso hay una minimizacin unidimensional a lo largo de la direccin a

tomar, en esta minimizacin se pueden aplicar varios algoritmos como el de
Newton.
Newton. Levenberg-Marquardt
El mtodo de Newton es una alternativa a los mtodos de gradiente conjugado

para una optimizacin ms rpida, es un algoritmo local de grado 2. Toma una
aproximacin hasta la segunda derivada del desarrollo en serie del error y
busca el mnimo a partir de esa expresin. Como la funcin no ser de
segundo orden, el proceso ser iterativo. En cada iteracin el vector incremento
de pesos se calcula segn:
39
donde:
g es el vector gradiente
H la matriz hessiana de segundas derivadas.
El vector incremento de pesos puede actuar como tal o como direccin a lo

largo de la cual realizar una minimizacin. Dado que el clculo de las segundas
derivadas es ms difcil de obtener, existen variantes de este algoritmo en los
que se realiza una aproximacin de H, mediante el algoritmo Gauss-Newton y
Levenberg-Marquardt.
En el algoritmo Gauss-Newton, se aproxima H segn:
donde:
J es la matriz Jacobiana cuyos componentes son la derivada primera de
los error es de la red respecto a los pesos.
En el algoritmo Levenberg-Marquardt, se aproxima H segn:
donde
es un escalar que cambia en cada iteracin, decrece si el error decrece y
aumenta en caso contrario.
Criterios de Parada
Los algoritmos de ajuste funcionan por iteraciones, por eso se requiere algn
criterio que indique detener el proceso y dar el resultado por bueno. Algunos de
estos pueden ser:
Detener el algoritmo cuando el progreso es muy pequeo.
Llegar a cierto valor de la funcin de error.
40
Que todos los puntos de la muestran tengan su error por debajo de un
umbral.
Que el gradiente, en algoritmos de grado 1 o 2, sea casi nulo.
Regularizacin
Al disear un Perceptrn multicapa por diferentes mtodos, se est

construyendo un modelo no-lineal del fenmeno fsico responsable de la
generacin de ejemplos de entrada salida usados para entrenar la red. En la
medida que el diseo de la red es estadstico por naturaleza, necesitamos un
balance adecuado entre la confiabilidad de los datos de entrenamiento y la
calidad del modelo. En el contexto del aprendizaje back-propagation o
cualquier otro procedimiento de aprendizaje supervisado, se puede producir el
balance minimizando el riesgo total expresado como:
R(w) = S(W) + C(w)

donde:
El primer trmino, S(W), es la medida de performance estndar, la cual

depende tanto de la red (modelo) y de los datos de entrada. En el
aprendizaje backpropagation se define tpicamente como un error
cuadrtico medio cuya evaluacin se extiende sobre las neuronas de
salida de la red y el cual se lleva a cabo para todos los ejemplos de
entrenamiento.
El segundo trmino, C(w), es la penalidad de complejidad, la cual

depende solamente de la red (modelo); su inclusin impone sobre la
solucin un conocimiento a priori sobre los modelos que estn siendo
considerados. Podemos pensar a como un parmetro de
regularizacin, representando la importancia relativa del trmino de la
penalidad de complejidad con respecto al trmino de la medida de
performance.
41
Cuando es cero, el proceso de aprendizaje no est restringido y la red
se determina completamente con los ejemplos de entrenamiento.
Cuando se hace infinitamente grande, por el contrario, la implicacin

es que la restriccin impuesta por la penalidad de complejidad es por s
misma suficiente para especificar la red, lo cual es otra manera de decir
que los ejemplos de entrenamiento no son confiables.
En los casos prcticos donde se utiliza la regularizacin de la complejidad para

mejorar la generalizacin, al parmetro se le asigna un valor entre medio de
estos dos casos extremos. La forma de regularizacin de complejidad que
puede utilizarse es la degradacin de pesos (weight decay). En el
procedimiento weight-decay, el trmino penalidad de complejidad se define
como la norma al cuadrado del vector de pesos w (es decir, todos los
parmetros libres) en la red, como se muestra en la siguiente ecuacion:
donde:
el conjunto Ctotal se refiere a todos los pesos de la red.
Este procedimiento opera al forzar a algunos de los pesos en la red a tomar

valores cercanos a cero, mientras permite que otros pesos retengan sus
valores relativamente grandes. En consecuencia, los pesos de la red se
agrupan a grandes rasgos en dos categoras:
aquellos que tienen una gran influencia sobre la red (modelo),

aquellos que tienen poca o ninguna influencia sobre la red.
Los pesos en la ultima categora se llaman pesos excedentes. En la ausencia

de la regularizacin de complejidad, estos pesos resultan en una
generalizacin pobre en virtud de sus altas probabilidades de tomar valores
completamente arbitrarios o causar que la red Sobreajuste los datos al tratar de
42
producir una leve reduccin en el error de entrenamiento. El uso de la
regularizacin de complejidad fomenta que los pesos excedentes suman
valores cercanos a cero y por lo tanto mejoran la generalizacin.
Redes Estticas
Las Redes Neuronales Estticas, tienen como caracterstica comn el no

poseer memoria, es decir, solo son capaces de transformar un conjunto de
entradas en un conjunto de salidas, de tal manera que una vez establecidos
todos los parmetros de la red las salidas nicamente dependen de las
entradas, en general la relacin deseada de entradas y salidas se determina en
este caso externamente mediante alguna forma de ajuste de los parmetros del
sistema supervisado.
Este tipo de redes se han empleado con xito en muchos problemas de

clasificacin, como funciones lgicas, as como en el campo de la aproximacin
funcional.
Son ejemplo de este tipo de redes, las redes Multicapa de Perceptrones, las
redes de Funciones de Base Radial y las redes Neuronal Probabilstica.
En estos modelos, el flujo de informacin es generalmente sncrono, todos los

estados de las neuronas se actualizan al mismo tiempo o siguiendo una
secuencia determinstica.
Redes Multicapa
Las Redes Multicapa o de retropropagacion, segn la cantidad de capas

ocultas que tenga, puede resolver una gran variedad de problemas en
diferentes reas del conocimiento, siendo entre las arquitecturas de redes la
ms popular; en la Figura 14, se identifican sus componentes.
43
Figura 14: Descripcin de una red neuronal artificial multicapa.
Capa de Entrada de una Red Neuronal: Est compuesta por unidades

que se ubican en la capa de entrada de una red neuronal (X, U), siendo
cada unidad la entrada de al menos una unidad funcional de U y no es la
salida de ninguna unidad procesadora de U.
Capa de Salida de una Red Neuronal: Est compuesta por unidades que
se encuentran en la capa de salida de una red funcional (X, U), donde
cada unidad es la salida de al menos una unidad funcional de U y no es
la entrada de ninguna unidad procesadora de U.
Capas Intermedias u Ocultas de una Red Neuronal: Est compuesta por

unidades que se distribuyen en las distintas capas intermedias de una
red neuronal (X, U), donde las unidades son la entrada de al menos una
unidad funcional de U y al mismo tiempo, es la salida de al menos una
unidad procesadora de U.
Perceptrn
En un Perceptrn, cada entrada es multiplicada por el peso W correspondiente

y los resultados son sumados, siendo evaluados contra el valor de umbral, si el
resultado es mayor al mismo, el Perceptrn se activa, como se detalla en la
Figuras 15 y 16.
44
Figura 15: Estructura del Perceptrn.
Figura 16: Capas de un Perceptrn.
45
Aplicaciones de las redes neuronales
Segn (ROSANO, 2002), los campos potenciales de aplicacin de las Redes

neuronales se pueden agrupar en las siguientes secciones:
Diagnstico.
El diagnstico comprende la identificacin de la naturaleza y causas de una

situacin presente. La operacin de diagnstico es empleada en numerosos
campos, tales como la planeacin estratgica de organizaciones, la medicina,
la ingeniera de servicio y mantenimiento, la economa, la sociologa, las
ciencias polticas, etc.
En el diagnstico se observan un conjunto de sntomas, que son valores de

variables observables del sistema, los cuales se asocian con un conjunto de
factores ambientales que actan o han actuado sobre ste, para inferir el
estado del sistema, as como una explicacin causal del mismo.
De lo anterior resulta la conveniencia de utilizar Redes Neuronales que,
basndose en ejemplos concretos y con la tutora de un experto, aprendan a
diagnosticar sistemas complejos, sin requerir el anlisis lgico causal explcito
que requeriran los Sistemas Expertos.
As, en el diagnstico mdico se ha desarrollado DESKNET (Yoon, 1989), que

es una Red Neuronal basada en retropropagacin que es capaz de
diagnosticar 10 diferentes enfermedades de la piel, basndose en un conjunto
de 18 sntomas y pruebas de laboratorio. Otra aplicacin ha sido desarrollada
por (Apolloni, 1990) para el diagnstico de variedades de epilepsia.
Procesamiento de seales.
Un problema importante del procesamiento de seales es la recuperacin de

una seal analgica despus de haber sido transmitida por un canal ruidoso o
distorsionador.
46
Para este problema se han desarrollado enfoques tradicionales basados en
filtros y ecualizadores de canales y la aplicacin de estimacin estadstica para
conformar un estimado ptimo de la seal deseada. Sin embargo, la falta de
conocimiento de parmetros estadsticos de la seal obstaculiza el uso de la
teora de la estimacin.
Una posible solucin es la construccin de filtros adaptativos entrenados en

instalaciones reales, que aprendan a dar como salida la seal deseada y
basados en Redes Neuronales. Douglas Palmer de Hecht-Nielsen
Neurocomputer Inc (Palmer, 1987) compar el filtrado resultante de una Red
Neuronal multicapa con el de un filtro adaptativo lineal en una seal de
electroencefalograma y los resultados de la red aparecan menos ruidosos que
los del filtro.
Otro problema importante es la prediccin de series de tiempo. Alan Lapedes y

Robert Farber han aplicado Redes Neuronales (Lapedes & Farber, 1987) en
forma de un Perceptrn de varias capas para predecir el comportamiento de un
sistema dinmico no lineal con comportamiento catico descrito por la ecuacin
diferencial no lineal de Glass-Mackey, dando por resultado una mayor precisin
en la prediccin con Redes Neuronales que utilizando predictores polinomiales
y el filtro adaptativo lineal de Widrow-Hoff.
En este mismo sentido, se han aplicado Redes Neuronales para predecir el

comportamiento de un mercado burstil, asesorando adecuadamente sobre el
mejor momento para comprar o vender acciones. El modelo tuvo un
desempeo calificado como excelente. (Kimoto, Yoda et al. 1990). Odom y
Sharda reportan tambin el empleo de Redes Neuronales para predecir la
quiebra de una institucin bancaria.
Procesamiento y anlisis de imgenes.
El procesamiento de imgenes es un campo muy promisorio de aplicaciones de

las Redes Neuronales, en donde la imagen digitalizada original o bien
preprocesada se utiliza como entrada de una red, obtenindose como salida
47
una clasificacin e identificacin de la imagen o de segmentos de ella. Como
procedimientos de preprocesamiento pueden utilizarse transformadas de
Fourier, algoritmos de extraccin de caractersticas especiales y otras tcnicas.
Entre las aplicaciones que se han desarrollado estn la identificacin de
blancos militares camuflados (Ruck, 1987), utilizando imgenes obtenidas
mediante un radar laser y una red multicapas, obtenindose una ms alta
efectividad de la solucin neuronal (86.4%) de reconocimiento de tanques, en
comparacin con un clasificador estadstico (76.5%).
Control automtico y robtico.
Un tema fundamental en Ingeniera de Control es disear un controlador que,

con base en el estado presente de un sistema, determine el conjunto ptimo de
seales que hagan que un sistema de actuadores lleve al sistema al estado
deseado.
Wang y Yeh han explorado el uso de Redes Neuronales para la construccin

de controladores auto-adaptativos, caracterizados por su habilidad de aprender
a partir de ejemplos, sin necesidad de modelar la planta a controlar.
Estos controladores se distinguen por su adaptabilidad dinmica ante cambios

de la misma planta, as como por sus propiedades de robustez.
Anlisis y generacin de lenguaje natural.
En cuanto a la aplicacin de Redes Neuronales para el reconocimiento de

lenguaje hablado, se est trabajando activamente para mejorar el
reconocimiento de fonemas, hacindolo independiente del hablante (Cole,
1990), as como su clasificacin, introduciendo redes con retrasos.
Asimismo, se estn empleando Redes Neuronales para analizar un vocablo

hablado, identificando sus parmetros fonticos, con el fin de asociarlo con la
palabra escrita correspondiente, permitiendo su reconocimiento. (Sung &
Jones, 1990).
48
En lo que respecta a la generacin de lenguaje, los trabajos ms famosos son
los de Terrence Sejnowsky y Charles Rosenberg que introducen su sistema
NETTALK como un sistema que aprende a leer en voz alta. A partir de
NETTALK ha habido nuevas contribuciones en cuanto al mejor tipo de red
neuronal a utilizar.
49
CAPTULO III
MARCO
METODOLGICO
50
CAPITULO III: MARCO METODOLGICO
3.1. Tipo y diseo de la investigacin:
3.1.1. Tipo de la investigacin:
El presente proyecto de investigacin se enfoca en una informacin cuantitativa

y mtodo cuasi experimental, con la finalidad de predecir series hidrolgicas
de la cuenca del rio Chicama.
3.1.2. Diseo de la investigacin:
PROBLEMA SOLUCIN REALIDAD
la problemtica de Estudiar y comparar de los a. Estimar el modelo

escasez de datos diferentes modelos de redes hidrolgico ms exacto
hidrolgicos, para neuronales artificiales, los para predecir los
desarrollar los resultados obtenidos en caudales mximas en
diversos estudios y series hidrolgicas. la Cuenca del ro
trabajos de series Chicama.
hidrolgicas.
b. Optimizar el clculo de
las intensidades
mximas.
3.2. Poblacin y muestra:
La poblacin y muestra va a estar dado por 329 registros de precipitaciones

obtenidas en las estaciones de San Benito, Capachique, Callancas,
Contumaza, Cospan, Cascas y Sinsicap.
3.3. Hiptesis
La seleccin del mejor modelo basado en redes neuronales artificiales nos

permitir obtener resultados de los caudales con mayor exactitud para estudios
de modelos hidrulicos en la Cuenca del ro Chicama.
51
3.4. Variables:
Variables Dependientes:
Software Matlab. Algoritmo utilizado en redes neuronales, funcin de
error, funcin de activacin.
Variables Independientes:
Las precipitaciones Obtenidas de las estaciones.
3.5. Mtodos, tcnicas e instrumentos de recoleccin de datos:
3.5.1 Mtodos de Investigacin:
DEDUCTIVO:
Porque nosotros despus de haber definido las variables
independientes y dependientes y sus respectivos indicadores, se
tendr que deducir la hiptesis para una adecuada evaluacin de las
precipitaciones registradas en cada estacin a estudiar.
INDUCTIVO:
Porque despus de obtener los resultados adecuados con el
desarrollo de la presente trabajo de investigacin que implic un
proceso basado en los distintos mtodos para luego desarrollar los
dems aspectos complementarios, se podr dar inicio a una
adecuado prediccin de series hidrolgicas.
ANLISIS.
Porque tenemos el objeto de estudio a la cuenca del rio Chicama y
se estudiar analizando para ello la informacin facilitada por las
estaciones para conocer sus caudales y as disear de forma
adecuada estructuras hidrulicas.
52
SNTESIS.
Porque una vez estudiados y comparados los diferentes mtodos
utilizados para la prediccin de caudales mximos plantearemos la
ptima solucin, sobre cul sera el modelo que ms se ajustara a los
regmenes de precipitacin actual.
3.5.2. Tcnicas de recoleccin de los datos:
Observacin:
Tiene como fuente a los investigadores.
Anlisis de Documentos:
Se tuvo en cuenta libros, tesis, revistas, etc, relacionados al tema a
tratar que se ha investigado, con la finalidad de seleccionar y
complementar la informacin faltante.
Gua de anlisis de documentos

Se revisaron normas tcnicas adecuadas que facilitaron un correcto
desarrollo de los diferentes mtodos utilizados para la prediccin
series hidrolgicas.
3.5.3. Descripcin de los instrumentos utilizados:
Los materiales y equipos que se emplearon fueron los necesarios

que ameritaron la investigacin y el adecuado desarrollo del presente
trabajo, dichos componentes fueron:
Programa Microsoft Excel.

Estaciones pluviomtricas.
Datos de los registros histricos de precipitacin.
Formato para la obtencin de intensidades mximas.
Software Matlab
53
CAPTULO IV
ANALISIS E
INTERPRETACIN DE
RESULTADOS
54
CAPITULO IV: ANALISIS E INTERPRETACIN DE RESULTADOS
4.1 Ubicacin y caractersticas generales del rea de la cuenca en

estudio.
4.1.1. Ubicacin.
La cuenca del Rio Chicama se ubica geogrficamente entre los paralelos
7 21 y 7 59 de latitud sur y los meridianos 78 14 y 79 20 de longitud
oeste. Siendo su extensin total de 5,822 Km2. Altitudinalmente se
extiende desde el nivel del mar hasta la lnea de las cumbres de la cuenca
del Rio Maran llegando a una altura aproximada de 4,297 m.s.n.m.
4.1.2 Caractersticas climticas

La temperatura en la cuenca est directamente influenciada por la altitud
obedeciendo a una gradiente negativa, es decir que la temperatura
disminuye con la altura a razn de 0.3C/100m. Como se observa en las
grficas de ecuaciones regionales, con la ayuda de las ecuaciones
regionales y de un SIG se obtuvo mapas de distribucin espacial de la
temperatura en toda la cuenca el que permite entender con mayor
claridad la distribucin de esta (ver mapa temperatura).
La humedad relativa media anual en el litoral es de 84.7%, mientras que

en el valle es de 77.3 con mximas diarias medias mensuales que
alcanzan el 94.3% en los meses de invierno y una mnima diaria media
mensual que llega a 55.81% en los meses de verano.
La velocidad del viento media anual en el litoral es de 9.3km/h mientras

que en el valle es de 3.6km/h.
4.1.3 El uso del suelo.

La informacin de suelos obtenida del estudio realizado por la ONERN en
1973 nos brindan una idea generalizada de los suelos en toda la cuenca y
55
est representada mediante 11 unidades cartogrficas amplias
denominadas Asociaciones de Suelos y como unidades taxonmicas de
abstraccin, los Grandes Grupos de Suelos (ver CUADRO)
Tabla 1 Distribucin del uso del suelo en la cuenca
4.1.4. Precipitacin media:

La precipitacin media anual tiene un intervalo de 702 a 1241mm, con los
valores superiores en la cuenca alta y valores menores en la cuenca baja.
La misma variacin ocurre con la evapotranspiracin que tiene un
intervalo 333 a 569mm.
56
4.1.5 Caractersticas hidrolgicas de la cuenca.
La forma de la cuenca es de oval redonda a oval oblonga, lo que indica
que la tendencia a crecidas del rio es media, y posee una densidad de
drenaje regular (Samaniego, 2008).
En la figura 4.1, se observa el comportamiento durante un periodo
continuo de tiempo, de los caudales mensuales, en la Cuenca del Ro
Chicama .
Figura 17. Serie de caudales medios mensuales ro Chicama.
4.2 Materiales y Mtodos
4.2.1 Materiales
Los materiales utilizados en la presente investigacin estn conformados
por datos de estaciones meteorolgicas e hidromtricas, tomadas de
algunos trabajos de investigacin.
4.2.2 Definicin de los datos.

Las series de tiempo de las variables de entrada deben ser lo ms
completas posible en las fechas o intervalos de tiempo escogidos. Esto ha
dificultado la disponibilidad de series de tiempo prolongadas. En el caso
de modelos concentrados es posible hacer una ponderacin de los datos
de las estaciones faltantes mediante tcnicas estadsticas. Para el modelo
57
que se ha estudiado en este trabajo de investigacin es necesario
informacin de cada estacin, debido a que el modelo es altamente
sensible a la informacin de cada estacin.
4.2.3 Identificacin de variables de entrada.

Las variables que estn involucradas en el problema de prediccin de
caudales son precipitacin y caudales histricos, la precipitacin no se
refleja instantneamente como caudal en el ro, por el contrario esta
precipitacin es retenida en los diferentes componentes de caudal dentro
de una cuenca, por lo que a pesar de ser un parmetro importante para el
clculo del caudal, se necesitan ms datos para obtener el caudal, pero si
se trabaja con anteriores caudales y la precipitaciones al entrenar las
redes se facilita el clculo de los futuros caudales que se podran obtener
con cierta precipitacin.
4.2.4 Implementacin de arquitecturas de redes neuronales.
4.2.4.1 Toolbox de Matlab.
El programa elegido para realizar esta tesis fue Matlab debido a que tiene
un Toolbox de redes neuronales que es bastante general y flexible.
Este toolbox permite cambiar el nmero de capas, nmero de neuronas,
su funcin de activacin, diversos tipos de interconexin entre capas,
diversas funciones de error para optimizar la red, varios tipos de
algoritmos de aprendizaje. Todas estas opciones son programables.
La interfaz es bastante manejable, permite trabajar con ventanas, desde
teclado o con scripts.
Una opcin que se ha utilizado del toolbox es la diferenciacin interna
entre muestra de entrenamiento, validacin y prediccin o test. La red se
entrena con los datos de entrada y va calculando una llamada varianza
dentro de los cuadrados medios del error, y habitualmente representada
por MSE (Mean Square Error) o MSW (Mean Square Within) que se
calcula como la media de las k varianzas muestrales. MSE es un cociente:
al numerador se le llama suma de cuadrados del error y se representa por
58
SSE y al denominador grados de libertad por ser los trminos
independientes de la suma de cuadrados. (Jimnez, 2009).
Debido al aprendizaje en cada iteracin, este MSE de entrenamiento va
disminuyendo. Paralelamente el programa va calculando el MSE con los
datos de validacin que globalmente van disminuyendo hasta cierto punto
y luego aumentan paulatinamente. En ese punto Matlab automticamente
detiene el entrenamiento de la red, debido a que la red se est
sobreentrenando para los datos de entrenamiento, pero se est
distanciando de datos que no hayan intervenido en su entrenamiento.
Esta caracterstica se llama early stopping y evita la especializacin de
la red, lo cual es poco deseable para la generalizacin deseada.
4.2.4.2 Red aplicada
Para identificar la red ptima para el problema que ocupa esta tesis, se ha
trabajado con el nmero de capas, numero de nodos o neuronas por
capa, los tipos de conexin entre capas y neuronas entre capas y las
funciones de transferencia utilizadas. La versatilidad que ofrece el toolbox
de Matlab ha permitido probar varias arquitecturas de red.
4.2.4.3 MLP: Multilayer perceptron.
Es una red de varias capas bsicamente. Las capas son la de entrada,

una o varias intermedias u ocultas y la de salida. Mediante el toolbox de
Matlab se puede optar por varias capas ocultas, pero de acuerdo a
referencias bibliogrficas, esto podra llevar a una red muy especfica o
sobreentrenada, en el entrenamiento de la red este caso se utiliz 10, 50,
80 y 85 capas ocultas, las que nos permitieron obtener los mejores
resultados.
4.2.5 Mtodos.
Los mtodos usados en la presente investigacin se han dividido en dos
etapas, las cuales son:
A) Recoleccin y anlisis de la informacin hidrometeorolgica
Anlisis de las series temporales de los caudales medios mensuales.
B) Modelamiento determinstico de caudales mensuales
59
Determinacin de las variables de los modelos a emplear.
Simulacin del modelo hidrolgico distribuido.

Anlisis de bondad de los modelos.
4.2.6 Desarrollo de los mtodos.
4.2.6.1 Determinacin de la arquitectura y parmetros de los modelos de

redes neuronales artificiales.
El tipo de red usada en el modelamiento con redes neuronales artificiales de

los caudales medios mensuales de las cuencas del Ro Chicama ,es la red
multicapa feedforward que comprende tres capas: de entrada, intermedias u
ocultas y de salida. En las redes feedforward, todas las seales neuronales
se propagan hacia adelante a travs de las capas de la red (Hilera &
Martnez, 2000).
La determinacin de la arquitectura para cada uno de los modelos de redes
neuronales artificiales se realiz para toda la serie, esto con la finalidad de
que el modelo pueda tener ms datos para el entrenamiento, adems se
asume que existe una relacin directa entre las variables de entrada y el
caudal de las cuencas en cada mes o da.
En la prctica no existe una regla definida para establecer el nmero inicial
de neuronas y capas intermedias u ocultas, por lo que la metodologa
seguida fue la de prueba-error.
4.2.6.2 Agrupacin de los datos de entrada.
Los datos fueron agrupados de tal forma que sigan la serie cronologa
mensual y anual establecida, se utiliz el 75% de datos para el
entrenamiento, dejando el 25% de datos para la verificacin del modelo,
excepto en la cuenca del rio Chicama, donde se utiliz el 85% de datos para
el entrenamiento. Quedando la distribucin como se ve en la Tabla 4.2 para
los caudales medios, y en la Tabla 4.3 para los caudales diarios.
Cuenca Datos para Datos para

entrenamiento (aos) comprobacin (aos)
Ro Chicama 12 2
Tabla 4.2 Distribucin de la informacin de las cuenca analizada con datos mensuales.
60
Cuenca Datos para Datos para
entrenamiento (das) comprobacin (das)
Rio Chicama 75 19
Tabla 4.3 Distribucin de la informacin de la cuenca analizada con datos diarios.
4.2.6.3 Entrenamiento de los modelos de redes neuronales artificiales.
Este proceso consisti en evaluar las distintas opciones de entrenamiento

haciendo variar la cantidad de iteraciones y la tasa de aprendizaje con la
finalidad de minimizar el error en los caudales simulados.
Durante la etapa de entrenamiento de las redes, se determina iterativamente
los pesos de las conexiones, wji que conectan a las neuronas de entrada
con las de la capa oculta y wj para la transferencia entre la capa oculta y la
de salida. A partir de los datos de entrada la red en cada iteracin genera
una salida, a travs de las neuronas que la componen, con los pesos y
funcin de transferencia considerada, esta salida es comparada con los
valores objetivos (caudales observados), obtenindose as un error. Esta
fase concluye cuando la red converge
y es capaz de minimizar el error. La funcin de transferencia y activacin ha
sido la del tipo sigmoidea.
El tolbox de Matlab cuenta con diversos algoritmos de entrenamiento de las
redes entre los cuales esta TRAINBR(Bayesian regulation backpropagation),
TRAINLM (Levenberg-Marquardt backpropagation), TRAINRP (Resilient
backpropagation), trainscg(Scaled conjugate gradient backpropagation), y
algunos ms cuya funcin es entrenar la red.
El entrenamiento Bayesian regulation backpropagation es una funcin de
entrenamiento que actualiza los valores de los pesos y el sesgo de acuerdo
con la optimizacin de Levenberg-Marquardt backpropagation. Se minimiza
una combinacin de errores cuadrticos y pesos, luego determina la
combinacin correcta de manera que produzca una correcta red
generalizada. (Jimnez, 2009).
La regulacin bayesiana (MATHWORKS, 2011) se lleva a cabo en el
algoritmo de Levenberg-Marquardt. La retropropagacin es usada para
calcular el Jacobiano jX de performance adecuada con respecto al peso y
sesgo de las variables X. Cada variable es ajustada de acuerdo con
Levenberg-Marquardt.
61
E.C. 4.1
Donde E son todos los errores e I es la matriz identidad. El valor adaptativo
mu se incremente por mu_inc hasta que el cambio se muestre por encima de
los resultados lo que indica un valor de reduccin del rendimiento. El cambio se
hace entonces a la red y mu decrece por mu-dec.
El algoritmo converge cuando:
El nmero mximo de iteraciones es alcanzado.
El error es minimizado hacia el objetivo.
El gradiente de rendimiento cae por debajo del valor mnimo.
4.2.6.4 Simulacin de los modelos de redes neuronales artificiales
La simulacin de los modelos de Redes Neuronales Artificiales se realiz

mediante el software cientfico MATLAB con la Neural Network Toolbox.
Como el algoritmo de entrenamiento usado presenta un proceso de
optimizacin se apreci que la variacin de neuronas en la capa oculta no
representa variaciones considerables en los caudales simulados, teniendo
como funcin objetivo la eficiencia de Nash- Sutcliffe, por lo cual se
establecieron los modelos con una cantidad de (10 a 80) neuronas ocultas
(dependiendo de la cantidad de neuronas de entrada) en la capa oculta o
intermedia. Las iteraciones en los modelos varan desde 600 a 1000
dependiendo del modelo y el proceso que le tome en converger al mejor
resultado.
4.2.6.5 Anlisis de bondad de los modelos determinsticos.
Para anlisis la bondad de los modelos determinsticos simulados se us la

eficiencia de Nash- Sutcliffe.
62
4.2.7 Modelo Presentado para su anlisis.
En la Tabla 2. se presenta el modelo analizado, donde las entradas son las
precipitaciones (P) y caudales histricos de la cuenca (Q), y en la salida se
tienen los caudales futuros (Q).
ENTRADAS SALIDA
P1 Q1 Q5
P2 Q2 Q6
P3 Q3 Q7
P4 Q4 Q8
. . ..
Tabla 2 Modelo analizado
4.2.8 Anlisis con la herramienta de identificacin de sistemas de Matlab.
Para realizar este anlisis, utilizando el software Matlab, se procedi a trabajar con
diversos modelos para realizar el entrenamiento de la red, se trabaj con un total
del 75%, 80% y 85% de los datos histricos obtenido de la Cuenca de estudio, esto
se lo hizo debido a que en unas cuencas se tena menor cantidad de informacin
por lo que se utiliz un mayor porcentaje de datos para el entrenamiento, el
porcentaje restante se lo dejo para su realizar la comprobacin de los datos
simulados
4.2.9 Implementacin en Matlab herramienta de redes neuronales

NNTool.
La herramienta de Redes neuronales de Matlab, NNTool, consiste de un

conjunto de funciones y estructuras que manejan las redes neuronales, que
se presenta en un entorno de ventanas de trabajo, donde se ingresan los
datos del problema a resolver y se seleccionan las funciones de activacin,
los algoritmos de formacin, que se usaran, con distintas opciones se
ingresa o selecciona informacin sobre la estructura de la red neuronal, por
ejemplo el nmero y estructura de sus capas, la conectividad entre las
capas, datos necesarios para generar la red neuronal, (Demuth & Beale,
1998)
63
El anlisis de una red neuronal usando la NNTool de Matlab, se inicia en el
entorno de trabajo de la herramienta de redes neuronales, se ingresan los
datos a ser analizados, en las Figura 18. puede observarse los datos
cargados para posteriormente ser emplearlos en la simulacin de la red.
Figura 18 Matlab-NNTool: Ventana NNTool, con la Red Neuronal y los datos usados en la
Generacin de la red.
En la Figura 18, se observan los archivos que se utilizan para realizar el

entrenamiento, siendo:
P: Los registros de precipitaciones histricos de cada cuenca analizada.
C: Los registros histricos de caudales de las cuencas.
Adr: Son los datos de precipitaciones con las que se har los clculos de los
caudales futuros. 60
En la Figura 19 se observan la nueva red donde especifica la estructura y se

indican los datos de entrada de la red, el nmero de neuronas y las diversas
funciones para el entrenamiento de la red.
64
Figura 19: Matlab-NNTool: Ventana de Creacin de la red neuronal, donde se indican datos y
se configuran las funciones y la estructura de la red neuronal
En la Figura 20, se observa la estructura de la red utilizada para la simulacin de los

caudales.
Figura 20: Matlab-NNTool: Estructura de la Red Neuronal.
65
En la Figura 21 se observa la ventana de entrenamiento donde se coloca en nmero
de iteraciones que se necesita para el entrenamiento de la red.
Figura 21: Matlab-NNTool: Simulacin de la Red.
En las Figuras 22 y 23, se presentan las grficas del mejor entrenamiento obtenido y la
mejor correlacin del entrenamiento interno de la red.
Figura 22: Matlab-NNTool: grficas con los resultados del entrenamiento de la RN, funcin de
entrenamiento TRAINBR.
66
Figura 23: Matlab-NNTool: grficas con los resultados del entrenamiento de la correlacin de
la Red Neuronal.
4.2.10 Anlisis microcuenca el Perejil.
Para la comparacin de datos mensuales, con datos diarios se utiliz los

datos diarios de tres estaciones de la microcuenca El Perejil las cuales se
encuentran en las coordenadas que se encuentran en la Tabla 3.
NOMBRE ESTACION COORDENADAS DESCRIPCIN

NORTE ESTE
P1 9668906 479840 Pluvimetro 1
P2 9669241 478842 Pluvimetro 2
E 9650067 479148,6 Estacin meteorolgica
Tabla 3 Coordenadas Estaciones Perejil.
Con estos datos se utiliz el mtodo de polgono Thiessen para obtener la
precipitacin media diaria de la cuenca.
67
4.2.11 Anlisis cuenca Chicama.
Para el anlisis de la cuenca Chicama se trabaj con datos diarios de caudal y
precipitacin de las estaciones Huacapongo, Quirihuac, Tambo.
Se realiz el relleno de datos faltantes por el mtodo de correlacin entre las
estaciones antes mencionadas, posteriormente se calcul la precipitacin
media de la cuenca por medio del mtodo de polgonos de Thiessen.
En la Tabla 2.8 se observa las coordenadas de las estaciones utilizadas para el
anlisis de la cuenca Chicama.
ESTACION COORDENADAS
Huacapongo 9162114 756991
Quirihuac 9105863 735118
Tambo 9523381 753038
Tabla 4 Coordenadas estaciones cuenca Chicama.
4.3 Anlisis De Resultados
Una vez aplicadas las metodologas, se ha procedido a realizar el anlisis de

resultados mediante el clculo de sensibilidad de datos, comparando los
caudales simulados con los caudales dados.
En la Tabla 5, se observa tres diferentes tipos de entrenamiento que nos
permite realizar el toolbox de Matlab y su respectivo coeficiente de eficiencia de
Nash & Sutcliffe, el algoritmo TRAINBR o de regularizacin bayesiana, es el
que se propone para ser utilizado en la red neuronal, porque present un mejor
desempe con los distintos grupos de datos de entrenamiento que se
probaron en la generacin de la red neuronal; considerando tambin que este
algoritmo reduce al mnimo una combinacin estrictamente convexa del error
cuadrado medio y de los pesos cuadrados medios.
Tabla 5 Anlisis de los errores para el entrenamiento
En la Tabla 6 se presentan los resultado de los coeficientes de eficiencia de

Nash & Sutcliffe, para varios nmero de neuronas, como se puede observar
68
segn se aumenta las neuronas mejora el coeficiente, pero esto ocurre hasta
cierto punto, ya que posteriormente el coeficiente empieza a disminuir, esto se
debe al sobreentrenamiento de la red, el mejor coeficiente se lo obtuvo con 10
neuronas, con este nmero se logr el mejor coeficiente en la mayora de los
casos por lo que fue elegido para el modelamiento de las redes.
Tabla 6 Anlisis del nmero de neuronas necesarias para el modelo de red

ptimo.
En la Tabla 7 se puede observar los parmetros de validacin para la cuenca,

existiendo una relacin directa entre el nmero de datos de entrenamiento, y el
Coeficiente de eficiencia de Nash y Sutcliffe, segn nuestra bibliografa [1] se
pudo observar que entre mayor cantidad de datos mejora el coeficiente,
tambin un parmetro importante es el monitoreo de la cuenca, entre mayor
nmero de estaciones tenga la cuenca, mejor es el coeficiente, que con un
mayor nmero de registros es mayor el desempeo de la red.
Cuenca rea Nmero Densidad Nmero Coef. Efi. Nash

(Km) Estacione Estaciones de & Sutcliffe
s por (Km) registros
Ro Chicama 4814.3 Km 4 0,0014 14 0,3
En la Figura 24 se pueden apreciar la grfica de la serie hidrolgica de

caudales observados y los caudales simulados versus sus fechas de
ocurrencias; los caudales observados son los caudales que se obtuvo del
registro historico, y los caudales simulados son los caudales obtenidos en el
entrenamiento de la red en Matlab, se aprecia que las series coinciden en
ciertos puntos.
Se tomaran datos de los aos 1985 al 1988
69
Figura 24 Comparacin de series hidrolgicas de caudales calculados y
simulados de la cuenca Ro Chicama.
4.3.1 Microcuenca El Perejil.
En la Tabla 8 se observan los parmetros de validacin de las cuencas, El

Perejil el coeficiente de eficiencia de Nash & Sutcliffe es bajo, esto quiere decir
que la relacin entre los caudales dados y los simulados no es buena, esto se
debe a que hay poca correspondencia de los datos, por la variabilidad de la
informacin, ya que existen puntos en los que no se registra precipitaciones en
ninguna estacin.
Cuenca Coeficiente de eficiencia de Nash &

Sutcliffe
El Perejil 0,006
Tabla 8 Parmetros de validacin.
En la Figura 25 se puede apreciar la grfica de los caudales observados y los

caudales simulados versus sus fechas de ocurrencias; los caudales simulados
son los caudales obtenidos en el entrenamiento de la red en Matlab, se aprecia
que las series no coinciden, esto se debe a la variabilidad de los registros
70
existentes, dificultando que la red encuentre un patrn adecuado entre los
datos.
Figura 25 Comparacin de series hidrolgicas de caudales calculados y

observados de la Microcuenca el Perejil.
71
CONCLUSIONES
De acuerdo a la evaluacin realizada aplicando redes neuronales, para

la generacin de caudales en el rio Chicama, se consiguio un valor del
coeficiente de eficiencia de Nash & Sutcliffe de 0.03 lo que indica que la
red se comport de una forma no ideal, esto se debi a que se tom
poca cantidad de datos.
Durante el anlisis se obtuvieron mejores resultados con datos de

caudales mensuales que con los datos de caudales diarios, esto se
debi a que los datos diarios presentan una mayor dispersin de la
informacin, y los datos mensuales al ser datos totales o promedios,
compensan estas diferencias y la red aprende de mejor forma y obtiene
mejores simulaciones.
Se observ una relacin directa entre el nmero de datos para el

entrenamiento, y el coeficiente de eficiencia de Nash & Sutcliffe, siendo
este coeficiente mejor con mayor cantidad de datos.
Las Redes Neuronales obtienen informacin ms precisa dependiendo

de la exactitud de los datos de entrada y que tan continuos en el tiempo
sean estos.
72
RECOMENDACIONES
Se debe trabajar con la mayor cantidad de datos disponibles, para que

la red pueda entrenarse con ms datos histricos y obtener mejores
simulaciones, ya que esto influencia de gran manera para tener un
mejor desempeo de la red.
Para la utilizacin de ms capas de entrada a la red, revisar que estas

sean proporcionales al nmero de datos del tarjetero utilizado, en caso
contario el tolbox de Matlab no entrenara la red.
Realizar estudios de simulacin de caudales diarios, mensuales

utilizando redes neuronales artificiales, usando como neuronas de
entrada variables que caractericen la respuesta hidrolgica de la
cuenca, como el nmero de curva o algn ndice que vegetacin,
temperatura, etc.
Realizar el anlisis de consistencia de la informacin de precipitacin y

caudales, la continuidad en el tiempo de estas variables, como paso
previo e indispensable al momento de utilizar las redes neuronales
artificiales para la simulacin de caudales.
Implementar modelos de simulacin basados en redes neuronales que

puedan simular sistemas complejos y difciles de explicar, como son los
procesos hidrolgicos, de impactos ambientales, por medio de otro tipo
de arquitectura de redes neuronales artificiales distintas a las
presentadas en esta investigacin.
Seguir investigando en el tema de Redes Neuronales Artificiales,

involucrando un mayor nmero de variables que intervengan en
comportamiento de la cuenca, trabajando con redes que tengan ms de
una capa de entrada, para as poder verificar qu importancia tiene
cada variable empleada para el clculo de caudales.
73
BIBLIOGRAFA
[1] Carpio. P. (2014). Matlab en Hidrologa. Universidad Catlica de Loja.

Ecuador.
[2] Samanego, E. (2011). Anlisis de la robustez de un modelo de redes

neuronales para la prediccin de caudales en la cuenca alta del rio Paute.
Universidad Politcnica Salesiana. Ecuador.
[3] Luja. E. (2014). Pronostico de Caudales medios mensuales del rio ILave
usando modelos de redes neuronales artificiales. Universidad Nacional del
Altiplano Puno. Per.
[4] Laqui. W. (2010). Aplicacin de Redes Neuronales Artificiales a la

Modelizacin de caudales medios mensuales del Rio Huancan. Revista Geo
Atmosfrica. Per.
[5] Ministerio de Agricultura. (2003). Evaluacin y ordenamiento de los recursos

hdricos en la cuenca del ro Chicama hidrologa. Instituto nacional de
recursos hdricos. La Libertad Per.
74

Proyecto de Investigacion

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Proyecto de Investigacion

Transféré par

Droits d'auteur :

Formats disponibles

FACULTAD DE INGENIERA, ARQUITECTURA Y URBANISMO

ESCUELA ACADMICO PROFESIONAL DE INGENIERA CIVIL

APLICACIN DE REDES NEURONALES PARA LA

Aprobacin del proyecto

Por estar siempre apoyndonos en los momentos de prosperidad y difciles,

Al Ing. Arriola Carrasco Guillermo Gustavo

Chingay Gonzales, Gary A.

Pea Becerra Enjhor Thaylor.

Queremos agradecer a Dios por estar siempre en esos momentos difciles as

Por ltimo nuestro agradecimiento hacia su persona Ing. Guillermo G. Arriola

Chingay Gonzales, Gary A.

Las Redes Neuronales Artificiales (RNA) constituyen una herramienta que se

La ventaja principal en la aplicacin de tal herramienta en Hidrologa es la

El modelo propuesto presenta una arquitectura de red multicapa (feedforward)

Debido a la gran importancia que tiene la determinacin y previsin de

1.1. SITUACIN PROBLEMTICA

1.1.1. A NIVEL INTERNACIONAL

En la actualidad los profesionales e investigadores de los recursos hdricos,

Siendo de gran importancia la modelacin y prediccin de caudales medios

En vista a estos inconvenientes en la modelizacin se ha optado por utilizar

Las redes neuronales sern utilizadas para la obtencin de caudales, de la

Por esta razn al utilizar las redes neuronales para la elaboracin de un

1.1.2. A NIVEL NACIONAL

En el Per el primer programa de Manejo de Cuencas, fue organizado por el

Cabe mencionar que el desarrollo poltico y econmico de una regin

El Per se ubica en la zona ecuatorial de Amrica del Sur, pero su clima no

La corriente Peruana y el relieve geogrfico del Per condicionan las

La costa presenta un clima templado en general, clido en el norte, algo ms

La zona amaznica o selva tiene un clima tropical, caluroso y hmedo, con

Considerando que las descripciones anteriores son muy genricas y los

Clima semiclido muy seco: (desrtico, rido, subtropical). Temperatura

1.2. FORMULACIN DEL PROBLEMA

Cmo modelar y generar series hidrolgicas aplicando redes neuronales

1.3. DELIMITACIN DE LA INVESTIGACIN

La cuenca del Ro Chicama se ubica geogrficamente entre los

Esta investigacin estuvo a cargo por los estudiantes de la Escuela de

1.4. JUSTIFICACIN E IMPORTANCIA

Como primera motivacin del tema es que desde el punto de vista

La segunda es netamente funcional, ya que el tener una herramienta

La tercera es incursionar en el uso de modelos data driven, por

1.5. LIMITACIONES DE LA INVESTIGACIN

Nuestra presente investigacin se vio limitada con los datos de estaciones

Los datos de las mismas fueron analizados con modelos probabilsticos,

1.6.1. OBEJETIVO GENERAL

Aplicar redes neuronales, para la generacin de series hidrolgicas en la

Utilizar el concepto de redes neuronales para la obtencin de datos

Determinar una red neuronal ptima, para la prediccin de caudales

Comprobar la validez de los modelos aplicados, por medio de

2.1. ANTECEDENTES DE ESTUDIO

Aplicacin de Redes Neuronales Artificiales a la Modelizacin y

Sistemas Inteligentes para el ajuste de Modelos Hidrolgicos.

MATLAB en hidrologa - El presente trabajo de investigacin tiene

Redes Neuronales Artificiales para la simulacin, estimacin y

Redes neuronales artificiales. Prediccin de alturas del rio Paran -

2.2.1. Redes Neuronales Artificiales

Son modelos computacionales que tratan de replicar, de manera simplificada,

En 1943, Warren McCulloc y Walter Pitts originaron el primer modelo de

El cerebro humano continuamente recibe seales de entrada de muchas

Figura 2: Comparacin entre neurona natural y neurona artificial.

Funciones Sigmoidales: Funciones montonas acotadas que dan una

La funcin logstica de 0 a 1, ver la grfica en la Figura 3:

Figura 3: La funcin logstica de 0 a 1.

La funcin tangente hiperblica de 1 a 1, ver la grfica en la Figura 4:

Figura 4: La funcin tangente hiperblica de 1 a 1.