Vous êtes sur la page 1sur 7

CORRELACIÓN PARA DETERMINAR DATOS FALTANTES DE PRECIPITACIONES

EN ESTACIONES DE LA CUENCA CASMA

CORRELATION TO DETERMINE DATA MISSING FROM PRECIPITATIONS IN


SEASONS OF THE CASMA BASIN

Elder Aguilar Aguilar 1


Royser Cayatopa Idrogo 2
Resumen

El presente trabajo evalúa la aplicabilidad de distintos métodos de completación de datos faltantes


de la precipitación, en seis estaciones pluviométricas durante el periodo de 2010- 2017 en la
cuenca rio Casma, Perú. Primero, se realizó el Análisis Exploratorio de Datos (AED) para
determinar la existencia de valores atípicos de la información obtenida de la base datos del ANA
(Autoridad nacional del Agua). Estos métodos corresponden a regresión lineal, razones de
distancias, promedios vecinales, razones promedio y correlaciones con estaciones vecinas,
propuestos por UNESCO.
Las observaciones de lluvia que se registran en las distintas estaciones de la red meteorológica,
es uno de los insumos para la realización de estudios, investigaciones, actividades de seguimiento
y manejo de la información que sirven para fundamentar la toma de decisiones en materia de
recursos, costos de producción y política ambiental. En ocasiones, no se cuenta con información
completa, debido a situaciones como equipos no calibrados, deterioro en unidades de medición,
mediciones no oportunas o deficiencias en el procedimiento mismo de la observación y la
medición entre otros. Con el fin de tener series históricas completas de lluvia, se propuso un
método de estimación de datos faltantes de fácil aplicación, basado en series de datos de
precipitación acumulada por ciclos en periodos de tiempo mensuales, teniendo en cuenta la
agrupación por años El Niño, La Niña y Neutro, fundamentado y validado estadísticamente.
Palabras claves: Cuenca casma, precipitación, completación de datos, Estimación datos
faltantes, probabilidad.

Abstract

The present work evaluates the applicability of different methods of completion of data missing
rainfall, in six rainfall stations during the period of 2010-2017 in the river basin Casma, Peru.
First, the Exploratory Data Analysis (AED) was carried out to determine the existence of atypical
values of the information obtained from the database of the ANA (National Water Authority).
These methods correspond to linear regression, distance ratios, neighborhood averages, average
ratios and correlations with neighboring stations, proposed by UNESCO.
The observations of rainfall that are recorded in the different stations of the meteorological
network, is one of the inputs for conducting studies, research, monitoring activities and
information management that serve to inform decision making regarding resources, production
costs and environmental policy.

1
Adscrito a la Escuela Profesional de Ingeniería Civil. Facultad de Ingeniería, Arquitectura y Urbanismo.
Estudiante del VI ciclo. Universidad Señor de Sipán. Provincia de Chiclayo. Región Lambayeque. Perú.
aaguilarelder@crece.uss.edu.pe.
2
Adscrito a la Escuela Profesional de Ingeniería Civil. Facultad de Ingeniería, Arquitectura y Urbanismo.
Estudiante del VI ciclo. Universidad Señor de Sipán. Provincia de Chiclayo. Región Lambayeque. Perú.
Cidrogoroys@crece.uss.edu.pe.
Sometimes, complete information is not available, due to situations such as non-calibrated
equipment, deterioration in measurement units, inappropriate measurements or deficiencies in the
procedure of observation and measurement, among others. In order to have complete historical
series of rainfall, a method of estimating missing data of easy application was proposed, based on
series of accumulated precipitation data by cycles in monthly periods of time, taking into account
the grouping by El Niño years, La Niña and Neutral, founded and statistically validated.
Key words: Casma basin, precipitation, data completion, Estimation of missing data,
accumulated regression, probability.

1. Introducción
Uno de los problemas más comunes es la falta de algunos datos o periodos en los registros
históricos de las estaciones. Sin embargo existen varios procedimientos para realizar la
completación y extensión de los datos faltantes, desde la utilización de promedios, hasta la
aplicación de técnicas estadísticas y matemáticas. Se dará a conocer algunos alcances importantes
sobre el tema, algunos métodos y ejemplos de aplicación. Conocer aspectos importantes de la
completación y extensión de datos, utilizado problemas con valores reales.
Conocer los métodos que permitan la completación y extensión de datos. Analizar los resultados
obtenidos de la completación y extensión de datos mediante un ejercicio de aplicación.
La precipitación se define como la variable clave en los sistemas hidrológicos. En los
diferentes estudios de investigación, el punto de partida es la estimación de la precipitación con
adecuada resolución espacial y temporal (Tapiador et al., 2003; Tapiador et al., 2012; Schuurmans
and Bierkens, 2007).
La información de la precipitación exacta es de suma importancia para numerosas
aplicaciones incluyendo la agronomía, hidrología, meteorología y climatología (Kidd and
Levizanni, 2009; Hou et al., 2013, Scheel et al., 2010).
Entre ellas el poder pronosticar las máximas avenidas (Collier, 2007). Los pluviómetros
son la fuente principal de datos de precipitación, los datos pluviométricos tienen la ventaja de
representar la medición directa de la lluvia (Scofield and Kuligowski, 2003).
El Perú está dividido de norte a sur por la cordillera de los Andes en tres vertientes, una
drena hacia el océano Pacífico (VP), otra hacia el océano Atlántico (VA) a través del río
Amazonas y hacia el sur al lago Titicaca (VT) (Lavado et al., 2012). El Servicio Nacional de
Meteorología e Hidrología (SENAMHI, http://www.senamhi.gob.pe) es el encargado de
monitorear y registrar los datos de la red hidrometeoro lógicos.
De acuerdo al ministerio de agricultura (http://www.minag.gob.pe) la agricultura a lo largo
de la VP se ha desarrollado gracias a la irrigación que utiliza el 80% de la disponibilidad de agua
fresca, y, precisamente es en ésta vertiente es donde se concentra la mayor cantidad de estaciones
meteorológicas. La VP está conformada por 53 cuencas hidrográficas, se caracterizan por ser
cuencas pequeñas y sus aguas fluyen de este a oeste, desde los Andes hacia el océano Pacífico
(Lavado et al., 2012).
Cuando en los registros pluviométricos existe una carencia de datos, existen diversos
métodos para la completación de datos que parten desde la metodología descrita por la UNESCO-
ROSTLAC (1982) en su guía metodológica para la elaboración del balance hídrico de América
del Sur (Pizarro et al., 2009), hasta el uso de programas estadísticos y metodología más compleja
(Ramesh, 2014).
La metodología establecida por la UNESCO-ROSTLAC (1982) es más factible de utilizar,
se basan en fórmulas matemáticas simples, en donde se establecen relaciones entre estaciones
patrones o cercanas (con datos completos) y la estación con carencia de información
pluviométrica.
2. Materiales y métodos
Método de regresión lineal
La investigación se desarrolla en función de este método, siendo uno de los más utilizados;
se recomienda para la estimación de datos mensuales y anuales. Se requiere establecer una
regresión y correlación lineal con la estación patrón consistente, mediante una ecuación lineal de
dos variables:
𝑦=𝑎+𝑏𝑥 (1)
Donde;
“y” es la precipitación estimada, “x” es la precipitación de la estación patrón.
a y b son las constantes de la regresión lineal.
A través del coeficiente de correlación (R) se determina la mejor estación vecina más
cercana como patrón. En términos hidrológicos, se considera aceptable un valor de -0.8≤R≤0.8
(UNESCO-ROSTLAC, 1982; Pizarro et al, 1993; 2009).

Correlación de datos

En probabilidad y estadística, la correlación indica la fuerza y la dirección de una relación


lineal y proporcionalidad entre dos variables estadísticas. Si disponemos de dos series de datos
emparejadas, con frecuencia es útil conocer si ambas variables están relacionadas, y, en caso
afirmativo, encontrar la expresión que refleja dicha relación. Si la ecuación que mejor relaciona
dichas variables es la de una recta, decimos que existe correlación lineal.
Un ejemplo puede ser la pluviometría registrada en dos estaciones próximas (Figura). Si la
pluviometría es similar en ambos puntos, sería de gran utilidad cuantificar esa relación, pues de
ese modo podríamos evaluar, aunque fuera de modo aproximado, la pluviometría de un lugar a
partir de la registrada en el otro.

Figura 1: Correlación de datos


Fuente:
3. Resultados

REGISTROS DE PRECIPITACION ANUAL

AÑO Buena Vista Pariacoto Chacchan Pira Cajamarquilla Yautan


2000 0.00 2.00 6.50 9.50 14.20 1.60
2001 0.00 2.40 7.20 13.20 14.50 1.70
2002 0.00 3.40 7.50 13.70 14.60 1.80
2003 0.00 3.60 8.36 14.00 14.60 2.00
2004 0.00 4.60 8.40 14.80 15.40 2.00
2005 0.00 5.40 8.60 14.80 15.40 2.20
2006 0.00 5.60 8.90 15.20 16.10 2.20
2007 0.00 6.20 9.10 15.40 16.10 2.30
2008 0.00 8.20 9.10 15.50 16.20 2.30
2009 0.00 10.20 9.20 15.50 16.40 3.00
2010 1.00 12.40 9.40 15.60 16.40 3.00
2011 1.00 12.60 9.70 17.80 16.40 3.50
2012 1.20 14.20 9.80 18.34 17.30 3.50
2013 2.00 14.20 10.50 19.60 18.00 3.60
2014 4.00 15.60 10.90 19.60 18.00 3.60
2015 5.00 16.60 11.40 29.40 18.60 ND
2016 41.00 20.80 ND 29.50 18.60 ND
Tabla 1

COEFICIENTE DE CORRELACION
25.00

y = 0.4888x + 11.573
20.00 R² = 0.7939

15.00 y = 0.2385x + 14.056


R² = 0.881

10.00
y = 0.2289x + 7.0371 y = 0.1525x + 1.3273
5.00 R² = 0.8398 R² = 0.9674

0.00
0.00 2.00 4.00 6.00 8.00 10.00 12.00 14.00 16.00 18.00

ESTACION PARIACOTO ESTACION PIRA


ESTACION CAJAMARQUILLA ESTANCION YAUTAN
Lineal (ESTACION PARIACOTO) Lineal (ESTACION PIRA)
Lineal (ESTACION CAJAMARQUILLA) Lineal (ESTANCION YAUTAN)

Grafico 1
Buena
AÑO Vista Pariacoto Chacchan Pira Cajamarquilla Yautan
2000 9.98 2.00 7.32 13.20 18.00 2.00
2001 9.61 10.20 9.20 15.60 14.60 2.20
2002 9.82 5.60 9.10 29.40 16.10 3.60
2003 1.00 12.40 8.40 14.00 15.40 2.47
2004 9.51 12.60 11.40 15.40 16.40 3.00
2005 9.33 16.60 10.50 18.34 17.30 2.30
2006 2.00 3.40 8.36 9.50 18.60 3.50
2007 9.37 15.60 7.50 15.20 16.20 2.30
2008 4.00 3.60 8.90 14.80 16.10 2.72
2009 9.96 2.40 9.70 14.80 14.20 1.70
2010 9.79 6.20 6.50 19.60 14.50 3.60
2011 9.86 4.60 9.10 13.70 18.00 2.20
2012 41.00 14.20 9.80 15.50 15.40 3.00
2013 5.00 14.20 8.60 29.50 16.40 1.80
2014 1.20 8.20 7.20 17.80 16.40 3.50
2015 1.00 20.80 10.90 15.50 18.60 1.60
2016 9.83 5.40 9.40 19.60 14.60 2.00
Tabla 2

ANALISIS DE CONSISTENCIA - CUENCA CASMA


45.00
40.00
35.00
Precipitaciones

30.00
25.00
20.00
15.00
10.00
5.00
0.00

años

BUENA VISTA PIRIACOTO CHACCHAN


PIRA CAJAMARQUILLA YAUTAN

Grafico 2
4. Discusión
Se inició por la estación que tenía menos incógnitas para realizar una buena
determinación de datos.
En la primera correlación se tuvo que encontrar un solo dato, tomamos en cuenta las
distancias en la que se encontraban las estaciones vecinas y finalmente obtuvimos que la
estación más cercana y con mayor coeficiente de correlación y logramos ejercer como
nuestra estación base a la estación Cajamarquilla.
La segunda obtención de datos se realizó de la estación Yautan que era clave para poder
encontrar los datos de nuestra siguiente correlación, por ser la estación más cercana y
dando un factor de correlación mayor a 70%.
La ultima correlación para determinar los datos de la estación buena vista, que por tener
pocos datos se tuvo que realizó varias correlaciones y finalmente obteniendo como
estación base, la estación Yautan que por ser vecina y generar un factor de correlación
excelente, se determinó los datos.
Todo este procedimiento fue aplicado el método de regresión Lineal para determinar los
datos faltantes.
5. Conclusiones
Se logró obtener los datos faltantes, de tres estaciones de la cuenca casma como son
estación hidrométricas, estación BUENA VISTA, estación CHACCHAN, y estación
YAUTAN, de las cuales en la estación Buena Vista tenía datos minimos, lo cual se
obtenía un coeficiente correlación muy bajo en el análisis de consistencia, las cuales
cambiaron sus resultado luego de haber obtenido toda la data necesaria para llegar a un
R2 minimo de 0.85 y un R2 máximo de 0.96, los cuales equivalen a un 85% y un 96%
respectivamente.

6. Referencias
Carbajal, M., C, Yarlequé, C., Posadas, A., Silvestre, E., Mejía, A., y Quiroz, R. (2010).
Reconstrucción de datos faltantes de precipitación pluvial diaria mediante la transformada
Wavelet. Revista peruana geo-atmosférica rpga (2), 76-88. Recopilado de:
http://www.atmos.albany.edu/student/yarleque/datos/Publications/Carbajal%20et%20al%20201
0.pdf
Romero, E., L. y Lavado, W., C. Evaluación de métodos hidrológicos para la completación de
datos faltantes de precipitación en estaciones de la cuenca Jetepeque, Perú (2015). Revista
Tecnológica ESPOL – RTE, Vol. 28, (3). Universidad Nacional Agraria La Molina, Perú.
Recopilado de: file:///C:/Users/Elder/Downloads/400-1136-1-PB%20(6).pdf
Adriadna Chávez-Jiménez (2009) en su investigación “aplicación del método de regionalización
para la determinación de caudales en el puente carraquillo”
https://pirhua.udep.edu.pe/bitstream/handle/11042/1858/MAS_ICIH_001.pdf?sequence=1
Pizarro, R., Ausensi, p., Aravena D., y Sangüesa, C. (s/f). Evaluación de Métodos Hidrológicos
para la Completación de Datos Faltantes de Precipitación en estacones pluviograficas de la VII
Región del Maule, Chile. Recuperado de:
http://eias.utalca.cl/Docs/pdf/Publicaciones/articulos_cientificos/pizarro_ausensi_aravena_sang
uesa.pdf

Vous aimerez peut-être aussi