Vous êtes sur la page 1sur 9

NoSQL Y Sistemas de Informacin Geogrficos: trabajo conjunto.

NoSQL and Geographic Information Systems: working together.


Manuel Fernando Anzola Jimenez
manuel.fernandoanzola@gmail.com
Universidad Pedaggica y Tecnolgica de Colombia
Ingeniera de Sistemas y Computacin
Resumen
El uso de los Sistemas de Informacin
Geogrficos (SIG) ha aumentado en
los ltimos aos, al igual que la
cantidad de datos espaciales que se
estn capturando y generando por
parte de los usuarios de la web
principalmente en las redes sociales, y
por entidades mediante el uso de
sensores, esto ha llevado a que las
bases de datos tradicionales utilizadas
en los SIG, tenga dificultades a la hora
de indexar y consultar informacin
espacial, generando sobrecostos en la
operacin de los sistemas. En este
punto aparece NoSQL como una
alternativa para la gestin de datos
espaciales que provee a los SIG un
acceso oportuno y relevante a la
informacin.
Abstract
The use of Geographic Information
Systems (GIS) has increased in recent
years, as the amount of spatial data
being captured and generated by Web
users mainly in social networks, and
institutions by the use of sensors, this
has meant that the traditional
databases used in GIS, have difficulty
indexing and query spatial information,
generating overruns in operating
systems. NoSQL appears at this point

as an alternative for the management


of spatial data in GIS provides timely
and relevant access to information.

Palabras clave. NoSQL, SIG, Sistema


de informacin Geogrfico, NoSQL
espacial, Datos geo-espaciales.
Keywords. NoSQL, GIS, Geographic
Information System, Space NoSQL,
Geospatial data.

1. Introduccin
Para un Sistema de Informacin
Geogrfico (SIG) es fundamental tener
acceso a la informacin que all se
gestiona, de forma oportuna y
relevante; en la actualidad estos
sistemas hacen uso del paradigma de
bases de datos relacional para el
almacenamiento
de
informacin,
debido principalmente a la consistencia
que se obtiene en los datos; pero,
desafortunadamente,
con
el
incremento de los datos en la ltima
dcada, el tiempo y consumo de
recursos de cmputo dificultan el
acceso a tiempo a los datos en los
SIG. Para ayudar a solventar esta
clase de inconvenientes, surgi
NoSQL, el cual posee una arquitectura

idnea para el manejo de grandes


volmenes de datos [1].
2. Revisin de Investigaciones.
Este trabajo pretende realizar una
revisin de los avances ms recientes
sobre el manejo de datos espaciales
por parte de los SIG, adems de los
esfuerzos
que
diferentes
organizaciones por incluir las bases de
datos no relacionales como una
solucin a la gestin del enorme
volumen de datos espaciales que
deben ser almacenados. De esta
manera se realiza una revisin de las
investigaciones presentando en subcaptulos la definicin de las palabras
claves junto con el desarrollo de estas
durante las ltimas dcadas.
2.1 Sistemas
de
Geogrficos (SIG)

Informacin

Los SIG son sistemas integrados


principalmente de hardware, software y
datos
espaciales
(topogrficos,
demogrficos, imgenes grficas, entre
otros) configurados para operaciones
de manipulacin y anlisis de
informacin para la presentacin de
reportes, y el control y visualizacin de
datos geogrficos [2]. El uso de esta
tecnologa se popularizo
por el
impulso de organizaciones como
Google Inc. con el desarrollo de
aplicaciones como Google Earth y
Google Maps, que se gestionan como
servicios basados en web, conocido
como Web Mapping, siendo este el
ejemplo ms sencillo de la aplicacin
de los SIG [3] [4]. Adems, los SIG han
permitido
que
empresas
como
Samsung Company, puedan visualizar

los reportes presentados por su


Sistema de Anlisis de Informacin de
Mercado (MIAS, por las siglas en
ingls de Market Information Analysis
Systems), obteniendo una forma
sencilla de representar la informacin,
como el de ubicar las tiendas
pertenecientes a la compaa [5].
2.2 Datos Geo-espaciales
El dominio de aplicacin de los SIG
aumento, en parte, gracias la cantidad
de informacin geogrfica que los
usuarios de la web han aportado
mediante el proceso de geoetiquetado, que consiste en agregar
datos como latitud, longitud, altitud,
nombre a fotografas, videos, o
archivos de voz, impulsando el
desarrollo de aplicaciones que ayudan
en el proceso de visualizacin e
indexado de datos espaciales [6].
Actualmente, la mayora de los SIG se
basa en el paradigma de gestin de
datos relacional, limitando el volumen
de informacin que se puede gestionar,
por lo que fue necesario el desarrollo
de tcnicas y algoritmos que
optimizarn las consultas a las bases
de datos, de tal manera que se pueda
tener acceso a los datos de manera
rpida [7].
As mismo, debido a que el uso de SIG
se extendi a diferentes sectores de la
sociedad, se origin la necesidad de
que estos se soporten en un
paradigma de bases de datos
construido sobre un enfoque de alta
disponibilidad de la informacin,
caracterstica que es notable en el
paradigma no relacional [8].

Por otra parte, es importante resaltar


que el Open Geospatial Consortium
(OGC) define un conjunto de reglas
para realizar la peticin y respuesta
durante el acceso a recursos
geoespaciales (metadatos espaciales,
imgenes o datos geoespaciales en
formato Geography Markup Language
GML) garantizando as, un estndar
para el manejo de estos datos, tanto
para fabricantes de hardware como de
software [9].
2.3 NoSQL
El principal uso de las bases de datos
NoSQL es en la administracin de
informacin en las redes sociales,
como Twitter o Facebook, donde la
cantidad de datos que se genera a
diario es elevada, al igual que el
nmero de transacciones que debe
soportar por minuto [10]- [11]. Para
poder gestionar dichos volmenes de
datos, las bases de datos no
relacionales se centran en tener un
acceso mnimo a disco, reduciendo el
consumo de recursos de mquina y
por ende el tiempo de respuesta,
otorgando una base slida para la
creacin de sistemas de informacin
robustos.
Otras caractersticas de estas bases
de datos son: proporcionan un alto
desempeo,
tienen
manejo
de
diferentes
modelos
de
datos
(documentos,
clave/valor,
grafos,
colecciones, columnas), posibilitan una
rpida escalabilidad, alta concurrencia
y bajos tiempos de acceso y emplean
un modelo de control de consistencia
denominado
BASE
(Basically
Available,
soft-state,
Eventually
consistency)
garantizando
una

significativa
reduccin
de
costo
computacional para la consistencia de
datos y as proveen velocidad en las
transacciones. Es de aclarar, que
NoSQL emplea un almacenamiento
tipo
copy-on-write
mediante
la
replicacin de la informacin en los
diferentes nodos servidores que
adems pueden estar distribuidos
geogrficamente [12].
De esta manera, el contexto principal
bajo el cual se hace uso de tecnologa
NoSQL, es bajo la aplicacin de Big
data, cuya referencia es hacia grandes
volmenes de datos [1] [13], y ,
considerando la gran cantidad de datos
espaciales
que
recolectan
organizaciones, mediante instrumentos
como China Near Earth Object Survey
Telescope,
cuya
informacin
representa
datos
espaciales
e
imgenes del universo y necesitan un
sistema de archivos rpido y eficiente,
se toman en cuenta herramientas
como MongoDB para cumplir con esta
funcin [14] [15], adems se han
desarrollado libreras como FastBit que
fue utilizada en el desarrollo de un
sistema de archivos para el New
Vacuum Solar Telescope (NVST), con
el fin de cambiar el paradigma
relacional
bajo el cual venan
trabajando [16].As el uso de las bases
de datos no relacionales est
incrementando, con el uso en
aplicaciones como el almacenamiento
de datos 3D para el diseo de modelos
y prototipos de construccin para
ciudades, edificaciones y puentes [17].
Aunque el uso de este paradigma
incrementa cada da, se hace
necesario seguir trabajando en la

resolucin de inconvenientes como el


manejo de datos espaciales, donde la
actualizacin dinmica de datos puede
causar un desbalance en la exactitud
de los datos espaciales, soluciones
como el desarrollo de algoritmos el de
balanceo dinmico de datos espaciales
[18]. Tambin se han propuesto
soluciones como Citrusleaf cuyo
objetivo es dar consistencia a la
informacin, puesto que el paradigma
no relacional tiende a sacrificar esta
caracterstica, promocionndose como
la ms rpida de las bases de datos no
relacionales en cuanto al manejo de
datos espaciales [19].
2.4 NoSQL Espacial
El principal uso de los datos geoespaciales est en ayudar a los
usuarios a encontrar lugares que se
han geo-referenciado por medios como
el geo-etiquetado [20], pero con la
enorme cantidad de datos que se
generan en la web, es necesario
adoptar un modelo que mejore las
capacidades de operacin en las
aplicaciones que se basan en el
paradigma relacional, por tanto,
mediante el uso de servicios como los
descritos por el OGC, es posible
aprovechar los recursos web y generar
una interoperabilidad entre los dos
paradigmas, permitiendo introducir
bases de datos no relacionales que
trabajen en cooperacin con las bases
de datos tradicionales [21].
Lo anterior para no oponerse a los
esfuerzos
presentados
por
las
organizaciones para seguir haciendo
uso de las bases de datos
tradicionales, por su caracterstica de
consistencia de datos; pero teniendo

en cuenta que en la ltima dcada con


la captura de datos espaciales en tres
dimensiones, que son utilizados por
SIG para presentar modelos y
prototipos, es necesario que el sistema
de archivos que los gestione presente
una alta efectividad y escalabilidad
[22].
NoSQL presenta herramientas como
Cassandra, que cuenta con una
extensin que da la capacidad de
indexar
datos
multidimensionales
considerando la capacidad de los
datos geo-espaciales en afectar el
desempeo en las consultas sobre los
mismos
[23],
sopesando
estas
caractersticas, tambin se ha hecho
uso de MongoDB otro miembro de las
bases de datos no relacionales, que
combinado con el potencial de
procesamiento de datos de los SIG
mostro un comportamiento fiable en el
manejo de cantidades grandes de
volmenes de datos capturadas por el
Geofon un servicio de extraccin de
datos
geoespaciales
para
la
monitorizacin de terremotos [24].
Los potenciales usos de estas
herramientas se ha fortalecido con la
integracin de la semntica de datos
con las bases de datos no relacionales
aprovechando uno de los modelos de
almacenamiento de datos como es de
tipo vector, con el fin de mejorar el
rendimiento en red de las aplicaciones
Big Data haciendo uso de la
replicacin evitando la sobrecarga de
la red y de los sistemas, permitiendo
una buena visualizacin en la web [25].
Como ejemplo prctico de un modelo
de administracin de datos geoespaciales esta GAIA un sistema que
permite el acceso sincronizado a los
datos geogrficos mediante una
trasformacin matemtica de la

informacin y la aplicacin de
algoritmos de bsqueda diseado
especficamente para esta operacin
[26].
3. Conclusiones
El incremento en el volumen de datos
espaciales
capturados
creo
la
necesidad de contar con una
herramienta de gestin de datos cuyas
capacidades de trabajo no se vieran
afectadas por la dificultad de gestin
de estos, as fue como diferentes
organizaciones empezaron a usar
NoSQL como la una solucin, y
adems combinar el anlisis por parte
de los sistemas de informacin
geogrficos para presentar los reportes
de una manera grfica y ordenada.
Tambin para el indexado y consulta
de datos espaciales se crearon
diferentes algoritmos y arquitecturas
que derivaron en una implementacin
exitosa, y con grandes aportes a cada
una de las entidades donde se usan.

Referencias
[1] M. Rodrigues Vieira, J. Maimone
de Figueiredo, G. Liberatti y A. F.
Mendes Viebrantz, Bancos de
dados NoSQL:
Conceitos,Ferramentas,Linguage
ns e Estudos de Casos no
Contexto de Big Data, 2012. [En
lnea]. Available:
http://data.ime.usp.br/sbbd2012/
artigos/pdfs/sbbd_min_01.pdf.
[ltimo acceso: 25 Septiembre
2014].
[2] Cloud Computing: A solution to

Geographical Information
Systems (GIS), International
Journal on Computer Science and
Engineering (IJCSE), vol. 3, n 2,
pp. 594-600, 2011.
[3] H. Samet, Sorting in Space:
Multidimensional, spatial, and
metric data structures for
applications in spatial databases,
geographic information systems
(GIS), and location-based
services, 29th IEEE
International Conference on Data
Engineering, pp. 1254-1257,
2013.
[4] M. Miler, D. Medak y D. Odobai,
Two-Tier Architecture for Web
Mapping with NoSQL Database
CouchDB, Geospatial
CrossroadsGIForum, vol. 11, pp.
62-71, 2011.
[5] O. Izadi y A. Rakib, Improving
the Efficiency of Market
Information Analysis Systems
using GIS,Polygon and Spatial
Databases, Research and
Innovation in Information
Systems (ICRIIS), 2013
International Conference on, pp.
527-532, 2013.
[6] L. Yun, Z. Mingjin, S.
Witherspoon, Y. Yesha, Y. Yesha y
N. Rishe, sksOpen: Efficient
Indexing, Querying, and
Visualization of Geo-spatial Big
Data, Machine Learning and
Applications (ICMLA), 2013 12th
International Conference on, vol.
2, pp. 495-500, 2013.
[7] L. Guobin y W. Guiling, Research
on Optimized Spatial Data Query
Algorithm in the Spatial
Database, Image Analysis and
Signal Processing, 2009. IASP

2009. International Conference

on, pp. 292-294, 2009.


[8] W. Xiaochun, W. Kai, S. Zixuan y

L. Yanjun, Research and


Implementation of the HighAvailability Spatial Database
Based on Oracle, Computer
Science & Service System
(CSSS), 2012 International
Conference on, pp. 1713-1716,
2012.

[9] P. Amirian, A. Basiri y A.


Winstanley, IMPLEMENTING
GEOSPATIAL WEB SERVICES
USING SERVICE ORIENTED
ARCHITECTURE AND NOSQL
SOLUTIONS, The Third
International Conference on
Digital Information and
Communication Technology and
its Applications (DICTAP2013),
pp. 161-169, 2013.
[10 P. Bjeljac, I. Zeevi y I. Perii,
]
NoSQL Databases Example of
Use in a Lost and Found
Website, 25 Octubre 2013. [En
lnea]. Available:
http://www.researchgate.net/publ
ication/258099631_NoSQL_Datab
ases__Example_of_Use_in_a_Lost
_and_Found_Website. [ltimo
acceso: 25 Septiembre 2014].
[11 E. Barbierato, M. Gribaudo y M.
]
Lacono, Performance evaluation
of NoSQL big-data applications
using multi-formalism models,
Future Generation Computer
Systems, vol. 37, pp. 345-353.,
2014.
[12 L. Dobos, B. Pinczel, A. Kiss, G.
]
Rcz y T. Eiler, A Comparative
Evaluation of NoSQL, Annales
Univ. Sci. Budapest., Sect.
Comp., vol. 42, pp. 173-198,
2014.
[13 P. Xiang, R. Hou y Z. Zhou,
]
Cache and Consistency in
NOSQL, Computer Science and
Information Technology (ICCSIT),
2010 3rd IEEE International
Conference on, vol. 6, pp. 117120, 2010.
[14 X. WANG, Design and
]
Implementation of CNEOST
Image Database Based on NoSQL

System, Chinese Astronomy


and Astrophysics, vol. 38, n 2,
pp. 211-221, 2014.

[15 A. B. M. Moniruzzaman y S. A.
]
Hossain, NoSQL Database: New
Era of Databases for Big data
Analytics - Classification,
Characteristics and
Comparison, arXiv preprint
arXiv:1307.0191, 2013.
[16 Y.-b. Liu, F. Wang, K.-f. Ji, H. Deng,
]
W. Dai y L. Bo, NVST DaTa
Archiving System Based on
FastBit NoSQL Database,
Journal of the Korean
Astronomical Society, vol. 47, n
3, pp. 115-122, 2014.
[17 B. Mao, L. Harrie, J. Cao, Z. Wu y
]
J. Shen, NoSQL Based 3D City
Model Management System,
ISPRS-International Archives of
the Photogrammetry, Remote
Sensing and Spatial Information
Sciences, vol. 1, pp. 169-173,
2014.
[18 Z. Yan, Q. Zhu y Z. Yeting,
]
Spatial Data Dynamic Balancing
Distribution Method for Parallel
Spatial Database, Information
Engineering and Computer
Science, 2009. ICIECS 2009.
International Conference on , pp.
19-20, 2009.
[19 V. Srinivasan y B. Bulkowski,
]
Citrusleaf: A Real-Time NoSQL
DB which Preserves ACID, Proc.
37th International Conference on
Very Large Databases, 2011.
[20 P. Amirian, A. Winstanley y A.
]
Basiri, NoSQL storage and
management of geospatial data
with emphasis on serving
geospatial data using standard
geospatial web services, 2012.
[En lnea]. Available:
http://www.geos.ed.ac.uk/~giste
ac/proceedingsonline/GISRUK201

3/gisruk2013_submission_42.pdf.
[ltimo acceso: 8 Septiembre
2014].
[21 C. de Souza Baptista, O. F. de
]
Lima Junior, M. G. de Oliveira, F.
Gomes de Andrade, T. E. da Silva
y C. E. Santos Pires, Using OGC
Services to Interoperate Spatial
Data Stored in SQL and NoSQL
Databases, GeoInfo, pp. 61-72,
2011.
[22 L. Gang, Q. Zhu, H. Zhenwen, Z.
]
Yeting, W. Chonglong, X. Li y W.
Zhengping, 3D GIS database
model for efficient management
of large scale underground
spatial data, Geoinformatics,
2009 17th International
Conference on., pp. 1-5, 2009.
[23 L. E. O. Lizardo, M. M. Moro y C.
]
A. Davis Jr., GeoNoSQL: Banco
de dados geoespacial em
NoSQL, 2014. [En lnea].
Available:
http://www6.univali.br/seer/index
.php/acotb/article/view/5332.

[ltimo acceso: 25 Septiembre


2014].
[24 W. Tampubolon, Utilization of
]
NoSQL database for disaster
preparedness, AGILE'2014
International Conference on
Geographic Information Science,
2014.
[25 . Garca-Recuero, S. Esteves y L.
]
Veiga, Quality-of-Data for
Consistency Levels in Georeplicated Cloud Data Stores,
Cloud Computing Technology
and Science (CloudCom), 2013
IEEE 5th International
Conference on, vol. 1, pp. 164170, 2013.
[26 A. Elouafiq y R. Abid,
]
Geographical Asynchronous
Information Access (GAIA) in the
Cloud, arXiv preprint
arXiv:1406.2644, 2014.

Vous aimerez peut-être aussi