Académique Documents
Professionnel Documents
Culture Documents
Resumen Abstract
La minera de datos es una herramienta es- Data mining is a strategic and technological
tratgica y tecnolgica que desarrolla ventajas tool which gives competitive advantages to
competitivas en el mundo de los negocios per- companies in the business world. Through the
mitiendo, a travs de la extraccin de patrones extrapolation of database information and be-
dentro de las bases de datos de las empresas havioral patterns, companies and private sec-
y organizaciones, extraer conocimiento nuevo tor organizations can acquire new knowledge
y til facilitando la toma de decisin y aplica- which can assist in a decision-making process
cin de nuevas estrategias por parte de la ge- as well as aid in the design and implementa-
rencia, a su vez, permite mostrar informacin tion of more dynamic management strategies
ms exacta, lo que permite disear estrategias allowing for quick response and addictiveness
competitivas ms dinmicas permitiendo una to the changing environment.
mayor capacidad de reaccin y adaptacin a
los constantes cambios del entorno. Key word
SOA, data mining, web services, BPM, Data
Palabras clave Warehouse, Business Intelligence, Warehous-
AOS, minera de datos, servicios web, BPM, ing.
Data Warehouse, Business Intelligence, Wa-
rehousing.
1. INTRODUCCIN
Las empresas necesitan poder interconectar los procesos, personas e informacin, tanto con la
propia organizacin como atravesando sus fronteras con subsidiarias y socios comerciales. La
falta de integracin entre los componentes de IT sistemas, aplicaciones y datos hace difcil obte-
ner una respuesta rpida y efectiva ante los cambios que afectan de forma natural a los negocios.
La inflexibilidad genera costes, reduce la capacidad de respuesta ante los clientes, compromete el
cumplimiento con las normativas legales y afecta negativamente la productividad de los emplea-
dos. En suma, una deficiente integracin es uno de los problemas ms importantes a los que las
organizaciones deben hacer frente para mantener su competitividad y garantizar su crecimiento.
La Arquitectura Orientada a Servicios (SOA, Service Oriented Architecture) supone una estrategia
* Ingeniero de Sistemas. Magister en Ingeniera de Sistemas. Universidad Simon Bolivar - Barranquilla, Colombia.
Artculo recibido: Agosto 15 /2012. Aceptado en Noviembre 1/2012.
| Innov.Ing.Desarro. | Vol. 1 No. 1| Pgs. 25-34 | Coruniamericana Barranquilla-Medelln, Colombia | Enero-Dic. 2012 | ISSN: 2344-7559 |
http://coruniamericana.edu.co/publicaciones/ojs/index.php/IID
26 Jonathan Ruiz Rangel
general de organizacin de los elementos de IT, de forma que una coleccin abigarrada de siste-
mas distribuidos y aplicaciones complejas se pueda transformar en una red de recursos integrados,
simplificada y sumamente flexible.
Un proyecto SOA bien ejecutado permite alinear los recursos de IT de forma ms directa con
los objetivos de negocio, ganando as un mayor grado de integracin con clientes y proveedores,
proporcionando una inteligencia de negocio ms precisa y ms accesible, con la cual se podrn
adoptar mejores decisiones, y ayudar a las empresas a optimizar sus procesos internos y sus flujos
de informacin para mejorar la productividad individual. Ver Fig 1.
Los programas de gestin del conocimiento se complementan con distintas herramientas adems
de la minera de datos, como puede ser la data warehousing (almacenes de datos) o el groupware
(software colaborativo). La minera de datos, como herramienta de bsqueda de informacin, se
utiliza como sistema de apoyo a la toma de decisiones de las altas direcciones de las empresas.
Las tcnicas de minera de datos se centran en analizar el gran volumen de datos, que en una pri-
mera seleccin pueden ser pertinentes, pero que la aplicacin de tcnicas de seleccin ceida a
unas determinadas demanda, reduce el tamao de los datos eligiendo las variables ms influyentes
en el problema.
En definitiva, la minera de datos es una tecnologa usada para descubrir informacin oculta y
desconocida, pero potencialmente til, a partir de las fuentes de informacin de la propia empresa.
Obtiene un conocimiento de un negocio, utilizando tcnicas de clustering (agrupamiento), redes
neuronales, rboles de decisin y reglas de asociacin etc. [1]
2. Definiciones
Antes de dar a conocer claramente lo que significa Minera de datos, es preciso dejar en claro lo
que es un Data Warehouse, que en principio lo podemos ver como un concepto que est antes de
Minera de datos y es la base de este (aunque no siempre es as); por ello, el objetivo de esta sec-
cin es dar una idea general de este concepto, no entraremos en muchos detalles, pero daremos a
conocer lo ms relevante para que en las secciones siguientes, cuando hablemos de Data Warehou-
se o Data Warehousing, no haya dudas sobre lo que nos estamos refiriendo.
Las Bases de Datos (BD) de una empresa utilizan los ordenadores como medio para organizar sus
datos de forma que sean comprensibles para las personas. Este proceso es conocido como Data
| Innov.Ing.Desarro. | Vol. 1 No. 1| Pgs. 25-34 | Coruniamericana Barranquilla-Medelln, Colombia | Enero-Dic. 2012 | ISSN: 2344-7559 |
http://coruniamericana.edu.co/publicaciones/ojs/index.php/IID
Minera de datos como soporte a la toma de decisiones empresariales en una arquitectura Soa 27
Warehousing. La comprensin de los datos almacenados es esencial para cualquier organizacin,
ya que constituye un elemento bsico en la toma de decisiones.
Los Data Warehouses a menudo almacenan gran cantidad de informacin, la cual est a veces sub-
dividida en pequeas unidades lgicas. Peridicamente se importan estos datos de otros sistemas
de informacin dentro del Data Warehouse para realizar sobre ellos un procesamiento posterior.
Un Data Warehouse se diferencia de una Base de Datos operacional de una empresa; diremos que
un Data Warehouse puede derivarse de la Base de Datos corporativa mediante la importacin de
informacin, pero el DW no es esa BD operacional.[2]
Muchos de los datos de una empresa se utilizan como soporte a los negocios, por eso a este tipo
de datos se les denomina operacionales. Los sistemas usados con el fin de recogerlos reciben el
nombre de OLTP (Online Transaction Processing).[3]
| Innov.Ing.Desarro. | Vol. 1 No. 1| Pgs. 25-34 | Coruniamericana Barranquilla-Medelln, Colombia | Enero-Dic. 2012 | ISSN: 2344-7559 |
http://coruniamericana.edu.co/publicaciones/ojs/index.php/IID
Minera de datos como soporte a la toma de decisiones empresariales en una arquitectura Soa 29
nocimiento. Se observa igualmente el volumen que presenta en cada nivel y el valor que los res-
ponsables de las decisiones le dan en esa jerarqua. El rea interna dentro del tringulo representa
los objetivos que se han propuesto. La separacin del tringulo representa la estrecha unin entre
dato e informacin, no as entre la informacin y el conocimiento. La Minera de datos trabaja
en el nivel superior buscando patrones, comportamientos, agrupaciones, secuencias, tendencias o
asociaciones que puedan generar algn modelo que nos permita comprender mejor el dominio para
ayudar en una posible toma de decisin.
Extraccin de datos
Limpieza de datos
Seleccin de caractersticas
Algoritmos
Anlisis de resultados
Este producto est fuertemente relacionado con anlisis estadsticos, el objetivo de generar hipte-
sis potenciales de inters que son posteriormente verificadas (Vea la figura 1.2.).
Encontrar patrones significativos en todos los datos puede proporcionar una ventaja competitiva a
cualquier organizacin.
Otra definicin que se puede dar de Minera de datos y que es muy comn encontrar dice: Una
actividad de extraccin cuyo objetivo es el de descubrir hechos contenidos en las bases de datos.
En la mayora de los casos se refiere a un trabajo automatizado. Si hay alguna intervencin humana
a lo largo del proceso, este no es considerado como minera de datos por parte de algunas perso-
nas. La palabra descubrimiento est relacionada con el hecho de que mucha de la informacin
valiosa es desconocida con anterioridad. En todo caso, estas tcnicas pueden ayudar a confirmar
cualquier sospecha sobre el comportamiento del sistema en un particular contexto. En cuanto a los
hechos escondidos, estos estarn principalmente bajo la forma de reglas, las cuales nos ayudarn
a entender el modelo del sistema relacionado con los datos observados. Por otra parte, las reglas
tambin pueden ser usadas en la prediccin de ciertos estados, del sistema (lo que se busca). Desde
un punto de vista acadmico, el trmino Minera de datos es una etapa dentro de un proceso mayor
llamado KDD (vea la figura 1.5). Lo que en verdad hace el Minera de datos es reunir las ventajas
de varias reas como la Estadstica, la Inteligencia Artificial, la Computacin Grfica, las Bases de
Datos y el Procesamiento Masivo (vea la figura 1.6), principalmente usando como materia prima
las bases de datos.
| Innov.Ing.Desarro. | Vol. 1 No. 1| Pgs. 25-34 | Coruniamericana Barranquilla-Medelln, Colombia | Enero-Dic. 2012 | ISSN: 2344-7559 |
http://coruniamericana.edu.co/publicaciones/ojs/index.php/IID
Minera de datos como soporte a la toma de decisiones empresariales en una arquitectura Soa 31
La Minera de datos es una tecnologa compuesta por etapas que integra varias reas y que no se
debe confundir con un gran software. Durante el desarrollo de un proyecto de este tipo se usan
diferentes aplicaciones software en cada etapa, que pueden ser estadsticas, de visualizacin de
datos o de inteligencia artificial, principalmente. Actualmente existen aplicaciones o herramientas
comerciales de Minera de datos muy poderosas que contienen un sinfn de utileras que facilitan
el desarrollo de un proyecto. Sin embargo, casi siempre acaban complementndose con otra he-
rramienta. [6]
de asociacin entre dichas variables. Tambin pueden usarse varias tcnicas a la vez para generar
distintos modelos, aunque generalmente cada tcnica obliga a un pre-procesado diferente de los
datos. Las tcnicas ms representativas son:
- El Perceptrn
- El Perceptrn multicapa.
- Los Mapas Autoorganizados, tambin conocidos como redes de Kohonen.
-Algoritmo ID3
-Algoritmo C4.5.
Modelos estadsticos: Es una expresin simblica en forma de igualdad o ecuacin que se em-
plea en todos los diseos experimentales y en la regresin para indicar los diferentes factores que
modifican la variable de respuesta.
-Algoritmo K-means.
-Algoritmo K-medoids.
Una vez obtenido el modelo, se debe proceder a su validacin, comprobando que las conclusio-
nes que arroja son vlidas y suficientemente satisfactorias. En el caso de haber obtenido varios
modelos mediante el uso de distintas tcnicas, se deben comparar los modelos en busca de aquel
que se ajuste mejor al problema. Si ninguno de los modelos alcanza los resultados esperados, debe
alterarse alguno de los pasos anteriores para generar nuevos modelos.
Cada ao, en los diferentes congresos, simposios y talleres que se realizan en el mundo, se renen
investigadores con aplicaciones muy diversas. En los Estados Unidos (sobre todo), la minera de
datos se ha ido incorporando a la vida de empresas, gobiernos, universidades, hospitales y diversas
organizaciones que estn interesadas en explorar sus bases de datos.
| Innov.Ing.Desarro. | Vol. 1 No. 1| Pgs. 25-34 | Coruniamericana Barranquilla-Medelln, Colombia | Enero-Dic. 2012 | ISSN: 2344-7559 |
http://coruniamericana.edu.co/publicaciones/ojs/index.php/IID
Minera de datos como soporte a la toma de decisiones empresariales en una arquitectura Soa 33
Segmentacin de Clientes: Segmentacin de clientes utilizando tcnicas de agrupamiento difu-
so.
4. CONCLUSIN
La capacidad de las empresas para almacenar datos ha crecido considerablemente en los ltimos
aos. Sin embargo, la capacidad para procesar y utilizar dichos datos no ha tenido el mismo creci-
miento, por tal motivo la minera de datos ha pasado a tener un rol significativo y se presenta hoy
en da como una tecnologa de apoyo para explorar, analizar, comprender y aplicar el conocimiento
obtenido usando grandes volmenes de datos en el mundo de los negocios.
Sin lugar a dudas, como herramienta estratgica permite transformar los datos recogidos durante
el funcionamiento normal de un negocio en informacin muy valiosa, lo que nos puede permitir
ser proactivos en nuestras operaciones diarias como empresa, lo que puede generar ventajas sobre
la competencia.
Mediante la aplicacin de esta tecnologa (minera de datos) se puede abordar la solucin a proble-
mas de prediccin, con lo cual podremos saber informacin de un escenario futuro ms adecuado a
la realidad, como lo es el comportamiento de los clientes; tambin podremos solucionar problemas
de clasificacin y segmentacin.
| Innov.Ing.Desarro. | Vol. 1 No. 1| Pgs. 25-34 | Coruniamericana Barranquilla-Medelln, Colombia | Enero-Dic. 2012 | ISSN: 2344-7559 |
http://coruniamericana.edu.co/publicaciones/ojs/index.php/IID
34 Jonathan Ruiz Rangel
No es una tecnologa que suplante a otras, sino que es complementaria y, en muchos casos, se apro-
vecha de lo que otros mecanismos, como la estadstica, tcnicas de agrupamiento y la clasificacin
automtica de clientes facilitan para el diseo y puesta en marcha de planes de accin mucho ms
eficaces.
En el mundo de los negocios, la minera de datos puede aportar informacin valiosa, permitiendo
tomar una posicin en nuestro mercado que nos diferencie de nuestros competidores.
En el mbito comercial, resulta interesante encontrar patrones ocultos de consumo de los clientes
para poder explorar nuevos horizontes. Asimismo, predecir el comportamiento de un futuro clien-
te, basndose en los datos histricos de clientes que presentaron el mismo perfil, ayuda a poder
retenerlo durante el mayor tiempo posible.
Las herramientas comerciales de la minera de datos que existen actualmente en el mercado son
muy variadas y de gran calidad, orientadas a estudios de Internet, anlisis de documentos, anlisis
de clientes de supermercado, mientras que otras son de uso ms general. Su correcta eleccin de-
pende de la necesidad de la empresa y de los objetivos a corto y largo plazo que pretenda alcanzar.
La decisin de seleccionar una solucin de minera de datos no es una tarea simple, se debe con-
sultar a expertos en el rea con vista a seleccionar la ms adecuada para el problema que quiera ser
abordado por la empresa.
5. REFERENCIAS
[1] Miko Matsumura, Bjoern Brauel y Jignesh Shah: Adopcin de SOA para Dummies, Software
AG y Wiley Publishing, Inc 1a Edicin Especial, 2009
[2] Wikipedia, la enciclopedia libre. Data Warehouse. (2005) http://es.wikipedia.org/wiki/Data_
warehouse.
[3] Spoke: Data Mining de tu correo electrnico, 2004 http://www.merodeando.com/blog/archi-
vos/2004/01/31-spoke-data-mining-de-tu-correo-electronico.php
[4] Josep Llus Cano: Business intelligence: competir con informacin, ESADE - 1a edicin. 2007.
[5] Molina Flix, Luis Carlos. Data Mining: torturando a los datos hasta que confiesen. (2002)
http://www.lsi.upc.es/~lcmolina/
[6] Wikipedia, la enciclopedia libre. Data Mining, 2005. http://es.wikipedia.org/wiki/Data_mining
[7], [8] Hernndez Orallo, Jos, Ramrez Quintana, Jos y Ferri Ramrez, Cesar. Introduccin a la
minera de datos. Madrid: Pearson, 2004.
[9] Woods, Dan y Mattern, Thomas. Enterprise SOA Designing IT for Business Innovation. USA:
Orelly, 2006.
[10] Artculo Paola Britos: Objetivos de Negocio y Procesos de Minera de Datos Basados en Siste-
mas Inteligentes, 2006. Recuperado en http://laboratorios.fi.uba.ar/lsi/R-rtis-7-1-2005-26-29.
pdf
| Innov.Ing.Desarro. | Vol. 1 No. 1| Pgs. 25-34 | Coruniamericana Barranquilla-Medelln, Colombia | Enero-Dic. 2012 | ISSN: 2344-7559 |
http://coruniamericana.edu.co/publicaciones/ojs/index.php/IID