Vous êtes sur la page 1sur 10

Minera de datos como soporte a la

toma de decisiones empresariales


en una arquitectura Soa
Data mining as a support
for business decision-making
in a Soa architecture
Cmo referenciar este artculo?:
Ruiz Rangel, Jonathan. Minera de datos como soporte a la toma de decisiones empresariales en una arquitectura SOA, Barran-
quilla, Ed. Coruniamericana, Vol. I, 2013. 25-34
Jonathan Ruiz Rangel
Jruizrangel316@hotmail.com

Resumen Abstract
La minera de datos es una herramienta es- Data mining is a strategic and technological
tratgica y tecnolgica que desarrolla ventajas tool which gives competitive advantages to
competitivas en el mundo de los negocios per- companies in the business world. Through the
mitiendo, a travs de la extraccin de patrones extrapolation of database information and be-
dentro de las bases de datos de las empresas havioral patterns, companies and private sec-
y organizaciones, extraer conocimiento nuevo tor organizations can acquire new knowledge
y til facilitando la toma de decisin y aplica- which can assist in a decision-making process
cin de nuevas estrategias por parte de la ge- as well as aid in the design and implementa-
rencia, a su vez, permite mostrar informacin tion of more dynamic management strategies
ms exacta, lo que permite disear estrategias allowing for quick response and addictiveness
competitivas ms dinmicas permitiendo una to the changing environment.
mayor capacidad de reaccin y adaptacin a
los constantes cambios del entorno. Key word
SOA, data mining, web services, BPM, Data
Palabras clave Warehouse, Business Intelligence, Warehous-
AOS, minera de datos, servicios web, BPM, ing.
Data Warehouse, Business Intelligence, Wa-
rehousing.

1. INTRODUCCIN

Las empresas necesitan poder interconectar los procesos, personas e informacin, tanto con la
propia organizacin como atravesando sus fronteras con subsidiarias y socios comerciales. La
falta de integracin entre los componentes de IT sistemas, aplicaciones y datos hace difcil obte-
ner una respuesta rpida y efectiva ante los cambios que afectan de forma natural a los negocios.
La inflexibilidad genera costes, reduce la capacidad de respuesta ante los clientes, compromete el
cumplimiento con las normativas legales y afecta negativamente la productividad de los emplea-
dos. En suma, una deficiente integracin es uno de los problemas ms importantes a los que las
organizaciones deben hacer frente para mantener su competitividad y garantizar su crecimiento.
La Arquitectura Orientada a Servicios (SOA, Service Oriented Architecture) supone una estrategia
* Ingeniero de Sistemas. Magister en Ingeniera de Sistemas. Universidad Simon Bolivar - Barranquilla, Colombia.
Artculo recibido: Agosto 15 /2012. Aceptado en Noviembre 1/2012.
| Innov.Ing.Desarro. | Vol. 1 No. 1| Pgs. 25-34 | Coruniamericana Barranquilla-Medelln, Colombia | Enero-Dic. 2012 | ISSN: 2344-7559 |
http://coruniamericana.edu.co/publicaciones/ojs/index.php/IID
26 Jonathan Ruiz Rangel

general de organizacin de los elementos de IT, de forma que una coleccin abigarrada de siste-
mas distribuidos y aplicaciones complejas se pueda transformar en una red de recursos integrados,
simplificada y sumamente flexible.

Un proyecto SOA bien ejecutado permite alinear los recursos de IT de forma ms directa con
los objetivos de negocio, ganando as un mayor grado de integracin con clientes y proveedores,
proporcionando una inteligencia de negocio ms precisa y ms accesible, con la cual se podrn
adoptar mejores decisiones, y ayudar a las empresas a optimizar sus procesos internos y sus flujos
de informacin para mejorar la productividad individual. Ver Fig 1.

El resultado neto es un aumento muy notable de la agilidad de la organizacin. En este contexto


se hace necesaria una herramienta que permita responder a preguntas de negocios empresariales a
priori no planteadas o que pueden consumir demasiado tiempo para ser resueltas.

Los programas de gestin del conocimiento se complementan con distintas herramientas adems
de la minera de datos, como puede ser la data warehousing (almacenes de datos) o el groupware
(software colaborativo). La minera de datos, como herramienta de bsqueda de informacin, se
utiliza como sistema de apoyo a la toma de decisiones de las altas direcciones de las empresas.
Las tcnicas de minera de datos se centran en analizar el gran volumen de datos, que en una pri-
mera seleccin pueden ser pertinentes, pero que la aplicacin de tcnicas de seleccin ceida a
unas determinadas demanda, reduce el tamao de los datos eligiendo las variables ms influyentes
en el problema.

En definitiva, la minera de datos es una tecnologa usada para descubrir informacin oculta y
desconocida, pero potencialmente til, a partir de las fuentes de informacin de la propia empresa.
Obtiene un conocimiento de un negocio, utilizando tcnicas de clustering (agrupamiento), redes
neuronales, rboles de decisin y reglas de asociacin etc. [1]

2. Definiciones

2.1. Data Warehouse: Un paso antes de la minera de datos.

Antes de dar a conocer claramente lo que significa Minera de datos, es preciso dejar en claro lo
que es un Data Warehouse, que en principio lo podemos ver como un concepto que est antes de
Minera de datos y es la base de este (aunque no siempre es as); por ello, el objetivo de esta sec-
cin es dar una idea general de este concepto, no entraremos en muchos detalles, pero daremos a
conocer lo ms relevante para que en las secciones siguientes, cuando hablemos de Data Warehou-
se o Data Warehousing, no haya dudas sobre lo que nos estamos refiriendo.

Las Bases de Datos (BD) de una empresa utilizan los ordenadores como medio para organizar sus
datos de forma que sean comprensibles para las personas. Este proceso es conocido como Data
| Innov.Ing.Desarro. | Vol. 1 No. 1| Pgs. 25-34 | Coruniamericana Barranquilla-Medelln, Colombia | Enero-Dic. 2012 | ISSN: 2344-7559 |
http://coruniamericana.edu.co/publicaciones/ojs/index.php/IID
Minera de datos como soporte a la toma de decisiones empresariales en una arquitectura Soa 27
Warehousing. La comprensin de los datos almacenados es esencial para cualquier organizacin,
ya que constituye un elemento bsico en la toma de decisiones.

Un Data Warehouse es un almacn o repositorio de datos categorizados que concentra un gran


volumen de informacin de inters para toda una organizacin, la cual se distribuye por medio de
diversas herramientas de consulta y de creacin de informes orientadas a la toma de decisiones. El
objetivo del Data Warehouse (DW) es agrupar los datos con el propsito de facilitar su posterior
anlisis, de forma que sean fciles de acceder y, posteriormente, analizar informacin sobre la pro-
pia empresa. A este tipo de datos se les conoce como informativos. Los sistemas que manejan estos
datos se denominan OLAP (Online Analytical Processing). Existen muchas definiciones formales
de DW de distintos autores, pero una de las ms famosas puede ser la dada por Inmon en 1992: Un
Data Warehouse es una coleccin de datos orientados a temas, integrados, no-voltiles y variante
en el tiempo, organizados para soportar necesidades empresariales.

Los Data Warehouses a menudo almacenan gran cantidad de informacin, la cual est a veces sub-
dividida en pequeas unidades lgicas. Peridicamente se importan estos datos de otros sistemas
de informacin dentro del Data Warehouse para realizar sobre ellos un procesamiento posterior.
Un Data Warehouse se diferencia de una Base de Datos operacional de una empresa; diremos que
un Data Warehouse puede derivarse de la Base de Datos corporativa mediante la importacin de
informacin, pero el DW no es esa BD operacional.[2]

Muchos de los datos de una empresa se utilizan como soporte a los negocios, por eso a este tipo
de datos se les denomina operacionales. Los sistemas usados con el fin de recogerlos reciben el
nombre de OLTP (Online Transaction Processing).[3]

Las principales caractersticas o propiedades de un DW son las siguientes:


El DW est orientado a la toma de decisiones. Un buen diseo de la base de datos favorece el
anlisis y la recuperacin de datos para obtener una ventaja estratgica y para facilitar las decisio-
nes de marketing.
El DW almacena datos, categorizndolos o estructurndolos de forma que favorezcan el anlisis
de los datos y puedan proporcionar anlisis histricos.
El DW no est orientado a procesos relacionados con la operativa de la empresa, es decir, que
solo est destinado a funcionar como un almacn de datos.
El DW est preparado para ser explotado mediante herramientas especficas que permiten la
extraccin de informacin significativa y patrones de comportamiento que permanecen ocultos en
un enorme repositorio de datos. Esta explotacin de los datos se suele realizar con herramientas
de Minera de datos.

2.2. Ventajas y Desventajas del Data Warehouse

La utilizacin de Data Warehouse proporciona una serie de ventajas:


Proporciona un gran poder de procesamiento de informacin.
Permite una mayor flexibilidad y rapidez en el acceso a la informacin.
Facilita la toma de decisiones en los negocios.
Las empresas obtienen un aumento de la productividad.
Proporciona una comunicacin fiable entre todos los departamentos de la empresa.
| Innov.Ing.Desarro. | Vol. 1 No. 1| Pgs. 25-34 | Coruniamericana Barranquilla-Medelln, Colombia | Enero-Dic. 2012 | ISSN: 2344-7559 |
http://coruniamericana.edu.co/publicaciones/ojs/index.php/IID
28 Jonathan Ruiz Rangel

Mejora las relaciones con los proveedores y los clientes.


Permite conocer qu est pasando en el negocio, es decir, estar siempre enterado de los buenos
y malos resultados.
Transforma los datos en informacin y la informacin en conocimiento.
Permite hacer planes de forma ms efectiva.
Reduce los tiempos de respuesta y los costes de operacin.
Resumiendo, el Data Warehouse proporciona una informacin de gestin accesible, correcta, uni-
forme y actualizada. Proporciona un menor coste en la toma de decisiones, una mayor flexibilidad
ante el entorno, un mejor servicio al cliente y permite el rediseo de los procesos. Pero los Data
Warehouse tambin tienen algunas desventajas:
Requieren una revisin del modelo de datos, objetos, transacciones, adems del almacenamiento.
Tienen un diseo complejo y multidisciplinar.
Requieren una reestructuracin de los sistemas operacionales.
Tienen un alto coste.
Requieren sistemas, aplicaciones y almacenamiento especfico.
Por ltimo, cabe mencionar la existencia del Data Marts (Mercado de Datos) que es una ver-
sin ms reducida de un Data Warehouse, a menudo conteniendo informacin especfica de algn
departamento, como marketing, finanzas o mantenimiento de la red. Idealmente, el Data Marts
debera ser un subconjunto del Data Warehouse, a fin de mantener consistencia en las prcticas
de administracin de datos corporativos y para mantener la seguridad y la integridad de la infor-
macin cruda que se est usando. Para las grandes compaas, el Data Marts usualmente contiene
una docena de gigabytes de datos. Ahora podemos continuar y dar una explicacin de lo que en
realidad es Minera de datos, a pesar de que en este apartado hemos dado una definicin de manera
somera.[4]
2.3. Qu es Data Mining o Minera de Datos? [5]
La Minera de Datos surge como una tecnologa y estrategia de modelado matemtico que intenta
ayudar a comprender el contenido de una base de datos. De forma general, los datos son la materia
prima bruta, en el momento que el usuario les atribuye algn significado especial pasan a conver-
tirse en informacin. Cuando los especialistas elaboran o encuentran un modelo, haciendo que
la interpretacin del confronto entre la informacin y ese modelo represente un valor agregado,
entonces nos referimos al conocimiento. (Vea la Fig 3.)

Fig 2. Jerarqua entre bases de datos,


informacin y conocimiento.
En la figura 2 se ilustra la jerarqua que existe en una base de datos entre dato, informacin y co-

| Innov.Ing.Desarro. | Vol. 1 No. 1| Pgs. 25-34 | Coruniamericana Barranquilla-Medelln, Colombia | Enero-Dic. 2012 | ISSN: 2344-7559 |
http://coruniamericana.edu.co/publicaciones/ojs/index.php/IID
Minera de datos como soporte a la toma de decisiones empresariales en una arquitectura Soa 29
nocimiento. Se observa igualmente el volumen que presenta en cada nivel y el valor que los res-
ponsables de las decisiones le dan en esa jerarqua. El rea interna dentro del tringulo representa
los objetivos que se han propuesto. La separacin del tringulo representa la estrecha unin entre
dato e informacin, no as entre la informacin y el conocimiento. La Minera de datos trabaja
en el nivel superior buscando patrones, comportamientos, agrupaciones, secuencias, tendencias o
asociaciones que puedan generar algn modelo que nos permita comprender mejor el dominio para
ayudar en una posible toma de decisin.

Fig 3. Relacin entre Dato, Informacin y conocimiento.

El descubrimiento de conocimiento en base de datos (KDD, de Knowledge Discovery in Data-


bases) combina las tcnicas tradicionales con numerosos recursos desarrollados en el rea de la
inteligencia artificial. En estas aplicaciones el trmino Minera de Datos (Data Mining) ha tenido
ms aceptacin. En algunos casos las herramientas provenientes de la inteligencia artificial son
nuevas, no del todo comprendidas y carentes de un soporte terico formal. Pero en este caso el
objetivo es tan valioso, que los resultados prcticos han rebasado la elegancia acadmica.
Con todo lo anterior podemos decir que Minera de datos es el proceso de descubrir patrones de
informacin interesantes y potencialmente tiles, inmersos en una gran base de datos en la que se
interacta constantemente. Minera de datos es una combinacin de procesos como:

Extraccin de datos
Limpieza de datos
Seleccin de caractersticas
Algoritmos
Anlisis de resultados

Las herramientas de Minera de datos exploran


gran cantidad de datos dentro de una BD grande, y
mediante su anlisis predicen posibles tendencias
o comportamientos futuros dentro de una empre-
sa, permitiendo al experto tomar decisiones en los
negocios de una forma rpida y utilizando un co-
nocimiento que de otra forma no habra encontra-
do. Mediante la utilizacin de estas herramientas
se pueden generar nuevas oportunidades de nego-
cio. Algunas posibilidades que ofrecen estas herra-
mientas son (ver Fig 4.):
Fig 4. Fases del proceso de des-
cubrimiento de conocimiento
en bases de datos (KDD).
| Innov.Ing.Desarro. | Vol. 1 No. 1| Pgs. 25-34 | Coruniamericana Barranquilla-Medelln, Colombia | Enero-Dic. 2012 | ISSN: 2344-7559 |
http://coruniamericana.edu.co/publicaciones/ojs/index.php/IID
30 Jonathan Ruiz Rangel

Prediccin automatizada de tendencias y comportamientos


Descubrimiento automatizado de modelos desconocidos
Descubrimiento de anomalas y acciones fraudulentas por parte de clientes.

Este producto est fuertemente relacionado con anlisis estadsticos, el objetivo de generar hipte-
sis potenciales de inters que son posteriormente verificadas (Vea la figura 1.2.).

Fig 6. La minera de datos y su relacin con otras


disciplinas.

Encontrar patrones significativos en todos los datos puede proporcionar una ventaja competitiva a
cualquier organizacin.

Otra definicin que se puede dar de Minera de datos y que es muy comn encontrar dice: Una
actividad de extraccin cuyo objetivo es el de descubrir hechos contenidos en las bases de datos.
En la mayora de los casos se refiere a un trabajo automatizado. Si hay alguna intervencin humana
a lo largo del proceso, este no es considerado como minera de datos por parte de algunas perso-
nas. La palabra descubrimiento est relacionada con el hecho de que mucha de la informacin
valiosa es desconocida con anterioridad. En todo caso, estas tcnicas pueden ayudar a confirmar
cualquier sospecha sobre el comportamiento del sistema en un particular contexto. En cuanto a los
hechos escondidos, estos estarn principalmente bajo la forma de reglas, las cuales nos ayudarn
a entender el modelo del sistema relacionado con los datos observados. Por otra parte, las reglas
tambin pueden ser usadas en la prediccin de ciertos estados, del sistema (lo que se busca). Desde
un punto de vista acadmico, el trmino Minera de datos es una etapa dentro de un proceso mayor
llamado KDD (vea la figura 1.5). Lo que en verdad hace el Minera de datos es reunir las ventajas
de varias reas como la Estadstica, la Inteligencia Artificial, la Computacin Grfica, las Bases de
Datos y el Procesamiento Masivo (vea la figura 1.6), principalmente usando como materia prima
las bases de datos.

Fig 5. Proceso de KDD.

| Innov.Ing.Desarro. | Vol. 1 No. 1| Pgs. 25-34 | Coruniamericana Barranquilla-Medelln, Colombia | Enero-Dic. 2012 | ISSN: 2344-7559 |
http://coruniamericana.edu.co/publicaciones/ojs/index.php/IID
Minera de datos como soporte a la toma de decisiones empresariales en una arquitectura Soa 31
La Minera de datos es una tecnologa compuesta por etapas que integra varias reas y que no se
debe confundir con un gran software. Durante el desarrollo de un proyecto de este tipo se usan
diferentes aplicaciones software en cada etapa, que pueden ser estadsticas, de visualizacin de
datos o de inteligencia artificial, principalmente. Actualmente existen aplicaciones o herramientas
comerciales de Minera de datos muy poderosas que contienen un sinfn de utileras que facilitan
el desarrollo de un proyecto. Sin embargo, casi siempre acaban complementndose con otra he-
rramienta. [6]

3. LA MINERIA DE DATOS DENTRO DE UNA ARQUITECTURA DATA WAREHOU-


SING [7]
Las tcnicas de minera de datos son utilizadas habitualmente para el anlisis y explotacin de
datos de un Data Warehouse. El uso del Minera de datos puede ser provechoso, por ejemplo, en
el caso de que una empresa posea un Data Warehouse que contenga datos sobre sus procesos pro-
ductivos, datos de seguimiento de clientes, datos externos de mercado, datos sobre la actividad de
competidores, etc., es una poderosa tecnologa nueva con gran potencial para ayudar a las compa-
as a concentrarse en la informacin ms importante de su base de informacin (Data Warehouse).
Para aplicar de manera adecuada las tcnicas avanzadas de Minera de datos, stas deben estar
totalmente integradas con el Data Warehouse, as como con herramientas flexibles e interactivas
para el anlisis de negocios. Varias herramientas de minera de datos actualmente operan fuera del
Warehouse, requiriendo pasos extra para extraer, importar y analizar los datos. Adems, cuando
nuevos conceptos requieren implementacin operacional, la integracin con el Warehouse simpli-
fica la aplicacin de los resultados desde la minera de datos. El Data Warehouse puede ser apli-
cado para mejorar procesos de negocios en toda la organizacin, en reas tales como manejo de
campaas promocionales, deteccin de fraudes, lanzamiento de nuevos productos, etc.
El punto de inicio ideal es un Data Warehouse que contenga una combinacin de datos de segui-
miento interno de todos los clientes junto con datos externos de mercado acerca de la actividad de
los competidores. Informacin histrica sobre potenciales clientes tambin provee una excelente
base para la prediccin de tendencias. Este Warehouse puede ser implementado en una variedad de
sistemas de bases de datos relacionales y debe ser optimizado para un acceso a los datos flexible
y rpido.
Las soluciones que aporta la minera de datos estn basadas en la implementacin, a travs de
la programacin, de interfaces de uso general y algoritmos propios y disponibles para todos, que
permiten una eficiente exploracin y organizacin de los datos. Estos algoritmos apoyan la identi-
ficacin de patrones, relaciones y anomalas de inters potencial para los que toman las decisiones
en los negocios. Adems de implementar estos algoritmos en un mtodo accesible para el usuario
la tecnologa de la minera de datos, requiere una comprensin de varias bases de datos e imple-
mentacin de soluciones de minera de datos para aprovechar las caractersticas de dichas bases
de datos (si hay alguna), y que hacen que las tareas de la minera de datos sean ms eficientes en
grandes volmenes de datos. Adems de las implementaciones de algoritmos, consideraciones
claves relativas a la minera de datos seran la preparacin de datos y el asegurar la escalabilidad y
rendimiento en grandes volmenes de datos.

3.1. ALGORITMOS DE EXTRACCIN DE CONOCIMIENTO[8]


Mediante una tcnica de minera de datos, se obtiene un modelo de conocimiento que representa
patrones de comportamiento observados en los valores de las variables del problema o relaciones
| Innov.Ing.Desarro. | Vol. 1 No. 1| Pgs. 25-34 | Coruniamericana Barranquilla-Medelln, Colombia | Enero-Dic. 2012 | ISSN: 2344-7559 |
http://coruniamericana.edu.co/publicaciones/ojs/index.php/IID
32 Jonathan Ruiz Rangel

de asociacin entre dichas variables. Tambin pueden usarse varias tcnicas a la vez para generar
distintos modelos, aunque generalmente cada tcnica obliga a un pre-procesado diferente de los
datos. Las tcnicas ms representativas son:

Redes neuronales: Son un paradigma de aprendizaje y procesamiento automtico inspirado en la


forma en que funciona el sistema nervioso de los animales. Se trata de un sistema de interconexin
de neuronas en una red que colabora para producir un estmulo de salida. Algunos ejemplos de red
neuronal son:

- El Perceptrn
- El Perceptrn multicapa.
- Los Mapas Autoorganizados, tambin conocidos como redes de Kohonen.

rboles de decisin: Un rbol de decisin es un modelo de prediccin utilizado en el mbito de


la inteligencia artificial; dada una base de datos se construyen estos diagramas de construcciones
lgicas, muy similares a los sistemas de prediccin basados en reglas, que sirven para representar
y categorizar una serie de condiciones que suceden de forma sucesiva para la resolucin de un
problema. Ejemplos:

-Algoritmo ID3
-Algoritmo C4.5.

Modelos estadsticos: Es una expresin simblica en forma de igualdad o ecuacin que se em-
plea en todos los diseos experimentales y en la regresin para indicar los diferentes factores que
modifican la variable de respuesta.

Agrupamiento o Clustering: Es un procedimiento de agrupacin de una serie de vectores segn


criterios habitualmente de distancia; se tratar de disponer los vectores de entrada de forma que
estn ms cercanos aquellos que tengan caractersticas comunes. Ejemplos:

-Algoritmo K-means.
-Algoritmo K-medoids.

3.2. INTERPRETACIN Y EVALUACIN

Una vez obtenido el modelo, se debe proceder a su validacin, comprobando que las conclusio-
nes que arroja son vlidas y suficientemente satisfactorias. En el caso de haber obtenido varios
modelos mediante el uso de distintas tcnicas, se deben comparar los modelos en busca de aquel
que se ajuste mejor al problema. Si ninguno de los modelos alcanza los resultados esperados, debe
alterarse alguno de los pasos anteriores para generar nuevos modelos.

3.3. APLICACIONES DE USO [9,10]

Cada ao, en los diferentes congresos, simposios y talleres que se realizan en el mundo, se renen
investigadores con aplicaciones muy diversas. En los Estados Unidos (sobre todo), la minera de
datos se ha ido incorporando a la vida de empresas, gobiernos, universidades, hospitales y diversas
organizaciones que estn interesadas en explorar sus bases de datos.
| Innov.Ing.Desarro. | Vol. 1 No. 1| Pgs. 25-34 | Coruniamericana Barranquilla-Medelln, Colombia | Enero-Dic. 2012 | ISSN: 2344-7559 |
http://coruniamericana.edu.co/publicaciones/ojs/index.php/IID
Minera de datos como soporte a la toma de decisiones empresariales en una arquitectura Soa 33
Segmentacin de Clientes: Segmentacin de clientes utilizando tcnicas de agrupamiento difu-
so.

Clasificacin: Clasificacin de clientes utilizando tcnicas de redes neuronales. Por ejemplo,


para aplicaciones de adquisicin de nuevos clientes o deteccin de fuga.

Modelos Predictivos: Desarrollo de modelos predictivos utilizando rboles de decisin o redes


neuronales. Estos modelos permiten realizar una prediccin sobre la base de una serie de decisio-
nes.

Induccin de reglas: Permiten entender el comportamiento de compra de los clientes o realizar


predicciones basadas en un cierto objetivo.

Rediseo de sitios Web: Reorganizacin de la estructura de links o contenido de las pginas.

Soporte a decisiones de Marketing o de Negocios: Determinacin de conductas o rasgos de los


clientes que realizan ciertas acciones, tales como comprar productos.

Personalizacin: Adaptacin de las vistas de pgina de acuerdo a la informacin obtenida de


cada usuario. Esto puede incluir precios dinmicos para cada usuario o promociones que aumenten
las ventas.

Estudios de utilidad: Determinacin de la calidad de la interfaz de usuario.

Seguridad: Deteccin de accesos inusuales a datos privados.

Anlisis de trfico de redes: Determinacin de los requerimientos de equipo y la distribucin de


datos con el fin de manejar eficientemente el trfico de un sitio.

4. CONCLUSIN

La capacidad de las empresas para almacenar datos ha crecido considerablemente en los ltimos
aos. Sin embargo, la capacidad para procesar y utilizar dichos datos no ha tenido el mismo creci-
miento, por tal motivo la minera de datos ha pasado a tener un rol significativo y se presenta hoy
en da como una tecnologa de apoyo para explorar, analizar, comprender y aplicar el conocimiento
obtenido usando grandes volmenes de datos en el mundo de los negocios.

Sin lugar a dudas, como herramienta estratgica permite transformar los datos recogidos durante
el funcionamiento normal de un negocio en informacin muy valiosa, lo que nos puede permitir
ser proactivos en nuestras operaciones diarias como empresa, lo que puede generar ventajas sobre
la competencia.

Mediante la aplicacin de esta tecnologa (minera de datos) se puede abordar la solucin a proble-
mas de prediccin, con lo cual podremos saber informacin de un escenario futuro ms adecuado a
la realidad, como lo es el comportamiento de los clientes; tambin podremos solucionar problemas
de clasificacin y segmentacin.
| Innov.Ing.Desarro. | Vol. 1 No. 1| Pgs. 25-34 | Coruniamericana Barranquilla-Medelln, Colombia | Enero-Dic. 2012 | ISSN: 2344-7559 |
http://coruniamericana.edu.co/publicaciones/ojs/index.php/IID
34 Jonathan Ruiz Rangel

No es una tecnologa que suplante a otras, sino que es complementaria y, en muchos casos, se apro-
vecha de lo que otros mecanismos, como la estadstica, tcnicas de agrupamiento y la clasificacin
automtica de clientes facilitan para el diseo y puesta en marcha de planes de accin mucho ms
eficaces.

En el mundo de los negocios, la minera de datos puede aportar informacin valiosa, permitiendo
tomar una posicin en nuestro mercado que nos diferencie de nuestros competidores.

En el mbito comercial, resulta interesante encontrar patrones ocultos de consumo de los clientes
para poder explorar nuevos horizontes. Asimismo, predecir el comportamiento de un futuro clien-
te, basndose en los datos histricos de clientes que presentaron el mismo perfil, ayuda a poder
retenerlo durante el mayor tiempo posible.

Las herramientas comerciales de la minera de datos que existen actualmente en el mercado son
muy variadas y de gran calidad, orientadas a estudios de Internet, anlisis de documentos, anlisis
de clientes de supermercado, mientras que otras son de uso ms general. Su correcta eleccin de-
pende de la necesidad de la empresa y de los objetivos a corto y largo plazo que pretenda alcanzar.
La decisin de seleccionar una solucin de minera de datos no es una tarea simple, se debe con-
sultar a expertos en el rea con vista a seleccionar la ms adecuada para el problema que quiera ser
abordado por la empresa.

5. REFERENCIAS

[1] Miko Matsumura, Bjoern Brauel y Jignesh Shah: Adopcin de SOA para Dummies, Software
AG y Wiley Publishing, Inc 1a Edicin Especial, 2009
[2] Wikipedia, la enciclopedia libre. Data Warehouse. (2005) http://es.wikipedia.org/wiki/Data_
warehouse.
[3] Spoke: Data Mining de tu correo electrnico, 2004 http://www.merodeando.com/blog/archi-
vos/2004/01/31-spoke-data-mining-de-tu-correo-electronico.php
[4] Josep Llus Cano: Business intelligence: competir con informacin, ESADE - 1a edicin. 2007.
[5] Molina Flix, Luis Carlos. Data Mining: torturando a los datos hasta que confiesen. (2002)
http://www.lsi.upc.es/~lcmolina/
[6] Wikipedia, la enciclopedia libre. Data Mining, 2005. http://es.wikipedia.org/wiki/Data_mining
[7], [8] Hernndez Orallo, Jos, Ramrez Quintana, Jos y Ferri Ramrez, Cesar. Introduccin a la
minera de datos. Madrid: Pearson, 2004.
[9] Woods, Dan y Mattern, Thomas. Enterprise SOA Designing IT for Business Innovation. USA:
Orelly, 2006.
[10] Artculo Paola Britos: Objetivos de Negocio y Procesos de Minera de Datos Basados en Siste-
mas Inteligentes, 2006. Recuperado en http://laboratorios.fi.uba.ar/lsi/R-rtis-7-1-2005-26-29.
pdf

| Innov.Ing.Desarro. | Vol. 1 No. 1| Pgs. 25-34 | Coruniamericana Barranquilla-Medelln, Colombia | Enero-Dic. 2012 | ISSN: 2344-7559 |
http://coruniamericana.edu.co/publicaciones/ojs/index.php/IID

Vous aimerez peut-être aussi