Vous êtes sur la page 1sur 5

Relacin entre Data Mining y los sistemas de bases de datos

Actualmente, dentro de una organizacin, el apoyo a la decisin se enfrenta a grandes problemas: - Hay almacenadas grandes cantidades de datos. - Los datos pueden provenir de fuentes muy distintas. - Los dominios de los datos pueden ser muy diversos. Adems se da la paradoja de que cuanta ms informacin se posee (y ms variada sea sta) ms difcil es extraer informacin til. Para resolver estas situaciones surge el Data Mining (minera de datos). Para llevar a cabo el minado de datos se necesitan siste mas de bases de datos. Estos sistemas pueden ser de dos tipos: - Sistemas de bases de datos tradicionales. - Sistemas de Data Warehousing. El Data Mining se basa en tcnicas que han existido desde hace bastante tiempo. La razn de que ahora se haga us o de ellas para el minado de datos es que ahora existe una gran cantidad de datos recopilados, estructurados y organizados. En gran parte esto es debido a los sistemas de bases de datos, que permiten asegurar caractersticas tales como la integridad y la s eguridad. Las aplicaciones de minera de datos deberan tenerse muy en cuenta desde un principio, durante el diseo de un almacn de datos. Asimismo, las herramientas de minera de datos deberan ser diseadas para facilitar su uso en conjuncin con los almacenes de datos. De hecho, para muchas bases de datos de gran tamao que se convierten en terabytes de datos, el xito de la utilizacin de aplicaciones de minera de bases de datos depender en primer lugar de la construccin de un almacn de datos. Data Mining es un proceso para extraer informacin til a partir de grandes cantidades de datos. El Data Mining a travs del descubrimiento y cuantificacin de relaciones predictivas en los datos, permite transformar la informacin disponible en conoci miento til de negocio. Es una tecnologa que ayuda a las empresas a concentrarse en la informacin ms importante de sus bases de informacin. Las herramientas de Data Mining predicen futuras tendencias y comportamientos y pueden responder, de forma r pida, a preguntas de negocios que tradicionalmente

consumen demasiado tiempo para poder ser resueltas; esta herramientas exploran la base de datos en busca de patrones ocultos encontrando informacin predecible. Esencialmente el Data Mining consiste e n hacer una serie de consultas, cuyo resultado puede depender, a su vez, de de la respuesta de anteriores consultas. La Minera de datos, con una fuerte base matemtica (sobre todo en modelizacin) e informtica, involucra a muchas otras disciplinas tales como: Bases de Datos ( Contribuye con las tcnicas deductivas de procesamiento de consultas) Inteligencia Artificial ( Aprendizaje computerizado, lgica difusa, programacin lgica, redes neuronales, etc.) Estadstica ( Por medio de tcnicas es tadsticas como: Anova, regresiones, ji cuadrado, componentes principales, anlisis cluster, etc.) Investigacin Operativa ( modelado, algoritmos y toma de decisiones) Anlisis matemtico ( Por medio de tcnicas matemticas tales como las Series Temporales) Visualizacin ( Para lograr una minera de datos interactiva). Apoyo a la decisin ( Herramientas de evaluacin del rendimiento, planificacin, organizacin, rboles de decisin, etc.) Heurstica (Algoritmos genticos, mtodos del vecino m s cercano, etc.) Paralelismo( Para mejorar el rendimiento de los algoritmos de Data Mining9. Arquitectura de ordenadores ( Ofreciendo un entorno adecuado para la aplicacin de las tcnicas de Data Mining). 2. UTILIDAD DEL DATA MINING - Detectar patrones habituales tales como los hbitos de compra por ejemplo. - Detectar patrones anormales como puedan ser posibles fraudes, errores, etc. - Predicciones del futuro basadas en el pasado y en las tendencias actuales como por ejemplo para el pronsti co de posibles problemas financieros. Una razn por la que el Data Mining se ha convertido en una tecnologa demandada por empresas, es porque se han dado cuenta de las oportunidades de negocio que ofrece el conocimiento de sus clientes.

2.1 PROCESO DE DESCUBRIMIENTO DEL CONOCIMIENTO (KDD) El Data Mining no es un proceso sencillo. Existen seis pasos bsicos para realizar un proyecto de Data Minig eficaz.: 1. Comprender el problema que se desea resolver y definirlo. Ya que los proyectos mal definidos tienen pocas probabilidades de dar resultados satisfactorios, adems de tener claros los objetivos que se persiguen debe adaptarse a las caractersticas del entorno donde se desarrolla el problema. 2. Seleccionar los datos. Si queremos que los d atos hablen debemos disponer de una muestra amplia y hacer una seleccin adecuada de los datos y adems de las variables pertinentes. 3. Determinar la forma en que deben representarse los elementos de los datos frente al algoritmo de Data Mining. Se deben determinar de forma adecuada las unidades, categoras o clasificacin de los datos ella que de ello depender, en gran medida, el xito o fracaso del proyecto. 4. Usar el algoritmo, o la serie de algoritmos, de Data Minig adecuados. 5. Analizar el resultado obtenido. Este resultado debe ajustarse al marco del mbito del problema que se est tratando. En este paso la visualizacin reviste de gran importancia. 6. Presentacin de los resultados a los responsables de operaciones deforma que los conocimientos obtenidos puedan integrarse en los procesos de la corporacin. TIPOS DE RESULTADOS Existen dos planteamientos, uno ms interactivo que otro, para extraer informacin til con los algoritmos de Data Minig: El primer planteamiento c onsiste en iniciar un programa, identificar los patrones, normas o funciones y luego hacer que el analista los revise en busca de su valor. El segundo planteamiento, ms interactivo que el anterior, se denomina anlisis exploratorio de datos. En l el an alista pide que los datos le sean presentados de

una forma determinada, los observa, los transforma y los revisa; se mueve hacia delante y hacia detrs, explorando las relaciones que a menudo aparecen, mediante mtodos nicos de visualizacin y por ltimo presenta una respuesta. Los conocimientos as obtenidos pueden utilizarse posteriormente como entrada para otro anlisis y establecer as un ciclo para obtener conclusiones ms complejas. 2.5. ARQUITECTURA DE LOS SISTEMAS Hay dos enfoques en la arquitectura que debe seguir un sistema de bases de datos que permita el minado de datos: 1. Aadir una herramienta de minado a un S.G.B.D. - La herramienta debe tener la interfaz adecuada con el S.G.B.D. para extraer la informacin de la base de datos. La principal ventaja de esta aproximacin es que se tiene una arquitectura abierta: la herramienta no est limitada a un S.G.B.D. concreto. Sin embargo, al usar un S.G.B.D. de propsito general para la minera aparecen problemas de rendimiento. 2. Incluir la herramienta de minado de datos en el S.G.B.D. - Las tcnicas de minado pueden influir en muchas de las funciones de los S.G.B.D.: almacenamiento, ejecucin de consultas, manejo de transacciones, manejo de la metainformacin, integridad, seguridad, algor itmos de optimizacin, etc. Adems en un S.G.B.D. para minera se pueden eliminar funciones de un S.G.B.D. general que no son necesarias para el Data Mining y potenciar as funciones claves como la integridad y la calidad de los datos. Por ejemplo, la mayora de las aplicaciones de minado no necesitan los datos relacionados con transacciones, por lo que se pueden eliminar las funciones que manejan este tipo de informacin. 2.6. FUNCIONES DE LAS BASES DE DATOS Y DEL DATA MINING El minado de datos pued e influir en las funciones de los sistemas de bases de datos, sobre todo en aquellos que siguen el enfoque de una gran integracin con la herramienta de minera. Algunas de las funciones que pueden sufrir cambios considerables son aquellas relacionadas con el procesamiento de consultas o el

almacenamiento. En el caso de tratamiento de transacciones, el minado en general no suele influir mucho ya que ste suele centrarse en los datos de apoyo a la decisin y no en los transaccionales. La seguridad y privacidad pierden verse amenazadas por el tratamiento que hace el Data Mining de los datos. Por otro lado, la propia minera de datos puede usarse para analizar las amenazas a las que se enfrenta la base de datos. En el caso de la calidad e integridad de datos, se puede aplicar la minera de datos para detectar informacin incorrecta y mejorar as la calidad de los datos. OBJETIVOS DE LA MINERA DE DATOS Prediccin: La minera de datos puede mostrar el modo en el que actuarn en el futuro ciertos atributos dentro de los datos. As, unos ejemplos de minera de datos predictiva serian el volumen de ventas que generara un comercio en un periodo dado, el anlisis de transacciones de compra para predecir lo que comprarn los consumidores bajos determinados descuentosEn aplicaciones de este tipo, junto a la minera de datos se usa la lgica de negocio. Identificacin: Los patrones de datos pueden utilizarse para identificar la existencia de un artculo, un evento o una actividad. TIPOS DE CONOCIMIENTO DESCUBIERTO DURANTE LA MINERA DE DATOS La minera de datos trata el conocimiento inductivo. El conocimiento descubierto durante la minera de datos puede describirse de cinco formas: Reglas de asociacin: estas reglas establecen una correlacin en tra la presencia de un conjunto de elementos con otro rango de valores para otro conjunto de variables.

Vous aimerez peut-être aussi