Vous êtes sur la page 1sur 2

MINERA DE DATOS O DATA MINING

La revolucin digital que se ha ido dando durante los ltimos aos, ha posibilitado que la captura y el almacenamiento de datos tenga un coste casi nulo. En la actualidad, las organizaciones pueden disponer de una cantidad enorme de datos almacenados y de los cuales sera de gran ayuda poder sacar informacin til. Para poder tratar con estas cantidades de datos, las tcnicas tradicionales de estadstica y las herramientas de gestin clsicas no sirven debido a que no estn preparadas para trabajar con tanta informacin, as que se necesitan nuevas herramientas. De la necesidad de descubrir conocimiento a partir de los datos, sale el proceso de Descubrimiento de Conocimiento en Bases de Datos o KDD (Knowledge Discovery in Databases). Ese proceso puede ser definido como el proceso no trivial de identificar patrones en los datos que sean vlidos, que aporten informacin desconocida hasta el momento, tiles y comprensibles. El KDD consta de tres partes bien diferenciadas: 1. Preprocesamiento de los datos. 2. Minera de Datos. 3. Postprocesamiento de los resultados. En el preprocesamiento de los datos se corrigen datos errneos o incompletos, se elimina el posible ruido que contengan los datos, etc... En el postprocesamiento, a partir de los resultados de la minera de datos, se pueden preparar patrones y sacar conclusiones de los que se pueda extraer conocimiento, que es el objetivo final del proceso de KDD. El proceso ms importante es el de Minera de Datos o DM (Data Mining) . Una definicin formal de la DM sera: La minera de datos es el proceso automtico para el descubrimiento de informacin til en grandes cantidades de datos. Este proceso es un campo multidisciplinario, en el que se pretende predecir resultados y/o descubrir relaciones entre los diferentes datos. Las diferentes tareas que puede realizar la DM son: Clasificacin: Mediante la clasificacin se busca encontrar un modelo que pueda predecir el comportamiento de una variable a partir de sus caractersticas. Anlisis de Asociaciones: Estas tcnicas pretenden sacar patrones de las relaciones que hay entre diferentes rasgos de los datos. Deteccin de Anomalas: El objetivo de la deteccin de anomalas es encontrar aquellos elementos o caractersticas que son significativamente diferentes del resto de los datos. Dentro de la clasificacin, quiz la tarea ms extendida, tenemos varios algoritmos que se pueden utilizar: rboles de decisin Basados en reglas

Redes neuronales Basados en Clusters Redes Bayesianas

Algunas de las reas que mas se pueden beneficiar de la minera de datos son los siguientes: mbitos financieros y de negocios: ndices de produccin y coste, marketing, deteccin de fraudes, descubrir perfiles de clientes. Salud: modelos de diagnstico a partir de informacin almacenada en hospitales, gestin de tratamientos, comprobacin de la adecuacin de tratamientos. Sistemas informticos: control del sistema y deteccin de ataques. Ciencia: observaciones astronmicas, genmica, anlisis de datos biolgicos.

Vous aimerez peut-être aussi