Vous êtes sur la page 1sur 2

Datamining o minera de datos:

El objetivo general del proceso de minera de datos consiste en extraer informacin de un


conjunto de datos y transformarla en una estructura comprensible para su uso posterior. Utiliza
el anlisis matemtico para deducir los patrones y tendencias que existen en los datos.
Normalmente, estos patrones no se pueden detectar mediante la exploracin tradicional de los
datos porque las relaciones son demasiado complejas o porque hay demasiado datos.
Estos patrones y tendencias se pueden recopilar y definir como un modelo de minera de datos.
Los modelos de minera de datos se pueden aplicar en escenarios como los siguientes:

Previsin: calcular las ventas y predecir las cargas de servidor o el tiempo de


inactividad del servidor.
Riesgo y probabilidad: elegir los mejores clientes para la distribucin de correo
directo, determinar el punto de equilibrio probable para los escenarios de riesgo, y
asignar probabilidades a diagnsticos u otros resultados.

Recomendaciones: determinar los productos que se pueden vender juntos y generar


recomendaciones.

Buscar secuencias: analizar los artculos que los clientes han introducido en el carrito
de compra y predecir los posibles eventos.

Agrupacin: separar los clientes o los eventos en clsteres de elementos relacionados,


y analizar y predecir afinidades.

Los datos son la materia prima bruta. En el momento que el usuario les atribuye algn
significado especial pasan a convertirse en informacin. Cuando los especialistas elaboran o
encuentran un modelo, haciendo que la interpretacin que surge entre la informacin y ese
modelo represente un valor agregado, entonces nos referimos al conocimiento.
La generacin de un modelo de minera de datos forma parte de un proceso mayor que incluye
desde la formulacin de preguntas acerca de los datos y la creacin de un modelo para
responderlas, hasta la implementacin del modelo en un entorno de trabajo.
Aunque en datamining cada caso concreto puede ser radicalmente distinto al anterior, el proceso
comn a todos ellos se suele componer de cuatro etapas principales:

Determinacin de los objetivos. Trata de la delimitacin de los objetivos que el


cliente desea bajo la orientacin del especialista en data mining.
Preprocesamiento de los datos. Se refiere a la seleccin, la limpieza, el
enriquecimiento, la reduccin y la transformacin de las bases de datos. Esta etapa
consume generalmente alrededor del setenta por ciento del tiempo total de un
proyecto de data mining.
Determinacin del modelo. Se comienza realizando unos anlisis estadsticos de
los datos, y despus se lleva a cabo una visualizacin grfica de los mismos para
tener una primera aproximacin. Segn los objetivos planteados y la tarea que
debe llevarse a cabo, pueden utilizarse algoritmos desarrollados en diferentes reas
de la Inteligencia Artificial.

Anlisis de los resultados. Verifica si los resultados obtenidos son coherentes y


los coteja con los obtenidos por los anlisis estadsticos y de visualizacin grfica.
El cliente determina si son novedosos y si le aportan un nuevo conocimiento que
le permita considerar sus decisiones

En resumen, el datamining se presenta como una tecnologa emergente, con varias ventajas: por
un lado, resulta un buen punto de encuentro entre los investigadores y las personas de negocios;
por otro, ahorra grandes cantidades de dinero a una empresa y abre nuevas oportunidades de
negocios. Adems, no hay duda de que trabajar con esta tecnologa implica cuidar un sinnmero
de detalles debido a que el producto final involucra "toma de decisiones".

Vous aimerez peut-être aussi