Académique Documents
Professionnel Documents
Culture Documents
MINERIA DE DATOS
IDEAS
El siguiente artículo va dirigido para aquellas que personas que le interesan el tema de minería de datos ya que
con este paso se da lugar a que las personas de una empresa puedan tomar sus propias decisiones al
momento de descubrir que su información es necesaria para ayudar a la información de la empresa.
Una empresa está ligada a llevar mucha información durante muchos años y gracias a los sistemas o
programas las empresas han sabido dar uso de esa la misma, alguna de estas llegaran a hacer útil para dar
mejoras a la empresa.
Normalmente las organizaciones han sufrido por exceso de datos y no por falta del mismo y lo que deseamos
es buscar datos específicos que nos ayuden a mejorar la empresa.
CONCEPTO
Tiene como propósito a través de programas para buscar, encontrar, extraer, respaldar información que sea
relevante con el objetivo de aprovechar al máximo su información oculta y así poder clasificar y segmentar al
tomar decisiones confiables.
Es una etapa dentro de un proceso de extracción de conocimientos en bases de datos, la minería de datos es
una tecnología que está compuesta por etapas que integran muchas áreas y no debe confundirse con un gran
software.
La minería de datos su proceso es descubrir y uso es de algoritmo concretos que generan patrones a partir de
datos procesados.
PROCESOS
Consolidar datos.
Entorno de la minería de datos puede llegar a tener una arquitectura cliente servidor.
Un minero de dato puede ser un usuario final que con ayudas de herramientas indagatorias puede
valerse a hacer preguntas y obteniendo rápidas respuesta.
Al momento de escarbar información siempre corres el riesgo de que algún archivo infectado este al
asecho, ese es el riesgo que se corre al hurgar y sacudir información.
La minería de datos puede ser procesada más rápidamente si su procesamiento se la haría en paralelo.
o Asociaciones
o Secuenciales
o Clasificaciones
o Agrupamientos
o Pronósticos
ESTRUCTURA
La estructura de la minería de datos es más bien un conjunto de algoritmo que sirve para detectar desviaciones
y patrones ocultos en datos históricos.
El funcionamiento de un sistema de minería de datos se basa en relacionar las búsquedas con los datos
históricos y si encuentra algún patrón extraño lo presenta como un hallazgo.
Los programas de minería de datos trabajan con procesos automáticos los cuales buscan patrones extraños y
normalmente se debería hacer en las noches para evitar las horas pico y tener más rapidez en la búsqueda.
La capacidad de medir información tiene otras ventajas importantes al analizar los datos se genera un mapa de
información que hace innecesario la preparación previa de los datos, una tarea absolutamente necesaria si se
desea buenos resultados, pero que lleva enorme cantidad de tiempo y es posible seleccionar variables que
contenga la información necesaria para realizar un modelo sofisticado a futuro y una vez que las variables son
procesadas con el fin de crear el mapa de información para luego seleccionarlas a aquellas que aportan la
mayor información, la selección de la herramienta que se usará para crear el modelo deja de tener importancia,
ya que el mayor trabajo fue realizado en los pasos previos.
TENDENCIAS
La minería de datos a sufrido grandes cambios en la actualidad con el avance de los cambios tecnológicos, la
importancia que han cobrado los datos no estructurados y la necesidad de integrar algoritmo para hacer
procesos que funcionen prácticamente en línea, pero eso no se da en la práctica ya que se maneja un gran
volumen de datos que hace que su proceso se demore y hay problemas que requieren atención de tiempo real,
todas las herramientas tradicionales de minería de datos asumen que los datos que usarán para construir los
modelos que contienen la información necesaria para lograr el propósito buscado, su objetivo es obtener
suficiente conocimiento que pueda ser aplicado al negocio para obtener un beneficio.
Algoritmos genéticos:
Son métodos numéricos de optimización, en los que aquella variable o variables que se pretenden optimizar
junto con las variables de estudio constituyen un segmento de información. Aquellas configuraciones de las
variables de análisis que obtengan mejores valores para la variable de respuesta. Se puede además introducir
elementos aleatorios para la modificación de las variables, al cabo de cierto número de iteraciones la población
estará constituida por buenas soluciones al problema de optimización, pues las malas soluciones han ido
descartando.
Inteligencia Artificial:
Mediante un sistema informático que simula un sistema inteligente, se procede al análisis de los datos
disponibles. Entre los sistemas de Inteligencia Artificial se encuentran los Sistemas Expertos y las Redes
Neuronales.
Sistemas Expertos:
Son sistemas que han sido creados a partir de reglas prácticas extraídas del conocimiento de expertos.
Principalmente a base de inferencias o de causa-efecto.
LUIS WILLIAM OÑA ALVARADO 19 FEBRERO 2011
Sistemas Inteligentes:
Son similares a los sistemas expertos, pero con mayor ventaja ante nuevas situaciones desconocidas para el
experto.
Redes neuronales:
Son métodos de proceso numérico en paralelo, en el que las variables interactúan mediante transformaciones
lineales o no lineales, hasta obtener unas salidas. Estas salidas se revisan con los que tenían que haber salido,
dando lugar a un proceso de retroalimentación mediante el cual la red se reconfigura, hasta obtener un modelo
adecuado.
Filtrado de datos.
Selección de Variables.
Extracción de Conocimiento.
Interpretación y Evaluación.
EJEMPLOS
Fraudes
Negocios
La minería de datos puede contribuir significativamente en las aplicaciones basada en la relación con el cliente.
En lugar de contactar con el cliente de forma indiscriminada a través de un centro de llamadas, sólo se
contactará con aquellos que se perciba que tienen una mayor probabilidad de responder positivamente a una
determinada oferta o promoción.
Por lo general, las empresas que emplean minería de datos ven rápidamente el retorno de la inversión, pero
también reconocen que el número de modelos predictivos desarrollados puede crecer muy rápidamente.
En lugar de crear modelos para predecir qué clientes pueden construir modelos separados para cada tipo de
cliente. También puede querer determinar qué clientes van a ser rentables y sólo enviar las ofertas a las
personas que es probable que sean rentables. Para mantener esta cantidad de modelos, es necesario gestionar
las versiones de cada modelo y pasar a una minería de datos lo más automatizada posible.
LUIS WILLIAM OÑA ALVARADO 19 FEBRERO 2011
CONCLUSION
La minería de datos es de obtener una visión más completa y detallada ya que le permite buscar datos más
cotidianos que salen de los rangos normales y que servirá para la toma de decisiones de la información
confiable. La minería tiene un futuro en las empresas, ya que existen grandes base datos con archivos
desaprovechados y que necesitan una atención minuciosa.
Con esta perspectiva y usando la Teoría de la información, es posible medir la cantidad de información
disponible en los datos y qué porción de la misma podrá utilizarse para resolver la problemática del negocio. Un
enfoque relativamente nuevo al análisis de datos soluciona estos problemas haciendo que la práctica de la
minería de datos se parezca más a una ciencia que a un arte.
Según estudios la capacidad para almacenar datos ha crecido en los últimos años a velocidades exponenciales,
nuestra capacidad para procesarlos y utilizarlos no ha ido a la par. Por este motivo, la minería de dato se
presenta como una tecnología de apoyo para explorar, analizar, comprender y aplicar el conocimiento obtenido
usando grandes volúmenes de datos. Y nos permite descubrir nuevos caminos que nos ayuden en la
identificación de interesantes estructuras en los datos, es una de las tareas fundamentales en la minería de
datos.
En el ámbito comercial, resulta interesante encontrar patrones ocultos de consumo de los clientes para poder
explorar nuevos horizontes. Saber que un vehículo deportivo corre un riesgo de accidente casi igual al de un
vehículo normal cuando su dueño tiene un segundo vehículo en casa ayuda a crear nuevas estrategias
comerciales para ese grupo de clientes. Asimismo, predecir el comportamiento de un futuro cliente, basándose
en los datos históricos de clientes que presentaron el mismo perfil, ayuda a poder retenerlo durante el mayor
tiempo posible. Las herramientas comerciales de la minería de datos que existen actualmente en el mercado
son variadas y excelentes. Las hay orientadas al estudio del web o al análisis de documentos o de clientes de
supermercado, mientras que otras son de uso más general. Su correcta elección depende de la necesidad de la
empresa y de los objetivos a corto y largo plazo que pretenda alcanzar. La decisión de seleccionar una solución
de la minería de datos no es una tarea simple. Es necesario consultar a expertos en el área con vista a
seleccionar la más adecuada para el problema de la empresa.
ANEXOS
LUIS WILLIAM OÑA ALVARADO 19 FEBRERO 2011