Vous êtes sur la page 1sur 6

LUIS WILLIAM OÑA ALVARADO 19 FEBRERO 2011

MINERIA DE DATOS

DIRIGIDO: AL ING. RICHARD RAMIREZ

POR: TGLO. WILLIAM OÑA

IDEAS

El siguiente artículo va dirigido para aquellas que personas que le interesan el tema de minería de datos ya que
con este paso se da lugar a que las personas de una empresa puedan tomar sus propias decisiones al
momento de descubrir que su información es necesaria para ayudar a la información de la empresa.

Una empresa está ligada a llevar mucha información durante muchos años y gracias a los sistemas o
programas las empresas han sabido dar uso de esa la misma, alguna de estas llegaran a hacer útil para dar
mejoras a la empresa.

Normalmente las organizaciones han sufrido por exceso de datos y no por falta del mismo y lo que deseamos
es buscar datos específicos que nos ayuden a mejorar la empresa.

CONCEPTO

Tiene como propósito a través de programas para buscar, encontrar, extraer, respaldar información que sea
relevante con el objetivo de aprovechar al máximo su información oculta y así poder clasificar y segmentar al
tomar decisiones confiables.

Es una etapa dentro de un proceso de extracción de conocimientos en bases de datos, la minería de datos es
una tecnología que está compuesta por etapas que integran muchas áreas y no debe confundirse con un gran
software.

La minería de datos su proceso es descubrir y uso es de algoritmo concretos que generan patrones a partir de
datos procesados.

PROCESOS

1. Selección del conjunto de datos


La minería de datos ayuda a las empresas a procesar datos y ver las relaciones que existen en muchos
casos que uno ni si quiera sospechaba.

2. Análisis de las propiedades de datos


La información obtenida según la minería de datos nos ayuda a elegir que acción y que estrategias
emplear.

3. Transformación del conjunto de datos de entada


La minería de datos mediante modelos avanzados y regla puede examinar gran cantidad de volúmenes
de datos y encontrar patrones que a simple vista no se pueden ver.

4. Seleccionar y aplicar técnicas de minería de datos.


Es donde se puede clasificar o segmentar la información, siguiendo los pasos anteriores donde se
busca en las grandes cantidades de información histórica.
LUIS WILLIAM OÑA ALVARADO 19 FEBRERO 2011

5. Extracción del conocimiento


Puede usarse varias técnicas de minerías de datos cada una terminara un con proceso diferente de
datos, como también este proceso puede ser realizado por herramientas automáticamente
programadas que muestran los patrones más importantes.

6. Interpretación y evaluación de datos.


Una vez obtenido el modelo o los modelos usados, se procederá a revisar las validaciones y
conclusiones si son validas y si los resultados no son los esperados debe modificarse un nuevo modelo.

CARACTERISTICA Y OBJETOS DE LA MINERIA DE DATOS

Explorar datos que se encuentran oculto en las bases de datos.

Consolidar datos.

Entorno de la minería de datos puede llegar a tener una arquitectura cliente servidor.

A través de las herramientas de minerías de datos se pueden desenterrar archivos o registros


archivados.

Un minero de dato puede ser un usuario final que con ayudas de herramientas indagatorias puede
valerse a hacer preguntas y obteniendo rápidas respuesta.

Al momento de escarbar información siempre corres el riesgo de que algún archivo infectado este al
asecho, ese es el riesgo que se corre al hurgar y sacudir información.

La minería de datos puede ser procesada más rápidamente si su procesamiento se la haría en paralelo.

La minería de datos tiene cinco etapas de información:


Los programas de minerías de datos son creados por el usuario para la explotación datos tales como
los cluster, redes neuronales y algoritmo genéticos.

o Asociaciones
o Secuenciales
o Clasificaciones
o Agrupamientos
o Pronósticos

PROTOCOLO DE MINERIA DE DATOS

Comprensión del negocio y solución al problema que se desea resolver.


Obtención y limpieza de los datos.
Creación de modelos matemáticos.
Resultado de validación y comunicación obtenidos.
Integración de los resultados en un sistema.
LUIS WILLIAM OÑA ALVARADO 19 FEBRERO 2011

ESTRUCTURA

La estructura de la minería de datos es más bien un conjunto de algoritmo que sirve para detectar desviaciones
y patrones ocultos en datos históricos.

El funcionamiento de un sistema de minería de datos se basa en relacionar las búsquedas con los datos
históricos y si encuentra algún patrón extraño lo presenta como un hallazgo.

Los programas de minería de datos trabajan con procesos automáticos los cuales buscan patrones extraños y
normalmente se debería hacer en las noches para evitar las horas pico y tener más rapidez en la búsqueda.

La capacidad de medir información tiene otras ventajas importantes al analizar los datos se genera un mapa de
información que hace innecesario la preparación previa de los datos, una tarea absolutamente necesaria si se
desea buenos resultados, pero que lleva enorme cantidad de tiempo y es posible seleccionar variables que
contenga la información necesaria para realizar un modelo sofisticado a futuro y una vez que las variables son
procesadas con el fin de crear el mapa de información para luego seleccionarlas a aquellas que aportan la
mayor información, la selección de la herramienta que se usará para crear el modelo deja de tener importancia,
ya que el mayor trabajo fue realizado en los pasos previos.

TENDENCIAS

La minería de datos a sufrido grandes cambios en la actualidad con el avance de los cambios tecnológicos, la
importancia que han cobrado los datos no estructurados y la necesidad de integrar algoritmo para hacer
procesos que funcionen prácticamente en línea, pero eso no se da en la práctica ya que se maneja un gran
volumen de datos que hace que su proceso se demore y hay problemas que requieren atención de tiempo real,
todas las herramientas tradicionales de minería de datos asumen que los datos que usarán para construir los
modelos que contienen la información necesaria para lograr el propósito buscado, su objetivo es obtener
suficiente conocimiento que pueda ser aplicado al negocio para obtener un beneficio.

Algoritmos genéticos:

Son métodos numéricos de optimización, en los que aquella variable o variables que se pretenden optimizar
junto con las variables de estudio constituyen un segmento de información. Aquellas configuraciones de las
variables de análisis que obtengan mejores valores para la variable de respuesta. Se puede además introducir
elementos aleatorios para la modificación de las variables, al cabo de cierto número de iteraciones la población
estará constituida por buenas soluciones al problema de optimización, pues las malas soluciones han ido
descartando.

Inteligencia Artificial:

Mediante un sistema informático que simula un sistema inteligente, se procede al análisis de los datos
disponibles. Entre los sistemas de Inteligencia Artificial se encuentran los Sistemas Expertos y las Redes
Neuronales.

Sistemas Expertos:

Son sistemas que han sido creados a partir de reglas prácticas extraídas del conocimiento de expertos.
Principalmente a base de inferencias o de causa-efecto.
LUIS WILLIAM OÑA ALVARADO 19 FEBRERO 2011

Sistemas Inteligentes:

Son similares a los sistemas expertos, pero con mayor ventaja ante nuevas situaciones desconocidas para el
experto.

Redes neuronales:

Son métodos de proceso numérico en paralelo, en el que las variables interactúan mediante transformaciones
lineales o no lineales, hasta obtener unas salidas. Estas salidas se revisan con los que tenían que haber salido,
dando lugar a un proceso de retroalimentación mediante el cual la red se reconfigura, hasta obtener un modelo
adecuado.

FASES DE MINERIA DE DATOS

Filtrado de datos.
Selección de Variables.
Extracción de Conocimiento.
Interpretación y Evaluación.

EJEMPLOS

Fraudes

Un caso es el de la detección de transacciones de blanqueo de dinero o de fraude en el uso de tarjetas de


crédito o de servicios de telefonía móvil e, incluso, en la relación de los contribuyentes con el fisco.
Generalmente, estas operaciones fraudulentas o ilegales suelen seguir patrones característicos que permiten,
con cierto grado de probabilidad, distinguirlas de las legítimas y desarrollar así mecanismos para tomar medidas
rápidas frente a ellas.

Negocios

La minería de datos puede contribuir significativamente en las aplicaciones basada en la relación con el cliente.
En lugar de contactar con el cliente de forma indiscriminada a través de un centro de llamadas, sólo se
contactará con aquellos que se perciba que tienen una mayor probabilidad de responder positivamente a una
determinada oferta o promoción.

Por lo general, las empresas que emplean minería de datos ven rápidamente el retorno de la inversión, pero
también reconocen que el número de modelos predictivos desarrollados puede crecer muy rápidamente.

En lugar de crear modelos para predecir qué clientes pueden construir modelos separados para cada tipo de
cliente. También puede querer determinar qué clientes van a ser rentables y sólo enviar las ofertas a las
personas que es probable que sean rentables. Para mantener esta cantidad de modelos, es necesario gestionar
las versiones de cada modelo y pasar a una minería de datos lo más automatizada posible.
LUIS WILLIAM OÑA ALVARADO 19 FEBRERO 2011

CONCLUSION

La minería de datos es de obtener una visión más completa y detallada ya que le permite buscar datos más
cotidianos que salen de los rangos normales y que servirá para la toma de decisiones de la información
confiable. La minería tiene un futuro en las empresas, ya que existen grandes base datos con archivos
desaprovechados y que necesitan una atención minuciosa.

Con esta perspectiva y usando la Teoría de la información, es posible medir la cantidad de información
disponible en los datos y qué porción de la misma podrá utilizarse para resolver la problemática del negocio. Un
enfoque relativamente nuevo al análisis de datos soluciona estos problemas haciendo que la práctica de la
minería de datos se parezca más a una ciencia que a un arte.

Según estudios la capacidad para almacenar datos ha crecido en los últimos años a velocidades exponenciales,
nuestra capacidad para procesarlos y utilizarlos no ha ido a la par. Por este motivo, la minería de dato se
presenta como una tecnología de apoyo para explorar, analizar, comprender y aplicar el conocimiento obtenido
usando grandes volúmenes de datos. Y nos permite descubrir nuevos caminos que nos ayuden en la
identificación de interesantes estructuras en los datos, es una de las tareas fundamentales en la minería de
datos.

En el ámbito comercial, resulta interesante encontrar patrones ocultos de consumo de los clientes para poder
explorar nuevos horizontes. Saber que un vehículo deportivo corre un riesgo de accidente casi igual al de un
vehículo normal cuando su dueño tiene un segundo vehículo en casa ayuda a crear nuevas estrategias
comerciales para ese grupo de clientes. Asimismo, predecir el comportamiento de un futuro cliente, basándose
en los datos históricos de clientes que presentaron el mismo perfil, ayuda a poder retenerlo durante el mayor
tiempo posible. Las herramientas comerciales de la minería de datos que existen actualmente en el mercado
son variadas y excelentes. Las hay orientadas al estudio del web o al análisis de documentos o de clientes de
supermercado, mientras que otras son de uso más general. Su correcta elección depende de la necesidad de la
empresa y de los objetivos a corto y largo plazo que pretenda alcanzar. La decisión de seleccionar una solución
de la minería de datos no es una tarea simple. Es necesario consultar a expertos en el área con vista a
seleccionar la más adecuada para el problema de la empresa.

ANEXOS
LUIS WILLIAM OÑA ALVARADO 19 FEBRERO 2011

Vous aimerez peut-être aussi