Vous êtes sur la page 1sur 4

CONCEPTOS

DATA MINING

Data
Mining

De acuerdo a la estadstica de anlisis multivalente de Cesar Prez la Minera de


Datos es un proceso en el cual se busca la obtencin de nuevos datos
relacionados entre s, esos datos tienen en comn informacin ya que se crean
patrones o tienen tendencias en comn, en la ciencia de la computacin existen
diversas herramientas que nos permiten aplicar las numerosas tcnicas que
permiten lograr la aplicacin de la minera de datos.
Adems Cesar Perez tambin menciona las principales tcnicas las cuales tienen
por objetivo descubrir tendencias o patrones en grandes cantidades de
informacin, lo que en Tecnologas de la Informacin conocemos como Big Data,
dichas tcnicas son utilizadas para la aplicacin de la minera de datos como son,
las tcnicas de modelado originado por la teora, en la cual se utilizan mtodos
probabilsticos o estadsticos, como la varianza o la regresin lineal, a travs de
los cuales se podr encontrar o predecir datos futuros.
Otra de las tcnicas es la tcnica de modelado originado por los datos en la cual
se utilizan ciertos algoritmos de agrupamiento como el Clustering, modelos de
prediccin utilizados en Inteligencia Artificial como los arboles de decisin o las
redes neuronales por mencionar algunas tcnicas; Y por ltimo las Tcnicas
Auxiliares en las cuales se utiliza el Procesamiento Analtico en Lnea (OLAP),
este proceso utilizado para agilizar la consulta en grandes cantidades de datos, en
este proceso son utilizadas consultas SQL (SELECT).
De acuerdo a Cesar Prez la clasificacin de las tcnicas del Data Mining se
muestra en el siguiente cuadro conceptual:

Tecnicas

Modelado Dirigido
por la Teoria

Analisis de la
Varianza, Regresion,
Series Temporales,
Discriminante

Modelado Dirigido
por los Datos

Analisis Cluster,
Analisis Factorial,
Esccalamiento
Multidimensional,
Escalamiento
Optimo, Arboles de
Decision, Redes
Neuronales, Analisis
Conjunto

Tecnicas Auxiliares

Proceso Analitico de
Transiciones (OLAP),
Reporting

Por ultimo en esta breve sntesis sobre el concepto de la minera de datos


mencionamos las fases de la aplicacin del modelo mencionados en
https://msdn.microsoft.com/es-es/library/ms174949.aspx, no sin antes indicar los
escenarios en donde puede ser aplicada la minera de datos los cuales son los
siguientes:

Pronostico.
Riesgo y probabilidad.
Recomendaciones.
Bsqueda de secuencias.
Agrupacin.
(Microsoft, 2016)

La primera fase es la Definicin del Problema en el cual se define la manera en


que se utilizaran los datos y cul ser su posible respuesta. La segunda fase es la
preparacin de los datos la cual consiste en consolidar los datos, es decir, los
datos no deben contener incoherencias por ejemplo, y podrn ser utilizadas
herramientas como Data Quality Services para la limpieza y consolidacin de los
datos; La tercera fase es la Exploracin de los Datos en la cual se debe tener
conocimiento de la informacin que se tiene para elegir el modelo o tcnica de la
minera de datos que se va a implementar; La cuarta fase es la de Generar los
modelos de la minera de datos y aplicar el modelo elegido; La quinta fase
consiste en explorar los resultados que arroj el modelo aplicado de la minera de
datos para saber si el modelo utilizado es el conveniente y la ltima fase consiste
en la implementacin del modelo de minera de datos que mejor se adapte o
mejores resultados dio en todo el proceso, en la ilustracin 1 podemos ver de
manera grfica las fases de la minera de datos.

Ilustracin 1, (Microsoft, 2016)

Bibliografa
Microsoft. (29 de 08 de 2016). Microsoft Library. Obtenido de
https://msdn.microsoft.com/es-es/library/ms174949.aspx
Perez, C. (2004). Tecnicas de Analisis Multivalente de Datos. Madrid: PEARSON
EDUCACIN.

Vous aimerez peut-être aussi