Académique Documents
Professionnel Documents
Culture Documents
Noviembre 2013
Introduccin
Da a da generamos informacin y esto nos lleva a tener una gran cantidad de esta, lo cual implica que el generar informacin, nos puede ayudar a controlar, optimi ar, administrar, e!aminar, investigar, planificar, predecir, someter, negociar o tomar decisiones de cualquier "m#ito seg$n el dominio en que nos desarrollemos%
Qu es Minera de Datos?
& 'a e!traccin no trivial de informacin implcita, previamente desconocida y potencialmente $til, a partir de datos% ()* & 'a integracin de un con+unto de "reas que tienen como propsito la identificacin de un conocimiento o#tenido a partir de las #ases de datos que aporten un sesgo ,acia la toma de decisin(-*
'os pasos a seguir para la reali acin de un proyecto de minera de datos son: )% 'a Determinacin de los /#+etivos% 0rata so#re la delimitacin de los o#+etivos que el cliente desea -% .re procesamiento de los Datos% 1e refiere a la seleccin, la limpie a, el enriquecimiento, la reduccin y transformacin de las #ases de datos%
4%
.rincipales Caractersticas de MD
Explorar los datos que se encuentran en las profundidades de las bases de datos, o almacenes de datos, que algunas veces contienen informacin almacenada durante varios aos. El entorno de la minera de datos suele tener una arquitectura clienteservidor. Las herramientas de la minera de datos a udan a extraer el mineral de la informacin enterrado en archivos corporativos o en registros p!blicos archivados. Las herramientas de la minera de datos se combinan f"cilmente pueden anali#arse procesarse r"pidamente. La minera de datos produce cinco tipos de informacin$ % &sociaciones. % 'ecuencias. % (lasificaciones. % &grupamientos. % )ronsticos.
DATO S PROBLEMAS
& L 7 4 8 / 5 3 4 '
IMPLANTAR
6o est"tico
12
(on el modelado se constru e un modelo en una situacin donde se conoce la respuesta luego se aplica en otra situacin de la cual se desconoce la respuesta.
19
1:
*escripcin
6ormalmente esta t+cnica es usada para an"lisis preliminar de los datos ,resumen, caractersticas de los datos, etc... *escribir un comportamiento en una base de datos comple0a para aumentar el conocimiento entendimiento sobre gente, productos, procesos etc. ,<=isuali#acin < *iferenciacin.
Establecer que las mu0eres presentan menor siniestralidad en seguros de automvil que los hombres /dentificar las caractersticas de personas que apo a uno u otro partido poltico
1;
Ejemplo
Gestin de personal de una empresa: !u" #lases de empleados $a% #ontratados&
Datos:
Modelo 'enerado:
3inera de datos
en una casa alquilada. ?a0o n!mero de uniones. 3uchos das enfermos en una casa alquilada
con coche. <o n!mero de uniones. )ocos das enfermos. 3"s mu0eres con coche. 3"s hombres
1>
1@
rboles de decisi !
'E 'ELE((/46& EL 64*4 8&/A B E'5E 'E */=/*E *E &(CE8*4 & L4' =&L48E' *EL &58/?C54 8&/A
rboles de decisi !
8epresentan reglas donde atributos independientes determinan los valores finales. En estos "rboles cada nodo representa una propiedad que puede tomar diversos valores, cada uno de los cuales genera una rama. Los nodos ho0as representan las clasificaciones finales. 6os pueden servir para tareas como$ (lasificacin en general validaciones Csadas donde se deben tomar decisiones a partir de varias alternativas 'on !tiles en problemas de alta dimensionalidad pequeo numero de valores /ngreso para cada atributo. > $5000 7enero M 0 Casado F /ngreso >35 7enero M >=4 <=$5000 Edad 3odelo predictivo generado <= 35 &ntigEedad >4
Soltera F
rboles de decisi !
rboles de decisi !
A'ente #omer#ial: De(o #on#eder una $ipote#a a un #liente&
Datos:
Modelo 'enerado:
3inera de datos
I" *efaulter-accounts F G #$e! 8eturns-credit H no I" *efaulter-accounts H G %!d I,'alar F 2;GG. or ,(redit-p F 1G.J #$e! 8eturns-credit H es
21
Ejemplo
Tienda de T): *u+ntas tele,isiones planas se ,ender+n el pr-imo mes&
Datos:
Modelo 'enerado:
3inera de datos
22
Exploracin
29
'e usa como alternativa al algoritmo de arboles de decisin 6os pueden servir para tareas como$ Las mismas tareas que los "rboles de decisin. 8egresiones ,similar a la clasificacin, pero predice una magnitud continua.. 'on usadas para reconocimiento de patrones, clasificaciones de vo# e imagen, procesamiento de lengua0e natural, prediccin optimi#acin.
2:
mu0eres 0venes solteros, hombres ma ores solteros, mu0eres ma ores casados... pero no mu0eres ma ores
2>
8eglas de &sociacin
2@
&n"lisis de (anasta
E0emplo Cn e0emplo tradicional de minera de datos es el relacionado con una b!squeda en una bodega de datos, de un negocio de cadena, de hechos comunes relevantes$ Luego del proceso se dio como resultado la siguiente$ 'i edad P 9;Q sexo H masculinoQ dia H 0ueves entonces compras inclu en paalesQ cerve#a Esto sirvi para que empresa tomara medidas relacionada con la ubicacin de ciertos productos en sitios comunes.
2O
9G
91
92
Ejemplo
Supermer#ado: *u+ndo los #lientes #ompran $ue,os. tam(i"n #ompran a#eite&
Datos:
Modelo 'enerado:
3inera de datos
Bene7i#ios para el Supermer#ado: Las rela#iones entre produ#tos permiten apo%ar de#isiones #omo:
Armado de Pa#/0s 1*onsulta de *anasta2
o Entre 3 produ#tos de alta rota#in de distintas #ate'or4as pero del mismo pro,eedor 5 un produ#to de (aja rota#in % alto mar'en6 o Entre 3 produ#tos de alta rota#in de #ate'or4as % pro,eedores distintos 5 un produ#to de (aja rota#in % alto mar'en6
Descuentos: Polticas agresivas para productos que se venden juntos, con alta confiabilidad
Rela#iones entre pro,eedores % sus produ#tos Identi7i#a#in de pre7eren#ias % 'ustos de los #lientes < Re7or8ar esas pre7eren#ias < In#enti,ar a otros #lientes a tomar estas pre7eren#ias < Se en#uentran rela#iones entre produ#tos de distintas #ate'or4as por ejemplo:
Deter'ente #on 9o'urt. Deter'ente #on Le#$e o 9o'urt #on Ma%onesa
Anti#ipar #am(ios en las pre7eren#ias de los #lientes % a#tuar oportunamente 9: Aumento en las ,entas de la #adena
,err%+ie!#%s de so"#&%re
Existen muchas herramientas de softSare para el desarrollo de modelos de minera de datos tanto libres como comerciales como, por e0emplo$
L6/3E ')'' (lementine ,softSare. '&' Enterprise 3iner 8apid3iner -eNa LTE6 4range
9;
:erramienta ;e/a
La -eNa ,Gall)rall*s a*stral)s% es *n a+e or)g)nar)a de N*e+a ,elanda- sta Gall)n.$ea en /el)gro de extincin es famosa por su curiosidad agresividad. *e aspecto pardo tamao similar a una gallina, las SeNas se alimentan fundamentalmente de insectos frutos.
-eNa es un softSare programado en Uava que est+ orientado a la extraccin de conocimientos desde bases de datos con grandes cantidades de informacin.
9>
:erramienta ;e/a
(aractersticas principales de -eNa$ Est" disponible libremente ba0o la licencia p!blica 7eneral de 76C. Es mu portable porque est" completamente implementado en Uava puede correr en casi cualquier plataforma. (ontiene una extensa coleccin de t+cnicas para preprocesamiento de datos modelado. Es f"cil de utili#ar por un principiante gracias a su interfa# gr"fica de usuario.
9@
:erramienta ;e/a
9O
:erramienta ;e/a
9D
Re7eren#ias
,1.http$VVSSS.daedalus.esVmineria-de-datosV ,2.,3olina otros, 2GG1. ,9.http$VVSSS.monografias.comVtraba0os;;Vmineria-de-datosVmineria-dedatos.shtm -,:.http$VVSSS.uccor.edu.arVpaginasVseminariosV(ursosV*33edicineV(lase1-W/C6E8.pdf -,;.http$VVSSS.microsoft.comVbusinessVsmbVesesVtecnologiaVdataXmining.mspx -,>. http$VVSSS.tecnicas.comVconceptosVdata-miningVmetodos.aspx -,@.http$VVSSS.scielo.org.coVscielo.phpYpidH'G12G;>GD2GGDGGG1GGGGOZscriptHsciXarttext -,O.http$VVSSS. outube.comVSatchYvH-a)C19-@TvSZ68H1ZfeatureHfvSp -,D.http$VVSSS. outube.comVSatchYvH(?L8Lq[o&/sZ68H1 http$VVccc.inaoep.mxV\emoralesV(ursosVL**G9Vnode@.html
:G