Académique Documents
Professionnel Documents
Culture Documents
Objetivos:
Recursos:
Guas prcticas.
Datos ejemplo.
http://rapidminer.com
http://www.karpetas.com/almacen1/comestibles.rar
Introduccin
En la actualidad uno de los usos ms importantes de las bases de datos es en la aplicacin
del uso de tcnicas de minera de datos, con los cuales cualquier empresa o institucin
puede obtener resultados importantes para la toma de decisiones.
Como este es un tema muy amplio y complejo, lo que veremos es el uso de una aplicacin
RapidMiner, el cual proporciona un entorno muy bueno de pruebas y adems tiene una
versin de cdigo abierto.
Ejemplo de Aplicacin
Realizaremos un ejemplo basado en Reglas de Asociacin para cual iniciaremos, creando
una carpeta con el nombre comestibles y guardaremos ah el archivo que contiene la
data el cual es extensin csv y puede obtenerse en la siguiente direccin:
http://www.karpetas.com/almacen1/comestibles.rar (recuerda descomprimirlo) , y el
programa Rapid Miner el cual ya esta instalado en su computadora, al entrar al programa
puede que les pida crear un directorio de trabajo, sino es as, la aplicacin tendr la
siguiente apariencia.
Para crear nuestro ejemplo, seleccionaremos file y posteriormente New Process segn
muestra la siguiente figura:
Al seleccionar esta opcin la aplicacin nos presentara un lienzo en el que podremos trabajar en
base a una data, y a la unin de operadores, la aplicacin aparecer como la siguiente figura.
Para ocupar el operador tenemos dos formas de hacerlo, ya sea tomando y arrastrando el
operador hacia el lienzo o dndole doble clic.
Una vez colocado el operador, lo primeros que haremos es borrar la lnea que conecta a nuestro
operador con el lado derecho del lienzo, para hacer esto, seleccionamos la lnea y presionamos
suprimir, ahora vamos a usar los datos de prueba, y ocuparemos la parte derecha de la aplicacin
que donde esta los parmetros de cada operador, y seleccionaremos la opcin Import
Configuration Wizard como lo muestra la siguiente figura.
Recuerde en que carpeta descomprimi el archivos de datos, pues tendr que llamar al archivo
comestibles.csv, como lo muestra la siguiente figura.
Una vez seleccionado el archivo, presionaremos Next para continuar con la configuracin del
modelo, y nos presentara la siguiente pantalla.
Verificamos que la pantalla tenga la configuracin correcta, no se debe de cambiar los datos de
esta, porque el ejemplo se ha configurado de tal forma, pero en futuros caso puede ser necesario
modificar algn parmetro, dependiendo de cmo estos sean obtenidos.
Ahora presionaremos Next y nos presentara la siguiente pantalla.
Esta pantalla confirmara la informacin que se incorporara al modelo, para continuar presiono
Next.
La ltima pantalla nos permite configurar todava an ms la data que importamos, para terminar
este proceso presionaremos Finish.
Una vez importado los datos, me aparecer en el lienzo el operador, solamente con un circulo
amarrillo y debo de configurar la parte derecha con los datos tal y como aparecen en la siguiente
figura.
Ahora debemos de configurar los parametros de del operador, los cuales estan a la derecha de la
aplicacin, los cuales deben de quedar de siguiente forma.
Lo que hacemos es decirle que la columna Cdigo no debe ser tomada en cuenta pues
solamente representa al id de un comprador, y estamos listos para el operador 3.
En la parte de los parmetros no se cambiara ninguna seleccin por lo cual debe de quedar de la
siguiente manera.
Ahora configuramos los parmetros del operador, y estos datos deben de quedar con la siguiente
figura.
La lnea de unin se realizara en forma automtica, ahora solo nos falta incorporar el ultimo
operador.
Y debemos tambin configurar los parmetros, y realizaremos una prueba con la siguiente
configuracin
EJECUTAR EL MODELO
Para que se realice todo el proceso, ejecutamos el modelo presionando el icono de Play azul, el
cual nos servir para tener los datos disponibles, tambin ocuparemos los iconos de libreta de
apuntes que servir para regresar al modelo, y el icono de presentacin que servir para ir al
modelo.
La primera vez que lo corramos nos pedir que lo guardemos, a lo cual accederemos, y nos pedir
en que repositorio lo alojaremos, si el repositorio no est a la vista usemos el que tenemos por
default.
El nombre que usaremos para este ejemplo es: reglas_asociacion_ejemplo, pero puede usar otro
nombre, la informacin debe estar colocada con la pantalla siguiente.
Despues nos preguntara si queremos cerrar procesos viejos antes de empezar, responderemos
Yes.
Es muy difcil en una gua mostrar todos los resultados, entonces debemos de experimentar
utilizando las opciones de la parte izquierda, seleccionando valores, cambiando criterios, o
cambiando el valor mnimo del criterio, esto nos puede generar muchas opciones y resultados,
adems debemos de analizar los datos de la lista.
Otra opcin viable para mostrar resultados es Graph View a donde podemos ver las relaciones
de un producto con otros, su soporte, su ganancia y ms, tambin podemos filtrar resultados
usando los controles de la parte izquierda, este es un ejemplo del resultado.
Y por ltimo tambin puede utilizar la opcin Text View y me generara una lista, de productos
con la relacin y valor de estas.
Este es un proceso para realizar reglas de asociacin, puede ser utilizado para la toma de
decisiones, este proceso es muy utilizado en la actualidad, el programa genera dos archivos.
Como ejercicio cambia los parmetros del operador Create Association Rules y genera nuevos
resultados, para ver el cambio de los datos.
Es importante el anlisis de los resultados, adems de la elaboracin del modelo, pues a partir de
la forma de construirlo se obtendrn datos tiles o no, tambin, investiga para que sirve cada
operador.