Vous êtes sur la page 1sur 19

Presentado por:

Pinedo Delgado, Fermn Orlando

Qu es RAPIDMINER?
RapidMiner (anteriormente, YALE, Yet Another Learning Environment) es un
programa informtico para el anlisis y minera de datos. Permite el desarrollo de
procesos de anlisis de datos mediante el encadenamiento de operadores a travs de
un entorno grfico. Se usa en investigacin y en aplicaciones empresariales.
La versin inicial fue desarrollada por el departamento de inteligencia artificial de
la Universidad de Dortmund en 2001 y se distribuye bajo licencia GPL .
RapidMiner proporciona ms de 500 operadores orientados al anlisis de datos,
incluyendo los necesarios para realizar operaciones de entrada y salida, pre
-procesamiento de datos y visualizacin. Tambin permite utilizar los algoritmos
incluidos en Weka.

Qu es Minera de Datos?
Es el descubrimiento de conocimiento en un conjunto de datos enormemente
grande. El conocimiento que se obtiene viene dado en forma
de caractersticas (patrones) que no son triviales, que son previamente
desconocidas y que tienen bastante posibilidades de ser tiles Otros nombres
que se le dan a minera de datos son: Descubrimiento desconocimiento en bases
de datos (KDD), extraccin de conocimiento, anlisis inteligente de datos.
Es el proceso para extraer un modelo de datos, normalmente se utiliza en
marketing, deteccin de fraudes, vigilancia, etc.
Ejemplos de aplicacin de Data Minig.
-Hallar grupos de personas que padecen las mismas enfermedades.
-Determinar las caractersticas de personas a las que se puede hacer un
prstamo.
-Determinar si hay mas oportunidades de enfermarse de cncer cuando se vive
cerca de lneas de alta tencin.

CARACTERISTICAS DE RAPIDMINER
1) RapidMiner/Yale es un sistema prototipado para descubrimiento del
conocimiento DataMining.
2) Es un software de tipo Open Source con licencia GNU GPL, basado en java.
3) Se presenta bajo tres versiones:
1- Versin Open-Source: permite su libre uso en todas las formas de la licencia GNU
GPL.
2- Versin Libre: posee una interfaz grafica mejorada, pero no bajo la licencia GNU
GPL.
3- Versin comercial.
4) Posee alrededor de 400 operadores que pueden ser combinados.
5) Usa el lenguaje de scripting XML para describir los operadores y su configuracin.
6) La caracterstica mas importante es la capacidad de jerarquizar cadenas de operador y de
construir complejos arboles de operadores.
7) RapidMiner fcilmente puede ser invocado desde otra aplicacin java.
8) El usuario puede leer la configuracin de los procesos desde los archivos XML.

INTERFAZ GRAFICA

PANTALLA DE BIENBENIDA CON POSIBILIDAD DE:


-Iniciar un nuevo proceso.
-Abrir procesos recientemente usados.
-Abrir un nuevo proceso.
-Abrir el tutorial en lnea.
LA PANTALLA DE EDICION CONTIENE:
-Barra de men.
-Barra de herramientas.
-Lengeta de rbol de operadores.
-Lengeta de edicin (Parmetros, XML, Comentarios y Operadores).
-Visor de mensajes.

Crear Operadores:
Usando el icono de nuevo operador:
Usando el botn derecho del Mouse ubicndonos en la lengeta
del rbol de Operadores sobre cualquier operador que lo
permita, elegimos nuevo operador.
Reemplazar Operadores:
Usando el botn derecho del Mouse ubicndonos en la lengeta
del rbol de Operadores sobre cualquier operador que lo
permita, elegimos reemplazar operador.
Eliminar Operadores:
Usando el icono de remover operador:
Usando el botn derecho del Mouse ubicndonos en la lengeta
del rbol de Operadores sobre cualquier operador que lo
permita, elegimos remover operador.
Manejo de parmetros:
A partir de la lengeta de parmetros y pudiendo acceder a mas
si se pasa de modo normal a modo experto con los iconos:

Validacin de la definicin de Proceso:


Una vez que se agregaron todos los operadores necesarios
para un proceso es posible chequear si estos fueron
jerarquizados como corresponde y si tiene sus entradas
correctas y sus propiedades seteadas.
Para esto usamos el icono de validacin:
Los resultados se observan en el Visor de Mensajes y en caso
de error aparece un signo de admiracin junto al operador, en la
lengeta del rbol de operadores, en el que surge el problema .
Ejecucin del Proceso:
Una vez validado el proceso, la ejecucin consiste en clickear
en el icono de ejecucin:
Agregados de Puntos de Corte (BreakPoint):
Si nos ubicamos en alguno de los operadores en la lengeta del
rbol de operadores usando el botn derecho del mouse
podemos elegir colocar un BreaKPoint para que cuando la
ejecucin se inicie podamos frenar la en algn punto y luego
reanudarla.

Evaluacin de Resultados:
Cuando la ejecucin termino los resultados se observan en
pantalla en lo que se denomina Modo de Resultados (Result
Mode).
Desde esta pantalla tambin se puede volver a la pantalla de
edicin (Edit Mode) con la tecla <F9> (la cual sirve para cambiar
de modo) o tambin con el icono:
El modo de Resultados se puede acceder usando el icono:
Manejo de Grficos para los resultados:
Desde la vista de resultados es posible dependiendo el tipo de
resultados que arroja el modelo obtener grficos de distintas
formas.

Ejemplo 1: rbol de Decisin.

1. En el panel izquierdo seleccionar la pestana Operators. Luego


seleccionar el operador Repository

Access Retrieve y arrastrarlo a la zona de trabajo.

2. En la pestana Parameters del panel derecho, utilizar el navegador a


la derecha del parmetro repository entry para localizar el archivo
//Samples/data/Golf.

En el panel izquierdo seleccionar el operador Modeling


Classification and Regression Tree

Induction Decision Tree y arrastrarlo a la zona de


trabajo.

4. Conectar la salida del operador Retrieve a la entrada


del operador Decisin Tree, haciendo clic izquierdo

en el conector out (output, salida) del primero y luego otro


clic en el conector tra (training set, conjunto de

entrenamiento) del segundo.

5. De la misma forma, conectar la salida mod (model,


modelo) del operador Decisin Tree al puerto res de

la zona de trabajo.

6. Presionar el icono ejecutar en la barra de iconos de la


parte superior del marco. El proceso debera

comenzar y luego de un corto tiempo el visor de mensajes


de la parte inferior del marco muestra el mensaje

de que el proceso finalizo correctamente. El marco


principal cambia a la vista de "Resultados", que muestra

el rbol de decisin aprendido (una hiptesis que en


RapidMiner se denomina Modelo).

7. Volver al modo edicin ya sea por medio de la entrada


del men View Perspectives Design, el

icono de la barra de iconos, o presionando la tecla de


funcin <F8>.

Ejemplo 2. Exportar una base


de datos Excel.

Se direcciona a la base de datos


donde lo tenemos guardada.

Obtenemos la base de datos


de Excel en el Rapidminer

Vous aimerez peut-être aussi