Académique Documents
Professionnel Documents
Culture Documents
Qu es RAPIDMINER?
RapidMiner (anteriormente, YALE, Yet Another Learning Environment) es un
programa informtico para el anlisis y minera de datos. Permite el desarrollo de
procesos de anlisis de datos mediante el encadenamiento de operadores a travs de
un entorno grfico. Se usa en investigacin y en aplicaciones empresariales.
La versin inicial fue desarrollada por el departamento de inteligencia artificial de
la Universidad de Dortmund en 2001 y se distribuye bajo licencia GPL .
RapidMiner proporciona ms de 500 operadores orientados al anlisis de datos,
incluyendo los necesarios para realizar operaciones de entrada y salida, pre
-procesamiento de datos y visualizacin. Tambin permite utilizar los algoritmos
incluidos en Weka.
Qu es Minera de Datos?
Es el descubrimiento de conocimiento en un conjunto de datos enormemente
grande. El conocimiento que se obtiene viene dado en forma
de caractersticas (patrones) que no son triviales, que son previamente
desconocidas y que tienen bastante posibilidades de ser tiles Otros nombres
que se le dan a minera de datos son: Descubrimiento desconocimiento en bases
de datos (KDD), extraccin de conocimiento, anlisis inteligente de datos.
Es el proceso para extraer un modelo de datos, normalmente se utiliza en
marketing, deteccin de fraudes, vigilancia, etc.
Ejemplos de aplicacin de Data Minig.
-Hallar grupos de personas que padecen las mismas enfermedades.
-Determinar las caractersticas de personas a las que se puede hacer un
prstamo.
-Determinar si hay mas oportunidades de enfermarse de cncer cuando se vive
cerca de lneas de alta tencin.
CARACTERISTICAS DE RAPIDMINER
1) RapidMiner/Yale es un sistema prototipado para descubrimiento del
conocimiento DataMining.
2) Es un software de tipo Open Source con licencia GNU GPL, basado en java.
3) Se presenta bajo tres versiones:
1- Versin Open-Source: permite su libre uso en todas las formas de la licencia GNU
GPL.
2- Versin Libre: posee una interfaz grafica mejorada, pero no bajo la licencia GNU
GPL.
3- Versin comercial.
4) Posee alrededor de 400 operadores que pueden ser combinados.
5) Usa el lenguaje de scripting XML para describir los operadores y su configuracin.
6) La caracterstica mas importante es la capacidad de jerarquizar cadenas de operador y de
construir complejos arboles de operadores.
7) RapidMiner fcilmente puede ser invocado desde otra aplicacin java.
8) El usuario puede leer la configuracin de los procesos desde los archivos XML.
INTERFAZ GRAFICA
Crear Operadores:
Usando el icono de nuevo operador:
Usando el botn derecho del Mouse ubicndonos en la lengeta
del rbol de Operadores sobre cualquier operador que lo
permita, elegimos nuevo operador.
Reemplazar Operadores:
Usando el botn derecho del Mouse ubicndonos en la lengeta
del rbol de Operadores sobre cualquier operador que lo
permita, elegimos reemplazar operador.
Eliminar Operadores:
Usando el icono de remover operador:
Usando el botn derecho del Mouse ubicndonos en la lengeta
del rbol de Operadores sobre cualquier operador que lo
permita, elegimos remover operador.
Manejo de parmetros:
A partir de la lengeta de parmetros y pudiendo acceder a mas
si se pasa de modo normal a modo experto con los iconos:
Evaluacin de Resultados:
Cuando la ejecucin termino los resultados se observan en
pantalla en lo que se denomina Modo de Resultados (Result
Mode).
Desde esta pantalla tambin se puede volver a la pantalla de
edicin (Edit Mode) con la tecla <F9> (la cual sirve para cambiar
de modo) o tambin con el icono:
El modo de Resultados se puede acceder usando el icono:
Manejo de Grficos para los resultados:
Desde la vista de resultados es posible dependiendo el tipo de
resultados que arroja el modelo obtener grficos de distintas
formas.
la zona de trabajo.