Vous êtes sur la page 1sur 4

Instituto Superior Privado Robustiano Macedo Martinez Analista en Sistemas de Informacin Plan 2008 Sistemas de Soporte a decisin

Sistema de Soporte a Decisiones


Bveda, Julio Ferreira, Gabriel Gaviola, Nicolas

Investigar las herramientas disponibles para realizar Minera de Datos, dando: 1. Caractersticas, disponibilidad, ventajas, desventajas, etc. 2. Compararlas con WEKA. 3. Dar ejemplo de aplicacin de por lo menos 2 herramientas.

1. Herramientas de la Minera de Datos

Instituto Superior Privado Robustiano Macedo Martinez Analista en Sistemas de Informacin Plan 2008 Sistemas de Soporte a decisin Redes Neuronales: Son colecciones de nodos conectados, con entradas, salidas y procesamiento en cada nodo. Entre las entradas y salidas de la red existen un nmero de capas ocultas de procesamiento. La red neuronal debe ser ingresada a travs de un conjunto de patrones de entrenamiento (aprendizaje supervisado). Una vez ingresada es utilizada para hacer predicciones. Las redes neuronales se utilizan para clasificacin y reconocimiento de patrones. Caractersticas: Existen cuatro aspectos a tener en cuenta. .Topologa de las Redes Neuronales: La arquitectura de las redes neuronales consiste en la organizacin y disposicin de las neuronas formando capas ms o menos alejadas de la entrada y salida de la red. En este sentido, los parmetros fundamentales de la red son: el nmero de capas, el nmero de neuronas por capa, el grado de conectividad y el tipo de conexiones entre neuronas. .Redes Monocapa: Se establecen conexiones laterales, cruzadas o recurrentes entre las neuronas que pertenecen a la nica capa que constituye la red. Se utilizan en tareas relacionadas con lo que se conoce como auto-asociacin. .Redes Multicapa: Son aquellas que disponen de conjuntos de neuronas agrupadas en varios niveles o capas. Una forma de distinguir la capa a la que pertenece la neurona, consiste en fijarse en el origen de las seales que recibe a la entrada y el destino de la seal de salida. Segn el tipo de conexin, se distinguen las redes feedforward, y las redes feedforward/feedback. .Mecanismo de Aprendizaje: El mecanismo de aprendizaje es el proceso por el cual una red neuronal modifica sus pesos en respuesta a una informacin de entrada. Los cambios que se producen durante el proceso de aprendizaje se reducen a la destruccin, modificacin y creacin de conexiones entre las neuronas, la creacin de una nueva conexin implica que el peso de la misma pasa a tener un valor distinto de cero, una conexin se destruye cuando su peso pasa a ser cero. Se puede afirmar que el proceso de aprendizaje ha finalizado (la red ha aprendido) cuando los valores de los pesos permanecen estables. Un criterio para diferenciar las reglas de aprendizaje se basa en considerar las Redes Neuronales con aprendizaje supervisado y Redes Neuronales con aprendizaje no supervisado. La diferencia fundamental entre ambos tipos se encuentra en la existencia o no de un agente externo (supervisor) que controle el aprendizaje de la red. Redes con Aprendizaje Supervisado: El proceso de aprendizaje es controlado por un agente externo (supervisor) que determina la respuesta que debera generar la red a partir de una entrada determinada. El supervisor comprueba la salida de la red y en el caso de que sta no coincida con la deseada, se proceder a modificar los pesos de las conexiones, con el fin de conseguir la salida que se aproxime a la deseada Redes con Aprendizaje No Supervisado: Estas redes no requieren influencia para ajustar los pesos de las conexiones entre neuronas. La red no recibe ninguna informacin por parte del entorno que le indique si la salida generada es o no correcta. As que existen varias posibilidades en cuanto a la interpretacin de la salida de estas redes. En algunos casos, la salida representa el grado de similitud entre la informacin entrante y las informaciones que se le han mostrado en el pasado. En otro caso podra realizar una codificacin de los datos de entrada, generando a la salida una versin codificada de la entrada, con menos bits, pero manteniendo la informacin relevante de los datos, o algunas redes con aprendizaje no supervisado lo que realizan es un mapeo de caractersticas, obtenindose en las neuronas de salida una disposicin geomtrica que representa un ,mapa topogrfico de las caractersticas de los datos de entrada, de tal forma que si se presentan a la red informaciones similares, siempre sean afectadas las neuronas de salidas prximas entre s, en la misma zona del mapa. Ventajas: La capacidad de aprendizaje adaptativo es una de las caractersticas ms atractivas de redes neuronales. Esto es, aprenden a llevar a cabo ciertas tareas mediante un entrenamiento con ejemplos ilustrativos. Como las redes neuronales pueden aprender a diferenciar patrones mediante ejemplos y entrenamientos, no es necesario elaborar modelos, ni de especificar funciones de distribucin de probabilidad. Las redes neuronales son sistemas dinmicos auto-adaptativos. Son adaptables debido a la capacidad de auto-ajuste de los elementos procesales (neuronas) que componen el sistema. Son dinmicos, pues son capaces de estar constantemente cambiando para adaptarse a las nuevas condiciones. En el proceso de aprendizaje, los enlaces ponderados de las neuronas se ajustan de manera que se obtengan ciertos resultados especficos. Una red neuronal no necesita un algoritmo para resolver un problema, ya que ella puede generar su propia distribucin de pesos en los

Instituto Superior Privado Robustiano Macedo Martinez Analista en Sistemas de Informacin Plan 2008 Sistemas de Soporte a decisin enlaces mediante el aprendizaje. Tambin existen redes que continan aprendiendo a lo largo de su vida, despus de completado su perodo de entrenamiento. Comparados con los sistemas computacionales tradicionales, los cuales pierden su funcionalidad en cuanto sufren un pequeo error de memoria, en las redes neuronales, si se produce un fallo en un pequeo nmero de neuronas, aunque el comportamiento del sistema se ve influenciado, sin embargo no sufre una cada repentina. Hay dos aspectos distintos respecto a la tolerancia a fallos: primero, las redes pueden aprender a reconocer patrones con ruido, distorsionados, o incompleta. Segundo pueden seguir realizando su funcin (con cierta degradacin) aunque se destruya parte de la red. La razn por la que las redes neuronales son tolerantes a fallos es que tienen su informacin distribuida en las conexiones entre neuronas, existiendo cierto grado de redundancia en ese tipo de almacenamiento, a diferencia de la mayora de los ordenadores algortmicos y sistemas de recuperacin de datos que almacenan cada pieza de informacin en un estado nico, localizado y direccionable. Desventajas: A pesar del incremento en la velocidad y de la escala de integracin en los semiconductores, la mejor contribucin de las redes neuronales, todavia tendr que esperar por computadoras ms rpidas, masivas y paralelas. rbol de Decisiones: Un rbol de decisin es un modelo de prediccin utilizado en el mbito de la inteligencia artificial, dada una base de datos se construyen estos diagramas de construcciones lgicas, muy similares a los sistemas de prediccin basados en reglas, que sirven para representar y categorizar una serie de condiciones que suceden de forma sucesiva, para la resolucin de un problema. Ventajas: Se ha demostrado que los rboles de decisin son eficaces cuando es necesario describir problemas con ms de una dimensin o condicin. Tambin son tiles para identificar los requerimientos de datos crticos que rodean al proceso de decisin, es decir, los rboles indican los conjuntos de datos que la gerencia requiere para formular decisiones o tomar acciones. Desventajas: Los rboles de decisin no siempre son la mejor herramienta para el anlisis de decisiones. El rbol de decisiones de un sistema complejo con muchas secuencias de pasos y combinaciones de condiciones puede tener un tamao considerable. El gran nmero de ramas que pertenecen a varias trayectorias constituye ms un problema que una ayuda para el anlisis. En estos casos los analistas corren el riesgo de no determinar qu polticas o estrategias de la empresa son la gua para la toma de decisiones especficas. Cuando aparecen estos problemas, entonces es momento de considerar las tablas de decisin. Modelos Estadsticos: Es una expresin simblica en forma de igualdad o ecuacin que se emplea en todos los diseos experimentales y en la regresin para indicar los diferentes factores que modifican la variable de respuesta. Agrupamiento: Es un procedimiento de agrupacin de una serie de vectores segn criterios habitualmente de distancia; se tratar de disponer los vectores de entrada de forma que estn ms cercanos aquellos que tengan caractersticas comunes. 2. Weka: es un software programado en Java que est orientado a la extraccin de conocimientos desde bases de datos con grandes cantidades de informacin. Existen otras herramientas similares como Oracle Data Miner o Clementine. Weka es desarrollado bajo licencia GPL. Caractersticas: Weka se denomina a si mismo un conjunto de libreras para tareas de minera de datos. El paquete Weka contiene una coleccin de herramientas de visualizacin y algoritmos para anlisis de datos y modelado predictivo, unidos a una interfaz grfica de usuario para acceder fcilmente a sus funcionalidades. La versin original de Weka fue un front-end en TCL/TK para modelar algoritmos implementados en otros lenguajes de programacin, ms unas utilidades para el pre-procesamiento de datos desarrolladas en C para hacer experimentos de aprendizaje automtico. Esta versin original se dise inicialmente como herramienta para analizar datos procedentes del dominio de la agricultura , pero la versin ms reciente basada en Java (WEKA 3), que empez a desarrollarse en 1997, se utiliza en muchas y muy diferentes reas, en particular con finalidades docentes y de investigacin. Todas las tcnicas de Weka se fundamentan en la asuncin de que los datos estn disponibles en un fichero plano (flat file) o una relacin, en la que cada registro de datos est descrito por un nmero fijo de atributos (normalmente numricos o nominales, aunque tambin se soportan otros tipos). Weka tambin proporciona acceso a bases de datos va SQL gracias a la conexin JDBC (Java Database Connectivity) y puede procesar el resultado devuelto por una consulta hecha a la base de datos.

Instituto Superior Privado Robustiano Macedo Martinez Analista en Sistemas de Informacin Plan 2008 Sistemas de Soporte a decisin Ventajas: Est disponible libremente bajo la licencia pblica general de GNU. Es muy portable porque est completamente implementado en Java y puede correr en casi cualquier plataforma. Contiene una extensa coleccin de tcnicas para pre procesamiento de datos y modelado. Es fcil de utilizar por un principiante gracias a su interfaz grfica de usuario. Weka soporta varias tareas estndar de minera de datos, especialmente, pre-procesamiento de datos, clustering, clasificacin, regresin, visualizacin, y seleccin. Desventajas: No puede realizar minera de datos multi-relacional, pero existen aplicaciones que pueden convertir una coleccin de tablas relacionadas de una base de datos en una nica tabla que ya puede ser procesada con Weka. 3. Aplicaciones: Redes Neuronales: Las Redes Neuronales poseen fundamentalmente dos orientaciones, la militar y la mdica. En medicina los primeros en beneficiarse son los minusvlidos con deficiencias o carencias motrices, quienes adems aportan al desarrollo de estas tecnologas, por ser sujetos de prueba. Tanto las tecnologas que usan EMG, como EOG han logrado ampliar las expectativas de estos pacientes, por ej. Con EMG se observ que los impulsos elctricos procedentes de fibras musculares activas, pueden manejar equipos electrnicos, con las seales generadas por los msculos. Con EOG una nia con una grave lesin espinal prob que poda mover el cursor de la pantalla de computadora a partir de impulsos generados por sus ojos. En el rea militar estn experimentando en pilotos de avin con seales EP, siendo una herramienta til en el momento de tener manos y pies ocupados.

Vous aimerez peut-être aussi