Académique Documents
Professionnel Documents
Culture Documents
Presentado a:
ANVAR CHAVES TORRES
Tutor
Presentado por:
NILSON JAIRO ARIAS COD 91285823
PEDRO JAVIER BAYTER- COD 85272898
GRUPO 301125_16
INTRODUCCIN
El fin del presente trabajo corresponde a la prctica nmero dos del mdulo de
Bases de datos avanzadas busca asimilar y comprender cada tema visto con
anterioridad en la unidad correspondiente a esta tarea, as como tambin conocer y
aplicar los concepto de bases de datos distribuidas y bodegas de datos por medio
de la minera de datos.
Como bien sabemos el anlisis de los datos en un tiempo finito, ha trado consigo
estudios sobre la mejor forma de almacenar y representar estos datos para que
puedan ser consultados de una forma ms rpida. Por ende tenemos una serie de
fundamentos tericos que nos presenta el modulo en la temtica correspondiente a
Bodegas de datos y minera de datos.
Partiendo de un precepto simple y sencillo una Bodega de Datos (Data Warehouse)
es un repositorio integrado por datos que pueden ser generados internamente o
recibidos de fuentes externas, organizados de tal manera que facilitan el proceso
de toma de decisiones.
La Minera de datos es el proceso analtico diseado para explorar grandes
volmenes de datos con el objeto de descubrir patrones y modelos de
comportamiento o relaciones entre diferentes variables. Es decir, descubrir
conocimiento que ayuda a mejorar la toma de decisiones en las organizaciones.
OBJETIVOS
Aplicar bodegas de datos sobre un ejemplo real y crear una minera de datos
DESCRIPCIN DE LA ACTIVIDAD
Prometeus se ver beneficiada de usar una bodega de datos porque ser una forma
ms gil de obtener informacin especfica para tomar decisiones con el fin de
aumentar las ventas.
La bodega de datos no implica demasiado costo para la empresa, pues al tener una
base de datos distribuida la informacin se filtrar para tomar solo la especifica y
necesaria para almacenar en la bodega de datos, aunque s debera tener
presupuesto para alguna herramienta hardware y para el recurso humano.
Para la bodega de datos y minera se necesitaran herramientas como Herramientas
de Almacenamiento, Herramientas de Extraccin y Coleccin, Herramientas para
Reportes de Usuario Final y Herramientas para Anlisis Inteligentes.
PROCESO DE IMPLEMENTACIN
SOFTWARE:
Herramientas de Almacenamiento: corresponde a la herramienta en la cual
se irn a almacenar los datos. Existen muchas opciones dependiendo del
volumen de los datos, presupuesto y capacidad de su sistema. Cada uno de
los sistemas de administracin de bases de datos, como Oracle, DB2,
Informix, Tera Data, Sybase, etc, tienen una facilidad de Data Warehouse.
Herramientas de Extraccin y Coleccin: Ayudan a definir, acumular, totalizar
y filtrar los datos de sus sistemas transaccionales en el Data Warehouse. La
mayora de esas herramientas son desarrolladas por el personal interno de
la compaa dado el gran conocimiento que tienen de los sistemas
transaccionales.
Herramientas para Elaboracin de Reportes a Usuarios Finales: Es la
interface vista por el usuario. Al usuario se le debe proveer un mecanismo
para que vea los datos a un alto nivel y que entonces obtenga con ello la
solucin a preguntas especficas. Existen muchas herramientas, incluyendo
Cognos Powerplay, Business Objects, SAS, Show Case? Strategy etc.
HARDWARE:
Se requiere de un servidor para el almacenamiento y manejo de la base de
datos corporativa; este servidor se recomienda que sea altamente escalable,
pues algunas veces el proyecto de construccin de la bodega presenta
redimensionamiento a medida que se avanza en la implementacin.
La capacidad inicial de almacenamiento estar determinada por los
requerimientos de informacin histrica presentados por la empresa y por la
perspectiva de crecimiento que se tenga.
RIESGOS DE LA RED.
OTROS RIESGOS
- Des actualizacin de esquemas a nuevas necesidades del negocio.
- Acceso no restringido a objetos de la bodega de datos.
- Respaldo de los datos almacenados.
DATA MINING
La definicin mas acertada sobre el data mining es una tecnologa compuesta por
etapas que integra varias reas y que no se debe confundir con un gran software.
Durante el desarrollo de un proyecto de este tipo se usan diferentes aplicaciones
software en cada etapa que pueden ser estadsticas, de visualizacin de datos o de
inteligencia artificial, principalmente.
Actualmente existen aplicaciones o herramientas comerciales de data mining muy
poderosas que contienen un sinfn de utileras que facilitan el desarrollo de un
proyecto. Sin embargo, casi siempre acaban complementndose con otra
herramienta.
Podemos decir que "en data mining cada caso es un caso". Sin embargo, en
trminos generales, el proceso se compone de cuatro etapas principales:
1. Determinacin de los objetivos. Trata de la delimitacin de los objetivos
que el cliente desea bajo la orientacin del especialista en data mining.
2. Preprocesamiento de los datos. Se refiere a la seleccin, la limpieza, el
enriquecimiento, la reduccin y la transformacin de las bases de datos.
Esta etapa consume generalmente alrededor del setenta por ciento del
tiempo total de un proyecto de data mining.
3. Determinacin del modelo. Se comienza realizando unos anlisis
estadsticos de los datos, y despus se lleva a cabo una visualizacin
grfica de los mismos para tener una primera aproximacin. Segn los
objetivos planteados y la tarea que debe llevarse a cabo, pueden utilizarse
algoritmos desarrollados en diferentes reas de la Inteligencia Artificial.
4. Anlisis de los resultados. Verifica si los resultados obtenidos son
coherentes y los coteja con los obtenidos por los anlisis estadsticos y de
visualizacin grfica. El cliente determina si son novedosos y si le aportan
un nuevo conocimiento que le permita considerar sus decisiones.
El Perceptrn.
El Perceptrn multicapa.
Los Mapas Auto organizados, tambin conocidos como redes de Kohonen.
Sistemas Expertos: Son sistemas que han sido creados a partir de reglas
prcticas extradas del conocimiento de expertos. Principalmente a base de
inferencias o de causa-efecto.
Dendral
XCon
Dipmeter Advisor
Mycin
CADUCEUS
R1
CLIPS, Jess
Prolog
ehsis.ikudetelemed.com
CONCLUSIONES
Este diseo de una bodega de datos para luego implementar el proceso de
minera de datos est dirigido a profesionales involucrados en el anlisis de los
sistemas de informacin o en la toma de decisiones de su organizacin o de sus
clientes, as como a estudiantes universitarios en titulaciones de ingeniera,
informtica o bien que quieran complementar su formacin estadstica con la
perspectiva del proceso de extraccin de conocimiento mediante la generacin
de modelos a partir de bases de datos.
Dicha minera de datos es utilizada actualmente para deducir y encontrar perfiles
de comportamiento de clientes, proveedores o ambientes, de acuerdo a los
parmetros emitidos en los modelos matemticos que se extraen en el anlisis
hecho para la implementacin de esta tecnologa.
REFERENCIAS BIBLIOGRFICAS