Vous êtes sur la page 1sur 96

PROTOTIPO DE UNA BODEGA DE DATOS PARA LA EMPRESA SALN DEL

AUTOMVIL

ANDRES CAMILO PINEDA SUAVITA


066051026
WILMER HEDERT TORRES GONZALEZ
066051019

UNIVERSIDAD LIBRE
FACULTAD DE INGENIERA
PROGRAMA DE INGENIERA DE SISTEMAS
BOGOT D.C.
2011

PROTOTIPO DE UNA BODEGA DE DATOS PARA LA EMPRESA SALN DEL


AUTOMVIL

ANDRES CAMILO PINEDA SUAVITA


066051026
WILMER HEDERT TORRES GONZALEZ
066051019

Trabajo de grado para obtener el ttulo de Ingeniero de Sistemas

Director
Gilberto Pedraza Garca
Ingeniero de Sistemas y Computacin

UNIVERSIDAD LIBRE
FACULTAD DE INGENIERA
PROGRAMA DE INGENIERA DE SISTEMAS
BOGOT D.C.
2011

Nota de Aceptacin:
_______________________________
_______________________________
_______________________________
_______________________________
_______________________________
_______________________________

_______________________________
Director del Proyecto

_______________________________
Firma del jurado

_______________________________
Firma del jurado

Bogot (23, 09, 2011)


3

AGRADECIMIENTO
Queremos manifestar nuestro agradecimiento a todas las personas que durante el
proceso nos han apoyado en esta etapa de nuestras vidas, a nuestro director de
proyecto Ingeniero Gilberto Pedraza Garca que gracias a l hemos escogido uno
de los temas interesantes de la Ingeniera de Sistemas como son las Bodegas de
datos, por sus continuas enseanzas y su apoyo en el proceso de este trabajo.
Quisiramos tambin darle las gracias a nuestra familia que nos han brindado todo
el apoyo posible, durante todo este proceso de formacin desde el comienzo hasta
culminacin de nuestra carrera.
Adicionalmente les agradecemos a todas las personas que han intervenido con
este proyecto, ofrecindonos su conocimiento y experiencia sobre el tema
(Bodegas de datos).

CONTENIDO
Pg.
INTRODUCCIN

16

1.

17

PLANTEAMIENTO DEL PROBLEMA

1.1 DESCRIPCIN DEL PROBLEMA

17

1.2 FORMULACIN DEL PROBLEMA

17

1.3 JUSTIFICACIN

17

1.4 OBJETIVOS
1.4.1 General
1.4.2 Especficos

18
18
18

1.5 ALCANCE

18

1.6 HIPTESIS

19

2.

20

MARCO REFERENCIAL

2.1 MARCO HISTRICO


2.1.1 Visin.
2.1.2 Misin.
2.1.3 Tipo de Ventas Saln del Automvil.

20
20
20
20

2.2 MARCO CONCEPTUAL


2.2.1 Toma de decisiones.
2.2.2 Bodegas De Datos.
2.2.3 Modelamiento Dimensional.
2.2.4 Modelo multidimensional.
2.2.5 Modelamiento en Bodegas de Datos
2.2.6 Arquitectura de la Bodega de Datos
2.2.7 Proceso ETL.
2.2.8 Datawarehouse Manager.

21
21
24
25
26
27
27
28
29

2.3 MARCO METODOLGICO


2.3.1 Metodologa de Ralph Kimball.

30
30

2.4 MARCO LEGAL

41

2.5 MARCO TECNOLGICO


2.5.1 Herramienta de desarrollo

43
43

2.6 MARCO GEOGRFICO

44

3.

DISEO METODOLGICO

45

3.1 TIPO DE INVESTIGACION

45

4. DESARROLLO METODOLGICO

48

4.1 PLANEACIN DEL PROYECTO

48

4.2 DEFINICIN DE REQUERIMIENTOS DE NEGOCIO

53

4.3 DISEO ARQUITECTURA TCNICA.

56

4.4 SELECCIN DE HERRAMIENTAS E INSTALADOR.

57

4.5 MODELAMIENTO DIMENSIONAL

57

4.6 DISEO CONCEPTUAL.

58

4.7 DISEO LGICO.

65

4.8 DISEO FSICO.

66

4.9 DISEO DE CAPAS DE DATOS INTERMEDIA Y DESARROLLO

69

4.10 CUBOS CON MICROSOFT SQL SERVER 2008

79

5.

RESULTADOS

82

6.

CONCLUSIONES

90

7.

RECOMENDACIONES

91

BIBLIOGRAFA

92

ANEXOS

94

LISTA DE FIGURAS
Pg.
Figura 1. Los tres pilares de BI

23

Figura 2. Modelo Estrella

25

Figura 3. Arquitectura bodega de datos

27

Figura 4. Ciclo de vida para el desarrollo de la bodega de datos

31

Figura 5. Mapa por localidades Bogot

44

Figura 6. Cronograma de actividades

51

Figura 7. Origen de Datos

54

Figura 8. Diseo Arquitectura Tcnica

56

Figura 9. Diseo conceptual

64

Figura 10. Diseo Lgico

65

Figura 11. Creacin de tablas Cliente y Tipo_Transaccion

66

Figura 12. Creacin de tablas Departamento, Producto y Tiempo

67

Figura 13. Creacion de tabla Hechos_Ventas

68

Figura 14. Creacion de tablas Temporales

68

Figura 15. Creacion de tabla Temporal Tiempo

69

Figura 16. Dimension Cliente

70

Figura 17. Propiedades Objeto Ordenar Cliente

70

Figura 18. Dimensin Tipo Transaccin

71

Figura 19. Propiedades Objeto ordenar Tipo Transaccin

71

Figura 20. Dimensin Departamento

72

Figura 21. Propiedades Objeto Ordenar Departamento

72

Figura 22. Dimensin Producto

73

Figura 23. Propiedades Objeto Ordenar Producto

73

Figura 24. Dimensin Temporal Tiempo

74

Figura 25. Dimensin Tiempo

75

Figura 26. Propiedades Origen de Tiempo y consulta SQL

75

Figura 27. Tabla Temporal Nit

76

Figura 28. Propiedades Objeto Ordenar Nit

76

Figura 29. Tabla Temporal Valor

77

Figura 30. Propiedades Objeto Ordenar Valor

77

Figura 31. ETL Hechos Ventas

78

Figura 32. Vista en Analysis Services

79

Figura 33. Cubo Ventas Saln Automvil

80

Figura 34. Proceso de carga de los Datos al cubo

80

Figura 35. Cubo Cargado con los Datos

81

Figura 36. Informe Clientes Mayoristas

83

Figura 37. Informe Producto Mayorista

84

Figura 38. Informe Compras Mensuales

85

Figura 39. Informe Medio de pago

86

Figura 40. Informe Promedio Clientes

87

Figura 41. Informe Promedio Ciudad

88

Figura 42. Informe Promedio Sexo

89

LISTA DE TABLAS

Pg.
Tabla 1. Marco legal

41

Tabla 2. Descripcin Roles

49

Tabla 3. Asignacin de Roles

50

Tabla 4. Actividades de gestin de costos

51

Tabla 5. Actividades control de cronograma

52

Tabla 6. Descripcin Requerimientos

55

Tabla 7. Primera Forma Normal

59

Tabla 8. Primera Forma Normal

59

Tabla 9. Descripcion Primera Forma Normal

60

Tabla 10. Segunda Forma Normal

60

Tabla 11. Segunda Forma Normal

61

Tabla 12. Segunda Forma Normal

61

Tabla 13. Segunda Forma Normal

61

Tabla 14. Tercera Forma Normal

62

Tabla 15. Tercera Forma Normal

62

Tabla 16. Tabla Conceptual

62

Tabla 17. Descripcin Clientes Mayoristas

83

Tabla 18. Descripcin Producto Mayorista

84

Tabla 19. Descripcin Compras Mensuales

85

Tabla 20. Descripcin Medio de Pago

86

Tabla 21. Descripcin Promedio Clientes

87

Tabla 22. Descripcin Promedio Ciudad

88

Tabla 23. Descripcin Promedio Sexo

89

LISTA DE ANEXOS
Anexo A. Entrevista

94

Anexo B. Posible implementacin

96

10

GLOSARIO

APLICACIN: cualquier programa que corra en un sistema operativo y que haga


una funcin especfica para un usuario. Por ejemplo, procesadores de palabras,
bases de datos, agendas electrnicas, etc.
BASES DE DATOS: recopilacin sistematizada y organizada de datos conexos,
usualmente erigida o conformada a travs de medios informticos, estructurados
de tal manera que faciliten su explotacin para satisfacer los requerimientos de
informacin.
BODEGA DE DATOS: conjunto de datos integrados u orientados a una materia,
que varan con el tiempo y que no son transitorios, los cuales soportan el proceso
de toma de decisiones de la administracin y est orientada al manejo de grandes
volmenes de datos provenientes de diversas fuentes o diversos tipos.
BUSINESS INTELLIGENCE: es la habilidad para transformar los datos en
informacin, y la informacin en conocimiento, de forma que se pueda optimizar el
proceso de toma de decisiones en los negocios.
CONOCIMIENTO: es el acervo de informacin utilizado en el proceso de la toma
de decisiones.
DATOS: hechos, conceptos, instrucciones o caracteres representados de una
manera apropiada para que sea comunicado, transmitido o procesado por seres
humanos o por medios automticos y a los cuales se les asigna o se les puede
asignar significado.
DATAMART: base de datos departamental, especializada en el almacenamiento
de los datos de un rea de negocio especfica.
ESTRATEGIA: conjunto de acciones que se llevan a cabo para lograr un
determinado fin.
FLUJO DE DATOS: sirve para conectar el resto de componentes de un diagrama
de flujo de datos, este concepto es muy similar a la tubera a travs fluye
informacin estructurada conocida.
GESTIN DE CONOCIMIENTO (KNOWLEDGE MANAGEMENT): es la disciplina
que busca enfocar el uso de las Tecnologas de Informacin en las personas, con
el fin de que estas y sus organizaciones aprendan a utilizar los recursos y fuentes
de informacin para el logro de objetivos estratgicos.

11

HARDWARE: conjunto de dispositivos fsicos que componen el ordenador: la


pantalla, el teclado, el ratn, etc.
IDENTIFICAR LAS FUENTES: hace referencia al proceso de identificacin de las
fuentes y datos que harn parte de la bodega o almacn de datos.
INSTALACIN: proceso en el cual nuevos programas son transferidos a un
computador y, eventualmente, configurados, para ser usados con el fin para el
cual fueron desarrollados.
INFORMACIN: es el resultado del procesamiento de datos. Todo aquello que
permite adquirir cualquier tipo de conocimientos.
INNOVACIN: es la aplicacin de nuevas ideas, conceptos, productos, servicios y
prcticas, con la intencin de ser tiles para el incremento de la productividad. Un
elemento esencial de la innovacin es su aplicacin exitosa de forma comercial.
No solo hay que inventar algo, sino, por ejemplo, introducirlo en el mercado para
que la gente pueda disfrutar de ello.
MEDIOS DE ALMACENAMIENTO: son los materiales fsicos donde se
almacenan datos, ejemplo de ellos discos magnticos, discos pticos, cintas
magnticas, tarjetas de memoria, etc.
METADATO: contienen informacin fundamental para los usuarios,
desarrolladores y administradores de la bodega de datos: informacin disponible,
su significado y como obtenerla; Fuente de datos para cada tem de la bodega de
datos, si el tem es tomado directamente de un sistema fuente o si es calculado,
ltima actualizacin del tem, etc.
METODOLOGA: la rama de la metodologa, dentro de la ingeniera de software,
se encarga de elaborar estrategias de desarrollo de software que promuevan
prcticas adoptativas en vez de predictivas; centradas en las personas o los
equipos, orientadas hacia la funcionalidad y la entrega, de comunicacin intensiva
y que requieren implicacin directa del cliente.
MODELO: propuesta, normalmente de carcter terico-prctico, que tiene una
serie de caractersticas que se consideran dignas de emular. Generalmente, el
modelo ilustra una situacin deseable para ser analizada y puesta en prctica en
un contexto educativo similar, o bien adaptarla a otras caractersticas del entorno.
MOTOR DE BASE DE DATOS: es el servicio principal para almacenar, procesar y
proteger datos. El Motor de base de datos proporciona acceso controlado y
procesamiento de transacciones rpido para cumplir con los requisitos de las
aplicaciones consumidoras de datos ms exigentes de la empresa.

12

NEGOCIO: es una ocupacin lucrativa que cuando tiene un cierto volumen,


estabilidad y organizacin se llama empresa. Tambin es la consecuencia de la
correcta administracin de los recursos con un resultado econmicamente positivo
para las partes; es importante sealar que no solamente puede ser dinero sino
relaciones de poder.
OLAP: las siglas OLAP significan en ingls Online Analytical Processing, una
categora de herramientas de software que provee anlisis de datos almacenados
en una base de datos multidimensional. Las herramientas OLAP permiten a los
usuarios analizar diferentes dimensiones de datos.
PLANIFICACIN: es el proceso de establecer metas y elegir medios para
alcanzar dichas metas.
PROCESO: conjunto de actividades o eventos (coordinados u organizados) que
se realizan o suceden (alternativa o simultneamente) con un fin determinado.
Este trmino tiene significados diferentes segn la rama de la ciencia o la tcnica
en que se utilice.
RED: conjunto de medios tcnicos que permiten la comunicacin a distancia entre
equipos autnomos (no jerrquica -master/slave-). Normalmente se trata de
transmitir datos, audio y vdeo por ondas electromagnticas a travs de diversos
medios (aire, vaco, cable de cobre, cable de fibra ptica, etc.).
SISTEMAS: los sistemas son todos aquellos programas que se elaboran para
satisfacer las posibles necesidades de informacin automatizada de cada rea en
particular. Por decir, en el rea de sistemas de un Banco existen los sistemas de
cheques, ahorro, remesas, tarjeta de crdito, crdito hipotecario, etc.
SISTEMA DE INFORMACIN: se debe considerar un sistema de computacin e
informacin como el conjunto de componentes fsicos (hardware), lgicos
(software), de comunicacin (bien redes de cualquier tipo o tipo Internet) y medios
humanos, todo ello unido permite el tratamiento de la informacin.
SISTEMA OPERATIVO: software que acta de interfaz entre los dispositivos de
hardware y los programas usados por el usuario para utilizar un computador. Es
responsable de gestionar, coordinar las actividades y llevar a cabo el intercambio
de los recursos y acta como estacin para las aplicaciones que se ejecutan en la
mquina.
SOFTWARE: conjunto de instrucciones y datos codificados para ser ledas e
interpretadas por una computadora. Estas instrucciones y datos fueron concebidos
para el procesamiento electrnico de datos.

13

SQL (STRUCTURED QUERY LANGUAGE): lenguaje utilizado para base de


datos desarrollado en 1974 y 1975 en IBM Research.
TECNOLOGA: es el conjunto de habilidades que permiten construir objetos y
mquinas para adaptar el medio y satisfacer nuestras necesidades. Es una
palabra de origen griego, formada por tekne ("arte, tcnica u oficio") y logos
("conjunto de saberes"). Aunque hay muchas tecnologas muy diferentes entre s,
es frecuente usar el trmino en singular para referirse a una de ellas o al conjunto
de todas. Cuando se lo escribe con mayscula, tecnologa puede referirse tanto a
la disciplina terica que estudia los saberes comunes a todas las tecnologas,
como a educacin tecnolgica, la disciplina escolar abocada a la familiarizacin
con las tecnologas ms importantes.
TOMA DE DECISIONES: es el proceso durante el cual la persona debe escoger
entre dos o ms alternativas. Todos y cada uno de nosotros pasamos los das y
las horas de nuestra vida teniendo que tomar decisiones. Algunas decisiones
tienen una importancia relativa en el desarrollo de nuestra vida, mientras otras son
gravitantes en ella.

14

RESUMEN
El uso de las Bodegas de datos como medio de informacin en una empresa, ha
revolucionado el ambiente empresarial, principalmente en lugares donde se desea
tener un conocimiento ms profundo sobre la manera de poder mejorar sus
estrategias de mercado.
Un problema presentado en la empresa Saln del Automvil es la poca eficiencia
en el uso de la informacin la cual no se pueden sacar conclusiones, ya que esta
informacin no es muy utilizada por la redundancia de los datos y no representan
ninguna ayuda en el mejoramiento de la toma de decisiones y procesos internos
de la empresa Saln del Automvil, as almacenando datos ao tras ao sin darle
un uso adecuado para beneficio de la misma empresa. Adems si la organizacin
requiere generar un informe con estos datos se demoran demasiado tiempo
porque este proceso se realiza manualmente y no pueden saber con exactitud que
clientes compran ms durante cada ao.
El anlisis y diseo de una bodega de datos para ayudar en la toma de decisiones
en la empresa Salon del Automvil genera los informes de los clientes mayoristas,
los productos ms vendidos, las fechas de las mayores compras, los medios de
pago que cancelan los clientes y el promedio de compra por cliente mayorista,
adems lo datos son almacenados y organizados en la herramienta Microsoft SQL
Server 2008.

Palabras Claves: Bodega de datos, Informacin histrica, Toma de decisiones,


Ventas, Dimensiones, ETL, Inteligencia de negocios, Clientes, Metodologa de
Bodega de datos, Modelamiento, Aplicativos, Plataformas.

15

INTRODUCCIN

Empresas como el Saln del Automvil buscan incrementar su productividad y


ventajas frente a la competencia mediante nuevas estrategias de negocio. Para el
cumplimiento de estas estrategias es necesario utilizar toda la informacin que es
almacenada da a da en sus bases de datos.
Al manejar esta informacin de las bases de datos para la toma de decisiones, se
presenta un problema principal: existe demasiada informacin que no es utilizada
por la empresa, muchas veces terminan desasindose de estos datos y
desaprovechando la oportunidad de generar unos nuevos ingresos para la
organizacin.
Por lo tanto, se busca una unificacin entre la parte de datos y la parte de los
negocios, por medio de una solucin basada en el almacenamiento de datos. Esta
solucin permite utilizar los datos operativos de la empresa para generar
informacin que soporte la toma de decisiones.
Grandes empresas como EPM, Telmex, Pichincha, TIGO e IBM han utilizado la
inteligencia de negocios para estos propsitos, permitindoles conocer mejor a
sus clientes, sus productos, ventas, costos y otros factores determinantes en sus
negocios.
Esta tesis se encuentra dividida en 3 captulos, el primero de ellos corresponde al
Planteamiento del Problema donde se realiza un anlisis profundo de la
problemtica que se desea enfocar, dando la descripcin y la formulacin del
problema que se quiere analizar y mostrar en el proyecto, as como la justificacin,
objetivos y alcance que se desea tener. El segundo captulo consiste en los
conceptos, el Modelamiento y el proceso en los cuales se basa esta tesis para el
desarrollo del prototipo para la empresa SALN DEL AUTOMVIL, adicional la
metodologa que se aplicara para el desarrollo del mismo. En el tercer captulo se
explica con ms profundidad la metodologa que ayuda a la elaboracin del
prototipo de la bodega de datos para la empresa Saln del Automvil.

16

1. PLANTEAMIENTO DEL PROBLEMA

1.1

DESCRIPCIN DEL PROBLEMA

En la empresa SALN DEL AUTOMVIL, compaa que se dedica a la compra y


venta de repuestos para automviles, donde se desarrolla el proyecto, se
encontraron los siguientes problemas:
La informacin que almacena la empresa cada ao tienen muchos datos
redundantes, la falta de organizacin de los mismos hacen que no sea utilizada de
la mejor manera, as generando riesgos para la organizacin en caso que se
presente fuga de informacin.
Al momento de generar un informe o reporte no tienen una aplicacin adecuada
para producirlos y as la informacin no es utilizada por la empresa para mejorar
su estabilidad econmica y no se puede tomar decisiones acertadas en caso de
ser requerido.
La empresa no tiene un control optimo sobre el manejo de los clientes que mas
compran durante el ao y no pueden saber con exactitud los ingresos por este
concepto, sino se sabe cules son los clientes ms fieles a los productos de la
empresa esto genera algunas perdidas ya que muy probablemente los clientes
recomienden a la competencia.
1.2

FORMULACIN DEL PROBLEMA

Ser posible que mediante la aplicacin de las tecnologas de la informacin a


travs de la formulacin y modelacin de soluciones, se pueda apoyar la toma de
decisiones de los clientes mayoristas de la empresa?
1.3

JUSTIFICACIN

Este proyecto realiza un anlisis y diseo de una bodega de datos para la


empresa Saln del Automvil. El proyecto muestra el valor agregado que genera
la introduccin de tecnologas de informacin en el desarrollo de las estrategias de
la organizacin. Particularmente est enfocado a mejorar la toma de decisiones en
las ventas realizadas por la empresa determinando el cliente que mayor compra,
consolidndola mejor en el mercado de los repuestos automotrices.
El prototipo permite tener una idea global de los compradores mayoristas en el
transcurso del ao electo, con la realizacin de la bodega de datos se obtiene un
modelado y un diseo de la misma, evitando que la empresa se centre en
objetivos que no generen mejores ingresos, proporcionando una mejor toma de
decisiones para las ventas de la empresa en un futuro.

17

Se obtendr una mejor acogida en el mercado y con ello un mayor crecimiento de


las ventas de repuestos automotrices, ya que la empresa segmentara mejor sus
clientes para as generar unos mejores ingresos.
Los beneficios que se pueden generar en la consolidacin de informacin es la
siguiente:
Generar reportes estadsticos de los clientes mayoristas en la empresa en un
periodo establecido, mejora en la toma de decisiones y un aumento significativo en
las ventas, para ello se va articular el uso de tecnologas de informacin (bodegas
de datos) en cumplimiento de objetivos y estrategias organizacionales.
1.4

OBJETIVOS

1.4.1 General. Elaborar una estrategia para toma de decisiones que permita
describir un comportamiento o plantear un modelo de prediccin relacionado con
la problemtica de los clientes mayoristas de la empresa Saln del Automvil
utilizando Microsoft SQL Server 2008 y su componentes analysis services e
Integration services.
1.4.2 Especficos
Establecer el perfil de los clientes y priorizar un conjunto de requerimientos para
fidelizacin de clientes mayoristas de la empresa Saln del Automvil.
Identificar y valorar la calidad de las fuentes de datos disponibles y requeridas
para implementar el modelo
Modelar e implementar una estrategia de bodega de datos para consolidar la
informacin necesaria.
Aplicar el modelo de anlisis a la bodega para establecer las variables que
determinan la fidelizacin de clientes y evaluar resultados.
1.5

ALCANCE

Se realiza el Prototipo de una bodega de datos para la empresa SALN DE


AUTOMVIL para ayudar a la toma de decisiones de la empresa. Se busca hacer
un modelo de prediccin relacionado con la problemtica de los clientes
mayoristas de la empresa, sobre el objeto de estudio de la investigacin se abarca
nuevas tecnologas de informacin en el desarrollo organizacional, mediante el
cual se analizara informacin histrica y actual para el apoyo de la toma de
decisiones
Diseo y construccin de la bodega de datos aplicando una metodologa
reconocida.
Aplicacin de Software para los clientes mayoristas de la empresa.
18

1.6

HIPTESIS

En el momento de implementar la bodega de datos que se propone, se obtendr


como resultado la integracin y consolidacin de la informacin histrica,
soportados en el anlisis de las diferentes variables que permitan mejorar nuestras
estrategias y ayudarnos al mejoramiento de la toma de decisiones para as tener
una iteracin con el usuario final (cliente).

19

2. MARCO REFERENCIAL
2.1

MARCO HISTRICO

En el ambiente automotriz la empresa Saln del automvil se destaca por su alta


calidad en el servicio, el completo inventario de repuestos y su alta preferencia con
sus clientes.
Desde el inicio se propuso por brindarles a sus clientes buena calidad en la
atencin. La empresa dispone de un almacn en los Martires en Bogot, con un
total de 15 empleados divididas en las reas administrativas y operativas del
negocio, esto con el fin de brindar un gran apoyo a los fieles clientes de la
empresa. Es una empresa fuerte, solida y con un objetivo claro, mantener el
liderazgo que los apoya por ms de quince aos de servicio. Ahora el Saln del
automvil se proyecta hacia el futuro buscando expansin en el mercado y
mejorando servicios estratgicos para mantener la preferencia de sus clientes. El
inters de nuestro proyecto es poderle brindar a la empresa una herramienta que
ayude a la toma de decisiones y as poder alcanzar las metas propuestas por la
empresa, ya que no cuenta con un sistema que le facilite tomar las mejores
decisiones para un futuro cercano.
Como toda empresa tiene unos Objetivos y metas ha alcanzar como son:
2.1.1 Visin. Ser en un futuro inmediato el principal proveedor de autopartes y
productos con una mejor calidad. Seremos la mejor opcin para nuestros clientes
y estaremos al da con las nuevas tecnologas que nos permitan ofrecer un
excelente servicio con los mejores estndares de calidad para ser reconocidas
dentro del mercado de autopartes como los lderes indiscutibles en Colombia 1 .
2.1.2 Misin. En el Saln del Automvil nos comprometemos a ser la mejor
opcin del mercado de autopartes, a travs de nuestros diferentes puntos de
ventas a nivel nacional, ofreciendo un excelente servicio y productos de calidad
que le permita a nuestros clientes satisfacer sus necesidades y a nuestros
accionistas, aliados y empleados un mejor nivel de vida para contribuir al progreso
de nuestro pas 2 .
2.1.3 Tipo de Ventas Saln del Automvil. La empresa Saln del automvil
desde su creacin ha manejado diferentes formas de llegar a sus clientes,
ofreciendo nuevos productos y mejores precios en el mercado. Estas ventas se
dividen en tres partes las cuales se adaptan a los diferentes tipos de clientes que
maneja la empresa Saln del Automvil.

1
2

Manual de calidad. Empresa Saln del Automvil.2010


Ibid

20

Venta de productos en el almacn. Sucede cuando un cliente se acerca


directamente al almacn a realizar una compra de un repuesto o parte para su
vehculo automotriz. El pago es realizado en efectivo o por medio de electrnico
(tarjeta debito o crdito), luego pasa a la parte de entrega del almacn y el cliente
lo recibe.
Venta de los productos por los vendedores. Sucede cuando un vendedor de
la empresa realiza sus ventas en la parte exterior del almacn sin necesidad de
que el cliente se acerque al almacn a realizar su compra. El pago es realizado
en efectivo, si el cliente desea hacerlo por medio electrnico es necesario que se
acerque al almacn, luego de hecha la venta el vendedor le toma los datos al
cliente y hace llegar la mercanca al lugar indicado. En caso de que el cliente
quiera llevar sus repuestos o partes de inmediato es necesario que se acerque al
almacn.
Venta por telfono. Sucede cuando el cliente se comunica directamente a la
empresa a solicitar un producto en especfico o realizar un pedido mayor. Por este
medio es como la empresa tiene la mayor entrada de capital y de ventas.
La empresa maneja la mayora de sus clientes con una forma de pago la cual es a
crdito dando un tiempo mximo de 30 das para cancelar el pedido solicitado.
Para que la empresa brinde estos crditos se realiza un estudio crediticio que
demuestre la solvencia econmica de los clientes para poder ser entregado el
producto
2.2

MARCO CONCEPTUAL

2.2.1 Toma de decisiones. La toma de decisiones se define como el anlisis de


acciones, donde permite a la empresa mejorar su estabilidad econmica ayudando
a abrir nuevos mercados. Sin embargo la toma de decisiones es una planeacin
de los procesos que permite el cumplimiento de los objetivos o metas de la
empresa.
El proceso de toma de decisiones es uno de los rangos ms significativos para
caracterizar una empresa, porque en l se resume su cultura y sus paradigmas
administrativos. En las organizaciones Colombianas, por lo general, procede a
buscar las decisiones ms obvias y familiares, las empresas dedican casi todo su
tiempo y sus recursos a la realizacin de los procesos de transformacin
basndose en la elaboracin de sus productos dejando de lado la innovacin y el
perfeccionamiento, haciendo que la tomas sea rutinarias y basadas

21

La toma de decisiones abarca cuatro funciones administrativas, as los


administradores cuando planean, organizan, conducen y controlan, se les
denomina con frecuencia los que toman las decisiones.
La separacin del proceso en etapas puede ser tan resumida o tan extensa como
se desee, pero poder identificar principalmente las siguientes etapas:

Identificar y analizar el problema


Identificar los criterios de decisin y ponderarlos
Definir la prioridad para atender el problema
Generar las alternativas de solucin
Evaluar las alternativas
Eleccin de la mejor alternativa
Aplicacin de la decisin
Evaluacin de los resultados

Inteligencia De Negocios (BI). A travs de los aos la Inteligencia de


Negocios o Business Intelligence(BI) ha tenido mayor acogida en las grandes
empresas por sus caractersticas para tomar informacin histrica y generar
escenarios, pronsticos y reportes que ayudan a la toma de decisiones, lo que
sirve para que la empresa obtenga una ventaja competitiva frente a las otras
empresas. En la actualidad hay muchas empresas que se han beneficiado por la
implementacin de este sistema, buscando tener mayores ingresos.
Hoy en da las organizaciones tienen la necesidad de implementar un sistema de
Inteligencia de negocios por muchas razones como son:
Permite reunir, normalizar y centralizar toda la informacin de la empresa,
mediante una bodega de datos.
Las plataformas de BI se disean para perfeccionar al mximo las consultas de
alto nivel, realizando las transformaciones oportunas a cada sistema (OLTP OLAP), y liberando los servidores operacionales.
Permite articular las tecnologas de informacin al cumplimiento de los objetivos
de cada organizacin.
Los Tres pilares de BI. BI representa ms que slo una aplicacin. Los
estudios de caso muestran que las empresas que utilizan la fuerza combinada de
los tres pilares del BI - la infraestructura o las mejores herramientas, prcticas y
aplicaciones - son las ms propensas a implementar BI de una manera que
ofrezca un valor.

22

Infraestructura y herramientas - Durante el ao 2004, las empresas harn hincapi


en mejorar o modificar su infraestructura de BI para proporcionar la durabilidad y la
agilidad necesaria para el apoyo estratgico en aplicaciones de BI y ofrecer un
valor continuo.
Mejores prcticas - tecnologa por s sola no puede producir conocimiento. Las
empresas tambin necesitan una estrategia de BI para toda la empresa y cumplir
una poltica de gobierno de BI.
Aplicaciones - En una encuesta de Gartner, el 60 por ciento de los encuestados
europeos y el 30 por ciento de los EE.UU. declar que comprar aplicaciones de BI
en vez de construirlas. Adems, las capacidades de los proveedores de
aplicaciones empresariales "continan ganando importancia en el mercado de BI.
Sin embargo, a medida que ms empresas adoptan muchas tecnologas
diferentes y sin relacin de BI, la fragmentacin de BI en las empresas
aumentar. 3
Figura 1. Los tres pilares de BI

Fuente: Libro Business Intelligence: A Managerial Approach

Aplicaciones de Inteligencia de negocios (BI). Hoy en da existe una gran


variedad de software y herramientas enfocadas en Inteligencia de negocios (BI)
que son utilizadas en las diferentes reas de la empresa, como el rea de ventas,
marketing, finanzas, etc., que permiten el acceso rpido y fcil a informacin til y
valiosa de la empresa. Con la inteligencia de negocios se pueden crear bases de
3

TURBAN Efraim, SHARDA Ramesh, ARONSON Jay, KING David. Business Intelligence: A Managerial Approach.
Pearson Education Canada, 2010

Ibid

23

datos de clientes, prever ventas y devoluciones, compartir informacin y mejorar el


servicio al cliente.
Para realizar un anlisis adecuado de Inteligencia de negocios es necesario tener
en cuenta las siguientes caractersticas:
Accesible a la informacin. Los datos que son la fuente principal deben
garantizar que este tipo de herramientas tenga un uso adecuado para que los
usuarios la pueden utilizar de una manera correcta, independientemente del origen
de los datos.
Apoyo en toma de decisiones. La idea en la inteligencia de negocios es
difundir la presentacin de la informacin, para que todos los usuarios tengan
acceso a las tcnicas de anlisis que les permita seleccionar y manejar los datos
ms notables para la organizacin.
Orientacin al usuario final. Las soluciones en inteligencia de negocios se
pueden dividir en su nivel de complejidad: informes simples, cubos OLAP (On Line
Analytic Processing), minera de datos o sistemas de previsin empresarial. . Los
cubos OLAP son vectores en los cuales se dispone la informacin, y mediante
este se genera un anlisis completo de los datos.
2.2.2 Bodegas De Datos. Las bodegas de datos son una coleccin de datos que
contiene informacin procedente de sistemas de bases de datos o archivos de la
organizacin y de otros sistemas relacionados al negocio, la formacin de una
bodega de datos se obtiene mediante procesos de extraccin, transformacin y
Carga de datos utilizados para el soporte del proceso de toma de decisiones
gerenciales. El datawarehouse es siempre un almacn de datos transformados y
separados fsicamente de la aplicacin de donde provienen los datos.
Una bodega de datos es el resultado de las transformaciones, la mejora de la
calidad y la integracin de datos procedentes de bases de operaciones.
Ralph Kimball define un almacn de datos como: "una copia de las transacciones
de datos especficamente estructurada para la consulta y el anlisis". Tambin
determino que un datawarehouse no era ms que: "la unin de todos los
Datamarts de una entidad".
Toda bodega de datos debe tener las siguientes caractersticas:
Orientados a un tema particular. la informacin se clasifica en base a los
aspectos que son de inters para la empresa
Integrado. La integracin de datos se muestra de muchas maneras: en
convenciones de nombres consistentes, en la medida uniforme de variables, en la
24

codificacin de estructuras consistentes, en atributos fsicos de los datos


consistentes y fuentes mltiples, estos datos deben ser consistentes.
Variante en el tiempo. La informacin debe incluir los datos histricos para
usarse en la identificacin y evaluacin de tendencias.
No voltil. La informacin no se modifica ni se elimina, la informacin es til
slo cuando es estable. Hay dos nicos tipos de operaciones: la carga inicial de
datos y el acceso a los mismos.
2.2.3 Modelamiento Dimensional. El modelo dimensional es una tcnica de
diseo lgico que busca presentar los datos de forma intuitiva y proporcionando
acceso de alto desempeo. Cada modelo dimensional se compone de una tabla
con mltiples llaves forneas, llamada tabla de Hechos (fact table), y un conjunto
de tablas ms pequeas, llamadas tablas de dimensin.
Existen dos modelos dimensionales que predominan en las soluciones de
bodegas de datos: el modelo estrella y el modelo copo de nieve. En el modelo
estrella, como se ve en la figura 2 se tiene una tabla de hechos y en ella llaves
forneas a cada una de las tablas de dimensin que tiene el modelo. Es decir,
cada tabla dimensional est directamente relacionada a la tabla de hechos. 5
Figura 2. Modelo Estrella

Fuente: Libro The Data Warehouse ETL Toolkit

Una dimensin es modelada de forma copo de nieve cuando los campos de baja
cardinalidad de la dimensin han sido removidos a tablas separadas y unidas a la
tabla original con llaves forneas 7 . En este modelo la tabla de hechos no tendr
llaves forneas a todas las dems tablas como en el caso de la estrella. Las

KIMBALL Ralph, CASERTA Joe. The Data Warehouse ETL Toolkit Practical Techniques for Extracting, Cleaning,
Conforming, and Delivering Data.

6
7

Ibid
Ibid

25

nuevas tablas no estarn conectadas con la tabla de hechos sino con las
dimensionales establecidas.
2.2.4 Modelo multidimensional. Las Bodegas de datos y sistemas OLAP se
basan en un modelo multidimensional. Este modelo permite una mejor
comprensin de los datos con fines de anlisis y proporciona un mejor rendimiento
para consultas complejas de anlisis. Visin del modelo de datos multidimensional
en un espacio n-dimensional, generalmente llamado un cubo de datos o un
hipercubo. 8
Los Datamarts son subconjuntos, que debe ser consistente en la representacin
de los datos, para que pueda asegurar la robustez. Son subconjuntos de datos de
una bodega de datos para reas especficas, los Datamarts son pequeos
datawarehouse encargados de un tema o un rea de negocio especfico dentro de
una organizacin. El sistema de base de datos donde se construye el DW puede
ser multidimensional o relacional. Cuando este sistema es relacional el diseo
lgico puede aplicar tcnicas de de los modelos multidimensionales a bases de
datos relacionales.
OLTP (On-Line Transactional Processing).Los sistemas OLTP son bases de
datos orientadas al procesamiento de transacciones. Cada transaccin genera un
proceso atmico y puede involucrar las operaciones de insercin, modificacin y
eliminacin de datos. Este proceso es tpico en las bases de datos operacionales.
El acceso a los datos optimizado a las tareas de lectura y escritura, un ejemplo de
ello son las transacciones que tiene que soportar una base de datos de un banco.
Los datos estn estructurados segn su nivel de aplicacin, mediante los
programas de gestin ERP o CRM.
Es comn la falta de compatibilidad y la existencia de islas de datos
El historial de datos suele limitarse a los datos actuales 9
OLAP (On-Line Analytical Processing) Los sistemas OLAP son bases de
datos orientadas al procesamiento analtico. Este anlisis implica generalmente la
lectura de amplias cantidades de datos para poder extraer informacin til:
tendencias de ventas, patrones de comportamiento de los consumidoresetc.
Este sistema es tpico de los datamarts.
El acceso a los datos suele ser de solo lectura. Su accin ms comn es la
consulta.

nd

MALINOWSKI Elzbieta - Esteban Zimanyi . Advanced Data Warehouse Design. 2 corrected printing 2009. Springer

SINNEXUS. Bases de datos OLTP y OLAP, [En lnea]. [30 de Septiembre de 2010]. Disponible en la Web:
http://www.sinnexus.com/business_intelligence/olap_vs_oltp.aspx

26

Los datos se estructuran de acuerdo a sus reas de negocio y los formatos de los
datos estn integrados de una forma uniforme en toda la organizacin.
El historial de datos es a largo plazo, normalmente de dos a cinco aos
Suele alimentar informacin procedente de los sistemas operacionales existentes,
mediante el proceso ETL (Extraccin, transformacin y carga). 10
2.2.5 Modelamiento en Bodegas de Datos: Dimensional Vs Relacional. En los
sistemas transaccionales el objetivo del modelo es brindar la integridad de los
datos, adems elimina todo tipo de redundancia. Este sistema nos permite tener
un mejor entorno del procesamiento transaccional.
En un entorno de bases de datos relacionales se debe bsicamente a esta
disciplina de modelado. Sin embargo, para el propsito de un Data Warehouse, el
modelo relacional (ER) presenta los siguientes problemas:
Legibilidad limitada. Los usuarios finales no son capaces de entender el modelo
ER. Por tanto, no pueden navegar por dicho modelo en busca de informacin.
Dificultad para las herramientas de consulta en el acceso a un modelo ER general.
Las herramientas de consulta a menudo poseen prestaciones mediocres o
inaceptables cuando se trabaja en entornos relacionales de grandes volmenes de
informacin.
La utilizacin de la tcnica de modelado ER frustra el principal atractivo del Data
Warehouse. Al utilizar el modelado ER queda frustrada la recuperacin de
informacin intuitiva y con alto rendimiento.
2.2.6 Arquitectura de la Bodega de Datos
Figura 3. Arquitectura bodega de datos

Fuente: Pagina Web /www.dataprix.com

11

10

SINNEXUS. Bases de datos OLTP y OLAP, [En lnea]. [30 de Septiembre de 2010]. Disponible en la Web:
http://www.sinnexus.com/business_intelligence/olap_vs_oltp.aspx

27

Bsicamente, la forma de operar del esquema superior se resume de la siguiente


manera:
Los datos son extrados desde aplicaciones, bases de datos, archivos, etc. Esta
informacin generalmente reside en diferentes tipos de sistemas, orgenes y
arquitecturas y tienen formatos muy variados.
Los datos son integrados, transformados y limpiados, para luego ser cargados en
la Bodega de datos.
Fundamentalmente, la informacin de la Bodega de datos se estructura en cubos
multidimensionales, ya que estos preparan esta informacin para responder a
consultas dinmicas con una buena performance. Pero tambin pueden utilizarse
otros tipos de estructuras de datos para representar la informacin de la Bodega
de datos, como por ejemplo Business Models.
Los usuarios acceden a los cubos multidimensionales, Business Models (u otro
tipo de estructura de datos) de la Bodega de datos utilizando diversas
herramientas de consulta, exploracin, anlisis, reportes, etc.
A continuacin se detallar cada uno de los componentes de la arquitectura de la
Bodega de datos, teniendo como referencia siempre el grfico antes expuesto,
pero resaltando el tema que se tratar.
2.2.7 Proceso ETL. Los procesos de extraccin, transformacin y carga, son
muy importantes porque por medio de estos procesos los datos se cargan en una
bodega de datos (o en cualquier base de datos). Implican las siguientes
operaciones:
Extraccin. Obtener la informacin deseada a partir de los datos almacenados
en fuentes externas.
Transformacin. Cualquier operacin realizada sobre los datos para que
puedan ser cargados en la Bodega de datos se puedan migrar de ste a otra base
de datos.
Carga. Consiste en almacenar los datos en la base de datos final, o en este
caso la Bodega de datos final.

11

ING. BERNABEU R. DARIO. Data Warehouse Arquitectura, [En lnea]. Publicado Enero de 2009, [17 de Septiembre de
2010]. Disponible en la web: http://www.dataprix.com/data-warehousing-y-metodologia-hefesto/arquitectura-del-datawarehouse/31-introduccion

28

Las bodegas de datos, han monopolizado la investigacin sobre la parte


conceptual del modelado de datos, se ha dedicado a captura de caractersticas
conceptuales de esquema de estrella esquema de Datamarts y agregaciones.
Los modelos conceptuales de ETL, el modelo propuesto es informal y la atencin
se centra en demostrar la complejidad de los esfuerzos, en lugar modelo formal de
las propias actividades. En trminos de enfoques de tipo industrial, el modelo que
se deriva sera una documentacin informal del proceso de ETL general.
Para la poblacin de la bodega de datos. Existen 2 razones fundamentales:
En el modelo conceptual para el proceso de ETL, la atencin se centra en
documentacin / formalizacin de las particularidades de las fuentes de datos con
respecto al almacn de datos y no en proporcionar una solucin tcnica para la
ejecucin del proceso.
El modelo de ETL conceptual se construye a principios de las etapas del proyecto
de Bodegas de Datos durante el cual, el tiempo de las limitaciones del proyecto
requieren una documentacin rpida de la almacenamiento de los datos en
cuestin y sus relaciones.
2.2.8 Datawarehouse Manager. Es la base de datos relacional que contienen
los datos obtenidos de un servidor que es un objetivo de recogida de datos. Estos
datos son utilizados para generar los informes correspondientes a los conjuntos de
recopilacin de datos del sistema, y tambin se puede utilizar para crear informes
personalizados.
La Datawarehouse Manager presenta las siguientes caractersticas y funciones
principales:
Almacena los datos de forma multidimensional, es decir, a travs de tablas de
hechos y tablas de dimensiones.
Gestiona las diferentes estructuras de datos que se construyan o describan
sobre la Bodega de datos, como Cubos Multidimensionales, Business Models, etc.
Gestiona y mantiene metadatos. 12
Adems, la Datawarehouse Manager se encarga de:

12

ING. BERNABEU R. Dario. Datawarehouse manager, [En lnea]. Publicado Enero de 2009, [17 de Septiembre de
2010]. Disponible en la Web: http://www.dataprix.com/data-warehousing-y-metodologia-hefesto/arquitectura-del-datawarehouse/34-datawarehouse-manager

29

Transformar e integrar los datos fuentes y del almacenamiento intermedio en un


modelo adecuado para la toma de decisiones.
Realizar todas las funciones de definicin y manipulacin del depsito de datos,
para poder soportar todos los procesos de gestin del mismo.
Ejecutar y definir las polticas de particionamiento. El objetivo de realizar esto,
es conseguir una mayor eficiencia y performance en las consultas al no tener que
manejar todo el grueso de los datos. Esta poltica debe aplicarse sobre la tabla de
hechos que, como se explicar ms adelante, es en la que se almacena toda la
informacin que ser analizada.
Realizar copias de resguardo incremental o total de los datos de la Bodega de
datos. 13
2.3

MARCO METODOLGICO

2.3.1 Metodologa de Ralph Kimball. La metodologa para el desarrollo del


proyecto es la propuesta por Ralph Kimball, quien es uno de los padres en el
campo de las bodegas de datos. Kimball se ha dedicado al desarrollo de su
metodologa para que este concepto sea correctamente aplicado en las empresas,
y cambie la calidad de los proyectos de este tipo. Durante su carrera ha escrito
varios libros y ha sido consultor en el campo de las bodegas de datos.
Kimball ha establecido ciertos procesos para llevar al xito un proyecto de Bodega
de datos. Para su desarrollo se incluyen varias tareas que pueden ser realizadas
en forma secuencial. El desarrollo de cada una de las fases planteadas en su
metodologa garantiza una bodega de calidad y un proceso bien desarrollado
Existen varios escenarios posibles en los que surge un proyecto de bodega de
datos para una empresa. Es importante identificar el escenario para determinar el
alcance y definicin del proyecto. Los escenarios, originados por una demanda del
proyecto en una empresa son los siguientes:
Demanda de un sector del negocio. En este escenario, un ejecutivo del
negocio tiene el propsito de obtener mejor informacin con un mejor acceso para
tomar mejores decisiones.
Alto volumen de informacin. En este escenario, existen mltiples ejecutivos
del negocio buscando mejor informacin.

13

ING. BERNABEU R. Dario. Datawarehouse manager, [En lnea]. Publicado Enero de 2009, [17 de Septiembre de
2010]. Disponible en la Web: http://www.dataprix.com/data-warehousing-y-metodologia-hefesto/arquitectura-del-datawarehouse/34-datawarehouse-manager

30

Exploracin. En este escenario usualmente est involucrado el presidente de


una empresa, quien no identifica necesidades de una bodega de datos para su
negocio pero desea incorporar este sistema por razones diferentes a
requerimientos o necesidades del negocio.
Al identificar el escenario, es posible determinar si existe demanda para el
proyecto y de donde proviene esta demanda. El primer caso se puede determinar
que se requiere del proyecto. El segundo escenario es riesgoso, pues para
implementar una bodega de datos que soporte varios requerimientos de diferentes
reas de la empresa, se necesita mucho tiempo, dinero y soporte de la
organizacin que perdure a largo plazo. En el tercer escenario se deben buscar
los requerimientos que puede implementar la solucin y basar en ellos el proyecto.
Figura 4. Ciclo de vida para el desarrollo de la bodega de datos 14

Fuente: Libro The Data Warehouse Lifecycle Toolkit

15

En todos los escenarios es determinante contar con sponsors o patrocinadores


internos del proyecto para lograr el xito. Si no se cuenta con un patrocinador
interno de la empresa involucrado en la demanda es preferible posponer el
proyecto.
Luego de identificar el escenario es importante conocer si la empresa est lista
para realizar este proyecto.

14
15

KIMBALL, Ralph.The Data Warehouse Lifecycle Toolkit. John Wiley & Sons. 1998
Ibid

31

Determinar la preparacin de la empresa para un proyecto de bodega de datos de


acuerdo a Ralph Kimball existen cinco factores que deben existir en una
organizacin para iniciar un proyecto de bodega de datos.
Patrocinio de la gerencia del negocio. Al contar con este patrocinio se tiene
una visin del impacto que tendr la bodega de datos en la empresa. Los gerentes
son lderes influyentes dentro de la organizacin y determinarn el apoyo y
soporte al proyecto de los dems miembros de la organizacin. Es preferible tener
varios patrocinadores que uno solo, en caso de cambios en la organizacin o
necesidad un apoyo ms fuerte.
Motivacin del negocio. Al implementar una bodega de datos se busca
encontrar un sentido de emergencia por parte de la organizacin, causado por una
motivacin del negocio. Un ejemplo de motivadores son la competencia y la visin
competitiva. Otras organizaciones han encontrado el motivador en una crisis. Un
motivador importante tambin es un mercado potencial. Lo importante para un
proyecto de bodega de datos es alinearse con uno de estos motivadores
estratgicos del negocio.
Acompaamiento del departamento de tecnologa y de negocio. El xito de
un proyecto de bodega de datos se produce gracias a un esfuerzo de las reas de
tecnologa y de negocio, compartiendo responsabilidades.
Presencia de cultura analtica. Es importante que las decisiones de la
organizacin se basen en hechos, ms que en simples intuiciones. Y que estas
decisiones sean determinantes y recompensadas.
Factibilidad. Es preferible que la infraestructura que soporte la bodega de
datos est presente y sea robusta. La primera factibilidad debe ser la de los datos.
Si estos se encuentran sucios o no cumplen con estndares, el proyecto tendr
retrasos respecto al cronograma planeado.
Desarrollo del enfoque preliminar. Luego de haber determinado la
preparacin de la organizacin para el proyecto, se debe centrar el proyecto en su
enfoque, y justificarlo para recibir el apoyo y presupuesto de desarrollo. Para
determinar el enfoque, se deben responder preguntas como: Se busca el
enfoque y presupuesto para cubrir el levantamiento de requerimientos y diseo?
O para una primera versin de la bodega? O para el proyecto completo? Para
definir este enfoque la base debe ser los requerimientos del negocio, no un
cronograma. Para la definicin del enfoque es importante seguir los siguientes
parmetros:

32

La definicin del enfoque es responsabilidad del departamento de tecnologa y


de negocio. El enfoque usualmente se establece para desarrollar requerimientos
especficos del negocio, en un tiempo determinado.
El enfoque inicial del proyecto debe ser factible y manejable. Es preferible
empezar pequeo. Luego continuar el proceso de forma iterativa. Lanzando
pequeos y rpidos desarrollos del proyecto.
Enfoque inicial en un solo requerimiento del negocio soportado por una sola
fuente de datos.
Limitar el nmero de usuarios que tendrn acceso a la bodega de datos
inicialmente.
Establecer criterios de xito del proyecto mientras se define el enfoque. Se
refiere a entender lo que la gerencia espera del proyecto.
Una vez el rea de tecnologa y negocios han acordado un enfoque, este se
debe documentar.
Desarrollar la justificacin del negocio. Luego de haber definido el enfoque,
la justificacin debe ser establecida. Esto significa que se identifican
anticipadamente los costos y beneficios asociados al proyecto. Una forma de
hacer esto es con el factor Tasa interna de retorno (TIR), que consiste en
comparar el retorno financiero esperado (beneficios del negocio) contra la
inversin esperada (costos).
Se deben considerar las siguientes inversiones y costos:
Compras de licencias de software y hardware.
Costos de mantenimiento: muchos productos de hardware y software requieren
mantenimiento.
Recursos internos de desarrollo.
Recursos externos requeridos.
Capacitacin para desarrolladores y usuarios.
Soporte a usuarios.
Costos de crecimiento: Por cambios en requerimientos y actualizaciones.
Se deben considerar los siguientes retornos y beneficios:
Los proyectos de bodegas de datos tpicamente tienen un impacto en el
incremento de ingresos y ganancias, ms que en reduccin de costos.

Incremento de ingresos por nuevas ventas a nuevos y antiguos clientes.


Incremento de ganancias por aumento de respuestas a la publicidad.
Incremento de niveles de servicio al cliente.
Descubrimiento de nuevas oportunidades.

33

Planeacin del proyecto. El proyecto de bodega de datos debe tener un


nombre. Luego, se identifican roles que pueden ser cubiertos por uno o varios
integrantes del equipo y cada miembro del quipo tambin puede desempear
varios roles, dependiendo de los requerimientos y del tamao del proyecto. Los
siguientes roles se identifican para el proyecto:
Patrocinadores de negocio.
Gerente del proyecto. Responsable de la gerencia de tareas y actividades
cotidianas.
Lder de negocios del proyecto. Con el gerente del proyecto monitorea el
proyecto y lo comunica a la organizacin. Tiene un alto entendimiento de los
requerimientos del negocio.
Analista del sistema de negocios. Lidera las actividades de definicin de
requerimientos.
Modelador de datos.
responsable del anlisis de datos y el modelo
dimensional.
Administrador de bases de datos de la bodega (DBA). Responsable de
determinar agregaciones, particiones y soporte a la base de datos.
Diseador de proceso ETL. Responsable del diseo de la extraccin,
transformacin y carga de la bodega.
Desarrolladores de aplicacin al usuario.
Instructor de la bodega de datos.
Desarrollo del plan del proyecto. El objetivo de la planeacin es proveer el
detalle suficiente para hacer seguimiento al progreso del proyecto. Se identifican
actividades, recursos y tiempos para el desarrollo.
Tambin permite monitorear los procesos y tener un plan de riesgos.
Administracin del proyecto. Se consideran las reuniones de equipo,
monitoreo del estatus, el enfoque y estrategias de comunicacin. Para las
reuniones se debe seguir una agenda y mantener un ambiente de comunicacin
entre el equipo. El monitoreo se debe realizar peridicamente, analizando el
estado del proyecto en diferentes estados del tiempo.
Anlisis de requerimientos. Acercamiento a la definicin de
requerimientos. Para entender mejor los requerimientos se debe empezar por
hablar con los usuarios del negocio. No se debe preguntar a estos usuarios, qu
datos quieren que aparezcan en el datamart, sino hablar con ellos sobre sus
trabajos, objetivos y retos e intentar conocer cmo toman decisiones, actualmente
y en el futuro.
Se debe considerar lo que requiere el negocio comparando estos requerimientos
con los datos disponibles en las bases de datos que servirn como fuente, para
lograr el soporte de estos requerimientos.
34

Preparacin de la entrevista. Se deben determinar roles y responsabilidades


en el equipo entrevistador. Es preferible que el mismo equipo conduzca las
entrevistas a usuarios del negocio y al equipo de tecnologa de la empresa.
Los roles que se deben manejar, comprenden a un lder, encargado de dirigir el
cuestionario, debe tener habilidades en el conocimiento del negocio y
comunicaciones. Tambin debe existir un relator encargado de tomar notas
durante las entrevistas. Se debe tomar el mayor detalle posible del contenido. Al
finalizar las entrevistas, esta persona debe hacer preguntas para aclarar dudas y
obtener una retroalimentacin de los entrevistados.
Investigacin previa a entrevistas. Antes de iniciar el proceso de
levantamiento de requerimientos, se deben analizar los reportes anuales de la
compaa, para determinar las decisiones y hechos estratgicos.
Tambin es til obtener planes de negocios de la compaa. Tambin se debe
analizar la competencia de la compaa y sus principales fortalezas y debilidades.
Si ha existido un intento anterior de desarrollar una bodega de datos de la
compaa, este tambin se debe analizar.
Seleccin de los entrevistados. Se deben seleccionar personas
representativas de cada rea de la organizacin. Es importante observar el
organigrama de la compaa para determinar los candidatos a entrevista. Los
principales entrevistados deben ser los administradores ejecutivos del negocio,
para comprender la estrategia en un alto nivel de la empresa. Luego es importante
entrevistarse con los analistas del negocio de cada rea quienes conocen el
manejo de informacin que se lleva a cabo.
Desarrollo del cuestionario. El lder de la entrevista debe preparar el
cuestionario antes de iniciar la entrevista. Se deben disear varios cuestionarios
que sern aplicados dependiendo del rol de los entrevistados dentro de la
empresa. El cuestionario debe ser de una sola pgina, para evitar exceso de
tiempo de entrevistas.
Es preferible iniciar las entrevistas en un nivel medio de jerarqua de la
organizacin, en vez de iniciar desde la parte superior con las altas gerencias,
pues en los mandos medios se maneja un mayor nivel de detalle respecto a los
datos que sirven para luego definir la granularidad de la bodega.
Es importante que durante la entrevista se especifique terminologa, la definicin
exacta de esta tendr un gran impacto en la granularidad y dimensionalidad del
modelo. Es posible que una palabra signifique muchas cosas, por eso lo

35

importante es identificarlas y documentar estas inconsistencias en el vocabulario


para luego confrontarlas con los entrevistados.
Inicio y desarrollo de la entrevista. La entrevista debe iniciarse con una
introduccin, para recordar al usuario sobre el proyecto y el equipo desarrollador.
Los objetivos del proyecto y de la entrevista deben ser nombrados y los miembros
del equipo presentados.
Para documentar informacin til se debe preguntar a los usuarios sobre sus
trabajos, por qu los hacen y cmo los hacen. Se deben realizar preguntas en un
alto nivel y luego irse al detalle para obtener respuestas cada vez ms especficas.
Al entrevistar ejecutivos, el principal objetivo es obtener una visin y entender
globalmente el negocio. Al entrevistar administradores y analistas de la empresa,
se buscan los objetivos y visin de cada departamento. En el rea de auditora y
administracin de datos se busca saber si existen los datos para poder dar soporte
a los requerimientos encontrados en las entrevistas previas. Se debe entender las
definiciones de los campos de las bases de datos, granularidad, volmenes de
datos, y otros detalles de estas fuentes de informacin.
Al cierre de las entrevistas se debe preguntar por los criterios de xito del
proyecto, de esta forma se entienden las actitudes y expectativas frente al
proyecto. Estos criterios deben ser medibles y cuantificables.
Anlisis de las entrevistas. Si algn miembro del equipo conoce los sistemas
operativos fuente de la empresa, debe explicarlos al resto del equipo para
determinar la factibilidad de implementar los requerimientos encontrados. Se
deben resaltar los descubrimientos y requerimientos clave para el proyecto.
Se deben analizar y repasar los reportes y anlisis reunidos en las entrevistas, lo
cual comnmente conlleva a una aproximacin del descubrimiento de dimensiones
para el modelo.
Para finalizar, es importante documentar los requerimientos obtenidos y
comunicarlos a los usuarios para adquirir su aprobacin y compromiso.
Diseo tcnico de la arquitectura. En los sistemas de informacin la
definicin de una arquitectura permite hacer un desarrollo ms confiable y
eficiente. Con la definicin de la arquitectura se mejora la comunicacin entre las
diferentes reas del proyecto, el planeamiento del proyecto, la flexibilidad y el
mantenimiento del mismo.

36

Aspectos de arquitectura. Para hacer el diseo de la arquitectura se debe


comenzar analizando los sistemas legacy actuales, estos deben ser consistentes y
manejar de forma correcta sus transacciones, pues en la metodologa del
desarrollo del DWH (Datawarehouse) se toma como hecho que estos sistemas
son confiables.
Para hacer el diseo de la arquitectura se debe comenzar analizando los sistemas
legacy actuales, estos deben ser consistentes y manejar de forma correcta sus
transacciones, pues en la metodologa del desarrollo del DWH se toma como
hecho que estos sistemas son confiables.
Procesos de extraccin, transformacin y carga. Este proceso comprende
varios aspectos determinantes para la bodega de datos. Por lo tanto se debe
seguir un plan para su correcto desarrollo. Se establecen varios pasos que
conducen al desarrollo del proceso y se describen a continuacin.
Paso 1. Plan de alto nivel. El proceso de diseo se inicia con un esquema
simple de los componentes del plan que son conocidos: Las fuentes y los destinos
de los datos. Se identifica de donde provienen los datos y las caractersticas y
problemas con dichas fuentes. Con este esquema es posible comunicar la
complejidad del proyecto a la gerencia y miembros del equipo de desarrollo del
proyecto.
Las aplicaciones de ETL realizan tres pasos: extraccin, transformacin y carga a
la bodega de datos. Estos pasos se deben ver en un esquema de alto nivel: Tomar
los datos de las fuentes, transformarlos y cargarlos en los destinos.
Paso 2. Herramientas ETL. Las extracciones tpicamente se escriben en el
lenguaje de la fuente de los datos. Existen herramientas que realizan todo el
proceso de extraccin, transformacin y carga que buscan minimizar el tiempo
requerido para estas tareas. Estas herramientas implican un costo por licencias y
posibles incompatibilidades o dificultades con transformaciones complejas que
fuesen requeridas para el proceso. Ya se haga el proceso con cdigo
desarrollado, o herramientas existentes, es determinante realizar prcticas que
mejoren el rendimiento del proceso, como ordenar los datos o cargarlos de forma
rpida para cargas masivas en las bases de datos.
Paso 3. Plan detallado. El plan se inicia seleccionando las tablas en las que se
va a trabajar, en cual orden y secuenciar las transformaciones para cada conjunto
de datos. Se debe graficar un diagrama con estas estructuras.
Todas las tablas de dimensin deben ser cargadas antes que las tablas de
hechos. Se debe iniciar el desarrollo de la aplicacin ETL con la dimensin ms
simple y continuar con las dems hasta llegar la tabla de hechos.

37

Extraccin. La primera parte del proceso ETL consiste en extraer los datos
desde los sistemas de origen.
Cada sistema separado puede usar una
organizacin diferente de los datos o formatos distintos. Los formatos de las
fuentes normalmente se encuentran en bases de datos relacionales o archivos
planos, pero pueden incluir bases de datos no relacionales u otras estructuras
diferentes. La extraccin convierte los datos a un formato preparado para iniciar el
proceso de transformacin.
Una parte intrnseca del proceso de extraccin es la de analizar los datos
extrados, de lo que resulta un chequeo que verifica si los datos cumplen la pauta
o estructura que se esperaba. De no ser as los datos son rechazados.
Un requerimiento importante que se debe exigir a la tarea de extraccin es que
sta cause un impacto mnimo en el sistema origen. Si los datos a extraer son
muchos, el sistema de origen se podra ralentizar e incluso colapsar, provocando
que ste no pueda utilizarse con normalidad para su uso cotidiano. Por esta razn,
en sistemas grandes las operaciones de extraccin suelen programarse en
horarios o das donde este impacto sea nulo o mnimo.
Transformacin. La fase de transformacin aplica una serie de reglas de
negocio o funciones sobre los datos extrados para convertirlos en datos que
sern cargados. Algunas fuentes de datos requerirn alguna pequea
manipulacin de los datos. No obstante en otros casos pueden ser necesarias
aplicar algunas de las siguientes transformaciones:
Seleccionar slo ciertas columnas para su carga (por ejemplo, que las
columnas con valores nulos no se carguen).
Traducir cdigos (por ejemplo, si la fuente almacena una "H" para Hombre y "M"
para Mujer pero el destino tiene que guardar "1" para Hombre y "2" para Mujer).
Codificar valores libres (por ejemplo, convertir "Hombre" en "H" o "Sr" en "1").
Obtener nuevos valores calculados (por ejemplo, total_venta = cantidad *
precio).
Unir datos de mltiples fuentes (por ejemplo, bsquedas, combinaciones, etc.).
Calcular totales de mltiples filas de datos (por ejemplo, ventas totales de cada
regin).
Generacin de campos clave en el destino.
Transponer o pivotar (girando mltiples columnas en filas o viceversa).
Dividir una columna en varias (por ejemplo, columna "Nombre: Garca, Miguel";
pasar a dos columnas "Nombre: Miguel" y "Apellido: Garca").
La aplicacin de cualquier forma, simple o compleja, de validacin de datos, y la
consiguiente aplicacin de la accin que en cada caso se requiere:

38

Datos OK: Entregar datos a la siguiente etapa (Carga).


Datos errneos: Ejecutar polticas de tratamiento de excepciones (por ejemplo,
rechazar el registro completo, dar al campo errneo un valor nulo o un valor
centinela).
Carga. La fase de carga es el momento en el cual los datos de la fase anterior
(transformacin) son cargados en el sistema de destino. Dependiendo de los
requerimientos de la organizacin, este proceso puede abarcar una amplia
variedad de acciones diferentes.
Existen dos formas bsicas de desarrollar el proceso de carga:
Incremental: Se utiliza cuando nicamente se carga informacin nueva o
informacin que necesita ser actualizada.
AL (Trunc and Load): Limpia el repositorio de datos y carga la informacin de
nueva cuenta.
Caractersticas de aplicaciones para usuarios finales. En los pasos
explicados anteriormente, se ha analizado el diseo e implementacin; ahora se
profundizar ms en el front room.
El objetivo del front room es proporcionar la interfaz que mostrar al usuario
reportes y anlisis multidimensionales que tomar como base en la toma de
decisiones.
Una aplicacin de usuario final, provee un diseo y estructura a los reportes
tomando como base los datos del DWH.
Minera de datos en las Bodegas de datos. Es una categora de herramientas
de anlisis Open-end. En vez de hacer preguntas, se toma estas herramientas y
se pregunta por algo interesante una agrupacin peculiar, por ejemplo. El
proceso de minera de datos extrae los conocimientos guardados o informacin de
la Bodega de datos sin requerir preguntas especificas. Las herramientas de
minera usan algunas de las tcnicas de computacin ms avanzadas para
generar modelos y asociaciones de redes neuronales, deteccin de desviacin
entre otros.
Las tcnicas utilizadas anteriormente se definen de la siguiente forma:
Redes Neuronales: este paradigma de aprendizaje est inspirado en la forma
en que funciona el sistema nervioso de los animales. Y consiste en un sistema de
interconexin de neuronas de una red que producen un estimulo de salida.

39

Regresin Lineal: es la ms rpida, eficaz y utilizada para formar relaciones


entre datos.
Arboles de decisin: es un modelo de prediccin utilizado en la Inteligencia
Artificial, de donde una base de datos se pueden construir diagramas de
construccin lgicos
Modelos estadsticos: es una expresin simblica en forma de igualdad o
ecuacin que se emplean en los diseos experimentales y en la regresin para
identificar los factores que modifican la variable de respuesta. 16
Toma de decisiones en las Bodegas de datos. Las bodegas de datos estn
orientadas a la toma de decisiones. Ya que almacena datos de acuerdo a clases
de forma que puedan favorecer el anlisis de los datos, el anlisis histrico, est
listo para ser utilizado mediante herramientas especificas que permiten hacer una
extraccin de informacin adecuada y diferentes patrones de comportamiento que
estn ocultos en un gran repositorio de datos.
Base de datos multidimensional OLAP. Las primeras soluciones OLAP (On
Line Analytical Processing), estaban basadas en bases de datos
multidimensionales. Un cubo estructural almacena los datos para que se puedan
manipular automticamente y ver las asociaciones a travs de dimensiones
mltiples pero est limitado de la siguiente manera:
Las nuevas estructuras de almacenamiento de datos requieren bases de datos
propietarias.
La segunda limitacin se encuentra en el desarrollo de una estructura de datos.
Las compaas almacenan los datos de la empresa en bases de datos
relacionales, lo que significa que se debe realizar una extraccin, transformacin y
carga de los datos en un hipercubo
Especificacin de aplicaciones para usuario finales. Hay algunos pasos
importantes en el proceso de especificacin de las aplicaciones de usuario final:

Determinar el conjunto inicial de plantillas de reportes


Determinar la navegacin en los reportes.
Determinar el estndar de plantillas de reportes.
Determinar la especificacin de estas plantillas.

16

WIKIPEDIA. Mineria de datos, [En lnea].Modificado en Noviembre de 2010, [24 de Noviembre de 2010].Disponible en
la Web: http://es.wikipedia.org/wiki/Miner%C3%ADa_de_datos#T.C3.A9cnicas_de_miner.C3.ADa_de_datos

40

Mantenimiento y crecimiento de un data warehouse. Administracin del


entorno de Data Warehouse. Cuando una empresa adquiere sus sistemas de
informacin el cambio que tendrn estos sistemas es muy poco, sin embargo
cuando se desarrolla un proyecto de DWH se debe pensar en el mantenimiento
posterior a la implementacin, pues estas aplicaciones tienen gran tendencia a
crecer a medida que crece la informacin de la organizacin.
La inversin en el mantenimiento del DWH es bastante importante, sin embargo
estas aplicaciones retornan la inversin que se les hace.
2.4

MARCO LEGAL

Las bodegas de datos manejan informacin histrica de una empresa y la mayora


de ellas contienen datos sensibles y confidenciales en los que se pueden
encontrar registros de proveedores y clientes, estos datos pueden ser utilizados
para fines delictivos o tambin para realizar diferentes daos equipos de computo
de una empresa, por tal motivo se hace necesario tener en cuenta las siguientes
leyes y artculos.
Tabla 1. Marco legal

LEY O ARTICULO
Ley 1273

DESCRIPCIN
El 5 de enero de 2009, el Congreso de
la Repblica de Colombia promulg la
Ley 1273 Por medio del cual se
modifica el Cdigo Penal, se crea un
nuevo bien Ley 1273 jurdico tutelado
denominado De la Proteccin de la
informacin y de los datos- y se
preservan integralmente los sistemas
que utilicen las tecnologas de la
informacin y las comunicaciones, entre
otras disposiciones.

Artculo 269A: ACCESO


ABUSIVO A UN
SISTEMA INFORMTICO

El que, sin autorizacin o por fuera de lo


acordado, acceda en todo o en parte a
un sistema informtico protegido o no
con una medida de seguridad, o se
mantenga dentro del mismo en contra
de la voluntad de quien tenga el
legtimo derecho a excluirlo, incurrir en
pena de prisin de cuarenta y ocho (48)
a noventa y seis (96) meses y en multa
de 100 a 1000 salarios mnimos legales

41

mensuales vigentes.
Artculo 269C:
INTERCEPTACIN DE
DATOS INFORMTICOS

El que, sin orden judicial previa


intercepte datos informticos en su
origen, destino o en el interior de un
sistema informtico, o las emisiones
electromagnticas provenientes de un
sistema informtico que los trasporte
incurrir en pena de prisin de treinta y
seis (36) a setenta y dos (72) meses.

Artculo 269D: DAO


INFORMTICO

El que, sin estar facultado para ello,


destruya, dae, borre, deteriore, altere o
suprima datos informticos, o un
sistema de tratamiento de informacin o
sus partes o componentes lgicos,
incurrir en pena de prisin de cuarenta
y ocho (48) a noventa y seis (96) meses
y en multa de 100 a 1000 salarios
mnimos legales mensuales vigentes.

Artculo 269F:
VIOLACIN DE DATOS
PERSONALES.

El que, sin estar facultado para ello, con


provecho propio o de un tercero,
obtenga, compile, sustraiga, ofrezca,
venda, intercambie, enve, compre,
intercepte, divulgue, modifique o
emplee cdigos personales, datos
personales contenidos en ficheros,
archivos, bases de datos o medios
semejantes, incurrir en pena de prisin
de cuarenta y ocho (48) a noventa y
seis (96) meses y en multa de 100 a
1000
salarios
mnimos
legales
mensuales vigentes.

Artculo 269I: HURTO


POR MEDIOS
INFORMTICOS Y
SEMEJANTES

El que, superando medidas de


seguridad
Informtica,
realice
la
conducta
sealada en el artculo 239[3]
manipulando un sistema informtico,
una red de sistema electrnico,
telemtico u otro medio semejante, o
suplantando a un usuario ante los
sistemas de autenticacin y de

42

autorizacin establecidos, incurrir en


las penas sealadas en el artculo 240
del Cdigo Penal [4], es decir, penas de
prisin de tres (3) a ocho (8) aos.
Fuente: Pagina Web www.informatica-juridica.com

2.5

17

MARCO TECNOLGICO

En el siguiente marco tecnolgico se identifican las herramientas para el diseo y


desarrollo de la bodega de datos de la empresa Saln del Automvil, que es la
utilizada en algunas empresas por traer todo integrado en un nico programa
como es SQL Server 2008.
2.5.1 Herramienta de desarrollo
Microsoft SQL server 2008. Una plataforma que permite el anlisis y la
administracin de datos empresariales con herramientas de Inteligencia de
Negocios, anlisis, reporteo, integracin y notificacin integradas. Provee de
mayor escalabilidad, disponibilidad y seguridad al tiempo que simplifica la
creacin, implementacin y gestin de aplicaciones altamente disponibles y de
buen desempeo.
Microsoft SQL Server 2008 es un sistema para la gestin de bases de datos
producido por Microsoft basado en el modelo relacional. Sus lenguajes para
consultas son T-SQL y ANSI SQL. Microsoft SQL Server constituye la alternativa
de Microsoft a otros potentes sistemas gestores de bases de datos como son
Oracle o MySQL.
Soluciones de Inteligencia de Negocios. SQL ofrece funcionalidades de
Inteligencia de Negocios (Business Intelligence) con altos estndares, permitiendo
que pueda obtener mayor ventaja de los datos almacenados en la organizacin.
Caractersticas
Soporte de transacciones.
Escalabilidad, estabilidad y seguridad.
Soporta procedimientos almacenados.
Incluye tambin un potente entorno grfico de administracin, que permite el
uso de comandos DDL y DML grficamente.

17

INFORMATICA JURIDICA. Republica de Colombia, [En Lnea].[18 Septiembre de 2010]. Disponible en:
http://www.informatica-juridica.com/legislacion/colombia.asp

43

Permite trabajar en modo cliente-servidor, donde la informacin y datos se


alojan en el servidor y los terminales o clientes de la red slo acceden a la
informacin.
Adems permite administrar informacin de otros servidores de datos. 18
2.6

MARCO GEOGRFICO

La empresa Saln del Automvil se encuentra ubicada en la direccin Cra 15 N 8


- 73 en el barrio La Estanzuela en la Localidad Los Martires de la ciudad de
Bogot (Colombia).

Figura 5. Mapa por localidades Bogot

Fuente: Pagina Web www.bogotamiciudad.com

19

18

WIKIPEDIA. Microsoft SQL Server, [En lnea].Modificado en Septiembre de 2010, [18 de Septiembre de
2010].Disponible en la Web: http://es.wikipedia.org/wiki/Microsoft_SQL_Serve
19

BOGOT MI CIUDAD. Imagen de Bogot.


http://www.bogotamiciudad.com/Directorio/Detalles.aspx

[18

44

Septiembre

de

2010].

Disponible

en

la

Web:

3. DISEO METODOLGICO

3.1

TIPO DE INVESTIGACION

Cualitativo. Realizar una investigacin a la empresa que se podr hacer con


entrevistas realizadas al personal encargado de ventas. Por otra parte otra
investigacin estar basada en los tipos de tecnologas asociadas a Bodegas de
datos buscando las mejores alternativas para la aplicabilidad de la empresa,
sabiendo la necesidad ms importante por parte de la misma, ya que esta requiere
avances siendo este un punto de partida para poder encontrarnos en un campo de
bsqueda muy detallado como en este caso.
En el proyecto se utilizara la metodologa de Ralph Kimball y a continuacin se
describe el ciclo de vida de desarrollo para bodegas de datos.
Planeacin del Proyecto. Es el comienzo del ciclo de vida para el desarrollo
del proyecto aqu es donde se le asigna un nombre a la bodega de datos. Luego
se identifican los roles que pueden ser cubiertos por los integrantes del grupo y
cada uno de ellos puede desempear uno o varios roles, dependiendo del tamao
del proyecto.
Se pueden identificar diferentes roles como por ejemplo: Patrocinador del negocio,
Gerente del proyecto, lder del proyecto, analista de sistemas, Modelador de
datos, entre otros.
Definicin de Requerimientos del Negocio. Los requerimientos del Negocio
son la gua para que al equipo de desarrollo tome las mejores decisiones
estratgicas para el proyecto, tambin en esta etapa se describe los temas sobre
la aplicacin, el diseo de la bodega de datos y la forma de presentar los
indicadores claves de rendimiento en las pantallas de los usuarios. Se describe el
proceso de entrevistar a los representantes empresariales y del rea de
Tecnologa, se categorizan las necesidades del negocio y el trabajo con la alta
direccin para dar prioridad en el proyecto.
Modelamiento Dimensional. Esta etapa se realiza el modelado dimensional
mediante el proceso de disear un modelo de negocio de dimensiones. Esta fila
central de la seccin del ciclo de vida se centra en los datos, de ah se le asigna el
nombre de Pista de datos. El objetivo principal de la pista de datos es asegurarse
que los usuarios puedan obtener los datos que necesitan para satisfacer las
necesidades actuales de negocio. Tambin se puede encontrar en esta etapa la
descripcin de los hechos, las dimensiones y otros conceptos bsicos.

45

Diseo Arquitectura Tcnica y Seleccin de Herramientas e instalador. En


los sistemas de informacin la definicin de una arquitectura permite hacer un
desarrollo ms confiable y eficiente. Despus de realizar esta definicin se mejora
la comunicacin entre varias reas del proyecto.
En estas etapas, se describe la arquitectura y la seleccin de productos para la
bodega de datos de datos de Microsoft / Business Intelligence del sistema. Ya
que Microsoft SQL Server 2008 ofrece suficientes componentes de software para
escoger en el desarrollo de la bodega de datos.
Diseo Fsico. Lo ms importante del diseo fsico de la base de datos
relacional de almacenamiento es tener la posibilidad de que la tabla de hechos
pueda ser particionada. En la herramienta de Microsoft se pueden realizar
particiones de tablas a gran escala para la bodega de datos. En esta etapa se
plantea los problemas de diseo fsico agregado, la puesta en escena y las tablas
de metadatos. Tambin es conocido como etapa de construccin y consiste en
formar los diseos lgicos de la fase anterior.
Diseo de Capa de datos intermedia y desarrollo. En esta etapa se empieza
a manejar la herramienta Integration Services de Microsoft SQL Server, en donde
se realiza todo el proceso de ETL (Extraccin, Transformacin y Carga) de los
datos. Se empieza con la planificacin de alto nivel, se toman algunas decisiones
en todo el sistema acerca de cmo abordar diversos asuntos y luego se realiza un
anlisis exhaustivo de los datos de origen. Despus de realizar todo esto se
empieza a configurar el sistema ETL, reuniendo suficiente informacin y tomando
decisiones adecuadas para la hacer un sistema detallado de ETL.
Desarrollo aplicacin usuario final. Cada usuario de la bodega de datos
tendr acceso a las aplicaciones y los informes estndar. Despus de trabajar a
travs del diseo de base de datos, los requisitos de sistema de ETL, OLAP y
diseo de bases de datos, generan una creacin de informes ms fcil. Mediante
el Reporting Services de Microsoft se puede generar dichos informes y con mayor
detalle. Aqu es donde se empiezan a generar los primeros informes estndar,
segn los requerimientos del negocio propuestos y ya planeados al comienzo de
la bodega de datos.
Administracin del Proyecto Aseguramiento de la Calidad. En esta etapa
se realiza un proceso de sistema est llevando un control adecuado y que se
cumpli con los requisitos acciones planificados y sistematizados, para poder
demostrar a la empresa que el del negocio. Adems aqu es donde se demuestra
que las necesidades expuestas por el cliente o empresa estn siendo satisfechas
adecuadamente.

46

Montaje y Puesta en marcha. Esta es la etapa en la que se hace la


implementacin de la bodega de datos, aqu es donde se hace la revelacin a la
empresa sobre todo el proceso que se llevo para la construccin y desarrollo de la
Bodega de datos. Es fundamental cumplir a cabalidad los requerimientos del
negocio para que ha primera impresin influya fuertemente en la aceptacin del
sistema. Como cualquier gran evento, hay un montn de detalles que hay que
tener presentes para que el programa tenga xito.
Mantenimiento y evolucin. Esta etapa se puede realizar despus de que se
ha implementado el sistema en la empresa, aqu es donde se empiezan hacer las
correcciones a los errores que presenta el sistema, se realiza mantenimiento del
mismo y se verifica como ha sido su proceso despus de la puesta en marcha o
implementacin.

47

4. DESARROLLO METODOLGICO
4.1 PLANEACIN DEL PROYECTO
Planeacin y Administracin del proyecto. El proyecto est dirigido a las
empresas Saln del Automvil la cual su objeto social es la venta de repuestos
automotrices. Para este caso se ha escogido el escenario de demasiada demanda
de informacin, porque la empresa a travs de los aos ha guardado sus datos
pero sin darle un uso adecuado para el mejoramiento de la toma de decisiones.
Estos datos que se van a manejar dentro del proyecto fueron suministrados por el
gerente General de la compaa, el cual nos brindo su apoyo para la realizacin
de este.
De acuerdo a Ralph Kimball existen cinco factores que deben existir en una
organizacin para iniciar un proyecto de bodega de datos:
Patrocinio de la gerencia del negocio. Contamos con el aval del Gerente
General de la compaa el cual tiene una visin del mejoramiento de su empresa
con el modelamiento de una bodega de datos.
Motivacin del negocio. La empresa Saln del Automvil es consciente que al
tener un modelo de una bodega de datos como parte de la organizacin esta le
brindara una gran ayuda a la hora de tomar decisiones que le permitan tener un
mayor crecimiento en el mercado.
Acompaamiento del departamento de Tecnologa. La empresa Saln del
Automvil cuenta con una persona encargada del rea de tecnologa la cual nos
brindara su apoyo en caso de ser necesitado.
Presencia de cultura analtica. Por medio de la bodega de datos la empresa
tendr una gran ayuda que le permitir que las decisiones tomadas sean
determinantes y recompensadas para el negocio.
Factibilidad. La empresa Saln del Automvil cuenta con la informacin
detallada para la realizacin de la Bodega de datos.
Luego de haber determinado la factibilidad en la empresa Saln del Automvil en
la elaboracin de una bodega datos, se mirara el enfoque que esta tendr:
El enfoque inicial del proyecto, ser determinar cules son los clientes
mayoristas de la empresa.
Manejaremos inicialmente una sola fuente de datos la cual nos suministro la
empresa Saln del Automvil.
48

En la bodega de datos tendr acceso completo el Gerente General de la


empresa Saln del Automvil
Planeacin del Proyecto. El proyecto se le dio como nombre PROTOTIPO
DE UNA BODEGA DE DATOS PARA LA EMPRESA SALN DEL AUTOMVIL.
Los roles que se identificaron en el proyecto son:
Tabla 2. Descripcin Roles

Responsabilidad
Proporcionar las diferentes herramientas
y conceptos de
organizacin, que se requieran durante el desarrollo del proyecto
partiendo de una base terica.
Velar por las actividades y cumplimiento ptimo del cronograma
establecido, involucrando al equipo de trabajo y las diferentes
tareas proporcionados al hito de cada entrega de las fases y
metodologa propuesta.
Responsabl Coordinar de forma precisa cada actividad correspondiente al
e de rea cronograma, proporcionando las posibles herramientas logsticas
(Administra requeridas para el xito de la etapa y sus actividades.
dor
del
proyecto)
Coordinar cada recurso tcnico, e incorporarlo con las etapas de la
Lder
metodologa establecida, cumpliendo con las entregas de carcter
tcnico
funcional del Datamart y su arquitectura
Evaluar de forma continua la solucin presentada por el lder
Lder
tcnico, para el tener un producto de alta calidad, estando en
usuario
constante comunicacin con el cliente final
Desarrollo total del proyecto en constante comunicacin con el
rea
lder funcional. Actividades como Administrador de Bases de Datos
desarrollo
y arquitectura del Datamart.
Comunicacin con el cliente final y manejo de la herramienta, para
rea
presentacin de reportes financieros.
usuaria
Rol
Patrocinad
or
del
Proyecto
Gerente del
proyecto

Fuente: Autores

49

Los responsables del los roles expuestos anteriormente estn asignados de la


siguiente manera:
Tabla 3. Asignacin de Roles

Rol
Patrocinador del Proyecto
Gerente del proyecto
Responsable
de
rea
(Administrador del proyecto)
Lder tcnico
Lder usuario
rea desarrollo
rea usuaria

Asignado a
Saln del Automvil
Andrs Pineda Savita
Wilmer Torres Gonzlez
Andrs Pineda
Gonzlez
Andrs Pineda
Andrs Pineda
Gonzlez
Wilmer Torres

Savita

Wilmer

Torres

Savita

Wilmer

Torres

Fuente: Autores

Desarrollo Cronograma de actividades. Se analizara el orden de las


actividades, su duracin, los requisitos de recursos y las restricciones, la
incorporacin de actividades genera un cronograma con fechas planificadas para
completar las actividades del proyecto, donde se determinaran las fechas de inicio
y finalizacin planificadas y los hitos.
Para generar el cronograma implementaremos el mtodo de la Cadena Critica,
que es una tcnica de anlisis de la red del cronograma que permite modificar el
cronograma para adaptarlo a los recursos limitados, inicialmente el diagrama del
cronograma se elaborara mediante los estimados de la duracin del proyecto.
Se utilizan los diagramas de barras para representar la duracin de las
actividades, estos determinaran las fechas de inicio y finalizacin de las
actividades, se implementa este tipo de diagramas porque son fciles de leer y de
interpretar.

50

Figura 6. Cronograma de actividades

Fuente: Autores

Controlar el cronograma. Se realizara el seguimiento del estado del proyecto


para actualizar el avance y realizar cambios a la lnea base del cronograma. Se
requiere gestionar los cambios reales a medida que estos se van presentando.
Tabla 4. Actividades de gestin de costos

Actividad

frecuencia responsable

Determinar el estado actual del cronograma

semanal

Andres Pineda

Realizar un anlisis de los factores que semanal


generaran cambios en el cronograma

Andres Pineda

Realizar control integrado de cambios: revisin Cuando se Andres Pineda


de informes de avance, solicitudes de cambio, requiera
revisin y tratamiento de estas solicitudes.

51

Reunin de seguimiento, informe del avance del diario


proyecto, actividades iniciadas, su avance y
actividades terminadas

Wilmer Torres

Revisar el desempeo del cronograma: fechas Semanal


reales de inicio y finalizacin, porcentaje
completado, duracin, estado de cronograma,
acciones preventivas o correctivas, etc.

Andres Pineda

Fuente: Autores

Plan de gestin de costos. Se estimara una aproximacin de los recursos


monetarios necesarios para completar las actividades del proyecto. Esta
estimacin se refinara durante el transcurso del proyecto para reflejar los detalles
de costo a medida que se presentan en cada fase del ciclo de vida del proyecto.
Los costos se estiman por cada recurso que se asigna al proyecto, recursos
como el trabajo, los materiales, el equipo, los servicios y las instalaciones.
Para la estimacin de costos se realiza una evaluacin cuantitativa de los
costos probables de los recursos necesarios para completar cada una de las
actividades descritas en el cronograma de actividades.
Se determinara la disponibilidad y cantidades necesarias de personal y material
requeridos.
Se determinaran los recursos humanos, atributos
compensaciones o reconocimientos correspondientes.

como

salarios,

Se determinaran los costos de mitigacin de riesgos, cuando se presenta un


evento negativo, se incrementa el costo a corto plazo.
Estimacin de costos por analoga, se realiza una estimacin teniendo en
cuenta el costo del alcance, el presupuesto disponible para el proyecto y la
duracin.
Tabla 5. Actividades control de cronograma

Actividad

frecuencia responsable

El equipo de trabajo y los interesados en el semanal


proyecto acordar reuniones para evaluar de
forma cuantitativa los costos de cada fase del
proyecto, teniendo en cuenta la especificacin
de actividades y requisitos.

52

Andres Pineda

Realizar documentacin de los fundamentos de semanal


las estimaciones: Supuestos, restricciones.
Realizar la suma del costo estimado para cada
actividad dentro de una fase del proyecto para
realizar una aproximacin por cada etapa del
proyecto
Entrevista con el patrocinador del proyecto la
Seora Ibon para determinar el presupuesto del
proyecto, teniendo la suma total de costos por
fase.
Revisar el registro de riesgos para tener
presente el estimado de costos de litigacin de
riesgos

Wilmer Torres

Cuando se Wilmer Torres


requiera

Cuando se Andres Pineda


requiera

semanal

Wilmer Torres

Actualizacin del cronograma del proyecto, Semanal


informacin de los recursos asignados a cada
fase.
Realizar control integrado de cambios: revisin semanal
de informes de avance, solicitudes de cambio
en costo y presupuesto, revisin y tratamiento
de estas solicitudes.

Andres Pineda

Andres Pineda

Fuente: Autores

4.2 DEFINICIN DE REQUERIMIENTOS DE NEGOCIO


Anlisis de requerimientos. Para el levantamiento de requerimientos se
realizaron entrevistas a personas del rea tcnica y de negocio de la empresa, se
identificaron los requerimientos que este proyecto iban abarcar y lo que se podra
hacer con el anlisis y el diseo de la bodega de datos para la empresa Saln del
Automvil
Levantamiento de informacin. Para el levantamiento de informacin es
importante conocer que la empresa Saln del Automvil pertenece al rea
automotriz, como primera instancia se realizo una entrevista con la Gerente
General la Sra. Verna Ivonn Vera Monroy, la cual nos manifest la necesidad de
poder darle una mejor utilidad a la informacin almacenada por la empresa, ya que
actualmente esta no posee ninguna aplicacin o herramienta que le brinde apoyo
para el mejoramiento de la toma de decisiones.
Una vez analizada la informacin dada, la empresa Saln del Automvil nos brindo
un archivo en Excel donde encontrbamos datos histricos del ao 2009 con la
fecha, tipo de pago, cliente y ciudad (ver Figura 7), para as empezar a realizar un

53

estudio de cmo poder ayudar a ese mejoramiento que desea la empresa Saln
del Automvil. Esta informacin fue complementada con las facturas fsicas de
cada uno de los meses del ao 2009, que nos permiti obtener los productos
vendidos a cada uno de los clientes.
Figura 7. Origen de Datos

Fuente: Autores

En la figura 7 se encuentra la informacin relacionada a las ventas de la empresa


saln del automvil.
Los requerimientos del negocio se describen a continuacin:

Ver ventas por cliente


Ver ventas por productos
Ver ventas por tiempos
Ver ventas de productos por cliente
Ver ventas por cliente en el tiempo
Ver ventas por ciudad
Ver ventas por tipo de cliente

Estos requerimientos fueron acordados con la empresa para su anlisis y diseo


de la bodega de datos, todos estos soportados con datos encontrados en la base
de datos facilitada por la empresa Saln del Automvil (ver Tabla 6.Descripcin de
Requerimientos).

54

A continuacin se presenta la descripcin de los requerimientos definidos


conjuntamente con la empresa
Tabla 6. Descripcin Requerimientos

Nombre
del Descripcin
Fuente de datos
requerimiento
Ventas
por Esta consulta permite explorar el valor
de las ventas del Saln del Automvil,
cliente
discriminando estas ventas por sus
sectores de clientes. Al hacer drill down
se exploran las ventas por clientes
individuales.
Ventas
por Esta consulta permite explorar el valor
de las ventas del Saln del Automvil,
productos
discriminando estas ventas por sus
lneas de productos. Al hacer drill down
se exploran las ventas por productos
individuales
Ventas
por Esta consulta permite explorar el valor Base de datos
de las ventas del Saln del Automvil, Salondelautomovil
tiempos
discriminando estas ventas por las
fechas de venta. Al hacer drill down se
limita ms el criterio del reporte,
permitiendo analizar las ventas por ao,
semestre, trimestre y da.
Ventas
de Se muestran las ventas que se han
productos
por hecho a los clientes con sus respectivos
productos.
cliente
Ventas
cliente
tiempo
Ventas
ciudad

en

por Permite visualizar las ventas hechas a


el clientes en perodos de tiempos.

por Se muestran las ventas que se han


realizada en las diferentes ciudad que la
empresa vende sus productos

Ventas por tipo Permite observar que tipo de gnero


compra mas los productos de la
de clientes
compaa
Fuente: Autores

55

4.3 DISEO ARQUITECTURA TCNICA


Esta es la arquitectura propuesta para la bodega de datos Saln del Automvil,
donde se utilizan las herramientas de Microsoft SQL Server 2008
Figura 8. Diseo Arquitectura Tcnica

Fuente: Autores

Archivo Excel. Este es el documento origen de los datos proporcionados por la


empresa Saln del Automvil, donde se encuentra la fecha, Nit de la empresa,
nombre de la empresa, referencia producto, nombre del producto, valor, medio de
pago, departamento y ciudad.
Integration Services. Esta herramienta realiza todo el proceso ETL (extraccin,
Transformacin y carga) de los datos para las diferentes dimensiones de la
bodega de datos.
Analysis Services. Esta herramienta almacena los datos de forma
multidimensional, a travs de tabla de hechos y tablas dimensionales, transforma
e integra los datos fuente en un modelo adecuado para la toma de decisiones.
Reporting Services. Este recopila la informacin almacenada generando
informes y reportes que muestran los resultados esperados por la empresa Saln
del Automvil.

56

Usuarios: Son los encargados de tomar las decisiones y planificar las


actividades del negocio, a travs de las herramientas de consulta y anlisis las
cuales exploran los datos en bsqueda de mejores resultados.
4.4 SELECCIN DE HERRAMIENTAS E INSTALADOR
Se escoge la herramienta de Microsoft SQL Server 2008 por varias razones como
son:
Integridad. Desde el sistema operativo los motores de base de datos y entorno
de desarrollo para el escritorio de Office y Excel, se pueden crear Bodegas de
datos completas con solo utilizar el software de Microsoft.
Bajo costo de licenciamiento. Los costos de licenciamiento son muy bajos a
comparacin de otros aplicativos porque en un solo paquete incluye todos los
componentes y herramientas necesarias para el desarrollo de una bodega de
datos
Alto rendimiento. Mayor estabilidad y capacidad para los cambios que se
deseen realizar en los datos almacenados, cambio de hardware que se vayan a
realizar.
4.5 MODELAMIENTO DIMENSIONAL
Para el proyecto que actualmente se est desarrollando el modelo que se va a
utilizar va a ser el modelo de estrella, ya que es uno de los ms simple y utilizado
en las bodegas de datos. Este modelo consiste en una tabla de hechos rodeada
por dimensiones y forman una estructura que permite implementar mecanismos
bsicos para poder utilizar una herramienta de consulta OLAP.
Este Modelamiento ser desarrollado segn los requerimientos del negocio
expuestos anteriormente, mediante mutuo acuerdo con la empresa Saln del
Automvil y consiste en realizar una bodega de datos para los clientes mayoristas
de la empresa.
Preguntas de Negocio
Cules son los diez clientes mayoristas de la empresa?
Cules son los productos ms comprados por los clientes mayoristas?
En qu fecha los clientes realizan mayores compras?

57

Cul es el monto promedio de compra de los clientes mayoristas?


Cul es la ciudad que tiene ms demanda con los productos de la compaa?
Cul es la opcin ms escogida por los clientes para pagar los productos
adquiridos?
Dentro de los clientes mayoristas cul es el tipo de gnero que mas compra
los productos?
4.6 DISEO CONCEPTUAL
Los datos relacionados a continuacin son tomados del archivo de Excel
proporcionado por la empresa. Se empieza con la forma no normalizada de los
datos como se muestran en los siguientes pasos.
Forma No normalizada. En esta forma se describen los datos bsicos tomados
de la factura de compra y el archivo de Excel.

Fecha. Fecha en la que se realizo la venta


Nit. Nit del Proveedor al que se realizo la venta
Nombre Empresa. Nombre del cliente
Referencia. Numero asignado al producto
Producto. Nombre del Producto
Tipo. Nombre del tipo del producto
Marca. Nombre de la marca del producto
Medio de pago. Medio en el que pago el cliente
Departamento. Departamento en la que se realizo la venta
Ciudad. Ciudad en la que se realizo la venta
Localidad. Localidad en la que se realizo la venta
Cdigo de la Localidad. Valor numrico para la localidad
Valor. Valor total de la compra del cliente
Sexo. Sexo de la persona que realiza la compra
Edad. Valor que indica la edad
Nivel Econmico. Nivel que se encuentra el comprador
Primera Forma Normal. Se separa el grupo repetitivo

58

Tabla 7. Grupo Repetitivo

Grupo NO repetitivo
IDProducto
Nit
Valor
Nivel_Economico
Fecha
Nombre Empresa
Medio de Pago
Departamento
Ciudad
Localidad
Cod_Localidad
Sexo
Edad

Grupo Repetitivo
Producto
Tipo
Marca
Referencia

Fuente: Autores

El Producto, Tipo, Marca y Referencia, pueden aparecer en la misma factura


varias veces por tal motivo es separa del primer grupo obteniendo la primera
forma normal as:
Tabla 8. Primera Forma Normal

Grupo 1
IDProducto
Nit
Valor
Nivel_Economico
Referencia
Fecha
Nombre_Empresa
Medio de Pago
Departamento
Ciudad
Localidad
Cod_Localidad
Sexo
Edad

Grupo 2
IDProducto
Producto
Tipo
Marca

Fuente: Autores

59

Segunda Forma Normal. Separar dependencias de las llaves compuestas. Se


analizan los grupos de datos con llaves combinadas, as formando la segunda
forma normal de la siguiente manera.
Tabla 9. Segunda Forma Normal

Grupo 1
IDProducto
Nit
Valor
Nivel_Econ
omico

Grupo 2
IDProducto
Producto
Referencia
Tipo
Marca

Grupo 3 Grupo 4
IDTiempo IDClient
Fecha
e
Nombre
_Empres
a
Sexo
Edad

Grupo 5
IDTransaccio
n
Medio
de
Pago

Grupo 6
IDDepartament
o
Departamento
Ciudad
Localidad
Cod_Localidad

Fuente: Autores

Esto se realiza para que en caso de que se requiera incluir un dato por ejemplo
que un producto se repita 50 veces en diferentes facturas solo se tendra que
incluir en la tabla del Grupo 2 un solo registro. Hasta aqu ya se pueden ver la
estructura de las Dimensiones (Dim.) de la Bodega de datos
Tabla 10. Segunda Forma Normal

Grupo 1

Dim. 1

Dim. 2

Dim. 3

IDProduct
o
Nit
Valor
Nivel_Eco
nomico

IDProducto
Producto
Referencia
Tipo
Marca

IDTiempo IDCliente
Fecha
Nombre
Empresa
Sexo
Edad

Dim. 4

Dim. 5

IDTransaccion IDDepartamento
Medio de Pago Departamento
Ciudad
Localidad
Cod_Localidad

Fuente: Autores

De las dimensiones que se crearon se pueden crear otras tablas como son las
siguientes:

60

Tabla 11. Segunda Forma Normal

Dim. 1

Dim. 6

Dim. 7

IDProducto
Nombre
Referencia
IDTipoProducto

IDTipoProducto
Tipo

IDMarca
Nombre

Fuente: Autores

Tabla 12. Segunda Forma Normal

Dim. 3

Dim 8

Dim 9

IDCliente
Nombre_Empresa
IDSexo
IDEdad

IDSexo
Sexo

IDEdad
Edad

Fuente: Autores

Tabla 13. Segunda Forma Normal

Dim. 5

Dim 10

IDDepartamento IDCiudad
Nombre
Nombre
IDLocalidad
IDCiudad

Dim 11
IDLocalidad
Nombre
Codigo

Fuente: Autores

Tercera Forma Normal. Examinar las interdependencias entre los campos.


Luego de analizar todas las tablas se encuentra que la tabla de Hechos es
dependiente de las dems por tal motivo se hace necesario crear las llaves

61

forneas en dicha tabla. As quedan las tablas al finalizar la normalizacin de


datos
Tabla 14. Tercera Forma Normal

Hechos_Ventas

Dim_Producto

Dim_Tiempo

Dim_Cliente

IDProducto
IDTiempo
IDCliente
IDTransaccion
IDDepartamento
Nit
Valor
Nivel_Economico

IDProducto
Nombre
Referencia
IDTipoProducto

IDTiempo
Fecha

IDCliente
Nombre_Empresa
IDSexo
IDEdad

Fuente: Autores

Tabla 15. Tercera Forma Normal

Dim_Tipo_Transaccion

Dim_Departamento

IDTransaccion
Medio de Pago

IDDepartamento
Nombre
IDCiudad

Fuente: Autores

Tabla conceptual. Una vez analizadas las diferentes fuentes de entrada (figura
8) y revisando cada campo del archivo se genero la siguiente tabla conceptual en
la que se crean cinco dimensiones.
Tabla 16. Tabla Conceptual

TABLA CONCEPTUAL
DIMENSION
Tiempo

JERARQUIA
Fecha
Ao
Mes
Da

EJEMPLOS
14/08/09, 10/01/09
2007, 2008, 2009
Enero, Febrero, Marzo...
1, 2, 3, 4, 5, 6, 7...

62

Cliente

Nombre

Sexo
Sexo
Edad
Edad
Departamento Nombre
Ciudad
Localidad
Producto
Tipo
Marca
Tipo
Transaccin

Nombre
Nombre
Codigo
Nombre
Referencia
Tipo
Nombre
Medio de Pago

Multiservicios
Intercambios..

Tecnicar,

Talleres

Masculino, Femenino
18,19,20,21,22 ..
Cundinamarca, Antioquia, Bolivar
Bogota, Medellin, Cali
Suba, Bosa, Kennedy, Engativa
11, 15, 18, 20.
Pistones, Discos, Mangueras
3001, 3002, 3003.
Exportado, Importado
Federal Nogul, Brigestone, Ingersoll Rand
Contado, Crdito

Fuente: Autores

Dim_Producto. Esta tabla es creada con el fin de almacenar los datos que se
encuentran en el archivo Origen como son: Referencia y Nombre del Producto ya
son datos que se encuentran en el Archivo de Excel de la empresa.
Dim_Tipo. Esta tabla es creada para la almacenar los datos del tipo de
producto (Ej: Exportado o Importado)
Dim_Marca. Se creo con el fin de guardar datos de las diferentes empresas
que crean repuestos automotrices y poder alimentarla a diario
Dim_Tiempo. Se crea esta tabla con el fin de almacenar las fechas que
contiene el archivo del Saln del Automvil, adems toda bodega de datos debe
manejar un tiempo en el cual transcurren los eventos en este caso las Ventas de
la empresa.
Dim_Cliente. Esta tabla es creada segn anlisis realizado al archivo en Excel
y almacenara todos los datos relacionados con los clientes de la empresa.
Dim_Sexo. Esta tabla almacena solo los valores relacionados al sexo de la
persona que realiza la compra
Dim_Edad. Esta tabla almacena todos los valores que puedan generar cierta
edad de un cliente
63

Dim_Tipo_Transaccion. En el Archivo se encuentra un campo con el nombre


de Medio de pago y analizando los datos se crea esta tabla para almacenar el tipo
de transaccin de cada cliente.
Dim_Departamento. Se crea esta tabla con el fin de almacenar las principales
Departamentos en las que la empresa est presente, aunque solo por el momento
realice ventas en la capital ya que esta tabla puede servir a futuro en caso de
expansin de la empresa y se requieran ingresar otras ciudades.
Dim_Ciudad. Se crea esta tabla con el fin de almacenar las principales
Ciudades en las que la empresa est presente.
Dim_Localidad. Se crea esta tabla con el fin de almacenar las principales
Localidades de las ciudades y poder segmentar el mercado para futuros
compradores
Con las especificaciones anteriores se estableci para la empresa Salon del
Automvil el siguiente diseo conceptual:
Figura 9. Diseo conceptual

Fuente: Autores

64

Como se observa en la Figura 9, el esquema de copo de nieve es la arquitectura


de bodega de datos utilizada para bsqueda de datos. Este diseo implementa un
esquema lgico relacional de base datos que resulta en que la tabla de hechos
representa la Tercera Forma Normal (3FN) y las dimensiones representan la
Segunda Forma Normal (2FN). En el esquema no se utilizan las tablas en el
modelo relacional todo lo contrario se debe permitir el almacenamiento de
informacin redundante, para optimizar el tiempo de respuesta y dar informacin a
un cliente en menos tiempo posible, La llave primaria de una tabla de hechos est
formada por todas las columnas que corresponden a las dimensiones.
4.7 DISEO LGICO.
Validando archivos de datos de fuente, se presenta el siguiente diseo final para el
prototipo de bodega de datos para la empresa Saln del Automvil.
Dentro del modelo se encuentran las dimensiones Cliente, Departamento,
Producto, Tiempo y Tipo de Transaccin.

Figura 10. Diseo Lgico

Fuente: Autores

65

4.8 DISEO FSICO.


En el siguiente Script se encuentra la creacin de las dimensiones y la tabla
hechos de la Bodega de datos
Figura 11. Creacin de tablas Cliente y Tipo_Transaccion

Fuente: Autores

66

Figura 12. Creacin de tablas Departamento, Producto y Tiempo

Fuente: Autores

67

Figura 13. Creacion de tabla Hechos_Ventas

Fuente: Autores

Se crean las siguientes tablas temporales para poder almacenar los datos de Nit y
Valor y llevarlos a la tabla hechos al momento de hacer el proceso de ETL
Figura 14. Creacion de tablas Temporales

Fuente: Autores

68

Se crea la tabla Temporal de tiempo para que almacene la fecha del archivo de
Excel y poder extraerlo en la dimensin tiempo por da, mes y ao
Figura 15. Creacion de tabla Temporal Tiempo

Fuente: Autores

4.9 DISEO DE CAPAS DE DATOS INTERMEDIA Y DESARROLLO


Se utilizo la herramienta SQL Server Business Intelligencie Development Studio,
esta herramienta cubre muy amplias necesidades de Anlisis de los Datos y de los
Informes empresariales. El entorno principal que se utilizar para desarrollar
soluciones empresariales que incluyan proyectos de Analysis Services, Integration
Services y Reporting Services. Cada tipo de proyecto proporciona plantillas para
crear los objetos necesarios para las soluciones de Business Intelligence y ofrece
varios diseadores, herramientas y asistentes para trabajar con los objetos.
Construccin ETL. Las herramientas de ETL son piezas de software
responsables de la extraccin de datos de varias fuentes, de la limpieza, la
personalizacin y la insercin de los datos en una bodega de datos.
La construccin del ETL se realizara con una plataforma como es Microsoft SQL
Integration Services que permite generar soluciones de integracin de datos que
se incluyen paquetes de extraccin, transformacin y carga (ETL) para el
almacenamiento de datos

69

Proceso ETL para la Dimensin Cliente

Figura 16. Dimension Cliente

Fuente: Autores

Extraccin. La fuente para la Dimensin Cliente se toma de un archivo Excel


localizado en la siguiente ruta: C:\Salon del automvil\ETL\Saln del automvil.xls.
Este archivo tiene 10 atributos en los cuales se encuentra uno de ellos Nombre del
cliente.
Transformacin. Se realiza la transformacin de eliminar datos duplicados y se
ordena por nombre de cliente en forma ascendente.
Figura 17. Propiedades Objeto Ordenar Cliente

Fuente: Autores

Carga. Despus de realizado los procesos de extraccin y transformacin se


carga los datos a la dimensin Cliente (Dim_Cliente).

70

Proceso ETL para la Dimensin Tipo Transaccin


Figura 18. Dimensin Tipo Transaccin

Fuente: Autores

Extraccin. La fuente para la Dimensin Tipo de Transaccin se toma de un


archivo Excel localizado en la siguiente ruta: C:\Salon del automvil\ETL\Saln del
automvil.xls. Este archivo tiene 10 atributos en los cuales se encuentra uno de
ellos Medio de pago.
Transformacin. Se realiza la transformacin de eliminar datos duplicados y se
ordena por Medio de pago en forma ascendente.
Figura 19. Propiedades Objeto ordenar Tipo Transaccin

Fuente: Autores

71

Carga. Despus de realizado los procesos de extraccin y transformacin se


carga los datos a la dimensin Tipo de transaccin (Dim_Tipo_Transaccion).
Proceso ETL para la Dimensin Departamento
Figura 20. Dimensin Departamento

Fuente: Autores

Extraccin. La fuente para la Dimensin Departamento se toma de un archivo


Excel localizado en la siguiente ruta: C:\Salon del automvil\ETL\Saln del
automvil.xls. Este archivo tiene 10 atributos en los cuales se encuentra dos de
ellos y son: Departamento y Ciudad.
Transformacin. Se realiza la transformacin de eliminar datos duplicados y se
ordena por Departamento y Ciudad.
Figura 21. Propiedades Objeto Ordenar Departamento

Fuente: Autores

72

Carga. Despus de realizado los procesos de extraccin y transformacin se


carga los datos a la dimensin Departamento (Dim_Departamento).
Proceso ETL para la Dimensin Producto
Figura 22. Dimensin Producto

Fuente: Autores

Extraccin. La fuente para la Dimensin Producto se toma de un archivo Excel


localizado en la siguiente ruta: C:\Salon del automvil\ETL\Saln del automvil.xls.
Este archivo tiene 10 atributos en los cuales se encuentra dos de ellos y son:
Referencia y Producto
Transformacin. Se realiza una conversin de datos para que se puedan
asignar a la tabla del valor Referencia, luego se hace la transformacin de eliminar
datos duplicados y se ordena por Referencia y Producto.
Figura 23. Propiedades Objeto Ordenar Producto

Fuente: Autores

73

Carga. Despus de haber realizado los procesos de extraccin


transformacin se cargan los datos a la dimensin Producto (Dim_Producto).

Proceso ETL para la tabla temporal Tiempo


Figura 24. Dimensin Temporal Tiempo

Fuente: Autores

Extraccin. La fuente para la tabla Tiempo se toma de un archivo Excel


localizado en la siguiente ruta: C:\Salon del automvil\ETL\Saln del automvil.xls.
Este archivo tiene 10 atributos en los cuales se encuentra uno que es Fecha
Transformacin. Se ordenan los datos de fecha y se realiza una conversin de
datos para la tabla temporal Tiempo (Temp_Tiempo)
Carga. Despus de haber realizado los procesos de extraccin y
transformacin se cargan los datos en la tabla temporal de tiempo (Temp_Tiempo)

74

Proceso ETL para la Dimensin Tiempo


Figura 25. Dimensin Tiempo

Fuente: Autores

Extraccin. La fuente para la Dimensin Tiempo se toma de la tabla


Temp_Tiempo localizada en la Base de datos Ventas_Salon_Automovil. Esta tabla
contiene un atributo con el nombre de Fecha
Transformacin. Se realiza una consulta a la tabla Temp_Tiempo para eliminar
los datos repetidos, para convertir la fecha en da, mes y ao y se organizan por
Fecha.
Figura 26. Propiedades Origen de Tiempo y consulta SQL

Fuente: Autores

75

Carga. Despus de haber realizado los procesos de extraccin


transformacin se cargan los datos en la Dimensin de Tiempo (Dim_Tiempo)

Proceso ETL para la tabla Temp_Nit


Figura 27. Tabla Temporal Nit

Fuente: Autores

Extraccin. La fuente para la tabla Temp_Nit se toma de un archivo Excel


localizado en la siguiente ruta: C:\Salon del automvil\ETL\Saln del automvil.xls.
Este archivo tiene 10 atributos en los cuales se encuentra uno con el nombre de
NIT
Transformacin. Se realiza una conversin de datos para que se puedan
asignar a la tabla el valor, luego se hace la transformacin de eliminar datos
duplicados y se ordena por NIT.

Figura 28. Propiedades Objeto Ordenar Nit

Fuente: Autores

76

Carga. Despus de haber realizado los procesos de extraccin


transformacin se cargan los datos en la tabla temporal Nit (Temp_Nit).

Proceso ETL para la tabla Temp_Valor


Figura 29. Tabla Temporal Valor

Fuente: Autores

Extraccin. La fuente para la tabla Valor se toma de un archivo Excel


localizado en la siguiente ruta: C:\Salon del automvil\ETL\Saln del automvil.xls.
Este archivo tiene 10 atributos en los cuales se encuentra uno con el nombre de
Valor.
Transformacin. Se realiza una transformacin de datos ordenndolos y
eliminando los registros duplicados.
Figura 30. Propiedades Objeto Ordenar Valor

Fuente: Autores

77

Carga. Despus de haber realizado los procesos de extraccin


transformacin se cargan los datos en la tabla temporal Valor (Temp_Valor).
Proceso ETL para la tabla Hechos_Ventas
Figura 31. ETL Hechos Ventas

Fuente: Autores

78

Para poblar la tabla Hechos_Ventas se toma como base el archivo ubicado en


C:\Salon del automvil\ETL\Saln del automvil.xls.
Se realizan las siguientes transformaciones
Ordenar los atributos en la dimensin tiempo por periodo, da, mes y ao.
Se
toman
los
atributos
IDCliente,
IDDepartamento,
IDTiempo,
IDTransaccion,IDProducto de las dimensiones Cliente, Departamento, Tiempo,
Tipo Transaccin respectivamente.
Se ordena la tabla temporal Nit en forma ascendente.
Se realizan la validacin necesaria para agregar nuevos registros en caso de
que se hagan cambios en el archivo de Excel.
Por ltimo se realiza la carga de datos a Hechos_Ventas.
4.10

CUBOS CON MICROSOFT SQL SERVER 2008

Microsoft SQL Server 2008 permite desarrollar soluciones de forma rpida con el
nuevo diseador y el fcil uso del cubo. Adicionalmente se pueden crear
diferentes vistas segn la necesidad de la empresa.
La plataforma de Analysis services que tiene incluido Microsoft SQL Server 2008
permite realizar tareas sencillas desde Business Intelligence Development Studio
durante todo el proceso de desarrollo, adems esta herramienta detecta posibles
problemas de diseo que puedan surgir con notificaciones automticas
proporcionadas por mejor diseo de la prctica alertas.
El siguiente es la vista generada en el Proyecto de Analysis Services
Figura 32. Vista en Analysis Services

Fuente: Autores

79

Cubo Ventas
Figura 33. Cubo Ventas Saln Automvil

Fuente: Autores

Y por ltimo se realiza el proceso de carga de los datos al cubo


Figura 34. Proceso de carga de los Datos al cubo

Fuente: Autores

80

Se pueden organizar los datos de cualquier forma la ms adecuada para la


Bodega de datos
Figura 35. Cubo Cargado con los Datos

Fuente: Autores

81

5. RESULTADOS
Microsoft SQL Server Reporting Services 2008 es una plataforma que est basada
en un servidor diseado para solucionar una variedad de necesidades para las
empresas y generar diferentes informes o reportes segn sus necesidades.
Esta Herramienta ofrece un entorno grafico familiar, con herramientas de fcil uso
y estructuras para informes bien detallados para generar reportes que se adapten
totalmente al gusto y la necesidad de la empresa
Solucin de las preguntas de negocio. El anlisis de las siguientes preguntas
de negocio, fue acordado con el cliente en nuestro caso el rea de las ventas de la
empresa Saln del Automvil, como entrega final del Prototipo realizado.
Cules son los diez clientes mayoristas de la empresa?
Cules son los productos ms comprados por los clientes mayoristas?
En qu fecha los clientes realizan mayores compras?
Por qu medio es cancelado los productos de los clientes mayoristas?
Cul es el monto promedio de compra de los clientes mayoristas?
Cul es la ciudad que tiene ms demanda con los productos de la compaa?
Dentro de los clientes mayoristas cul es el tipo de gnero que mas compra
los productos?

De acuerdo a las anteriores preguntas de negocio, se realiza un anlisis tomando


una muestra de los datos del movimiento de la empresa y se presentan los
siguientes Reportes:
Cules son los diez clientes mayoristas de la empresa?
En el siguiente grafico se muestra los diez clientes que mas adquieren productos
de la empresa Salon del Automovil y segn estos resultados el Cliente Multive
LTDA es el principal mayorista de la empresa como se puede observar en la
Figura 36.

82

Figura 36. Informe Clientes Mayoristas

Fuente: Autores

Tabla 17. Descripcin Clientes Mayoristas

CLIENTES
MULTIVE LTDA
GATE GOURMET COLOMBIA
CORPACERO LTDA
BUSES ARMENIA S.A.
MINCIVIL S.A.
GRAVILLERA ALBANIA
MULTISERVICIOS TECNICARS
ALEGRA ACTIVITY AMERICA
IRAUTOS LTDA
SERVIFORD

Fuente: Autores

83

MEDIDAS
Valor
Tiempo
Ao 2009
16.222.766
14.998.390
13.700.976
13.532.120
12.803.284
12.347.700
12.054.820
11.722.534
10.880.786
9.449.430

Cules son los productos ms comprados por los clientes mayoristas?


En el siguiente grafico se muestra el producto que mas adquieren los clientes de la
empresa Salon del Automovil y segn estos resultados el producto Compresor de
Aire Volvo es el mas vendido como se puede observar en la Figura 37.
Figura 37. Informe Producto Mayorista

Fuente: Autores

Tabla 18. Descripcin Producto Mayorista

MEDIDAS
Valor
Clientes
Ao 2009

PRODUCTOS
COMPRESOR DE AIRE VOLVO
25 C
EJE TRASERO KODIAK
COMPRESOR DE AIRE MOTOR
SUAVIZADOR TOYOTA
CRUCETAS MIXTAS TEREX

12.500.000
2.655.200
1.800.000
1.500.000
1.320.000

Fuente: Autores

84

En qu mes del ao los clientes realizan mayores compras?


En el siguiente grafico se muestra el mes en que los clientes de la empresa Salon
del Automovil realizan sus mayores compras y segn estos resultados el mes de
Septiembre es el mas ofertado a la empresa como se observa en la tabla 19.
Figura 38. Informe Compras Mensuales

Fuente: Autores

Tabla 19. Descripcin Compras Mensuales

CLIENTES
RODAMIENTOS Y
BALINERAS LTDA
GATE GOURMET COLOMBIA
ALEGRA ACTIVITY AMERICA
DISTRIBUIDOR A.J.E.M
IRAUTOS LTDA
BUSES ARMENIA S.A.
J.E FILTROS LTDA
IMPORTADORA SOMOS
FORD COLO
REPUESTOS RIMAR CIA
LTDA
GRAVILLERA ALBANIA

Fuente: Autores

85

MEDIDAS
Valor
Tiempo
Mes 1 - 12
SEPTIEMBRE

VALOR
6.171.500

DICIEMBRE
JULIO
DICIEMBRE
AGOSTO
NOVIEMBRE
MAYO
AGOSTO

6.134.486
3.803.750
3.800.600
3.552.800
3.485.534
3.420.000
3.420.000

JUNIO

3.098.000

NOVIEMBRE

3.096.500

Cul es la opcin ms escogida por los clientes para pagar los productos
adquiridos?
En el siguiente grafico se muestra el medio de pago mas utilizado por los clientes
de la empresa Salon del automvil para realizar el pago de sus compras y segn
estos resultados los clientes tienen como preferencia el pago a Credito como se
muestra en la Figura 39.
Figura 39. Informe Medio de pago

Fuente: Autores

Tabla 20. Descripcin Medio de Pago


MEDIDAS
Valor
Tiempo
CLIENTES
MULTIVE LTDA
GATE GOURMET COLOMBIA
CORPACERO LTDA
BUSES ARMENIA S.A.
MINCIVIL S.A.
GRAVILLERA ALBANIA
MULTISERVICIOS TECNICARS
ALEGRA ACTIVITY AMERICA
IRAUTOS LTDA
SERVIFORD

Ao 2009
16.222.766
14.998.390
13.700.976
13.532.120
12.803.284
12.347.700
12.054.820
11.722.534
10.880.786
9.449.430

Fuente: Autores

86

Medio de
pago
CREDITO
CREDITO
CREDITO
CREDITO
CREDITO
CREDITO
CONTADO
CREDITO
CREDITO
CREDITO

Cul es el monto promedio de compra de los clientes mayoristas?


En el siguiente grafico se muestra el promedio de compra que realiza los clientes
mayoristas al ao como se puede observar en la figura 40.
Figura 40. Informe Promedio Clientes

Fuente: Autores

Tabla 21. Descripcin Promedio Clientes


MEDIDAS
Valor
Promedio
Ao 2009

CLIENTES
MULTIVE LTDA
GATE GOURMET COLOMBIA
CORPACERO LTDA
BUSES ARMENIA S.A.
MINCIVIL S.A.
GRAVILLERA ALBANIA
MULTISERVICIOS TECNICARS
ALEGRA ACTIVITY AMERICA
IRAUTOS LTDA
SERVIFORD

103.329,7197
142.841,8095
80.122,6666
111.835,7024
82.601,8322
107.371,3043
98.006,6666
101.056,3275
109.906,9292
119.613,0379

Fuente: Autores

87

Cul es la ciudad que tiene ms demanda con los productos de la compaa?


En el siguiente grafico se muestra cual es la ciudad que mas adquiere los
productos de la empresa y segn estos resultados seria posible a futuro vender
mas en la ciudad de Cali como se puede observar en la figura 41.
Figura 41. Informe Promedio Ciudad

PromedioCiudad
CARTAGENA
PASTO
BOYACA
CIUDADES

BUCARAMANGA
BARRANQUILLA
BOGOTA
0

200000000 400000000 600000000

CALI

Fuente: Autores

Tabla 22. Descripcin Promedio Ciudad

MEDIDAS
Valor
Promedio
CIUDADES

Ao 2009

MEDELLIN

40,103,838

CALI

436,064,429

BOGOTA

307,226,068

BARRANQUILLA

251,941,980

BUCARAMANGA

265,565,068

BOYACA

311,244,268

PASTO

335,547,744

CARTAGENA

418,372,151

Fuente: Autores

88

Dentro de los clientes mayoristas cul es el tipo de gnero que mas compra
los productos?
Como se muestra en la figura 42 el gnero que mas compra productos de la
empresa Salon del Automovil es el Masculino.
Figura 42. Informe Promedio Sexo

PromedioSexo

MASCULINO
FEMENINO

SEXO

50

100

Fuente: Autores

Tabla 23. Descripcin Promedio Sexo

MEDIDAS
Valor
Promedio
SEXO

Ao 2009

FEMENINO

23

MASCULINO

87

Fuente: Autores

89

6. CONCLUSIONES
Para establecer el perfil de los clientes de la empresa Saln del Automvil se
generaron unas preguntas de negocio las cuales identifican las necesidades
primarias que tiene la empresa para el mejoramiento de las tomas de decisiones.
Una vez realizado el anlisis de la informacin y la verificacin de la calidad de
esta, permiti realizar un estudio detallado de las necesidades expuesta por la
empresa Saln del Automvil. Obteniendo los resultados esperados, que le
ayudaran en un futuro a tomar diferentes decisiones internas como externas.
Se cre un adecuado diccionario de datos, para luego realizar el modelamiento
de las tablas que son necesarias y as poder consolidar la informacin de una
manera ordenada y fcil de manejar, esto con el fin de obtener los resultados
propuestos por la empresa Saln del Automvil.
El prototipo le brindara a la empresa una manera gil de saber diferentes
entornos por medio de sus datos histricos dndole la informacin necesaria que
le ayudara a ver el comportamiento interno y as tener un mejor control y
argumentacin en las decisiones que sern tomadas en un futuro.
Una bodega de datos es mucho ms que un repositorio de informacin
histrica, es una serie de datos relacionados por procesos bien definidos que
llegan a producir la informacin ms adecuada para una correcta toma de
decisiones.
Este trabajo de grado se realizo con el fin de explorar otras tecnologas no
utilizadas frecuentemente en la universidad Libre, mostrando la viabilidad de una
propuesta metodolgica como es la de Ralp Kimball.
Una bodega de datos es un insumo para soportar objetivamente procesos de
toma de decisiones porque permite analizar y modelar informacin histrica y
actual para proponer modelos predictivos.

90

7. RECOMENDACIONES
En las bodegas de datos siempre se debe tener en cuenta que los
requerimientos de negocio se puedan confrontar con el rea tcnica, para as
poder ofrecer al final reportes que si se puedan generar.
Una bodega de datos debe tener informacin confiable y fcil de acceder en
una empresa y si hay datos en diversas fuentes se debe extraer de la fuente que
sea ms confiable.
Es necesario encontrar una justificacin correcta para el negocio en el momento
de iniciar con el proyecto para poderlo justificar desde un punto de vista financiero
y generar un retorno sobre la inversin. As la empresa estar totalmente de
acuerdo con el Proyecto.
Se debe identificar los roles del proyecto de acuerdo a las capacidades de cada
integrante para llegar a un proyecto exitoso y realizarlo en un menor tiempo
posible.
Para que la bodega de datos funcione correctamente es necesario que el
equipo de computo tengan instalados los aplicativos Microsoft SQL Server 2008
con sus herramientas Analysis Services, integration services y reporting services y
Visual Studio 2008.
Es necesario que el usuario que vaya a administrar la herramienta tenga
conocimientos bsicos de bases de datos y manejo de informacin a gran escala.
Para la implementacin del diseo conceptual propuesto es necesario que la
empresa Saln del automvil lleve un control ms detallado sobre la informacin
de sus clientes (Ej: Nivel econmico, genero, ciudades, etc.).

91

BIBLIOGRAFA

ALFONSO LUQUE Romero. Bodegas de datos: Consideraciones de


implementacin, Seguridad y Control, [En lnea]. Publicado Noviembre de 2006,
[17
de
Septiembre
de
2010].
Disponible
en
la
Web:
http://www.acis.org.co/fileadmin/Conferencias/ConfAlfonsoLuqueNov30-06.pdf.
BOGOT MI CIUDAD. Imagen de Bogot. [18 Septiembre de 2010]. Disponible
en la Web: http://www.bogotamiciudad.com/Directorio/Detalles.aspx
EQUIPO 3. Bodega de datos en las Empresas, [En Lnea]. Publicado Noviembre
de 2008, Modificado en Noviembre de 2008, [17 de Septiembre de 2010].
Disponible en la Web: http://bodegadedatos.blogspot.com/2008/11/memo.html.
INFORMATICA JURIDICA. Republica de Colombia, [En Lnea].[18 Septiembre
de
2010].
Disponible
en:
http://www.informaticajuridica.com/legislacion/colombia.asp
ING. BERNABEU R. Dario. Data Warehouse Arquitectura, [En lnea]. Publicado
Enero de 2009, [17 de Septiembre de 2010]. Disponible en la web:
http://www.dataprix.com/data-warehousing-y-metodologia-hefesto/arquitectura-deldata-warehouse/31-introduccion
ING. BERNABEU R. Dario. Load manager, [En lnea]. Publicado Enero de 2009,
[17 de Septiembre de 2010]. Disponible en la Web: http://www.dataprix.com/33load-manager
ING. BERNABEU R. DARIO. Datawarehouse manager, [En lnea]. Publicado
Enero de 2009, [17 de Septiembre de 2010]. Disponible en la Web:
http://www.dataprix.com/data-warehousing-y-metodologia-hefesto/arquitectura-deldata-warehouse/34-datawarehouse-manager
KIMBALL, Ralph. The Data Warehouse ETL Toolkit Practical Techniques for
Extracting, Cleaning, Conforming, and Delivering Data, Wiley, Canada, 2004
KIMBALL, Ralph. Two Powerful Ideas. The foundations for modern Data
Warehouse, Wiley, Canada, 2004
KIMBALL, Ralph, Ross, Margy. Building the Data Warehouse, Wiley, New York,
2005
KIMBALL, Ralph. The Keyword Dimension. Using keywords in a Data Warehouse
of historical letters, Wiley, Canada, 2010

92

KIMBALL, Ralph. Surrogate Keys. Keep control over record identifiers by


generating new keys for the Data Warehouse, Wiley, Canada, 2004
KOONTZ y Weihrich, Harold y Heinz. Administracin una Perspectiva Global.
McGRAW- HILL Interamericana De Editores, S.A,1998
NEVADO CABELLO, Maria Victoria. Introduccin a las bases de datos
relacionales, Vision libros, Madrid, 2002
RSM. Inteligencia de Negocios (BI), [En lnea]. Modificado Septiembre de 2010,
[23
de
Septiembre
de
2010].
Disponible
en
la
Web:
http://www.monografias.com/trabajos14/bi/bi.shtml#QUEES
SINNEXUS. Razones por las que invertir en Business Intelligence, [En lnea]. [30
de
Septiembre
de
2010].
Disponible
en
la
Web:
http://www.sinnexus.com/business_intelligence/inversion.aspx
SINNEXUS. Bases de datos OLTP y OLAP, [En lnea]. [30 de Septiembre de
2010].
Disponible
en
la
Web:
http://www.sinnexus.com/business_intelligence/olap_vs_oltp.aspx
SQLMAX CONNECTIONS. Data Warehouse, [En lnea]. [17 de Septiembre de
2010]. Disponible en la Web: http://www.sqlmax.com/dataw1.asp
TURBAN, Efraim, SHARDA, Ramesh, ARONSON, Jay, KING, David. Business
Intelligence: A Managerial Approach, Pearson Education, Canada, 2010
UNIVERSIDAD DE JAEN. La toma de decisiones de la empresa, [En lnea].
Modificado Noviembre de 2005, [22 de Septiembre de 2010]. Disponible en la
Web: http://www4.ujaen.es/~cruiz/diplot-5.pdf.
WIKIPEDIA. Toma de decisiones, [En lnea]. Modificado Septiembre de 2010, [23
de
Septiembre
de
2010].
Disponible
en
la
Web:
http://es.wikipedia.org/wiki/Toma_de_decisiones.

WIKIPEDIA. Microsoft SQL Server, [En lnea].Modificado en Septiembre de 2010,


[18
de
Septiembre
de
2010].Disponible
en
la
Web:
http://es.wikipedia.org/wiki/Microsoft_SQL_Serve

93

ANEXOS
Anexo A. Entrevista
Preguntas:
1. Actualmente manejan archivos de Excel que contengan gran informacin?
- Si
- No
2. Cree usted que con la informacin que contienen los archivos de Excel se
puede generar diferentes reportes que beneficien su empresa?
- Si
- No
3. Conoce usted que es una Bodega de Datos y para qu sirve?
- Si
- No
Si la respuesta es Si pasar a la pregunta 5.
4. Le gustara obtener informacin acerca de que es una bodega de datos y
para qu sirve?
-

Si
No

5. Cree usted que una bodega de datos le ayudara a los procesos internos
de la empresa Saln del Automvil?
- Si
- No
- Por qu?
____________________________________________________________
____________________________________________________________
____________________________________________

94

6. Le gustara poder acceder ms fcilmente a la informacin almacenada en


su empresa Saln del Automvil?
- Si
- No
- Por qu?
____________________________________________________________
____________________________________________________________
____________________________________________

7. Con la Bodega de datos se podr realizar diferentes informes y reportes


cree usted que estos informes le ayudaran para la toma de decisiones y
as recibir mejores ingresos?

Si
No
Por qu?

____________________________________________________________
____________________________________________________________
____________________________________________

8. Desea usted que se realice un Prototipo de una bodega de datos para su


empresa
-

Si
No
Por qu?

____________________________________________________________
____________________________________________________________
____________________________________________

95

Anexo B. Posible implementacin


Dentro de las diferentes actividades y etapas que conforman el proyecto, existen
varios roles y recursos tecnolgicos que son necesarios a continuacin se
enuncian los roles y herramientas para su implementacin:

Descripcin
Salarios
1 Lder de proyecto
1 Administrador de bases de datos (DBA)
1 Desarrollador ETL
1 Ingeniero de Soporte Tcnico
1 Ingeniero de calidad

Valor
$ 12.350.000
$ 4.500.000
$ 3.000.000
$ 1.850.000
$ 1.500.000
$ 1.500.000

Hardware (Servidor Dell)


Caractersticas
Procesador Intel Xeon X3430
Sistema Operativo Windows Server 2008 R2 SP1
Chassis PowerEdge T110
Memoria RAM de 4GB
Disco duro de 250GB 7.2K RPM SATA 3.5"
DVD-ROM (Interno)

Valor*

$ 2.800.030

Licencia
Nombre
SQL Server 2008 R2 Enterprise

Valor*
$ 2.133.069,96

Sumando todo lo anterior para la elaboracin del proyecto se hace necesario para
la implementacin un valor de $ 17.283.099,96

* Los valores generados en las tablas anteriores son aproximados segn el precio del dlar.

96

Vous aimerez peut-être aussi