Vous êtes sur la page 1sur 56

Definiendo requerimientos de negocio, Diseo y Construccin de

AdventureWorks Data Warehouse


Base de Datos Estratgicas

Introduccin al Concepto de Data Warehousing


Data Warehousing es el centro de la arquitectura para los sistemas de informacin en la dcada de los '90. Soporta el procesamiento informtico al proveer una plataforma slida, a partir de los datos histricos para hacer el anlisis. Facilita la integracin de sistemas de aplicacin no integrados. Organiza y almacena los datos que se necesitan para el procesamiento analtico, informtico sobre una amplia perspectiva de tiempo. Un Data Warehouse o Depsito de Datos es una coleccin de datos orientado a temas, integrado, no voltil, de tiempo variante, que se usa para el soporte del proceso de toma de decisiones gerenciales.
UPAO 2

Continuacin

Base de Datos Operacional Datos Operacionales Orientado a la aplicacin Actual Detallada Cambia continuamente

Data Warehouse Datos del negocio para Informacin Orientado al sujeto Actual + histrico Detallada + ms resumida Estable

Diferentes tipos de informacin

UPAO

Continuacin

Se puede caracterizar un data warehouse haciendo un contraste de cmo los datos de un negocio almacenados en un data warehouse, difieren de los datos operacionales usados por las aplicaciones de produccin. El ingreso de datos en el data warehouse viene desde el ambiente operacional en casi todos los casos. El data warehouse es siempre un almacn de datos transformados y separados fsicamente de la aplicacin donde se encontraron los datos en el ambiente operacional.
UPAO 4

Procesos del Negocio


Utilizamos el trmino procesos del negocio para significar una actividad operacional que la organizacin engancha adentro para lograr sus metas fundamentales. Puedes pensar en procesos del negocio como los acoplamientos en la cadena de valor de la organizacin. Cada proceso del negocio tiene tpicamente su propio sistema o mdulo operacional, tal como el sistema de la entrada de orden, o el sistema que sigue de la llamada, o el sistema de gerencia de inventario. La informacin generada por estos procesos del negocio mide solamente el proceso s mismo del negocio, pero esa informacin tiene generalmente valor bien ms all de los lmites del proceso individual del negocio. La informacin de un solo proceso del negocio, tal como informacin de las rdenes, poda estar de gran inters a las ventas, a la comercializacin, al servicio de cliente, y a otros grupos a travs de la organizacin.
UPAO 5

Continuacin
Cada proceso del negocio es un sistema nico, coherente de la medida puesto en ejecucin como sistema operacional. Si necesitas datos de un proceso dado del negocio, necesitas extraer esos datos en su contexto del negocio. Es decir necesitas tirar de las medidas y de todos los descriptores asociados en una manera cuidadosa, sistemtica. Esto hace el proceso del negocio la unidad fundamental del trabajo para el sistema de DW/BI. A menos que tengas recursos ilimitados, tu equipo de DW/BI se concentrar en que disean y que cargan datos a partir de un negocio de proceso a la vez. El proceso del negocio es la unidad del sistema de DW/BI del trabajo.
UPAO 6

Construccin de la matriz bus inicial del almacn de datos


Pues hay que identificar los procesos del negocio necesitados para apoyar cada tema analtico, tambin agregars esos procesos del negocio a un mapa itinerario de los datos de la empresa llamado la matriz del autobs del almacn de los datos. Esta matriz traza los procesos de organizacin del negocio a las entidades o los objetos que participan en esos procesos. Cada fila en la matriz es un proceso del negocio.

UPAO

Continuacin
El cuadro 1 muestra una matriz bus simplificada de ejemplo para una compaa al por menor. Ntese cmo los procesos de negocio debajo del lado izquierdo de la matriz siguen la cadena de valor de la organizacin. En este caso, la compaa compra mercancas de sus vendedores y los almacena en centros de distribucin. Entonces, como las mercancas son exigidas por los consumidores, se mueven hacia fuera a las tiendas al por menor donde se sostienen en estantes hasta que el cliente los compra y las mercancas salen de la cadena de valor de la compaa. Estos procesos del negocio corresponden generalmente a los sistemas o a los mdulos individuales de la fuente en el sistema total del planeamiento del recurso de la empresa (ERP).
UPAO 8

Cuadro 1

UPAO

Continuacin
Las columnas en la matriz bus son los objetos descriptivos que participan en varios procesos del negocio, por ejemplo almacn, producto, y fecha. Ponen en contraste con los procesos medidos-conductores del negocio que etiquetan las filas del matriz. Llamamos estos objetos dimensiones en el modelo dimensional. Cada dimensin participa en unos o ms procesos de negocio -indicamos esto al colocar una X en la celda que se interseca en la matriz. Por ejemplo, la dimensin vendedor est implicado en ambos procesos de compra y de entrega. El proceso del negocio venta almacn, por otra parte, no implica a vendedor o centro de distribucin.
UPAO 10

Continuacin
La matriz bus es esencialmente la arquitectura dimensional de los datos de la empresa. Para cada proceso del negocio (fila), puedes ver exactamente que dimensiones (columnas) necesitas poner en ejecucin. Y para cada dimensin, puedes ver qu procesos de negocio se debe apoyar. Esta visin dimensin-orientada es la representacin visual de las dimensiones conformadas. Los procesos del negocio en la matriz bus, y los temas que apoyan (y el valor que esos temas representan) se convierten en las entradas principales al paso siguiente en el proceso de definicin de los requisitos: una sesin de prioritization con la gerencia mayor.
UPAO 11

Ejemplo de Requerimientos del Negocio: Adventure Works Cycles (AWC)


Las bases de datos ejemplo en inteligencia de negocios en SQL Server 2005 se basan en una compaa ficticia llamada Adventure Works Cycles (AWC), una multinacional fabricante y vendedora de bicicletas y de accesorios. Segn las descripciones en libros en lnea, la compaa se ubica en Bothell, Washington, E.E.U.U. y tienen oficinas de ventas regionales en varios pases. En esta seccin nosotros proporcionamos un ejemplo de los requisitos del negocio que recolectan el proceso basado en esta mu;tinacional. Si se asume que el sistema de DW/BI ya tiene buen patrocinio del negocio, el primer paso principal en el ciclo de vida es la definicin de los requisitos, y la primera tarea es la definicin de los requisitos es la preparacin.
UPAO 12

Informacin bsica del negocio de AWC


La base de datos transaccional de AWC se llama AventureWorks y est instalada como parte de los ejemplos del servidor del SQL. Tiene datos a partir del enero de 2001 hasta el 30 de junio de 2004. Algunas consultas en estos datos revelan que AWC esta yendo bien, por lo menos en trminos de rdenes y crecimiento. La lnea del importe total en la tabla 2 demuestra que las rdenes han estado aumentando rpidamente, se han triplicado en el 2002 y han aumentando en casi 50 por ciento en el 2003. De acuerdo con los primeros seis meses, 2004 luce como otro ao de xito. La tabla 2 tambin demuestra que AWC vende productos en cuatro categoras importantes: bicicletas, componentes, ropa, y accesorios. Las bicicletas ocupan ms del 80 por ciento de rdenes, mientras que la ropa y los accesorios cubren cerca del 4 por ciento.
UPAO 13

Tabla 2: Ordenes de AWC por categorias

UPAO

14

Continuacin

AWC vende muchas bicicletas. Las consultas adicionales de la base de datos nos dicen de donde vienen las rdenes de bicicletas. La tabla 3 revela que AWC tiene ventas en seis pases, con cerca de 60 por ciento de rdenes que vienen de los Estados Unidos. El porcentaje de las rdenes que vienen fuera de los E.E.U.U. ha aumentado desde cerca de 25 por ciento en el 2001 hasta algo mas de 40 por ciento en el 2004.

UPAO

15

Tabla 3: Ordenes de AWC por Pases

UPAO

16

Continuacin
En trminos de canales de ventas, la tabla 4 demuestra que el bulto de rdenes viene de los almacenes y de los distribuidores de bicicleta, tambin conocidos como revendedores. Este canal tiene cerca del 70 por ciento de rdenes y es dirigido por una fuerza de ventas directa de 18 personas. AWC ensancho su negocio durante los ltimos aos de la dcada del 90 abriendo un canal de ventas directas a los consumidores en el Internet. Extraamente, las rdenes del Internet han sido bastante constantes aproximadamente al 30 por ciento del total de ventas a travs de los datos de los cuatro aos considerados. Mientras que no sabemos porqu esto est as, predecimos que el VP de ventas lograr aumentar las ventas directas por este canal tan rpidamente como ha crecido Internet.
UPAO 17

Tabla 4: Ordenes de AWC por canales de venta

UPAO

18

Continuacin

Ahora se tiene conocimiento de lo que AWC vende, donde lo venden, y cmo lo venden. La pregunta siguiente es a quines vende AWC? La tabla 5 da una consolidado de los clientes analizados por el canal de ventas. Esta coyuntura es vital para entender a los clientes de AWC porque los dos canales de venta son muy diferentes.

UPAO

19

Tabla 5:Clientes de AWC por consolidado de canales de venta

UPAO

20

Continuacin
El canal del revendedor tiene un total de 701 clientes, 467 de quin son activos (definidos debido a tener una orden en los primeros seis meses del 2004). El canal del Internet es mucho ms grande, con un total de 18,484 clientes, 11,377 de los cuales han puesto una orden en el 2004. El canal del revendedor justifica una fuerza de ventas directas en parte porque la orden media est cerca de $24,000 comparados con un promedio de $827 para el Internet. Por otra parte, el negocio del Internet debe ser considerablemente ms provechoso porque el precio estara ms cercano a venta al por menor antes que al por mayor, y el coste de venta sera mucho ms bajo sin una fuerza de ventas directa.
UPAO 21

Temas analticos y procesos del negocio


Los resmenes de las entrevistas han agrupado ya requisitos similares en temas analticos comunes. Hemos encontrado que es el ms fcil identificar los procesos del negocio que apoyan cada tema analtico mientras que escribes el resumen. Por ejemplo, el planeamiento de ventas es un tema analtico que es apoyado por la informacin del proceso del negocio de las rdenes. El cuadro 1 es un ejemplo de cmo se puede destilar procesos del negocio de AWC de los temas analticos basados en el resumen de la entrevista con el jefe de ventas. La lista final incluir muchos ms temas y procesos del negocio.
UPAO 22

Cuadro 1: Temas analticos y procesos

del negocio

UPAO

23

Continuacin

UPAO

24

Continuacin

UPAO

25

Continuacin
El proceso del prioritizacin se centra en procesos del negocio porque stas son las unidades coherentes del trabajo para el sistema de DW/BI. En describir cada proceso del negocio, necesitas enlazarlo de nuevo a los temas analticos que apoya, as que la gerencia mayor puede determinar su valor de negocio. Los procesos del negocio de la entrevista con el jefe de venta se demuestran en la tabla 7. Se subrayan los temas analticos apoyados del jefe de ventas; el resto vino de otras entrevistas.

UPAO

26

Tabla 6:Procesos de negocio derivados de la entrevista con el jefe de ventas

UPAO

27

Matriz bus de Adventure Work Cycles


Los procesos del negocio son las unidades del trabajo en la construccin de la capa de la informacin del sistema de BI. La matriz bus demuestra los procesos del negocio y las dimensiones necesitados para apoyarlas. Mientras ms se conoce sobre el negocio y el trabajo de los sistemas de soporte ms fcil es definir la matriz bus. La versin completa de la tabla 6 sera el punto de partida para una versin inicial de la matriz bus. El cuadro 2 muestra una versin de alto nivel de AWC de la matriz bus para los procesos del negocio de la tabla 6.
UPAO 28

Cuadro 2: La matriz bus de AWC

UPAO

29

Crear el modelo dimensional de las rdenes de AWC


Crear el modelo dimensional de alto nivel: El proceso de modelado en cuatro pasos.
La tarea inicial en la sesin del diseo es crear un modelo dimensional de alto nivel para el proceso prioritario superior del negocio . Crear el primer bosquejo es directo porque la matriz bus del documento de los requisitos detallados da al equipo un punto de partida excelente (cuadro 3). El modelo dimensional de alto nivel es un modelo de los datos en el nivel de la entidad.

UPAO

30

Cuadro 3: El diagrama de flujo del proceso del modelo dimensional.

UPAO

31

Continuacin

Se puede tambin incluir cualquier tabla para uso general, tal como jerarquas de las tablas de las operaciones de bsqueda o del usuario, pero stas no emergen sino posteriormente en el proceso. El proceso atraviesa generalmente cuatro pasos en esta sesin del diseo: 1. Elegir el proceso del negocio 2. Declarar el nivel de detalle 3. Elegir las dimensiones 4. Identificar los hechos

UPAO

32

El proceso de modelado en cuatro pasos de AWC.


1. El proceso de negocio elegido es el proceso de rdenes. 2. El nivel de detalle del proceso del negocio de las rdenes necesita claramente estar en el nivel de la orden de lnea de artculos. 3. Elegir las dimensiones: Para dar un contexto ms rico para el proceso de elegir dimensiones, iremos nuevamente al paso 1 en el cuadro 3: la sesin de diseo del modelo dimensional de alto nivel.

UPAO

33

Continuacin

Usando el modelo dimensional demostrado en el cuadro 3 como nuestra gua, resumiremos la discusin y las conclusiones de AWC para cada dimensin, comenzando con la dimensin Date. El modelo dimensional mostrado en el cuadro 4 se basa en la matriz bus inicial que desarrollamos como parte del proceso de la definicin de los requerimientos (Cuadro 2). El modelo en el cuadro 4 proporciona un punto de partida spero para la discusin del modelo dimensional de alto nivel.

UPAO

34

Cuadro 4: El modelo dimensional de alto nivel inicial de las rdenes de AWC

UPAO

35

Date
Hay dos fechas importantes en el proceso de negocio rdenes: fecha de la orden y la fecha a entregar. La dimensin de la fecha desempear dos roles en el modelo dimensional de las rdenes. Recordar que una dimensin de actuacin de roles significa que la misma tabla ser utilizada mltiples veces, a travs de vistas, de sinnimos, o de copias fsicas de la tabla. Los servicios del anlisis tienen el concepto de las dimensiones de actuacin de papeles construidos y no necesitan vistas o copias. Hay que tener el cuidado de incluir cada una de las dimensiones de la actuacin de roles en la documentacin del diseo lgico para facilitar una comprensin clara y sucinta con los socios del negocio y los DBAs.
UPAO 36

Product
La decisin sobre incluir a producto era muy fcil hasta que lleg a estar claro que el producto significa diversas cosas en diversos procesos del negocio. En rdenes, significa que fue vendida al cliente- producto acabado. En la fabricacin, podra significar una pieza o un producto acabado. Para ellos, cada elemento es un producto de un cierto proceso. Para que la dimensin del producto sea til a travs de la organizacin (es decir, conformado), este tener el concepto de granularidad a su nivel ms bajo. Por lo tanto, se decide que la tabla del producto incluir todos los artculos relacionados con el producto. Esta decisin fue tomada fcilmente cuando una de las personas de los sistemas fuente precis que as es cmo los datos del producto fueron guardados en el sistema fuente, y hay solamente 504 filas en la tabla.
UPAO 37

Sales Territory
El territorio de ventas era confuso para el equipo. Inicialmente, se sentan que no haba necesidad de guardar una dimensin separada del territorio de ventas porque el territorio de ventas es realmente una cualidad del representante de ventas y del cliente. Segn los requerimientos, la organizacin de ventas necesita mirar las rdenes histricas segn las cuales el representante de ventas consigui crdito a la hora de la orden y las cuales conseguir el representante de ventas el crdito para las rdenes actuales. El VP de ventas tambin puede desear mirar a clientes por el territorio para realinear territorios en el futuro.
38

UPAO

Continuacin

Cuando crearon la matriz bus inicial, el equipo discuti diversas maneras de manejar los diversos requerimientos. La adicin de una dimensin separada del territorio de ventas enlaza el territorio de ventas directamente a la transaccin. Esto cierra en el territorio a el cual la orden fue asignada originalmente, resolviendo aparentemente el requisito histrico de las rdenes.

UPAO

39

Employee
El proceso del negocio de las rdenes implica representantes de ventas solamente. Ningn otro empleado debe aparecer en la tabla de hecho de las rdenes. Sin embargo, ms bien que crear una tabla limitada de uso para los representantes de ventas, el equipo modelador decide ensancharla para incluir a todos los empleados. Despus de todo, la construccin de la dimensin empleado apoya la visin empresarial de la matriz bus. Una tabla completamente cargada del empleado se puede utilizar para apoyar otros procesos del negocio que impliquen a empleados.

UPAO

40

Continuacin
Las discusiones inciales categorizaron la tabla del empleado como tabla del tipo 1, conteniendo valores actuales solamente. El grupo decide esto por dos razones. Los cambios en las cualidades del empleado realmente son un proceso separado del negocio bajo recursos humanos, as que seguir los cambios ser parte de poner esa rea del proceso en ejecucin del negocio y est fuera del alcance del modelo dimensional de las rdenes. En segundo lugar, era confuso de donde vendra los datos para reconstruir de la historia de los cambios de atributos del empleado.

UPAO

41

Customer y Reseller
Despus comentando sobre el crculo en el cuadro 4, discurrimos en dos dimensiones relacionadas: Cliente y Revendedor. Mientras que el equipo de diseo repas los requisitos del negocio relacionados con el cliente, lleg a estar claro que haba ideas mltiples de quin era el cliente, y que estas ideas se traslaparon. Los clientes del Internet son individuos de venta-dirigida, y los clientes del revendedor son comercios sobre todo al por mayor o al por menor. Mientras que comparten algunas cualidades, como una direccin, la compaa tiene cierta informacin sobre cada uno que no tenga sobre el otro. El sentido cuando la matriz bus fue creada era que los dos tipos de cliente son bastante diferentes como para estar divididos en dimensiones separadas.
UPAO 42

Promotion
El documento de los requerimientos claramente identific promociones como elemento importante en la mezcla de la comercializacin. Sin embargo, las promociones no han sido una herramienta importante de la comercializacin para AWC en el pasado. De hecho, hay solamente 16 promociones en la tabla promocin del sistema fuente. En este punto, es bastante para identificar la promocin como su propia dimensin y la nota sobre la lista de ediciones que ms investigacin es necesaria para definir promociones porque la comercializacin est planeando hacer ms promociones de la mayor complejidad. El administrador de los datos precis eso que seguir la informacin sobre promociones puede implicar mejoras al sistema fuente.
UPAO 43

Currency
Cada venta en el sistema fuente se captura en la moneda local. El sistema confa en una tabla de conversin de modernas para traducir monedas y reportar en dlares de los E.E.U.U. Esta tabla sigue el ndice de conversin entre la moneda local y los dlares de los E.E.U.U. en el final de cada da y como promedio para cada da. Conseguir informes estandarizados en dlares de los E.E.U.U. para comparar a travs de pases requiere una pregunta bastante complicada y ha sido de largo un dolor de cabeza para la mayor parte de la gente en jefaturas. Al mismo tiempo, la gente de ventas en el campo desea crear informes en moneda local para mostrar a sus clientes.
44

UPAO

Continuacin

Las finanzas, por supuesto desean ambos, junto con la tabla de conversin as podrn determinar el impacto de los cambios en variaciones de presupuesto. De acuerdo con estos requerimientos, el equipo de diseo ha decidido incluir ambo campos de la moneda local y del dlar de los E.E.U.U. en la tabla de hecho, con una dimensin de la moneda para indicar la moneda de los datos locales. Esto significa que el proceso ETL tendra que convertir en la tabla de conversin de moneda ventas que no son en dolares a ventas en dlares de los E.E.U.U.

UPAO

45

Identificar las dimensiones y atributos de hecho para el proceso del negocio rdenes
La segunda mitad de la sesin inicial del diseo implica el crear de una lista inicial de elementos de datos. Esta lista es una lista de la cualidad para cada dimensin y una lista de elementos de datos hecho-relacionados. El punto de partida para esta lista es el documento detallado de requerimientosuno de sus apndices debe ser una lista de los elementos de datos dominantes (atributos) que la gente identifica especficamente como importante. La tabla 7 muestra lo que una parte de la lista de atributos podra tener en el modelo dimensional del proceso del negocio de las rdenes de AWC. La columna de los valores de la muestra es provechosa en identificar atributos.
UPAO 46

Tabla 7: Parte de la dimensin Promocin de la lista inicial de atributos de las rdenes de AWC

UPAO

47

Continuacin

UPAO

48

Continuacin

UPAO

49

Continuacin
No todos los elementos de datos en la lista de atributos sern necesariamente atributos del modelo dimensional final. Algunos de ellos no son realmente atributos; antes son agregados o restricciones. Otras son los mismo atributos disfrazados bajo diversos nombres. Todava otros atributos faltan en conjunto, cualquiera porque eran as que la gente obviamente no pens en mencionarlas, o la utilizaron tan poco, que la gente no saba para mencionarlas. Como se construye las listas, hay que ver hacia fuera sobre estas clases de redundancias y de omisiones. Comenzar a explotar toda esta informacin para crear la lista principal de atributos para cada tabla.
50

UPAO

El bosquejo final del modelo inicial


En el final de la sesin inicial del diseo, se ha creado un buen modelo dimensional de alto nivel. El modelo de alto nivel demostrado en Cuadro 5 es el resultado de combinar los cambios identificados en curso de crear la lista de las cualidades (agregar la dimensin OrderInfo) junto con los cambios de la sesin modelo del diseo en s mismo (combinando Reseller y Customer, quitando la dimensin Sales Territory, y agregando el proceso Exchange Rate). Este modelo dimensional contiene todos los elementos necesarios para resolver los requerimientos ordenrelacionados del negocio de AWC en un formato simple, de gran alcance, flexible lo mayormente posible por lo que el equipo entiende hasta este punto. Este modelo cambiar, pero es un primer paso fuerte.
UPAO 51

Cuadro 5: El modelo dimensional de alto nivel de la sesin inicial de diseo

UPAO

52

Identificando las tablas de hecho


El completar la descripcin detallada de la tabla de hecho es como completar las dimensiones. Comenzar copiando en la lista de medidas y completando todos los artculos fciles. Entonces utilizar las herramientas de la investigacin para anotar tantos tems abiertos como sea posible. Finalmente, trabajar con el equipo modelador de datos para resolver los asuntos restantes. Hay varias ediciones que son especficas a las tablas del hecho. stos incluyen:

UPAO

53

Continuacin
Columnas derivadas: Identificar la frmula e indicar si la derivacin es aditiva o semi-aadida, como es el caso del balance en la cuenta del final de mes. Asignaciones : En el caso del modelo dimensional de las . rdenes de AWC, el nivel de detalle est en la lnea nivel de la orden del artculo. El equipo debe decidir cmo manejar el conjunto de los hechos que se recogen en el nivel de la orden. El impuesto de ventas se puede asignar fcilmente a cada lnea artculo. Otros hechos, tales como costes del envo, pueden necesitar ser asignados basados en el peso o tamao.
54

UPAO

Continuacin
Hechos conformados: El campo de ventas en dlares es un buen ejemplo de crear un hecho conformado. Segn lo discutido en la sesin del diseo, hay una necesidad tener todas las transacciones indicadas en una sola moneda (dlares de los E.E.U.U.), as como la moneda local original del sistema fuente. Dimensiones degeneradas: Mientras que ninguna de las transformaciones necesitan ser aplicadas a cualquier dimensin degenerada en el modelo dimensional, necesitas indicar qu campos en la tabla del hecho son dimensiones degeneradas.
55

UPAO

Continuacin

En el modelo dimensional de las rdenes, hay dimensiones degeneradas para el nmero de orden, lnea nmero de la orden del artculo, y la revisin del nmero de rdenes de venta. El modelador de los datos identificar otra dimensin degenerada potencial que viene como parte de la orden: el nmero PO del cliente.

UPAO

56