Vous êtes sur la page 1sur 13

SISTEMA DE DATOS CURSO: ERNESTO CHINKES

FACULTAD DE CIENCIAS ECONOMICAS


UNIVERSIDAD DE BUENOS AIRES
Caso prctico: data warehouse / business Intelligence

Caso prctico de una solucin de


data warehouse business
intelligence
Caso Jurassic Park Parte II

Profesor: Ernesto Chinkes


Sistemas de Datos

Facultad de Ciencias Econmicas


Universidad de Buenos Aires

SISTEMA DE DATOS CURSO: ERNESTO CHINKES

FACULTAD DE CIENCIAS ECONOMICAS


UNIVERSIDAD DE BUENOS AIRES
Caso prctico: data warehouse / business Intelligence

Jrassic Park Parte 2


Descripcin del caso
Luego de cinco aos de estar operando, la empresa ya cuenta con 8 parques temticos
distribuidos por todo el pas.
Aprovechando el xito del merchandising relacionado con los dinosaurios, la empresa
logr desarrollar fuertemente su unidad de negocios de venta de productos y comidas
dentro de los parques. Esto, junto a la venta de entradas representa ms del 90% de los
ingresos de la compaa.
Los problemas surgen en cada reunin gerencial: los datos sobre las ventas de
entradas y productos no parecen confiables ni estn listos en tiempo y forma para que
el equipo de gerentes pueda tomar decisiones acertadas. Esto ocurre porque los
distintos gerentes (ventas, marketing, control de gestin, etc.) se manejan con
diferentes fuentes de informacin (en algunos casos usando planillas de clculo, hechas
con ingreso manual de datos, minutos antes de las reuniones) y adems porque cada
vez que se requiere un informe de mediana complejidad, hay que solicitarlo al rea de
sistemas que demora por lo menos una semana en confeccionarlo ya que estn
demasiado ocupados con la migracin de los servidores corporativos y cuentan con
poco personal.
En resumen: cada reunin es un caos por las diferentes versiones de la verdad que
cada gerente tiene y en algunos casos porque ni siquiera se llega a tener la informacin
necesaria o est demasiado desactualizada.
Debido a
solucin a
de ayuda
realmente
empresa.

esta situacin, la empresa decide contratarlo a Ud. para que le de una


este problema. El directorio ha escuchado hablar de palabras como sistemas
a la decisin, business intelligence, data warehouse y otras pero lo que
necesita es una solucin de negocio para afianzar el crecimiento de la

En principio se quiere trabajar con la informacin de ventas, tanto de entradas como de


productos dentro de los parques, para luego ir extendiendo el alcance del proyecto a
otras reas.
Luego de realizar un relevamiento inicial, se llega a las siguientes conclusiones:
1. Los orgenes de datos que alimentarn el data warehouse sern:
1. El sistema emisor y facturador de entradas, que est presente en todas las
boleteras de cada parque (que contiene el mdulo de reservas que usted
desarroll en Jurassic Park I). Ver anexo I
2. Dos (2) sistemas distintos de facturacin de productos y comidas para los
locales de los parques (ya que los ms nuevos tiene un sistema que se
contrat hace un ao a una consultora, pero los parques ms antiguos tienen

SISTEMA DE DATOS CURSO: ERNESTO CHINKES

FACULTAD DE CIENCIAS ECONOMICAS


UNIVERSIDAD DE BUENOS AIRES
Caso prctico: data warehouse / business Intelligence
todava un sistema desarrollado por el sobrino de uno de accionistas de la
empresa). Ver anexo II
3. El sistema de administracin de RRHH y liquidacin de haberes. Ver anexo
III
Observacin: los anexos muestran solo las tablas que se han evaluado como
tiles, es decir, que existen otras tablas en cada sistema, que en los anexos no
se muestran.
2. Se detecta que los analistas de negocio de la empresa necesitan analizar la
informacin de ventas de un producto o de las entradas desde diferentes
perspectivas. Por ejemplo, la venta de entradas vista por mes o por ao, por parque,
por regin, por empleado y dems combinaciones entre las perspectivas.
3. El mnimo nivel de detalle que se quiere tener disponible para el anlisis de las
ventas ($ vendidos y unidades vendidas) es el de la lnea de los ticket.
4. De cada empleado es necesario poder hacer anlisis de ventas considerando
tambin el impacto de las horas de capacitacin recibidas.
5. Es necesario conocer tambin de que manera influye, en las ventas de productos, la
zona geogrfica en la que estn ubicados los locales.
6. De cada escuela se sabe si es privada o pblica, y se desea conocer cuales son las
escuelas que generan mayores ingresos a la empresa.
7. Se necesitar hacer anlisis diarios, mensuales, trimestrales y anuales.

SISTEMA DE DATOS CURSO: ERNESTO CHINKES

FACULTAD DE CIENCIAS ECONOMICAS


UNIVERSIDAD DE BUENOS AIRES
Caso prctico: data warehouse / business Intelligence

SISTEMA DE DATOS CURSO: ERNESTO CHINKES

FACULTAD DE CIENCIAS ECONOMICAS


UNIVERSIDAD DE BUENOS AIRES
Caso prctico: data warehouse / business Intelligence

Anexo I (Sistema Emisor y facturador de entradas)

SISTEMA DE DATOS CURSO: ERNESTO CHINKES

FACULTAD DE CIENCIAS ECONOMICAS


UNIVERSIDAD DE BUENOS AIRES
Caso prctico: data warehouse / business Intelligence

Anexo II (Sistemas de facturacin)


Sistema de Facturacin I

Sistema de Facturacin II

SISTEMA DE DATOS CURSO: ERNESTO CHINKES

FACULTAD DE CIENCIAS ECONOMICAS


UNIVERSIDAD DE BUENOS AIRES
Caso prctico: data warehouse / business Intelligence

SISTEMA DE DATOS CURSO: ERNESTO CHINKES

FACULTAD DE CIENCIAS ECONOMICAS


UNIVERSIDAD DE BUENOS AIRES
Caso prctico: data warehouse / business Intelligence

Anexo III (Sistema de RRHH)

SISTEMA DE DATOS CURSO: ERNESTO CHINKES

FACULTAD DE CIENCIAS ECONOMICAS


UNIVERSIDAD DE BUENOS AIRES
Caso prctico: data warehouse / business Intelligence

Resolucin
1. Se decide empezar por modelar el negocio de Jurassic Park, identificando las
dimensiones de anlisis y tambin los hechos o medidas: Modelo
multidimensional conceptual.
EMPLEADO

TIEMPO

ESCUELA

Rango
capacitacin

Anio

Tipo

Empleado

Trimestre

Escuela

DISTRIBUCIN
GEOGRFICA

Regin

PRODUCTO

Categora

Provincia
Sub categora

Ciudad
Mes

Producto
Parque

Da
Local

Monto vendido
Cantidad vendida

2. Decide define la arquitectura de la solucin, segn se expresa en el esquema que


sigue:

RRHH

E
Facturacion I

Area de trabajo

Data
Warehouse
Objetivo

L
E

T
L

Facturacion II
Data
Warehouse
Subjetivo

Boleterias

Aplicaciones de
Business Intelligence

SISTEMA DE DATOS CURSO: ERNESTO CHINKES

FACULTAD DE CIENCIAS ECONOMICAS


UNIVERSIDAD DE BUENOS AIRES
Caso prctico: data warehouse / business Intelligence
3. Considerando el diseo multidimensional conceptual y los modelos de datos de las
fuentes de datos se disea el data warehouse objetivo.

PROVINCIA
TIPO ESCUELA

id_provincia
CIUDAD

Id_tipo_escuela

id_ciudad

Descripcion

Nombre provincia
id_region

REGION
id_region
Nombre region

Nombre ciudad
id_provincia

LOCAL

ESCUELA
Id_escuela

Id_local

VENTA
Numero_ticket

Nombre_escuela
Id_tipo_escuela

Id_parque
Superficie
Distancia_boleteria

Fecha_venta
Legajo_empleado
Id_escuela
Id_local

ITEM_VENTA

Direccin
id_ciudad

EMPLEADO

Numero_ticket
Id_producto

legajo_empleado
Nombre_empleado
Apellido_empleado
Sueldo
Horas _capacitacion
Numero_ticket

Descripcion_producto
Precio_unitario
Cantidad
PRODUCTO

PARQUE
Id_parque

SUB CATEGORIA

Id_producto

Id_sub_categoria

Descripcion_producto
Id_sub_categoria

Descripcion_sub_categoria
Id_categoria

CATEGORIA
Id_categoria
Descripcion_cateogira

4. Para cargar los datos al data warehouse es necesario pasar por un proceso de ETL
que extraiga los datos de los sistemas fuente, la transforme si es necesario, y luego
la cargue en el DW.
Periodicidad
Lo primero a tener en cuenta para el proceso de ETL es la periodicidad. Se ha
considerado la decisin basndose en la necesidad del negocio (con que frecuencia es
necesario tener datos actualizados para el anlisis) y por otra parte la disponibilidad de
los recursos, tanto las fuentes de datos como el data warehouse, ya que vern afectado
su rendimiento en gran medida durante su ejecucin, inclusive en el data warehouse no
estar disponible durante el proceso.
En base a ello se decide correr el proceso de ETL para la carga del data warehouse una
vez por semana (extrayendo todas las transacciones de la semana anterior) los das
domingo a las 22 horas. Esta decisin se ha tomado porque este nivel de actualizacin
es suficiente para los analistas y adems porque ese es un momento en que hay
disponibilidad de recursos de procesamiento. Tambin se toma en cuenta que la
mayora de los anlisis se hace el da lunes con la informacin de la semana anterior.

SISTEMA DE DATOS CURSO: ERNESTO CHINKES

FACULTAD DE CIENCIAS ECONOMICAS


UNIVERSIDAD DE BUENOS AIRES
Caso prctico: data warehouse / business Intelligence
Transformacin de datos
A modo de ejemplo, se describen a continuacin tres de las transformaciones que
realizarn en el proceso de ETL:
a) Categoras y subcategoras de productos: En los tres sistemas en los que se usan
tienen campos con nombres distintos. Los mismos sern integrados en el DW en
una nica tabla, dejando un nico valor para cada categora y subcategora de los
productos en los sistemas de facturacin I y II (ya que existe la misma codificacin
en ambos sistemas) y se inventarn subcategoras ficticias para cada categora del
sistema de entradas, ya que en dicho sistema no existe el concepto de
subcategora.
b) Cada sistema de facturacin cuenta con su propia codificacin de empleados y
escuelas (esto significa, por ejemplo, que un mismo cdigo de empleado puede ser
usado para dos empleados distintos de un parque a otro). Esto debe ser
solucionado mediante el proceso de ETL, usando tablas de conversin o
equivalencia.
b.1. En el caso de los empleados:
Se usar una tabla de equivalencias, donde se unificar la codificacin usando el
nmero de legajo del sistema de RRHH.
Tabla de equivalencias
ID_EMPLEADO Sistema
facturacion I
1

COD_EMPLEADO
Sistema facturacion II

Codigo_empleado
sistema de
entradas
LEGAJO
54
5

70

41

10

34

53

Esta tabla sirve para ser usada al momento de la extraccin de las ventas de los
diferentes sistemas de facturacin (y el de entradas) al momento de hacer el pasaje al
DW. En cada venta se extrae el cdigo del empleado del sistema fuente y, luego de
consultar la tabla de equivalencias y obtener el legajo correspondiente, podr cargar el
registro de la venta en forma homognea en el DW.
b.2. En el caso de las escuelas:
La solucin es similar, usando la siguiente tabla de conversin entre el sistema fuente y
el DW, pero es un poco ms sencillo ya que los sistemas de facturacin I y II tienen los
mismos cdigos, por lo tanto solo es necesaria una tabla que establezca las
equivalencias con el sistema de entradas. En este caso se deja como codificacin base
en el DW al de los sistemas de facturacin I y II

SISTEMA DE DATOS CURSO: ERNESTO CHINKES

FACULTAD DE CIENCIAS ECONOMICAS


UNIVERSIDAD DE BUENOS AIRES
Caso prctico: data warehouse / business Intelligence
Tabla de equivalencias
COD_ESCUELA
de sistema de
entradas

ID_ESCUELA
Sistemas I y II
1

24

21

23

45

5. Se disea el data warehouse subjetivo, mediante un modelo mixto (copo de


nieve en estrella).
EMPLEADO
Legajo
Apellido_nombre
Sueldo
Horas _capacitacion
Rango_horas _capacitacion

TIEMPO
id_fecha

PRODUCTO
id_producto

Dia
Mes
Trimestre
Ao

Descripcion producto
Categoria
Subcategoria

TABLA DE HECHOS
id_producto
id_local
id_fecha
id_escuela
Legajo
monto vendido
cantidad vendida

ESCUELA
Id_escuela

TIPO ESCUELA

Nombre
Id_tipo_escuela

Id_tipo_escuela
Tipo_escuela

DISTRIBUCION GEOGRAFICA
id_local
Nombre local
Id_parque

PARQUE

CIUDAD

PROVINCIA

REGION

Id_parque

id_ciudad

id_provincia

id_region

Direccion
id_ciudad

Nombre ciudad
id_provincia

Nombre provincia
id_region

Nombre region

SISTEMA DE DATOS CURSO: ERNESTO CHINKES

FACULTAD DE CIENCIAS ECONOMICAS


UNIVERSIDAD DE BUENOS AIRES
Caso prctico: data warehouse / business Intelligence

Ejercitacin
A. Se desea que defina qu cambios hara en el data warehouse objetivo, el subjetivo,
y en el diseo multidimensional conceptual, para los nuevos requerimientos que se
describen a continuacin:
1. Si Jurassic Park decidiera incorporar informacin acerca del stocks disponible de
sus productos en el data warehouse. El stock deber estar disponible a nivel de
producto, da y local.
2. Si se lanzara una tarjeta de fidelizacin de clientes y se pudiera identificar a qu
cliente se hizo cada venta (tanto de entradas como de otros tipos de productos).
3. Poder evaluar el impacto que tiene en las ventas, la antigedad y el salario de
los empleados.
4. De cada local es necesario poder analizar las ventas (importe y cantidad) con
respecto a los metros cuadrados que disponen y distancia respecto de la
boletera.

B. Defina el resto de los proceso que debe contemplar el ETL para generar el
DW objetivo, continuando lo visto en el punto 4 de la resolucin.

Vous aimerez peut-être aussi