Académique Documents
Professionnel Documents
Culture Documents
Agenda
01. Metodologas para el DWH
Data Warehouse
Conceptos Clave
Datamart. Repositorio de datos especifico.
Diseado para responder las preguntas especficas.
Diseado para servir las necesidades de unidades de negocio
(ventas, comercializacin, operaciones, contabilidad, etc.)
Es construido usando modelado dimensional
Inteligencia de Negocios.
Reportes y anlisis de datos almacenadas en el DWH
Data warehouse/business intelligence (DW/BI) se refiere al sistema
completo de extremo a extremo.
Top-Down
Bill Inmon
Bottom-Up
Rodolfo Kimball
Hybrid
Muchos profesionales
Federated
Doug Hackney
nfasis
DWH
DataMarts
DWH y DataMarts
Integrado a entornos BI
heterogneos
Diseo
Modelo normalizado
basado en la empresa
El modelo dimensional
de datamarts, usa
esquema de estrella
rea de inters y
datamarts
Modelo empresarial
normalizado de alto
nivel;
datamarts inciales.
Data set
Uso de cualquiera
significado posible para
integrar las necesidades
de negocio
Historia de DWH
Inmon.
1990 Publica Building the Data Warehouse
2002 Mejora su libro y define una arquitectura como
una coleccin de fuentes dispares en
almacenes de datos detalles y variantes en el
tiempo.
Kimball
1996 Publica The Data Warehouse Toolkit
2002 Mejora su libro y define multiples bases de
datos llamados datamarts que son
organizados por procesos de negocio, pero
usan medios de datos estandarizados para la
empresa.
Top-Down
Botton-Up
ENFOQUE INMON
El modelo Inmon
Consiste de todas las bases y sistemas de informacin de
una organizacin
Modelo CIF (Corporate Information Factory)
Fabrica de Informacin corporativa.
Operacional
DWH atmico
Departamental
Individual
Modelado Inmon
Tres niveles en el modelado de los datos
Entidad Relacin
Relaciones entre entidades, atributos y relaciones
Modelado Inmon
Relacin entre los niveles Uno y Dos del modelo de datos
de Inmon
ENFOQUE KIMBALL
Enfoque Kimball
El modelo dimensional se inicia con tablas:
De hechos
De dimensiones
Planificacin
Anlisis
DB Initial Study
DB Design
Ejecucin
Diseo del
Sistema detallado
Ejecucin
Mantenimiento
Kimball LifeCycle
Comprobacin
Operacin
Mantenimiento
Metodologia
Propuesta por
Cognos
(adaptacin de
Kimball)
Ciclo de Vida
Planificacin del proyecto
Requerimientos del Negocio
Lnea tecnolgica
Arquitectura tecnolgica
Seleccin e instalacin de productos
Lnea de datos
Modelo dimensional
Modelo fsico
ETL
Despliegue
Despliegue
Crecimiento
Mantenimiento
Qu es Data Warehouse?
Un almacn de datos analticos orientados a un
determinado mbito de la empresa (organizacin, rea,
tema, etc.), integrado, no voltil y variable en el tiempo.
Data
Warehouse
Data Marts
Ventas
Produccion
OLTP
Contabilidad
OLTP
Data
Empresarial
OLTP
Presupuesto
Datos en
un Entorno
OLAP
ETL
Extraer, transformar y cargar abreviado como ETL es el proceso
que permite a las organizaciones mover datos desde mltiples
fuentes, reformatearlos y limpiarlos, y cargarlos en otra base de
datos, data mart, o data warehouse para analizar, o en otro
sistema operacional para apoyar un proceso de negocio.
Los datos de los sistemas OLAP son obtenidos desde los
sistemas OLTP.
Este no es un proceso trivial, existen cientos de potenciales
problemas al momento de obtener los datos
Inteligencia
de Negocios
Metodologa
Kimball
Planeamiento
del Proyecto
Modelo
del
Negocio
Modelado
Dimensional
Modelado
Fsico
ETL
Reportes
Minera de
Datos
Tabla de hechos
Tabla de Dimensiones
Hechos
Dimensiones
Eventos
que
ocurren
dinmicamente en el negocio de
la empresa.
Construccin del
Data Warehouse
o Data Mart
Ejemplo
Construiremos el modelo del Data Mart de
ventas en tres etapas:
Etapa 1 Construccin de las Dimensiones
Dimensiones
Tiempo
Sucursal
Vendedor
Cliente
Producto
Ventas_Importe
Ventas_Costo
Ventas_Unidades
Ventas_ImporteTotal
Ventas_Ganancia
Ventas_Promedio
Medidas
Definiendo las
Dimensiones
Tiempo
(Esquema Estrella)
Vendedor
Tabla de Hechos o
FACT TABLE
Ventas
Producto
Sucursal
Cliente
Tcnica Dimensional
?qu
?cundo
?cmo
Medida
?quin
Tcnica Dimensional
PRODUCTO
TIEMPO
ORGANIZACIN
SUCURSAL
VEMNDEDOR
Monto vendido
Unidades vendidas
CLIENTE
Tcnica Dimensional
TIEMPO
Proveed
PRODUCTO
Famila
Anual
Marca
Trim
Mes
Producto
Dia
Personal
Cliente
Seccin
Sucursal
VENDEDOR
Monto vendido
Unidades vendidas
Zona
CLIENTE
Dimensin Tiempo
Dimensin
Tiempo
*
**
***
****
*****
Ao
Semestre
Trimestre
Mes
Da
Dimensin
Vendedor
Dimensin Vendedor
Dimensin Sucursal
Sucursal
Dimensin
*
**
***
****
*****
Sucursal
Tipo Sucursal
Pas
Provincia
Ciudad
**
***
Sucursal
Seccin
Vendedor
Dimensin
Cliente
Dimensin Cliente
*
**
***
****
Pas
Provincia
Ciudad
Razn Social
Dimensiones
Medidas
Tiempo
Sucursal
Vendedor
Cliente
Producto
Ventas_Importe
Ventas_Costo
Ventas_Unidades
Ventas_ImporteTotal
Ventas_Ganancia
Ventas_Promedio
Esquema
Copo de Nieve
Dimensiones
Medidas
Tiempo
Sucursal
Vendedor
Cliente
Producto
Ventas_Importe
Ventas_Costo
Ventas_Unidades
Ventas_ImporteTotal
Ventas_Ganancia
Ventas_Promedio
Fact_Ventas
Definiendo la
Tabla de Hechos
ID_Tiempo
ID_Producto
ID_Cliente
ID_Vendedor
ID_Sucursal
Medidas
Dimensiones
Tiempo
Sucursal
Vendedor
Cliente
Producto
Ventas_Importe
Ventas_Costo
Ventas_Unidades
Ventas_ImporteTotal
Ventas_Ganancia
Ventas_Promedio
Fact_Ventas
ID_Tiempo
ID_Producto
ID_Cliente
ID_Vendedor
ID_Sucursal
Medidas
Fact_Ventas
ID_Fecha
ID_Producto
ID_Cliente
ID_Vendedor
Ventas_Importe
Ventas_Costo
Ventas_Unidades
Dimensin Tiempo
Dimensin
Tiempo
*
**
***
****
*****
Ao
Semestre
Trimestre
Mes
Da
Dimensin Sucursal
Sucursal
Dimensin
*
**
***
****
*****
Sucursal
Tipo Sucursal
Pas
Provincia
Ciudad
Fact_Ventas
ID_Fecha
ID_Producto
ID_Cliente
ID_Vendedor
Ventas_Importe
Ventas_Costo
Ventas_Unidades
Dimensin
Cliente
Dimensin Cliente
*
**
***
****
Pas
Provincia
Ciudad
Razn Social
Dimensin
Vendedor
Dimensin Vendedor
*
**
***
Sucursal
Seccin
Vendedor
Dimensiones
Medidas
Tiempo
Sucursal
Vendedor
Cliente
Producto
Ventas_Importe
Ventas_Costo
Ventas_Unidades
Ventas_ImporteTotal
Ventas_Ganancia
Ventas_Promedio
Conclusiones
Finales
Fin de la Sesin 04
CARRERA DE INGENIERA DE SISTEMAS