Académique Documents
Professionnel Documents
Culture Documents
Data WareHousing
Metodologa
Kimball
Planeamiento
del Proyecto
Modelo
del
Negocio
Modelado
Dimensional
Modelado
Fsico
ETL
Reportes
Minera de
Datos
Tabla de Contenido
Antecedentes
Metodologa Kimball
Planificacin del proyecto
Requerimientos del Negocio
Lnea tecnolgica
Arquitectura tecnolgica
Seleccin e instalacin de productos
Lnea de datos
Modelo dimensional
Modelo fsico
ETL
Despliegue
Despliegue
Crecimiento
Mantenimiento
Objetivos
1. Presentar los enfoques para el desarrollo de DWH
2. Presentar la metodologa de Kimball
ANTECEDENTES
Data Warehouse
Conceptos Clave
Datamart. Repositorio de datos especifico.
Diseado para responder las preguntas especficas.
Diseado para servir las necesidades de unidades de negocio
(ventas, comercializacin, operaciones, contabilidad, etc.)
Es construido usando modelado dimensional
Inteligencia de Negocios.
Reportes y anlisis de datos almacenadas en el DWH
Data warehouse/business intelligence (DW/BI) se refiere al sistema
completo de extremo a extremo.
Top-Down
Profesional Bill Inmon
Bottom-Up
Rodolfo Kimball
nfasis
DataMarts
DWH
Hybrid
Muchos
profesionales
DWH y DataMarts
Federated
Doug Hackney
Integrado a
entornos BI
heterogneos
Diseo
Modelo normalizado El modelo
Modelos locales y
Una arquitectura de
basado en la
dimensional de
uno o mas
arquitecturas;
empresa
datamarts, usa
esquemas de
comparte
esquema de estrella estrella
dimensiones,
hechos, reglas,
definiciones a
travs de la
organizacin
Arquitectu Compuesto de
rea de inters y
Modelo empresarial Realidad del cambio
ra
varios niveles de
datamarts
normalizado de alto en organizaciones y
reas de inters y
nivel;
sistemas
datamarts
datamarts inciales.
dependientes
Data set DWH datos a nivel Contiene datos
Carga datamarts
Uso de cualquiera
atmico;
atmicos y
con datos atmicos significado posible
datamarts datos
sumarizados
y sumarizados va para integrar las
sumarizados
un rea de inters necesidades de
no persistente
negocio
Historia de DWH
Inmon.
1990 Publica Building the Data Warehouse
2002 Mejora su libro y define una arquitectura como
una coleccin de fuentes dispares en
almacenes de datos detalles y variantes en el
tiempo.
Kimball
1996 Publica The Data Warehouse Toolkit
2002 Mejora su libro y define multiples bases de
datos llamados datamarts que son
organizados por procesos de negocio, pero
usan medios de datos estandarizados para la
empresa.
Top-Down
Botton-Up
ENFOQUE INMON
El modelo Inmon
Consiste de todas las bases y sistemas de informacin de
una organizacin
Modelo CIF (Corporate Information Factory)
Fabrica de Informacin corporativa.
Operacional
DWH atmico
Departamental
Individual
Modelado Inmon
Tres niveles en el modelado de los datos
Entidad Relacin
Relaciones entre entidades, atributos y relaciones
Modelado Inmon
Relacin entre los niveles Uno y Dos del modelo de datos
de Inmon
ENFOQUE KIMBALL
Enfoque Kimball
El modelo dimensional se inicia con tablas:
De hechos
De dimensiones
Planificacin
Anlisis
DB Initial Study
DB Design
Ejecucin
Diseo del
Sistema detallado
Ejecucin
Mantenimiento
Kimball LifeCycle
Comprobacin
Operacin
Mantenimiento
Ciclo de Vida
Planificacin del proyecto
Requerimientos del Negocio
Lnea tecnolgica
Arquitectura tecnolgica
Seleccin e instalacin de productos
Lnea de datos
Modelo dimensional
Modelo fsico
ETL
Despliegue
Despliegue
Crecimiento
Mantenimiento
Lnea de desarrollo
Luego de definir los requerimientos del negocio, enfocar el
proyecto a tres lneas (tracks) concurrentes:
Tecnologa
Datos
Aplicaciones de BI
Ejercicio 1
Identifique roles para el equipo de desarrollo de un DWH
Ejercicio 1
Identifique roles para el equipo de desarrollo de un DWH
Front Office: Sponsor y Directores
Ejecutivos: Jefe de Proyecto, Lder Proyecto del Negocio.
Lnea regular: Equipo de proyecto principal.
Ejercicio 1
Ejercicio 2
Identifique los recursos necesarios para el desarrollo del
proyecto.
Ejercicio 2
Identifique los recursos necesarios para el desarrollo del
proyecto.
Los recursos pueden ser:
Humanos
Equipamiento
Servicios de terceros
Tiempo
Ciclo de Vida
Planificacin del proyecto
Requerimientos del Negocio
Lnea tecnolgica
Arquitectura tecnolgica
Seleccin e instalacin de productos
Lnea de datos
Modelo dimensional
Modelo fsico
ETL
Despliegue
Despliegue
Crecimiento
Mantenimiento
Requerimiento de datos
Fuente de datos
Calidad de datos y limpieza de datos
Almacenamiento de datos
Carga de datos
Bus Matrix
Relaciona los procesos organizacionales a las entidades u
objetos que participan en el proceso.
Cada fila es un proceso y cada columna una dimensin
Priorizacin de Procesos
Recoleccin de Requerimientos
Quin va ha ir a recoger los requerimientos?.
Los usuarios pueden ser clasificados como:
Ejecutivos Senior
Administradores de departamentos clave
Analistas de negocio
DBA de sistemas operacionales
Personal de TI
Los ejecutivos senior le darn un sentido de direccin y
alcance para su almacn de los datos.
Ciclo de Vida
Planificacin del proyecto
Requerimientos del Negocio
Lnea tecnolgica
Arquitectura tecnolgica
Seleccin e instalacin de productos
Lnea de datos
Modelo dimensional
Modelo fsico
ETL
Despliegue
Despliegue
Crecimiento
Mantenimiento
Ciclo de Vida
Planificacin del proyecto
Requerimientos del Negocio
Lnea tecnolgica
Arquitectura tecnolgica
Seleccin e instalacin de productos
Lnea de datos
Modelo dimensional
Modelo fsico
ETL
Despliegue
Despliegue
Crecimiento
Mantenimiento
Lnea de datos
ETL
Modelado dimensional
Anlisis de los datos de un proceso de
negocio para:
identificar la granularidad de las tablas
de hechos
dimensiones y atributos asociados
hechos numricos.
Contiene los mismos datos y relaciones
que un modelo normalizado en la 3FN,
pero estructurado de manera diferente.
Mejora el entendimiento y desempeo de
consultas al DW
Las construcciones primarias son:
Tablas de hechos
Tablas de dimensiones
Esquema de estrella
Una tabla de hechos
Varias tablas de dimensiones.
Ejemplo:
Asuma este esquema para una cadena de venta al por menor.
El hecho puede ser el ingreso de dinero.
Ventajas:
Diseo fsico
Preparando el entorno de base de datos.
Preparando la seguridad apropiada.
Estrategia preliminar de afinamiento (tuning) de indexacin
y agregacin.
Si son apropiadas las bases de datos OLAP que se
disean durante este proceso.
ETL
Los datos en bruto son extrados de los sistemas
operacionales y transformados en informacin significativa
para el negocio
Los procesos ETL deben diseados mucho antes que
cualquier datos sea extrada de la fuente
Se verifica la calidad de los datos de entrada.
Las condiciones de calidad de datos se controlan
continuamente
Ciclo de Vida
Planificacin del proyecto
Requerimientos del Negocio
Lnea tecnolgica
Arquitectura tecnolgica
Seleccin e instalacin de productos
Lnea de datos
Modelo dimensional
Modelo fsico
ETL
Despliegue
Despliegue
Crecimiento
Mantenimiento
Aplicacin del BI
Aplicaciones que consultan,
analizan y presentan informacin
desde el modelo dimensional.
Las aplicaciones BI entregan
valor al negocio desde la solucin
DW/BI.
La meta es entregar capacidades
al negocio para soportar y mejorar
la toma de decisiones.
1. Diseo de Aplicaciones BI.
2. Desarrollo de aplicaciones BI.
Aplicacin del BI
Diseo de Aplicaciones BI.
Identifica las aplicaciones de BI
candidatas y interfaces de navegacin
apropiadas
Orienta las necesidades de los
usuarios.
Produce la especificacin de las
aplicaciones BI
Ciclo de Vida
Planificacin del proyecto
Requerimientos del Negocio
Lnea tecnolgica
Arquitectura tecnolgica
Seleccin e instalacin de productos
Lnea de datos
Modelo dimensional
Modelo fsico
ETL
Despliegue
Despliegue
Crecimiento
Mantenimiento
Despliegue
Si la planificacin se ha ejecutado se
puede asegurar:
Los resultados de las lneas de
tecnologa, datos y aplicacin del BI.
Disponibilidad de la infraestructura de
capacitacin y apoyo.
El despliegue debe ser bien sincronizado.
El despliegue debe ser aplazado si todas
las piezas, tales como entrenamiento,
documentacin, y validacin de datos, no
estn listos para la liberacin de
produccin.
Mantenimiento
Cuando el sistema esta en produccin
Incluye:
Tareas tcnico operacionales que
son necesarias para mantener el
sistema operando ptimamente.
Monitorio del uso.
Tuning del desempeo.
Mantenimiento de la tabla de
ndices.
Backup del sistema.
Apoyo permanente, capacitacin y
comunicacin con los usuarios finales
Crecimiento
Los DWH tienden a expandirse
(si son exitosos)
Es considerado como un signo
de xito.
Nuevos requerimientos deben
ser priorizados.
Empezar el ciclo de nuevo
Construir sobre las bases ya establecidas.
Enfoque en los nuevos requerimientos
PREGUNTAS