Vous êtes sur la page 1sur 52

Lic Jos A Gonzlez Alonso

1



NUEVAS
TECNOLOGIAS
Inteligencia de Negocios
1ra parte

Vs. 1.3
Lic Jos A Gonzlez Alonso
20
Qu es Inteligencia de Negocios?
Business Intelligence is the process of
transforming data into information and
through discovery transforming that
information into knowledge.
Gartner Group
Lic Jos A Gonzlez Alonso
Propsito de la inteligencia de negocios
El propsito de inteligencia de negocios es
convertir el volumen de datos en valor para
el negocio con la divulgacin analtica.
Decisin
Conocimiento
Informacin
Datos
Volumen
Valor
Lic Jos A Gonzlez Alonso
Management
Information Systems
MIS provea datos acerca del negocio.
Los reportes eran construidos a demanda.
Los reportes contenan poca capacidad de anlisis.
Las herramientas de soporte de decisin derivaban
en un acceso demasiado personalizado a los datos
y poco flexibles.
Reportes operacionales Decisores
Entorno de
produccin
Accesos ad hoc
Lic Jos A Gonzlez Alonso
Anlisis de datos del
entorno operativo
Las estructuras de datos son complejas.
Los sistemas se disean para alto rendimiento
Los datos no se representan de una manera
significativa
Datos dispersos.
Los sistemas de OLTP pueden ser inadecuados
para cuestiones analticas.
Reportes operativos
Entorno
de produccin
Lic Jos A Gonzlez Alonso
Por qu OLTP no es conveniente
para la divulgacin analtica?
OLTP Divulgacin analtica
Informacin de apoyo de
servicios cotidianos
Informacin histrica a analizar
Datos almacenados a nivel de
transaccin
Los datos necesitan ser
integrados
Diseo de base de datos:
normalizado
Diseo de base de datos:
denormalizado, esquema
estrella
Lic Jos A Gonzlez Alonso
Proceso de extraccin de datos
Fue una evolucin lgica desde DSS para evitar la
degradacin de la performance de los sistemas
operacionales
Los usuarios finales toman datos fuera de los
ambientes operativos
Los usuarios son dueos de sus datos
Decisores Sistemas del
entorno operativo
Extraccin
de datos
Lic Jos A Gonzlez Alonso
Problemas de gestin con los
programas de extraccin de datos
Extraccin Sistemas del
entorno operativo
Decisores
Explosion de la Extracin
Lic Jos A Gonzlez Alonso
Problemas de productividad
de los procesos de extraccin
Esfuerzo duplicado
Tecnologas mltiples
Informes obsoletos
Sin metadata
Lic Jos A Gonzlez Alonso
Problemas de calidad de los datos
con los procesos de extraccin
Los resultados no son confiables porque los datos
pudieron ser extrados en momentos diferentes
Diversos algoritmos de clculo para valores
derivados (ej: monto total)
Diversos niveles de extraccin
Diversos niveles de granularidad
Los orgenes de los datos son difusos
Diversos significados de los campos de datos
Informacin que falta
No existen reglas de correccin de los datos
Los reportes no tienen capacidad drill-down
Lic Jos A Gonzlez Alonso
Data Warehousing y
Business Intelligence
Datos
Externos
Datos de las
Operaciones
Datos en la
Organizacin
Data Warehouse
de la Empresa
Data Marts
Reportes
analticos
Lic Jos A Gonzlez Alonso
Ventajas del entorno de
procesamiento Warehouse
Controlado
Confiable
Informacin de calidad
Fuentes de datos controladas
Decisores Data
warehouse
Sistemas
internos y
externos
Lic Jos A Gonzlez Alonso
Ventajas del entorno de
procesamiento Warehouse (cont)
Sin doble esfuerzo
Sin necesidad de herramientas de diversas
tecnologas
Sin disparidad con los datos y su significado, o su
representacin
Sin conflictos con los perodos de tiempo
Sin confusin de algoritmos
Sin restriccin de drill-down
Lic Jos A Gonzlez Alonso

Factores de xito para un ambiente de
negocios dinmico

Conocer el negocio
Reinventar frente a nuevos desafos
Invertir en productos
Invertir en clientes
Conservar a los clientes
Invertir en tecnologa
Mejorar el acceso a la informacin del negocio
Proporcionar productos y servicios superiores
Ser rentable
Lic Jos A Gonzlez Alonso
Impulsores del negocio que
proporciona el Data Warehouse

Soporte a los sistemas de informacin
Acceso a la informacin consistente y de alta calidad sobre los
comportamientos de los negocios y los mercados externos
Obtener informacin de calidad:
Reducir costos
Dinamizar el negocio
Mejorar los mrgenes
Lic Jos A Gonzlez Alonso
Mejoras tecnolgicas que permite el
Data Warehousing
Soluciones de hardware y
software ms rentables
Bases de Datos que
manejan grandes
volmenes
Aplicaciones especficas de
Inteligencia de Negocios
Arquitecturas de 64 bits
Mejores herramientas de
consulta
Mejores tcnicas de
indexacin
Herramientas
sofisticadas para el
usuario final
Lic Jos A Gonzlez Alonso
Prctica 1
Esta prctica cubre los siguientes asuntos:
Preguntas acerca data warehousing
Lic Jos A Gonzlez Alonso
Conceptos y terminologa del
Data Warehouse
Lic Jos A Gonzlez Alonso
20
Qu es Data Warehouse?

A data warehouse is a subject-oriented, integrated,
time-variant and non-volatile collection of data in
support of management's decisions
Bill Inmon
A data warehouse is a copy of transaction data
specifically structured for query and analysis
Ralph Kimball

Lic Jos A Gonzlez Alonso
Orientado a un Tema
Los datos son categorizados y almacenados por el
tema del negocio ms que por el uso.
Aplicaciones OLTP
Acciones
Participaciones
Seguros
Prstamos
Ahorros
Data Warehouse
Informacin
financiera del cliente
Lic Jos A Gonzlez Alonso
Integrado
Los datos sobre un tema dado se definen y se
almacenan una vez.
Data Warehouse Aplicaciones OLTP
Cliente
Ahorros
Cuentas
corrientes
Prstamos
Lic Jos A Gonzlez Alonso
Data
Warehouse
Variante con el Tiempo
Los datos se almacenan como una serie de fotos
(snapshots) y cada una representa un perodo de
tiempo.
Lic Jos A Gonzlez Alonso
Permanente (no voltil)
Los datos en el data warehouse no son actualizados o
suprimidos
Warehouse
Select
Carga / Refresh
Operacional
Insert, Update,
Delete, o Select
Lic Jos A Gonzlez Alonso
Cambios en el Data Warehouse
Bases de datos operacionales Warehouse Database
Primera carga
Refresh
Refresh
Refresh
Depuracin
Lic Jos A Gonzlez Alonso
Data Warehouse Vs. OLTP
Caracterstica OLTP Data Warehouse
Tiempo de
Respuesta
Mili-segundos a
segundos
Segundos a horas
Operaciones Leer, grabar,
actualizar
Solamente leer
Naturaleza de los
Datos
30 60 dias Ms tiempo (5-10
aos)
Organizacin de
datos
Aplicaciones Por tema, por
tiempo
Tamao Pequeo a grande Grande a muy
grande
Fuentes de datos Operacional, interno Operacional,
interno y externo
Actividades Procesos Anlisis
Lic Jos A Gonzlez Alonso
Curvas de uso

El sistema operacional es de uso
programado y planificado
Data warehouse:
Uso Variable
Al azar
Lic Jos A Gonzlez Alonso
Expectativas de los usuarios
Controlar las expectativas de los usuarios
Establecer objetivos realizables para el tiempo de
respuesta de las consultas
Definir SLA (acuerdo del nivel de servicio)
Educar a los usuarios
El crecimiento y el uso son exponenciales
Lic Jos A Gonzlez Alonso
Data Warehouse Corporativo
Implementacin a gran escala
El alcance abarca todo el negocio
Datos de todas las reas
Desarrollo incremental
Fuente de datos nica para toda la empresa
Datos sincronizados a nivel corporativo
Punto nico de distribucin de datos para cada
rea
Lic Jos A Gonzlez Alonso
Qu es un Data Mart o
Almacn de Datos?
Es un subconjunto de hechos y datos sumarizados del
Data Warehouse que proporciona a los usuarios
informacin especfica a sus necesidades
departamentales o reas.
Ejemplos: Data Mart del rea Comercial, Data Mart del
rea de Finanzas, etc
Lic Jos A Gonzlez Alonso
Data Warehouses Vs.
Data Marts
Caracterstica Data Warehouse Data Mart
Alcance Empresa Departamento
Temas Mltiple Unidad de negocio o
rea funcional
Fuente de datos Muchos Pocos
Tiempo de puesta
en prctica
Meses a aos Meses
Lic Jos A Gonzlez Alonso
Data Marts dependientes
Data
Warehouse
Data Marts
Archivos
planos
Marketing
Ventas
Finanzas
Marketing
Ventas
Finanzas
Sistemas
operacionales
Datos
externos
Datos de las
operaciones
Datos
heredados
Datos
externos
Lic Jos A Gonzlez Alonso
Data Marts Independientes
Ventas o
Marketing
Archivos
planos
Sistemas
operacionales
Datos
externos
Datos de las
operaciones
Datos
heredados
Datos
externos
Lic Jos A Gonzlez Alonso
Componentes tpicos del
Data Warehouse
Sistemas
origen
Area de
ensayo
rea de
presentacin
Herramientas
de acceso
ODS
Operacional
Externo
Heredados
Repositorio de la Metadata
Data Marts
Data
Warehouse
Lic Jos A Gonzlez Alonso
Enfoques para el desarrollo
del Warehouse
Enfoque Big Bang
Enfoque incremental:
Incremental Top-down
Incremental Bottom-up
Lic Jos A Gonzlez Alonso
Enfoque Big Bang
Anlisis de
requerimientos
Construccin del
Data Warehouse
Reportes del conjunto o
subconjuntos almacenados
en data marts
Lic Jos A Gonzlez Alonso
Enfoque Top-Down
Anlisis de requisitos a nivel empresa
Desarrollar el modelo conceptual de la informacin
Identificar y priorizar las reas temticas
Completar el modelo de las reas temticas seleccionadas
Mapear los datos disponibles
Realizar un anlisis de los sistemas fuente
Implementar la arquitectura tcnica bsica
Definir la metadata, la extraccin, y
los procesos de carga para las reas temticas iniciales
Crear y poblar los data mart iniciales dentro del
marco del data warehouse
Lic Jos A Gonzlez Alonso
Enfoque Bottom-Up
Definir el alcance y la cobertura del
data warehouse y analizar los sistemas origen
dentro de ese alcance
Definir el incremento inicial basado
en la presin poltica, la ventaja asumida
del negocio y el volumen de los datos
Establecer la arquitectura tcnica bsica y
la metadata, la extraccin, y los procesos
de carga segn los requisitos del incremento
Crear y poblar los data marts iniciales
dentro del marco del warehouse
Lic Jos A Gonzlez Alonso
Enfoque incremental
Iteraciones mltiples
Puestas en prctica ms cortas
Validacin de cada fase
Estrategia
Definicin
Anlisis
Diseo
Estructura
Produccin
Incremento 1
Iterative
Lic Jos A Gonzlez Alonso

Componentes del proceso de
Data Warehousing

Metodologa
Arquitectura
Extraccin, transformacin, y carga
(ETL)
Implementacin
Operacin y soporte
Lic Jos A Gonzlez Alonso
Metodologa
Conjunto de pasos o procedimientos detallados
para llevar a cabo un objetivo definido
Identificar claramente los entregables requeridos
Alentar un desarrollo incremental
Aplicar la metodologa enfocada en los resultados
Proporcionar un enfoque por etapas hacia un Data
Warehouse corporativo:
Seguro
Manejable
Probado
Recomendable
Lic Jos A Gonzlez Alonso
Arquitectura
Proporciona el planeamiento, la estructura, y la
estandarizacin necesaria para asegurar la
integracin de componentes mltiples, proyectos y
procesos a travs del tiempo
Establece el marco de trabajo (framework), los
estndares, y los procedimientos para el data
warehouse a nivel de la empresa.
- The Data Warehouse Institute -

Lic Jos A Gonzlez Alonso
Arquitectura (cont)
Algunos componentes que conforman la
Arquitectura del DW:
Origen de los datos
Recoleccin de datos
Manipulacin de datos
Distribucin de datos
Directorio de la informacin
Herramientas de acceso de datos

Lic Jos A Gonzlez Alonso

Extraccin, transformacin,
y carga (ETL)

Los procesos de extraccin, transformacin y carga
de datos (ETL), representan el factor nmero uno de
xito de un proyecto de Data Warehouse, y pueden
absorber hasta el 70 por ciento del tiempo empleado
en un proyecto tpico de Data Warehouse.
- DM Review -
Origen Objetivo rea de ensayo
Lic Jos A Gonzlez Alonso

Extraccin, transformacin,
y carga (cont)

Extraccin
Es el proceso de seleccin de atributos especficos desde
los sistemas operacionales
Transformacin
Es el proceso de integracin, verificacin, validacin,
limpieza y fechado (time-stamp) de los datos seleccionados
en un formato consistente y uniforme para la base de datos
objetivo. Los datos impropios o imprecisos son retornados
al dueo de los datos para su correccin y reproceso.
Carga
Es el proceso de mover los datos desde un rea de
almacenamiento intermedio (staging area) a la base de
datos del Data Warehouse
Lic Jos A Gonzlez Alonso
Implementacin
Arquitectura Data Warehouse
Implementacin
Ej: Implementacin incremental
Incremento1
Incremento 2
Incremento n
.
.
.
Lic Jos A Gonzlez Alonso
Implementacin (cont)
Entregables de la Implementacin:
ANALISIS: confirmar y refinar los requerimientos
DISEO: reunir todas las especificaciones y preparar el
ante-proyecto para el DW corporativo o Data Mart
CONSTRUCCION: poner en marcha y probar DW o
Data Mart y todas las herramientas de apoyo
necesarias
DESPLIEGUE: aceptacin del DW para utilizar en el
negocio
Lic Jos A Gonzlez Alonso
Operacin y soporte
Acceso a los datos y reportes
Actualizacin de datos
Supervisin
Respuesta a los cambios
Administrar, monitorear y tunear
Lic Jos A Gonzlez Alonso
Fases del enfoque
incremental
Increment 1
Estrategia
Definicin
Anlisis
Diseo
Estructura
Produccin
Lic Jos A Gonzlez Alonso
Entregables de la fase de estrategia
Metas y objetivos del negocio
Propsito, objetivos, y alcance del Data Warehouse
Modelo lgico del data warehouse de la empresa
Hitos incrementales
Flujos de datos desde los sistemas origen
Anlisis del gap entre la informacin requerida y
la capacidad de las fuentes de datos para
proporcionar esa informacin
Lic Jos A Gonzlez Alonso
Entregables de la fase de estrategia
Estrategia de la adquisicin de datos
Estrategia de la calidad de los datos
Estrategia de la metadata
Herramientas de acceso a los datos
Estrategia del capacitacin
Lic Jos A Gonzlez Alonso
Prctica 2
Esta prctica cubre los siguientes asuntos:
Preguntas con respecto a los datos que se
almacenan, conceptos y terminologa
Lic Jos A Gonzlez Alonso
53
Historia de Cambios
Versin Fecha Descripcin del Cambio
1.0 Feb-14 1ra edicin.
1.1 Abr-14 Correccin slide 21
1.2 Abr-14 Cambios en ttulos
1.3 Abr-14 Correccin de slide 42

Vous aimerez peut-être aussi