Vous êtes sur la page 1sur 52

Universidad Tecnológica Nacional

Facultad Regional Tucumán


2
pcigliuti@frba.utn.edu.ar
@pabcig
http://mundobi.com.ar (@mundo_bi)

3
Módulo Temas
Conceptos iniciales – Desafíos - Ventajas de BI en la
organización – Inteligencia de negocios y cultura
Módulo 1 empresarial - Los 5 estilos – Data Warehouse –
Introducción a BI Arquitectura de BI – Sistemas OLAP vs. OLTP – Modelo de
madurez – Etapas en un proyecto de BI – Equipos de BI
Toma de requerimientos – Hechos, Dimensiones, Atributo
– Modelado dimensional – Ventajas – Datamarts -
Dimensiones Conformadas - Método de la matriz –
Módulo 2 Introducción a la bases de datos -Tablas de Hechos –
Diseño de DW Tablas look up – Esquema estrella y copo de nieve -
Claves surrogadas – Granularidad - Técnicas de
modelado: SCD, Dimensiones gigantes , Junk Dimensions.
- Tunning
Módulo Temas
Revisión de requerimientos –Estructura de datos de un
ETL - Área de Staging – Flujo de datos: Extracción,
Módulo 3
Limpieza, Carga – Implementación y operación del ETL –
ETL
Responsabilidades – ETL en tiempo real – Conclusiones

Metadata – Creación de atributos, métricas - Jerarquías –


Drill – Creación de Reportes – Funciones de agregación –
Módulo 4
Consumo de información – Modelo de gobernanza – BI
Implementación
Framework - Tableros de comando

Herramientas en el mercado – Tendencias: GeoBI, Redes


Módulo 5 Sociales y BI, BI Saas, Bases de datos orientadas a
Actualidad columnas, Big Data
”Conjunto de subsistemas relacionados entre sí
encargados de recopilar, almacenar, procesar, y
distribuir información para las operaciones y
actividades de dirección y control (decisiones)
de la organización en cuestión.”

Decisiones

Conocimiento

Información

Datos
 Las organizaciones actuales cuentan con
múltiples Sistemas Operacionales, algunos
especializados en un aspecto en particular del
Negocio o Foco y administran gran cantidad de
datos y cierta información.

 Los Organismos actulaes han visto aumentada


su capacidad de generar y recolectar datos..

8
 Dispersa en distintas plataformas o sistemas.
 Duplicadas e inconsistentes entre los distintos
sistemas.
 Sin perspectivas temporales o que permitan
deducir tendencias.
 Los plazos de entrega de información no son
compatibles con las necesidades.
 Altos volúmenes de datos y baja capacidad de
procesamiento y análisis.
 Falta de confidencialidad / Acceso irrestricto

9
 ”En esta organización tenemos montañas de
datos pero no podemos accederlos”
 ”Necesitamos manejar libremente los datos”
 ”Tienen que hacer esto mucho más fácil para la
gente de negocio”
 ”Sólo quiero ver lo que es importante”
 ”No es posible que me reuna con dos personas
que tienen el mismo indicador con distintos
valores”
 ”El área X tiene la información que necesito
pero no me la brinda.”

10
”Procesos, tecnologías y herramientas necesarias
para transformar datos en información,
información en conocimiento, y conocimientos en
planes que nos lleven a tomar una acción de
negocio rentable.” (TDWI)

”La transformación de los datos de la compañía en


conocimiento para obtener una ventaja
competitiva.” (Gartner)

”Conjunto de procesos y herramientas orientadas al


análisis de información para la ayuda a la toma de
decisiones ”
Datos -> Información -> Conocimiento -> Decisiones
 Acceso directo a la info. para investigación y
análisis.
 Datos definidos y organizados según los términos
de negocio.
 Acceso a grandes volúmenes de información.
 Consolidación de información interna y externa.
 Poder responder a cuestiones específicas sin
necesidad de realizar aplicaciones especiales.
 Posibilidad de medir la calidad en algunos
procesos.
 Posibilidad de realizar comparaciones con la
competencia.

12
Los 3 desafíos

1. Ventas
Tener una única verdad
Marketing Ventas Marketing

RRHH Finanzas RRHH Finanzas

2. Lograr una visión integral del negocio

3. Poder acceder a la información que necesito en el momento adecuado


Advanced Reporting

ANALYSIS
Análisis más sofisticados

Multidimensional Analysis (OLAP)

Enterprise Reporting REPORTING

Scorecards &
MONITORING
Dashboards
Alertas & Notificaciones
Proactivas

Más Usuarios
Tableros
• Consumo facil de información con tacómetros
• Vista integrada de los datos de toda la empresa

Scorecards
• Usando Metodologías formales
• Drill Down para ver Performance
Scorecards de Grupos/Empleados

Managed Metrics
• Permite a todos monitorear
las métricas que a cada uno
le interesa
• Indicación Inmediata de
cuando se requiere accionar
Reportes Operacionales Print-perfect
• Via Web e Impresión
• Facil navegación a través de cientos de páginas de reportes
• Prompts que permiten a los usuarios definir el contenido

Reportes de Negocios Pixel-perfect


• Creado por usuarios de negocio, no por
el departamento de sistemas
• Tablas y gráficos integrados

Page-perfect Invoices
and Statements
• On-line Billing
Applications
• Statements
• Other Page Forms
Cortar y extraer
con un análisis OLAP

Ventas de computadoras portatiles


Para todo el 2005
Todas las regiones

Geografía

Ventas de Electrodomésticos
Productos

Para todo el 2004 y Q1 2005


Todas las tiendas en la Región NE

Ventas y Costos Totales


Para Enero 2004 y Enero 2005
Las Top 10 tiendas con mayores ventas
Radar Personalizado de Información

Revisar los datos Las Alertas se disparan Reportes y Alertas son enviados Los usuarios pueden conocer más
En la Base de Datos Basadas en Agendas, Eventos, Al dispositvo preferido Detalle abriendo los adjuntos o
Reglas de Negocio De cada usuario Clickeando los Web links

El Radar Personalizado de
Información constantemente
Revisa la Base de Datos
Análisis Predictivo Básico Análisis Predictivo Avanzado
Basado en Técnicas de Regresión Basado en Técnicas de Data Mining

Alcanzar las Ventas


Mantenerse en el presupuesto
DETERMINAR Responder
QUIEN ES Comprar
CAPAZ DE … Defraudar
Ser Rentable
Puntual

Redes Neuronales, Clustering Algoritmos


Arbol de Algoritmos, Regresiones Multi-
Variables
Notar ambas Predicción Lineal y Lineas de Predicción
Estacional
Estratégico CEO BSC
Directores Dashboard

Táctico Gerentes de negocio Reportes Adhoc


Tablero

Analistas Reportes
Operativo
Consumidores de Alertas
Información

La cantidad de uso que se le de en las áreas


dependerá de la cultura de la organización
Tipo de Info / Características Deseable
Contenido

Estratégico Estratégica •Todas las áreas •Solo por


•Poco detalle excepción.
•En cualquier lugar

Táctica / •Foco en su área. •Historia completa y


Táctico Departamental •Reportes de evaluación de libre acceso
•Análisis largo plazo
•Consultas libres y
complejas
Operativo •Minuto a minuto •Casi on-line
•Poca historia (algunos •Falencia de los
Operativo meses) sistemas
•Consultas pre operacionales
determinadas

21
 Tener acceso a los datos corportativos /
organizacionales.

 Consistencia.

 Herramientas para Consultar, Analizar, y


Presentar la información.

 Publicar Datos (limpios, completos, integros...)

 Utilizar la información, luego conocer, luego


cambiar.

22
Arquitectura BI
Datos Entendimiento Acción

A B C
• ERP
• Ventas
• RRHH
• POS DW
• WEB
• Mercado

MD

A Datos: Centralizar información de multiples fuentes en un Data Warehouse

B Entendimiento: Herramientas de BI y DM para analizar y mejorar el entendimiento del negocio

C Acción: Actuar sobre los hallazgos realizados en el análisis


 Fuentes de datos
 OLTP: sistemas utilizados para la operatoria
del negocio.
 Excel / Archivo de Texto: Archivos como
salida de otros sistemas, o archivos creados a
mano, como podría ser COPLAN.
 Otros DW: porque se encuentran en otro
lugar, o porque aprovecho la info. ya limpia.
 Web 2.0: aprovechar la información de redes
sociales: twitter, facebook, etc.
“Es un repositorio de datos integrado, no volátil, variable
en el tiempo, orientado al negocio, organizado de forma
tal que facilita el análisis de grandes volúmenes de datos
para la toma de decisiones”

Etapas
 Integrado
• Información proveniente de sistemas heterogéneos. (BD, excels, archivos
planos, etc.)
• Procesos de integración de datos y limpieza de información. (unificación de
formatos, códigos, etc.)
 No volátil
• Los datos perduran en el tiempo. Sólo inserts y updates.
 Variable en el tiempo
• Es un repositorio de datos históricos.
• El tiempo de conservación de los datos es mayor que en sistemas
transaccionales.
• La fecha es un dato fundamental, para poder analizar en el tiempo.
 Orientado al negocio
• Los datos están organizados y presentados como se manejan en el negocio.
• Los datos tienen el nivel de detalle y estructura necesarios para los que toman
decisiones.
Arquitectura BI

• Tener una única verdad


• Lograr una visión integral del negocio
• Poder acceder a la información que necesito en el momento adecuado
OLTP y OLAP

 Sistemas OLTP (On Line Transactional


Process)
Sistemas preparados para realizar
transacciones en tiempo real (altas, bajas,
modificaciones y procesos instantáneos).

 Sistemas OLAP (On Line Analitical Process)


Sistemas preparados para atender consultas
complejas y de grandes volúmenes de
datos.
OLTP vs OLAP

OLTP OLAP

Alineados por aplicación o Integrados y alineados en dimensiones que


Alineación e funcionalidad dentro de la tienen sentido para el analisis que requiere
Integración de aplicación, no integrados el negocio
Datos Actualización online Actualización batch (ETL)

Disponibilidad de datos Disponibilidad de datos históricos


recientes o de períodos de
tiempos cortos
Mantenimiento
El acceso a los datos es de tipo El acceso a los datos es de tipo analítico
transaccional (read only)
(read/write/update)

Uso Información detallada y no


redundante orientada a Información agregada y redundante
favorecer la operación
transaccional estructurada para favorecer el análisis
Sistemas OLAP
– ROLAP (OLAP Relacional): se implementan sobre base
de datos relacionales.

• ERP
• Ventas
• RRHH DW
• POS
• WEB
• Mercado
Sistemas OLAP
– MOLAP (OLAP Multidimensional): se implementan sobre
estructuras de almacenamientos específicas orientadas a
consultas y técnicas de compactación de datos.

• ERP
• Ventas
• RRHH DW
• POS
• WEB
• Mercado
Sistemas OLAP
– HOLAP (OLAP Híbrido): utilizan combinación de las 2
tecnologías anteriores.

• ERP
• Ventas
• RRHH DW
• POS
• WEB
• Mercado
 Mayor velocidad de acceso a los datos, los mismos
son guardados en el servidor OLAP en un formato
multidimensional y no se necesita acceder al DW
 Todos los cálculos son pre generados en el
servidor OLAP cuando el cubo es procesado, de
esta forma los cálculos complejos que son parte
del resultado se obtienen más rápido.
 MOLAP usa técnicas de compresión para guardar
datos en el servidor OLAP, ocupando menos
espacio que en una base relacional. (hoy las bases
de datos utilizan técnicas de compresión)
 Se necesita procesamiento extra para la
actualización de datos, consumiendo recursos del
sistema.
 MOLAP guarda una copia de los datos relacionales
en el servidor OLAP, por lo que se necesita invertir
en espacio adicional.
 Si el volumen de datos es grande, el procesamiento
de datos puedo tomar mucho tiempo. Esto se
puede evitar realizando procesamiento
incremental.
 Permite ver datos casi en tiempo real
 Debido a que no es necesario replicar los datos, se
necesita menos espacio.
 En una solución ROLAP todos los datos se
almacenan en la base de datos, con lo cual no hay
límites de crecimiento.
 La respuesta de las consultas es más lenta debido a
que siempre tiene que ir a la base relacional a
buscar los datos.
 Se debe mantener siempre conexión a la base de
datos.
 Orientados a Focos analíticos específicos.

 Muy común para áreas operativas.

 Apunta a las necesidades de información de


un grupo de personas

Data Warehouse Data Marts


Corporativo Departamental
Visión Homogénea Visión Parcial

38
Data Warehouse Data Marts

Alcance •Neutral a las aplicaciones •Requerido por una aplicación específica.


•Centralizado, compartido •Departamental
•Cruza toda la empresa •Orientado a proceso de negocio
•Múltiples BD con datos redundantes
Perspectiva de los •Detallados e históricos •Detallado (algo de historia)
datos •Poca sumarización •Sumarizado
•Suavemente desnormalizado •Fuertemente desnormalizado
Temas •Múltiples áreas temáticas •Única y múltiples áreas temáticas
parciales.

Fuente de datos •Muchas •Pocas


•Operacionales, datos externos •Operacionales, datos externos
•Snapshot de BD OLTP

39
 Son pequeños
 Son menos complejos de construir y más
rápido de obtener que un DW.
 Son escalables a un DW
 Pueden ser dinámicamente integrados para
formar un DW.
 Contienen una única área temática.
 Son más flexibles que los DW
 Son un nuevo concepto

40
 Contiene información Operacional

 De carácter Tático (vs. Estratégico del DW)

 Integrado

 Volátil – No histórico

 Con información reciente

 Detallado

41
Data Warehouse ODS
Estática Dinámica
Histórica Actual / Reciente
Detalla / Sumarizada Detallada
Estratégica Táctica

42
Management Reporting

• Reporter estáticos compartidos en la empresa.

• IT no puede responder rápidamente a los pedidos.

• Esto frustra a los usuarios y pierden credibilidad en IT ya que no les


puede dar acceso a la información necesaria.

• IT termina sacando datos de las bases de datos y cargándole la


información en planillas excels o bases locales.
Spreadsheets

• Bases y excels locales (de escritorio)

• Cada uno contiene un conjunto de datos, métricas y reglas y no


está alineado con ningún otro excel o sistema.

• Como son fáciles de crear, de bajo costo y fáciles de usar proliferan


a lo largo de la empresa.

• Los spreadmarts dificultan a los ejecutivos a tener una foto clara y


consistente de la organización.

• Son difíciles de erradicar porque se tiene sobre ellos gran control a


un costo muy bajo. Esto dificulta pasar a la próxima etapa.
• Los departamentos reconocen la necesidad de proveer de
información a todos los empleados.

• Un datamart es una estructura de datos analítica y compartida que


por lo general a una única área o proceso de negocio.

• La información de estos datamart es consumida con alguna


aplicación OLAP o reportes parametrizables.

• Cada datamart soporta una única definición y regla de negocio y


son nutridos directamente de los sistemas fuentes.

• Satisfacen muy bien las necesidades locales pero no puedo cruzar


información de diferentes áreas.

• Lo que se necesita es un mecanismo para integrar los datamarts


sin poner en peligro la autonomía local.
Data Warehouse

• Los departamentos comienzan a reconocer la necesidad de


estandarizar definiciones, reglas de negocio y dimensiones para
poder integrar toda la info.

• Lo mas común es crear un DW con datamart dependientes


lógicamente en la misma base.

• Ahora se puede realizar análisis cruzando información de diferentes


departamentos.

• Para monitorear la info se comienza a utilizar dashboards donde se


puede ver información cruzada y alertas.
Entrprise Data Warehouse

• Aunque el DW resuelva la mayoría de los problemas, no soluciona


el problema de los siles. Muchas compañías tienen varios DW.

• Así como pasaba con los spreadmars los diferentes dw son


inconsistentes creando barreras para que la información fluya.

• El ROI se empieza a repagar


BI Services

• El data warehouse se volvió una herramienta estratégica para el


negocio.

• El trabajo ya está hecho.

• Pero todavía hay muchas oportunidades.


50
Diseño Selección
Arquitectura productos e
instalación

Definición
de Integración Mantenimiento
Planificación Modelo Diseño Diseño
Requisitos Y del proyecto
proyecto Dimensional Físico ETL
del Despliegue
Negocio

Especificación Desarrollo
Aplicación Aplicación
Usuario Usuario
Ing. Pablo Cigliuti
pcigliuti@frba.utn.edu.ar
@pabcig
http://mundobi.com.ar (@mundo_bi)

Vous aimerez peut-être aussi