Vous êtes sur la page 1sur 22

HERRAMIENTAS DE BUSINESS INTELLIGENCE

SEMANA 4

Base de datos para la toma de


decisiones e introducción a
Oracle Business Intelligence 11g.
Parte I
ÍNDICE

OBJETIVOS ESPECÍFICOS ...................................................................................................................... 3


INTRODUCCIÓN ................................................................................................................................... 3
1. BASES DE DATOS MULTIDIMENSIONALES................................................................................... 4
1.1. DEFINICIONES ...................................................................................................................... 5
1.1.1. SISTEMAS OLTP ........................................................................................................... 5
1.1.2. SISTEMAS OLAP ........................................................................................................... 6
1.1.3. DATA WAREHOUSE Y DATA MART .............................................................................. 8
1.2. TERMINOLOGÍA DE DATA WAREHOUSE ............................................................................. 9
1.2.1. ¿POR QUÉ SE NECESITA UN DATA MART? ................................................................ 11
1.3. MODELO DE DATOS OLAP ................................................................................................. 12
1.3.1. OPERACIONES ANALÍTICAS BÁSICAS DE LOS SISTEMAS OLAP .................................. 13
1.4. VISTA DE DATOS DE LOS SISTEMAS OLAP ......................................................................... 15
1.5. MODELO DE DATOS DE LOS SISTEMAS OLAP .................................................................... 16
1.5.1. TIPO DE SERVIDORES ................................................................................................. 16
COMENTARIO FINAL.......................................................................................................................... 19
REFERENCIAS ..................................................................................................................................... 20

2
ESTE DOCUMENTO CONTIENE LA SEMANA 4
BASE DE DATOS PARA LA TOMA DE DECISIONES E
INTRODUCCIÓN A ORACLE BUSINESS INTELLIGENCE 11G

OBJETIVOS ESPECÍFICOS
 Analizar las características de los sistemas OLTP y OLAP en relación al desarrollo de bases
de datos.

 Comprender las características y relación entre data warehouse y data mart.

 Comprender las operaciones analíticas, vista multidimensional de los sistemas y los tipos
de servidores OLAP.

INTRODUCCIÓN
En esta semana se abordarán las características y diferencias de los sistemas OLTP y OLAP.
Además, se explicará qué es un data warehouse y un data mart y cómo estas herramientas de
business intelligence ofrecen una vista particular o global del negocio de cualquier organización.

Dentro de los contenidos se incluyen también las terminologías de data warehouse como
metadata. Estos conceptos entregarán al estudiante y su futuro profesional los fundamentos
teóricos para comprender los componentes de las bases de datos multidimensionales.

Asimismo, serán explicadas las operaciones analíticas básicas de los sistemas OLAP y los tipos de
servidores que contiene, como MOLAP, ROLAP y HOLAP.

3
ESTE DOCUMENTO CONTIENE LA SEMANA 4
1. BASES DE DATOS MULTIDIMENSIONALES
Una de las tecnologías discutidas a menudo en el contexto del data warehouse son los sistemas de
gestión de base de datos multidimensionales o data marts. Estos sistemas proveen información
con la estructura que necesita una organización para tener una mayor flexibilidad de acceso a los
datos y explorar dinámicamente las relaciones entre resumen y detalle de datos, además de un
adecuado control al usuario final. Existe una relación complementaria entre la base de datos
multidimensional y el data warehouse (Inmon, 2002).

En la figura se muestra la estructura de un data warehouse, la información se comunica entre el


detalle general y los datos de cada departamento de una compañía.

Fuente: Inmon (2002, p. 182).

La información detallada que se encuentra almacenada en un data warehouse proporciona una


sólida y adecuada fuente para las bases de datos multidimensionales. Los datos que circulan entre
un data warehouse y una base regular como la multidimensional deben ser renovados en forma
periódica. Esto debido a que los datos provenientes de una aplicación (como por ejemplo, OLAP)
se integran cuando ingresan al data warehouse. La base de datos multidimensional no necesita
extraer e incluir los datos que opera desde el entorno operativo. Además, los datos son
almacenados en el nivel mínimo del data warehouse, brindando información disponible para el
análisis de cualquier usuario que utilice la base de datos multidimensional (Inmon, 2002).

Para comprender las diferencias entre los sistemas operaciones y multidimensionales se entregan
las siguientes definiciones:

4
ESTE DOCUMENTO CONTIENE LA SEMANA 4
1.1. DEFINICIONES

1.1.1. SISTEMAS OLTP

Los sistemas OLTP (online transaction processing o procesos de transacciones en línea) son
sistemas de captura de datos transaccionales y se encuentran orientados a la operación diaria y en
tiempo real de una organización como control de inventario o reportes de ventas (Ponniah, 2001).

Características:

 Diseño orientado a la transacción.


 Volatilidad1 de los datos.
 Proporciona soporte muy limitado a la toma de decisiones.

Dirección
ejecutiva

Marketing y Finanzas y
ventas contabilidad

OLTP

Operaciones Recursos
administrativas humanos

1
Se refiere a datos (o información) sensibles de ser perdidos.

5
ESTE DOCUMENTO CONTIENE LA SEMANA 4
1.1.2. SISTEMAS OLAP

Los sistemas OLAP (online analytical processing o procesos de análisis en línea) operan con bases
de datos multidimensionales netamente analíticas como comparación de datos, análisis de
tendencias o reportes, proporcionando a los usuarios respuestas rápidas y múltiples vistas de
dichos datos de manera amigable y confiable (Ponniah, 2001).

Características:

 La data es agrupada desde todas las áreas de la organización y almacenada en un repositorio


central y único.
 Todos los usuarios pueden obtener la misma versión de los datos independientemente de
dónde provengan.
 Orientados al objetivo.

Análisis de
requerimientos

Data Diseño
warehouse conceptual

Implementación
Producto
específico

6
ESTE DOCUMENTO CONTIENE LA SEMANA 4
Las principales diferencias entre los sistemas OLTP y OLAP son las siguientes:

Características OLTP OLAP

Tamaño de la base de datos: Gigabytes. Gigabytes a terabytes.

Origen de los datos: Interno. Interno y externo.

Actualización: Información actual y Información histórica y de gestión.


operacional.

Consultas: Predecibles. Ad hoc (solución específica).

Actividad: Operacional. Analítica.

Fuente: Ibarra (2006, p. 14).

Los sistemas operacionales OLTP se encuentran orientados al proceso, en cambio los sistemas
OLAP se encuentran orientados al análisis de la información, su estructura está diseñada para dar
apoyo al proceso de toma de decisiones.

Fuente: Cano (2007, p. 93).

7
ESTE DOCUMENTO CONTIENE LA SEMANA 4
1.1.3. DATA WAREHOUSE Y DATA MART

Un data mart es un subconjunto lógico de un data warehouse completo. Un data warehouse, por
lo tanto, es una unión conformada de todos los data marts. Los data marts son independientes y
se encuentran dirigidos a determinadas áreas de negocio dentro de la empresa (Ponniah, 2001).

Tabla comparativa entre data warehouse y data mart

Data warehouse Data mart

Corporativo, para toda la empresa. Área de negocio específica de una empresa.

Es un conjunto de data marts. Comprende un solo proceso de negocio.

Los datos son recibidos desde una fuente de Consultas de acuerdo a un modelo estrella2
almacenamiento. (hechos y dimensiones).

Las consultas a los datos se realizan sobre una Herramienta para el acceso y análisis de datos.
herramienta multidimensional.

Arquitectura para la vista corporativa de datos. Arquitectura para adaptarse a la vista


departamental de datos.

Estructura un modelo completo de gestión


utilizando como base un modelo de datos
relacional.

Fuente: Ponniah (2001, p. 26).

2
El modelo estrella es un esquema de datos que tiene una tabla de hechos que contiene los datos para el
análisis, rodeada de las tablas de dimensiones. Ver más en:
https://es.wikipedia.org/wiki/Esquema_en_estrella

8
ESTE DOCUMENTO CONTIENE LA SEMANA 4
Fuente: Cano (2007, p. 124).

1.2. TERMINOLOGÍA DE DATA WAREHOUSE

METADATA

Metadata es toda la información que se encuentra en el ambiente del data warehouse que no es
la data actual. La metadata es equivalente a una enciclopedia para el data warehouse.

La metadata tiene una variedad de formas para apoyar las necesidades de los técnicos que operan
el data warehouse, de los administrativos y de los usuarios del negocio. Por ejemplo, al tener un
sistema operacional de metadata, este incluye esquemas y copias que facilitan el proceso de
extracción. Una vez que los datos se encuentran en el área de preparación, estos pueden ser
utilizados para la transformación y carga de datos, incluyendo archivos. Incluso el código de
programación a medida que se escribe en el área de preparación de datos es una metadata
(Kimball y Ross, 2002).

REPOSITORIO DE METADATA

Este tipo de repositorio o almacén contiene distintos componentes de metadata, los cuales
pueden ser bases de datos relacionales o multidimensionales, archivos xml, aplicaciones web, etc.

Existen distintas herramientas que permiten administrar repositorios de metadata como, por
ejemplo, Administration Tool de Oracle (Oracle BI Server, 2010).

9
ESTE DOCUMENTO CONTIENE LA SEMANA 4
Arquitectura de Oracle BI Server

Fuente: Oracle BI Server (2010).

Para profundizar en el tema, ver el tutorial:


Creación de repositorio de metadatos en Oracle Administration Tool

CUBO DE DATOS

Corresponde al nombre de una estructura


dimensional sobre una plataforma de base de
datos multidimensional o sistema OLAP.
Originalmente se refiere a un caso de tres
dimensiones, por ejemplo: producto, marketing y
tiempo.

En general, los usuarios del área de negocios


desean analizar no solo ventas, sino también otras
métricas (o variables), entre ellas las cinco más
comunes son: costos fijos, costos variables, ventas Fuente: Ponniah (2001, p. 357).
indirectas, ventas directas y margen de utilidad.

10
ESTE DOCUMENTO CONTIENE LA SEMANA 4
DATA MART

Es un subconjunto lógico y físico del área de presentación del data warehouse. Originalmente, los
data marts se definieron como agregaciones de subconjuntos de datos para responder alguna
pregunta específica sobre el negocio, pero esta función en la práctica se volvió inviable, porque
estos data marts funcionaban en forma independiente e inflexible, pues no se podían comunicar
entre sí. Esta primera generación fue reemplazada y el data mart actual es un conjunto flexible de
datos, sobre todo de datos atómicos3 (granulares) para proporcionar una fuente operacional y
presentar un modelo simétrico (dimensional), más amigable y consistente con el empleo del
usuario ante consultas emergentes (Kimball y Ross, 2002).

1.2.1. ¿POR QUÉ SE NECESITA UN DATA MART?

Se definen para satisfacer las necesidades de un departamento o sección de la organización.


Contiene menos información de detalle y más información agregada.

En la construcción de un data mart se siguen dos aproximaciones:

 Definir previamente el almacén de datos de la organización y posteriormente definir sobre él


los data marts.

 Definir previamente los data marts de departamentos y después integrarlos en un almacén de


datos para la organización.

Fuente: Cano (2007, p. 118).

3
Los datos atómicos son aquellos que son más simples, que ya no pueden ser descompuestos, por ejemplo:
short, que es un número entero corto con signo (de solo 2 bytes).

11
ESTE DOCUMENTO CONTIENE LA SEMANA 4
Funcionamiento de un data mart junto a un data warehouse

Fuente: Ibarra (2006, p. 13).

1.3. MODELO DE DATOS OLAP


Los usuarios necesitan el sistema OLAP, pues los otros métodos de distribución o manejo de
información no satisfacen los requisitos de análisis multidimensional con los cálculos pertinentes y
de rápido acceso (Ponniah, 2001).

OLAP permite a los usuarios de negocios tener una visión multidimensional y lógica
de los datos, facilitar la consulta interactiva y el análisis complejo de dichos datos.

Permite a los usuarios desglosar la información para obtener mayores detalles y


agregaciones de métricas a lo largo de una dimensión empresarial individual o a
través de múltiples dimensiones.

Proporciona la capacidad para realizar cálculos complejos y comparaciones, y


presentar resultados de varias maneras, incluyendo cuadros y gráficos.

12
ESTE DOCUMENTO CONTIENE LA SEMANA 4
1.3.1. OPERACIONES ANALÍTICAS BÁSICAS DE LOS SISTEMAS OLAP

Las herramientas de operaciones analíticas permiten obtener una visión multidimensional de la


información y para cada actividad que es objeto de análisis.

La particularidad de estos tipos de herramientas es que el usuario realiza consultas seleccionando


atributos del esquema multidimensional sin que sea necesario el conocimiento de la estructura
interna del almacén de datos. El sistema OLAP genera la consulta y la envía al gestor de consultas,
a través de sentencias SQL4 (Ibarra, 2006).

Un ejemplo sería el caso de una cadena de farmacias que desea saber cuál es el monto de las
ventas de perfumería durante el año 2014. Por lo tanto, en este caso:

 La medida sería: monto.


 El hecho: ventas.
 Las restricciones: productos del departamento de perfumería, ventas del 2014.
 El parámetro de la consulta: por categoría de producto y por trimestre.

La gran característica de las herramientas OLAP son sus operadores de manipulación de consultas,
tales como:

 Roll-up
 Drill-down
 Slice and dice
 Pivot

ROLL-UP

Para comprender qué significa esta herramienta se muestra como ejemplo el siguiente esquema
en donde se pueden observar las potencialidades de las jerarquías de la dimensión producto, es
decir, es posible explorar en los niveles mayores de agregación (Ponniah, 2001).

DRILL-DOWN

De acuerdo al mismo esquema se puede ejemplificar este concepto ya que este implica acceder a
los niveles más bajos de agregación, es decir, explorar con mayor detalle (Ponniah, 2001).

4
SQL (structured query language o lenguaje de consulta estructurado) es un lenguaje declarativo de acceso
a bases de datos relacionales que permite especificar diversos tipos de operaciones en ellas.

13
ESTE DOCUMENTO CONTIENE LA SEMANA 4
Fuente: Ponniah (2001, p. 361).

SLICE AND DICE

En la siguiente imagen se muestra un claro ejemplo de slice and dice: originalmente las tiendas se
encuentran en el eje Z, los productos en el eje X y los meses en el eje Y, pero si se rota el cubo que
compone la información, ahora los productos están en el eje Z, los meses en el eje X y las tiendas
en el Y. El segmento slice que se está considerando también gira. Por tanto, los meses son ahora
mostrados como columnas y las tiendas como filas.

Al volver a rotar, los meses están ahora en el eje Z, las tiendas en el X y los productos en el Y.
Desde luego, el segmento slice también gira. Entonces, en este caso, las tiendas aparecen ahora
como columnas y los productos como filas (Ponniah, 2001).

14
ESTE DOCUMENTO CONTIENE LA SEMANA 4
PIVOT

Este operador permite ir desde una vista general del informe hacia un nivel mayor de detalle. Por
ejemplo, en las tablas que están a continuación se muestra el informe general de ventas por
producto y por sucursal de una cadena de retail y luego el detalle de la tienda de Nueva York
(Ponniah, 2001).

Fuente: Ponniah (2001, p. 359).

1.4. VISTA DE DATOS DE LOS SISTEMAS OLAP

VISTA MULTIDIMENSIONAL

En ocasiones, los usuarios necesitan realizar un análisis multidimensional con cálculos complejos,
pero se encuentran con herramientas tradicionales y que resultan insuficientes para la creación de
informes, consultas, hojas de cálculos e interfaces de lenguajes. Además, las herramientas en los
entornos de data warehouses básicos y OLTP no coinciden, por lo que se requiere un conjunto de
distintas herramientas y productos que estén destinados específicamente para el análisis. Ante
esta situación específica, la vista multidimensional de OLAP en el data warehouse viene a
responder estos requerimientos.

15
ESTE DOCUMENTO CONTIENE LA SEMANA 4
Las características principales de la vista de datos de OLAP son:

 Permite a los analistas, ejecutivos y gerentes obtener ideas útiles de la presentación de los
datos.

 Puede reorganizar métricas a lo largo de varias dimensiones y permite que los datos sean
visualizados desde diferentes perspectivas.

 Soporta el análisis multidimensional.

 Es capaz de realizar drill-down o roll-up dentro de cada dimensión.

 Es capaz de aplicar fórmulas matemáticas y cálculos de medidas.

 Proporciona respuestas rápidas, facilitando el análisis.

 Complementa el uso de otras técnicas de entrega de información tales como minería de datos.

 Mejora la comprensión de resultados a través de presentaciones visuales, utilizando gráficos y


tablas.

 Puede ser implementado en la web.

 Es diseñado para el análisis interactivo.

1.5. MODELO DE DATOS DE LOS SISTEMAS OLAP

1.5.1. TIPO DE SERVIDORES

ROLAP

En el servidor ROLAP (relational online analytical processing o procesamiento analítico online


relacional) los datos se almacenan como filas y columnas de modo relacional. Los datos se
presentan a los usuarios en forma de dimensiones de negocio. Con el fin de ocultar la estructura
de almacenamiento de datos de usuario y presentarlos multidimensionalmente, se crea una capa
semántica de los metadatos, esto se refiere a la capa que traduce la estructura física de la
información (tablas, campos y relaciones) en una orientación de negocio entendible y conocida
por los usuarios. La capa de metadatos admite la asignación de las dimensiones a las tablas
relacionales.

16
ESTE DOCUMENTO CONTIENE LA SEMANA 4
La metadata adicional apoya a las sumarizaciones5 y agregaciones6. Este modelo puede almacenar
los metadatos en las bases de datos relacionales (Ponniah, 2001).

Fuente: http://slideplayer.es/slide/1677469/

MOLAP

En el servidor MOLAP (multidimensional online analytical processing o procesamiento analítico


multidimensional online) los datos para el análisis se almacenan en bases de datos
multidimensionales especializadas. Las grandes matrices multidimensionales forman las
estructuras de almacenamiento. Por ejemplo, el almacenamiento del total de ventas del
departamento de electrónica, en el mes número 2014/01, en la tienda de Iquique y bajo la
distribución de canal online, se realiza en una matriz representada por valores (Electrónica,
2014/01, Iquique, Online). Los valores de la matriz indican la ubicación de las celdas. Estas celdas
son intersecciones de los valores de los atributos de la dimensión. Si se observa cómo se forman
las celdas, se puede ver que no todas las celdas tienen valores de métricas. Si una tienda está
cerrada los domingos, las celdas que representan los domingos serán todas nulas (Ponniah, 2001).

5
La sumarización muestra los datos de una manera más resumida, permitiendo, precisamente, calcular
valores agregados, que no son los datos directos registrados, sino datos derivados de ellos. Se puede utilizar
no solo para construir la vista minable directamente, sino también para realizar un análisis exploratorio. Ver
más en: http://sumarizacionyessengmiranda.blogspot.com/2010/12/definicion.html
6
La agregación es un tipo de asociación que indica que una clase es parte de otra clase. Ver más en:
http://www.seas.es/blog/informatica/agregacion-vs-composicion-en-diagramas-de-clases-uml/

17
ESTE DOCUMENTO CONTIENE LA SEMANA 4
Fuente: http://slideplayer.es/slide/1677469/

HOLAP

HOLAP (hybrid online analytical process o procesamiento analítico en línea híbrido) accede a los
datos de alto nivel en una base de datos multidimensionales y a los atómicos directamente sobre
la base de datos relacional. En esencia, utiliza o combina las ventajas de los servidores ROLAP y
MOLAP (Cano, 2007).

Fuente: http://slideplayer.es/slide/1677469/

18
ESTE DOCUMENTO CONTIENE LA SEMANA 4
COMENTARIO FINAL
De acuerdo a los contenidos de esta semana se mostraron las diferencias entre un sistema OLTP y
OLAP, destacando el enfoque que tiene cada uno. El primero se encuentra dirigido a un modelo
operacional, mientras que OLAP, como un modelo analítico, permite trabajar con grandes
volúmenes de datos.

Además, se muestra un ejemplo práctico de cómo crear un repositorio de metadatos con la


herramienta Administration Tool de Oracle. Al conocer esta herramienta y profundizar en sus
ventajas los estudiantes podrán aportar en una compañía realizando modelos multidimensionales
orientados al negocio.

En los contenidos de data warehouse y data mart se muestra una tabla comparativa para ver las
características que contiene cada uno. Las ventajas que entrega un data warehouse son
importantes para la entrega de información estratégica y la toma de decisiones.

Para finalizar se mostraron las diferentes operaciones básicas de los sistemas OLAP, destacando
las funcionalidades drill-down, que permite ver la información en un nivel de mayor detalle, y slice
and dice, que permite visualizar la información desde distintas dimensiones; funcionalidades que
aportan a la visualización de los datos desde distintas y útiles perspectivas en el análisis de datos
estratégicos de una organización.

19
ESTE DOCUMENTO CONTIENE LA SEMANA 4
REFERENCIAS
Cano, J. (2007). Business Intelligence: Competir con información. España. Fundación Cultural

Banesto. Disponible en:

http://itemsweb.esade.edu/biblioteca/archivo/Business_Intelligence_competir_con_infor

macion.pdf

Ibarra, M. Á. (2006). Procesamiento analítico en línea (OLAP). Argentina. Universidad Nacional del

Nordeste. Disponible en: http://exa.unne.edu.ar/informatica/SO/OLAPMonog.pdf

Inmon, W. H. (2002). Building The Data Warehouse. 3ª edición. EE. UU.: John Wiley & Sons, Inc.

Disponible en: https://akademik.del.ac.id/ebooks/Database/Wiley%20&%20Sons%20-

%20Building%20The%20Data%20Warehouse.%20Third%20Edition.pdf

Kimball, R. y Ross, M. (2002). The data warehouse toolkit. The complete guide to dimensional

modelling. 2ª edición. EE. UU.: John Wiley and Sons, Inc.

Oracle. (2015). Fusion middleware metadata repository builder's guide for Oracle Business

Intelligence enterprise edition. Disponible en:

http://docs.oracle.com/cd/E14571_01/bi.1111/e10540/intro.htm#BIEMG101

Oracle BI Server. (2010). Administration Tool Oracle Business Intelligence enterprise edition.

Disponible en: http://docs.oracle.com/cd/E21043_01/bi.1111/e10540/planning.htm

Ponniah, P. (2001). Data Warehousing fundamentals: A comprehensive guide for IT professionals.

EE. UU.: John Wiley & Sons, Inc. Disponible en:

https://anuradhasrinivas.files.wordpress.com/2013/03/data-warehousing-fundamentals-

by-paulraj-ponniah.pdf

20
ESTE DOCUMENTO CONTIENE LA SEMANA 4
PARA REFERENCIAR ESTE DOCUMENTO, CONSIDERE:

IACC (2015). Base de datos para la toma de decisiones e introducción a Oracle Business Intelligence

11g. Herramientas de Business Intelligence. Semana 4.

21
ESTE DOCUMENTO CONTIENE LA SEMANA 4
22
ESTE DOCUMENTO CONTIENE LA SEMANA 4

Vous aimerez peut-être aussi