Académique Documents
Professionnel Documents
Culture Documents
SEMANA 4
2
ESTE DOCUMENTO CONTIENE LA SEMANA 4
BASE DE DATOS PARA LA TOMA DE DECISIONES E
INTRODUCCIÓN A ORACLE BUSINESS INTELLIGENCE 11G
OBJETIVOS ESPECÍFICOS
Analizar las características de los sistemas OLTP y OLAP en relación al desarrollo de bases
de datos.
Comprender las operaciones analíticas, vista multidimensional de los sistemas y los tipos
de servidores OLAP.
INTRODUCCIÓN
En esta semana se abordarán las características y diferencias de los sistemas OLTP y OLAP.
Además, se explicará qué es un data warehouse y un data mart y cómo estas herramientas de
business intelligence ofrecen una vista particular o global del negocio de cualquier organización.
Dentro de los contenidos se incluyen también las terminologías de data warehouse como
metadata. Estos conceptos entregarán al estudiante y su futuro profesional los fundamentos
teóricos para comprender los componentes de las bases de datos multidimensionales.
Asimismo, serán explicadas las operaciones analíticas básicas de los sistemas OLAP y los tipos de
servidores que contiene, como MOLAP, ROLAP y HOLAP.
3
ESTE DOCUMENTO CONTIENE LA SEMANA 4
1. BASES DE DATOS MULTIDIMENSIONALES
Una de las tecnologías discutidas a menudo en el contexto del data warehouse son los sistemas de
gestión de base de datos multidimensionales o data marts. Estos sistemas proveen información
con la estructura que necesita una organización para tener una mayor flexibilidad de acceso a los
datos y explorar dinámicamente las relaciones entre resumen y detalle de datos, además de un
adecuado control al usuario final. Existe una relación complementaria entre la base de datos
multidimensional y el data warehouse (Inmon, 2002).
Para comprender las diferencias entre los sistemas operaciones y multidimensionales se entregan
las siguientes definiciones:
4
ESTE DOCUMENTO CONTIENE LA SEMANA 4
1.1. DEFINICIONES
Los sistemas OLTP (online transaction processing o procesos de transacciones en línea) son
sistemas de captura de datos transaccionales y se encuentran orientados a la operación diaria y en
tiempo real de una organización como control de inventario o reportes de ventas (Ponniah, 2001).
Características:
Dirección
ejecutiva
Marketing y Finanzas y
ventas contabilidad
OLTP
Operaciones Recursos
administrativas humanos
1
Se refiere a datos (o información) sensibles de ser perdidos.
5
ESTE DOCUMENTO CONTIENE LA SEMANA 4
1.1.2. SISTEMAS OLAP
Los sistemas OLAP (online analytical processing o procesos de análisis en línea) operan con bases
de datos multidimensionales netamente analíticas como comparación de datos, análisis de
tendencias o reportes, proporcionando a los usuarios respuestas rápidas y múltiples vistas de
dichos datos de manera amigable y confiable (Ponniah, 2001).
Características:
Análisis de
requerimientos
Data Diseño
warehouse conceptual
Implementación
Producto
específico
6
ESTE DOCUMENTO CONTIENE LA SEMANA 4
Las principales diferencias entre los sistemas OLTP y OLAP son las siguientes:
Los sistemas operacionales OLTP se encuentran orientados al proceso, en cambio los sistemas
OLAP se encuentran orientados al análisis de la información, su estructura está diseñada para dar
apoyo al proceso de toma de decisiones.
7
ESTE DOCUMENTO CONTIENE LA SEMANA 4
1.1.3. DATA WAREHOUSE Y DATA MART
Un data mart es un subconjunto lógico de un data warehouse completo. Un data warehouse, por
lo tanto, es una unión conformada de todos los data marts. Los data marts son independientes y
se encuentran dirigidos a determinadas áreas de negocio dentro de la empresa (Ponniah, 2001).
Los datos son recibidos desde una fuente de Consultas de acuerdo a un modelo estrella2
almacenamiento. (hechos y dimensiones).
Las consultas a los datos se realizan sobre una Herramienta para el acceso y análisis de datos.
herramienta multidimensional.
2
El modelo estrella es un esquema de datos que tiene una tabla de hechos que contiene los datos para el
análisis, rodeada de las tablas de dimensiones. Ver más en:
https://es.wikipedia.org/wiki/Esquema_en_estrella
8
ESTE DOCUMENTO CONTIENE LA SEMANA 4
Fuente: Cano (2007, p. 124).
METADATA
Metadata es toda la información que se encuentra en el ambiente del data warehouse que no es
la data actual. La metadata es equivalente a una enciclopedia para el data warehouse.
La metadata tiene una variedad de formas para apoyar las necesidades de los técnicos que operan
el data warehouse, de los administrativos y de los usuarios del negocio. Por ejemplo, al tener un
sistema operacional de metadata, este incluye esquemas y copias que facilitan el proceso de
extracción. Una vez que los datos se encuentran en el área de preparación, estos pueden ser
utilizados para la transformación y carga de datos, incluyendo archivos. Incluso el código de
programación a medida que se escribe en el área de preparación de datos es una metadata
(Kimball y Ross, 2002).
REPOSITORIO DE METADATA
Este tipo de repositorio o almacén contiene distintos componentes de metadata, los cuales
pueden ser bases de datos relacionales o multidimensionales, archivos xml, aplicaciones web, etc.
Existen distintas herramientas que permiten administrar repositorios de metadata como, por
ejemplo, Administration Tool de Oracle (Oracle BI Server, 2010).
9
ESTE DOCUMENTO CONTIENE LA SEMANA 4
Arquitectura de Oracle BI Server
CUBO DE DATOS
10
ESTE DOCUMENTO CONTIENE LA SEMANA 4
DATA MART
Es un subconjunto lógico y físico del área de presentación del data warehouse. Originalmente, los
data marts se definieron como agregaciones de subconjuntos de datos para responder alguna
pregunta específica sobre el negocio, pero esta función en la práctica se volvió inviable, porque
estos data marts funcionaban en forma independiente e inflexible, pues no se podían comunicar
entre sí. Esta primera generación fue reemplazada y el data mart actual es un conjunto flexible de
datos, sobre todo de datos atómicos3 (granulares) para proporcionar una fuente operacional y
presentar un modelo simétrico (dimensional), más amigable y consistente con el empleo del
usuario ante consultas emergentes (Kimball y Ross, 2002).
3
Los datos atómicos son aquellos que son más simples, que ya no pueden ser descompuestos, por ejemplo:
short, que es un número entero corto con signo (de solo 2 bytes).
11
ESTE DOCUMENTO CONTIENE LA SEMANA 4
Funcionamiento de un data mart junto a un data warehouse
OLAP permite a los usuarios de negocios tener una visión multidimensional y lógica
de los datos, facilitar la consulta interactiva y el análisis complejo de dichos datos.
12
ESTE DOCUMENTO CONTIENE LA SEMANA 4
1.3.1. OPERACIONES ANALÍTICAS BÁSICAS DE LOS SISTEMAS OLAP
Un ejemplo sería el caso de una cadena de farmacias que desea saber cuál es el monto de las
ventas de perfumería durante el año 2014. Por lo tanto, en este caso:
La gran característica de las herramientas OLAP son sus operadores de manipulación de consultas,
tales como:
Roll-up
Drill-down
Slice and dice
Pivot
ROLL-UP
Para comprender qué significa esta herramienta se muestra como ejemplo el siguiente esquema
en donde se pueden observar las potencialidades de las jerarquías de la dimensión producto, es
decir, es posible explorar en los niveles mayores de agregación (Ponniah, 2001).
DRILL-DOWN
De acuerdo al mismo esquema se puede ejemplificar este concepto ya que este implica acceder a
los niveles más bajos de agregación, es decir, explorar con mayor detalle (Ponniah, 2001).
4
SQL (structured query language o lenguaje de consulta estructurado) es un lenguaje declarativo de acceso
a bases de datos relacionales que permite especificar diversos tipos de operaciones en ellas.
13
ESTE DOCUMENTO CONTIENE LA SEMANA 4
Fuente: Ponniah (2001, p. 361).
En la siguiente imagen se muestra un claro ejemplo de slice and dice: originalmente las tiendas se
encuentran en el eje Z, los productos en el eje X y los meses en el eje Y, pero si se rota el cubo que
compone la información, ahora los productos están en el eje Z, los meses en el eje X y las tiendas
en el Y. El segmento slice que se está considerando también gira. Por tanto, los meses son ahora
mostrados como columnas y las tiendas como filas.
Al volver a rotar, los meses están ahora en el eje Z, las tiendas en el X y los productos en el Y.
Desde luego, el segmento slice también gira. Entonces, en este caso, las tiendas aparecen ahora
como columnas y los productos como filas (Ponniah, 2001).
14
ESTE DOCUMENTO CONTIENE LA SEMANA 4
PIVOT
Este operador permite ir desde una vista general del informe hacia un nivel mayor de detalle. Por
ejemplo, en las tablas que están a continuación se muestra el informe general de ventas por
producto y por sucursal de una cadena de retail y luego el detalle de la tienda de Nueva York
(Ponniah, 2001).
VISTA MULTIDIMENSIONAL
En ocasiones, los usuarios necesitan realizar un análisis multidimensional con cálculos complejos,
pero se encuentran con herramientas tradicionales y que resultan insuficientes para la creación de
informes, consultas, hojas de cálculos e interfaces de lenguajes. Además, las herramientas en los
entornos de data warehouses básicos y OLTP no coinciden, por lo que se requiere un conjunto de
distintas herramientas y productos que estén destinados específicamente para el análisis. Ante
esta situación específica, la vista multidimensional de OLAP en el data warehouse viene a
responder estos requerimientos.
15
ESTE DOCUMENTO CONTIENE LA SEMANA 4
Las características principales de la vista de datos de OLAP son:
Permite a los analistas, ejecutivos y gerentes obtener ideas útiles de la presentación de los
datos.
Puede reorganizar métricas a lo largo de varias dimensiones y permite que los datos sean
visualizados desde diferentes perspectivas.
Complementa el uso de otras técnicas de entrega de información tales como minería de datos.
ROLAP
16
ESTE DOCUMENTO CONTIENE LA SEMANA 4
La metadata adicional apoya a las sumarizaciones5 y agregaciones6. Este modelo puede almacenar
los metadatos en las bases de datos relacionales (Ponniah, 2001).
Fuente: http://slideplayer.es/slide/1677469/
MOLAP
5
La sumarización muestra los datos de una manera más resumida, permitiendo, precisamente, calcular
valores agregados, que no son los datos directos registrados, sino datos derivados de ellos. Se puede utilizar
no solo para construir la vista minable directamente, sino también para realizar un análisis exploratorio. Ver
más en: http://sumarizacionyessengmiranda.blogspot.com/2010/12/definicion.html
6
La agregación es un tipo de asociación que indica que una clase es parte de otra clase. Ver más en:
http://www.seas.es/blog/informatica/agregacion-vs-composicion-en-diagramas-de-clases-uml/
17
ESTE DOCUMENTO CONTIENE LA SEMANA 4
Fuente: http://slideplayer.es/slide/1677469/
HOLAP
HOLAP (hybrid online analytical process o procesamiento analítico en línea híbrido) accede a los
datos de alto nivel en una base de datos multidimensionales y a los atómicos directamente sobre
la base de datos relacional. En esencia, utiliza o combina las ventajas de los servidores ROLAP y
MOLAP (Cano, 2007).
Fuente: http://slideplayer.es/slide/1677469/
18
ESTE DOCUMENTO CONTIENE LA SEMANA 4
COMENTARIO FINAL
De acuerdo a los contenidos de esta semana se mostraron las diferencias entre un sistema OLTP y
OLAP, destacando el enfoque que tiene cada uno. El primero se encuentra dirigido a un modelo
operacional, mientras que OLAP, como un modelo analítico, permite trabajar con grandes
volúmenes de datos.
En los contenidos de data warehouse y data mart se muestra una tabla comparativa para ver las
características que contiene cada uno. Las ventajas que entrega un data warehouse son
importantes para la entrega de información estratégica y la toma de decisiones.
Para finalizar se mostraron las diferentes operaciones básicas de los sistemas OLAP, destacando
las funcionalidades drill-down, que permite ver la información en un nivel de mayor detalle, y slice
and dice, que permite visualizar la información desde distintas dimensiones; funcionalidades que
aportan a la visualización de los datos desde distintas y útiles perspectivas en el análisis de datos
estratégicos de una organización.
19
ESTE DOCUMENTO CONTIENE LA SEMANA 4
REFERENCIAS
Cano, J. (2007). Business Intelligence: Competir con información. España. Fundación Cultural
http://itemsweb.esade.edu/biblioteca/archivo/Business_Intelligence_competir_con_infor
macion.pdf
Ibarra, M. Á. (2006). Procesamiento analítico en línea (OLAP). Argentina. Universidad Nacional del
Inmon, W. H. (2002). Building The Data Warehouse. 3ª edición. EE. UU.: John Wiley & Sons, Inc.
%20Building%20The%20Data%20Warehouse.%20Third%20Edition.pdf
Kimball, R. y Ross, M. (2002). The data warehouse toolkit. The complete guide to dimensional
Oracle. (2015). Fusion middleware metadata repository builder's guide for Oracle Business
http://docs.oracle.com/cd/E14571_01/bi.1111/e10540/intro.htm#BIEMG101
Oracle BI Server. (2010). Administration Tool Oracle Business Intelligence enterprise edition.
https://anuradhasrinivas.files.wordpress.com/2013/03/data-warehousing-fundamentals-
by-paulraj-ponniah.pdf
20
ESTE DOCUMENTO CONTIENE LA SEMANA 4
PARA REFERENCIAR ESTE DOCUMENTO, CONSIDERE:
IACC (2015). Base de datos para la toma de decisiones e introducción a Oracle Business Intelligence
21
ESTE DOCUMENTO CONTIENE LA SEMANA 4
22
ESTE DOCUMENTO CONTIENE LA SEMANA 4