Académique Documents
Professionnel Documents
Culture Documents
Cochabamba – Bolivia
2018
1
Dedicatoria
1 GENERALIDADES………………………………………………………………………… 3
2 METODOLOGIA…………………………………………………………………………… 6
3.2 Integración……………………………………………………………………………………... 7
3.4 No Volátil………………………………………………………………………………………. 9
4 OLTP Y OLAP………………………………………………………………………………. 9
5 ETL………………………………………………………………………………………….11
6 MODELO MULTIDIMENSIONAL……………………………………………………….12
6.5 Jerarquía……………………………………………………………………………………… 17
7 SERVIDORES OLAP………………………………………………………………………20
8 CONCLUSIONES…………………………………………………………………………. 22
9 BIBLIOGRAFIA…………………………………………………………………………... 25
10 GLOSARIO DE ACRONIMOS…………………………………………………………… 27
INDICE DE FIGURAS.
INDICE DE TABLAS.
RESUMEN
El Rol de las Bases de Datos en las Organizaciones Modernas es de mucha importancia actualmente, debido
a la gran cantidad de datos, en diferentes formatos, almacenados en diferentes medios, organizados usando
varios gestores de bases de datos SGBD (Data Base Management System, traducido como: Sistema Gestor
de Base de Datos), acumulados por las organizaciones, representa una de las razones, por la cual, las
empresas necesitan utilizar tecnologías que les permitan realizar de manera fácil, rápida y oportuna, un
análisis práctico para estar en constante vanguardia ante los retos que la competencia presenta.
Atendiendo estos problemas es que se usa el concepto de Bases de Datos Multidimensionales las cuales
tienen como metas: El acceder de manera más rápida a la información, modelado multidimensional,
extrayendo la información de diferentes fuentes de almacenamiento, manteniendo la relación entre los datos
de manera completa, que esta sea oportuna, que sea confiable y ante todo entendible, ETL (Extract,
Transform, and Load, traducido como: Extracción, Transformación y Cargado), coadyuvando en la
utilización de todos los datos en aplicaciones de análisis.
Tomando como parámetro el modelo relacional, que es el modelo de datos más extendido, donde la
información se almacena en campos (columnas) y registros (filas o tuplas), se puede decir que las bases de
datos multidimensionales se caracterizan por crear aplicaciones OLAP (On-Line Analytical Processing,
traducido como: Procesamiento Analítico en Línea), los registros son referencia de las métricas que se
desean analizar tomando un campo por cada dimensión y otro por cada hecho, modelado multidimensional
de base de datos, por lo general se crean a partir de información introducida en las bases de datos
relacionales, aplicaciones OLTP (On-Line Transaction Processing, traducido como: Procesamiento
Transaccional en Línea), pero pueden tener otro tipo de fuentes que difieren tanto en estructura y formato.
1
El Rol de las Bases de Datos Multidimensionales en las Organizaciones Modernas | Yuri Vladimir Llanos Aiza
INTRODUCCION
El Rol de las Bases de Datos Multidimensionales en las Organizaciones Modernas, permitirá ver las ventajas
y desventajas al momento de implementar estas bases de datos. Logrando así una perspectiva más completa
en cuanto a la toma de decisiones, que hoy en día es un punto fuerte en el desempeño de toda organización.
El estudio se centrará en elaborar un análisis comparativo entre las bases de datos multidimensionales Vs.
las bases de datos relacionales, y su impacto dentro las empresas modernas, realizando un enfoque en cuanto
a su organización, lenguaje de consulta, rendimiento y otras características relevantes.
De igual manera se efectuará un análisis para un mejor entendimiento, y observar cuando es oportuno hacer
uso de las bases de datos multidimensionales, mostrando los escenarios más habituales a la hora de tomar
decisiones.
Se proporcionara los conceptos más relevantes en cuanto al desarrollo, organización y estructura de una
base de datos multidimensional, en comparación con una base de datos relacional.
De igual forma se desarrollarán temas como la integración de este tipo de bases de datos multidimensionales
con otras herramientas de toma de decisión.
Se explicara de la diferencia entre procesos transaccionales y procesos analíticos, este punto es importante
para tener clara la idea de hacia dónde está orientado el manejo de recursos de hardware que vamos a utilizar.
Se hará un pequeño desarrollo al momento de diferenciar los tipos de servidores que albergan una base de
datos multidimensional.
El propósito del documento es mostrar el rol que actualmente tienen las bases de datos multidimensionales
en las organizaciones modernas, sintetizar los conceptos más relevantes que diferencian el diseño de este
tipo de base de datos para su compresión, viendo la finalidad para la cual son estructuradas, de igual manera,
mostrar un análisis de las ventajas y desventajas en comparación con las bases de datos relacionales,
permitiendo dejar de manera clara la utilidad que tienen las bases de datos multidimensionales dentro de
una organización.
2
El Rol de las Bases de Datos Multidimensionales en las Organizaciones Modernas | Yuri Vladimir Llanos Aiza
1 GENERALIDADES
Las nuevas tendencias y el constante desarrollo del área de la informática, da lugar a que profesionales
informáticos puedan presentar soluciones alternativas a los antiguos paradigmas, que si bien fueron de
mucha ayuda en su momento, en la actualidad se requieren incluir otros conceptos y mecanismos
complementarios.
Las empresas modernas actualmente para mantenerse competitivas requieren dar respuesta inmediata a los
requerimientos de sus actuales clientes, y de aquellos que esperan agregar a su lista, por tal motivo, tienen
que buscar la manera de tener una respuesta más rápida en cuanto a datos estadísticos, tendencias del
mercado y otros que colaboren a estar siempre en la cima del mercado.
Lo que se pretende es mostrar cómo las empresas se adaptan a estos nuevas exigencias de tener siempre a
la mano información precisa y oportuna en el menor tiempo posible, y cual el beneficio en comparación a
solo contar con las bases de datos relacionales para estos fines. El análisis estará centrado en términos
técnicos.
De igual manera hay que tomar en cuenta los costos en los que incurren las organizaciones modernas al no
contar con información oportuna, esto para tomar decisiones que en comparación con la competencia
significa permanecer o desaparecer en el mercado en el que se esté participando. El tema también va de la
mano con la inversión que la organización esté dispuesta a invertir para contar con la información oportuna,
debido a que si bien se cuenta con la información histórica, esta debe ser trasladada a repositorios con la
infraestructura adecuada, y contar con las herramientas para que el proceso sea beneficioso.
Sin embargo a lo largo del tiempo se puede ver cómo han ido evolucionando las bases de datos, en el
siguiente figura.
3
El Rol de las Bases de Datos Multidimensionales en las Organizaciones Modernas | Yuri Vladimir Llanos Aiza
2005 - Bases de
2010 Datos XML
1998 - Bases de Datos
2000 Multidimensionales
1990 - Bases de Datos Distribuidas
1995 Bases de Datos Multimedia
CUARTA GENERACION
1987 Modelos Semánticos, Modelos Orientados a
Objetos
1975 - TERCERA GENERACION
1980 Bases de Datos Relacionales
SEGUNDA GENERACION
1968 -
1970 Sistemas de Bases de Datos Jerárquicos, modelo de Base de Datos
en Red
PRIMERA GENERACION
1960
Sistemas de Archivos
INICIO
1950
Cintas Magnéticas
Figura 1. Bases de Datos Multidimensionales – Evolución
En 1950, se empieza con el origen de las cintas magnéticas, las cuales se utilizaron para cubrir la necesidad
de información de la industria en constante crecimiento. Esta se basaba en leer una cinta o más y colocar
los datos a otra, de igual manera que con las tarjetas perforadas, siendo la nueva cinta a la que se transfería
la información la cinta maestra, estas eran leídas de manera secuencial, según. (Silberschatz, Korth, &
Sudarshan, 2002, pág. 13)
En 1960, apareció el uso de discos, una manera de consultar la información directamente, y era más fácil de
recuperar la información, a diferencia de la cinta magnética no era necesario un orden secuencial. Esto dio
inicio a los sistemas de archivos y posteriormente a las bases de datos jerárquicas y de red, según.
(Silberschatz, Korth, & Sudarshan, 2002, pág. 13)
4
El Rol de las Bases de Datos Multidimensionales en las Organizaciones Modernas | Yuri Vladimir Llanos Aiza
En 1968 – 1970, Edgar Frank Codd definió el modelo relacional y publicó una serie de reglas para la
evaluación de administradores de sistemas de datos relacionales y así nacieron las bases de datos
relacionales, según. (Silberschatz, Korth, & Sudarshan, 2002, pág. 13)
En 1975 – 1980, las bases de datos relacionales con su sistema de tablas, columnas y filas, lograron
posicionarse en el mercado de bases de datos ya que su nivel de programación era bajo y más sencillo,
según. (Silberschatz, Korth, & Sudarshan, 2002, págs. 13, 14)
En 1987, se crea el lenguaje SQL (Structure Query Language), en español Lenguaje Estructurado de
Consultas, con esta incorporación los distribuidores de bases de datos incursionaron de lleno con las bases
de datos orientadas a objetos, según. (Silberschatz, Korth, & Sudarshan, 2002, pág. 14)
En 1990 – 1995, en este lapso de tiempo se dio un salto importante con la aparición de WWW (World Wide
Web), este medio facilitó que la consulta a las bases de datos se realice desde sitios geográficamente más
lejanos. Actualmente tiene una gran cantidad de almacenamiento de información, lo que dio lugar a las
bases de datos distribuidas y multimedia, según. (Silberschatz, Korth, & Sudarshan, 2002, pág. 14)
En 1998 – 2000, la gran cantidad de datos heterogéneos acumulados por las organizaciones y la necesidad
de rapidez en cuanto a la solicitud de información específica para la toma de decisiones, dio lugar a un
nuevo paradigma las bases de datos multidimensionales, según. (Silberschatz, Korth, & Sudarshan, 2002,
pág. 14)
En 2005 -2010, aparecieron las bases de datos XML que constituye un sistema de software que da
persistencia a datos, son asociadas con las bases de datos documentales, según. (Silberschatz, Korth, &
Sudarshan, 2002, pág. 14)
Debido a la necesidad de contar con un sistema que permita recuperar y consolidar datos periódicos de
diferentes fuentes de almacenamiento cada uno con sus diferentes restricciones de normalización, y estos
combinados con otra cantidad de información que para un estudio determinado es innecesaria, da lugar a
las bases de datos multidimensionales, cuya finalidad usualmente es tomar años de información histórica y
esta ser consultada para inteligencia de negocios o actividades de análisis, según. (Rainardi, 2008, pág. 1)
Si bien los sistemas transaccionales permiten realizar todo tipo de consultas su objetivo se centra en
almacenar información de forma constante, las consultas que se hagan serán de información relativamente
corta y a medida que aumente la cantidad de registros se tornara más difícil de acceder a algún tipo de
reporte.
5
El Rol de las Bases de Datos Multidimensionales en las Organizaciones Modernas | Yuri Vladimir Llanos Aiza
Si se habla a nivel de las organizaciones modernas debido al cambio en el que se encuentran sumergidas,
no cuentan con la información organizada en un solo sistema de información, esto debido a la adquisición
de otras empresas y la fluctuante demanda del mercado, haciendo que la información histórica deba ser
procesada y orientada para ser revisada.
2 METODOLOGIA
Método Bibliográfico, consiste en la realización de una investigación cualitativa, que integra los
relatos de acontecimientos bibliográficos sobre el tema de interés en estudio, haciendo una
análisis sobre la información más relevante.
Método Analítico, consiste en dividir en partes más pequeñas el caso de estudio para observar
las causas, naturaleza y su posibles efectos, esto con el fin de entender su esencia, permitiendo
conocer mejor el objeto o caso en estudio.
Una base de datos multidimensional es una colección de datos orientada a un determinado ámbito, integrado,
no volátil y variable en el tiempo, que ayuda a la toma de decisiones en la entidad en la que se utiliza, según.
(Inmon, 2002, págs. 1, 2)
Orientado a un tema
Integración
Variante en el tiempo
No volátil
La organización o estructura tiene que ser en torno grandes temas. Ej. Clientes, productos,
ventas, según. (Inmon, 2002, pág. 31)
Debe ser centrado tanto su modelado y análisis de los datos para la toma de decisiones, no así
para operaciones cotidianas o el procesamiento de transacciones, según. (Inmon, 2002, pág. 31)
Tiene que ser fácil de entender, debiendo excluir todos aquellos datos que no son útiles a la hora
de tomar decisiones, según. (Inmon, 2002, pág. 31)
6
El Rol de las Bases de Datos Multidimensionales en las Organizaciones Modernas | Yuri Vladimir Llanos Aiza
3.2 Integración
Este punto hace énfasis a su construcción, que puede ser a partir de múltiples y heterogéneas fuentes. Ej.
Base de datos relacionales, archivos planos, XML, hojas de cálculo. Se debe hacer uso de técnicas para
mantener la integración y limpieza de los datos, con el fin de garantizar la coherencia en cuanto a la
nomenclatura, estructura y atributos de las diferentes fuentes de datos.
Cualquier conversión o modificación se la debe realizar al momento de mover los datos a la estructura
multidimensional.
En la figura que sigue a continuación se puede observar en la parte izquierda las fuentes de datos que vamos
a utilizar, y la abstracción que se realizará al momento de trasladar la información a la base de datos
multidimensional, tomando el atributo descripción como atributo base de la abstracción, realizando sobre
este atributo las operaciones que sean necesarias para que su tratamiento sea único dentro la base de datos
multidimensional, según. (Inmon, 2002, pág. 32)
Se refiere a que los datos que componen nuestra estructura multidimensional proveen información de una
perspectiva histórica. Por tanto esta información tiene que ser estable, puesto que su representación es más
grande, esencial para el análisis. La forma en la que se agrupará los datos en función del tiempo puede ser
7
El Rol de las Bases de Datos Multidimensionales en las Organizaciones Modernas | Yuri Vladimir Llanos Aiza
representada en meses, trimestres, semestres, años u otro tipo de agrupamiento en función del tiempo que
permita comparar y realizar una conclusión.
En la siguiente figura se realiza un ejemplo tomando como atributo las ventas de los productos de una
empresa avícola para comparar sus líneas de producción por trimestres y ver durante el año en cual debe
hacer más énfasis de publicidad, con el fin de primero mantener su espacio en el mercado y luego crecer sus
expectativa de venta.
Según la figura en los cuatro trimestres hay un marcado cambio entre lo que quiere el consumidor final
dentro las líneas que la empresa ofrece, por tanto es decisión del directorio invertir en las líneas que en el
año pasado tuvieron una venta neta mayor o igual a los 150,000.00 $.-, dejando de largo las otras líneas por
ese periodo de tiempo para el año en curso, según. (Inmon, 2002, pág. 35)
VENTAS
DECISIÓN
NETAS EN $.-
PRIMER TRIMESTRE
POLLO 250,000 INVERTIR EN PUBLICIDAD
TROZADO 150,000 INVERTIR EN PUBLICIDAD
EMBUTIDOS 50,000
SEGUNDO TRIMESTRE
POLLO 350,000 INVERTIR EN PUBLICIDAD
TROZADO 100,000
EMBUTIDOS 100,000
TERCER TRIMESTRE
POLLO 200,000 INVERTIR EN PUBLICIDAD
TROZADO 250,000 INVERTIR EN PUBLICIDAD
EMBUTIDOS 50,000
CUARTO TRIMESTRE
POLLO 500,000 INVERTIR EN PUBLICIDAD
TROZADO 150,000 INVERTIR EN PUBLICIDAD
EMBUTIDOS 150,000 INVERTIR EN PUBLICIDAD
8
El Rol de las Bases de Datos Multidimensionales en las Organizaciones Modernas | Yuri Vladimir Llanos Aiza
3.4 No Volátil
Esta característica indica que el almacenamiento físico tiene que estar separado del resto de las fuentes de
datos, es decir el ambiente transaccional. Limitándose a realizar dos operaciones: La inicialización de datos
y el acceso a los datos. La inicialización de datos se la realiza con el fin de tener toda la información a
disposición sin importar los últimos cambios realizados en las fuentes de datos, porque el análisis se
parametriza por periodos de tiempo. El acceso a los datos es estático no cambiante, ahí es donde reside su
velocidad a la hora de mostrar los datos y empezar a realizar el análisis que se vea conveniente para
decisiones futuras.
En la figura se puede observar las operaciones que se realizan sobre las fuentes de datos, en este caso
registro, actualización, borrado y lectura. Mientras que en la base de datos multidimensional solo se efectúa
la carga o inicialización y la lectura, según. (Inmon, 2002, pág. 34)
OPERACIONES OPERACIÓN
INSERT, UPDATE, DELETE, READ READ
4 OLTP Y OLAP
OLTP (OnLine Transaction Processing), es un tipo de proceso que facilita y administra aplicaciones
transaccionales, las que comúnmente son: Entrada de datos, recuperación y procesamiento de transacciones,
según. (Sinnexus, 2018)
9
El Rol de las Bases de Datos Multidimensionales en las Organizaciones Modernas | Yuri Vladimir Llanos Aiza
OLAP (OnLine Analytical Processing), es un tipo de proceso cuyo objetivo es agilizar la consulta de gran
cantidad de datos, permitiendo analizar la información en función de un determinado tema, permitiendo
realizar conclusiones objetivas, según. (Sinnexus, 2018)
En la siguiente tabla o cuadro se puede observar las diferencias entre estos dos sistemas de procesamiento
de información, tomando en cuenta parámetros de índole técnica.
OLTP OLAP
System Online Transaction Processing Online Analytical Processing
Base de Datos Relacional Base de Datos Multidimensional
Datos operacionales; son la fuente Consolidación de datos; los datos
Fuente de datos
original de los datos provienen de varios fuentes OLTP
Propósito de los Controlar y ejecutar tareas Ayudar con la planificación, problemas
datos fundamentales del negocio de guardado, y soporte de decisión
Objetivo de los Muestra varias tipos actividades del
Muestra el proceso actual del negocio
datos negocio de forma multidimensional
Son por periodos de tiempo y lotes de
Inserciones y Son cortas y rápidas, e inicializadas por
información de larga duración los que se
Actualizaciones el usuario final
refrescan
Relativamente estandarizados y simples.
Consultas Retornan relativamente pocos datos A menudo se usan complejas consultas
almacenados
Depende de la cantidad de datos, los
Velocidad de lotes de datos refrescados y la
Muy rápido
procesamiento complejidad de las consultas pueden
llevar horas
Mucho más grande debido a la
Requerimiento Puede ser relativamente pequeño, si los
estructura de agregación y datos
de espacio datos históricos son archivados
históricos
Típicamente des normalizado con pocas
Diseño de base Altamente normalizado con muchas
tablas, se usan esquemas de copo de
de datos tablas
nieve
El respaldo es vital. Las operaciones con
El respaldo se lo puede efectuar de
Respaldo y los datos son críticas para el negocio. La
forma regular. Algunos entornos solo
Recuperación pérdida de datos conlleva a perdidas
necesitan refrescar las fuentes de datos.
monetarias y problemas legales
Tabla 1. Comparación entre los Sistemas de Procesamiento de Datos OLTP y OLAP
10
El Rol de las Bases de Datos Multidimensionales en las Organizaciones Modernas | Yuri Vladimir Llanos Aiza
5 ETL
ETL (Extraction, Transformation Loading), es el proceso que se ocupa de la extracción de datos desde varias
fuentes, su limpieza, puesta a punto, reorganización, integración e inserción dentro la base de datos
multidimensional. Este proceso puede ser realizado por uno mismo según el requerimiento y la fuente de
datos de la que se pretende absorber la información, pero también existen herramientas que automatizan
este proceso, tal es el caso de Barracuda Software, Data Integrator, metaWORKS, Microsoft SQL Server
Integration Services, MySQL Migration Toolkit, Oracle Warehouse Builder, por mencionar algunas.
1. Extracción de datos. Los datos pueden provenir de distintas fuentes de datos, las mismas pueden
estar en distintas plataformas, pueden ser heterogéneas, pueden tener distinto formatos, según.
(Kimball & Caserta, 2004, pág. 30)
2. Limpieza de datos. Pueden existir errores en los datos y los mismos deben ser corregidos para
evitar malos entendidos, según. (Kimball & Caserta, 2004, pág. 30)
11
El Rol de las Bases de Datos Multidimensionales en las Organizaciones Modernas | Yuri Vladimir Llanos Aiza
3. Transformación de Datos. Al momento de integrar los datos se tienen que hacer las
conversiones necesarias para que la información este en el formato que se va a manejar dentro
la base de datos multidimensional, según. (Kimball & Caserta, 2004, pág. 30)
4. Cargado de la información. Debe estar ordenada, resumida, consolidada, analizada, verificada
en cuanto a integridad, con sus índices y particiones, según. (Kimball & Caserta, 2004, pág. 30)
5. Actualización. Se debe cuidar de que el proceso sea lo más transparente posible de las fuentes
de datos a la base de datos multidimensional, según. (Kimball & Caserta, 2004, pág. 31)
6 MODELO MULTIDIMENSIONAL
Este tipo de modelo ve los datos como cubos, un cubo permite a los datos ser representados en múltiples
dimensiones, un cubo está definido por 2 componentes:
La tabla de dimensiones, donde se puede manejar los ítems (nombre, industria) o tiempo (días,
semanas, meses, años)
Las tablas de hechos, que contiene las medidas y las claves por cada una de las tablas de
dimensiones con las que está relacionada.
Son las tablas que constituyen todo aquello que se quiere almacenar de acuerdo a un tema en específico.
Esta a su vez puede estar relacionada con otras tablas. Su creación puede estar basada en la necesidad de un
usuario experto, o de forma automática, en función de la distribución de los datos, dando la posibilidad de
adicionar o quitar los atributos que se vean convenientes en la etapa de diseño, según. (Kimball & Caserta,
2004, pág. 46)
Son las tablas que constituyen el tema a ser representado, donde los hechos son medidas numéricas, que
expresan la dependencia entre las dimensiones, estas pueden ser propiedades numéricas o formulaciones
que combinen varios valores a medir en uno solo, según. (Kimball & Caserta, 2004, pág. 45)
Debido a que las bases de datos multidimensionales se estructuran a partir de diferentes fuentes de datos,
no se puede hacer uso de las llaves o claves propias de estas fuentes, en su lugar se hace uso de claves
subrogadas que son definidas dentro el entorno de la base de datos multidimensional, siendo estas de tipo
numérico secuencial, sin relación directa con los datos, y sin poseer un significado especial más que el de
orden. Al igual que las tablas de dimensiones se pueden adicionar o quitar atributos en la etapa de diseño,
según. (Kimball & Caserta, 2004, pág. 47)
12
El Rol de las Bases de Datos Multidimensionales en las Organizaciones Modernas | Yuri Vladimir Llanos Aiza
Las tablas de hechos, contiene los nombres de los hechos o las medidas, y también las claves para cada una
de las tablas de dimensiones que se van a relacionar. Los hechos o medidas pueden ser de tres clases:
Aditivas. Son combinaciones a lo largo de una dimensión, según. (Kimball & Caserta, 2004, pág.
47)
Semiaditivas. No se puede combinar en una o más dimensiones, según. (Kimball & Caserta, 2004,
pág. 47)
No Aditivas. No se las puede combinar a lo largo de cualquier dimensión, según. (Kimball &
Caserta, 2004, pág. 47)
A continuación se muestra un ejemplo de una base de datos relacional y su transformación a una base de
datos multidimensional. En el ejemplo se toma en cuenta el ambiente de una oferta de cursos presencial o
virtual.
OnlineCourse
CourseID
StudentGrade URL
EnrollmentID
Rowversion
CourseID
OnsiteCourse
StudentID
CourseID
Grade
Location
Rowversion
Days
Course Time
CourseID Rowversion
Title
Credits
Person
DepartmentID
PersonID
Rowversion
LastName
FirstName Department
DepartmentID
HireDate
Name
EnrollmentDate
CourseInstructor Budget
Rowversion
CourseID
StartDate
PersonID
Administrator
Rowversion
CreatedBy
CreatedDate
ModifiedBy
OfficeAssignment ModifiedDate
InstructorID Rowversion
Location
Rowversion
13
El Rol de las Bases de Datos Multidimensionales en las Organizaciones Modernas | Yuri Vladimir Llanos Aiza
En la figura 6, se puede apreciar las tablas que forman parte de la base de datos relacional donde se aprecia
la normalización de las mismas.
En la figura 7 se distingue con el prefijo Dim las tablas de dimensiones, así también se puede observar la
tabla FactGrade que es la tabla de hechos, y en este caso el hecho o medida que se toma en cuenta es el
grado o nivel, que según la tabla de dimensión se puede analizar lo siguiente:
DimInstructor
InstructorID
InstructorName
Location
HireDate
DimCourse
FactGrade
CourseID
DepartmentID
DimStudent CourseTitle
StudentID CourseID
CourseCredits
StudentName InstructorID
CourseType
StudentID
EnrollmentDate URL
Grade
Location
DimDepartment
DepartmentID
DepartmentName
Budget
14
El Rol de las Bases de Datos Multidimensionales en las Organizaciones Modernas | Yuri Vladimir Llanos Aiza
Las bases de datos multidimensionales requieren de un esquema conciso y orientado a un tema que facilite
la toma de decisiones para el que fue elaborado. Las formas de modelado son:
Esquema de Estrella
Esquema de Copo de Nieve
Constelación de Hechos
Esquema de Estrella. Está basado en una tabla central, la tabla de hechos, que contiene la información sin
datos reiterativos. A su alrededor se tiene las tablas de dimensiones, las que están relacionadas y definen
una dimensión. Cada dimensión contiene una serie de atributos. Estos atributos pueden formar una jerarquía
o una grilla, según. (Jensen, Pedersen, & Thomsen, 2010, pág. 12)
15
El Rol de las Bases de Datos Multidimensionales en las Organizaciones Modernas | Yuri Vladimir Llanos Aiza
Esquema de Copo de Nieve. Es una variante del anterior esquema, donde algunas de las tablas de
dimensión son normalizadas. Al ser normalizadas generan tablas adicionales. Este tipo de esquema reduce
la redundancia gracias a esta normalización, ayudando a que le mantenimiento de las tablas se mas fácil, de
igual forma ahorra un poco más de almacenamiento físico. Pero no todo es ventajas, debido al uso de la
normalización, reduce significativamente el procesado de las consultas, ya que se deben de realizar más
uniones y combinaciones, según. (Jensen, Pedersen, & Thomsen, 2010, pág. 14)
Constelación de Hechos. Se hace uso de varias tablas de hechos, las mismas que comparten tablas de
dimensiones, en otras palabras se lo ve como una recolección de esquemas de estrella, según. (Jensen,
Pedersen, & Thomsen, 2010, pág. 14)
16
El Rol de las Bases de Datos Multidimensionales en las Organizaciones Modernas | Yuri Vladimir Llanos Aiza
Datawarehouse
Data Mart
Datawarehouse, recolección de información centrada en una temática que abarca a toda una organización,
por ende el tipo esquema que mejor se adapta es de la Constelación de Hechos, según. (Rainardi, 2008,
págs. 71 - 111)
Data Mart, su enfoque está orientado a un área de la organización, por tal motivo los esquemas de Estrella
y Copo de Nieve son los más utilizados para este caso, según. (Rainardi, 2008, págs. 71 - 111)
6.5 Jerarquía
Como su nombre indica, lo que se hace es establecer una estructura de conceptos de bajo nivel a uno de más
alto nivel, es decir tratar de abstraer la información sin dejar de largo el retorno para ingresar en conceptos
más específicos, según. (Jensen, Pedersen, & Thomsen, 2010, pág. 18)
17
El Rol de las Bases de Datos Multidimensionales en las Organizaciones Modernas | Yuri Vladimir Llanos Aiza
Datos resumidos. En ingles ROLL UP o DRILL UP. La idea es permitir reducir dimensiones,
con la finalidad de generalizar los conceptos, según. (Jensen, Pedersen, & Thomsen, 2010, pág.
18)
18
El Rol de las Bases de Datos Multidimensionales en las Organizaciones Modernas | Yuri Vladimir Llanos Aiza
19
El Rol de las Bases de Datos Multidimensionales en las Organizaciones Modernas | Yuri Vladimir Llanos Aiza
7 SERVIDORES OLAP
Este servidor ofrece vistas de objetos multidimensionales, debido a que toda su estructura esta previamente
calculada, su tiempo de respuesta tiende a cero, en caso contrario primero se hace un cálculo inicial, según.
(Banchero, 2015, pág. 38)
Por lo general el cubo tiene un alto grado de seguridad, dejando de esta manera su flexibilidad y
escalabilidad muy limitados, por tanto algún cambio significativo implica la generación de todos los cubos
nuevamente, según. (Banchero, 2015, pág. 38)
En la siguiente tabla o cuadro se puede hacer un énfasis entre las ventajas y desventajas al momento de optar
por estos servidores.
20
El Rol de las Bases de Datos Multidimensionales en las Organizaciones Modernas | Yuri Vladimir Llanos Aiza
VENTAJAS DESVENTAJAS
Este servidor ofrece vistas de objetos multidimensionales, el tiempo de respuesta es más visible, su tendencia
es a los segundos y en algunos casos a los minutos, los datos se almacenan en esquemas relacionales, hacen
uso de los esquemas de Estrella y Copo de Nieve, según. (Banchero, 2015, pág. 39)
La interacción del usuario con los datos es directa con las bases de datos relacionales a través de consultas
en distintos motores. La actualización de los datos en la base de datos multidimensional es configurable
para estar a disposición lo antes posible, dependiendo de la necesidad y del hardware utilizado. Por este
motivo el cargado inicial consume menores recursos. Este tipo de servidor es utilizado con mayor frecuencia
ante la necesidad de un análisis a nivel transaccional, según. (Banchero, 2015, pág. 40)
En la siguiente tabla o cuadro se puede hacer un énfasis entre las ventajas y desventajas al momento de optar
por estos servidores.
21
El Rol de las Bases de Datos Multidimensionales en las Organizaciones Modernas | Yuri Vladimir Llanos Aiza
VENTAJAS DESVENTAJAS
Mejor escalabilidad con El proceso ETL es
grandes volúmenes de datos personalizado
Disposición de una gran
variedad de herramientas para Creación de tablas auxiliares
ajustar el código ETL
Dependencia del lenguaje
Datos almacenados en una SQL para los cálculos, que en
base de datos relacional ocasiones no son bien
traducidos
No existen problemas al
momento de hacer consultas
textuales Carencia de un indexado
La modelación de datos no se jerárquico especial
adhiere a un modelo
dimensional estricto
Tabla 3. Ventajas y desventajas de un servidor ROLAP.
8 CONCLUSIONES
Luego de hacer un análisis de los conceptos de bases de datos multidimensionales, se hace un desarrollo de
las conclusiones a las que se llegan, todo en función a los antecedentes específicos con los que se dio inicio
a este estudio, como sigue a continuación:
Concepto de una base de datos multidimensional. Este apartado indica que se tiene que tener la
idea clara de los reportes que se desean crear para su posterior análisis. Ya que si el tema no está
bien orientado dará lugar a un mala captación de datos, pérdida de tiempo, y por ende una
estructura multidimensional que no servirá para hacer un correcto análisis.
De igual manera la integración de los datos, vale decir las fuentes desde donde se cargar la
información debe ser puntual para no incurrir en redundancia y así incrementar el tiempo de
procesamiento al momento de tener el resultado final.
La variabilidad en el tiempo será dependiente del usuario final, pero la idea es que se absorba la
cantidad de datos que sean necesarios al momento de hablar de reportes históricos, ampliando la
velocidad de respuesta.
La no volatilidad de los datos extraídos, si bien la teoría indica que no exista grado de asociación
con las fuentes de datos esta deberá estar sometida a la inversión que la empresa esté dispuesta
22
El Rol de las Bases de Datos Multidimensionales en las Organizaciones Modernas | Yuri Vladimir Llanos Aiza
a asumir, ya que una mezcla de esta información puede terminar en problemas de asociación, a
la vez que las fuentes de datos deberían de ser un respaldo para poder generar las veces que sea
necesario la base de datos multidimensional.
Diferencia entre OLPT y OLAP. Este subtema indica el uso que debemos de analizar y
diferenciar al momento de modelar una base de datos. Aunque hay una diferencia marcada entre
ambos no quiere decir que no se pueda hacer uso el uno del otro, y más bien dejar en manos de
alguna herramienta ETL, la unión de la información con los fines que se vea conveniente.
De esta manera se puede organizar la empresa con el fin de tener la información transaccional
en manos de la parte operativa y la de toma de decisiones en manos de la alta gerencia o los
cargos superiores, manteniendo un flujo de información transparente.
Características de ETL. Este punto muestra el concepto de la extracción de la información de
diversas fuentes, siendo estas variables en cuanto a estructura de almacenamiento, diferente
sistema operativo, y como es de índole histórica, de versiones que no cuenten con el soporte
actual.
La transformación de toda esta información extraída, da lugar al uso de algoritmos que faciliten
el tener la información de manera ordenada y bien depurada.
El cargado es volcar esta información a los repositorios de datos multidimensionales que ya están
definidos y desde donde se podrá acceder a la información lista para ser mostrada al usuario
final.
Modelo multidimensional. Este subtema muestra que en cualquier modelo multidimensional se
parte de dos parámetros la tabla de dimensiones y la tabla de hechos, la primera para ver el
entorno con el que se generan los reportes de la segunda, que es la que contiene las medidas.
De acuerdo a la complejidad de nuestro modelo esta puede dar lugar a esquemas que van desde
el más sencillo que es el de estrella (también llamado por su complejidad Data Mart), pasando
por el de copo de nieve y el más complejo que es la constelación de hechos (también conocido
como Datawarehouse), de igual manera se ve el tema de jerarquía, que se refiere al hecho de la
abstracción de la información, tomando en consideración lo general y lo especifico, pudiendo
estar entrelazadas las consultas y facilitando el acceso a la información requerida.
Servidores OLAP. En este punto se debe hacer una diferenciación de la persistencia en el tiempo
y la cantidad de información que se necesita analizar. Debido a que si solo se habla de
persistencia en el tiempo y que solo se va recuperar cierta información histórica, la mejor opción
sería un servidor MOLAP, ya que la estructura de la base de datos multidimensional se
23
El Rol de las Bases de Datos Multidimensionales en las Organizaciones Modernas | Yuri Vladimir Llanos Aiza
mantendría de forma estática en cuanto a estructura y solo se tendrá que consumir recursos de
actualización de datos cada cierto tiempo. Por el caso contrario si se habla de persistencia en el
tiempo y que a la vez la información a ser analizada se necesita que sea constantemente
actualizada la mejor opción sería tomar un servidor ROLAP, ya que existe una mejor respuesta
al tener una constante comunicación con la base de datos relacional. Cabe indicar que las bases
de datos multidimensionales son un complemento o consecuencia de las bases de datos
relacionales.
Los servidores ROLAP, cuyo modelamiento se basa en los esquemas estrella y copo de nieve
son los que caen en este problema ya que su tiempo de respuesta puede caer en un tiempo
considerable, pero antes de dejar de largo esta opción hay que hacer un análisis en cuanto a la
disponibilidad actual de los datos, y el hardware con el que se cuenta ya que puede balancear la
deficiencia.
Por otro lado hay que ver que si los parámetros anteriormente mencionados son inversos la mejor
opción sería optar por un servidor MOLAP, ya que los datos no necesitarían estar constantemente
actualizados, por lo cual la estructura multidimensional estaría previamente calculada y a
disposición en el momento que sea necesario, solo considerando el tiempo de actualización de
la información, esta base de datos multidimensional sería la más opción óptima.
24
El Rol de las Bases de Datos Multidimensionales en las Organizaciones Modernas | Yuri Vladimir Llanos Aiza
9 BIBLIOGRAFIA
manager
Chris Anderson, J. L. (2010). CouchDB: The Definitive Guide. United States of America: O'Reilly.
Empresariales [Película].
Inmon, W. H. (2002). Building the Data Warehouse Third Edition. New York: John Wiley & Sons,
Inc.
Jensen, C. S., Pedersen, T. B., & Thomsen, C. (2010). Multidimensional Databases and Data
Kimball, R. &. (2011). The data warehouse toolkit: the complete guide to dimensional modeling.
Kimball, R. (1996). The Data Warehouses Toolkit: Practical Techniques fro Building Dimensional
Kimball, R., & Caserta, J. (2004). The Data Warehouse ETL Toolkit. Danvers: Wiley Publishing,
Inc.
https://www.researchgate.net/figure/ETL-Phases_fig1_289495049
Rainardi, V. (2008). Building a Data Warehouse: With Examples in SQL Server. Berkeley: Apress.
25
El Rol de las Bases de Datos Multidimensionales en las Organizaciones Modernas | Yuri Vladimir Llanos Aiza
Silberschatz, A., Korth, H. F., & Sudarshan, S. (2002). FUNDAMENTOS DE BASES DE DATOS.
S. A. U.
https://www.sinnexus.com/business_intelligence/olap_vs_oltp.aspx
administracion-de-base-de-datos/
26
El Rol de las Bases de Datos Multidimensionales en las Organizaciones Modernas | Yuri Vladimir Llanos Aiza
10 GLOSARIO DE ACRONIMOS
BDR, acrónimo que viene de los términos originales en inglés, Data Base Relational, significa: Base de
Datos Relacional
ETL, acrónimo que viene de los términos originales en inglés, Extraction, Transformation Loading,
significa: Extraer, transformar y cargar.
OLAP, acrónimo que viene de los términos originales en inglés, OnLine Analytical Processing, significa:
Procesamiento Analítico en línea.
OLTP, acrónimo que viene de los términos originales en inglés, OnLine Transaction Processing, significa:
Procesamiento de transacciones en línea.
SQL, acrónimo que viene de los términos originales en inglés, Structure Query Language, significa:
Lenguaje de consulta estructurada.
WWW, acrónimo que viene de los términos originales en inglés, World Wide Web, significa: Red
informática mundial.
XML, acrónimo que viene de los términos originales en inglés, Extensible Markup Language, significa:
Lenguaje de marcado extensible.
27