Vous êtes sur la page 1sur 5

OLAP

La explotacin del Data Warehouse mediante informacin de gestin, se fundamenta bsicamente en los niveles agrupados o calculados de informacin. La informacin de gestin se compone de conceptos de informacin y coeficientes de gestin, que los cuadros directivos de la empresa pueden consultar segn las dimensiones de negocio que se definan. Dichas dimensiones de negocio se estructuran a su vez en distintos niveles de detalle (por ejemplo, la dimensin geogrfica puede constar de los niveles nacional, provincial, ayuntamientos y seccin censal). Este tipo de sistemas ha existido desde hace tiempo, en el mundo de la informtica bajo distintas denominaciones. Su realizacin fuera del entorno del Data Warehouse, puede repercutir sobre estos sistemas en una mayor rigidez, dificultad de actualizacin y mantenimiento, malos tiempos de respuesta, incoherencias de la informacin, falta del dato agregado, etc. Los sistemas de soporte a la decisin usando tecnologas de Data Wrehouse, se llaman sistemas OLAP (siglas de On Line Analytical Processing). En general, estos sistemas OLAP deben: Soportar requerimientos complejos de anlisis Analizar datos desde diferentes perspectivas Soportar anlisis complejos contra un volumen ingente de datos

OLAP Es una solucin utilizada en el campo de la llamada Inteligencia empresarial (o Business Intelligence) cuyo objetivo es agilizar la consulta de grandes cantidades de datos. Para ello utiliza estructuras multidimensionales (o Cubos OLAP) que contienen datos resumidos de grandes Bases de Datos o Sistemas Transaccionales (OLTP). Se usa en informes de negocios de ventas, marketing, informes de direccin, minera de datos y reas similares. La propuesta de Codd consista en realizar una disposicin de los datos en vectores para permitir un anlisis rpido. Estos vectores son llamados cubos. Disponer los datos en cubos evita una limitacin de las bases de datos relacionales, que no son muy adecuadas para el anlisis de instantneas de grandes cantidades de datos. Las bases de datos relacionales son ms adecuados para registrar datos provenientes de transacciones (conocido como OLTP o procesamiento de

transacciones en lnea). Aunque existen muchas herramientas de generacin de informes para bases de datos relacionales, estas son lentas cuando debe explorarse toda la base de datos.

Nos referimos a cubos OLAP cuando hablamos de bases de datos multidimensionales, en l a s c u a l e s e l a l ma c e n a mi e n t o f s i c o de l o s da t o s s e r e a l i za e n v e c t o r e s multidimensionales. Los cubos OLAP se pueden considerar como una ampliacin de las dos dimensiones de una hoja de clculo. Por ejemplo, una empresa podra analizar algunos datos financieros por producto, por perodo de tiempo, por ciudad, por tipo de ingresos y de gastos, y mediante la comparacin de los datos reales con un presupuesto. Estos parmetros en funcin de los cuales se analizan los datos se conocen como dimensiones. Para acceder a los datos slo es necesario indexarlos a partir de los valores de las dimensiones o ejes.

El almacenar fsicamente los datos de esta forma tiene sus pros y sus contras. Por ejemplo, en estas bases de datos las consultas de seleccin son muy rpidas (de hecho, casi en tiempo real). Pero uno de los problemas ms grandes de esta forma de almacenamiento es que una vez poblada la base de datos sta no puede recibir cambios en su estructura. Para ello sera necesario redisear el cubo. En un sistema OLAP puede haber ms de tres dimensiones, por lo que a los cubos OLAP tambin reciben el nombre de hipercubos. Las herramientas comerciales OLAP tienen diferentes mtodos de creacin y vinculacin de estos cubos o hipercubos (vase Tipos de OLAP en el artculo sobre OLAP).

La razn de usar OLAP para las consultas es la Velocidad de respuesta. Una base de datos relacional almacena entidades en tablas discretas si han sido normalizadas. Esta estructura es buena en un sistema OLTP pero para las complejas consultas multitabla es relativamente lenta. Un modelo mejor para bsquedas, aunque peor desde el punto de vista operativo, es una base de-datos multidimensional. La principal caracterstica que potencia a OLAP, es que es lo ms rpido a la hora de ejecutar sentencias SQL de tipo SELECT, en contraposicin con OLTP que es la mejor opcin para operaciones de tipo INSERT, UPDATE Y DELETE.

Funcionalidad En la base de cualquier sistema OLAP se encuentra el concepto de cubo OLAP (tambin llamado cubo multidimensional o hipercubo). Se compone de hechos numricos llamados medidas que se clasifican por dimensiones. El cubo de metadatos es tpicamente creado a partir de un esquema en estrella o copo de nieve, esquema de las tablas en una base de datos relaciona. Las medidas se obtienen de los registros de una tabla de hechos y las dimensiones se derivan de la dimensin de los cuadros. La funcionalidad de los sistemas OLAP se caracteriza por ser un anlisis multidimensional de datos corporativos, que soportan los anlisis del usuario y unas posibilidades de navegacin, seleccionando la informacin a obtener. Normalmente este tipo de selecciones se ve reflejada en la visualizacin de la estructura multidimensional, en unos campos de seleccin que nos permitan elegir el nivel de agregacin Jerarqua) de la dimensin, y/o la eleccin de un dato en concreto, la visualizacin de los atributos del sujeto, frente a una(s) dimensiones en modo tabla, pudiendo con ello realizar, entre otras las siguientes acciones: Rotar (Swap): ;alterar las filas por columnas (permutar dos

dimensiones de anlisis)

Bajar (bown): jerarqua inferior

;bajar el nivel de visualizacin en las filas a una

Detallar (Drilldown): ;informar para una fila en concreto, de datos a un nivel inferior

Expandir (Expand): ;id. anterior sin perder la informacin a nivel superior para ste y el resto de los valores

Colapsar (Collapse): ;operacin inversa de la anterior. OLAP: OLAP

Existen dos arquitecturas diferentes para los sistemas multidimensional (MOLAP) y OLAP relacionales (ROLAP). Tipos de sistemas OLAP

Tradicionalmente, los sistemas OLAP se clasifican segn las siguientes categoras:

ROLAP Implementacin OLAP que almacena los datos en un motor relacional. Tpicamente, los datos son detallados, evitando las agregaciones y las tablas se encuentran normalizadas. Los esquemas ms comunes sobre los que se trabaja son estrella copo de nieve, aunque es posible trabajar sobre cualquier base de datos relaciona. La arquitectura est compuesta por un servidor de banco de datos relaciona) y el motor OLAP se encuentra en un servidor dedicado. La principal ventaja de esta arquitectura es que permite el anlisis de una enorme cantidad de datos. La arquitectura ROLAP, accede a los datos almacenados en un Data Warehouse para proporcionar los anlisis OLAP. La premisa de los sistemas ROLAP es que las capacidades OLAP se soportan mejor contra las bases de datos relacionales. MOLAP Esta implementacin OLAP almacena los datos en una base de datos multidimensional. Para optimizar los tiempos de respuesta, el resumen de la informacin es usualmente calculado por adelantado. Estos valores precalculados o agregaciones son la base de las ganancias de desempeo de este sistema. Algunos sistemas utilizan tcnicas de compresin de datos para disminuir el espacio de almacenamiento en disco debido a los valores precalculados. La arquitectura MOLAP usa unas bases de datos multidimensionales para proporcionar el anlisis, su principal premisa es que el OLAP est mejor implantado almacenando los datos multidimensionalmente. Por el contrario, la arquitectura ROLAP cree que las capacidades OLAP estn perfectamente implantadas sobre bases de datos relacionales Un sistema MOLAP usa una base de datos propietaria multidimensional, en la que la informacin se almacena multidimensionalmente, para ser v i s u a l i z a d a multidimensionalmente. HOLAP (Hybrid OLAP) Almacena algunos datos en un motor relacional y otros en una base de datos multidimensional. Comparacin ROLAP HOLAP vs.

Cuando se comparan las dos arquitecturas, se,. pueden realizar las siguientes observaciones:

El ROLAP delega la negociacin entre tiempo de respuesta y el proceso batch

al diseo del sistema. Mientras, el MOLAP, suele requerir que sus bases de datos se precompilen para conseguir un rendimiento aceptable en las consultas, incrementando, por tantolos requerimientos batch. Los sistemas con alta volatilidad de los datos (aquellos en los que cambian las reglas de agregacin y consolidacin), requieren una arquitectura que pueda realizar esta consolidacin ad-hoc. Los sistemas ROLAP soportan bien esta consolidacin dinmica, mientras que los MOLAP estn ms orientados hacia consolidaciones batch. Los ROLAP pueden crecer hasta un gran nmero de dimensiones, mientras que los MOLAP generalmente son adecuados para diez o menos dimensiones. Los ROLAP soportan anlisis OLAP contra grandes volmenes de datos elementales, mientras que los MOLAP se comportan razonablemente en volmenes ms reducidos (menos de 5 Gb) Por ello, y resumiendo, el ROLAP es una arquitectura flexible y general, que crece para dar soporte a amplios requerimientos OLAP. El MOLAP es una solucin particular, adecuada para soluciones departamentales con unos volmenes de informacin y nmero de dimensiones ms modestos. Comparacin general

Otros tipos Los siguientes acrnimos a veces tambin se utilizan, aunque no son sistemas tan generalizados como los anteriores: WOLAP o Web OLAP: OLAP basado u orientado para la web. DOLAP o Desktop OLAP: OLAP de escritorio RTOLAP o Real Time OLAP: OLAP en tiempo real SOLAP o Spatial OLAP: OLAP espacial

Vous aimerez peut-être aussi