Vous êtes sur la page 1sur 31

 

  
una consulta a un almacn de datos consiste generalmente
en la obtencin de medidas sobre los hechos parametrizadas
por atributos de las dimensiones y restringidas por
condiciones impuestas sobre las dimensiones
medida

hecho

Importe total de las ventas durante este ao de los productos


del departamento Bebidas, por trimestre y por categora ?.
Restricciones: productos del departamento Bebidas, ventas durante este ao
Parmetros de la consulta: por categora de producto y por trimestre


    


Bebidas

Marca

Da de la
semana

Categora

Mes
Departamento
Da

Nro_producto

Ao

Trimestre

Tipo

2002

importe
unidades

Almacn

Importe total de ventas en


este ao, del departamento
de Bebidas, por categora y
trimestre

Ciudad

Tipo

Regin



    


trimestre

categora

importe



    


Categora

Trimestre

Ventas

Refrescos

T1

2000000

Refrescos

T2

1000000

Refrescos

T3

3000000

Refrescos

T4

2000000

Zumos

T1

1000000

Zumos

T2

1500000

Zumos

T3

8000000

Zumos

T4

2400000

Presentacin tabular
(relacional) de los
datos seleccionados

Se asumen dos categoras en


el departamento de Bebidas:
Refrescos y Zumos.


    


trimestre
categora

T1

T2

Refrescos 2000000 1000000


Zumos

T3

T4

Presentacin matricial
(multidimensional) de los
datos seleccionados

3000000 2000000

1000000 1500000 8000000 2400000

Los parmetros de la consulta (por trimestre y por categora)


determinan los criterios de agrupacin de los datos seleccionados
(ventas de productos del departamento Bebidas durante este ao).
La agrupacin se realiza sobre dos dimensiones (Producto, Tiempo).


    


Lo interesante no es poder realizar consultas que, en
cierto modo, se pueden hacer con selecciones,
proyecciones, concatenaciones y agrupamientos
tradicionales.
Lo realmente interesante de las herramientas OLAP
son sus operadores de refinamiento o manipulacin
de consultas.
DRILL
ROLL
SLICE & DICE
PIVOT



    


El carcter agregado de las consultas en el Anlisis
de Datos, aconseja la definicin de nuevos
operadores que faciliten la agregacin (consolidacin)
y la disgregacin (divisin) de los datos:
9 agregacin (roll): permite eliminar un criterio de
agrupacin en el anlisis, agregando los grupos
actuales.
9 disgregacin (drill): permite introducir un nuevo
criterio de agrupacin en el anlisis, disgregando
los grupos actuales.



    


Si se desea introducir la dimensin Almacn en el anlisis
anterior e incluir un nuevo criterio de agrupacin sobre la
ciudad del almacn:

Importe total de las ventas durante este ao de los


productos del departamento Bebidas, por trimestre, por
categoras y por ciudad del almacn ?.

Restricciones: productos del departamento Bebidas, ventas durante este ao


Parmetros de la consulta: por categora de producto, por trimestre y por
ciudad del almacn.


    


Bebidas

Marca

Da de la
semana

Categora

Mes
Departamento
Da

Nro_producto

Ao

Trimestre

Tipo

2002

importe
unidades

Almacn

Importe total de ventas en


este ao, del departamento
de Bebidas, por categora,
trimestre y ciudad

Ciudad

Tipo

Regin



    


trimestre

categora

importe

la operacin de DRILL
se realiza sobre el
informe original !



    


Categora

Refrescos
Refrescos

Trimestre

Ventas

T1

2000000

T2

1000000

Refrescos

T3

3000000

Refrescos

T4

2000000

Zumos

T1

1000000

Zumos

T2

1500000

Zumos

T3

8000000

Zumos

T4

2400000

Categora

Trimestre

Ciudad

Ventas

Refrescos

T1

Valencia

1000000

Refrescos

Len

1000000

Refrescos

T1
T2

Valencia

400000

Refrescos

T2

Len

700000

Cada grupo (categora-trimestre) de la


consulta original se disgrega en dos
nuevos grupos (categora-trimestreciudad) para las ciudades de Len y
Valencia.

* Se asumen dos ciudades: Valencia y Len.




Zumos

    

300000

500000

200000

2000000

1000000

400000

100000

500000

T1

T2

T3

T4

Presentacin matricial de
los datos seleccionados.


    

Si se desea eliminar el criterio de agrupacin sobre la


dimensin Tiempo en la consulta original:

Importe total de las ventas durante este ao de los


productos del departamento Bebidas, por categoras ?



    


Bebidas

Marca

Da de la
semana

Categora

Mes
Departamento
Da

Nro_producto

Ao

Trimestre

Tipo

2002

importe
unidades

Almacn

Importe total de ventas en


este ao, del departamento
de Bebidas, por categoras

Ciudad

Tipo

Regin



    


trimestre

categora

importe

la operacin de ROLL
se realiza sobre el
informe original !



    


Categora

Trimestre

Ventas

Refrescos

T1

2000000

Refrescos

T2

1000000

Refrescos

T3

3000000

Refrescos

T4

2000000

Zumos

T1

1000000

Zumos

T2

1500000

Zumos

T3

8000000

Zumos

T4

2400000

Categora

Ventas

Refrescos 8000000
Zumos

12900000



    


Las operaciones de agregacin (DRILL) y disgregacin (ROLL)
se pueden hacer sobre:
9atributos de una dimensin sobre los que se ha definido
una jerarqua: DRILL-DOWN, ROLL-UP
departamento categora - producto (Producto)
ao - trimestre mes - da (Tiempo)
9sobre dimensiones independientes: DRILL-ACROSS,
ROLL-ACROSS
Producto Almacn -Tiempo



    


trimestre

categora

importe

la operacin de DRILL
se realiza sobre el
informe original !



    


Categora

Refrescos

Trimestre

Ventas

T1

2000000

Refrescos

T2

1000000

Refrescos

T3

3000000

Refrescos

T4

2000000

Zumos

T1

1000000

Zumos

T2

1500000

Zumos

T3

8000000

Zumos

T4

2400000

Categora

Trimestre

Refrescos

T1

Enero

1000000

Refrescos

T1
T1

Febrero

500000

Marzo

500000

Refrescos

Mes

Ventas

Cada grupo (categora-trimestre) de la


consulta original se disgrega en dos
nuevos grupos (categora-trimestre-mes).



    

Otras operaciones de OLAP:

9 SLICE & DICE: seleccionar y proyectar


datos en el informe.

9 PIVOT: reorientacin de las dimensiones


en el informe.


    

 

 




















 

!"
#$
%
#&

 

!"
#$
%
#&


PIVOT



   

 

 

!"
#$
%
#&

 

!"
#$
%
#&























    

 
 



















  




 

!"
#$
%
#&

 

!"
#$
%
#&


 

!"




   

 

!"




SLICE
& DICE


    


Las herramientas de OLAP se caracterizan* por:
9 ofrecer una visin multidimensional de los datos (matricial).
9 no imponer restricciones sobre el nmero de dimensiones.
9 ofrecer simetra para las dimensiones.
9 permitir definir de forma flexible (sin limitaciones) sobre las
dimensiones: restricciones, agregaciones y jerarquas entre
ellas.
9 ofrecer operadores intuitivos de manipulacin: drill-down, rollup, slice-and-dice, pivot.
9 ser transparentes al tipo de tecnologa que soporta el almacn
de datos (ROLAP o MOLAP).

*Subconjunto de las 12 reglas propuestas por E.F. Codd para A.D.



  
El Almacn de Datos y las herramientas OLAP se
pueden basar fsicamente en varias organizaciones:
Sistemas ROLAP
9 se implementan sobre tecnologa relacional, pero
disponen de algunas facilidades para mejorar el
rendimiento (ndices de mapas de bits, ndices de JOIN).

Sistemas MOLAP
9 disponen de estructuras de almacenamiento especficas
(arrays) y tcnicas de compactacin de datos que
favorecen el rendimiento del almacn.

Sistemas HOLAP
9 sistemas hbridos entre ambos.



  
Sistemas ROLAP:
9 El almacn de datos se construye sobre un
SGBD Relacional.
9 Los fabricantes de SGBD relacionales
ofrecen extensiones y herramientas para
poder utilizar el SGBDR como un Sistema
Gestor de Almacenes de Datos.


  
Sistemas ROLAP:
Extensiones de los SGBD relacionales:
9 ndices de mapa de bits
9 ndices de JOIN
9 tcnicas de particionamiento de los datos
9 optimizadores de consultas
9 extensiones del SQL (operador CUBE, roll-up)


  
Sistemas MOLAP.
Sistema de propsito especfico:
9 estructuras de datos (arrays)
9 tcnicas de compactacin.
El objetivo de los sistemas MOLAP es almacenar fsicamente
los datos en estructuras multidimensionales de forma que la
representacin externa y la representacin interna coincidan.



  
Estructuras
multidimensionales

El servidor MOLAP
construye y almacena datos
en estructuras
multidimensionales.
La herramienta de OLAP
presenta estas estructuras
multidimensionales.

Herramienta
OLAP

Servidor
MOLAP

Warehouse


  
MOLAP:
Datos

Estructuras
multidimensionales

Herramienta
OLAP

Arrays
Extrados del almacn de datos

almacenamiento y procesos
eficientes

Servidor
MOLAP

la complejidad de la BD se
oculta a los usuarios
el anlisis se hace sobre datos
agregados y mtricas o
indicadores precalculados.

Warehouse


  
ROLAP

MOLAP

Desktop
Herramienta
OLAP
Servidor
Multidimensional

Herramienta
OLAP
Servidor
Relacional

Warehouse


  
ROLAP/MOLAP: Ventajas e Inconvenientes:
ROLAP
9 pueden aprovechar la tecnologa relacional.
9 pueden utilizarse sistemas relacionales genricos
(ms baratos o incluso gratuitos).
9 el diseo lgico corresponde al fsico si se utiliza el
diseo de Kimball.

MOLAP:
9 generalmente ms eficientes que los ROLAP.
9 el coste de los cambios en la visin de los datos.
9 la construccin de las estructuras multidimensionales.



Vous aimerez peut-être aussi