Académique Documents
Professionnel Documents
Culture Documents
Los directores ven la informacin como un recurso crtico y requieren sistemas que les
permitan explotarla para obtener una ventaja competitiva. Una forma de utilizar mejor
informacin de la organizacin es a travs de procesamiento analtico en lnea y bases de
datos multidimensionales (MDDBs). OLAP y MDDBs presentarn informacin resumida de las
bases de datos de la compaa. Utilizan estructuras multidimensionales que permiten a los
administradores fragmentar los datos de rendimiento de la empresa y profundizar en los
puntos conflictivos. Desde hace ms de una dcada, los promotores han promocionado estas
herramientas como el sistema de informacin ejecutiva definitiva, pero la mayor parte de la
publicidad de productos proviene de los propios proveedores. Sobre la base de nuestra
experiencia con varias herramientas OLAP, hemos desarrollado un enfoque ms pragmtico
para el diseo de sistemas de informacin multidimensional que permite a los administradores
a tomar la mayor parte de los activos de informacin de sus empresas.
Vista superior
Los administradores a menudo tienen una actitud ambivalente hacia los sistemas de
informacin. Por un lado, la paradoja de la productividad conocida sugiere que no existe una
correlacin entre la inversin y el rendimiento de IT de una organizacin. A pesar de este
hecho, las organizaciones siguen gastando una gran proporcin de sus presupuestos en los
sistemas de IT.
Por otro lado, algunos administradores ven los sistemas de informacin como una parte
esencial del xito del negocio, moderno, la mejora de la eficiencia de los procesos de negocio y
apoyar formas innovadoras de hacer negocios. La creciente popularidad de almacenamiento
de datos sugiere que muchos administradores ahora ven los enormes volmenes de datos
almacenados en bases de datos de la organizacin como un potencial activo de la empresa. Se
utiliza con eficacia, estos datos proporcionan informacin para la toma de decisiones de
gestin y planificacin estratgica. De hecho, creemos que la paradoja de la productividad no
implica que las organizaciones estn desviando su inversin en IT. En su lugar, la paradoja
simplemente no tiene en cuenta el valor de los activos de informacin en bases de datos de la
compaa.
Esta informacin est disponible a travs de una interfaz grfica de usuario interactiva, y la
literatura utiliza el trmino "OLAP" para describir el conjunto de herramientas que apoyan
estas manipulaciones. OLAP es compatible con el anlisis de negocio en los niveles ejecutivos y
de gestin, tal como OLTP en lnea automatiza los procesos de negocio a nivel operativo.
Varias variantes de OLAP se han desarrollado durante los ltimos aos, siendo el ms
importante de OLAP multidimensional (MOLAP) y OLAP relacional (ROLAP). Las principales
diferencias entre las dos tecnologas son la capacidad de procesamiento de almacenamiento
de datos y la actualizacin de los datos.
Los datos en los sistemas MOLAP se carga peridicamente a partir de bases de datos
relacionales de una organizacin en un hipercubo semipermanente. Al cargar estos datos, es
necesario realizar varias agregaciones de los datos de origen y para "limpiar" los datos
mediante la eliminacin de duplicados o registros incompletos que puedan existir en los datos
de origen. Este mecanismo ofrece una mayor flexibilidad y un mejor rendimiento, lograr un
ptimo rendimiento y flexibilidad para los usuarios de la MDDB. Una crtica muy comn en
MOLAP es la falta de estandarizacin entre los productos patentados MDDB que lo incorporan.
Sin embargo, el hecho de que la mayora de las bases de datos MOLAP son de slo lectura y se
puede automatizar el proceso de sacar los datos de todos los RDBMS estndar minimiza este
inconveniente.
ROLAP, por otra parte, analiza los datos originales en la base de datos de la organizacin actual
o un almacn de datos relacional. Utilizando los datos de origen permite a los usuarios
directamente (en teora) clasificar el nivel de unidad de datos, generalmente por medio de
extensiones SQL. Sin embargo, la potencia de procesamiento para llevar a cabo este tipo de
anlisis sobre la marcha es enorme, lo que requiere equipos caros y de alto rendimiento.
Adems, los sistemas ROLAP tienden a usar slo las bases de datos actuales de la organizacin
as que carecen de datos histricos. ROLAP tiene la ventaja de estar atado a los estndares de
sistemas abiertos de las RDBMS.
Varios informes han discutido las altas tasas de fracaso de los proyectos OLAP; la mayora de
los proyectos gastan demasiado esfuerzo por muy poco beneficio. Estamos de acuerdo con la
observacin -a menudo llamada la regla 80 20 - que las organizaciones obtienen el 80 por
ciento de los beneficios de cerca del 20 por ciento del esfuerzo. La ganancia restante 20 por
ciento en funcionalidad se requiere el 80 por ciento del esfuerzo y es casi seguro que no vale la
pena.
Tambin estamos a favor de desarrollo incremental, lo que conduce a una mayor aceptacin
por parte de todos los interesados en la organizacin, ya que fomenta el crecimiento de una
comprensin mutua entre las partes interesadas. El desarrollo incremental tambin permite a
una organizacin alcanzar un equilibrio entre los beneficios a corto y largo plazo.
Existe la creencia general de que el enfoque de abajo hacia arriba es ms comn, pero ms
probable que conduzca al fracaso. Esto se conoce como el sndrome de la disponibilidad de
datos; es decir, slo porque usted tiene una gran cantidad de datos no hay ninguna razn para
ponerlo todo junto y ponerlo a disposicin de todo el mundo. Dos estudios de caso destacan
ventajas e inconvenientes de cada enfoque.
Hay, sin embargo, al menos dos problemas con este enfoque. En primer lugar, la MDDB no
est totalmente integrada con las bases de datos de la Organizacin subyacentes, por lo que el
MDDB no refleja inmediatamente cambios en la estructura de esas bases de datos. Por
ejemplo, una unidad de negocio podra aadir o fusionar las regiones geogrficas en sus bases
de datos, pero el MDDB no reflejara estas diferencias. Ese cambio significa que las bases de
datos de la unidad de negocio ya no eran compatibles con el modelo de datos
multidimensional en el MDDB. Los gestores tendran que decidir cmo anticipar y hacer frente
a los posibles cambios en los datos de origen.
En segundo lugar, estaba claro que el desarrollador adapt este sistema a las necesidades de
un gerente en particular. El MDDB no era necesariamente adecuado, en la forma que tena,
para un uso ms general.
CASO 2: EL ENFOQUE DE ABAJO HACIA ARRIBA
Caso 2 se refera al desarrollo de un sistema de MDDB para analizar los datos existentes de los
alumnos en una universidad grande. Estos datos incluye tanto la informacin demogrfica
sobre los estudiantes y los registros del curso del estudiante. La universidad almacena los
datos de origen en una base de datos Oracle con un diseo relacional basado en los requisitos
de informacin del gobierno. La implantacin se inici con un anlisis de los datos en la base
de datos relacional existente para identificar las medidas y dimensiones que se relacionan con
un tema de inters. Estas medidas y dimensiones que normalmente forman lo que se conoce
como el esquema en estrella.
- una tabla de hechos , que consiste en las medidas numricas que existen dentro de la
base de datos, y
- tablas de medidas, que son elementos de datos ms descriptivos que se asignan a las
dimensiones naturales dentro de la empresa.
La tabla de hechos se compone de varias partes claves que vinculan de nuevo a las tablas de
dimensiones, produciendo un esquema de estrella o de copo.
Para traducir correctamente los datos de una base de datos relacional en un MDDB es
necesario identificar el esquema de estrella dentro de la base de datos relacional que se
refiere a los sujetos que los analistas de negocios de inters. El proceso de traduccin es
esencialmente una de desnormalizacin y, por tanto; la simplificacin. Se debe, en principio,
ser posible utilizar un procedimiento automatizado.
Tal procedimiento estaba disponible en el producto de software utilizado en este caso. Sin
embargo, la extraccin de datos multidimensionales, significativa a partir de una gran base de
datos de la organizacin, de relacin era extremadamente difcil, incluso para personal
altamente calificado. Esto fue particularmente cierto cuando (como suele ser el caso) los datos
de origen no fueron diseados para el propsito de la MDDB. En este caso, decidimos convertir
slo una parte de todo el conjunto de datos en forma multidimensional. El sistema resultante
era de poco inters para la gestin, cuya principal preocupacin era para resumir la
informacin en todo el conjunto de datos. Dados los problemas con los datos subyacentes, la
administracin decidi cancelar el proyecto.
UN ENFOQUE INTERMEDIO
Hemos utilizado las lecciones aprendidas de los casos 1 y 2 para crear un enfoque compuesto
para el desarrollo MDDB. Nuestro enfoque intermedio llevado a cabo consiste en las siguientes
directrices para un nuevo enfoque, pragmtico del desarrollo MDDB:
- Dar de alta un gestor adecuado para actuar como promotor del proyecto. Entrevistar a
este gestor para determinar un conjunto de trabajo inicial de medidas y dimensiones,
centrndose en las necesidades de informacin de todos los gerentes.
- Localizar las fuentes de datos para el mayor nmero de estas medidas y dimensiones
como sea posible, la identificacin de un conjunto de datos de ejemplo que es
relativamente fcil de extraer.
- Identificar cualquier informacin disponible en estas fuentes que el promotor del
proyecto no se ha identificado. Tener el patrocinador evaluar la utilidad de dichos
datos a otros gestores.
- Eliminar las medidas o dimensiones que no son esenciales para las necesidades de los
gerentes de reuniones o que son difciles de extraer. Esta optimizacin se aplica la
regla 80-20.
- Construir un prototipo utilizando una herramienta de desarrollo MDDB y tienen tanto
el promotor del proyecto y el gestor de bases de evaluarlo.
- Si es necesario, el gestor de bases modifica los datos de origen para facilitar la
extraccin de los datos MDDB.
CASO 3
Hemos probado este enfoque en dos estudios de casos nuevos. Caso 3 afecta al desarrollo de
un sistema MDDB para ayudar a los administradores de una universidad recoger y realizar un
seguimiento de los datos de publicacin de investigacin. El gerente de la oficina de
investigacin de la universidad indic qu medidas y dimensiones seran tiles para la
planificacin y gestin. La disponibles en las colecciones de datos del sitio fueron analizados
para identificar las fuentes de datos existentes que podran proporcionar las medidas y
dimensiones requeridas. Los datos de la publicacin de cada ao se almacenan en un nico
archivo plano que podran ser fcilmente exportados a un archivo de texto delimitado por
comas. Se utiliz una herramienta OLAP para cargar el archivo delimitado por comas en un
modelo multidimensional de estos datos.
Aunque el sistema OLAP funcion bien y cumpli con todos sus requisitos de diseo, los altos
directivos no lo han utilizado, como se pretenda originalmente. Sin embargo, la organizacin
cargue los datos de publicacin de cada ao en el sistema y varios mandos medios (no oficial)
utilizar los datos. Las razones de su utilizacin por los mandos medios en lugar de los altos
directivos parecen ser poltica, ms que tcnico. A pesar del aumento de la funcionalidad
ofrecida por el sistema OLAP, los registros de publicacin oficial todava se almacenan en
archivos planos que no proporcionan altos directivos con una visin efectiva de los datos.
CASO 4
En este punto, los requisitos fueron exclusivamente de arriba hacia abajo. A pesar de que el
sistema podra almacenar y analizar una variedad de informacin sobre la salud de datos, las
cifras de comercio, valores de la tierra , y as sucesivamente - este estudio de caso se utiliza el
censo de Australia 1991 como la fuente de datos . Los datos contienen la unidad (registro de
nivel) de datos para cada uno de 63.000 viviendas, 67.000 familias y 168.000 personas.
Contena ms de 60 dimensiones, y el nmero de miembros en cada dimensin vara de dos (el
sexo de la persona) a 58 (campo de la calificacin ms alta). MDDBs se desarrollaron durante
varios subconjuntos de las dimensiones disponibles para cada entidad porque MDDBs que
contienen todas las dimensiones para una sola entidad eran prohibitivamente grandes. Por lo
tanto, los datos en s determin la estructura de cada modelo, un enfoque de abajo hacia
arriba.
COMPARACIONES
Los cuatro estudios de caso muestran que la visin multidimensional de datos puede
proporcionar a los usuarios un medio eficaz para dar sentido a las grandes cantidades de
datos. La estructura de datos pero significativo simplificado en un MDDB coincide con las
necesidades de informacin de los usuarios. Los ms notables de estos son los altos directivos
que quieren peridicamente informacin resumida y comparativa sobre el rendimiento hacia
los objetivos de negocio.
Por el contrario, los datos subyacentes de la cual un MDDB debe extraer informacin til es, en
la mayora de los casos, almacenados en estructuras relacionales que facilitan el
procesamiento de las transacciones de negocios da a da. Los datos de negocio acumulado en
las bases de datos de la organizacin son a menudo extremadamente complejos. Caso 2
demostr que esta complejidad es difcil de evitar si se utiliza una metodologa de abajo hacia
arriba para disear un MDDB. En este caso, el proceso de bsqueda de los datos en tablas
relacionales OLTP a un sistema OLAP multidimensional era innecesariamente difcil, incluso
con el uso de una herramienta sofisticada.
PROBLEMAS EN CURSO
Aunque el enfoque intermedio de salida parece ser eficaz y eficiente, cuestiones sin resolver
permanecen.
La decisin sobre si se debe utilizar MOLAP o ROLAP es un ejemplo del dilema del espacio-
tiempo. MOLAP ocupa ms espacio mediante la creacin de un cubo fsico, que duplica los
datos, pero en gran medida acelera OLAP. Por otro lado, ROLAP utiliza mucho menos espacio
pero es inherentemente lento. Desde nuestra perspectiva, una aplicacin MOLAP es ms
probable que sea el resultado de un enfoque de arriba hacia abajo, a partir de un modelo
multidimensional basado en las necesidades del negocio. Una aplicacin ROLAP es ms
probable que el resultado de un enfoque de abajo hacia arriba, extraer datos de bases de
datos relacionales existentes sobre la marcha. Nuevas investigaciones sobre los mritos
relativos de los sistemas MOLAP y ROLAP sera til.
Por ejemplo, el sistema que produce los datos de origen suele calcular los indicadores clave de
rendimiento de varios valores de los datos recogidos en diferentes momentos
significativamente. Esta inconsistencia significaba que los administradores no podan usar
estos indicadores clave de rendimiento para el anlisis significativo a travs de la dimensin de
tiempo. El desarrollo de MDDBs revela a menudo este tipo de problemas, y los gerentes
necesitan formas prcticas tanto de anticipar y corregir los problemas cuando surgen.
CAMBIOS EN LA ESTRUCTURA CON EL TIEMPO
Un problema fundamental con un MDDB donde el tiempo es una dimensin es cmo hacer
frente a las dimensiones cuya estructura cambia con el tiempo. Por ejemplo, una cadena de
tiendas de rpido crecimiento podra querer informar sobre las ventas a nivel regional, donde
antes slo haban informado sobre las ventas a nivel estatal. Para dar cabida a tales informes,
la compaa tendra que redefinir la dimensin ubicacin y subir una nueva copia de los datos.
Para sistemas pequeos, como los prototipos descritos anteriormente, al hacerlo, no era un
problema grave. Sin embargo, algunos sistemas tienen gigabytes de datos, y este problema
puede convertirse en una pesadilla logstica para los que no hemos encontrado ninguna
solucin inmediata.
La bibliografa consultada durante el primer estudio de caso pareca dividido en cuanto a los
requisitos de una MDDB deben basarse en los factores crticos de xito y los indicadores clave
de rendimiento de un gestor individuales o las de toda la organizacin. Desde un punto de
vista pragmtico, es probablemente mejor para construir sistemas de apoyo a un gestor
individual debido a las dificultades que entraa la identificacin de todas las medidas y
dimensiones necesarias para crear un modelo de datos dimensional para toda la organizacin.
Todos los profesionales de IT que participan en los estudios de casos reportaron dificultades
con los conceptos bsicos de las medidas y dimensiones, y con la identificacin de ellos en los
datos. Por otro lado, fue sorprendente la rapidez con que los gerentes de empresas captaron
los conceptos de dimensin. Esto sugiere que la familiaridad con los datos, junto con las
necesidades de informacin del problema de negocio, es ms importante que la base de datos
de conocimientos tradicionales de arriba hacia abajo, modelado multidimensional. Las
investigaciones futuras deberan probar esta hiptesis.
GERENTE DE EDUCACIN
Por ltimo, creemos que los cursos de gestin deberan poner ms nfasis en la comprensin
de la informacin y el conocimiento como activos de la empresa para la planificacin de la
organizacin, toma de decisiones, y la innovacin.