Académique Documents
Professionnel Documents
Culture Documents
INTRODUCCION
Desde que se inici la era de la computadora, las organizaciones han usado los datos desde
sus sistemas operacionales para atender sus necesidades de informacin. Algunas
proporcionan acceso directo a la informacin contenida dentro de las aplicaciones
operacionales. Otras, han extrado los datos desde sus bases de datos operacionales para
combinarlos de varias formas no estructuradas, en su intento por atender a los usuarios en sus
necesidades de informacin.
Ambos mtodos han evolucionado a travs del tiempo y ahora las organizaciones manejan
una data no limpia e inconsistente, sobre las cuales, en la mayora de las veces, se toman
decisiones importantes.
La gestin administrativa reconoce que una manera de elevar su eficiencia est en hacer el
mejor uso de los recursos de informacin que ya existen dentro de la organizacin. Sin
embargo, a pesar de que sto se viene intentando desde hace muchos aos, no se tiene todava
un uso efectivo de los mismos.
Es asi como surge los sistemas de Data Warehousing son el centro de la arquitectura de los
Sistemas de Informacin de los 90's. Han surgido como respuesta a la problemtica de extraer
informacin sinttica a partir de datos atmicos almacenados en bases de datos de
produccin. Uno de los objetivos principales de este tipo de sistemas es servir como base de
informacin para la toma de decisiones. Los beneficios obtenidos por la utilizacin de este
tipo de sistemas se basan en el acceso interactivo e inmediato a informacin estratgica de un
rea de negocios. Este acercamiento de la informacin al usuario final permite una toma de
decisiones rpida y basada en datos objetivos obtenidos a partir de las bases de datos
(eventualmente heterogneas) de la empresa. Estos beneficios aumentan cuanto ms
importantes son las decisiones a tomar y cuanto ms crtico es el factor tiempo.
Hoy en da las empresas cuentan en su mayora con la automatizacin de sus procesos,
manejando gran cantidad de datos en forma centralizada y manteniendo sus sistemas en
lnea. En esta informacin descansa el know-how de la empresa, constituyendo un recurso
corporativo primario y parte importante de su patrimonio.
El nivel competitivo alcanzado en las empresas les ha exigido desarrollar nuevas
estrategias de gestin. En el pasado, las organizaciones fueron tpicamente estructuradas
en forma piramidal con informacin generada en su base fluyendo hacia lo alto; y era en
el estrato de la pirmide ms alto donde se tomaban decisiones a partir de la informacin
proporcionada por la base, con un bajo aprovechamiento del potencial de esta
informacin. Estas empresas, han reestructurado y eliminado estratos de estas pirmides y
han autorizado a los usuarios de todos los niveles a tomar mayores decisiones y
responsabilidades. Sin embargo, sin informacin slida para influenciar y apoyar las
decisiones, la autorizacin no tiene sentido.
Esta necesidad de obtener informacin para una amplia variedad de individuos es la
principal razn de negocios que conduce al concepto de Datawarehouse. El nfasis no est
slo en llevar la informacin hacia lo alto sino que a travs de la organizacin, para que todos
los empleados que la necesiten la tengan a su disposicin.
Definiciones:
Que es?
El data warehouse, es actualmente, el centro de atencin de las grandes instituciones, porque
provee un ambiente para que las organizaciones hagan un mejor uso de la informacin que
est siendo administrada por diversas aplicaciones operacionales.
Un data warehouse es una coleccin de datos en la cual se encuentra integrada la informacin
de la Institucin y que se usa como soporte para el proceso de toma de decisiones gerenciales.
Aunque diversas organizaciones y personas individuales logran comprender el enfoque de un
Warehouse, la experiencia ha demostrado que existen muchas dificultades potenciales.
Reunir los elementos de datos apropiados desde diversas fuentes de aplicacin en un ambiente
integral centralizado, simplifica el problema de acceso a la informacin y en consecuencia,
acelera el proceso de anlisis, consultas y el menor tiempo de uso de la informacin.
Las aplicaciones para soporte de decisiones basadas en un data warehousing, pueden hacer
ms prctica y fcil la explotacin de datos para una mayor eficacia del negocio, que no se
logra cuando se usan slo los datos que provienen de las aplicaciones operacionales (que
ayudan en la operacin de la empresa en sus operaciones cotidianas), en los que la
informacin se obtiene realizando procesos independientes y muchas veces complejos.
Un data warehouse se crea al extraer datos desde una o ms bases de datos de aplicaciones
operacionales. La data extrada es transformada para eliminar inconsistencias y resumir si es
necesario y luego, cargadas en el data warehouse. El proceso de transformar, crear el detalle
de tiempo variante, resumir y combinar los extractos de datos, ayudan a crear el ambiente para
el acceso a la informacin Institucional. Este nuevo enfoque ayuda a las personas
individuales, en todos los niveles de la empresa, a efectuar su toma de decisiones con ms
responsabilidad.
La innovacin de la Tecnologa de Informacin dentro de un ambiente data warehousing,
puede permitir a cualquier organizacin hacer un uso ms ptimo de los datos, como un
ingrediente clave para un proceso de toma de decisiones ms efectivo. Las organizaciones
tienen que aprovechar sus recursos de informacin para crear la informacin de la operacin
del negocio, pero deben considerarse las estrategias tecnolgicas necesarias para la
implementacin de una arquitectura completa de data warehouse.
Los almacenes de datos (o Datawarehouse) generan bases de datos tangibles con una
perspectiva histrica, utilizando datos de mltiples fuentes que se fusionan en forma
congruente. Estos datos se mantienen actualizados, pero no cambian al ritmo de los
sistemas transaccionales. Muchos datawarehouses se disean para contener un nivel de
detalle hasta el nivel de transaccin, con la intencin de hacer disponible todo tipo de
datos y caractersticas, para reportar y analizar. As un datawarehouse resulta ser un
recipiente de datos transaccionales para proporcionar consultas operativas, y la
informacin para poder llevar a
cabo anlisis multidimensional. De esta forma, dentro de una almacn de datos existen dos
tecnologas complementarias, una relacional para consultas y una multidimensional para
anlisis.
Se puede caracterizar un data warehouse haciendo un contraste de cmo los datos de un
negocio almacenados en un data warehouse, difieren de los datos operacionales usados por las
aplicaciones de produccin.
Data Warehouse
Datos Operacionales
Orientado a la aplicacin
Orientado al sujeto
Actual
Actual + histrico
Detallada
Detallada + ms resumida
Cambia continuamente
Estable
El ingreso de datos en el data warehouse viene desde el ambiente operacional en casi todos
los casos. El data warehouse es siempre un almacn de datos transformados y separados
fsicamente de la aplicacin donde se encontraron los datos en el ambiente operacional.
1.2 SISTEMAS DE INFORMACION
Los sistemas de informacin se han dividido de acuerdo al siguiente esquema:
Orientado al tema
Integrado
De tiempo variante
No voltil
1.3.2 Integracin
El aspecto ms importante del ambiente data warehousing es que la informacin encontrada
al interior est siempre integrada.
La integracin de datos se muestra de muchas maneras: en convenciones de nombres
consistentes, en la medida uniforme de variables, en la codificacin de estructuras
consistentes, en atributos fsicos de los datos consistentes, fuentes mltiples y otros.
tiempo
variante
se
muestra
de
varias
maneras:
data warehouse es, para todos los propsitos prcticos, una serie larga de "snapshots" (vistas
instantneas).
1.3.4 No Voltil
La informacin es til slo cuando es estable. Los datos operacionales cambian sobre una
base momento a momento. La perspectiva ms grande, esencial para el anlisis y la toma de
decisiones, requiere una base de datos estable.
La tecnologa permite realizar backup y recuperacin, transacciones e integridad de los datos
y la deteccin y solucin al estancamiento que es ms complejo. En el data warehouse no es
necesario el procesamiento.
La fuente de casi toda la informacin del data warehouse es el ambiente operacional. A simple
vista, se puede pensar que hay redundancia masiva de datos entre los dos ambientes. Desde
luego, la primera impresin de muchas personas se centra en la gran redundancia de datos,
entre el ambiente operacional y el ambiente de data warehouse. Dicho razonamiento es
superficial y demuestra una carencia de entendimiento con respecto a qu ocurre en el data
warehouse. De hecho, hay una mnima redundancia de datos entre ambos ambientes.
1.4 ESTRUCTURA DEL DATA WAREHOUSE
Los data warehouses tienen una estructura distinta. Hay niveles diferentes de esquematizacin
y detalle que delimitan el data warehouse. La estructura de un data warehouse se muestra en
la Figura N 5.
En la figura, se muestran los diferentes componentes del data warehouse y son:
Meta data
Detalle de datos actuales.- En gran parte, el inters ms importante radica en el detalle de los
datos actuales, debido a que:
Refleja las ocurrencias ms recientes, las cuales son de gran inters
Es voluminoso, ya que se almacena al ms bajo nivel de granularidad.
Casi siempre se almacena en disco, el cual es de fcil acceso, aunque su administracin sea
costosa y compleja.
Detalle de datos antiguos.- La data antigua es aquella que se almacena sobre alguna forma
de almacenamiento masivo. No es frecuentemente accesada y se almacena a un nivel de
detalle, consistente con los datos detallados actuales. Mientras no sea prioritario el
almacenamiento en un medio de almacenaje alterno, a causa del gran volumen de datos unido
al acceso no frecuente de los mismos, es poco usual utilizar el disco como medio de
almacenamiento.
Datos ligeramente resumidos.- La data ligeramente resumida es aquella que proviene desde
un bajo nivel de detalle encontrado al nivel de detalle actual. Este nivel del data warehouse
casi siempre se almacena en disco. Los puntos en los que se basa el diseador para construirlo
son:
Que la unidad de tiempo se encuentre sobre la esquematizacin hecha.
Qu contenidos (atributos) tendr la data ligeramente resumida.
Datos completamente resumidos.- El siguiente nivel de datos encontrado en el data
warehouse es el de los datos completamente resumidos. Estos datos son compactos y
fcilmente accesibles.
A veces se encuentra en el ambiente de data warehouse y en otros, fuera del lmite de la
tecnologa que ampara al data warehouse. (De todos modos, los datos completamente
resumidos son parte del data warehouse sin considerar donde se alojan los datos fsicamente.)
Metadata.- El componente final del data warehouse es el de la metadata. De muchas maneras
la metadata se sita en una dimensin diferente al de otros datos del data warehouse, debido a
que su contenido no es tomado directamente desde el ambiente operacional.
La metadata juega un rol especial y muy importante en el data warehouse y es usada como:
Un directorio para ayudar al analista a ubicar los contenidos del data warehouse.
Una gua para el mapping de datos de cmo se transforma, del ambiente operacional al de
data warehouse.
Una gua de los algoritmos usados para la esquematizacin entre el detalle de datos actual,
con los datos ligeramente resumidos y stos, con los datos completamente resumidos, etc.
La metadata juega un papel mucho ms importante en un ambiente data warehousing que en
un operacional clsico.
A fin de recordar los diferentes niveles de los datos encontrados en el data warehouse,
considere el ejemplo mostrado en la Figura N 6.
a) Sistemas Operacionales
Los datos administrados por los sistemas de aplicacin operacionales son la fuente principal
de datos para el data warehouse.
Las bases de datos operacionales se organizan como archivos indexados (UFAS, VSAM),
bases de datos de redes/jerrquicas (I-D-S/II, IMS, IDMS) o sistemas de base de datos
relacionales (DB2, Oracle, Informix, etc.). Segn las encuestas, aproximadamente del 70% a
80% de las bases de datos de las empresas se organizan usando DBMSs no relacional.
b) Extraccin, Transformacin y Carga de los Datos
Se requieren herramientas de gestin de datos para extraer datos desde bases de datos y/o
archivos operacionales, luego es necesario manipular o transformar los datos antes de cargar
los resultados en el data warehouse.
Tomar los datos desde varias bases de datos operacionales y transformarlos en datos
requeridos para el depsito, se refiere a la transformacin o a la integracin de datos. Las
bases de datos operacionales, diseadas para el soporte de varias aplicaciones de produccin,
frecuentemente difieren en el formato.
Los mismos elementos de datos, si son usados por aplicaciones diferentes o administrados por
diferentes software DBMS, pueden definirse al usar nombres de elementos inconsistentes, que
tienen formatos inconsistentes y/o ser codificados de manera diferente. Todas estas
inconsistencias deben resolverse antes que los elementos de datos sean almacenados en el data
warehouse.
c) Metadata
Otro paso necesario es crear la metadata. La metadata (es decir, datos acerca de datos)
describe los contenidos del data warehouse. La metadata consiste de definiciones de los
elementos de datos en el depsito, sistema(s) del (os) elemento(s) fuente. Como la data, se
de
ser
almacenada
en
informacin
similar.
Los usuarios accesan al data warehouse por medio de herramientas de productividad basadas
en GUI (Graphical User Interface - Interfase grfica de usuario). Pueden proveerse a los
usuarios del data warehouse muchos de estos tipos de herramientas.
Estos pueden incluir software de consultas, generadores de reportes, procesamiento analtico
en lnea, herramientas data/visual mining, etc., dependiendo de los tipos de usuarios y sus
requerimientos particulares. Sin embargo, una sola herramienta no satisface todos los
requerimientos, por lo que es necesaria la integracin de una serie de herramientas.
e) Plataforma del data warehouse
La plataforma para el data warehouse es casi siempre un servidor de base de datos relacional.
Cuando se manipulan volmenes muy grandes de datos puede requerirse una configuracin en
bloque de servidores UNIX con multiprocesador simtrico (SMP) o un servidor con
procesador paralelo masivo (MPP) especializado.
Los extractos de la data integrada/transformada se cargan en el data warehouse. Uno de los
ms populares RDBMSs disponibles para data warehousing sobre la plataforma UNIX (SMP
y MPP) generalmente es Teradata. La eleccin de la plataforma es crtica. El depsito crecer
y hay que comprender los requerimientos despus de 3 o 5 aos.
Muchas de las organizaciones quieran o no escogen una plataforma por diversas razones: el
Sistema X es nuestro sistema elegido o el Sistema Y est ya disponible sobre un sistema
UNIX que nosotros ya tenemos. Uno de los errores ms grandes que las organizaciones
cometen al seleccionar la plataforma, es que ellos presumen que el sistema (hardware y/o
DBMS) escalar con los datos.
El sistema de depsito ejecuta las consultas que se pasa a los datos por el software de acceso a
los datos del usuario. Aunque un usuario visualiza las consultas desde el punto de vista de un
GUI, las consultas tpicamente se formulan como pedidos SQL, porque SQL es un lenguaje
universal
y
el
estndar
de
hecho
para
el
acceso
a
datos.
f) Datos Externos
Dependiendo de la aplicacin, el alcance del data warehouse puede extenderse por la
capacidad de acceder a la data externa. Por ejemplo, los datos accesibles por medio de
servicios de computadora en lnea (tales como CompuServe y America On Line) y/o va
Internet, pueden estar disponibles a los usuarios del data warehouse.
Evolucin del Depsito
Construir un data warehouse es una tarea grande. No es recomendable emprender el
desarrollo del data warehouse de la empresa como un proyecto cualquiera. Ms bien, se
recomienda que los requerimientos de una serie de fases se desarrollen e implementen en
modelos consecutivos que permitan un proceso de implementacin ms gradual e iterativo.
No existe ninguna organizacin que haya triunfado en el desarrollo del data warehouse de la
empresa, en un slo paso. Muchas, sin embargo, lo han logrado luego de un desarrollo paso a
paso. Los pasos previos evolucionan conjuntamente con la materia que est siendo agregada.
Los datos en el data warehouse no son voltiles y es un repositorio de datos de slo lectura
(en general). Sin embargo, pueden aadirse nuevos elementos sobre una base regular para que
el contenido siga la evolucin de los datos en la base de datos fuente, tanto en los contenidos
como en el tiempo.
Uno de los desafos de mantener un data warehouse, es idear mtodos para identificar datos
nuevos o modificados en las bases de datos operacionales. Algunas maneras para identificar
estos datos incluyen insertar fecha/tiempo en los registros de base de datos y entonces crear
copias de registros actualizados y copiar informacin de los registros de transaccin y/o base
de datos diarias.
Estos elementos de datos nuevos y/o modificados son extrados, integrados, transformados y
agregados al data warehouse en pasos peridicos programados. Como se aaden las nuevas
ocurrencias de datos, los datos antiguos son eliminados. Por ejemplo, si los detalles de un
sujeto particular se mantienen por 5 aos, como se agreg la ltima semana, la semana
anterior es eliminada.
1.6
TRANSFORMACION
DE
DATOS
METADATA
Las estructuras de datos que dan una visin de los datos al administrador de
datos.
El modelo de datos del data warehouse (es decir, los elementos de datos y sus relaciones).
Un registro de cuando los nuevos elementos de datos se agregan al data warehouse y cuando
los elementos de datos antiguos se eliminan o se resumen.
Los niveles de sumarizacin, el mtodo de sumarizacin y las tablas de registros de su data
warehouse.
Algunas implementaciones de la metadata tambin incluyen definiciones de la(s) vista(s)
presentada(s) a los usuarios del data warehouse. Tpicamente, se definen vistas mltiples para
favorecer las preferencias variadas de diversos grupos de usuarios. En otras
implementaciones, estas descripciones se almacenan en un Catlogo de Informacin.
Los esquemas y subesquemas para bases de datos operacionales, forman una fuente ptima de
entrada cuando se crea la metadata. Hacer uso de la documentacin existente, especialmente
cuando est disponible en forma electrnica, puede acelerar el proceso de definicin de la
metadata del ambiente data warehousing.
La metadata sirve, en un sentido, como el corazn del ambiente data warehousing. Crear
definiciones de metadata completa y efectiva puede ser un proceso que consuma tiempo, pero
lo mejor de las definiciones y si usted usa herramientas de gestin de software integrado, son
los esfuerzos que darn como resultado el mantenimiento del data warehouse.
Sea eliminado
Sea resumido
Sea archivado
DatosUso de
de
Data Warehouse
predefinidas
pequeas
Requerimientos
inmediata
de
de
datosCantidades
detallados
grandes
respuestaRequerimientos
crticos
de
de
datos
respuesta
no
que se conoce (si es modelada correctamente) es el conjunto inicial de datos que se han
establecido en el depsito.
Por ejemplo, un especialista en el cuidado de la salud podra necesitar acceder a los datos
actuales e histricos para analizar las tendencias de costos, usando un conjunto de consultas
predefinidas. Por el contrario, un representante de ventas podra necesitar acceder a los datos
de cliente y producto para evaluar la eficacia de una campaa de marketing, creando consultas
base o ad-hoc para encontrar nuevamente necesidades definidas.
Slo pocos usuarios acceden a los datos concurrentemente
En contraste a la produccin de sistemas que pueden manejar cientos o miles de usuarios
concurrentes, al data warehouse acceda un limitado conjunto de usuarios en cualquier tiempo
determinado.
Los usuarios generan un procesamiento no predecible complejo
Los usuarios del data warehouse generan consultas complejas. A veces la respuesta a una
consulta conduce a la formulacin de otras preguntas ms detalladas, en un proceso llamado
drilling down. El data warehouse puede incluir niveles de resmenes mltiples, derivado de
un conjunto principal, nico, de datos detallados, para soportar este tipo de uso.
En efecto, los usuarios frecuentemente comienzan buscando en los datos resumidos y como
identifican reas de inters, comienzan a acceder al conjunto de datos detallado. Los
conjuntos de datos resumidos representan el "Qu" de una situacin y los conjuntos de datos
detallados permiten a los usuarios construir un cuadro sobre "Cmo" se ha derivado esa
situacin.
Las consultas de los usuarios accedan a cantidades grandes de datos
Debido a la necesidad de investigar tendencias y evaluar las relaciones entre muchas clases de
datos, las consultas al data warehouse permiten acceder a volmenes muy grandes tanto de
data detallada como resumida. Debido a los requerimientos de datos histricos, los data
warehouses evolucionan para llegar a un tamao ms grande que sus orgenes operacionales
(de 10 a 100 veces ms grande).
Las consultas de los usuarios no tienen tiempos de respuesta crticos
Las transacciones operacionales necesitan una respuesta inmediata porque un cliente puede
estar esperando una respuesta. En el data warehouse, por el contrario, tiene un requerimiento
de respuesta no-crtico porque el resultado frecuentemente se usa en un proceso de anlisis y
toma de decisiones. Aunque los tiempos de respuesta no son crticos, los usuarios esperan una
respuesta
dentro
del
mismo
da
en
que
es
hecha
la
consulta.
Por lo general, los diferentes niveles de datos dentro del data warehouse reciben diferentes
usos. A ms alto nivel de esquematizacin, se tiene mayor uso de los datos.
En la Figura N 12 se muestra que hay mayor uso de los datos completamente resumidos, a
diferencia de la informacin antigua que apenas es usada.
Hay una buena razn para mover una organizacin al paradigma sugerido en la figura, la
utilizacin del recurso. La data ms resumida, permite capturar los datos en forma ms rpida
y eficiente. Si en una tarea se encuentra que se hace mucho procesamiento a niveles de detalle
del data warehouse, entonces se consumir muchos recursos de mquina. Es mejor hacer el
procesamiento a niveles ms altos de esquematizacin como sea posible.
Para muchas tareas, el analista de sistemas de soporte de decisiones usa la informacin a nivel
de detalle en un pre data warehouse. La seguridad de la informacin de detalle se consigue de
muchas maneras, aun cuando estn disponibles otros niveles de esquematizacin. Una de las
actividades del diseador de datos es el de desconectar al usuario del sistema de soporte de
decisiones del uso constante de datos a nivel de detalle ms bajo.
El diseador de datos tiene dos predisposiciones:
Instalar un sistema chargeback, donde el usuario final pague por los recursos consumidos
Sealar el mejor tiempo de respuesta que puede obtenerse cuando se trabaja con la data a un
nivel alto de esquematizacin, a diferencia de un pobre tiempo de respuesta que resulta de
trabajar con los datos a un nivel bajo de detalle.
Para ilustrar cmo un data warehouse puede ayudar a una organizacin a mejorar sus
operaciones, se muestra un ejemplo de lo que es el desarrollo de actividades sin tener un data
warehouse.
Ejemplo:
Preparacin de un reporte complejo
Considere un problema bastante tpico en una compaa de fabricacin grande en el que se
pide una informacin (un reporte) que no est disponible.
El informe incluye las finanzas actuales, el inventario y la condicin de personal, acompaado
de comparaciones del mes actual con el anterior y el mismo mes del ao anterior, con una
comparacin adicional de los 3 aos precedentes. Se debe explicar cada desviacin de la
tendencia que cae fuera de un rango predefinido.
Sin un data warehouse, el informe es preparado de la manera siguiente:
La informacin financiera actual se obtiene desde una base de datos mediante un programa de
extraccin de datos, el inventario actual de otro programa de extraccin de otra base de datos,
Para los diferentes tipos de tablas hay diferentes unidades de tiempo que fsicamente dividen
las unidades de informacin. El histrico de fabricacin est dividido por trimestres, el
histrico de la orden de piezas est dividido por aos y el histrico de cliente es un archivo
nico, no dividido por el tiempo.
As tambin, las diferentes tablas son vinculadas por medio de un identificador comn, piezas
u rdenes de piezas (la representacin de la interrelacin en el ambiente de depsito toma una
forma muy diferente al de otros ambientes, tal como el ambiente operacional).
2.1.4 ESTRATEGIAS PARA LA GESTION DE UN DATA WAREHOUSE
Los data warehouses requieren una comercializacin y gestin muy cuidadosa. Debe
considerarse
lo
siguiente:
1ra.: Un data warehouse es una inversin buena slo si los usuarios finales realmente pueden
conseguir informacin vital ms rpida y ms barata de lo que obtienen con la tecnologa
actual.
Como consecuencia, la gestin tiene que pensarse seriamente sobre cmo quieren sus
depsitos para su eficaz desempeo y cmo conseguirn llegar a los usuarios finales.
2da.: La administracin debe reconocer que el mantenimiento de la estructura del data
warehouse es tan crtico como el mantenimiento de cualquier otra aplicacin de misincrtica.
De hecho, la experiencia ha demostrado que los data warehouses llegarn a ser rpidamente
uno de los sistemas ms usados en cualquier organizacin.
3ra.: La gestin debe comprender tambin que si se embarcan sobre un programa data
warehousing, se crearn nuevas demandas sobre sus sistemas operacionales, que son:
-
Los usuarios pueden usar sus herramientas familiares, hojas de clculo, procesadores de
textos y software de anlisis de datos y anlisis estadstico para manipular y evaluar la
informacin obtenida desde el data warehouse.
c) Para la Organizacin en Tecnologas de Informacin
El data warehouse enriquece las capacidades del usuario autosuficiente y hace lo factible para
ofrecer nuevos servicios a los usuarios, sin interferir con las aplicaciones cotidianas de
produccin.
La pugna constante por resolver las necesidades de usuarios que piden acceso a los datos
operacionales, finaliza con la implementacin de un data warehouse. La mayora de los
usuarios no necesita acceder ms a los datos actuales, porque ellos tienen informacin ms
til disponible desde el data warehouse.
Un data warehouse aumenta el valor de las inversiones en tecnologas de informacin, en
aplicaciones y bases de datos operacionales. Como estas bases de datos alimentan
informacin, al evolucionar el data warehouse, llegan a ser imprescindibles no solamente para
las operaciones diarias, sino adems como la fuente de informacin del negocio de amplio
rango.
3. SOFTWARE EN UN DATA WAREHOUSE
La informacin estratgica sobre clientes importantes o un exitoso lanzamiento de producto,
se almacena en gigabytes de datos de marketing o ndice de transacciones de venta. Esa
informacin debe ser extrada de alguna forma para la toma de decisiones.
En este caso se necesita software especializado que permita capturar los datos relevantes
forma rpida y pueda verse a travs de diferentes dimensiones de los datos. El software
debera limitarse nicamente al acceso a los datos, si no tambin, al anlisis significativo
los datos. En efecto, transformar los datos de la informacin cruda o no procesada,
informacin til para la empresa.
en
no
de
en
Requerimientos
Evolucin de las ventas
1- Se desea hacer un seguimiento de las ventas comparando los distintos meses del ao, y del
ao anterior, estudiando la evolucin por familia de productos, y pudindola refinar hasta un
producto o presentacin de producto en concreto. Por ejemplo: una presentacin del producto
"Agua sin gas" es "Agua sin gas de 2 litros".
2- Se desea tambin observar las variaciones en las ventas para las distintas ciudades del
pas.
Disminucin de los costos
3- Se necesita comparar las diferencias entre importes de ventas y costos, de manera de
maximizar las ganancias. Un estudio por producto ayudara a los responsables de facturacin
en la reduccin de los costos.
4- En los costos tambin influye el cliente y la regin geogrfica (traslados, peajes, transporte
especial, etc). Se quiere estudiar como inciden esas variables en los costos. Interesa el total de
costos, no es importante el desglose por tipo de costo.
Seguimiento del stock.
5- Se quiere analizar el stock existente de productos, comparndolo con la cantidad vendidaen
un da. Esta comparacin la usan los analistas para predecir para cunto tiempoalcanzara el
stock: si el stock es demasiado pequeo se pueden perder ventas, y si esdemasiado grande es
dinero estancado. Este estudio es de vital importancia para ajustar laproduccin de productos
perecederos. Por ejemplo: al final del mes de enero de 2003haba 2000 unidades del producto
"Agua sin gas de 2 litros" y se vendi un promedio de500 unidades diarias.
Anlisis de mercado.
6- Interesa medir los volmenes de venta para los diferentes rubros (mayoristas,
supermercados, almacenes y restaurantes) estudiando las variaciones para los distintos
perodos. Los analistas asocian esta informacin con promociones o propagandas orientadas a
un perfil de clientes, lo que les permite medir los efectos positivos y/o negativos de una
promocin en un sector. No interesa comparar cliente por cliente, alcanza con un
fraccionamiento por rubros y subrubros. Tampoco interesa registrar informacin de las
promociones.
Distribucin geogrfica.
7- Interesa comparar las ventas por departamentos y ciudades. Esto nos indica las regiones
que estn en riesgo y necesitan de mayor atencin. El anlisis debe incluir valores absolutos
(volmenes de venta), y valores relativos (proporcionales a la cantidad de clientes en cada
regin).
8- Se desea tambin estudiar la evolucin en el tiempo de la cantidad de clientes por ciudad y
departamento.
Warehousing: Base Fuente: GrandDFuente
Se tienen las siguientes tablas:
Departamentos ( DE_Codigo, DE_Nombre)
Contiene informacin sobre los departamentos del pas.
Ciudades (CI_Codigo, CI_Depto, CI_Nombre, CI_Poblacion)
Contiene informacin sobre las ciudades. El atributo CI_Depto permite indicar en
quedepartamento se ubica cierta ciudad.
Sucursales(SC_Codigo,SC_Depto,SC_Ciudad,SC_Cliente,SC_Direccin,SC_FechaAl
ta, SC_FechaBaja, SC_CantEmpleados)
Contiene informacin referente a la presencia de los clientes en las ciudades. Un cliente
puedetener varias sucursales en una misma ciudad, y para cada una de ellas se indica la fecha
decomienzo de actividad o fecha de alta y en caso de cese de actividades la fecha de baja.
Cadaciudad se identifica por los atributos (SC_Depto, SC_Ciudad).
Rubros (RU_Codigo, RU_Nombre)
Contiene informacin referente a los rubros en que se agrupan los subrubros a los cuales
sededican los clientes. Un ejemplo de rubro: ALMACENES
Subrubros (SR_Codigo, SR_Nombre, SR_Rubro)
Contiene informacin sobre los subrubros y su relacin con los rubros. Un ejemplo
desubrubro: Grandes para el rubro ALMACENES
Clientes (CL_Codigo, CL_Nombre, CL_RazonSocial, CL_Subrubro)
Contiene informacin sobre las empresas clientes de la empresa distribuidora. Cada cliente
trabaja en un nico subrubro
CONCLUSIONES
Data Warehousing se considera exitoso, cuando su objetivo final comienza a concretarse,
es decir que la gente de la empresa use el DW para satisfacer sus necesidades empresariales
Un Data Warehouse puede producir la informacin correcta para los ejecutivos
empresariales, gerentes y analistas. Conectarse al potencial del Data Warehouse slo esta
limitado por la capacidad, habilidad y creatividad de los usuarios empresariales. Las
experiencias anteriores apuntan hacia un amplio rango de usos: anlisis de rentabilidad y
crecimiento, administracin estratgica, administracin de relaciones con el cliente,
administracin de activos corporativos y manejo de la reingeniera del proceso empresarial y
la administraci6n de calidad total. Los Data Warehouses se ha aplicado con xito en los
sectores de manufactura, bienes de consumo y distribucin, y en banca y finanzas.
El uso del Data Warehouse en el curso diario de una empresa consiste en dos grandes
actividades: acceso y recuperacin, y anlisis y reportes. Estas actividades se manejan a travs
del bloque de Acceso y Uso de la arquitectura de referencia. Existen dos modelos para
aprovechar el Data Warehouse: el modelo de verificacin, que utiliza tcnicas de
procesamiento analtico e informtico, y el modelo de descubrimiento, que emplea tcnicas de
minera de datos.
La finalidad de un Data Warehouse consiste en asistir a la administracin a comprender el
pasado y planear el futuro. Aunque el Data Warehouse contiene informacin estratgica
crucial, extraer un valor empresarial del Data Warehouse es un esfuerzo complejo. Obtener
este valor requiere de una mezcla de aptitudes empresariales, habilidad tcnica, intuicin y
experiencia.
BIBLIOGRAFIA
Ballard, C. Herreman, D. Schau, D. Bell, R. Kim, E. Valncic, A.: Data Modeling
Techniques for Data Warehousing. SG24-2238-00. IBM Red Book. 1998.
Cabibbo, L. Torlone, R.:"A Logical Approach to Multidimensional Databases", EDBT,
1998.
Carpani, F.: CMDM: A conceptual multidimensional model for Data Warehouse.
Master Thesis. Advisor: Ruggia. InCo - Pedeciba, UdelaR, Uruguay, 2000.
Franconi, E. Sattler, U.:"A Data Warehouse Conceptual Data Model for
Multidimensional Aggregation", DMDW99, Germany, 1999.
Golfarelli, M. Maio, D. Rizzi, S.:"Conceptual Design of Data Warehouses from E/R
Schemes.", HICSS98, IEEE, Hawaii,1998.
http://www.techguide.com/
http://www.guia.com.uy
http://sol.facea.puc.cl/a352m/datawarehouse/index.htm
http://www.gcc.com.mx/soluciones/dwhouse.htm
http://www.consisa.com/herramientas/pag_dw.htm
http://www.sybase.com/products/dataware/studio.html
http://www.microsoft.com/Spain/PRENSA/11_98/NOTA3.HTM