Vous êtes sur la page 1sur 31

DATA WAREHOUSING

INTRODUCCION
Desde que se inici la era de la computadora, las organizaciones han usado los datos desde
sus sistemas operacionales para atender sus necesidades de informacin. Algunas
proporcionan acceso directo a la informacin contenida dentro de las aplicaciones
operacionales. Otras, han extrado los datos desde sus bases de datos operacionales para
combinarlos de varias formas no estructuradas, en su intento por atender a los usuarios en sus
necesidades de informacin.
Ambos mtodos han evolucionado a travs del tiempo y ahora las organizaciones manejan
una data no limpia e inconsistente, sobre las cuales, en la mayora de las veces, se toman
decisiones importantes.
La gestin administrativa reconoce que una manera de elevar su eficiencia est en hacer el
mejor uso de los recursos de informacin que ya existen dentro de la organizacin. Sin
embargo, a pesar de que sto se viene intentando desde hace muchos aos, no se tiene todava
un uso efectivo de los mismos.
Es asi como surge los sistemas de Data Warehousing son el centro de la arquitectura de los
Sistemas de Informacin de los 90's. Han surgido como respuesta a la problemtica de extraer
informacin sinttica a partir de datos atmicos almacenados en bases de datos de
produccin. Uno de los objetivos principales de este tipo de sistemas es servir como base de
informacin para la toma de decisiones. Los beneficios obtenidos por la utilizacin de este
tipo de sistemas se basan en el acceso interactivo e inmediato a informacin estratgica de un
rea de negocios. Este acercamiento de la informacin al usuario final permite una toma de
decisiones rpida y basada en datos objetivos obtenidos a partir de las bases de datos
(eventualmente heterogneas) de la empresa. Estos beneficios aumentan cuanto ms
importantes son las decisiones a tomar y cuanto ms crtico es el factor tiempo.
Hoy en da las empresas cuentan en su mayora con la automatizacin de sus procesos,
manejando gran cantidad de datos en forma centralizada y manteniendo sus sistemas en
lnea. En esta informacin descansa el know-how de la empresa, constituyendo un recurso
corporativo primario y parte importante de su patrimonio.
El nivel competitivo alcanzado en las empresas les ha exigido desarrollar nuevas
estrategias de gestin. En el pasado, las organizaciones fueron tpicamente estructuradas
en forma piramidal con informacin generada en su base fluyendo hacia lo alto; y era en
el estrato de la pirmide ms alto donde se tomaban decisiones a partir de la informacin
proporcionada por la base, con un bajo aprovechamiento del potencial de esta
informacin. Estas empresas, han reestructurado y eliminado estratos de estas pirmides y
han autorizado a los usuarios de todos los niveles a tomar mayores decisiones y
responsabilidades. Sin embargo, sin informacin slida para influenciar y apoyar las
decisiones, la autorizacin no tiene sentido.
Esta necesidad de obtener informacin para una amplia variedad de individuos es la
principal razn de negocios que conduce al concepto de Datawarehouse. El nfasis no est
slo en llevar la informacin hacia lo alto sino que a travs de la organizacin, para que todos
los empleados que la necesiten la tengan a su disposicin.

Definiciones:

Data Warehouse (Susan Osterfeldt en 1993)

Data Warehouse (Inmon en 1992 considerado el Padre de las Bases de Datos)

Considera al DW como algo que provee dos beneficios empresariales reales:


Integracin y Acceso de datos. DW elimina una gran cantidad de datos intiles
y no deseados, como tambin el procesamiento desde el ambiente operacional
clsico.

Es un conjunto de datos orientados a temas, integrados, no voltiles e


histricos, organizados para soportar un proceso de toma de decisiones.

Sistema de Data Warehousing:

Es un sistema informtico capaz de ofrecer informacin para toma de


decisiones, y cuya pieza principal es un Data Warehouse.

Que es?
El data warehouse, es actualmente, el centro de atencin de las grandes instituciones, porque
provee un ambiente para que las organizaciones hagan un mejor uso de la informacin que
est siendo administrada por diversas aplicaciones operacionales.
Un data warehouse es una coleccin de datos en la cual se encuentra integrada la informacin
de la Institucin y que se usa como soporte para el proceso de toma de decisiones gerenciales.
Aunque diversas organizaciones y personas individuales logran comprender el enfoque de un
Warehouse, la experiencia ha demostrado que existen muchas dificultades potenciales.
Reunir los elementos de datos apropiados desde diversas fuentes de aplicacin en un ambiente
integral centralizado, simplifica el problema de acceso a la informacin y en consecuencia,
acelera el proceso de anlisis, consultas y el menor tiempo de uso de la informacin.
Las aplicaciones para soporte de decisiones basadas en un data warehousing, pueden hacer
ms prctica y fcil la explotacin de datos para una mayor eficacia del negocio, que no se
logra cuando se usan slo los datos que provienen de las aplicaciones operacionales (que
ayudan en la operacin de la empresa en sus operaciones cotidianas), en los que la
informacin se obtiene realizando procesos independientes y muchas veces complejos.
Un data warehouse se crea al extraer datos desde una o ms bases de datos de aplicaciones
operacionales. La data extrada es transformada para eliminar inconsistencias y resumir si es
necesario y luego, cargadas en el data warehouse. El proceso de transformar, crear el detalle
de tiempo variante, resumir y combinar los extractos de datos, ayudan a crear el ambiente para
el acceso a la informacin Institucional. Este nuevo enfoque ayuda a las personas
individuales, en todos los niveles de la empresa, a efectuar su toma de decisiones con ms
responsabilidad.
La innovacin de la Tecnologa de Informacin dentro de un ambiente data warehousing,
puede permitir a cualquier organizacin hacer un uso ms ptimo de los datos, como un
ingrediente clave para un proceso de toma de decisiones ms efectivo. Las organizaciones
tienen que aprovechar sus recursos de informacin para crear la informacin de la operacin

del negocio, pero deben considerarse las estrategias tecnolgicas necesarias para la
implementacin de una arquitectura completa de data warehouse.
Los almacenes de datos (o Datawarehouse) generan bases de datos tangibles con una
perspectiva histrica, utilizando datos de mltiples fuentes que se fusionan en forma
congruente. Estos datos se mantienen actualizados, pero no cambian al ritmo de los
sistemas transaccionales. Muchos datawarehouses se disean para contener un nivel de
detalle hasta el nivel de transaccin, con la intencin de hacer disponible todo tipo de
datos y caractersticas, para reportar y analizar. As un datawarehouse resulta ser un
recipiente de datos transaccionales para proporcionar consultas operativas, y la
informacin para poder llevar a
cabo anlisis multidimensional. De esta forma, dentro de una almacn de datos existen dos
tecnologas complementarias, una relacional para consultas y una multidimensional para
anlisis.
Se puede caracterizar un data warehouse haciendo un contraste de cmo los datos de un
negocio almacenados en un data warehouse, difieren de los datos operacionales usados por las
aplicaciones de produccin.

Base de Datos Operacional

Data Warehouse

Datos Operacionales

Datos del negocio para Informacin

Orientado a la aplicacin

Orientado al sujeto

Actual

Actual + histrico

Detallada

Detallada + ms resumida

Cambia continuamente

Estable

Un Sistemas de Data Warehousing incluye funcionalidades tales como:


1. Integracin de bases de datos heterogneas (relacionales, documentales, geogrficas,
archivos, etc.).
2. Ejecucin de consultas complejas no predefinidas visualizando el resultado en forma
de grfica y en diferentes niveles de agrupamiento y totalizacin de datos.
3. Agrupamiento y desagrupamiento de datos en forma interactiva.
4. Anlisis de problema en trminos de dimensiones. Por ejemplo, permite analizar datos
histricos a travs de una dimensin tiempo.
5. Control de calidad de datos para asegurar, no solo la consistencia de la base, sino
tambin la relevancia de los datos en base a los cuales se toman las decisiones.

Diferentes tipos de informacin

El ingreso de datos en el data warehouse viene desde el ambiente operacional en casi todos
los casos. El data warehouse es siempre un almacn de datos transformados y separados
fsicamente de la aplicacin donde se encontraron los datos en el ambiente operacional.
1.2 SISTEMAS DE INFORMACION
Los sistemas de informacin se han dividido de acuerdo al siguiente esquema:

Sistemas Estratgicos, orientados a soportar la toma de decisiones, facilitan la labor de la


direccin, proporcionndole un soporte bsico, en forma de mejor informacin, para la toma
de decisiones. Se caracterizan porque son sistemas sin carga peridica de trabajo, es decir, su
utilizacin no es predecible, al contrario de los casos anteriores, cuya utilizacin es peridica.
Destacan entre estos sistemas: los Sistemas de Informacin Gerencial (MIS), Sistemas de
Informacin Ejecutivos (EIS), Sistemas de Informacin Georeferencial (GIS), Sistemas de
Simulacin de Negocios (BIS y que en la prctica son sistemas expertos o de Inteligencia
Artificial-AI).
Sistemas Tcticos, diseados para soportar las actividades de coordinacin de actividades y
manejo de documentacin, definidos para facilitar consultas sobre informacin almacenada en
el sistema, proporcionar informes y, en resumen, facilitar la gestin independiente de la
informacin por parte de los niveles intermedios de la organizacin.
Destacan entre ellos: los Sistemas Ofimticos (OA), Sistemas de Transmisin de Mensajera
(E-mail y Fax Server), coordinacin y control de tareas (Work Flow) y tratamiento de
documentos (Imagen, Trmite y Bases de Datos Documentarios).
Sistemas Tcnico-Operativos, que cubren el ncleo de operaciones tradicionales de captura
masiva de datos (Data Entry) y servicios bsicos de tratamiento de datos, con tareas
predefinidas (contabilidad, facturacin, almacn, presupuesto, personal y otros sistemas
administrativos). Estos sistemas estn evolucionando con la irrupcin de censores, autmatas,
sistemas multimedia, bases de datos relacionales ms avanzadas y data warehousing.
Sistemas Interinstitucionales, este ltimo nivel de sistemas de informacin recin est
surgiendo, es consecuencia del desarrollo organizacional orientado a un mercado de carcter
global, el cual obliga a pensar e implementar estructuras de comunicacin ms estrechas entre
la organizacin y el mercado (Empresa Extendida, Organizacin Inteligente e Integracin
Organizacional), todo sto a partir de la generalizacin de las redes informticas de alcance
nacional y global (INTERNET), que se convierten en vehculo de comunicacin entre la

organizacin y el mercado, no importa dnde est la organizacin (INTRANET), el mercado


de la institucin (EXTRANET) y el mercado (Red Global).
Sin embargo, la tecnologa data warehousing basa sus conceptos y diferencias entre dos tipos
fundamentales de sistemas de informacin en todas las organizaciones: los sistemas tcnicooperacionales y los sistemas de soporte de decisiones. Este ltimo es la base de un data
warehouse.
1.2.1 Sistemas tcnico-operacionales
Como indica su nombre, son los sistemas que ayudan a manejar la empresa con sus
operaciones cotidianas. Estos son los sistemas que operan sobre el "backbone" (columna
vertebral) de cualquier empresa o institucin, entre las que se tiene sistemas de ingreso de
rdenes, inventario, fabricacin, planilla y contabilidad, entre otros.
Debido a su volumen e importancia en la organizacin, los sistemas operacionales siempre
han sido las primeras partes de la empresa a ser computarizados. A travs de los aos, estos
sistemas operacionales se han extendido, revisado, mejorado y mantenido al punto que hoy,
ellos son completamente integrados en la organizacin.
Desde luego, la mayora de las organizaciones grandes de todo el mundo, actualmente no
podran operar sin sus sistemas operacionales y los datos que estos sistemas mantienen.
1.2.2 Sistemas de Soporte de Decisiones
Por otra parte, hay otras funciones dentro de la empresa que tienen que ver con el
planeamiento, previsin y administracin de la organizacin. Estas funciones son tambin
crticas para la supervivencia de la organizacin, especialmente en nuestro mundo de rpidos
cambios.
Las funciones como "planificacin de marketing", "planeamiento de ingeniera" y "anlisis
financiero", requieren, adems, de sistemas de informacin que los soporte. Pero estas
funciones son diferentes de las operacionales y los tipos de sistemas y la informacin
requerida son tambin diferentes. Las funciones basadas en el conocimiento son los sistemas
de soporte de decisiones.
Estos sistemas estn relacionados con el anlisis de los datos y la toma de decisiones,
frecuentemente, decisiones importantes sobre cmo operar la empresa, ahora y en el futuro.
Estos sistemas no slo tienen un enfoque diferente al de los operacionales, sino que, por lo
general, tienen un alcance diferente.
Mientras las necesidades de los datos operacionales se enfocan normalmente hacia una sola
rea, los datos para el soporte de decisiones, con frecuencia, toma un nmero de reas
diferentes y necesita cantidades grandes de datos operacionales relacionadas.
Son estos sistemas sobre los se basa la tecnologa data warehousing.
1.3 CARACTERISTICAS DE UN DATA WAREHOUSE
Entre las principales se tiene:

Orientado al tema

Integrado

De tiempo variante

No voltil

1.3.1 Orientado a Temas


Una primera caracterstica del data warehouse es que la informacin se clasifica en base a los
aspectos que son de inters para la empresa. Siendo as, los datos tomados estn en contraste
con los clsicos procesos orientados a las aplicaciones. En la Figura N 1 se muestra el
contraste entre los dos tipos de orientaciones.
El ambiente operacional se disea alrededor de las aplicaciones y funciones tales como
prstamos, ahorros, tarjeta bancaria y depsitos para una institucin financiera. Por ejemplo,
una aplicacin de ingreso de rdenes puede acceder a los datos sobre clientes, productos y
cuentas. La base de datos combina estos elementos en una estructura que acomoda las
necesidades de la aplicacin.
En el ambiente data warehousing se organiza alrededor de sujetos tales como cliente,
vendedor, producto y actividad. Por ejemplo, para un fabricante, stos pueden ser clientes,
productos, proveedores y vendedores. Para una universidad pueden ser estudiantes, clases y
profesores. Para un hospital pueden ser pacientes, personal mdico, medicamentos, etc.

1.3.2 Integracin
El aspecto ms importante del ambiente data warehousing es que la informacin encontrada
al interior est siempre integrada.
La integracin de datos se muestra de muchas maneras: en convenciones de nombres
consistentes, en la medida uniforme de variables, en la codificacin de estructuras
consistentes, en atributos fsicos de los datos consistentes, fuentes mltiples y otros.

El contraste de la integracin encontrada en el data warehouse con la carencia de integracin


del ambiente de aplicaciones, se muestran en la Figura N 2, con diferencias bien marcadas.
Medida de atributos. Los diseadores de aplicaciones miden las unidades de medida de las
tuberas en una variedad de formas. Un diseador almacena los datos de tuberas en
centmetros, otros en pulgadas, otros en millones de pies cbicos por segundo y otros en
yardas.
Al dar medidas a los atributos, la transformacin traduce las diversas unidades de medida
usadas en las diferentes bases de datos para transformarlas en una medida estndar comn.
Cualquiera que sea la fuente, cuando la informacin de la tubera llegue al data warehouse
necesitar
ser
medida
de
la
misma
manera.

1.3.3 De Tiempo Variante


Toda la informacin del data warehouse es requerida en algn momento. Esta caracterstica
bsica de los datos en un depsito, es muy diferente de la informacin encontrada en el
ambiente operacional. En stos, la informacin se requiere al momento de acceder. En otras
palabras, en el ambiente operacional, cuando usted accesa a una unidad de informacin, usted
espera que los valores requeridos se obtengan a partir del momento de acceso.
Como la informacin en el data warehouse es solicitada en cualquier momento (es decir, no
"ahora mismo"), los datos encontrados en el depsito se llaman de "tiempo variante".
Los datos histricos son de poco uso en el procesamiento operacional. La informacin del
depsito por el contraste, debe incluir los datos histricos para usarse en la identificacin y
evaluacin de tendencias. (Ver Figura N 3).

tiempo

variante

se

muestra

de

varias

maneras:

1 La ms simple es que la informacin representa los datos sobre un horizonte largo de


tiempo - desde cinco a diez aos. El horizonte de tiempo representado para el ambiente
operacional es mucho ms corto - desde valores actuales hasta sesenta a noventa das.
Las aplicaciones que tienen un buen rendimiento y estn disponibles para el procesamiento de
transacciones, deben llevar una cantidad mnima de datos si tienen cualquier grado de
flexibilidad. Por ello, las aplicaciones operacionales tienen un corto horizonte de tiempo,
debido al diseo de aplicaciones rgidas.
2 La segunda manera en la que se muestra el tiempo variante en el data warehouse est en la
estructura clave. Cada estructura clave en el data warehouse contiene, implcita o
explcitamente, un elemento de tiempo como da, semana, mes, etc.
El elemento de tiempo est casi siempre al pie de la clave concatenada, encontrada en el data
warehouse. En ocasiones, el elemento de tiempo existir implcitamente, como el caso en que
un archivo completo se duplica al final del mes, o al cuarto.
3 La tercera manera en que aparece el tiempo variante es cuando la informacin del data
warehouse, una vez registrada correctamente, no puede ser actualizada. La informacin del

data warehouse es, para todos los propsitos prcticos, una serie larga de "snapshots" (vistas
instantneas).
1.3.4 No Voltil
La informacin es til slo cuando es estable. Los datos operacionales cambian sobre una
base momento a momento. La perspectiva ms grande, esencial para el anlisis y la toma de
decisiones, requiere una base de datos estable.
La tecnologa permite realizar backup y recuperacin, transacciones e integridad de los datos
y la deteccin y solucin al estancamiento que es ms complejo. En el data warehouse no es
necesario el procesamiento.
La fuente de casi toda la informacin del data warehouse es el ambiente operacional. A simple
vista, se puede pensar que hay redundancia masiva de datos entre los dos ambientes. Desde
luego, la primera impresin de muchas personas se centra en la gran redundancia de datos,
entre el ambiente operacional y el ambiente de data warehouse. Dicho razonamiento es
superficial y demuestra una carencia de entendimiento con respecto a qu ocurre en el data
warehouse. De hecho, hay una mnima redundancia de datos entre ambos ambientes.
1.4 ESTRUCTURA DEL DATA WAREHOUSE
Los data warehouses tienen una estructura distinta. Hay niveles diferentes de esquematizacin
y detalle que delimitan el data warehouse. La estructura de un data warehouse se muestra en
la Figura N 5.
En la figura, se muestran los diferentes componentes del data warehouse y son:

Detalle de datos actuales

Detalle de datos antiguos

Datos ligeramente resumidos

Datos completamente resumidos

Meta data

Detalle de datos actuales.- En gran parte, el inters ms importante radica en el detalle de los
datos actuales, debido a que:
Refleja las ocurrencias ms recientes, las cuales son de gran inters
Es voluminoso, ya que se almacena al ms bajo nivel de granularidad.
Casi siempre se almacena en disco, el cual es de fcil acceso, aunque su administracin sea
costosa y compleja.
Detalle de datos antiguos.- La data antigua es aquella que se almacena sobre alguna forma
de almacenamiento masivo. No es frecuentemente accesada y se almacena a un nivel de
detalle, consistente con los datos detallados actuales. Mientras no sea prioritario el
almacenamiento en un medio de almacenaje alterno, a causa del gran volumen de datos unido

al acceso no frecuente de los mismos, es poco usual utilizar el disco como medio de
almacenamiento.
Datos ligeramente resumidos.- La data ligeramente resumida es aquella que proviene desde
un bajo nivel de detalle encontrado al nivel de detalle actual. Este nivel del data warehouse
casi siempre se almacena en disco. Los puntos en los que se basa el diseador para construirlo
son:
Que la unidad de tiempo se encuentre sobre la esquematizacin hecha.
Qu contenidos (atributos) tendr la data ligeramente resumida.
Datos completamente resumidos.- El siguiente nivel de datos encontrado en el data
warehouse es el de los datos completamente resumidos. Estos datos son compactos y
fcilmente accesibles.
A veces se encuentra en el ambiente de data warehouse y en otros, fuera del lmite de la
tecnologa que ampara al data warehouse. (De todos modos, los datos completamente
resumidos son parte del data warehouse sin considerar donde se alojan los datos fsicamente.)
Metadata.- El componente final del data warehouse es el de la metadata. De muchas maneras
la metadata se sita en una dimensin diferente al de otros datos del data warehouse, debido a
que su contenido no es tomado directamente desde el ambiente operacional.
La metadata juega un rol especial y muy importante en el data warehouse y es usada como:
Un directorio para ayudar al analista a ubicar los contenidos del data warehouse.
Una gua para el mapping de datos de cmo se transforma, del ambiente operacional al de
data warehouse.
Una gua de los algoritmos usados para la esquematizacin entre el detalle de datos actual,
con los datos ligeramente resumidos y stos, con los datos completamente resumidos, etc.
La metadata juega un papel mucho ms importante en un ambiente data warehousing que en
un operacional clsico.
A fin de recordar los diferentes niveles de los datos encontrados en el data warehouse,
considere el ejemplo mostrado en la Figura N 6.

1.5.2 Operaciones en un Data Warehouse


En la Figura N 8 se muestra algunos de los tipos de operaciones que se efectan dentro de un
ambiente data warehousing.

a) Sistemas Operacionales
Los datos administrados por los sistemas de aplicacin operacionales son la fuente principal
de datos para el data warehouse.
Las bases de datos operacionales se organizan como archivos indexados (UFAS, VSAM),
bases de datos de redes/jerrquicas (I-D-S/II, IMS, IDMS) o sistemas de base de datos
relacionales (DB2, Oracle, Informix, etc.). Segn las encuestas, aproximadamente del 70% a
80% de las bases de datos de las empresas se organizan usando DBMSs no relacional.
b) Extraccin, Transformacin y Carga de los Datos
Se requieren herramientas de gestin de datos para extraer datos desde bases de datos y/o
archivos operacionales, luego es necesario manipular o transformar los datos antes de cargar
los resultados en el data warehouse.
Tomar los datos desde varias bases de datos operacionales y transformarlos en datos
requeridos para el depsito, se refiere a la transformacin o a la integracin de datos. Las
bases de datos operacionales, diseadas para el soporte de varias aplicaciones de produccin,
frecuentemente difieren en el formato.
Los mismos elementos de datos, si son usados por aplicaciones diferentes o administrados por
diferentes software DBMS, pueden definirse al usar nombres de elementos inconsistentes, que
tienen formatos inconsistentes y/o ser codificados de manera diferente. Todas estas
inconsistencias deben resolverse antes que los elementos de datos sean almacenados en el data
warehouse.
c) Metadata
Otro paso necesario es crear la metadata. La metadata (es decir, datos acerca de datos)
describe los contenidos del data warehouse. La metadata consiste de definiciones de los
elementos de datos en el depsito, sistema(s) del (os) elemento(s) fuente. Como la data, se

integra y transforma antes


d) Acceso de usuario final

de

ser

almacenada

en

informacin

similar.

Los usuarios accesan al data warehouse por medio de herramientas de productividad basadas
en GUI (Graphical User Interface - Interfase grfica de usuario). Pueden proveerse a los
usuarios del data warehouse muchos de estos tipos de herramientas.
Estos pueden incluir software de consultas, generadores de reportes, procesamiento analtico
en lnea, herramientas data/visual mining, etc., dependiendo de los tipos de usuarios y sus
requerimientos particulares. Sin embargo, una sola herramienta no satisface todos los
requerimientos, por lo que es necesaria la integracin de una serie de herramientas.
e) Plataforma del data warehouse
La plataforma para el data warehouse es casi siempre un servidor de base de datos relacional.
Cuando se manipulan volmenes muy grandes de datos puede requerirse una configuracin en
bloque de servidores UNIX con multiprocesador simtrico (SMP) o un servidor con
procesador paralelo masivo (MPP) especializado.
Los extractos de la data integrada/transformada se cargan en el data warehouse. Uno de los
ms populares RDBMSs disponibles para data warehousing sobre la plataforma UNIX (SMP
y MPP) generalmente es Teradata. La eleccin de la plataforma es crtica. El depsito crecer
y hay que comprender los requerimientos despus de 3 o 5 aos.
Muchas de las organizaciones quieran o no escogen una plataforma por diversas razones: el
Sistema X es nuestro sistema elegido o el Sistema Y est ya disponible sobre un sistema
UNIX que nosotros ya tenemos. Uno de los errores ms grandes que las organizaciones
cometen al seleccionar la plataforma, es que ellos presumen que el sistema (hardware y/o
DBMS) escalar con los datos.
El sistema de depsito ejecuta las consultas que se pasa a los datos por el software de acceso a
los datos del usuario. Aunque un usuario visualiza las consultas desde el punto de vista de un
GUI, las consultas tpicamente se formulan como pedidos SQL, porque SQL es un lenguaje
universal
y
el
estndar
de
hecho
para
el
acceso
a
datos.
f) Datos Externos
Dependiendo de la aplicacin, el alcance del data warehouse puede extenderse por la
capacidad de acceder a la data externa. Por ejemplo, los datos accesibles por medio de
servicios de computadora en lnea (tales como CompuServe y America On Line) y/o va
Internet, pueden estar disponibles a los usuarios del data warehouse.
Evolucin del Depsito
Construir un data warehouse es una tarea grande. No es recomendable emprender el
desarrollo del data warehouse de la empresa como un proyecto cualquiera. Ms bien, se
recomienda que los requerimientos de una serie de fases se desarrollen e implementen en
modelos consecutivos que permitan un proceso de implementacin ms gradual e iterativo.
No existe ninguna organizacin que haya triunfado en el desarrollo del data warehouse de la
empresa, en un slo paso. Muchas, sin embargo, lo han logrado luego de un desarrollo paso a
paso. Los pasos previos evolucionan conjuntamente con la materia que est siendo agregada.

Los datos en el data warehouse no son voltiles y es un repositorio de datos de slo lectura
(en general). Sin embargo, pueden aadirse nuevos elementos sobre una base regular para que
el contenido siga la evolucin de los datos en la base de datos fuente, tanto en los contenidos
como en el tiempo.
Uno de los desafos de mantener un data warehouse, es idear mtodos para identificar datos
nuevos o modificados en las bases de datos operacionales. Algunas maneras para identificar
estos datos incluyen insertar fecha/tiempo en los registros de base de datos y entonces crear
copias de registros actualizados y copiar informacin de los registros de transaccin y/o base
de datos diarias.
Estos elementos de datos nuevos y/o modificados son extrados, integrados, transformados y
agregados al data warehouse en pasos peridicos programados. Como se aaden las nuevas
ocurrencias de datos, los datos antiguos son eliminados. Por ejemplo, si los detalles de un
sujeto particular se mantienen por 5 aos, como se agreg la ltima semana, la semana
anterior es eliminada.
1.6

TRANSFORMACION

DE

DATOS

METADATA

1.6.1 Transformacin de Datos


Uno de los desafos de cualquier implementacin de data warehouse, es el problema de
transformar los datos. La transformacin se encarga de las inconsistencias en los formatos de
datos y la codificacin, que pueden existir dentro de una base de datos nica y que casi
siempre existen cuando mltiples bases de datos contribuyen al data warehouse.
En la Figura N 9 se ilustra una forma de inconsistencia, en la cual el gnero se codifica de
manera diferente en tres bases de datos diferentes. Los procesos de transformacin de datos se
desarrollan para direccionar estas inconsistencias.

La transformacin de datos tambin se encarga de las inconsistencias en el contenido de


datos. Una vez que se toma la decisin sobre que reglas de transformacin sern establecidas,
deben crearse e incluirse las definiciones en las rutinas de transformacin.
Se requiere una planificacin cuidadosa y detallada para transformar datos inconsistentes en
conjuntos de datos conciliables y consistentes para cargarlos en el data warehouse.
1.6.2 Metadata
Otro aspecto de la arquitectura de data warehouse es crear soporte a la metadata. Metadata es
la informacin sobre los datos que se alimenta, se transforma y existe en el data warehouse.
Metadata es un concepto genrico, pero cada implementacin de la metadata usa tcnicas y
mtodos especficos.
Estos mtodos y tcnicas son dependientes de los requerimientos de cada organizacin, de las
capacidades existentes y de los requerimientos de interfaces de usuario. Hasta ahora, no hay
normas para la metadata, por lo que la metadata debe definirse desde el punto de vista del
software data warehousing, seleccionado para una implementacin especfica.
Tpicamente, la metadata incluye los siguientes tems:

Las estructuras de datos que dan una visin de los datos al administrador de
datos.

Las definiciones del sistema de registro desde el cual se construye el data


warehouse.

Las especificaciones de transformaciones de datos que ocurren tal como la


fuente de datos se replica al data warehouse.

El modelo de datos del data warehouse (es decir, los elementos de datos y sus relaciones).
Un registro de cuando los nuevos elementos de datos se agregan al data warehouse y cuando
los elementos de datos antiguos se eliminan o se resumen.
Los niveles de sumarizacin, el mtodo de sumarizacin y las tablas de registros de su data
warehouse.
Algunas implementaciones de la metadata tambin incluyen definiciones de la(s) vista(s)
presentada(s) a los usuarios del data warehouse. Tpicamente, se definen vistas mltiples para
favorecer las preferencias variadas de diversos grupos de usuarios. En otras
implementaciones, estas descripciones se almacenan en un Catlogo de Informacin.
Los esquemas y subesquemas para bases de datos operacionales, forman una fuente ptima de
entrada cuando se crea la metadata. Hacer uso de la documentacin existente, especialmente
cuando est disponible en forma electrnica, puede acelerar el proceso de definicin de la
metadata del ambiente data warehousing.
La metadata sirve, en un sentido, como el corazn del ambiente data warehousing. Crear
definiciones de metadata completa y efectiva puede ser un proceso que consuma tiempo, pero
lo mejor de las definiciones y si usted usa herramientas de gestin de software integrado, son
los esfuerzos que darn como resultado el mantenimiento del data warehouse.

1.7 FLUJO DE DATOS


Existe un flujo de datos normal y predecible dentro del data warehouse. La Figura N 10
muestra ese flujo.
Los datos ingresan al data warehouse desde el ambiente operacional. (Hay pocas excepciones
a esta regla).
Al ingresar al data warehouse, la informacin va al nivel de detalle actual, tal como se
muestra. Se queda all y se usa hasta que ocurra uno de los tres eventos siguientes:

Sea eliminado

Sea resumido

Sea archivado

Con el proceso de desactualizacin en un data warehouse se mueve el detalle de la data actual


a data antigua, basado en el tiempo de los datos. El proceso de esquematizacin usa el detalle
de los datos para calcular los datos en forma ligera y completamente resumidos.
Hay pocas excepciones al flujo mostrado. Sin embargo, en general, para la mayora de datos
encontrados en un data warehouse, el flujo de la informacin es como se ha explicado.
1.9 USOS DEL DATA WAREHOUSE
Los datos operacionales y los datos del data warehouse son accesados por usuarios que usan
los datos de maneras diferentes.
Uso
de
Base
Operacionales

DatosUso de

de

Data Warehouse

Muchos usuarios concurrentes


Consultas
actualizables
Cantidades
detallados

predefinidas

Pocos usuarios concurrentes


yConsultas complejas, frecuentemente
no anticipadas.

pequeas

Requerimientos
inmediata

de

de

datosCantidades
detallados

grandes

respuestaRequerimientos
crticos

de

de

datos

respuesta

no

Maneras diferentes de uso de datos


Los usuarios de un data warehouse necesitan acceder a los datos complejos, frecuentemente
desde fuentes mltiples y de formas no predecibles.
Los usuarios que accedan a los datos operacionales, comnmente efectan tareas predefinidas
que, generalmente requieren acceso a una sola base de datos de una aplicacin. Por el
contrario, los usuarios que accedan al data warehouse, efectan tareas que requieren acceso a
un conjunto de datos desde fuentes mltiples y frecuentemente no son predecibles. Lo nico

que se conoce (si es modelada correctamente) es el conjunto inicial de datos que se han
establecido en el depsito.
Por ejemplo, un especialista en el cuidado de la salud podra necesitar acceder a los datos
actuales e histricos para analizar las tendencias de costos, usando un conjunto de consultas
predefinidas. Por el contrario, un representante de ventas podra necesitar acceder a los datos
de cliente y producto para evaluar la eficacia de una campaa de marketing, creando consultas
base o ad-hoc para encontrar nuevamente necesidades definidas.
Slo pocos usuarios acceden a los datos concurrentemente
En contraste a la produccin de sistemas que pueden manejar cientos o miles de usuarios
concurrentes, al data warehouse acceda un limitado conjunto de usuarios en cualquier tiempo
determinado.
Los usuarios generan un procesamiento no predecible complejo
Los usuarios del data warehouse generan consultas complejas. A veces la respuesta a una
consulta conduce a la formulacin de otras preguntas ms detalladas, en un proceso llamado
drilling down. El data warehouse puede incluir niveles de resmenes mltiples, derivado de
un conjunto principal, nico, de datos detallados, para soportar este tipo de uso.
En efecto, los usuarios frecuentemente comienzan buscando en los datos resumidos y como
identifican reas de inters, comienzan a acceder al conjunto de datos detallado. Los
conjuntos de datos resumidos representan el "Qu" de una situacin y los conjuntos de datos
detallados permiten a los usuarios construir un cuadro sobre "Cmo" se ha derivado esa
situacin.
Las consultas de los usuarios accedan a cantidades grandes de datos
Debido a la necesidad de investigar tendencias y evaluar las relaciones entre muchas clases de
datos, las consultas al data warehouse permiten acceder a volmenes muy grandes tanto de
data detallada como resumida. Debido a los requerimientos de datos histricos, los data
warehouses evolucionan para llegar a un tamao ms grande que sus orgenes operacionales
(de 10 a 100 veces ms grande).
Las consultas de los usuarios no tienen tiempos de respuesta crticos
Las transacciones operacionales necesitan una respuesta inmediata porque un cliente puede
estar esperando una respuesta. En el data warehouse, por el contrario, tiene un requerimiento
de respuesta no-crtico porque el resultado frecuentemente se usa en un proceso de anlisis y
toma de decisiones. Aunque los tiempos de respuesta no son crticos, los usuarios esperan una
respuesta
dentro
del
mismo
da
en
que
es
hecha
la
consulta.
Por lo general, los diferentes niveles de datos dentro del data warehouse reciben diferentes
usos. A ms alto nivel de esquematizacin, se tiene mayor uso de los datos.
En la Figura N 12 se muestra que hay mayor uso de los datos completamente resumidos, a
diferencia de la informacin antigua que apenas es usada.
Hay una buena razn para mover una organizacin al paradigma sugerido en la figura, la
utilizacin del recurso. La data ms resumida, permite capturar los datos en forma ms rpida
y eficiente. Si en una tarea se encuentra que se hace mucho procesamiento a niveles de detalle

del data warehouse, entonces se consumir muchos recursos de mquina. Es mejor hacer el
procesamiento a niveles ms altos de esquematizacin como sea posible.
Para muchas tareas, el analista de sistemas de soporte de decisiones usa la informacin a nivel
de detalle en un pre data warehouse. La seguridad de la informacin de detalle se consigue de
muchas maneras, aun cuando estn disponibles otros niveles de esquematizacin. Una de las
actividades del diseador de datos es el de desconectar al usuario del sistema de soporte de
decisiones del uso constante de datos a nivel de detalle ms bajo.
El diseador de datos tiene dos predisposiciones:
Instalar un sistema chargeback, donde el usuario final pague por los recursos consumidos
Sealar el mejor tiempo de respuesta que puede obtenerse cuando se trabaja con la data a un
nivel alto de esquematizacin, a diferencia de un pobre tiempo de respuesta que resulta de
trabajar con los datos a un nivel bajo de detalle.
Para ilustrar cmo un data warehouse puede ayudar a una organizacin a mejorar sus
operaciones, se muestra un ejemplo de lo que es el desarrollo de actividades sin tener un data
warehouse.

Ejemplo:
Preparacin de un reporte complejo
Considere un problema bastante tpico en una compaa de fabricacin grande en el que se
pide una informacin (un reporte) que no est disponible.
El informe incluye las finanzas actuales, el inventario y la condicin de personal, acompaado
de comparaciones del mes actual con el anterior y el mismo mes del ao anterior, con una
comparacin adicional de los 3 aos precedentes. Se debe explicar cada desviacin de la
tendencia que cae fuera de un rango predefinido.
Sin un data warehouse, el informe es preparado de la manera siguiente:
La informacin financiera actual se obtiene desde una base de datos mediante un programa de
extraccin de datos, el inventario actual de otro programa de extraccin de otra base de datos,

la condicin actual de personal de un tercer programa de extraccin y la informacin histrica


desde un backup de cinta magntica o CD-ROM.
Lo ms interesante es que se ha pedido otro informe que contine al primer informe (debido a
que las preguntas se originaron a partir del anterior). El hecho es, que ninguno de los trabajos
realizados hasta aqu (por ejemplo, diversos programas de extraccin) se pueden usar para los
prximos o para cualquier reporte subsiguiente. Imagine el tiempo y el esfuerzo que se ha
desperdiciado por un enfoque anticuado. (Ver Figura N 13).
Las inconsistencias deben identificarse en cada conjunto de datos extrados y resolverse, por
lo general, manualmente. Cuando se completa todo este procesamiento, el reporte puede ser
formateado, impreso, revisado y transmitido.
Nuevamente, el punto importante aqu es que todo el trabajo desempeado para hacer este
informe no afecta a otros reportes que pueden solicitarse es decir, todos ellos son
independientes y caros, desde el punto de vista de recursos y productividad.
Al crear un data warehouse y combinar todos los datos requeridos, se obtienen los siguientes
beneficios:
Las inconsistencias de los datos se resuelven automticamente cuando los elementos de datos
se cargan en el data warehouse, no manualmente, cada vez que se prepara un reporte.
Los errores que ocurrieron durante el proceso complejo de la preparacin del informe, se
minimizan porque el proceso es ahora mucho ms simple.
Los elementos de datos son fcilmente accesibles para otros usos, no slo para un reporte
particular.
Se crea una sola fuente.

1.11 EJEMPLO DE UN DATA WAREHOUSE


En la Figura N 14 se muestra un ejemplo hipottico de un data warehouse estructurado para
un centro de produccin industrial.

Se muestra slo el detalle actual, no as los niveles de esquematizacin ni los archivos de


detalle ms antiguos.
Adems, se observa que hay tablas del mismo tipo divididas a travs del tiempo. Por ejemplo,
para el histrico de la fabricacin de las piezas, hay muchas tablas separadas fsicamente,
representando cada una un trimestre diferente. La estructura de los datos es consistente con la
tabla de la elaboracin de las piezas, aunque fsicamente hay muchas tablas que lgicamente
incluyen el histrico.

Para los diferentes tipos de tablas hay diferentes unidades de tiempo que fsicamente dividen
las unidades de informacin. El histrico de fabricacin est dividido por trimestres, el
histrico de la orden de piezas est dividido por aos y el histrico de cliente es un archivo
nico, no dividido por el tiempo.
As tambin, las diferentes tablas son vinculadas por medio de un identificador comn, piezas
u rdenes de piezas (la representacin de la interrelacin en el ambiente de depsito toma una
forma muy diferente al de otros ambientes, tal como el ambiente operacional).
2.1.4 ESTRATEGIAS PARA LA GESTION DE UN DATA WAREHOUSE
Los data warehouses requieren una comercializacin y gestin muy cuidadosa. Debe
considerarse
lo
siguiente:
1ra.: Un data warehouse es una inversin buena slo si los usuarios finales realmente pueden
conseguir informacin vital ms rpida y ms barata de lo que obtienen con la tecnologa
actual.
Como consecuencia, la gestin tiene que pensarse seriamente sobre cmo quieren sus
depsitos para su eficaz desempeo y cmo conseguirn llegar a los usuarios finales.
2da.: La administracin debe reconocer que el mantenimiento de la estructura del data
warehouse es tan crtico como el mantenimiento de cualquier otra aplicacin de misincrtica.
De hecho, la experiencia ha demostrado que los data warehouses llegarn a ser rpidamente
uno de los sistemas ms usados en cualquier organizacin.
3ra.: La gestin debe comprender tambin que si se embarcan sobre un programa data
warehousing, se crearn nuevas demandas sobre sus sistemas operacionales, que son:
-

Demandas para mejorar datos

Demandas para una data consistente

Demandas para diferentes tipos de datos, etc.

2.4.2 BENEFICIOS A OBTENER


a) Para la Empresa
El data warehouse hace lo posible por aprovechar el valor potencial enorme de los recursos de
informacin de la empresa y volver ese valor potencial en valor verdadero.
b) Para los Usuarios
El data warehouse extiende el alcance de la informacin para que puedan acceder
directamente en lnea, lo que a la vez contribuye en su capacidad para operar con mayor
efectividad las tareas rutinarias o no.
Los usuarios del data warehouse pueden acceder a una riqueza de informacin
multidimensional, presentado coherentemente como una fuente nica confiable y disponible a
ellos por medio de sus estaciones de trabajo.

Los usuarios pueden usar sus herramientas familiares, hojas de clculo, procesadores de
textos y software de anlisis de datos y anlisis estadstico para manipular y evaluar la
informacin obtenida desde el data warehouse.
c) Para la Organizacin en Tecnologas de Informacin
El data warehouse enriquece las capacidades del usuario autosuficiente y hace lo factible para
ofrecer nuevos servicios a los usuarios, sin interferir con las aplicaciones cotidianas de
produccin.
La pugna constante por resolver las necesidades de usuarios que piden acceso a los datos
operacionales, finaliza con la implementacin de un data warehouse. La mayora de los
usuarios no necesita acceder ms a los datos actuales, porque ellos tienen informacin ms
til disponible desde el data warehouse.
Un data warehouse aumenta el valor de las inversiones en tecnologas de informacin, en
aplicaciones y bases de datos operacionales. Como estas bases de datos alimentan
informacin, al evolucionar el data warehouse, llegan a ser imprescindibles no solamente para
las operaciones diarias, sino adems como la fuente de informacin del negocio de amplio
rango.
3. SOFTWARE EN UN DATA WAREHOUSE
La informacin estratgica sobre clientes importantes o un exitoso lanzamiento de producto,
se almacena en gigabytes de datos de marketing o ndice de transacciones de venta. Esa
informacin debe ser extrada de alguna forma para la toma de decisiones.
En este caso se necesita software especializado que permita capturar los datos relevantes
forma rpida y pueda verse a travs de diferentes dimensiones de los datos. El software
debera limitarse nicamente al acceso a los datos, si no tambin, al anlisis significativo
los datos. En efecto, transformar los datos de la informacin cruda o no procesada,
informacin til para la empresa.

en
no
de
en

Los softwares o herramientas de negocios inteligentes se colocan sobre la plataforma data


warehousing y proveen este servicio. Debido a que son el punto principal de contacto entre la
aplicacin del depsito y la gente que lo usa, estas herramientas pueden constituir la
diferencia entre el xito o fracaso de un depsito.
Las herramientas de negocio inteligentes se han convertido en los sucesores de los sistemas de
soporte de decisin, pero tienen un alcance ms amplio. No solamente ayudan en las
decisiones de soporte sino, en muchos casos, estas herramientas soportan muchas funciones
operacionales y de misin-crtica de la compaa. Sin embargo, estos productos no son
infalibles ya que slo se consigue el mximo provecho del data warehouse, si elige las
herramientas adecuadas a las necesidades de cada usuario final.
Los software usados en un data warehouse se clasifican en Herramientas de Consulta y
Reporte, Herramientas de Base de Datos Multidimensionales/ Olap (On Line Analytical
Processing), Sistemas de Informacin Ejecutivos, Herramientas Data Mining y los Sistemas
de Gestin de Bases de Datos propiamente.
En el Anexo N 1, se muestra una lista de los softwares existentes en la tecnologa Data
warehousing.

Caso de estudio: Gran Distribuidor


Realidad Planteada
La empresa distribuidora de productos alimenticios Gran Distribuidor desea instalar un sistema
de DW para hacer un seguimiento ms eficiente de sus productos.
Se trata de una empresa nacional, que cuenta con diversos centros de fabricacin y/o elaboracin
de productos alimenticios y trabaja tambin en cooperacin con productores agrcolas de la
regin.
La empresa se encarga tambin de la distribucin de los productos en todo el territorio nacional.
Se comenz originalmente con la distribucin de productos envasados y bebidas, incorporndose
luego los lcteos y panificados. Recientemente, gracias a los acuerdos con cooperativas agrarias
se incluy la distribucin de productos agrcolas.
Muchos de los productos que se distribuyen son muy perecederos (la mayor parte de los lcteos,
panificados y vegetales), por lo que se debe ajustar muy bien las cantidades en stock de estos
productos.
La empresa trabaja con empresas mayoristas y supermercados, pero tambin con almacenes y
restaurantes. Algunos de estos clientes tienen casas en varias ciudades del pas por lo que debe
resolverse el traslado de mercaderas al interior.
Actualmente se est apuntando a incrementar las ventas en las ciudades del interior y ganar
mercado incorporando comercios locales.

Requerimientos
Evolucin de las ventas
1- Se desea hacer un seguimiento de las ventas comparando los distintos meses del ao, y del
ao anterior, estudiando la evolucin por familia de productos, y pudindola refinar hasta un
producto o presentacin de producto en concreto. Por ejemplo: una presentacin del producto
"Agua sin gas" es "Agua sin gas de 2 litros".
2- Se desea tambin observar las variaciones en las ventas para las distintas ciudades del
pas.
Disminucin de los costos
3- Se necesita comparar las diferencias entre importes de ventas y costos, de manera de
maximizar las ganancias. Un estudio por producto ayudara a los responsables de facturacin
en la reduccin de los costos.
4- En los costos tambin influye el cliente y la regin geogrfica (traslados, peajes, transporte
especial, etc). Se quiere estudiar como inciden esas variables en los costos. Interesa el total de
costos, no es importante el desglose por tipo de costo.
Seguimiento del stock.
5- Se quiere analizar el stock existente de productos, comparndolo con la cantidad vendidaen
un da. Esta comparacin la usan los analistas para predecir para cunto tiempoalcanzara el
stock: si el stock es demasiado pequeo se pueden perder ventas, y si esdemasiado grande es
dinero estancado. Este estudio es de vital importancia para ajustar laproduccin de productos

perecederos. Por ejemplo: al final del mes de enero de 2003haba 2000 unidades del producto
"Agua sin gas de 2 litros" y se vendi un promedio de500 unidades diarias.
Anlisis de mercado.
6- Interesa medir los volmenes de venta para los diferentes rubros (mayoristas,
supermercados, almacenes y restaurantes) estudiando las variaciones para los distintos
perodos. Los analistas asocian esta informacin con promociones o propagandas orientadas a
un perfil de clientes, lo que les permite medir los efectos positivos y/o negativos de una
promocin en un sector. No interesa comparar cliente por cliente, alcanza con un
fraccionamiento por rubros y subrubros. Tampoco interesa registrar informacin de las
promociones.
Distribucin geogrfica.
7- Interesa comparar las ventas por departamentos y ciudades. Esto nos indica las regiones
que estn en riesgo y necesitan de mayor atencin. El anlisis debe incluir valores absolutos
(volmenes de venta), y valores relativos (proporcionales a la cantidad de clientes en cada
regin).
8- Se desea tambin estudiar la evolucin en el tiempo de la cantidad de clientes por ciudad y
departamento.
Warehousing: Base Fuente: GrandDFuente
Se tienen las siguientes tablas:
Departamentos ( DE_Codigo, DE_Nombre)
Contiene informacin sobre los departamentos del pas.
Ciudades (CI_Codigo, CI_Depto, CI_Nombre, CI_Poblacion)
Contiene informacin sobre las ciudades. El atributo CI_Depto permite indicar en
quedepartamento se ubica cierta ciudad.

Sucursales(SC_Codigo,SC_Depto,SC_Ciudad,SC_Cliente,SC_Direccin,SC_FechaAl
ta, SC_FechaBaja, SC_CantEmpleados)
Contiene informacin referente a la presencia de los clientes en las ciudades. Un cliente
puedetener varias sucursales en una misma ciudad, y para cada una de ellas se indica la fecha
decomienzo de actividad o fecha de alta y en caso de cese de actividades la fecha de baja.
Cadaciudad se identifica por los atributos (SC_Depto, SC_Ciudad).
Rubros (RU_Codigo, RU_Nombre)
Contiene informacin referente a los rubros en que se agrupan los subrubros a los cuales
sededican los clientes. Un ejemplo de rubro: ALMACENES
Subrubros (SR_Codigo, SR_Nombre, SR_Rubro)
Contiene informacin sobre los subrubros y su relacin con los rubros. Un ejemplo
desubrubro: Grandes para el rubro ALMACENES
Clientes (CL_Codigo, CL_Nombre, CL_RazonSocial, CL_Subrubro)
Contiene informacin sobre las empresas clientes de la empresa distribuidora. Cada cliente
trabaja en un nico subrubro

FamiliasProductos (FA_Codigo, FA_Nombre, FA_Descripcion)


Contiene informacin sobre las distintas familias de productos que son distribuidos
Productos (PR_Codigo, PR_Nombre, PR_Familia, PR_Duracion)
Contiene informacin sobre los productos que son distribuidos. De cada producto se conoce la
familia a la que pertenece y la duracin del mismo (No Perecedero, Poco Perecedero, Muy
Perecedero).

Presentaciones Productos (PP_Codigo, PP_Nombre, PP_Producto,


PP_Tamanio,PP_Costo Produccion)
Contiene informacin sobre las diferentes presentaciones o envases en que puede ser
comercializado cierto producto. El costo de produccin no slo depende del producto sino
tambin de la presentacin.
CostosDeTraslado (CT_Sucursal, CT_Presentacin, CT_Costo )
Contiene informacin relacionada al costo de trasladar cierta presentacin de un producto
desde la central de distribucin hasta cierta sucursal.

Facturas (FC_Codigo, FC_Sucursal, FC_Fecha)


Contiene informacin sobre las facturas emitidas en cada sucursal, junto con la fecha de la
venta.
RegistrosDeFacturas (RF_Factura, RF_Presentacin, RF_Unidades, RF_Importe)
Contiene informacin que amplia la informacin almacenada en la tabla Facturas. Para cada
factura se almacena las unidades vendidas de cada presentacin de producto, as como el
importe que representan en total.

Stock (ST_Presentacin, ST_Unidades, ST_Pesos)

Contiene informacin sobre el stock existente al momento en el distribuidor. Para cada


presentacin de producto se registran tanto el stock en unidades como el stock en
pesos(calculado en base al stock por unidades y el costo de produccin de cada presentacin)
En la figura 1 se presentan las tablas descriptas junto con las relaciones de clave fornea
existentes entre

CONCLUSIONES
Data Warehousing se considera exitoso, cuando su objetivo final comienza a concretarse,
es decir que la gente de la empresa use el DW para satisfacer sus necesidades empresariales
Un Data Warehouse puede producir la informacin correcta para los ejecutivos
empresariales, gerentes y analistas. Conectarse al potencial del Data Warehouse slo esta
limitado por la capacidad, habilidad y creatividad de los usuarios empresariales. Las
experiencias anteriores apuntan hacia un amplio rango de usos: anlisis de rentabilidad y
crecimiento, administracin estratgica, administracin de relaciones con el cliente,
administracin de activos corporativos y manejo de la reingeniera del proceso empresarial y
la administraci6n de calidad total. Los Data Warehouses se ha aplicado con xito en los
sectores de manufactura, bienes de consumo y distribucin, y en banca y finanzas.
El uso del Data Warehouse en el curso diario de una empresa consiste en dos grandes
actividades: acceso y recuperacin, y anlisis y reportes. Estas actividades se manejan a travs
del bloque de Acceso y Uso de la arquitectura de referencia. Existen dos modelos para
aprovechar el Data Warehouse: el modelo de verificacin, que utiliza tcnicas de
procesamiento analtico e informtico, y el modelo de descubrimiento, que emplea tcnicas de
minera de datos.
La finalidad de un Data Warehouse consiste en asistir a la administracin a comprender el
pasado y planear el futuro. Aunque el Data Warehouse contiene informacin estratgica
crucial, extraer un valor empresarial del Data Warehouse es un esfuerzo complejo. Obtener
este valor requiere de una mezcla de aptitudes empresariales, habilidad tcnica, intuicin y
experiencia.

BIBLIOGRAFIA
Ballard, C. Herreman, D. Schau, D. Bell, R. Kim, E. Valncic, A.: Data Modeling
Techniques for Data Warehousing. SG24-2238-00. IBM Red Book. 1998.
Cabibbo, L. Torlone, R.:"A Logical Approach to Multidimensional Databases", EDBT,
1998.
Carpani, F.: CMDM: A conceptual multidimensional model for Data Warehouse.
Master Thesis. Advisor: Ruggia. InCo - Pedeciba, UdelaR, Uruguay, 2000.
Franconi, E. Sattler, U.:"A Data Warehouse Conceptual Data Model for
Multidimensional Aggregation", DMDW99, Germany, 1999.
Golfarelli, M. Maio, D. Rizzi, S.:"Conceptual Design of Data Warehouses from E/R
Schemes.", HICSS98, IEEE, Hawaii,1998.
http://www.techguide.com/
http://www.guia.com.uy
http://sol.facea.puc.cl/a352m/datawarehouse/index.htm
http://www.gcc.com.mx/soluciones/dwhouse.htm
http://www.consisa.com/herramientas/pag_dw.htm
http://www.sybase.com/products/dataware/studio.html
http://www.microsoft.com/Spain/PRENSA/11_98/NOTA3.HTM

Vous aimerez peut-être aussi