Académique Documents
Professionnel Documents
Culture Documents
DATA WAREHOUSE
1. Procesamiento de Transacciones En Lnea (OLTP)
OLTP (On Line Transaction Processing), representa toda aquella informacin
transaccional que genera la empresa en su accionar diario, adems, de las fuentes
externas con las que puede llegar a disponer.
Archivos de textos.
Hipertextos.
Hojas de clculos.
2.1. Extraccin
Es aqu, en donde, basndose en las necesidades y requisitos de los usuarios, se exploran
las diversas fuentes OLTP que se tengan a disposicin, y se extrae la informacin que
se considere relevante al caso.
Manipular los datos sin interrumpir ni paralizar los OLTP, ni tampoco el DW.
2.2. Transformacin
Esta funcin es la encargada de convertir aquellos datos inconsistentes en un conjunto
de datos compatibles y congruentes, para que puedan ser cargados en el DW. Estas
acciones se llevan a cabo, debido a que pueden existir diferentes fuentes de informacin,
y es vital conciliar un formato y forma nica, definiendo estndares, para que todos los
datos que ingresarn al DW estn integrados.
Los casos ms comunes en los que se deber realizar integracin, son los siguientes:
Codificacin.
Medida de atributos.
Convenciones de nombramiento.
Fuentes mltiples.
Adems de lo antes mencionado, esta funcin se encarga de realizar, entre otros, los
procesos de Limpieza de Datos (Data Cleansing) y Calidad de Datos.
b) Medida de atributos.
Los
algoritmos
que
resuelven
estas
inconsistencias
son
c) Convenciones de nombramiento.
Usualmente, un mismo
e) Limpieza de datos.
Ignorarlos.
Eliminar la columna.
Filtrar la columna.
Reemplazar el valor.
Ignorarlos.
Eliminar la columna.
Filtrar la columna.
Reemplazar el valor.
2.3. Carga.
a) Esta funcin se encarga, por un lado de realizar las tareas relacionadas con:
Se debe tener en cuenta, que los datos antes de moverse al almacn de datos,
deben ser analizados con el propsito de asegurar su calidad, ya que este es un
factor clave, que no debe dejarse de lado.
b) Por otra parte, el proceso de Carga tiene la tarea de mantener la estructura del
DW, y trata temas relacionados con:
Claves Subrogadas.
Dimensiones Degeneradas.