Vous êtes sur la page 1sur 3

EXAMEN PRESENCIAL INTELIGENCIA DE NEGOCIOS

Semestre: 2014-2
Seccin: O
Docente: Ms. Ing. Julio Csar lvarez Reyes

1. Describa en que consiste el proceso ETL.


El proceso ETL permite a las organizaciones mover un conjunto de datos desde cierta fuente hasta
una base de datos o Data Warehouse.
El proceso ETL consta de tres fases: Extraer, Transformar y Carga

Extraer: En esta fase se extraen los datos desde los sistemas de origen que pueden ser
mltiples y adems estn en distinto formato. Luego de la extraccin los datos son
convertidos a un nico formato que ser el requerido para entrar en la fase de
Transformacin. Durante este proceso se tiene en cuenta el no causar ningn impacto en los
sistemas de origen.

Transformar: En esta fase se aplican a los datos provenientes de la fase anterior una serie de
reglas de negocio o funciones. Tambin puede ser necesario aplicar algunas de las siguientes
transformaciones:
Seleccionar solo determinadas columnas para la carga
Traducir cdigos, por ejemplo en el sistema origen puede usarse H para hombre y M
para mujer, pero en el destino se debe almacenar 1 para hombre y 2 para mujer.
Unir datos mltiples, por ejemplo en el origen pueden estar separados nombres y
apellidos pero en el destino estos dos datos se fusionan en uno solo.
Separar datos, lo contrario a lo anterior, por ejemplo un campo nombre que incluya
nombres y apellidos puede separarse en dos campos un campo nombre y otro apellido.
Generacin
de
campos
clave
en
el
destino.

Carga: En esta ltima fase los datos ya transformados en la fase anterior son cargados en el
sistema destino (base de datos o Data Warehouse). Dependiendo de la necesidad de la
organizacin este proceso puede crear una nueva base de datos o sobre-escribir una
existente. A continuacin describimos dos formas bsicas de desarrollar el proceso de carga:
1. Acumulacin simple. Es el proceso ms simple y consiste en realizar una sntesis de todas
las transacciones ocurridas durante un determinado periodo de tiempo y transportar el
resultado en una nica transaccin hacia el sistema destino, almacenndose un valor
calculado, como una sumatoria o un promedio.
2. Rolling. Este proceso es el elegido cuando se opta por mantener ciertos niveles de
granulidad. Para ello se almacena informacin resumida a distintos niveles
correspondientes a diferentes agrupaciones dimensionales.

2. Grafique los niveles de uso de datos.

3. Qu es minera de datos?
Es toda una ciencia (parte de la ciencia informatica) cuyo objetivo principal es extraer
cierta informacin de un conjunto de datos y transformarla de forma que sea usable y
visualmente comprensible.
Tcnicamente, la minera de datos es el proceso de encontrar correlaciones o patrones
entre docenas de campos en grandes bases de datos relacionales.
4. Grafique la arquitectura de un DWH

5. Grafique el ciclo de vida de la metodologa de KIMBALL.


Ciclo de vida de la metodologa de Kimball

Vous aimerez peut-être aussi