Vous êtes sur la page 1sur 18

ETL (Data

Inteligencia de
Integration
negocios

PINCHAO FUELAGAN ALEXANDER


WLADIMIR
1 Introduccin
Para la realizacin del presente proyecto de la materia de inteligencia de
negocios se ha decidido hacer uso de una de las mltiples bases de datos que
maneja la DellStore . Se usaran datos que se encuentran desactualizados
correspondientes a los inventarios de bodega del ao 2006 y 2007 en el mes de
septiembre. El modelo de la base que servir de origen de los datos ser (Figura
1) basado en los datos entregados por el almacn de equipos

Figura 1.- Modelo conceptual de la base de datos Inventario

El modelo de la base que servir de destino de los datos ser (Figura 2) ser
desarrollado por el estudiante
Figura 2.- Modelo conceptual de la base de datos inventarioBI

2 Procedimiento
2.1 Creacin de la base de datos en PostgreSQL que ser el origen
de los datos
2.1.1 Creacin de la base de datos en la cual se va a correr el backup de
la base de datos

2.1.2 Agregamos nuestros valores de uso


2.1.3 Revisamos que la base se halla creado correctamente y que este
vaca

2.1.4 Seleccionamos la fuente del archivo backup, en este caso un script

2.1.5 Revisar los scripts

2.1.6 Correr el script de backup y esperamos la ejecucin exitosa del


script
2.1.7 Revisamos la base de datos

2.2 Creacin de la base de datos en PosgreSQL que ser el origen


de los datos
2.2.1 Creamos la base de datos en la que correremos el script de creacin
de nuestra base de datos y le agregamos los valores de creacin
2.2.2 Nos cercioramos que nuestra base esta generada de manera
correcta

2.2.3 Seleccionamos la fuente de nuestro script de creacin de las tablas

2.2.4 Revisamos el script y lo ejecutamos


2.2.5 Y esperamos el mensaje de confirmacin

2.2.6 Revisamos las tablas generadas


2.2.7 Revisamos las claves forneas de la tabla de hechos

2.2.8 Nos aseguramos de que las tablas estn vacas

2.3 Proceso de ETL de los datos


2.3.1 Para abrir la herramienta para Data Integration, Spoon, primero se
debe cargar el ambiente de desarrollo.

2.3.2 Luego se abre el ambiente de trabajo Spoon


2.3.3 Esperamos el mensaje de confirmacin

2.3.4 Inmediatamente despus del mensaje se desplegara el ambiente

2.3.5 Creamos una nueva transformacin

2.3.6 Creamos una nueva conexin a la base de datos para la carga

2.3.7 Agregamos las credenciales de la base de datos a utilizar


2.3.8 Probamos la conexin

2.3.9 Creamos una nueva conexin a la base de datos para la descarga

2.3.10 Agregamos los valores de la conexin

2.3.11 Probamos la conexin


2.3.12 Nos dirigimos a la parte de diseo y escogemos el origen de
los datos

2.3.13 Configuramos la entrada de datos

2.3.14 Pre-visualizamos los valores que se obtendrn

2.3.15 Se crea un data staging


2.3.16 Arrastramos hasta el rea de trabajo el Data Staging

2.3.17 Ligamos la tabla de entrada con el Data Staging

2.3.18 Editamos los valores del Data Staging

2.3.19 Aplicamos los cambios

2.3.20 Seleccionamos una salida de datos


2.3.21 Arrastramos la salida de datos al rea de trabajo

2.3.22 Ligamos el data Staging con la tabla de salida

2.3.23 Editamos los valores de la tabla de salida primero agregamos


el nombre de la tabla de salida

2.3.24 Agregamos el valor de la conexin a usar

2.3.25 Seleccionamos el esquema a utilizar

2.3.26 Agregamos la tabla que nos servir de destino, se puede


agregar a mano, pero ya que tenemos el explorador de tablas
usmoslo
2.3.27 Acepamos la edicin y revisamos la configuracin

2.3.28 Probamos la carga de los datos


2.3.28.1 Revisamos que la tabla de destino este vaca

2.3.28.2 Ejecutamos la carga

2.3.28.3 Debemos guardar la transformacin antes de ejecutarla en mi caso


la guardare en mis documentos por ahora
2.3.28.4 Revisamos los valores que nos devolver la ejecucin, en este caso
se puede ver que la ejecucin a sido un xito

2.3.28.5 Revisamos en la base de datos la carga


2.3.29 Este proceso se repite cara cada una de las dimensiones, por
ser un proceso repetitivo, solo se agregaran los valores de las
ejecuciones
2.3.29.1 Dimensin espacios

2.3.29.2 Dimensin modelos_placa

2.3.29.3 Dimensin procesadores


2.3.29.4 Dimensiones proveedores

2.3.29.5 Dimensin tarjetas

2.3.29.6 Tabla de hechos Equipos


3 CONCLUSIONES
El proceso de extraccin trae los datos desde diferentes fuentes de datos,
en este caso es una sola pero pueden ser de varias fuentes incluso de
varias organizaciones para realizar el anlisis y el formateo de la
informacin.
Para el proceso Transformar es necesario realizar en los datos a ser
cargados una reglas de negocio especficas para el correcto ingreso al ser
cargados.
El proceso de Cargar los datos son cargados en el sistema destino en este
caso hay datos que se sobrescriben la informacin antigua con datos
nuevos.

4 RECOMENDACIONES
Generalmente en los procesos ETL en la etapa de extraccin se realiza un
formateo de los datos para iniciar el proceso de transformacin, en este
caso no es necesario ya que los datos son adquiridos de una base de
datos similar y ya existe un formato definido adems de solo ser un solo
sistemas para la extraccin.
Un requerimiento importante del proceso de Extraccin de datos, es el de
realizar en los sistemas de procedencia en horarios donde no se afecte al
rendimiento de dichos sistemas para evitar ralentizar los procesos de las
empresas.

Vous aimerez peut-être aussi