Académique Documents
Professionnel Documents
Culture Documents
IBM WebSphere
DataStage
Introduccin
En el siguiente documento se proceder a mostrar la funcionalidad de los Stages de una
manera que sea fcil de entender y su rpida aplicacin, A continuacin se dar una
breve explicacin de lo que es Data Stages a grandes rasgos
Datastage es una herramienta que permite crear rpidamente procesos ETL. Se basa
bsicamente en una arquitectura Cliente-Servidor (en sus versiones ms nuevas puede
ser hasta una arquitectura de 4 capaz). Puede acceder a distintos orgenes de datos y lo
hace ideal para realizar las tareas de carga de datos a un Data Warehouse o Data Mart,
aunque tambin se puede utilizar en cualquier proyecto que requiera mover datos desde
un origen a un destino. Las tareas (o Jobs) son compilados y se crean ejecutables que
luego pueden ser ejecutados mediante la misma herramienta o por lnea de comandos.
En la actualidad existen varias versiones de la herramienta pero la ms popular es la
Enterprise Edition que posee los dos motores de tareas que posee la herramienta (server
engine y parallel engine)
Ejercicio DataStage
Extraccin
Paso 1: Lo primero que tenemos que hacer es dirigirnos a la paleta de herramientas
(Palette), vamos a la opcin File y de ese repositorio sacamos un (Sequential File) y
lo arrastramos al diseador esto servir para obtener los datos de origen.
Tener en cuenta que hay que cambiar los nombres de los link y de los procesos
dependiendo a que proceso corresponda.
Una vez realizado los parametros nos dirigimos a las propiedades del
data set donde indicaremos la ruta pero con el parametro
que
ingresamos
nos vamos al text box file y la ltima parte del nombre
especificamos el parametro correspondiente como se muestra en el
siguiente ilustracin, al ingresar el parametro tienes que ingresarlo
anteponiendo los siguientes signos al principio y final # #.
Ejercicio DataStage
Transformacin
Configuracin (Transformacin)
Data Set 2:
A continuacin nos dirigiremos al text box File donde indicamos la ruta de la extraccin
as de esta manera estaremos llamando los datos finales de la extraccin.
2
Sequential File: Posteriormente una vez ya realizado la configuracin del Data Set nos
dirigimos al Sequential File y abrimos las propiedades y ponemos la ruta en el text box
Join: A continuacin nos dirigimos a las propiedades del Join donde tendremos que
buscar las keys para hacer el cruce de los datos y luego filtrarlos a un tranformer o un
data set dependiendo lo que se necesite, en este caso solo est capturando una sola
Archivo de rechazo:
Remove Duplicates: Como ya visto en el Join este proceso tiene el mismo mecanismo,
hay que extraer la key luego dirigirse a Output y hacer el Mapping y verificar las
Columnas.
2
Sequential file (rechazo): Una vez ya echo la condicin en el tranformer nos dirigimos
a las propiedades del Sequential file en la cual ingresaremos en el text box file la ruta
donde queremos que se guarde los datos de rechazo.
Data Set: Una vez realizado el Transformer nos dirigimos al Data set en
donde este ser vuestro paso final para terminar la transformacin, una vez
ms abrimos en las propiedades en donde se nos mostrara la siguiente interfaz
en la cual tendremos que especificar en el Text box file la ruta en donde
queremos que se guarde.
Ejercicio DataStage
Carga
Configuracin (Carga)
Data Set (Final transformacin): Como mencionado en lo anterior tenemos que copiar
el data set final de la transformacin para luego pegarlo en el Job de carga una vez echo
eso vamos a las propiedades del data set donde tendremos que pegar la ruta del data set
2
Tranformer (Carga): Una vez realizado el proceso anterior nos dirigimos al tranformer
donde abrimos las propiedades y hacemos los mismos pasos que llevas haciendo en todo
el manual en el tranformer como se muestra en la siguiente ilustracin.
Data Set (Carga): Este sera el ltimo paso para realizar la serie de extraccin,
transformacin y carga. Lo que tenemos que hacer es dirigirnos a las propiedades del
data set y especificar la ruta donde va ser destinado los datos y de esta manera usted
habr completado la serie de los Jobs.
Paso 3: Lo tercero que tenemos que hacer es ir otra vez a la paleta de herramientas e ir
a la opcin Sequence y extraer Notification Activity y arrastrarlo al diseador.
Paso5: Lo quinto que tenemos que hacer es sacar del mismo repositorio el Sequence
Exception Handler y arrstralo al diseador.
Paso 6: Lo sexto que tenemos que hacer es ir al mismo repositorio y extraer el Sequence
UserVariables Activity y arrstralo al diseador.
Paso 7: Lo sexto que tenemos que hacer es ir al mismo repositorio y extraer el Sequence
de Notification Activity.
A continuacin se mostrara cmo debera estar armado el Sequence ene le Data Stage
como se muestra en la siguiente ilustracin.
Configuracin (Secuencial)
UserVariables Activity
User Variables:
General:
Trigger:
Job Activity:
A continuacion nos dirigimos al Job Activity donde tendremos que extraer el Job
de extracion en (Job name como se muestra en el rectangulo caf) tendran que
presinar en el boton del lado derecho y hay se les desplegara una interfaz en cual
tendran que buscar el job de extracion tener en cuenta que tienen Seleccionar el
job que corresponda a la secuencia.
A continuacion nos dirigimos a Execution donde tendremos que seleccionar en el
combobox Reset if requierd, the run.
Luego de eso nos dirimos a Inset Parameter en donde tendremos presinar e
ingresar los parametros correspondientes si en un caso no estuvieran se tendra
agegar en el menu parameter para posteriormente agregarlos al Insert Parameter.