Académique Documents
Professionnel Documents
Culture Documents
Tarea #1, Curso: Bases de datos. Cdigo: BIT-29. Carrera: Ingeniera en Telemtica
Estudiante: Eduardo Loaiza Mata.
Profesor: Ing. Henry Jimnez Marchena.
Los Data marts son subconjuntos de datos de un data warehouse para reas
especficas. Entre las caractersticas de un data mart destacan:
Usuarios limitados.
rea especfica.
Tiene un propsito especfico.
Tiene una funcin de apoyo.
Este tipo de aplicaciones se suelen incluir dentro del mbito de las Bases de
Datos, por lo que aplicaciones de este tipo son:
Oracle Database
Microsoft SQL Server
MySQL
PostgreSQL
IBM Websphere DB2
En definitiva, el principal objetivo de este proceso es facilitar el movimiento de
los datos y la transformacin de los mismos, integrando los distintos sistemas
y fuentes en la organizacin moderna.
El trmino ETL corresponde a las siglas en ingls de:
Extract: extraer.
Transform: transformar.
Load: cargar.
Tarea #1, Curso: Bases de datos. Cdigo: BIT-29. Carrera: Ingeniera en Telemtica
Estudiante: Eduardo Loaiza Mata.
Profesor: Ing. Henry Jimnez Marchena.
Para que su operativa sea ms ptima, deben ser los propios crawlers (robots)
que recopilan la informacin, los responsables de complementar y enriquecer cada
dato, asocindole los metadatos que le corresponden (fecha de carga, fuente,
fiabilidad del dato, frecuencia de refresco, significado, relaciones, sentimiento, etc.)
y que permiten su posterior procesado y recuperacin.
Las fases de los procesos ETL:
Tarea #1, Curso: Bases de datos. Cdigo: BIT-29. Carrera: Ingeniera en Telemtica
Estudiante: Eduardo Loaiza Mata.
Profesor: Ing. Henry Jimnez Marchena.
algn tipo de driver especial). Son sistemas que procesan hacia dentro y, por lo
tanto, no permiten la agregacin de una computadora que trabaje en paralelo.
Por el
Linux)
granja
nodos
Poder tener una visin global de todos los datos consolidados en una data
warehouse. Por ejemplo, crear una estrategia de marketing basndose en el
anlisis de los datos anteriores.
Tarea #1, Curso: Bases de datos. Cdigo: BIT-29. Carrera: Ingeniera en Telemtica
Estudiante: Eduardo Loaiza Mata.
Profesor: Ing. Henry Jimnez Marchena.
Poderosos algoritmos y
procesos que extraen datos
desde algn recurso y se
transforma en determinado
formato y base de datos
escogido.
Tarea #1, Curso: Bases de datos. Cdigo: BIT-29. Carrera: Ingeniera en Telemtica
Estudiante: Eduardo Loaiza Mata.
Profesor: Ing. Henry Jimnez Marchena.
Al igual que en casos anteriores, muchas bases de datos del mercado incluyen
funcionalidades o mdulos de ETL. Algunas aplicaciones especficas de ETL son:
Talend.
Kettle.
WebFocus - iWay Data Migrator Server.
BO Data Integrator.
Barracuda SW Integrator.
Cognos Decisionstream.
Conclusiones:
Proceso ETL: un sistema efectivo, pero con retos y cuestiones a resolver
Como hemos visto, los procesos ETL son muy tiles y beneficiosos para las
organizaciones por su capacidad para integrar grandes bases de datos,
logrando as una visin nica global que permite, a los analistas y directivos,
tomar las decisiones estratgicas adecuadas.
La implantacin de un sistema ETL bien definido supone todo un reto puesto que,
para
que
sea
realmente
efectivo,
debe
permitir
integrar
los
sistemas legacy (algunos ya muy obsoletos) con los ms modernos. Adems, el
acceso a todos estos sistemas se debe producir no solo en modo de lectura, sino
tambin como escritura.
Tarea #1, Curso: Bases de datos. Cdigo: BIT-29. Carrera: Ingeniera en Telemtica
Estudiante: Eduardo Loaiza Mata.
Profesor: Ing. Henry Jimnez Marchena.
Bibliografa:
http://blog.powerdata.es/el-valor-de-la-gestion-de-datos/bid/312584/ProcesosETL-Definici-n-Caracter-sticas-Beneficios-y-Retos
http://analisisbi.blogspot.com/2009/10/sistemas-etl.html
Betts, Mitch. "The future of business intelligence". Computerworld.