Académique Documents
Professionnel Documents
Culture Documents
INDOAMRICA
Facultad de ingeniera en sistemas
PROYECTO FINAL
NOMBRE DE ESTUDIANTES
EVENTO
DATAWAREHOUSE
TUTOR
Ing. Franklin Castillo
AMBATO ECUADOR
Marzo, 2017
1
VISIN INSTITUCIONAL
MISIN INSTITUCIONAL
INTRODUCCIN
2
Se ha investigado varios trabajos publicados en la web sobre los principales conceptos
Tambin se revis el trabajo del Ing. Ricardo Mendoza, en el cual menciona que un data
warehouse es una base de datos que contiene, datos empresariales, integra coleccin de
Una solucin data warehousing (ETL) es un proceso que recupera desde un OLTP,
transforma datos y carga datos a un data WareHouse; en trminos generales lleva datos
desde un origen aun destino usando una herramienta para construir y manejar el data
warehouse.
Para la aplicacin prctica del presente proyecto se est trabajando con los datos del
distrito de educacin de la ciudad de Guaranda, con los estudiantes de los colegios que
ya culminaron el bachillerato.
3
Plan de Trabajo
4
Fundamentacin terica
1. DATA WAREHOUSE
Para el portal MUNDODB [1], data warehouse es el que se encarga de extraer
datos de las bases de datos operacionales o fuentes externa, transformar,
consolidar, integrar, chequear la integridad y centralizar los datos que la empresa
genera en su actividad diaria de negocios y/o informacin externa con la que
est relacionada. Una data warehouse permite el acceso y manipulacin de la
informacin, a travs de anlisis multivariables, con el objetivo final de dar
soporte al proceso de toma de decisiones.
Las particularidades de los data warehouse hacen, que los modelos de datos y las
estrategias de diseo utilizadas para bases de datos operacionales, generalmente
no sirvan para el diseo de un data warehouse. Esto implica, que se utilicen
nuevas tcnicas y estrategias de diseo.
Los data warehouse pueden crecer y surge la necesidad de dividir la
informacin, los datamarts. Suelen ser soluciones departamentales y almacenan
un area de negocio especfica. Tienen una estructura ptima, para analizar los
datos desde el punto de vista de un departamento.
2. OBJETIVOS DE UN DATA WARE HOUSE
Accesibilidad de informacin por parte de la organizacin
Consistencia de la informacin entre las distintas unidades de una
organizacin
Ayuda a toma de decisiones
Generacin de informacin de forma flexible
Controlar el acceso de la informacin
3. CARACTERISTICAS
5
Condesa y agrega informacin
Integra y asocia informacin de muchas fuentes
6
No consumir muchos recursos.
100% Java: portabilidad, escalabilidad e integracin.
Multiplataforma (tanto a nivel de cliente como servidor):
Mac.
Linux/unix.
Windows.
7. PENTAHO DATA INTEGRATION
Para el Portal web gravitar [2], menciona muchas organizaciones tienen
informacin disponible en aplicaciones y base de datos separados. Pentaho Data
Integration abre, limpia e integra esta valiosa informacin y la pone en manos
del usuario. Provee una consistencia, una sola versin de todos los recursos de
informacin, que es uno de los ms grandes desafos para las organizaciones TI
hoy en da. Pentaho Data Integration permite una poderosa ETL (Extraccin,
Transformacin y Carga).
El uso de kettle permite evitar grandes cargas de trabajo manual frecuentemente
difcil de mantener y de desplegar.
La arquitectura de Pentaho Data Integration viene representada por el
siguiente esquema:
Propiedades bsicas:
A parte de ser open source y sin costes de licencia, las caractersticas
bsicas de esta herramienta son:
Entorno grfico de desarrollo
Uso de tecnologas estndar: Java, XML, JavaScript
Fcil de instalar y configurar
Multiplataforma: windows, macintosh, linux
Basado en dos tipos de objetos: Transformaciones (coleccin de
pasos en un proceso ETL) y trabajos (coleccin de
transformaciones)
Incluye cuatro herramientas:
Spoon: para disear transformaciones ETTL usando el entorno
grfico.
7
PAN: para ejecutar transformaciones diseadas con spoon.
CHEF: para crear trabajos.
Kitchen: para ejecutar trabajos.
CPU 2 Cores.
RAM 4 GB
ALMACENAMIENTO 40 GB.
8
Procedemos con la instalacin de centos de forma normal.
Para continuar descargamos del sitio web oficial Pentaho.
9
Una vez descargado e instalado procedemos a generar nuestra data warehouse
basado en el siguiente grfico.
10
Para la construccin del data warehouse de todas las herramientas utilizamos Pentaho
data integration.
Creacin de las dimensiones.
11
Como se muestra en el grafico se utiliza el modelo en estrella para nuestra tabla de
hechos.
Antes del ETL, realizamos una limpieza de los datos con el data cleanner.
12
Importamos de los archivos de Excel.
13
Obtenemos la vista previa de los datos.
14
Ejecutamos la transformacin.
Query utilizado.
15
Cargamos la tabla de hechos.
16
Carga del data warehouse.
17
Generacin de reportes a la medida.
18
19
Reflexiones y experiencias personales
El arte de vencer se aprende de las derrotas.
El coraje la valenta y el honor no hay que decirlo eso hay que demostrarlo.
La perseverancia es la clave del xito.
Experiencias
Como regresar en el tiempo, la mejor experiencia recordar nuevamente la universidad
luego de 5 aos de ser profesional.
Los servicios IP se aplica diariamente en los sistemas informticos.
Conclusiones
Bibliografa
Nota Final: . . . . . . . . . . . . . . . . . . . .
..
20