Vous êtes sur la page 1sur 182

UNIVERSIDAD REGIONAL AUTONOMA DE LOS ANDES

UNIANDES

FACULTAD SISTEMAS MERCANTILES

MAESTRIA EN INFORMATICA EMPRESARIAL

TESIS PREVIO A LA OBTENCION DEL GRADO ACADEMICO DE MAGISTER


EN INFORMATICA EMPRESARIAL

TEMA:

“SISTEMA DE SOPORTE A LA TOMA DE DECISIONES, PARA MEJORAR


LA GESTIÓN EDUCATIVA DE LA EDUCACION MEDIA DE LA DIRECCIÓN
DISTRITAL DE EDUCACIÓN INTERCULTURAL Y BILINGÜE, DEL CANTON
GUARANDA, PROVINCIA BOLIVAR.”

AUTOR:

LCDO. ANGEL RAMIRO PALACIOS BAYAS. ESPC.

TUTOR:

ING. FREDDY BAÑO N. M.Sc.

AMBATO – ECUADOR

2015

-1-
-2-
-3-
DEDICATORIA

Este arduo trabajo dedico a mi novia Eugenia, en vista de que juntos hemos
atravesado momentos difíciles y felices, a mi Padre que con su ejemplo y trabajo
nos ha regalado la mejor herencia que es la Educación y nos ha enseñado a ser
personas correctas, a mi hermano que desde niños crecimos juntos; me ha
guiado y aconsejado.

También dedico a mis Maestros, que con su sabiduría me formaron para el futuro,
a mis compañeros de trabajo que han compartido su experiencia, a mis amigos de
Colegio Diego y Jhonny que siempre con sus ocurrencias me han sacado una
sonrisa a pesar de las circunstancias y demás familiares cercanos que siempre
me han estado apoyando y aconsejando continuamente.

Finalmente dedico este trabajo de postgrado a todas las Madres solteras que son
bien fuertes y tienen la valentía de seguir luchando para salir adelante.

Angel

-4-
AGRADECIMIENTO

Agradezco primero a Dios y a la Virgencita del Huayco, razón que ellos son los
únicos que saben que es lo que realmente nos está pasando en nuestro interior y
nos dan ánimos y fuerzas para seguir adelante.

En segundo lugar Agradezco a Mi Padre, Hermano y demás familiares que de una


u otra forma me alentaron para concluir mi carrera.

Finalmente Agradezco a mi querida “UNIVERSIDAD ESTATAL DE BOLIVAR”,


Extensión San Miguel, motivo que ahí fue donde obtuve mi primer título
profesional, mismo que me está permitiendo escalar mucho más, por eso mi
profundo agradecimiento a las autoridades, docentes y compañeros de clase.

Angel

-5-
ÍNDICE GENERAL

Certificación del Asesor


Declaración de Autoría
Dedicatoria
Agradecimiento
Índice General
Índice de Gráficos
Índice de Tablas
Resumen Ejecutivo
Abstract
INTRODUCCION…………………………………………………………………... 1
Antecedentes de la Investigación………………………………………………... 1-2
Planteamiento del problema…………………………………………………….... 2
Formulación del Problema………………………………………………………... 3
Objeto de Investigación y Campo de Acción………………………………........ 3
Identificación de la Línea de Investigación……………………………………… 3
OBJETIVOS
Objetivo General…………………………………………………………………… 3
Objetivos Específicos……………………………………………………………… 3-4
Idea a Defender……………………………………………………………………. 4
Justificación………………………………………………………………………… 4-5
Metodología………………………………………………………………………… 5
Resumen de la Estructura de la Tesis…………………………………………... 5-6
Aporte Teórico……………………………………………………………………… 6
Significación Practica……………………………………………………………… 6-7
Novedad Científica………………………………………………………………… 7
CAPITULO I
MARCO TEORICO
1.1 Sistemas……………………………………………………………... 8
1.1.1 Datos e Información………………………………………………… 8
1.1.1.1 Características que debe cumplir la información………………... 9
1.1.2 Sistemas de información…………………………………………… 9
1.1.2.1 Características de los sistemas de información…………………. 10
1.1.2.2 Estructura del sistema de información……………………………. 10
1.1.2.3 Clasificación de los sistemas de información……………………. 11
1.1.2.4 Involucrados en los sistemas de información……………………. 11-12

-6-
1.1.3 Sistema de soporte a la toma de decisiones…………………….. 12-13
1.1.3.1 Tipos de sistemas de soporte a decisiones……………………… 13
1.1.3.1.1 Sistema de información gerencial………………………………… 13
1.1.3.1.2 Sistema de información ejecutiva…………………………………. 13
1.1.3.1.3 Sistemas expertos basados en inteligencia artificial……………. 13
1.1.3.1.4 Sistema de apoyo a decisiones en grupo………………………... 13
1.1.4 Sistemas del Ministerio de Educación……………………………. 14
1.1.4.1 Sigee………………………………………………………………..... 14
1.1.4.2 Sime………………………………………………………………….. 14
1.1.4.3 Amie………………………………………………………………….. 14
1.1.5 Sistema Data Warehouse/Bussines Intelligence………………... 14
1.2 Base de Datos………………………………………………………. 15
1.2.1 Software de Base de Datos……………………………………….. 15-16
1.2.2 Roles en el entorno de la base de datos integrada…………….. 16-17
1.2.3 Principales Sistemas de gestión de base de datos……………... 17-18
1.2.3.1 PostgreSQL………………………………………………………….. 18
1.2.3.1.1 Características de PostgreSQL…………………………………… 18-19
1.3 Data Warehouse……………………………………………………. 19-20
1.3.1 Objetivos fundamentales de un Data Warehouse………………. 20
1.3.2 Elementos básicos de un Data Warehouse……………………… 20-21
1.3.3 Procesos básicos del Data Warehouse………………………….. 21
1.3.4 Desafíos de un Data Warehouse…………………………………. 21-22
1.3.5 Metodología para el desarrollo de un Data Warehouse………... 22
1.3.5.1 El enfoque de Bill Inmon…………………………………………… 22
1.3.5.2 Metodología de Ralph Kimball…………………………………….. 23
1.3.6 Tabla comparativa CIF-MD………………………………………… 23
1.3.7 Ciclo de vida de la metodología de Ralph Kimball……………… 24
1.3.8 Requerimientos de un Data Warehouse…………………………. 24-25
1.3.9 Data Mining………………………………………………………….. 25
1.4 Pentaho………………………………………………………………. 25
1.4.1 Pentaho Community Edition……………………………………….. 25
1.4.2 Pentaho Enterprise Edition………………………………………… 25
1.4.3 Plataforma de Pentaho…………………………………………….. 26
1.4.3.1 Pentaho Data Integration…………………………………………... 26
1.4.3.1.1 ETL…………………………………………………………………… 26
1.4.3.1.2 Arquitectura de Pentaho Data Integration………………………... 27

-7-
1.4.3.2 Pentaho Report Designer………………………………………….. 27
1.4.3.2.1 Estructura de bandas de un reporte………………………………. 27-28
1.4.3.3 Pentaho Schema Workbench……………………………………… 28
1.4.3.3.1 Arquitectura de Pentaho Analysis Services……………………… 28
1.4.3.3.2 Mondrián……………………………………………………………... 29
1.4.3.3.3 Cubo OLAP………………………………………………………….. 29
1.4.3.3.3.1 Jerarquías, Niveles y Miembros…………………………………… 29
1.4.3.4 Community Dashboard Framework………………………………. 30
1.4.3.5 Pentaho Metadata Editor…………………………………………... 30
1.4.3.5.1 Arquitectura de Pentaho Metadata Layer………………………… 30
1.4.3.5.2. Capas de un Modelo Metadatos…………………………………... 31
1.5 Esquema para el modelado de datos…………………………….. 31
1.5.1 Esquema en Estrella……………………………………………….. 31
1.6 Bussines Intelligence……………………………………………….. 31-32
1.7 La toma de decisiones……………………………………………… 32
1.7.1 Elementos de la toma de decisiones……………………………... 32-33
1.8 La Gestión…………………………………………………………… 33
1.8.1 Administrar…………………………………………………………... 34
1.8.2 Enfoques Administrativos y de Gestión........…………………….. 34
1.8.3 El Proyecto Educativo Institucional……………………………….. 34
1.8.3.1 Importancia del PEI…………………………………………………. 35
1.8.3.2 Características del PEI……………………………………………... 35
1.8.4 Liderazgo Directivo…………………………………………………. 35
1.8.5 Gestión Educativa………………………………………………….. 36
1.8.6 Políticas Educativas del Ministerio de Educación del Ecuador... 36
1.8.7 Nuevo Modelo de Gestión Educativa…………………………….. 36-37
1.8.7.1 Zonas, Distritos y Circuitos………………………………………… 38
1.9 Conclusiones parciales del capítulo………………………………. 39
CAPITULO II
MARCO METODOLOGICO
2.1 Caracterización del sector…………………………………………. 40-41
2.1.1 Misión………………………………………………………………… 42
2.1.1 Visión…………………………………………………………………. 42
2.1.3 Organigrama Institucional………………………………………….. 42
2.2 Descripción del procedimiento metodológico……………………. 43
2.2.1 Modalidad de la Investigación……………………………………... 43

-8-
2.2.1.1 Tipos de Investigación……………………………………………… 43
2.2.1.2 Población y Muestra………………………………………………... 43-44
2.2.1.2.1 Distribución de la población……………………………………….. 44
2.2.2 Métodos utilizados en la investigación de campo………………. 44-45
2.2.3 Técnicas aplicadas en la investigación…………………………… 45
2.2.4 Procesamiento de datos…………………………………………… 45
2.2.4.1 Encuesta aplicada a los Servidores Públicos de la Dirección
Distrital de Educación del cantón Guaranda…………………….. 46-50
2.2.4.2 Encuesta dirigida a las autoridades de las Instituciones
Educativas de educación media de la Dirección Distrital de
Educación, del cantón Guaranda…………………………………. 51-55
2.2.4.3 Resumen de la entrevista realizada a la Directora Distrital de
Educación Intercultural y Bilingüe del cantón Guaranda……….. 56-57
2.3 Propuesta del Investigador………………………………………… 57
2.4 Conclusiones parciales del capítulo………………………………. 58
CAPITULO III
MARCO PROPOSITIVO
3.1 Tema…………………………………………………………………. 59
3.2 Objetivo General……………………………………………………. 59
3.3 Objetivos Específicos………………………………………………. 59
3.4 Planificación y Administración del Proyecto……………………... 59
3.4.1 Definición del Proyecto…………………………………………….. 59
3.4.2 Preparación de un Proyecto Data Warehouse…………………... 60
3.4.3 Alcance………………………………………………………………. 60
3.4.4 Fundamentación…………………………………………………….. 60
3.4.5 Planificación del Proyecto………………………………………….. 60
3.4.6 Administración del Proyecto……………………………………….. 61
3.5 Definición de Requerimientos……………………………………... 61-62
3.6 Diseño Técnico de la Arquitectura………………………………… 62
3.6.1 Entorno Back Room………………………………………………… 62-63
3.6.2 Entorno Front Room………………………………………………... 63
3.6.3 Arquitectura de flujo de datos con Pentaho……………………… 64
3.7 Selección e Instalación del Producto……………………………... 64-65
3.8 Modelamiento Dimensional………………………………………... 66
3.8.1 Técnicas de Modelamiento………………………………………… 66
3.8.1.1 Dimensiones………………………………………………………… 66

-9-
3.8.1.2 Hechos………………………………………………………………. 66
3.9 Principios de Diseño………………………………………………... 66
3.10 Granularidad y Agregación………………………………………… 67
3.11 Funciones de Agregación SQL……………………………………. 67
3.12 Técnicas SCD (Control de Cambios)……………………………... 67-68
3.13 Diseño Físico del Data Warehouse……………………………….. 69
3.13.1 Diccionario de datos del Data Warehouse……………………….. 70-73
3.14 Herramienta Auxiliar para la limpieza de datos………………….. 74
3.15 Diseño y Desarrollo de ETL con Pentaho Data Integration……. 74
3.15.1 Instalación de Pentaho Data Integration…………………………. 74
3.15.2 Configuración del Repositorio……………………………………... 75
3.15.3 Ejecución de Pentaho Data Integration…………………………... 75
3.15.4 Principales componentes de Pentaho Data Integration………... 75
3.15.4.1 Transformaciones…………………………………………………… 75
3.15.4.2 Jobs…………………………………………………………………... 76
3.15.5 Características de las Transformaciones y Jobs………………... 76
3.15.6 Procesos ETL……………………………………………………….. 76
3.15.6.1 ETL-Migrar datos fuente al repositorio temporal Stage………… 76-83
3.15.6.2 ETL-Carga Dimensión Fecha……………………………………… 83
3.15.6.3 ETL-Carga Dimensión Estudiante………………………………… 84
3.15.6.4 ETL-Carga Dimensión Titulo………………………………………. 85
3.15.6.5 ETL-Carga Dimensión Institución Educativa…………………….. 85
3.15.6.6 ETL-Carga Dimensión Ubicación Geográfica……………………. 85
3.15.6.7 ETL-Carga Tabla de Hechos………………………………………. 86-87
3.15.6.8 Carga de JOBS……………………………………………………… 87
3.15.6.8.1 Job Carga datos fuente al repositorio temporal Stage…………. 87-88
3.15.6.8.2 Job Carga Dimensiones……………………………………………. 88
3.15.6.8.3 Job Carga Data Warehouse……………………………………….. 88-89
3.16 Crear un Modelo Metadatos con Pentaho Metadata Editor……. 90
3.16.1 Instalación y Configuración de Pentaho Metadata Editor……… 90
3.16.2 Pasos para construir un Modelo Metadatos……………………... 90
3.16.3 Publicar un Modelo Metadatos……………………………………. 91
3.17 Construcción del Cubo de Análisis OLAP con Pentaho
Schema Workbench………………………………………………… 92
3.17.1 Instalación y configuración de Pentaho Schema
Workbench………………………………………………………….. 92

- 10 -
3.17.2 Nuevo Esquema…………………………………………………….. 92-93
3.17.3 Agregar un Cubo al Esquema……………………………………... 93

Agregar la Tabla de Hechos…………………………………


3.17.4 93-94
3.17.5 Agregar Dimensiones………………………………………………. 94-97
3.17.6 Agregar Sub Niveles………………………………………………... 98
3.17.7 Agregar Medidas……………………………………………………. 99-101
3.17.8 Agregar Campos Calculados……………………………………… 101
3.17.9 Publicar un Cubo OLAP……………………………………………. 102
3.17.10 Volver a publicar un Cubo…………………………………………. 102
3.18 Especificación de Aplicaciones para usuarios finales………….. 102
3.19 Aplicación para el usuario final……………………………………. 103
3.19.1 Instalación y Configuración de bi-server…………………………. 103
3.19.1.1 Instalar JDK………………………………………………………….. 103-104
3.19.1.2 Configuración de las variables de entorno……………………….. 104-105
3.19.1.3 Iniciar el Servidor Tomcat………………………………………….. 105-107
3.19.1.4 Configuración de Pentaho bi-server en PostgreSQL…………… 107-111
3.19.2 Crear usuarios en Pentaho………………………………………… 111-112
3.19.3 Cambiar el idioma de Pentaho…………………………………….. 112-113
3.19.4 Ocultar usuarios de Prueba………………………………………... 113
3.19.5 Instalar Reporteador WAQR………………………………………. 113
3.19.5.1 Quitar las alertas WAQR 114
3.19.6 Gestionar la conexión del Data Warehouse en Pentaho bi-
server………………………………………………………………… 114
3.19.7 Reportes con WAQR……………………………………………….. 115-117
3.19.8 Cambiar al encoding UTF-8 en bi-server………………………… 117
3.19.9 Explorar el Cubo con JPivot……………………………………….. 117-121
3.19.9.1 Quitar las Alertas de JPivot………………………………………... 122
3.19.10 Explorar el Cubo con Saiku Analytics y Saiku Chart Plus……… 122-126
3.19.10.1 Instalar Saiku Analytics…………………………………………….. 122
3.19.10.2 Instalar Saiku Analytics Chart Plus……………………………….. 123
3.19.10.3 Procedimiento de exploración del Cubo………………………….. 123-126
3.20 Reportes con Pentaho Report Designer…………………………. 127
3.20.1 Instalación de Pentaho Report Designer…………………………. 127
3.20.2 Configuración de la conexión JNDI……………………………….. 127-128
3.20.3 Iniciar Pentaho Report Designer………………………………….. 129

- 11 -
3.20.4 Construcción del Reporte Institucional…………………………… 130
3.20.4.1 Personalizando el Page Header…………………………………... 130
3.20.4.2 Personalizando el Page Footer……………………………………. 130
3.20.4.3 Personalizando la banda No Data………………………………… 130-131
3.20.5 Reportes utilizando como fuente JDBC………………………….. 132-133
3.20.6 Reportes utilizando como fuente Modelo Metadatos…………… 133-134
3.20.7 Reportes utilizando como fuente un Cubo OLAP……………….. 135
3.20.8 Guardar y Publicar los Reportes………………………………….. 136
3.20.9 Visualización del Reporte desde Pentaho Bi-Server……………. 136
3.20.10 Estructura de Directorios de la Solución…………………………. 137
3.21 Implementación……………………………………………………... 138
3.22 Mantenimiento y Crecimiento……………………………………… 138
3.23 Gestión del Proyecto……………………………………………….. 138
3.24 Conclusiones………………………………………………………… 139
3.25 Recomendaciones………………………………………………….. 140
Bibliografía
Anexos

- 12 -
ÍNDICE DE GRAFICOS

Gráfico 1. El proceso de transformación de los datos en información…………… 8


Gráfico 2. La triple dimensión humana, organizativa y tecnológica de los
sistemas de información………………………………………………………......…… 9
Gráfico 3. Clasificación de los sistemas por nivel y función………………………. 11
Gráfico 4. Arquitectura de dos y tres capas………………………………………… 15
Gráfico 5. Entorno de base de datos integrada……………………………………. 16
Gráfico 6. Roles en un entorno de base datos……………………………………… 17
Gráfico 7. Procesos básicos de Data Warehousing………………………………… 21
Grafico 8. Paradigma de Bill Inmon…………………………………………………... 22
Grafico 9. Paradigma de Ralph Kimball……………………………………………… 23
Gráfico 10. Ciclo de Vida de desarrollo de un data Warehouse………………….. 24
Grafico 11. Plataforma de Pentaho CE………………………………………………. 26
Gráfico 12. Arquitectura de Pentaho Data Integration……………………………… 27
Gráfico 13. Interfaz de Pentaho Report Designer………………………………….. 28
Gráfico 14. Pentaho Analysis Services……………………………………………… 28
Gráfico 15. Cubos, Dimensiones y Medidas………………………………………… 29
Gráfico 16. Jerarquías, niveles y medidas………………………………………….. 29
Gráfico 17. Pentaho Metadata Layer………………………………………………… 30
Gráfico 18. Esquema en estrella……………………………………………………… 31
Grafico 19. Actividades de análisis Business Intelligence…………………………. 32
Gráfico 20. Importancia de Proyecto Educativo Escolar…………………………… 35
Gráfico 21. Características del Proyecto Educativo Escolar………………………. 35
Gráfico 22. Desconcentración del Ministerio de Educación……………………….. 38
Gráfico 23. Dirección Distrital de Educación Intercultural y Bilingüe Guaranda… 40
Gráfico 24. Organigrama Institucional……………………………………………….. 42
Gráfico 25. Esquema de la solución propuesta…………………………………….. 57
Gráfico 26. Entorno Back Room……………………………………………………… 62
Gráfico 27. Entorno Front Room……………………………………………………… 63
Gráfico 28. Arquitectura de Flujo de datos con Pentaho…………………………… 64
Gráfico 29. Modelo Dimensional del Data Warehouse…………………………….. 69
Gráfico 30. Data Cleaner………………………………………………………………. 74
Gráfico 31. Ambiente Grafico de Spoon……………………………………………... 75
Gráfico 32. Propiedades del Steep Microsoft Excel Input…………………………. 77
Gráfico 33. Agregar la Hoja de la Fuente de Datos………………………………… 77

- 13 -
Gráfico 34. Campos de la fuente de Datos………………………………………….. 78
Gráfico 35. Vista Previa de los datos………………………………………………… 78
Gráfico 36. Pase de Steep…………………………………………………………….. 78
Gráfico 37. Propiedades del Steep Select Values………………………………….. 79
Gráfico 38. Configuración de la conexión al repositorio de datos Stage…………. 80
Gráfico 39. Creación de la tabla stg_matriz_excel………………………………….. 81
Gráfico 40. Proceso de Creación de la tabla stg_matriz_excel…………………… 81
Gráfico 41. Verificación de las columnas creadas en el Stage……………………. 81
Gráfico 42. Vista Previa de la transformación……………………………………….. 82
Gráfico 43. Ejecución de la Transformación Paso 1………………………………... 82
Gráfico 44. Ejecución de la Transformación Paso 2………………………………... 82
Gráfico 45. ETL-Carga Dimensión Fecha…………………………………………… 83
Gráfico 46. ETL-Carga Dimensión Estudiante……………………………………… 84
Gráfico 47. ETL-Carga Dimensión Titulo ……………………………………………. 85
Gráfico 48. ETL-Carga Dimensión Institución Educativa…………………………... 85
Gráfico 49. ETL-Carga Dimensión Ubicación Geográfica…………………………. 85
Gráfico 50. ETL-Carga Tabla de Hechos……………………………………………. 86
Gráfico 51. Propiedades del Steep Insert Update………………………………….. 87
Gráfico 52. Job-Carga Stage…………………………………………………………. 87
Gráfico 53. Referenciar a las Transformaciones……………………………………. 88
Gráfico 54. Job-Carga Dimensiones…………………………………………………. 88
Gráfico 55. Job-Carga Data Warehouse…………………………………………….. 89
Gráfico 56. Referenciar a los JOBS………………………………………………….. 89
Gráfico 57. Interfaz de Pentaho Metadata Editor y conexión al Data Warehouse. 90
Gráfico 58. Modelo Metadatos Editor………………………………………………… 91
Gráfico 59. Publicación del Modelo Metadatos……………………………………… 91
Gráfico 60. Interfaz de Pentaho Schema Workbench……………………………… 92
Gráfico 61. Crear Nuevo Esquema…………………………………………………… 93
Gráfico 62. Agregar un Cubo al Esquema…………………………………………… 93
Gráfico 63. Texto de ayuda en la construcción del Cubo………………………….. 93
Gráfico 64. Agregar Tabla de Hechos………………………………………………... 94
Gráfico 65. Lenguaje MDX…………………………………………………………….. 94
Gráfico 66. Agregar Dimensiones…………………………………………………….. 95
Gráfico 67. Agregar Jerarquía Nivel Todos…………………………………………. 95
Gráfico 68. Agregar la Tabla de la dimensión fecha del modelo dimensional…… 96
Gráfico 69. Dimensión Estudiante……………………………………………………. 96

- 14 -
Gráfico 70. Dimensión Ubicación Geográfica……………………………………….. 97
Gráfico 71. Dimensión Institución Educativa………………………………………... 97
Gráfico 72. Dimensión Titulo………………………………………………………….. 97
Gráfico 73. Agregar el nivel de jerarquía año……………………………………….. 98
Gráfico 74. Agregar el nivel de jerarquía mes………………………………………. 98
Gráfico 75. Texto guía en la construcción del Cubo……………………………….. 99
Gráfico 76. Agregar una medida……………………………………………………… 99
Gráfico 77. Verificar el Cubo con MDX Query……………………………………… 100
Gráfico 78. Medida Promedio de Bachillerato………………………………………. 100
Gráfico 79. Medida Promedio de Educación Básica……………………………….. 100
Gráfico 80. Medida Promedio Exámenes de Grado………………………………... 101
Gráfico 81. Agregar Campo Calculado………………………………………………. 101
Gráfico 82. Publicar un Cubo…………………………………………………………. 102
Gráfico 83. Mensaje de Sobrescribir el Cubo………………………………………. 102
Gráfico 84. Desactivar las actualizaciones automáticas de JAVA……………….. 104
Gráfico 85. Configuración de la variable JAVA_HOME……………………………. 104
Gráfico 86. Configuración de la variable Path………………………………………. 105
Gráfico 87. Muestra los miles segundos…………………………………………….. 105
Gráfico 88. Acceder a la consola de usuario de Pentaho………………………….. 105
Gráfico 89. Consola de usuario de Pentaho………………………………………… 106
Gráfico 90. Perspectivas y Portal de entrega de información…………………….. 106
Gráfico 91. Creación del repositorios de configuración de PostgreSQL…………. 108
Gráfico 92. Edición del context.xml………………………………………………….. 109
Gráfico 93. Edición del web.xml………………………………………………………. 109
Gráfico 94. Edición de aplication.context……………………………………………. 110
Gráfico 95. Creación de la tabla QUARTZ…………………………………………... 110
Gráfico 96. Creación de usuario………………………………………………………. 111
Gráfico 97. Asignación de Rol y Permisos…………………………………………... 112
Gráfico 98. Cambiar el idioma de Pentaho - Marketplace…………………………. 112
Gráfico 99. Instalar el idioma de Pentaho……………………………………………. 112
Gráfico 100. Portal de entrega de información……………………………………… 113
Gráfico 101. Ocultar Login as Evaluator…………………………………………….. 113
Gráfico 102. Instalar WAQR………………………………………………………….. 113
Gráfico 103. Alerta WAQR……………………………………………………………. 114
Gráfico 104. Gestionar la fuente de datos en Pentaho bi-server………………….. 114
Gráfico 105. Gestionar la fuente de datos tipo Metadatos…………………………. 115

- 15 -
Gráfico 106. Reportes WAQR………………………………………………………… 115
Gráfico 107. Procedimiento de generación de reportes a demanda……………… 116
Gráfico 108. Crear reporte a demanda………………………………………………. 116
Gráfico 109. Reporte a demanda…………………………………………………….. 117
Gráfico 110. Cambiar el encoding de Pentaho a UTF-8…………………………… 117
Gráfico 111. Explorar el Cubo OLAP………………………………………………… 118
Gráfico 112. Vista del Cubo OLAP con JPivot………………………………………. 118
Gráfico 113. Profundizando en los datos con JPivot……………………………….. 119
Gráfico 114. Vista del Cubo intercambiando ejes………………………………….. 119
Gráfico 115. Vista del Cubo haciendo Drill Down………………………………….. 120
Gráfico 116. Muestra Datos de origen………………………………………………. 120
Gráfico 117. MDX Query Editor……………………………………………………….. 121
Gráfico 118. Mostrar Grafico…………………………………………………………. 121
Gráfico 119. Configurar Grafico………………………………………………………. 121
Gráfico 120. Alerta JPivot……………………………………………………………… 122
Gráfico 121. Instalación del visor de cubos OLAP Saiku Analytics………………. 122
Gráfico 122. Visor Saiku Chart Plus………………………………………………….. 123
Gráfico 123. Crear análisis con Saiku Analytics……………………………………. 123
Gráfico 124. Visor Saiku Analytics……………………………………………………. 124
Gráfico 125. Análisis con Saiku Analytics……………………………………………. 124
Gráfico 126. Estadística básica……………………………………………………….. 124
Gráfico 127. Análisis con Saiku Analytics…………………………………………… 125
Gráfico 128. Consulta MDX…………………………………………………………… 125
Gráfico 129. Análisis con Saiku Analytics, grafico tipo Line……………………….. 125
Gráfico 130. Análisis con Saiku Analytics, grafico tipo Múltiple Bar………………. 126
Gráfico 131. Análisis con Saiku Chart Plus, grafico tipo Bar………………………. 126
Gráfico 132. Análisis con Saiku Analytics, grafico tipo Sunburst………………….. 126
Gráfico 133. Configuración de la conexión JNDI carpeta.pentaho……………….. 127
Gráfico 134. Configuración de la conexión JNDI archivo default.properties…….. 127
Gráfico 135. Código de referencia al driver de PostgreSQL y Data Warehouse.. 128
Gráfico 136. Edición del archivo context.xml………………………………………... 128
Gráfico 137. Edición del archivo web.xml……………………………………………. 128
Gráfico 138. Asistente de creación de reportes PRD………………………………. 129
Gráfico 139. Interfaz de Pentaho Report Designer…………………………………. 129
Gráfico 140. Plantilla del reporte Institucional………………………………………. 131
Gráfico 141. Fuentes soportadas por Pentaho Report Designer…………………. 132

- 16 -
Gráfico 142. Consulta JDBC…………………………………………………………... 132
Gráfico 143. Vista previa de la consulta JDBC……………………………………… 133
Gráfico 144. Resultado de la consulta JDBC……………………………………….. 133
Gráfico 145. Fuente Metadata………………………………………………………… 133
Gráfico 146. Examinar el Modelo Metadata…………………………………………. 133
Gráfico 147. Editando la consulta Metadata………………………………………… 134
Gráfico 148. Consulta Metadatos…………………………………………………….. 134
Gráfico 149. Vista previa de la consulta Metadatos………………………………... 134
Gráfico 150. Fuente OLAP……………………………………………………………. 135
Gráfico 151. Consulta MDX…………………………………………………………… 135
Gráfico 152. Vista previa de la consulta MDX………………………………………. 135
Gráfico 153. Publicar un Reporte…………………………………………………….. 136
Gráfico 154. Alojamiento del Reporte……………………………………………….. 136
Gráfico 155. Vista previa del reporte desde bi-server……………………………… 137
Gráfico 156. Estructura de directorios de la solución………………………………. 137

- 17 -
ÍNDICE DE TABLAS.

Tabla 1. Bloques de los sistemas de información………………………………… 10


Tabla 2. Sistema Data Warehouse / Business Intelligence……………………... 14

Tabla. 3. Sistemas de gestión de bases de datos más populares……………….


17-18
Tabla 4. Ventajas y desventajas de PostgreSQL…………………………………. 18-19
Tabla 5. Tabla Comparativa Fábrica de Información Corporativa y Arquitectura
Multidimensional………………………………………………………………………. 23
Tabla 6. Requerimientos de un Data Warehouse………………………………… 24-25
Tabla 7. Distribución de la población……………………………………………….. 44
Tabla 8. Entrevista realizada a la Directora Distrital de Educación……………... 57
Tabla 9. Definición de Requerimientos…………………………………………….. 61-62
Tabla 10. Productos y herramientas de instalación………………………………. 65
Tabla 11. Conversión de nombres para el modelado de datos………………….. 66
Tabla 12. Registro Nulo, Dimensión Estudiante…………………………………… 67
Tabla 13. Slowly Changing Dimensions Tipo 1 Situation Actual………………… 67
Tabla 14. Slowly Changing Dimensions Tipo 1 Nueva Situación……………….. 68
Tabla 15. Slowly Changing Dimensions Tipo 2 Situación Actual………………... 68
Tabla 16. Slowly Changing Dimensions Tipo 2 Nueva Situación……………….. 68
Tabla 17. Slowly Changing Dimensions Tipo 3 Situation Actual ………………... 68
Tabla 18. Slowly Changing Dimensions Tipo 3 Nueva Situación.………………. 68
Tabla 19. Detalle de la Dimensión Fecha………………………………………….. 70
Tabla 20. Detalle de la Dimensión Titulo…………………………………………… 70-71
Tabla 21. Detalle de la Dimensión Estudiante…………………………………….. 71
Tabla 22. Detalle de la Dimensión Ubicación Geográfica……………………….. 71-72
Tabla 23. Detalle de la Dimensión Institución Educativa………………………… 72-73
Tabla 24. Detalle de la Tabla de Hechos…………………………………………... 73
Tabla 25. Bandas de Pentaho Report Designer…………………………………… 129
Tabla 26. Herramientas utilizadas en el Page Header…………………………… 130
Tabla 27. Herramientas utilizadas en el Page Footer……………………………. 130
Tabla 28. Herramientas utilizadas en la Banda No Data………………………… 131
Tabla 28. Requerimientos de Hardware y Software……………………………… 138

- 18 -
RESUMEN EJECUTIVO.

Actualmente estamos rodeados de grandes volúmenes de datos, que van


generándose cotidianamente como resultado de diferentes procesos; el
procesamiento de estos pueden marcar el éxito o la falta de procesamiento,
puede conducirle al fracaso de una institución, organización o empresa.

Por mucho tiempo nadie se ha preocupado por conocer como estuvo, como esta y
como puede estar la gestión educativa en la Dirección Distrital de Educación
Intercultural y Bilingüe del cantón Guaranda, e identificar en que componentes
fortalecer para enriquecer los procesos pedagógicos con el fin de responder a las
necesidades educativas locales, regionales, nacionales e internacionales.

Es por esto que surge la necesidad de desarrollar un sistema de soporte a la toma


de decisiones que procese los datos existen y genere información relevante que
apoye a la toma de decisiones.

El sistema seguirá la arquitectura de flujo de datos con Pentaho CE 5.2, que va


desde la obtención de las fuentes, la construcción del Data Warehouse, el diseño
de modelos Metadatos, reportes, la construcción del Cubo de análisis OLAP, y
finalmente la implementación del portal de entrega de información al usuario final.

La metodología de investigación aplicada en el desarrollo del proyecto tuvo que


ver con varias investigaciones de campo, aplicación de encuestas, toma de
entrevistas a los diferentes actores durante el despliegue de la investigación, las
cuales permitieron ratificar el problema y orientar a la solución.

La línea de investigación en la que esta enmarca el presente proyecto de grado


tiene que ver con las tecnologías de información y comunicación.

- 19 -
ABSTRACT

We are currently surrounded by large volumes of data, ranging generated daily as


a result of different processes; processing may mark the success or failure of
processing, can lead to the failure of an institution, organization or company.

For a long time no one has bothered to know it was like, like this and how it can be
educational management in the District Direction of Intercultural Bilingual
Education of the Canton Guaranda, and identify which components strengthened
to enrich teaching processes in order to respond local, regional, national and
international educational needs.

That is why the need to develop a system to support decision-making process


there arises the data and generate relevant information to support decision
making.

The system will follow the dataflow architecture with CE 5.2 Pentaho, ranging from
obtaining supplies, construction of Data Warehouse Metadata design models,
reports, construction of Cube OLAP analysis, and finally the implementation of
portal providing information to the end user.

The research methodology applied in the project had to do with several field
investigations, conducting surveys, making interviews with the different actors in
the unfolding of the investigation, which allowed ratification of the problem and
guide the solution.

The research on which this part of this graduation project has to do with
information and communication technologies.

- 20 -
INTRODUCCION

Antecedentes de la Investigación.

Se han elaborado investigaciones preliminares que servirán de base para nuestra


investigación, así tenemos el tema encontrado en el repositorio digital de la
Escuela Politécnica Nacional, Facultad de Ingeniería en Sistemas, Titulado:
“Implementación de un Data Mart para el ramo de vehículos en una Empresa
Aseguradora.

Se puede deducir: “El crecimiento de los sistemas de información para la gestión


de diversas áreas que maneja una Compañía, ha conducido a que las empresas
se vuelvan ricas en datos pero pobres en información”. Carlos Mauricio Murillo,
2008.

Otro proyecto relevante consta en el repositorio digital de la Escuela Superior


Politécnica del Ejercito (ESPE), el cual será un referente para la investigación se
titula “Desarrollo de una aplicación de Business Intelligence para la empresa
EMPAQPLAST” donde se concluye: “El proyecto fue desarrollado con la finalidad
de dar soporte a la toma de decisiones, utilizando la metodología de Ralph
Kimball, motivo que es una de las más usadas, seguras y probadas, al momento
de implementar un proyecto Business Intelligence”, Byron Alejandro Boada
Vargas, Alvaro Arturo Tituaña, 2012.

También se puede señalar el trabajo de: Galuth Irene García y Carmen Silvana
Murillo, 2008 con Su tema titulado: “Estudio de Herramientas Business
Intelligence para la implementación de un sistema de información gerencial en la
unidad de planificación de la ESPOCH”, donde se puede resumir: “Contar con
información válida y oportuna para la toma de decisiones puede marcar la
diferencia entre el éxito o el fracaso, por lo que se recomienda el uso de
Herramientas Business Intelligence acorde a las necesidades, tamaño y
capacidad financiera de las empresas”.

-1-
Por otro lado podemos señalar que la Ex Dirección Provincial de Educación
Hispana de Bolívar se desconcentro hace tres años atrás, formándose la
Dirección Distrital de Educación Intercultural y Bilingüe del cantón Guaranda,
desde aquel entonces empezaron a proliferar mucho más los datos, con el
transcurrir del tiempo, nadie se ha preocupado por procesarlos y analizarlos para
obtener información que apoye a la toma de decisiones.

Hoy en la actualidad pretendemos implementar un sistema de soporte a la toma


de decisiones con Pentaho CE 5.2, basado en la extracción, transformación y
carga de información histórica para encontrar indicadores claves mediante el
análisis OLAP del rendimiento académico y poder mejorar de la gestión educativa.

Planteamiento del problema

En base a varias visitas realizadas a la Dirección Distrital de Educación


Intercultural y Bilingüe del cantón Guaranda se identificó algunas situaciones
dificultosas, relacionadas con la gestión educativa y la toma de decisiones:

 La mayoría de las fuentes de datos están en formato físico y muy pocas en


digital como hojas de cálculo.
 La recolección de datos entre las instituciones educativas se lo realiza
mediante el uso del correo electrónico, lo cual genera varios inconvenientes
como: Formatos de entrega distintos, dirección de correos electrónicos
incorrectos, no respetan la fecha límite de entrega, instituciones que no tienen
acceso a conexión de internet, entre otros.
 Alto riesgo de pérdida de información y vulnerabilidad en la misma.
 No existe un almacén centralizado de datos.
 Desconocimiento de ¿cómo estuvo? y ¿cómo está? el rendimiento académico
durante los años 2010 al 2014.
 Ningún sistema de procesamiento ni análisis de información, solo usa los
sistemas del Ministerio de Educación como son: SIGEE; AMIE; SIME, mismos
que permiten llevar a cabo los procesos a nivel de Ministerio de Educación,
mas no de la Dirección Distrital de Educación.

-2-
Formulación del Problema

¿Cómo mejorar la Gestión Educativa de la Educación Media en la Dirección


Distrital de Educación Intercultural y Bilingüe del cantón Guaranda?

Delimitación del Problema

La presente investigación se realizará en la Dirección Distrital de Educación


Intercultural y Bilingüe, del cantón, Guaranda, provincia Bolívar, 2015.

Objeto de Investigación y Campo de Acción

 Objeto de Estudio: Sistema de Información


 Campo de Acción: Sistemas de soporte a toma de decisiones

Identificación de la Línea de Investigación

Tecnologías de información y comunicaciones

OBJETIVOS

Objetivo General.

Implementar un sistema de soporte a la toma de decisiones, para mejorar la


Gestión Educativa de la Dirección Distrital de Educación Intercultural y Bilingüe
del Cantón Guaranda, Provincia Bolívar.

Objetivos Específicos:

 Fundamentar bibliográficamente los Sistemas de soporte a la toma de


decisiones, así como también la Gestión Educativa.
 Realizar una investigación de campo, sobre la Gestión Educativa de la
educación media en la Dirección Distrital de Educación Intercultural y
Bilingüe del Cantón Guaranda, Provincia Bolívar.
 Implementar un Sistema de Soporte a la toma de decisiones, caracterizado
por el uso de herramientas Open Source de la suite de Pentaho CE 5.2.

-3-
 Validar la propuesta en base al criterio de expertos.

Idea a Defender

Con la implementación del sistema de soporte a la toma de decisiones; mejorará


la Gestión Educativa de la Dirección Distrital de Educación Intercultural y Bilingüe
del Cantón Guaranda, Provincia Bolívar.

Justificación

De lo mencionado anteriormente se puede deducir que la problemática existe, que


esta debe solucionarse ya que de profundizarse puede afectar de manera
importante al Distrito Educativo.

De aplicarse la propuesta de solución planteada en este trabajo de grado se


podrán apreciar inmediatamente algunas mejoras y beneficios tales como:
 Información centralizada en un almacén de datos (DWH)
 Reportes avanzados que permiten profundizar en ellos y exportar a
diferentes formatos de salida como: pdf, xls, html, entre otros.
 Detección de indicadores clave que afectan a la obtención del alto
rendimiento académico.
 Toma de decisiones estratégicas, tácticas y operacionales en base a
información técnica, extraída del Data Warehouse.
 Definiciones claras y uniformes.
 La solución de análisis descriptivo tendría la oportunidad de proliferarse a
las diferentes Direcciones Distritales y Coordinaciones Zonales de
Educación para apoyar a la toma de decisiones.

Por todos los beneficios señalados se entiende que la implementación del


Sistema de Soporte a la toma de decisiones, produce un impacto positivo en la
Dirección Distrital de Educación, a más de ello permitirá mejorar la imagen
institucional, hacer uso adecuado de los recursos tecnológicos y perfeccionar el

-4-
proceso toma de decisiones en el campo de la informática, por todo esto se
justifica plenamente la realización de este trabajo de grado.

Metodología

La investigación de campo será llevada a cabo utilizando los siguientes métodos:

Histórico – Lógico: El proceso de la decisión gerencial se basa en antecedentes


históricos del comportamiento del usuario pero hoy en día ese análisis tiene que
ser sustentado por información técnica.

Analítico – Sintético: Este par dialectico será muy útil, en el momento de


elaborar el fundamento científico que sustenta la solución del problema, ya que se
recopilará la información existente en libros, revistas e internet y se la sintetizará
en el denominado marco teórico.

Inductivo – Deductivo: En el desarrollo del Sistema de Soporte a la toma de


decisiones, mismo que permitirá analizar e interpretar los datos de una manera
más fácil y sencilla, facilitando integrar totalmente el proceso en una estructura
general que permita determinar las mejores aplicaciones de los Sistemas de
información a utilizar.

Método Sistémico: En el proyecto se fusionaran los contenidos teóricos, con las


aplicaciones y herramientas de desarrollo de software existentes para determinar
cuáles ayudan a un mejor desempeño en el desarrollo del Sistema de Soporte a
la toma de decisiones.

Las técnicas aplicadas son: la encuesta y la entrevista.

Resumen de la estructura de la tesis.

El presente trabajo investigativo está estructurado en cuatro partes fundamentales


que son:
La Introducción, que es donde se plantea el problema relacionado con la toma de
decisiones, además allí se habla del objetivo general que en sí constituye la
implementación de un sistema de soporte a la toma de decisiones, también se

-5-
señalan los objetivos específicos, la justificación y algunos aspectos informativos
generales.

Capitulo I.- El marco teórico, que constituye el fundamento científico del trabajo y
que se lo ha elaborado con información relacionada a los sistemas informáticos, a
las bases de datos y a las metodologías para construir el data warehouse,
Pentaho, se complementa finalmente con el proceso de toma de decisiones y la
gestión educativa.

Capitulo II.- El marco metodológico, donde se tabula la investigación de campo y


en base al cual se ratifica la problemática, así como también se orienta a la
solución, la cual esencialmente consiste en la construcción e implementación del
sistema de soporte a la toma de decisiones.

Capitulo III.- Finalmente se desarrolla la propuesta de solución, la misma que


consiste en el desarrollo e implementación de un sistema de soporte a la toma de
decisiones, caracterizado por el uso de herramientas Open Source de la
plataforma de Pentaho 5.2; empleara una arquitectura de flujo de datos para
transportar las fuentes, extraer, transformar y cargar los datos al Data Warehouse
para generar el análisis descriptivo, y en base a esos datos se tome cualquier
decisión

Aporte Teórico.

En el aspecto teórico se puede mencionar la realización de una investigación


bibliográfica profunda en relación a Sistemas de Soporte a la toma de decisiones,
Pentaho, Mondrián, a más de ello se fundamenta la gestión educativa.

Significación Práctica.

La significación Práctica puede ser vista desde tres aspectos que son:

 La construcción del Data Warehouse ha implicado el estudio de las


metodologías de Ralph Kimball y Bill Inmon.

-6-
 El sistema de soporte a la toma de decisiones usa la arquitectura de flujo
de datos de Pentaho.
 También se debe mencionar la aplicación de todos los conocimientos
adquiridos y aprendidos durante los tres semestres, esto implica que está
íntimamente ligada la teoría con la práctica.

Novedad Científica.

Para el caso del Sistema de Soporte a la toma de decisiones de la “Dirección


Distrital de Educación” se puede señalar como aspecto novedoso las actividades
analíticas a realizar para que los datos sean transformados y representados en
información relevante, novedosa, y que aporte conocimiento nuevo para la toma
de decisiones.

-7-
CAPITULO I

MARCO TEÓRICO

1.1 Sistemas.

Antes de conocer que es un sistema de información es necesario tener presente


alguna definición de sistema, al respecto (Robert Anthony y Vijay Govindarajan,
2007), manifiestan lo siguiente: “Un sistema es una manera prescrita y
usualmente repetitiva de realizar una o varias actividades.

Los sistemas se caracterizan por una concatenación de pasos más o menos


rítmicos, coordinados y recurrentes, dirigidos a conseguir determinado fin”. Esta
definición es una visión reducida de lo que es un sistema, pues a criterio del autor
en dicha definición no se toma en cuenta que para realizar esa serie de acciones
deben existir otro conjunto de elementos que rodean al sistema, como por
ejemplo los usuarios, los componentes materiales y otros.

1.1.1 Datos e información.

Para (Gómez, 2010), la información se obtiene una vez que los hechos se
procesan, agregan y presentan de la manera adecuada para que puedan ser
útiles a alguien dentro de una institución o empresa, por lo que de este modo
estos datos organizados y procesados presentan un mayor valor que en su
estado original.

Sin embargo, según (Drucker, 2011), la información son datos dotados de


relevancia y propósito, que permite reducir la incertidumbre de quien la recibe.

Datos Transformación,
agregación, presentación Información

Gráfico 1. El proceso de transformación de los datos en información.


Fuente: Tomado de (Gómez, 2010).

-8-
1.1.1.1 Características que debe cumplir la información.

La utilidad de la información está en función de la toma de decisiones y, para ello,


ha de cumplir una serie de requisitos, entre los cuales se tiene:

 Exactitud: la información ha de ser precisa y libre de errores.


 Relevancia: la información ha de ser útil para la toma de decisiones.
 Nivel de detalle: la información debería presentar el nivel de detalle
indicado a la decisión que se destina.
 Oportunidad: se debe entregar la información a la persona que
corresponde y en el momento que ésta necesita para poder tomar una
decisión.
 Verificabilidad: la información ha de poder ser contrastada y comprobada
en todo momento. (Espinoza, 2009)

1.1.2 Sistemas de información.

(Gómez, 2010) Los sistemas de información constituyen el elemento fundamental


para poder llevar a cabo una gestión adecuada de cualquier tipo de institución o
empresa, orientada a procesos y no a funciones, que permita poner el énfasis en
la mejora continua de los resultados orientación total hacia el cliente. Su propósito
es apoyar y mejorar las operaciones cotidianas de la organización, así como
satisfacer las necesidades de información para la resolución de problemas y la
toma de decisiones.

DIMENSIÓN
HUMANA

SISTEMAS DE
INFORMACIÓN
DIMENSIÓN
TECNOLÓGICA DIMENSIÓN
ORGANIZATIVA

Gráfico 2. La triple dimensión humana, organizativa y tecnológica de los sistemas de información.


Fuente: Tomado de (Gómez. 2010).

-9-
1.1.2.1 Características de los sistemas de información.

Entregar información oportuna y precisa, con la presentación y el formato


adecuado, a la persona que la necesita para tomar decisiones o realizar alguna
operación al momento adecuado.

El sistema de información se ocupa de capturar hechos en cuanto se producen,


ya sean estos internos o externos, procesar datos obtenidos y comunicar a los
distintos elementos de la organización para que esta pueda reaccionar a tiempo
ante ellos.

1.1.2.2 Estructura del sistema de información.


(Whitten, Bentley y Barlow, 2008), proponen un modelo basado en cinco bloques:

Bloque Descripción

Personas Engloba a los propietarios del sistema, a los usuarios, a los


diseñadores y a los que implementan el sistema.

Datos Constituye la materia prima empleada para crear información


útil.

Actividades Incluyen los procesos, que se llevan a cabo en la empresa y


las actividades de procesos de datos y generación de
información que sirven de soporte a las primeras.

Redes Analiza la descentralización de la organización y la


distribución de los restantes bloques elementales en los
lugares más útiles, así como la comunicación y coordinación
entre dichos lugares.

Tecnología Hace referencia tanto al hardware como al software que


sirven de apoyo a los bloques restantes, integrantes del
sistema de soporte a la toma de decisiones.

Tabla 1. Bloques de los sistemas de información.


Fuente: Desarrollo propia a partir de (Whitten, Bentley y Barlow, 2008).

- 10 -
1.1.2.3 Clasificación de los sistemas de información.

La clasificación más extendida de los sistemas de información suelen agrupar a


éstos en función de su finalidad, tipo de función a la que se dirige, por su nivel y
función.

De acuerdo a su finalidad se clasifican en: a) soporte a las actividades operativas,


que da lugar a sistemas de información para actividades más estructuradas o
también sistemas que permitan el manejo de información menos estructurada;
aplicaciones ofimáticas, programas técnicos para funciones de ingeniería, b)
soporte a las decisiones y el control de gestión, que puede proporcionarse desde
las propias aplicaciones de gestión empresarial o a través de aplicaciones
específicas.

La clasificación de los sistemas de información por nivel y función, está


representada en la figura que se muestra a continuación.

Nivel estratégico

Nivel de Gestión

Nivel Operativo

Gráfico 3. Clasificación de los sistemas por nivel y función.


Fuente: Desarrollo propio a partir de (Gómez, 2010).

1.1.2.4 Involucrados en los sistemas de información.

De acuerdo a (Whitten, 2009), los involucrados en los sistemas de información


pueden ser clasificados ampliamente en cinco grupos, los mismos que tienen una
perspectiva distinta de un mismo sistema de información. Dichos involucrados
son: a) los propietarios del sistema, b) usuarios del sistema, c) diseñadores del
sistema, d) los constructores del sistema.

- 11 -
Los Propietarios del sistema.-Son aquellos que fomentan el desarrollo y
funcionamiento del sistema, ellos pueden ser entidades públicas o privadas y sus
fines pueden ser muy variados.

Los usuarios del sistema.-Básicamente definen los requerimientos y las


expectativas del sistema, es decir, ven aspectos de funcionalidad, facilidades para
ellos.

Los diseñadores del sistema.-Son los que traducen los requerimientos de las
organizaciones en una solución técnica factible, ve al sistema en términos de un
plan de diseño para guiar la construcción del sistema final.

Los constructores del sistema.-Construyen, implantan y mantienen el sistema


de información, tienden a ver el sistema de información en términos de hardware
y software utilizado que funciona para implementar el sistema.

1.1.3 Sistemas de Soporte a Decisiones.

Es una de las herramientas más emblemáticas de Business Intelligence (BI)


enfocada al análisis de los datos de una organización, permiten resolver gran
parte de las limitaciones de los programas de gestión. Estas son algunas de sus
características principales:

 Informes dinámicos, flexibles e interactivos. El usuario no tiene que ceñirse


a los listados predefinidos que se configuraron en el momento de la
implantación, y que no siempre responden a sus dudas reales.
 No requiere conocimientos técnicos. Un usuario no técnico puede crear
nuevos gráficos e informes y navegar entre ellos, haciendo drag & drop o drill
down.
 Rapidez en el tiempo de respuesta.-La base de datos subyacente suele ser
un Data Warehouse corporativo o un Data Mart, con modelos de datos en
estrella o copo de nieve. Este tipo de bases de datos están optimizadas para
el análisis de grandes volúmenes de información.
 Integración entre todos los sistemas y departamentos de la compañía. El
proceso de Extracción Transformación y Carga (ETL) previo a la implantación

- 12 -
de un Sistema de Soporte a Decisiones garantiza la calidad y la integración de
los datos entre las diferentes unidades de la empresa.
 Cada usuario dispone de información adecuada a su perfil. No se trata de
que todo el mundo tenga acceso a toda la información, sino de que tenga
acceso a la información que necesita para que su trabajo sea lo más eficiente
posible.
 Disponibilidad de información histórica. En estos sistemas está a la orden
del día comparar los datos actuales con información de otros períodos
históricos de la compañía, con el fin de analizar tendencias, fijar la evolución
de parámetros de negocio. (Sinnexus, 2012)

1.1.3.1 Tipos de Sistemas de Soporte a Decisiones.

1.1.3.1.1 Sistemas de información gerencial.- (MIS, Management Information


Systems), también llamados Sistemas de Información Administrativa (AIS) dan
soporte a un espectro más amplio de tareas organizacionales.

1.1.3.1.2 Sistemas de información ejecutiva.- (EIS, Executive Information


System) son el tipo de sistema de soporte a decisiones que más se suele emplear
en Business Intelligence, ya que proveen a los gerentes de un acceso sencillo a
información interna y externa de su compañía, y que es relevante para sus
factores clave de éxito.

1.1.3.1.3 Sistemas expertos basados en inteligencia artificial.-También


llamados sistemas basados en conocimiento, utilizan redes neuronales para
simular el conocimiento de un experto y utilizarlo de forma efectiva para resolver
un problema concreto. Este concepto está muy relacionado con el Data Mining.

1.1.3.1.4 Sistemas de apoyo a decisiones de grupo.- (GDSS, Group Decision


Support Systems) es "un sistema con un entorno compartido basado en
computadoras que apoya a grupos de personas que tienen un objetivo común”, El
supuesto en que se basa, es que si se mejoran las comunicaciones se pueden
mejorar las decisiones. (Laudon, 2008)

- 13 -
1.1.4 Sistemas del Ministerio de Educación.

1.1.4.1 Sigee.-El Sistema Integral de Gestión Educativa Ecuatoriana del Ministerio


de Educación es una aplicación web que permite mantener informados a sus
usuarios de todos los procesos importantes que esta Cartera de Estado realiza a
través de herramientas tecnológicas versátiles y seguras.

1.1.4.2 Sime.-El Sistema de Información del Ministerio de Educación SIME pone


al servicio de la comunidad educativa vía Internet algunas aplicaciones
informáticas que permiten el manejo transparente y automatizado de los
diferentes procesos relacionados con las funciones que le competen a esta
Cartera de Estado. Recursos Humanos, Procesos Administrativos, Formación
Docente.

1.1.4.3 Amie.-El Ministerio de Educación como responsable de la recopilación,


procesamiento, actualización y presentación de la información estadística del
sistema educativo a nivel nacional tiene a cargo el Archivo Maestro de
Instituciones Educativas (AMIE), que recaba datos de las instituciones públicas y
privadas sobre estudiantes, docentes, infraestructura, entre otros, a nivel nacional
y territorial. (Ministerio de Educación del Ecuador, 2014)

1.1.5 Sistema Data Warehouse / Bussines Intelligence.

Arquitectura Monolítica, Cliente Servidor,


Sistema de Software 3 Capas, N Capas
Plataforma Java, Ms. Net.
Arquitectura Flujo de Datos
SAP, Bussines Objects,
Sistema DWH/BI Oracle Hyperion, IBM
Plataforma Cognos, Microsoft,
Pentaho.

Tabla 2. Sistema Data Warehouse / Business Intelligence


Fuente: Desarrollo propia a partir de (Murillo M. , Data Warehousing Básico con Pentaho, 2013)

- 14 -
1.2 Bases de datos.

Una base de datos es: “una colección integrada de datos de computadora,


organizados y almacenados de una manera tal que se facilita su recuperación”
(McLeod, 2010), mientras que para (López, 2011), las bases de datos son
estructuras donde se almacena información siguiendo unas pautas de disposición
y ordenación para el posterior procesado de datos.

Primordialmente son dos los objetivos de una base de datos según (McLeod,
2010), uno de ellos es minimizar la redundancia de los datos (duplicación de los
datos) y el otro lograr la independencia de los datos (la capacidad de modificar la
estructura de los datos sin tener que modificar los programas que procesan los
datos).

Las aplicaciones de bases de datos suelen dividirse en dos o tres partes, esto es
lo que se denomina arquitectura dos o tres capas.

Usuario Usuario

Aplicación
Cliente de aplicaciones

Servidor de aplicaciones

Sistema de base
de datos Sistema de base de datos

Arquitectura 2 capas Arquitectura 3 capas

Gráfico 4. Arquitectura de dos y tres capas.


Fuente: Tomado de (Silberschatz, Korth y Sudarhan, 2006).

1.2.1 Software de base de datos.

Según (McLeod, 2010), (Abraham Silberschatz, Henry F. Korth, S. Sudarshan,


2006), el software que establece y mantiene la integración lógica entre archivos,

- 15 -
sea explícita o implícita, se denomina sistema de administración de base de
datos.

Cada Sistema de Administración de Base de Datos, posee su motor, los cuales se


basan en el lenguaje SQL (Lenguaje Estructurado de Consultas). El objetivo
principal de un DBMS (Sistema de Gestión de Base de Datos) es proporcionar
una forma de almacenar y recuperar la información de una base de datos de una
manera que sea tanto práctica como eficiente.

La gestión de los datos implica tanto la definición de estructuras para almacenar


la información como la provisión de mecanismos para la manipulación, de igual
forma, deben garantizar la fiabilidad de la información almacenada, a pesar de las
caídas del sistema o de los intentos de acceso no autorizados.

Salida 1
Aplicación 1
Base de
Salida 2
datos
DBMS

Aplicación 1 Salida 3

Aplicación 1 Salida 4

Gráfico 5. Entorno de base de datos integrada.


Fuente: tomado de (Ricardo, 2004)

1.2.2 Roles en el entorno de base de datos integrada.

Todas aquellas entidades, personas que de una u otra forma están integrados en
las operaciones de un sistema de gestión de base de datos cumplen diferentes
roles en la forma cómo interactúan con la base de datos. Así se puede citar los
siguientes roles:

 Usuarios finales, son aquellos que usan los datos que están almacenados en
la base de datos.
- 16 -
 Programadores de aplicación, quienes escriben código en cualquier lenguaje
para desarrollar software que utilizaran otros usuarios.
 Administradores de la base de datos, son los responsables del diseño,
creación de la estructura y mantenimiento de una base de datos. (Ricardo,
2004)

Usuarios Finales Programadores de Administradores de


aplicaciones base de datos
Usuarios Usuarios
aficionados casuales

Programa Lenguajes Programas en Comandos para crear y


prescritos de consulta diferentes lenguajes modificar estructura
interactivos que contienen de la base de datos
solicitudes a DBMS

Sistema de gestión de base de datos (DBMS)

Base de datos

Gráfico 6. Roles en un entorno de base datos.


Fuente: Tomado de (Ricardo, 2004)

1.2.3 Principales sistemas de gestión de base de datos.

La popularidad de los sistemas de gestión de base de datos, ha hecho posible


que diferentes organizaciones, hayan desarrollado sus aplicaciones para la
administración y uso de los servicios de base de datos, muchos de ellos han sido
desarrollados para el uso gratuito y otros para su uso comercial, la tabla siguiente
muestra el detalle de algunos de los más conocidos y usados a nivel mundial.

Sistema de gestión Sistema de gestión Sistemas de gestión de


de base de datos de base de datos bases de datos
libres gratuitos comerciales
PostgreSQL Licencia Microsoft SQL Server Advantage Database
BSD (Licencia de Compact Edition dBase
Software Libre Fox Pro
Permisiva) IBM DB2 Universal

MySQL Licencia Dual, Sybase ASE Express IBM Informix Interbase de


depende el uso. Edition para Linux CodeGear, filial de Borland

- 17 -
(Edición gratuita para MAGIC
Linux) Microsoft Access

Firebird basada en la Paradox


versión 6 de Interbase, Microsoft SQL Server
InitialDeveloper's NexusDB
PUBLIC LICENSE Open Access
Versión 1.0. Oracle

DB2 Express-C PervasiveSQL


Progress (DBMS)
Sybase ASE
NoSQL (Nueva Tecnología de base de datos)

Tabla. 3. Sistemas de gestión de bases de datos más populares.


Fuente: Desarrollo propio a partir de (http://alexnet0520.blogspot.com/)

1.2.3.1 PostgreSQL.

PostgreSQL es un sistema de gestión de bases de datos objeto-relacional,


distribuido bajo licencia BSD y con su código fuente disponible libremente. Es el
sistema de gestión de bases de datos de código abierto más potente del mercado
y en sus últimas versiones no tiene nada que envidiarle a otras bases de datos
comerciales. (Martínez, 2013)

1.2.3.1.1 Características de PostgreSQL.

PostgreSQL utiliza un modelo cliente/servidor y usa multiprocesos en vez de multi


hilos para garantizar la estabilidad del sistema. Un fallo en uno de los procesos no
afectará el resto y el sistema continuará funcionando.

Ventajas Desventajas

Disponible Sin Costo.-Instalación Soporte en línea: Hay foros oficiales,


Ilimitada, Multiplataforma. pero no hay una ayuda obligatoria.

Incluye Sub Consultas, valores por La sintaxis de algunos de sus comandos


defecto, restricciones a valores en los o sentencias no es nada intuitiva.
campos (constraints)
y disparadores (triggers).

- 18 -
Puede operar sobre distintas En comparación con MySQL es más
plataformas, incluyendo Linux, lento en inserciones y actualizaciones.
Windows, Unix, Solaris y MacOS X.

En Base de datos grandes se mantiene Consume más recursos que MySQL.


la velocidad de respuesta

Buen sistema de seguridad mediante la Límite del tamaño de cada fila de las
gestión de usuarios, grupos de usuarios tablas a 8kb
y contraseñas.

Tabla 4. Ventajas y desventajas de PostgreSQL.


Fuente: Desarrollo propio a partir de (Thomas Lockhart, 2000)

1.3 Data Warehouse.

Consiste en el proceso de creación, recuperación y consolidación de datos de los


sistemas fuente (bases de datos relacionales, archivos planos, Excel, Access,
sistemas CRM, sistemas ERP, etc.) hacia un modelo de datos optimizado para
actividades de análisis conocido como Data Warehouse.

Data Warehouse es la principal fuente para las actividades analíticas. (Murillo M. ,


Data Warehousing y Business Intelligence con herramientas Open Source , 2012)

El término Data Warehouse fue acuñado por primera vez por (Bill Inmon, 2000), y
se traduce literalmente como almacén de datos. No obstante, y como cabe
suponer, es mucho más que eso. Según definió el propio Bill Inmon, un Data
Warehouse se caracteriza por ser:

 Integrado: los datos almacenados en el Data Warehouse deben integrarse en


una estructura consistente, por lo que las inconsistencias existentes entre los
diversos sistemas operacionales deben ser eliminadas.
 Temático: sólo los datos necesarios para el proceso de generación del
conocimiento del negocio se integran desde el entorno operacional.

- 19 -
 Histórico: el tiempo es parte implícita de la información contenida en un Data
Warehouse. La información almacenada en el Data Warehouse sirve, entre
otras cosas, para realizar análisis de tendencias.
 No volátil: el almacén de información de un Data Warehouse existe para ser
leído, pero no modificado.

1.3.1 Objetivos fundamentales de un Data Warehouse.

Según (Gutiérrez, 2005), es información adaptable y elástica: el Data


Warehouse está diseñado para cambios continuos. Cuando se le hacen
nuevas preguntas al Data Warehouse, los datos existentes y las tecnologías no
cambian ni se corrompen.

Es la fundación de la toma de decisiones: el Data Warehouse tiene los datos


correctos para soportar la toma de decisiones.

Solo hay una salida verdadera del Data Warehouse: las decisiones que son
hechas después de que el Data Warehouse haya presentado las evidencias.

1.3.2 Elementos básicos de un Data Warehouse.

a) Sistema fuente: sistemas operacionales de registros donde sus funciones


son capturar las transacciones de una actividad.
b) Área de tráfico de datos: es un área de almacenamiento y grupo de
procesos, que limpian transforman, combinan, remover los duplicados,
guardan, archivan y preparan los datos fuente para ser usados en el Data
Warehouse.
c) Servidor de presentación: la maquina física objetivo en donde los datos
del Data Warehouse son organizados y almacenados para consultas
directas por los usuarios finales, reportes y otras aplicaciones.
d) Modelo dimensional: una disciplina específica para el modelado de datos
que es una alternativa para los modelos de entidad – relación.
e) Data Mart: un subgrupo lógico del Data Warehouse completo.

- 20 -
f) OLAP: actividad general de búsquedas para presentación de texto y
números del Data Warehouse, también un estilo dimensional especifico de
búsquedas y presentación de información. (Gutiérrez, 2005)

1.3.3 Procesos básicos del Data Warehouse.

 Extracción: Este es el primer paso de obtener la información hacia el


ambiente del Data Warehouse.
 Transformación: Una vez que la información es extraída hacia el área de
tráfico de datos, hay posibles pasos de transformación como; limpieza de la
información, eliminar lo que no nos sirve, seleccionar únicamente los
campos necesarios para el Data Warehouse, combinar fuentes de datos,
haciéndolas coincidir por los valores de las llaves, creando nuevas llaves
para cada registro de una dimensión.
 Carga (Loading): Al final del proceso de transformación, los datos están
en forma para ser cargados. (Murillo M. , Data Warehousing Básico con
Pentaho, 2013)

Gráfico 7. Procesos básicos de Data Warehousing


Fuente: Tomado de (Murillo M. , Data Warehousing Básico con Pentaho, 2013)

1.3.4 Desafíos de un Data Warehouse.

Problemas de calidad de datos, entre ellos: Datos Duplicados, datos Incompletos,


datos Incorrectos, datos conflictivos, datos faltantes (Falla de Integridad

- 21 -
referencial), valores nulos, volumen de datos (1Pb) y rendimiento, solo índices
binarios, particiones, agregaciones, vistas materializadas), captura de cambios de
datos consiste en identificar qué datos han sido insertados, modificados o
borrados. (Bouman, 2009)

1.3.5 Metodología para el desarrollo de un Data Warehouse.

Existen varias metodologías para el desarrollo de un proyecto estas se clasifican


en dos grupos: metodologías Top-Down del Autor Bill Inmon y Bottom-Up de
Ralph Kimball, que son los Padres del Data Warehousing.

1.3.5.1 El enfoque de Bill Inmon.-Está basado en que el Data Warehouse debe


ayudar a las necesidades de todos los usuarios en la organización y no solo de un
grupo particular.

Grafico 8. Paradigma de Bill Inmon


Fuente: Tomado de (Murillo M. , Data Warehousing Básico con Pentaho, 2013)

Bill Inmon ve la necesidad de transferir la información de los diferentes OLTP


(Sistemas Transaccionales) de las organizaciones a un lugar centralizado donde
los datos puedan ser utilizados para el análisis (sería el CIF o Corporate
Information Factory). (Espinosa, 2011)

- 22 -
1.3.5.2 Metodología de Ralph Kimball.-Está basada en la elaboración de
experimentos y prototipos, no requiere grandes inversiones por que la idea
consiste en construir Data Marts independientes que se diseñan con detalle y
después se relacionen con otros Data Marts para formar un sistema completo.

Grafico 9. Paradigma de Ralph Kimball


Fuente: Tomado de (Murillo M. , Data Warehousing Básico con Pentaho, 2013)

El Data Warehouse es un conglomerado de todos los Data Marts dentro de una


empresa. (Espinosa, 2011)

1.3.6 Tabla Comparativa Fabrica de Información Corporativa-Arquitectura


Multidimensional.

Característica CIF-Inmon MD-Kimball


Técnica de Modelamiento de Datos. Relacional y Dimensional Dimensional
Enfoque TOP-DOWN BOTOOM-UP
Vista empresarial de datos. Total Parcial
Provee datos detallados Si Si
Provee datos sumarizados Si Si
Tiempo de implantación Alto Bajo
Costo de Implantación Alto Bajo

Tabla 5. Comparativa Fábrica de Información Corporativa y Arquitectura Multidimensional.


Fuente: Tomado de (Murillo M. , Data Warehousing Básico con Pentaho, 2013)

- 23 -
1.3.7 Ciclo de vida de la Metodología de Ralph Kimball.

Planeación Diseño Técnico Selección e


del de la Instalación Crecimiento.
Proyecto Arquitectura del Producto.

Definición de Modelamiento Diseño Físico. Diseño y Implantación


Requerimientos Dimensional. Desarrollo ETL .
.

Especificación de Desarrollo de Mantenimiento


Aplicaciones de BI. Aplicaciones BI.

Gestión del Proyecto.

Gráfico 10. Ciclo de Vida de desarrollo de un Data Warehouse.


Fuente: Tomado de (Murillo M. , Data Warehousing Básico con Pentaho, 2013)

1.3.8 Requerimientos de un Data Warehouse.

Conocer las fuentes de datos, alcance, preguntas a responder, formatos de


entrega de información, etc.

ENTRADA DESCRIPCION
Tema Área o Proceso de Negocio
Audiencia Para Quien es la Solución
Propietario Quien será el Propietario de la Solución.
Necesidad del Usuario Que necesita el usuario y como usara la
solución.
Preguntas a Responder Preguntas que serán respondidas por la
solución.
Beneficios de la Entidad. Que ganará la Entidad construyendo el
Data Warehouse.
Mecanismos de Entrega Emails, Gráficos, Reportes, Tableros de
Mando, Cubos de Datos.

- 24 -
Fuentes de Información. A que personas se puede preguntar
sobre la gestión Educativa.
Fuentes de Datos. De que sistemas y base de datos se
obtendrán los datos.
Estimación. Estimación de tiempo para desarrollar la
solución.

Tabla 6. Requerimientos de un Data Warehouse.


Fuente: Desarrollo propio a partir de (http://wiki.pentaho.com).

1.3.9 Data Mining: Consiste en la extracción no trivial de información que reside


de manera implícita en los datos. Dicha información era previamente desconocida
y podrá resultar útil para algún proceso. En otras palabras, la minería de datos
prepara, sondea y explora los datos para sacar información oculta en ellos.
(Vinueza, 2013)

1.4 Pentaho.

Es una plataforma OSBI (Open Source Bussines Intelligence), que apoya a todo
el proceso de construcción del sistema Data Warehouse/Business Intelligence,
existen dos ediciones: Community (CE) y Enterprise (EE), fue programado con
Java y tecnologías relacionadas. (Murillo M. , Business Intelligence con Pentaho,
2015)

1.4.1 Pentaho Community (CE).- Es una versión totalmente Open Source,


requiere de recursos internos para parchear y probar, es de licencia GPL
orientada al aprendizaje y PYMES; ademas cuenta con una gran comunidad de
desarrollo, que realizan constantes mejoras y extensiones en la plataforma.
(OpenRed, 2014)

1.4.2 Pentaho Enterprise Edition (EE).-Es de licencia comercial, viene con


instalador automatizado, posee integración hadoop, para la presentación de datos
grandes y análisis, apoya a bi móvil, dispone de foros en línea 24x7, tiene
paquetes de asistencia remota para instalación, configuración, solución de
problemas, optimización y el derecho a las nuevas características y
actualizaciones.

- 25 -
1.4.3 Plataforma de Pentaho Community Edition.

PSW

Analysis
PRD CDF

Reporting Dashboards
PDI PME

Data Reportes
Integration Ad hoc

Gráfico 11. Plataforma de Pentaho CE


Fuente: Desarrollo propio a partir de: (http://ingmmurillo-dwh-bi.blogspot.com/2012/05/data-
warehousing.html)
.
1.4.3.1 Pentaho Data Integration (PDI)

Es la herramienta que permitirá realizar la Integración de datos, a través del


conjunto de actividades ETL, para poblar el Data Warehouse.

1.4.3.1.1 ETL.

Extracción.-Obtener datos de una o más fuentes.

Transformación.-Cambiar la forma y contenido de los datos. (Limpieza, validación,


decodificar, renombrar datos y generación de claves subrogadas (Sk)).

Loading.- Carga las tablas Dimensionales, hechos y temporales al Data


Warehouse.

Los Proyectos de Pentaho Data Integration son construidos sobre dos tipos de
objetos: Transformaciones y JOBS (Trabajos). La herramienta de trabajo será
Spoon, anteriormente denominada Kettle.

El corazón de PDI es el motor de integración de datos de Pentaho (Data


Integration Engine) (Dongen, 2009)

- 26 -
1.4.3.1.2 Arquitectura de Pentaho Data Integration.

Gráfico 12. Arquitectura de Pentaho Data Integration


Fuente: Tomado de (Dongen, 2009)

1.4.3.2 Pentaho Report Designer (PRD)

Es una herramienta gráfica, para crear, editar y publicar reportes al Servidor de


Pentaho. Es un reporteador basado en bandas similar a Cristal Reports, los
reportes son guardados con la extensión .prpt.

Soporta las siguientes fuentes de datos (Data Sets) JDBC, Modelo Metadatos,
Mongo DB, Pentaho Data Integration, OLAP, XML.

1.4.3.2.1 Estructura de Bandas de un Reporte:

 Page Header / Footer.-Contenido a mostrar en cada página. Ej. Logos,


fecha.
 Report Header / Footer.-Contenido a mostrar en la primera página del
reporte. Ej. Cabecera, gráficos, títulos.
 Group Header / Footer.-Contenido que se despliega por cada grupo.
 Details.-Contenido del reporte con los resultados de la consulta a un Data
Set.

- 27 -
 No Data.-Contenido a mostrar cuando el resultado de la consulta esta
vacía.
 Watermark.-Marca de agua que mostrara como fondo en cada reporte.

Gráfico 13.- Interfaz de Pentaho Report Designer.


Fuente: El Autor

1.4.3.3 Pentaho Schema Workbench.-Herramienta visual para construir y probar


Cubos OLAP (Online Analytical Processing). Pentaho Analysis Services (PAS)
provee las capacidades OLAP a la plataforma Pentaho. El componente principal
de PAS es el motor ROLAP Mondrian.

1.4.3.3.1 Arquitectura de Pentaho Analysis Services.

VISORES OLAP HERRAMIENTA


GRÁFICA PARA
JPIVOT ES EL VISOR CREAR ESQUEMAS
POR DEFECTO DE MONDRIAN

ESQUEMA DE
MONDRIAN
(ARCHIVO XML)

MOTOR ROLAP
MONDRIAN

Gráfico 14. Pentaho Analysis Services


Fuente: Tomado de (Dongen, 2009)

- 28 -
1.4.3.3.2 Mondrian.- Es una de las aplicaciones más importantes de la plataforma
Pentaho BI es un servidor OLAP open source que gestiona la comunicación entre
una aplicación OLAP (escrita en Java) y la base de datos con los datos fuente, es
decir, Mondrian actúa como “JDBC para OLAP”. (Gravitar, 2015)

1.4.3.3.3 Cubo OLAP.-Se crean en función a bases de datos multidimensionales,


que permiten procesar grandes volúmenes de datos, en campos bien definidos,
dando un acceso inmediato a los datos para su consulta y posterior análisis.
Esta estructura multidimensional de los cubos OLAP es gracias a que son
formados por vectores. Un cubo es una colección de múltiples dimensiones.
(Dongen, 2009)

Grafico 15. Cubos, Dimensiones y Medidas


Fuente. El Autor a partir de (Dongen, 2009)
La consulta al Modelo Dimensional es mediante el lenguaje MDX, así como SQL
es al Modelo Relacional. Las dimensiones del cubo son a las dimensiones del
modelo dimensional y las medidas del cubo son a los hechos del modelo
dimensional.
1.4.3.3.3.1 Jerarquías Niveles Y Miembros.-Las dimensiones del cubo son
organizadas en una o más jerarquías; la jerarquía permite definir niveles de
agregación. Ejemplo: La dimensión Fecha podría tener la siguiente jerarquía: Año
- Semestre -Mes. (Dongen, 2009)

Gráfico 16. Jerarquías, Niveles y Medidas


Fuente: Desarrollo propio a partir de (Dongen, 2009)

- 29 -
1.4.3.4 Community Dashboard Framework (CDF).-Tablero de mando, muestra
indicadores claves; pero se necesita un buen conocimiento en HTML5, CSS y
JavaScript para desarrollarlas.

1.4.3.5 Pentaho Metadata Editor (PME)

Pentaho tiene soporte para acceder y almacenar metadatos a través de una capa
de metadatos llamada Pentaho Metadata Layer (PML).
La capa de metadatos permite: Describir tablas y columnas en términos claros,
define los niveles de autorización, permite tener datos pre formateados; además
minimiza el impacto en los cambios del modelo dimensional del Data Warehouse.

1.4.3.5.1 Arquitectura de Pentaho Metada Data Layer.

Metadata Query
Language.

Basada en la
Especificación
CWM (Common
Warehouse
Metamodel,
OMG)

Gráfico 17. Arquitectura de Pentaho Metada Layer.


Fuente: Tomado de (Dongen, 2009)

- 30 -
1.4.3.5.2 Capas de un modelo Metadatos:

 Capa Física (Physical).-Se gestiona la conexión al Data Warehouse y se


oculta las claves subrogadas y primarias.
 Capa Lógica (Abstract Business Layer).-Se agrega campos calculados y
se le da formato.
 Capa de Presentación (Business View).-Permite definir las tablas que se
van a mostrar al usuario.

En un modelo Metadatos las capas heredan las propiedades. (Dongen, 2009)

1.5 Esquema para el modelado de datos.

1.5.1 Esquema en Estrella.-Se caracteriza por tener en el centro de una estrella


una tabla conocida como tabla de HECHOS y los puntos de la estrella se los
conoce como tablas de DIMENSIONES.

Gráfico 18.- Esquema en Estrella


Fuente.-Desarrollo Propio a partir de (http://todobi.blogspot.com)

1.6 Business Intelligence (BI).- Es el conjunto de actividades de análisis de


datos históricos, que ayuda a comprender la situación pasada, presente y futura
de una entidad, apoyando al proceso de toma de decisiones estratégicas, tácticas
y operativas.

- 31 -
De acuerdo al nivel y a la complejidad de análisis, las actividades de inteligencia
pueden ser agrupadas en tres categorías: a) Reporteo. b) Procesamiento
Analítico en línea. c) Minería de Datos.

Gráfico 19. Actividades de Análisis de Business IntelligenceI.


Fuente: Tomado de (Murillo M. , Business Intelligence con Pentaho, 2015)

1.7 La toma de Decisiones.

La toma de decisiones es definida por (Weihrich, 2007) como la selección de un


curso de acción entre distintas alternativas. Si el proceso de toma de decisiones
se diera en condiciones ideales se podría hablar de la toma racional de
decisiones.

Según (Robbins, 2007) estas condiciones ideales se presentarían si el problema


a resolver fuese claro, se tuviera información completa respecto a este problema,
se conocieran todas las alternativas posibles, las posibles consecuencias de estas
y la decisión se tomara sin restricciones de costos y tiempo, optando por aquella
que produzca el mayor valor percibido para la organización.

La toma racional de decisiones a veces debe complementarse con la intuición.


(Cronicas, 2010)

1.7.1 Elementos de la toma de decisiones

Según (Drucker, 2009) los elementos relevantes en la toma de decisiones son:

- 32 -
 Se debe verificar si la decisión a tomar es programada o no programada. En el
primer caso nos referimos a decisiones que se toman sobre problemas
estructurados o rutinarios, problemas comunes en la organización, por lo cual
estas decisiones se toman basándose en los conocimientos previos y criterios
previamente definidos, reglas, pautas o principios.
 Por otro lado, según (Barreto, 2007) las decisiones no programadas son
aquellas que se toman frente a problemas sin estructurar, problemas nuevos,
no rutinarios, que requieren una solución específica.
 Se deben definir las condiciones límites, estas son: los fines, metas y
condiciones que debe satisfacer la decisión.
 Se debe confirmar que la decisión a la cual se llegó es la correcta antes de
ponerla en práctica.
 Llevar la decisión a la práctica. Esta es la parte que exige más tiempo.
 La retroalimentación. Es muy importante que luego de poner en práctica la
decisión se analice si la misma está llevando a los resultados buscados.
(Caceres, 2014)

1.8 La Gestión.

La gestión tiene dos aspectos en su campo de acción uno de ellos tiene que ver
con la acción y efecto de gestionar y la segunda con la acción y efecto de
administrar. La idea de gestión está relacionada al direccionamiento y a los
resultados, es por eso que la gestión más que hacer en forma directa, crea las
condiciones para el mejor hacer del colectivo institucional.

Para (Blejmar, 2009) la gestión es una intervención en doble sentido, por lo cual
la gestión crea condiciones, construye escenarios adecuados, provee
capacidades e instrumentos a los equipos de trabajo, además señala que la
gestión no es un evento, no es una sola acción.

Por otra parte, la gestión, responde a propósitos explícitos, expresados en forma


de visión, metas y objetivos.

Gestionar de acuerdo al Diccionario de la Real Academia de la Lengua Española


tiene que ver con hacer diligencias conducentes al logro de un negocio o de un

- 33 -
deseo cualquiera. Se desprende entonces que gestionar es hacer las acciones o
trámites necesarios para conseguir un objetivo.

De acuerdo a lo mencionado anteriormente todo proceso de gestión lleva consigo


implícito organización y tener muy claro los objetivos a los cuales se desea llegar,
puesto que una gestión errónea puede llevar al fracaso a cualquier actividad que
desarrolle el ser humano.

1.8.1 Administrar.

(Chiavenato, 2008), administrar constituye un conjunto de actividades tales como


planear, organizar, dirigir y controlar las actividades realizadas por cualquier tipo
de organización, con el propósito de lograr los objetivos propuestos.

1.8.2 Enfoques Administrativos y de Gestión.

Caracterizada con las siguientes premisas:


a) Las relaciones humanas son el aspecto fundamental de la organización para la
Obtención de logros y metas en el proceso productivo.
b) El acento relacionado con el comportamiento racional y conductas en
detrimento de las dimensiones afectivas, emocionales y de sentimientos.
c) Atribuido al control como método eficaz para el logro del orden de las
relaciones humanas. (Fuentes, 2009)

1.8.3 EL Proyecto Educativo Institucional (PEI).

Un documento público de planificación Estratégica institucional en el que constan


acciones a mediano y largo plazo, dirigidas a asegurar la calidad de los
aprendizajes y una vinculación propositiva con el entorno escolar (Art. 88 del
Reglamento a la LOEI).

Un conjunto articulado de reflexiones, decisiones y estrategias, que ayudan a la


comunidad educativa a imaginar y diseñar el futuro deseado, considerando la
definición de estrategias flexibles y la búsqueda de consensos para lograr un
mismo objetivo, con proyección de cinco años aproximadamente.

- 34 -
1.8.3.1 Importancia del PEI.

Eje de la Gestion Institucional.

IMPORTANCIA DEL PEI


Intervención y Participación de toda
la comunidad educativa.

Establecimiento de lineas de comunicacion Efectiva.

Coherencia entre la práctica institucional y


las politicas educativas.

Vinculación de las características del entorno.

Gráfico 20. Importancia del PEI.


Fuente: Tomado de (Ministerio de Educación del Ecuador, 2014)

CARACTERISTICAS DEL PEI


1.8.3.2 Características del PEI.

Práctico.

•Integrador
Inclusivo
 Generador

Flexible
•Generador

Gráfico 21. Características del PEI.


Fuente: Tomado de (Ministerio de Educación del Ecuador, 2014)

1.8.4 Liderazgo Directivo.- El liderazgo es la influencia interpersonal ejercida en


una situación dirigida y a través del proceso de comunicación a la consecución de
uno o diversos objetivos específicos. (Helgueros, 2004)
Es tener la capacidad de llevar adelante el normal funcionamiento pedagógico,
comunitario, administrativo y operativo de la institución Educativa. El Autor.

- 35 -
1.8.5 Gestión Educativa.

La Gestión Educativa, se entiende como la conducción y dirección del sistema


educativo hacia el logro de procesos educativos de calidad, con el objetivo de
mejorar la equidad de la oferta educativa del país en un contexto de
descentralización, caracterizado y definido por las políticas educativas, que son
los pilares para la gestión educativa en el ámbito nacional, mediante el
diagnóstico de fortalezas y debilidades del Sistema Educativo, definiendo las
prioridades de asignación de recursos y la identificación para las oportunidades.
(Hernandez Baltazar, 2006)

1.8.6 Políticas Educativas del Ministerio de Educación del Ecuador.

 Entrega de Textos Escolares Gratuitos a los estudiantes que cursan los 10


años de Educación General Básica.
 Eliminación del Aporte Voluntario de las Familias de USD 25.
 Alimentación Escolar Gratuita.
 Programa Piloto de entrega de uniformes escolares gratuitos.
 Infraestructura Escolar. (Equipamiento de las Instituciones Educativas)
 Implementación del Sistema nacional de Evaluación.
 Erradicación del Analfabetismo. (Educación C. N., 2006-2015.)

1.8.7 Nuevo Modelo de Gestión Educativa.

El Nuevo Modelo de Gestión Educativa (NMGE) es un proyecto que inició su


gestión en enero de 2010, y plantea la reestructuración del Ministerio de
Educación para garantizar y asegurar el cumplimiento del derecho a la educación.
Es decir, busca influir de manera directa sobre el acceso universal y con equidad
a una educación de calidad y calidez, lo que implica ejecutar procesos de
desconcentración desde la Planta Central hacia las zonas, distritos y circuitos,
para fortalecer los servicios educativos y aproximarlos hacia la ciudadanía,
atendiendo las realidades locales y culturales.

- 36 -
En ese marco, el Nuevo Modelo persigue la desconcentración de la Autoridad
Educativa Nacional, a su vez, una nueva práctica de realización del servicio
público (mejor distribución de personal capacitado e idóneo); así como la
racionalización recursos, distribución de competencias y responsabilidades.

Objetivo General.

Implementar un Nuevo Modelo de Gestión Educativa que garantice la rectoría del


sistema mediante el fortalecimiento institucional de la autoridad educativa
nacional y potencie la articulación entre niveles e instituciones desconcentrados
del sistema.

Objetivos Específicos:

1. Implementar el nuevo orgánico funcional del Ministerio de Educación.

2. Implementar el Modelamiento Territorial a nivel nacional, para la definición

de distritos y circuitos educativos.

3. Conformar las Coordinaciones Regionales, Direcciones Distritales y

Administraciones Circuitales de Educación incluyendo adecuaciones de

infraestructura y dotación de equipamientos.

4. Implementar los sistemas de información que consideren los componentes

de capacitación, gestión, régimen escolar, acompañamiento pedagógico,

regulación.

5. Conformar los Gobiernos Escolares Ciudadanos en los Circuitos

Educativos.

La Autoridad Nacional Educativa se articula hacia las zonas, como lo muestra el


mapa a continuación, hasta llegar a los distritos y circuitos educativos

- 37 -
Gráfico 22. Desconcentración del Ministerio de Educación.
Fuente: (http://www.educacion.gob.ec)

1.8.8 Zonas, Distritos y Circuitos.

La implementación del Nuevo Modelo de Gestión Educativa está en desarrollo


progresivo en todo el territorio ecuatoriano, incluye las 9 Zonas Educativas
(Subsecretarías de Quito y Guayaquil), los 140 distritos educativos y 1.117
circuitos educativos. Y todas las áreas, secciones y direcciones del Ministerio de
Educación.

La población objetivo abarca todos los usuarios del Sistema Nacional de


Educación, incluyendo estudiantes y ex estudiantes de todos los niveles y
modalidades, docentes y autoridades de establecimientos fiscales, fisco misional
y particular del Ecuador.

Adicionalmente, abarca a todos los funcionarios del Ministerio de Educación del


Nivel Central, de las Coordinaciones Educativas Zonales y de las Direcciones
Provinciales de Educación Hispanas y Bilingües que se encuentran en transición
hacia los distritos. (Ministerio de Educación del Ecuador, 2014)

- 38 -
1.9 Conclusiones parciales del Capítulo.

 Hoy en día los datos existen en múltiples fuentes, tienen un gran valor, razón
que dándoles el tratamiento adecuado, pueden generar conocimiento y apoyar
en el análisis y la toma de decisiones.

 Todo Data Warehouse tiene al menos una Dimensión Fecha y una Tabla de
análisis (hechos.)

 Los sistemas de información han adquirido una dimensión estratégica en el


mundo del nuevo milenio y han dejado de ser una simple herramienta para
automatizar los procesos operativos para convertirse en una pieza clave a
tener en cuenta a la hora de formular cualquier tipo de estrategia, para llevar a
cabo su implantación y para realizar el control de la gestión.

 La calidad de los sistemas informáticos no está en la complejidad de los


mismos, el verdadero valor está en la utilización que cualquier organización o
empresa hagan de ellos, lo que por regla general, depende más de factores
humanos, que de factores tecnológicos.

 El principal objetivo de los Sistemas de Soporte a Decisiones es explotar al


máximo la información residente en una base de datos corporativa (Data
Warehouse o Data Mart), mostrando informes muy dinámicos, con gran
potencial de navegación, pero siempre con una interfaz gráfica amigable,
vistosa y sencilla.
 La gestión no depende de una sola persona o un solo factor sino se
complementa de varios factores y recursos como: tecnológicos, humanos,
económicos, donde el medio principal es la comunicación para el logro de los
objetivos propuestos.

 La tecnología es necesaria, pero es mucho más importante la parte humana,


ya que las decisiones al fin y al cabo son tomadas por los hombres o mujeres
que dirigen las instituciones o empresas.

- 39 -
CAPITULO II
MARCO METODOLÓGICO

2.1 CARACTERIZACION DEL SECTOR

La Dirección Distrital de Educación de Guaranda inició su vida institucional


mediante los respectivos acuerdos ministeriales (0481-12) emitidos, el 25 de
Enero del 2012, donde las Ex Direcciones Provinciales de Educación se
desconcentran y se crean 139 Distritos educativos en el territorio nacional.
Siendo Directora de Estudios en ese entonces, la ilustre bolivarense Dra. Mery
Gavilanes Betancourt, gestora de la educación de la provincia Bolívar.

Gráfico 23. Dirección Distrital de Educación Intercultural-Bilingüe, Guaranda.


Fuente: El Autor

La administración de la Educación ha sido dirigida por varios Directores (as). La


Dirección Distrital de Educación Intercultural y Bilingüe, es considerada de
tipología mediana por su extensión geográfica, está estructurada por procesos,
siendo éstos: Gobernantes y Adjetivos las divisiones siguientes: Gestión de TICS,
Denuncias, Apoyo y Seguimiento, Atención Ciudadana, Planificación, Asesoría
Jurídica, Desarrollo Profesional, Talento Humano, Administración Escolar,
Financiero y Coordinación Educativa. Según el Registro oficial Nro. 73, de 4 de
septiembre del 2013.

- 40 -
Es la institución que fomenta el desarrollo de la educación y el acervo cultural, y
asegura el acceso a la misma a toda la población Guarandeña; por ello, debe
promover el mejoramiento y democratización en su accionar, impulsa la
planificación, organización, gestión y evaluación de las actividades académico-
administrativas de la institución que contribuyen al análisis, estudio y solución de
los problemas vitales que afectan a la comunidad educativa y sociedad local y
nacional.

Los servidores públicos de la institución tienen un nivel cultural aceptable y la


predisposición para el trabajo y resaltan su aspiración de adelanto, capacitación,
superación y servicio a la colectividad.

En cuanto a la actualización de tecnología ha mejorado su equipamiento y


cuentan con los conocimientos suficientes para brindar una buena atención a los
usuarios.

Entre otras fortalezas que dispone es la ética y la capacidad para actuar ante
situaciones que se presentan. Además, de tener una proyección de una entidad
emprendedora con enfoque de calidad, comprometida con el desarrollo social y
respetuoso de la diversidad e interculturalidad.

El sistema educativo del cantón Guaranda es heterogéneo en su estructura


organizativa, funcionamiento, y en su composición, población, objetivo y servicio
que entrega. Atiende a niños, niñas y adolescentes, entre 3 y 18 años de edad,
con una oferta de servicios educativos en tres niveles de formación a) Educación
Inicial, b) Educación General Básica y c) Bachillerato; cada uno de los cuales
funciona bajo estructuras organizacionales y operativas diferentes.

Además se atiende a la población de adultos de acuerdo a las políticas del Plan


Decenal. El sistema educativo del cantón Guaranda funciona con relativo
reconocimiento, si bien existen debilidades, también hay enormes potenciales y
capacidades no explotadas, se espera aprovechar en el corto plazo para una
entrega de los servicios educativos de calidad. (Dirección Distrital de Educación ,
2014)

- 41 -
2.1.1 Misión. Garantizar el acceso y calidad de la educación inicial, básica y
bachillerato a los y las habitantes del territorio nacional, mediante la formación
integral, holística e inclusiva de niños, niñas, jóvenes y adultos, tomando en
cuenta la interculturalidad, la plurinacionalidad, las lenguas ancestrales y género
desde un enfoque de derechos y deberes para fortalecer el desarrollo social,
económico y cultural, el ejercicio de la ciudadanía y la unidad en la diversidad de
la sociedad ecuatoriana.

2.1.2 Visión.-El Sistema Nacional de Educación brindará una educación centrada


en el ser humano, con calidad, calidez, integral, holística, crítica, participativa,
democrática, inclusiva e interactiva, con equidad de género, basado en la
sabiduría ancestral, plurinacionalidad, con identidad y pertinencia cultural que
satisface las necesidades de aprendizaje individual y social, que contribuye a
fortalecer la identidad cultural, la construcción de ciudadanía, y que articule los
diferentes niveles y modalidades de los sistemas de educación. (Ministerio de
Educación, 2014)
2.1.3 Organigrama Institucional.

Gráfico 24. Organigrama Dirección Distrital de Educación-Guaranda.


Fuente: (Ministerio de Educación del Ecuador, 2014)

- 42 -
2.2 DESCRIPCIÓN DEL PROCEDIMIENTO METODOLÓGICO
2.2.1 Modalidad de la Investigación

La modalidad investigativa que se utilizó en esta tesis es la denominada cuali-


cuantitativa. La investigación cualitativa es el procedimiento metodológico que se
caracteriza por utilizar palabras, textos, discursos, dibujos, gráficos e imágenes
para comprender las características generales del problema, en el caso que nos
atañe mediante la observación se ha procedido a investigar los aspectos de la
toma de decisiones y el volumen de información en papeles que existe en la
Institución.

La investigación cuantitativa se caracteriza por recoger, procesar y analizar datos


cuantitativos o numéricos sobre variables previamente determinadas. En esta
investigación, esta modalidad se aplicó cuando encuestamos a los servidores
públicos de la Institución, y autoridades de las instituciones educativas, luego
dichas encuestas fueron tabuladas, para posteriormente graficar los resultados en
hojas de cálculo.

2.2.1.1 Tipos de investigación Aplicadas.

 Bibliográfica: Este tipo de investigación se la desarrolla en base a la


recopilación de la información de fuentes primarias, se la utilizó para
desarrollar el marco teórico orientado a sistemas de información, bases de
datos, Data Warehouse, Pentaho, sistemas para la toma de decisiones y
gestión educativa.
 De Campo: se la lleva a cabo en base a encuestas y entrevistas, se aplicó
para desarrollar el marco metodológico.

2.2.1.2 Población y Muestra

Por consiguiente el conjunto poblacional del presente estudio está conformado


por dos estratos claramente definidos. El primero, conformado por treinta y nueve
servidores públicos de la Dirección Distrital de Educación Intercultural y Bilingüe
del cantón Guaranda, los cuales por su naturaleza e importancia pasarán a formar
parte del universo auto-representada bajo probabilidad (1).

- 43 -
El segundo estrato está representado por treinta y cuatro Autoridades de las
instituciones educativas de Educación media. Estos dos estratos pertenecientes a
la ciudad de Guaranda y sus áreas de influencia por lo que la población queda de
la siguiente manera.

2.2.1.2 Distribución de la Población.

ESTRATOS Servidores públicos de la Dirección NUMERO DE


Distrital de Educación Intercultural y SUJETOS
1ra. Bilingüe del cantón Guaranda. 39
Autoridades de las instituciones 34
Educativas la Dirección Distrital de
2da. Educación Intercultural y Bilingüe
del cantón Guaranda.
TOTAL 73

Tabla.7 Distribución de la Población


Fuente: El Autor
Por tratarse de una población finita no aplicamos una formula estadística para
determinar el tamaño de la muestra, ya que la presente investigación se realizó
con un muestreo estratificado del universo de estudio.

En la selección de entrevistas y encuestas no se consideró a los estudiantes ni


docentes, motivo que la gestión y administración depende directamente de la
Autoridad de la institución educativa en conjunto con los Servidores públicos de
Dirección Distrital de Educación y siguiendo el ciclo de vida de la metodología de
Ralph Kimball, los requerimientos del sistema, se definen en base a la entrevista
realizada al usuario que va utilizar la solución.

2.2.2 Métodos utilizados en la Investigación de Campo.

a) Histórico – Lógico: El proceso de la decisión gerencial se basa en


antecedentes históricos del comportamiento del usuario pero hoy en día ese
análisis tiene que ser sustentado por información técnica extraída de la base de
datos transaccional.

b) Analítico – Sintético: Este par dialectico será muy útil, el momento de


elaborar el fundamento científico que sustenta la solución del problema, ya que se

- 44 -
recopilará la información existente en libros, revistas e internet y se la sintetizará
en el denominado marco teórico.

c) Inductivo – Deductivo: En el desarrollo del sistema de soporte a la toma de


decisiones (DSS), el mismo que facilitará el análisis descriptivo de los datos e
interpretarlo de una manera más fácil y sencilla, facilitando integrar totalmente el
proceso en una estructura general que permita determinar las mejores
Aplicaciones de los Sistemas de información a utilizar.

d) Método sistémico: En el proyecto se fusionaran los contenidos teóricos, con


las aplicaciones y herramientas de desarrollo de software existentes para
determinar cuáles ayudan a un mejor desempeño en el desarrollo del Sistema.

2.2.3 Técnicas Aplicadas en la investigación.

Entrevista a la Directora Distrital de Educación del cantón Guaranda, encuestas a


los servidores públicos de la misma institución y a las autoridades de las
instituciones educativas.

Los instrumentos utilizados fueron: Cuestionario específico para los Servidores


Públicos, Autoridades de las Instituciones educativas y guía de entrevista para la
máxima autoridad del Distrito de Educación.

2.2.4 Procesamiento de datos

Para un mejor análisis e interpretación de los resultados, se realizó una serie de


procesos que permitieron encarar la investigación de forma más clara y precisa
respecto a la cantidad de datos posibles.

La presente investigación procesó los datos obtenidos mediante, cuadros


estadísticos y gráficos de pasteles, con una breve interpretación de los resultados
obtenidos en la investigación de campo para llegar a las conclusiones y
recomendaciones que dan como resultado la propuesta alternativa para el
mejoramiento de la toma de decisiones en la gestión educativa.

- 45 -
2.2.4.1.-Encuesta Aplicada a los Servidores Públicos de la Dirección Distrital
de Educación del cantón Guaranda, 2014.

Pregunta Nro. 1
Título: ¿Considera que existen datos históricos del rendimiento académico que
deberían ser procesados y analizados para que sirvan de soporte a la toma de
decisiones?
Variable Frecuencia Porcentaje

A veces 3 4%

Siempre 70 96%

Nunca 0 0%

Total 73 100%

Tabla #1.-Disponibilidad de datos históricos del Rendimiento Académico.


Fuente.- El Autor Fecha: Marzo - 2014

DISPONIBILIDAD DE DATOS HISTÓRICOS DEL RENDIMIENTO


ACADÉMICO.
A veces
Nunca 4%
0%

Siempre
96%

Figura # 1.- Disponibilidad de datos históricos del Rendimiento Académico.


Fuente: El Autor.

ANALISIS E INTERPRETACION:

Como podemos ilustrarnos en el gráfico estadístico en un alto porcentaje


manifiestan que siempre existen datos históricos del Rendimiento Académico que
podrían generar información valiosa para la toma de decisiones; mientras un
bajísimo porcentaje manifiesta que a veces existen los datos, lo cual no es un
impedimento para el desarrollo de nuestro proyecto.

- 46 -
Pregunta Nro. 2

Título: ¿Conoce usted como ha estado y como está el rendimiento académico de


las Instituciones Educativas de su distrito educativo?

Variable Frecuencia Porcentaje

Si 2 3%

No 71 97%

Total 73 100%

Tabla # 2.-Conocimiento del estado del Rendimiento Académico.


Fuente.- El Autor Fecha: Marzo – 2014

CONOCIMIENTO DEL ESTADO DEL RENDIMIENTO


ACADEMICO

3%

97%

Si No

Figura # 2.- Conocimiento del estado del Rendimiento Académico.


Fuente.- El Autor

ANALISIS E INTERPRETACION.

La mayoría de los encuestados de la Dirección Distrital de Educación,


desconocen del estado del rendimiento, lo cual es un obstáculo para aplicar
estrategias, planes de mejora en la gestión educativa; mientras un bajísimo
porcentaje si conoce el estado del rendimiento académico.

- 47 -
Pregunta Nro. 3

Título: ¿Qué formato se utiliza para la entrega y recepción de información entre la


Dirección Distrital de Educación y las instituciones?

Variable Frecuencia Porcentaje

Físico 39 54%

Digital 25 34%

Físico y Digital 9 12%

Total 73 100%

Tabla # 3.- Formato utilizado en la entrega y recepción de Información


Fuente.- El Autor Fecha: Marzo - 2014

FORMATO UTILIZADO EN LA ENTREGA Y RECEPCION


DE INFORMACION
[NOMBRE DE
CATEGORÍA]

Físico
Digital

Físico Digital Físico y Digital

Figura # 3.- Formato utilizado en la entrega y recepción de Información

Fuente: El Autor

ANALISIS E INTERPRETACION

La mayor parte de Servidores Públicos de la Dirección Distrital de Educación,


entregan y receptan la información en formato físico lo cual implica más uso de
papel, más tiempo en el proceso de los datos y se vive un riesgo constante de
perdida de información, por lo que se hace urgente la implementación de un
sistema que extraiga las fuentes, procese y analice los datos. Una minoría recepta
la información en formato físico y digital, lo cual facilitara la consolidación de los
datos, para construir la centralización de datos.

- 48 -
Pregunta Nro. 4

Título: ¿Usted lleva el control y organización de sus datos digitales?

Variable Frecuencia Porcentaje

Si 11 15%

No 62 85%

Total 73 100%

Tabla # 4.- Control y organización de los datos digitales.


Fuente.- El Autor Fecha: Marzo - 2014

CONTROL Y ORGANIZACION DE LOS DATOS


DIGITALES

Si
15%

No
85%

Si No

Tabla # 4.- Control y organización de los datos digitales.


Fuente.- El Autor Fecha: Marzo - 2014

ANÁLISIS E INTERPRETACIÓN

Como podemos analizar en el gráfico estadístico la mayoría de encuestados no


llevan un control ni organización de los datos digitales, lo cual dificulta el
procesamiento y análisis de los mismos; mientras unos pocos si llevan control y
organización de los datos, lo cual favorece para proliferar esa política interna para
todos los empleados.

- 49 -
Pregunta Nro. 5
Título: Dispone de infraestructura tecnológica el departamento de ciencia y
tecnología, de su Dirección Distrital para implementar el Sistema de soporte a la
toma de decisiones?

Variable Frecuencia Porcentaje

Si 73 100%

No 0 0%

Total 73 100%

Tabla # 5.- Disponibilidad de Infraestructura Tecnológica para implementar el Sistema.

Fuente.- El Autor Fecha: Marzo - 2014

Fuente.- El Autor Fecha: Abril - 2014


DISPONIBILIDAD DE INFRAESTRUCTURA
TECNOLOGICA PARA IMPLEMENTAR EL
SISTEMA

No
0%

Si
100%

Si No

Figura # 5.- Disponibilidad de Infraestructura Tecnológica para implementar el Sistema.


Fuente: El Autor

ANALISIS E INTERPRETACION

En su totalidad los encuestados dan a conocer que sí disponen de infraestructura


tecnológica para implementar con éxito el sistema de Soporte a la toma de
decisiones, que mejorará la gestión educativa; lo cual facilita la implementación
del sistema, optimizando los recursos tecnológicos existentes y disminuyendo el
tiempo y costo de implantación.

- 50 -
2.2.4.2.-Encuesta dirigida a las autoridades de las instituciones educativas
de educación media de la Dirección Distrital de Educación del cantón
Guaranda, 2014.
Pregunta Nro. 1
Título: ¿Considera usted que los Servidores Públicos de la Dirección Distrital de
Educación en varias ocasiones solicitan información repetitiva?

Variable Frecuencia Porcentaje


A veces 18 25%
Siempre 55 75%
Nunca 0 0%
Total 73 100%

Tabla # 1.- Solicitan información repetitiva.


Fuente.- El Autor Fecha: Marzo - 2014

SOLICITAN INFORMACIÓN REPETITIVA.


Nunca
0% A veces
25%

Siempre
75%

A veces Siempre Nunca

Figura # 1.- Solicitan información repetitiva.


Fuente: El Autor

ANALISIS E INTERPRETACION

La mayoría de Autoridades de las instituciones educativas manifiestan que por


varias ocasiones solicitan información repetitiva desde la Dirección Distrital de
Educación, lo cual evidencia que los datos proporcionados al distrito no están
siendo bien almacenados.

- 51 -
Pregunta Nro. 2
Título: ¿Usted está consiente que la falta de un sistema de soporte a la toma de
decisiones incide negativamente en el mejoramiento de la gestión educativa?

Variable Frecuencia Porcentaje

SI 54 74%

NO 19 26%

Total 73 100%

Tabla # 2.- Incidencia en el mejoramiento de la gestión educativa al no disponer un sistema de


soporte a las decisiones.

Fuente.- El Autor Fecha: Marzo - 2014


INCIDENCIA EN EL MEJORAMIENTO DE LA GESTION
EDUCATIVA AL NO DISPONER UN SISTEMA DE SOPORTE
A LAS DECISIONES

26%

74%

Si No

Figura # 2.- Incidencia en el mejoramiento de la gestión educativa al no disponer un sistema de


soporte a las decisiones.
Fuente: El Autor

ANALISIS E INTERPRETACION

En su mayoría están conscientes que la carencia de un sistema de soporte a la


toma de decisiones, incide negativamente en el mejoramiento de la gestión
educativa; porque para mejorar, primero hay que identificar en que componentes
fortalecer.

- 52 -
Pregunta Nro. 3
Título: ¿Cuál cree que sería el mejor medio tecnológico para facilitar el flujo de
información?

Variable Frecuencia Porcentaje

CD 7 9%

Formulario Web 53 73%

Email 13 18%

Total 73 100%

Tabla # 3.- Medio para facilitar el flujo de la Información.

Fuente.- El Autor Fecha: Marzo - 2014

MEDIO TECNOLOGICO PARA FACILITAR EL FLUJO


DE INFORMACION

18% 9%

73%

Cd Formulario Web Email

Figura # 3.- Medio para facilitar el flujo de la Información.


Fuente: El Autor

ANALISIS E INTERPRETACION
En el grafico podemos observar y evidenciar que la mayoría de autoridades
educativas están conscientes que se debería utilizar formularios web para
canalizar la entrega de la información e ir automatizando los procesos, una
minoría decide mantener la manera tradicional del correo electrónico y CD.

- 53 -
Pregunta Nro. 4

Título: Apoya la noción que toda información enviada a la Dirección Distrital


debería ser almacenada, procesada y analizada, para en su momento apoyar a la
toma de decisiones en beneficio de la gestión educativa.

Variable Frecuencia Porcentaje

SI 73 100%

No 0 0%

Total 73 100%

Tabla # 4.- Uso de la Información.


Fuente.- El Autor Fecha: Marzo - 2014

USO DE LA INFORMACIÓN
No
0%

Si
100%
Si No

Figura # 4.- Uso de la Información.


Fuente: El Autor

ANALISIS E INTERPRETACION

En su totalidad de encuestados manifiestan que toda información enviada al


Distrito de Educación debería ser almacenada, procesada y analizada para en su
momento dado apoye a la toma de decisiones en beneficio de la gestión
educativa.

- 54 -
Pregunta Nro. 5
Título: Considera necesario implementar un sistema de soporte a la toma de
decisiones en la Dirección Distrital de Educación, para trasformar los datos en
información y obtener indicadores claves de la realidad de la educación.

Variable Frecuencia Porcentaje

Si 73 100%

No 0 0%

Total 73 100%

Tabla # 5.- Implementación de un sistema de soporte a la toma de decisiones.


Fuente.- El Autor Fecha: Marzo - 2014

Implementación del Sistema de Soporte a la


toma de decisiones.
No
0%

Si
100%
Si No

Figura # 5.- Implementación de un sistema de soporte a la toma de decisiones.

Fuente: El Autor

ANALISIS E INTERPRETACION.
Todas las autoridades de las instituciones educativas están de acuerdo que se
implemente un sistema de soporte a la toma de decisiones, para poder identificar
en que componentes educativos mejorar y encaminar hacia la excelencia
educativa.

- 55 -
2.2.4.3 Resumen de la entrevista aplicada a la Directora Distrital de
Educación Intercultural y Bilingüe del Cantón Guaranda.

PREGUNTAS RESPUESTA ANÁLISIS DE RESPUESTA

1.- ¿Considera que La entrevistada manifiesta que existen


existen datos datos valiosos, que no están siendo
valiosos que no SI procesados, debido a que no cuentan con
están siendo ningún sistema de procesamiento de datos,
procesados. ni personal capacitado en el tratamiento de
la información.

2.-¿Cree que es La Directora de Educación da a conocer


necesario que se que si es necesario que se implemente un
implemente un sistema que permita procesar y analizar los
sistema, que SI datos, motivo que por varios años nadie se
procese los datos y ha preocupado, por dar tratamiento a la
genere información información.
relevante para la
toma de decisiones.
3.-¿Cuáles serían ¿Cómo fue el La Directora Distrital quiere conocer como
las preguntas que rendimiento ha estado el rendimiento académico
desearía que le académico durante durante los años 2010 al 2014?
respondiera el el transcurso de los
sistema de soporte años 2010 al 2014?
a la toma de
decisiones?
¿Cuál es el La entrevistada desea conocer cuál es el
componente que componente que incide en el bajo
incide en el bajo rendimiento académico, para poder ejecutar
rendimiento planes de mejora?
académico de los
estudiantes?

¿De qué La Directora Distrital, considera muy


sostenimiento es la elemental identificar a que sostenimiento
institución en la que pertenece la institución en la que los
los estudiantes con estudiantes periódicamente obtienen un
frecuencia obtienen bajo rendimiento académico?
un bajo rendimiento
académico?

¿Cómo está la La entrevistada manifiesta que desea


educación bilingüe analizar el rendimiento académico bilingüe
en relación a la en relación al hispano?
hispana?

¿Qué género es el La Directora Distrital desea distinguir que


que mejor genero son los del mejor rendimiento
rendimiento reporta académico desde el año 2010 al 2014.
por años?

¿Cómo está el La entrevistada desea comparar el


rendimiento rendimiento académico de una institución
académico de la de modalidad semipresencial en relación a

- 56 -
modalidad la presencial.
semipresencial, en
relación a la
presencial?

¿Cómo está el La Directora Distrital desea analizar el


rendimiento rendimiento académico de la institución
académico de la jornada nocturna en relación a la diurna?
institución jornada
nocturna, en relación
a la diurna?

¿Cuál es la La entrevistada desea identificar cual es la


especialidad en la especialidad en la que se han graduado con
que los estudiantes bajo rendimiento académico, para priorizar
se han graduado con planes de mejora?
bajo rendimiento
académico?

¿Cómo está el La Directora Distrital desea conocer cómo


rendimiento está el rendimiento académico de la zona
académico de la rural en relación a la urbana, durante los
zona rural en años 2010 al 2014?
relación a la urbana
desde el año 2010 al
2014?
La entrevistada desea conocer cuáles
Cuáles fueron los fueron los mejores años del rendimiento
mejores años del académico.
rendimiento?

Tabla 08. Entrevista realizada a la Directora Distrital de Educación.


Fuente: El Autor

2.3 Propuesta del Investigador

La propuesta consiste en la construcción de una Aplicación OLAP para análisis


del rendimiento académico y la toma de decisiones de la Dirección Distrital de
Educación Intercultural y Bilingüe del cantón Guaranda, la herramienta de trabajo
será Pentaho 5.2 y se lo esquematiza de la siguiente forma:
software para toma

Construcción Formación de Emisión de


de desiciones
Fuente de la
Institución

del Data los cubos en reportes de


olap

Warehouse. pentaho los cubos

Gráfico 25. Esquema de la Solución Propuesta.


Fuente: El Autor

- 57 -
2.4 Conclusiones parciales del Capítulo.

 La Dirección Distrital de Educación como dependencia de control educativo no


dispone de los elementos necesarios para la toma de decisiones, así por
ejemplo cuenta con datos, pero no con información sobre aspectos de
rendimiento académico.

 La falta de un sistema de soporte a la toma de decisiones incide


negativamente en el mejoramiento de la gestión educativa.

 Hay un profundo desconocimiento del rendimiento académico, por lo que no


hay un análisis histórico sobre este, se desconoce las instituciones, zonas,
circuitos que necesitan planes de mejora.

 El departamento de ciencia y tecnología de la Dirección Distrital, no ha creado


políticas internas de organización y control de los datos, por lo que también
está fallando, es decir no cuenta con una estandarización del flujo de datos.

 La problemática existe y cada vez se acentúa más, eso significa que se están
tomando decisiones muy poco eficientes, es decir sin datos de respaldo.

 Se hace urgente la implementación de aplicaciones que nos ayuden a obtener


cierta información para que sirva de base para tomar decisiones relacionadas
con la gestión educativa.

- 58 -
CAPITULO III

MARCO PROPOSITIVO

3.1 Tema.

“Sistema de soporte a la toma de decisiones, para mejorar la gestión educativa de


la educación media de la Dirección Distrital de Educación Intercultural y Bilingüe,
del cantón Guaranda, provincia Bolívar.”

3.2 Objetivo General.

Implementar un sistema de soporte a la toma de decisiones en la Dirección


Distrital de Educación Intercultural y Bilingüe del Cantón Guaranda, provincia
Bolívar.

3.3 Objetivos Específicos.

 Administrar la plataforma Pentaho Community Edition 5.2.


 Usar una metodología y arquitectura de flujo de datos para fabricar el Data
Warehouse.
 Crear reportes a demanda, mediante el diseño de metadatos.
 Construir el Cubo de Análisis OLAP.
 Diseñar reportes institucionales e informes del Cubo.
 Implementar un portal web de inteligencia empresarial, para la toma de
decisiones.

3.4 Planeación y Administración del proyecto.

3.4.1 Definición del Proyecto.

Partiendo de la necesidad de procesar los datos del rendimiento académico para


que la Directora Distrital de Educación, pueda analizar la información y tomar
decisiones, el autor decidió implementar este tipo de proyecto.

- 59 -
3.4.2 Preparación de un Proyecto Data Warehouse.

La Dirección Distrital de Educación del Cantón Guaranda, muestra interés en el


desarrollo del proyecto por lo que se tiene el apoyo incondicional de la Directora
Distrital, el departamento de Tecnología, los servidores públicos del Distrito y
Autoridades de las Instituciones Educativas.

3.4.3 Alcance

El proyecto estará centrado en desarrollar e implementar un sistema de soporte


a la toma de decisiones en base a información histórica del rendimiento
académico desde el año 2010 al 2014, datos que reposan en la Dirección Distrital
de Educación, del cantón Guaranda.

El sistema contribuye significativamente a la gestión educativa, razón que está


enfocado en identificar cuáles son los componentes que inciden en el bajo
rendimiento académico de los estudiantes, para lo cual se fabricara el Data
WareHouse, se construirá el cubo de análisis OLAP y se diseñaran reportes a
demanda e institucionales, siendo la Directora Distrital de Educación la
responsable del análisis de la información y la toma de decisiones.

3.4.4 Fundamentación.

La Dirección Distrital de Educación, ubicada en el cantón Guaranda, desde su


inicio ha sido generadora de datos; pero no se ha preocupado en realizar
actividades analíticas que apoyen a la toma de decisiones.

La solución que planteamos está enfocada en el análisis de datos históricos con


la finalidad de rastrear los componentes que inciden en el bajo rendimiento
académico y con el propósito de colaborar a la gestión educativa en la toma de
decisiones.

Construiremos la Solución utilizando herramientas Open Source de la plataforma


de Pentaho CE. 5.2, líder en inteligencia empresarial.

- 60 -
3.4.5 Planificación del Proyecto.

Se asignaran roles a las personas involucradas en el ciclo de vida del desarrollo


del Proyecto.

Patrocinador del Proyecto: Dirección Distrital de Educación Intercultural y


Bilingüe del cantón Guaranda.

Administrador de Base de Datos: El Autor.

Director del Proyecto: Ing. Freddy Baño.

Desarrollador: El Autor.

Personal Involucrado en el Proyecto: Directora Distrital, Analistas de Atención


Ciudadana, Apoyo Seguimiento, Tecnología y Autoridades de las Instituciones
Educativas.

3.4.6 Administración del Proyecto.

Mensualmente se realiza una reunión para monitoreo del avance del proyecto por
parte del Director del Proyecto y el Autor. El Cronograma de Actividades de
encuentra en el Anexo # 05.

3.5 Definición de Requerimientos.

Este es el punto clave en el desarrollo del proyecto debido que a partir de la


entrevista realizada a la Directora Distrital de Educación se pudo identificar los
diferentes requerimientos:
Tema: Data Warehouse para Análisis del Rendimiento académico.

Preguntas a ¿Cómo ha estado el rendimiento académico durante el transcurso


Responder. de los años 2010 al 2014?

¿Cuál es el componente que incide en el bajo rendimiento


académico de los estudiantes?

¿De qué sostenimiento es la institución en la que los estudiantes


con frecuencia obtienen un bajo rendimiento académico?

¿Cómo está la educación bilingüe en relación a la hispana?

- 61 -
¿Qué género es el que mejor rendimiento reporta por años?

¿Cómo está el rendimiento académico de la modalidad


semipresencial, en relación a la presencial?

¿Cómo está el rendimiento académico de la institución jornada


nocturna, en relación a la diurna?

¿Cuál es la especialidad en la que los estudiantes se han graduado


con bajo rendimiento académico?

¿Cómo está el rendimiento académico de la zona rural en relación a


la urbana desde el año 2010 al 2014?

¿Cuáles fueron los mejores años del rendimiento?


Fuentes de Datos  Hojas de cálculos con datos desde el año 2010 al 2014.

Fuentes de  Analista de Atención Ciudadana. Lcdo, Luis Sánchez


Información Coloma.
 Directora Distrital: Espc. Charito Rea.
 Autoridades de las diferentes Instituciones Educativas.
Mecanismos de  Reportes a demanda, reportes institucionales.
Entrega  Cubo de análisis OLAP.
Información

Dimensiones  Fecha
Candidatas:  Institución Educativa
 Estudiante
 Titulo
 Ubicación Geográfica.
Indicadores  Nota final de grado.
Candidatos:

Tabla Nro. 09 Definición de Requerimientos.


Fuente: El Autor

3.6 Diseño Técnico de la Arquitectura.


Se determinó dos ambientes, los cuales se detallan a continuación:

3.6.1 Entorno Back Room.

Los datos fuente serán transportados al repositorio temporal STAGE, mediante


procesos ETL, con el apoyo de la herramienta Pentaho Data Integration (PDI) y
luego los datos serán cargados al Data Warehouse que será alojado en el sistema
de gestión de base de datos objeto-relacional PostgreSQL.9.3.

- 62 -
Gráfico. 26 Entorno Back Room
Fuente: El Autor

3.6.2 Entorno Front Room.

Una vez poblado el Data Warehouse, se podrá diseñar modelos metadatos


utilizando la herramienta Pentaho Metadata Editor y generar los reportes a
demanda utilizando WAQR del servidor de Pentaho; además se construirá el
Cubo de análisis OLAP, empleando la herramienta Schema Workbench, y los
informes del cubo serán visualizados con los Visores JPivot, Saiku Analytics y
Saiku Chart Plus; finalmente se diseñaran reportes institucionales con Pentaho
Report Designer.

Todos los análisis, informes y reportes serán visualizados a través del Portal de
entrega de información de Pentaho CE 5.2, por medio de un navegador de
internet.

Gráfico. 27. Entorno Front Room


Fuente: El Autor

- 63 -
Hibernat Quartz Jacckrabit
3.6.3 Arquitectura de flujo de datos con Pentaho. e

Metadatos

PENTAHO BI SERVER
Reportes a
M
Demanda
Base de Datos. PENTAHO E (Ad Hoc)
-Oracle
META T
-My SQL A
DATA D WQR Reportes
-Postgres
Metadatos EDITOR
A Simples
T
PDI_REPO O
(PME) S

PDI_REPO
PENTAHO
Archivos de
ETL REPORT
texto. ETL
Cvs DESIGNER (PDI) Reportes
Txt STAGE DWH Avanzados
PENTAHO
PENTAHO DATA INTEGRATION
SCHEMA
WORKBENCH
Cubos OLAP
(PSW)

Gráfico 28. Arquitectura de Flujo de datos con Pentaho.


Fuente: El Autor a partir de (Murillo M. , Data Warehousing Básico con Pentaho, 2013)

Como se puede observar en el gráfico. 28, para la construcción del Sistema de


Soporte a la toma de decisiones, se utilizará la arquitectura de flujo de datos de
Pentaho, donde se llevaran las fuentes al repositorio temporal llamado STAGE
mediante procesos ETL, posteriormente los datos serán extraídos, transformados
y cargados en el almacén de datos dimensional llamado Data WareHouse y a
partir de ahí podemos crear nuestras actividades analíticas como reportes a
demanda, análisis ad hoc y análisis OLAP, utilizando las diferentes herramientas
de Pentaho.

3.7 Selección e Instalación del Producto.

Se seleccionó la plataforma de “Pentaho CE. Versión 5.2”, motivo que es


totalmente Open Source, líder en Inteligencia Empresarial y contiene todas las
herramientas necesarias para llegar a construir una solución completa;
apoyándonos desde la obtención de los datos fuente, hasta el desarrollo de la
Aplicación para el usuario final.

-Pentaho BI Server CE 5.2, puede ser descargado desde la siguiente dirección:

- 64 -
http://sourceforge.net/projects/pentaho/files/Business%20Intelligence%20Server/

Nota: En la Etapa de Aplicación para el usuario final se explica el procedimiento


de configuración.

PRODUCTO CARACTERÍSTICA USO HARDWARE


PostgreSQL 9.3 Repositorio del Sistema de Gestión
Stage y el Data de Base de Datos.
Warehouse.
Pentaho BI Server Servidor Tomcat / Servidor Central de
5.2 Mondrián Pentaho.
Posee la consola de
usuario (PUC)
Pentaho Data Integración de Creación y
Integration (PDI) Datos. ejecución de
procesos ETL.
Pentaho Metada Metadatos. Crea modelo
Editor (PME) metadatos.
Pentaho Report Reporteador. Creación y
Designer (PRD) publicación de
reportes avanzados.
Pentaho Schema Diseñador de Cubos Creación y Windows 7 x64
Workbench (PSW) Multi publicación de 4 GB RAM
Dimensionales. esquemas. 500 GB Disco Duro
JPivot Visor de Cubos por Visualizar Cubo. Procesador Core i7
defecto.
WAQR Consulta basada en Generación de
web ad hoc y reportes a
Reportes. demanda.
Saiku Analytics. Explora fuente de Visor de Cubos
datos complejos. avanzado.
Data Cleaner Caracterización de Limpieza de Datos.
Datos
SQL Power Modelamiento de Modelamiento
Architect Datos. Dimensional. Windows 7 x 64
SQuirrel SQL Client. Cliente de Base de Acceso a consultas 4 GB RAM
Datos. al Data Warehouse. 500 GB Disco Duro
Notepad ++ Editor de Texto Editar etiquetas. Procesador Core i3

Tabla 10. Productos y herramientas de Instalación.


Fuente: El Autor

- 65 -
3.8 Modelamiento Dimensional.

Se utilizará la técnica de modelamiento dimensional tipo estrella para crear un


modelo optimizado de análisis de la información; este modelo permitirá que el
sistema tenga la capacidad de responder a las diversas preguntas planteadas en
la entrevista por la Directora Distrital de Educación. Además herramientas como
Mondrian no suele tener escenario para copo de nieve ni soporte, hay mucho más
soporte para el modelo en estrella.

3.8.1 Técnicas de Modelamiento.

3.8.1.1 Dimensiones.

Una Dimensión representa características, información de una institución.


(Ejemplo: Estudiantes, Institución Educativa, Título). Las dimensiones son
CUALITATIVAS.

3.8.1.2 Hechos.
Un hecho representa una medida para el análisis. (Ejemplo: Nota del Proyecto de
grado). Los hechos son CUANTITATIVOS.

3.9 Principios de Diseño.

a) Usar Claves Subrogas (SK).-Una clave subrogada es un identificador


único de tipo numérico que asigna a cada registro de una tabla de
dimensión; puede ser generada por una secuencia de la base de datos o
por la herramienta ETL.
b) Usar Convenciones de nombres y de tipos.

PREFIJO ALCANCE
STG_ Para tablas de almacenamiento temporal.
DIM_ Para tablas de dimensiones.
FACT_ Para tabla de hechos.

Tabla 11. Conversión de nombres para el modelado de datos.


Fuente: El Autor

- 66 -
c) Modelar una Dimensión para para la fecha utilizando el formato
AAAAMMDD
d) Tener un Registro (Desconocido) en cada Dimensión en vez de Null.

SK Cédula Nombre Fecha de Promoción.


0 Desconocido Angel Ramiro 07/04/2010

Tabla 12. Registro Nulo, DIM_ESTUDIANTE


Fuente: El Autor

3.10 Granularidad y Agregación.

Granularidad corresponde al nivel de detalle almacenado en el Data Warehouse;


almacenar los datos al nivel más bajo de detalle posible.

3.11 Funciones de Agregación SQL.

Las agregaciones mejoran el rendimiento. Las 5 funciones básicas de agregación


SQL son: Máximo: max () Mínimo: min (), Conteo: count (), Suma: sum (),
Promedio: avg ().

3.12 Técnicas SCD (Control de Cambios).


Permite identificar y guardar qué registros cambiaron.

3.12.1 Técnica Slowly Changing Dimensions.- Permite identificar y guardar


qué registros cambiaron. Existen los siguientes:

3.12.2 Slowly Changing Dimensions-Tipo 1.- Sobrescribe el registro. Soportada


por Pentaho Data Integration.
Situación Actual.

Sk Identificación Nombre Ciudad


1 0201780038 Angel Palacios Guaranda
Tabla 13. Slowly Changing Dimensions Tipo. 1-Situaión Actual.
Fuente: El Autor

- 67 -
Nueva Situación.

Sk Identificación Nombre Ciudad


1 0201780038 Angel Palacios Babahoyo

Tabla 14. Slowly Changing Dimensions Tipo 1-Nueva Situación.


Fuente: El Autor

3.12.2 Slowly Changing Dimensions -Tipo 2.- Agrega un registro a la dimensión


y 3 columnas: válido desde, válido hasta y versión.
Situación Actual.

Sk Identificación Nombre Ciudad Válido Válido Versión


Desde Hasta
1 0201780038 Angel Palacios Guaranda 2014-01-01 2099-12-31 1

Tabla 15. Slowly Changing Dimensions Tipo 2-Situación Actual.


Fuente: El Autor

Nueva Situación.

Sk Identificación Nombre Ciudad Válido Válido Versión


Desde Hasta
1 0201780038 Angel Guaranda 2014-01-01 2015-01-25 0
Palacios
2 0201780038 Angel Babahoyo 2015-01-25 2099-12-31 1
Palacios
Tabla 16. Slowly Changing Dimensions Tipo 2-Nueva Situación.
Fuente: El Autor

3.12.3 Slowly Changing Dimensions -Tipo 3.- Consiste en agregar una columna
por cada una que se quiera registrar el cambio.
Situación Actual.

Sk Identificación Nombre Ciudad Ciudad Antigua


1 0201780038 Angel Palacios Guaranda Guaranda
Tabla 17. Slowly Changing Dimensions Tipo 3-Situación Actual.
Fuente: El Autor

Nueva Situación.

Sk Identificación Nombre Ciudad Ciudad Antigua


1 0201780038 Angel Palacios Babahoyo Guaranda

Tabla 18. Slowly Changing Dimensions Tipo 3-Nueva Situación.


Fuente: El Autor

- 68 -
3.13 Diseño Físico del Data Warehouse.

Se utilizó SQL Power Architect para crear el modelamiento dimensional del Data
Warehouse. La herramienta lo podemos descargar desde el siguiente link:
http://www.sqlpower.ca/page/architect_download_os

Instalación.

Una vez descargado el archivo, ejecutar el script de instalación y seguir las


instrucciones en pantalla.

Configuración.

Copiar el Driver JDBC postgresql-9.3-1102.jdbc4.jar al directorio de instalación:


\SQL Power Architect\jdbc

Gráfico. 29. Modelo Dimensional del Data Warehouse Educación


Fuente: El Autor
El tipo de relación utilizado entre las Dimensiones y la tabla de hechos fue de uno
a varios.
- 69 -
3.13.1 Diccionario de Datos del Data Warehouse.
Detalle de la Dimensión Fecha.

Tabla DIM_FECHA

Tipo de Tabla Dimensional

Descripción Tabla que contiene el detalle de la fecha.

Esquema Data Warehouse

Campo Descripción Tipo de Dato Tamaño Clave

SK_FECHA Clave Subrogada de la INTEGER - PK


dimensión fecha.

ANIO Año INTEGER - -

MES Mes INTEGER - -

NOMBRE_MES Nombre del Mes VARCHAR 36 -

Tabla 19. Detalle Dimensión Fecha.


Fuente: El Autor

Detalle de la Dimensión Título.

Tabla DIM_TITULO

Tipo de Tabla Dimensional

Descripción Tabla que contiene el detalle del título.

Esquema Data Warehouse

Campo Descripción Tipo de Dato Tamaño Clave

SK_TITULO Clave Subrogada de la INTEGER - PK


dimensión título.

PK_TITULO Clave primaria de la VARCHAR 8 -


dimensión título.

TITULO Nombre del título VARCHAR 36 -

TIPO_TITULO Nombre del tipo de VARCHAR 36 -


título

ESPECIALIZACION Nombre de la VARCHAR 36 -


especialización

VALIDO_DESDE Control de Cambios DATE - -

VALIDO_HASTA Control de Cambios DATE - -

- 70 -
VERSION Control de Cambios INTEGER - -

Tabla 20. Detalle Dimensión Título


Fuente: El Autor

Detalle de la Dimensión Estudiante.

Tabla DIM_ESTUDIANTE

Tipo de Tabla Dimensional

Descripción Tabla que contiene el detalle de los estudiantes.

Esquema Data Warehouse.

Campo Descripción Tipo de Dato Tamaño Clave

SK_ESTUDIANTE Clave Subrogada de la INTEGER - PK


dimensión estudiante.

PK_CEDULA Clave primaria de la VARCHAR 13 -


dimensión

NOMBRES Nombres y Apellidos de VARCHAR 128 -


los Estudiantes.

SEXO Nombre del sexo de los VARCHAR 16 -


estudiantes.

VALIDO_DESDE Control de Cambios DATE - -

VALIDO_HASTA Control de Cambios DATE - -

VERSION Control de Cambios INTEGER - -

Tabla 21. Detalle Dimensión Estudiante


Fuente: El Autor

Detalle de la Dimensión Ubicación Geográfica.

Tabla DIM_UBICACION_GEOGRAFICA

Tipo de Tabla Dimensional

Descripción Tabla que contiene el detalle de la ubicación geográfica.

Esquema Data Warehouse

Campo Descripción Tipo de Tamaño Clave


Dato

- 71 -
SK_UBICACION_ Clave Subrogada de la INTEGER - PK
GEOGRAFICA dimensión ubicación geográfica..

PK_UBICACION_ Clave primaria de la dimensión VARCHAR 8 -


GEOGRAFICA ubicación geográfica.

PROVINCIA Nombre de la Provincia VARCHAR 40 -

PARROQUIA Nombre de la Parroquia VARCHAR 40 -

CANTON Nombre del cantón. VARCHAR 40 -

ZONA_INEC Nombre de la zona INEC. VARCHAR 12 -

VALIDO_DESDE Control de Cambios DATE - -

VALIDO_HASTA Control de Cambios DATE - -

VERSION Control de Cambios INTEGER - -

Tabla 22. Detalle Dimensión Ubicación Geográfica


Fuente: El Autor

Detalle de la Dimensión Institución Educativa.

Tabla DIM_INSTITUCION_EDUCATIVA

Tipo de Tabla Dimensional

Descripción Tabla que contiene el detalle de la Institución Educativa.

Esquema Data Warehouse.

Campo Descripción Tipo de Tamaño Clave


Dato

SK_INSTITUCION Clave Subrogada de la INTEGER - PK


EDUCATIVA dimensión Institución Educativa.

PK_INSTITUCION Clave Primaria de la dimensión VARCHAR 16 -


_EDUCATIVA Institución Educativa.

DISTRITO Código del Distrito INTEGER 16 -

CIRCUITO Código del Circuito VARCHAR 20 -

INSTITUCION Nombre de la Institución VARCHAR 100 -


Educativa.

SOSTENIMIENTO Nombre del Sostenimiento VARCHAR 20 -

JURISDICCION Nombre de la Jurisdicción VARCHAR 20 -

MODALIDAD Nombre de la Modalidad VARCHAR 20 -

REGIMEN Nombre del Régimen VARCHAR 20 -

- 72 -
JORNADA Nombre de la Jornada VARCHAR 20 -

VALIDO_DESDE Control de Cambios DATE - -

VALIDO_HASTA Control de Cambios DATE - -

VERSION Control de Cambios INTEGER - -

Tabla 23. Detalle Dimensión Institución Educativa


Fuente: El Autor

Detalle de la Tabla de hechos FACT_RENDIMIENTO_ACADEMICO.

Tabla FACT_RENDIMIENTO_ACADEMICO.

Tipo de Tabla Dimensional

Descripción Tabla que contiene los Datos del Rendimiento Académico.

Esquema Data Warehouse.

Campo Descripción Tipo de Tamaño Clave


Dato

SK_FECHA Clave Subrogada de la INTEGER - FK


dimensión fecha.

SK_TITULO Clave Subrogada de la INTEGER - FK


dimensión título.

SK_ESTUDIANTE Clave Subrogada de la INTEGER - FK


dimensión estudiante.

SK_INSTITUCION Clave Subrogada de la INTEGER - FK


dimensión institución educativa.

SK_UBICACION Clave Subrogada de la INTEGER - FK


dimensión ubicación geográfica.

PROMEDIO_EDU_ Contiene el Promedio de NUMERIC 6,2 -


BASICA Educación básica

PROMEDIO_BAC Contiene el Promedio de NUMERIC 6,2 -


HILLERATO Educación bachillerato.

NOTA_PROYECT Contiene la nota del Proyecto de NUMERIC 6,2 -


O_GRADO Grado.

PROMEDIO_EXA Contiene el Promedio de NUMERIC 6,2 -


MEN_GRADO Exámenes de Grado.

Tabla 24. Detalle Tabla de Hechos.


Fuente: El Autor

- 73 -
3.14 Herramienta Auxiliar para limpieza de datos fuente.

Se utilizó la herramienta Data Cleaner para descubrir y analizar la calidad de los


datos fuentes, creando nuestras propias reglas de limpieza y componiéndolas en
en varios escenarios de uso o bases de datos destino. Data Cleaner lo podemos
descargar desde la siguiente dirección web:

http://sourceforge.net/projects/datacleaner/files/datacleaner%20%28stable%29/

Gráfico. 30. Data Cleaner


Fuente: El Autor
El procedimiento de limpieza de datos consta en el: Anexo # 06

3.15 Diseño y Desarrollo de ETLs con Pentaho Data Integration.


Descargar Pentaho Data Integration desde la siguiente dirección web.

http://sourceforge.net/projects/pentaho/files/Data%20Integration/

3.15.1 Instalación de PDI.

 Extraer el archivo: pdi-ce-5.2.0.0-209.zip dentro del directorio llamado


“pentaho”, previamente creado para la instalación de bi-server.
 Copiar el Driver: postgresql-9.3-1102.jdbc4.jar a la ruta: \data-integration\lib

- 74 -
3.15.2 Configuración del Repositorio.

Requisitos

 Crear en PostgreSQL 9.3 el repositorio de datos llamado stage, colocando


como propietario al usuario postgres.

3.15.3 Ejecutar Pentaho Data Integration (PDI)

Identificar y ejecutar el archivo spoon.bat dentro del directorio previamente


extraído el data-integration.

Nos mostrara la pantalla donde debemos establecer la conexión al repositorio de


datos. Ver Anexo # 07

Una vez establecida la conexión al repositorio de datos se mostrará el ambiente


gráfico de spoon, donde se crearan las Transformaciones y JOBS, que contienen
los flujos de datos para transportar los datos fuente al modelo dimensional.

Conexión al repositorio
stage

Gráfico. 31. Ambiente Gráfico de Spoon.


Fuente: El Autor

3.15.4 Principales componentes de Pentaho Data Integration.

3.15.4.1 Transformaciones.-Consiste en una colección de Steeps, cada Steep


indica una operación de proceso ETL y la salida de un Steep genera un conjunto
de registros.

- 75 -
3.15.4.2 Trabajos (Jobs).-Consiste en una colección de transformaciones o
Steps de trabajos, cada steep del trabajo indica una tarea del proceso ETL y la
salida de un Steep de trabajo produce un Status de ejecución.

3.15.5 Características de las Transformaciones y JOBs.

Definen el flujo del proceso ETL, contiene los metadatos del proceso ETL:
Descripción de los datos, fuentes de entrada y salida, Planificador.

3.15.6 Procesos ETL.

Son las actividades de Extracción, Transformación y Carga de datos en un Data


Data Warehouse o Data Mart.

3.15.6.1 ETL- Migrar datos fuente, al repositorio temporal Stage.

1.-Crear una nueva transformación, haciendo clic derecho sobre la carpeta


transformations y eligiendo la opción New.

En el caso de nuestro proyecto disponemos la fuente en hojas de cálculo por lo


que utilizaremos el Steep Microsoft Excel Input, para que lea los datos.

2.-Identificar el Steep Microsoft Excel Input en el directorio input y arrastrar al


área de trabajo de Spoon.

Configurar la Fuente de entrada de datos.

Dar doble clic en Microsoft Excel Input para ver las propiedades del Steep y
configurar la conexión a la fuente de datos.

Iniciamos digitando un nombre para nuestro Steep el cual lo llamaremos


Rendimiento Académico, configuramos el tipo de formato de Excel, elegimos
Excel 2007 XLSX (Apache POI), luego hacemos clic en el botón browse, para

- 76 -
examinar la ubicación de nuestra fuente de datos, posteriormente damos clic en el
botón Add. Quedando de la siguiente manera:

Gráfico. 32. Propiedades del Steep Microsoft Excel Input


Fuente: El Autor
Nota: La fuente de datos debe estar guardado en tipo de formato: Libro de Excel
97-2003 (*.xls)

Luego nos cambiamos en la misma ventana de las propiedades del Steep a la


pestaña ¡Sheets (Hojas) y damos clic en el botón Get sheetname(s), donde
agregaremos nuestra hoja de cálculo que contiene nuestra fuente de datos, en el
campo Star Row digitamos 0 y en Start column 0 finalmente damos clic en OK.

Gráfico. 33. Agregando la hoja de la fuente de datos.


Fuente: El Autor

- 77 -
Posterior a esto nos dirigimos a la pestaña !Fields y damos clic en el botón Get
fields from header row y nos mostrara todos los campos con el tipo dato asociado
de la fuente de datos.

Gráfico. 34. Campos de la fuente de datos.


Fuente: El Autor
Finalmente hacemos clic en Preview Rows y nos mostrara la vista previa de
nuestra fuente de datos.

Gráfico. 35. Vista Previa de los datos.


Fuente: El Autor
3.-En el directorio transform identificar y arrastrar al área de trabajo de Spoon el
Steep Select Values.

4.- Hacer el pase desde el Steep nombrado Rendimiento Académico hasta el


Steep Select Values, presionando la tecla Shift + clic izquierdo guiar el puntero del
Steep Rendimiento Académico al Steep Select Values quedando de la siguiente
manera.

Gráfico. 36. Pase de Steep.


Fuente: El Autor

- 78 -
Propiedades del Steep Select Values.

Dar doble clic en el Steep Select Values, donde podemos visualizar si los campos
de la fuente de datos son amigables es decir (Que no contengan caracteres
especiales, ni sean demasiado extensos); caso contrario en estas propiedades lo
podemos renombrar

Gráfico. 37. Propiedades del Steep Select Values (renombrar campos).


Fuente: El Autor

Configurar la fuente de salida.

5.-En el árbol de carpeta Output identificar y arrastrar al área de trabajo el Steep


Table Output.

Propiedades de Table output.

Dar doble clic sobre el Steep, para acceder a las propiedades,


donde le damos el nombre al Steep, configuramos la conexión
al repositorio de datos, donde obligatoriamente debemos
elegir, el Servidor de Base de datos en nuestro caso
PostgreSQL e

Ingresamos los datos para la conexión: Nombre de la conexión del repositorio


de datos, nombre del host, nombre del repositorio de datos destino, usuario y
contraseña de postgres, damos clic en el botón test, para verificar que nuestra
conexión sea exitosa.

- 79 -
Gráfico. 38. Configuración de la conexión al repositorio de datos stage.
Fuente: El Autor

El paso siguiente es dar un nombre a la tabla que va almacenar los datos en


nuestro caso stg_matriz_excel y ejecutamos el SQL y Execute. Con estos pasos
tendremos creada la tabla stg_matriz_excel en la base de datos stage alojada en
postgreSQL.

Gráfico. 39. Creación de la tabla stg_matriz_excel.


Fuente: El Autor

- 80 -
Gráfico. 40. Proceso de Creación de la tabla stg_matriz_excel.
Fuente: El Autor

Verificamos en la base de datos stage alojada en PostgreSQL la creación de la


tabla stg_matriz_excel y sus respectivos campos.

Gráfico. 41. Verificación de las columnas creadas en el stage.


Fuente: El Autor

Ejecutar Vista previa de la TRANSFORMACION 1

Dar clic en el icono Preview this transformation.

- 81 -
Gráfico. 42. Vista Previa de la Transformación.
Fuente: El Autor
Ejecución de la Transformación.

Dar clic en el botón Ejecutar que muestra la imagen encerrado en un círculo rojo
y posteriormente dar clic en el botón Launch.

Gráfico. 43. Ejecución de la Transformación Paso 1.


Fuente: El Autor

Gráfico. 44. Ejecución de la Transformación Paso 2.


Fuente: El Autor

- 82 -
Con esta transformación cargamos los datos fuente al repositorio temporal stage;
cuando nos visualiza los vistos de color verde sobre los steeps, nos indica que
todo está correctamente configurado, caso contrario tendremos que revisar la
sección de Logging para identificar el error.

3.15.6.2 ETL-Carga Dimensión Fecha.- Es el flujo de datos que genera y carga


las fechas para el Data Warehouse.

Gráfico. 45. ETL Carga Dimensión Fecha.


Fuente: El Autor

Para crear la transformación ETL Carga Dimensión Fecha se utilizó varios steeps:

Se utilizó el Steep Generate Rows, para generar 120 filas que


abarcaran la fecha mínima 01/01/2010 y la máxima 31/12/2020.

Se utilizó el Steep Add sequence, para agregar un valor de inicio


específico y un incremento.

Se utilizó el Steep Calculator para hacer la conversión de la fecha


de Date a String y de String a Integer.

Se utilizó el Steep Value Mapper para convertir el valor fuente al


valor objetivo. (Ej. 1= Enero, 2= Febrero….12= Diciembre)

Se utilizó el Steep Table output para cargar la dimensión fecha a las


tablas dimensionales del Data Warehouse, donde iniciamos dando
un nombre al Steep, configuramos la conexión al data warehouse.

- 83 -
3.15.6.3 ETL-Carga Dimensión Estudiante.-Es el flujo de datos que transporta
los datos fuente almacenados en el repositorio temporal stage al Data
Warehouse.

Gráfico. 46. ETL de Carga Dimensión Estudiante.


Fuente: El Autor

Para crear la transformación ETL Carga Dimensión Estudiante se utilizaron varios


steeps:

Se utilizó el Steep Table input para SELECT DISTINCT


establecer la conexión al repositorio sexo
stage y leer los datos mediante una , apellidos_nombres
consulta SQL, preparada en Squirrel. , cedula
FROM
stg_matriz_excel

Se utilizó el Steep Value Mapper para convertir el valor fuente al


Valor objetivo. (Ej 1=Hombre 2=Mujer)

Se utilizó el Steep If field value is null, para el caso de los registros


sin cedula sustituir por el valor de 0.

Se utilizó el Steep Dimension lookup/update, para cargar los datos


del repositorio stage a las tablas dimensionales del Data
Warehouse, aquí damos el nombre al Steep, seleccionamos la
conexión al dwh_edu, seleccionamos la Dimensión, la clave primaria
(PK), los campos de la dimensión, la clave subrogada (SK) el valido
desde, válido hasta y versión.

- 84 -
3.15.6.4 ETL- Carga Dimensión Titulo.- Es el flujo de datos que transporta los datos
fuente de la base de datos temporal stage al Data Warehouse.

Gráfico. 47. ETL Carga Dimensión Título.


Fuente: El Autor

3.15.6.5 ETL-Carga Dimensión Institución Educativa.- Es el flujo de datos que


transporta los datos fuente de la base de datos temporal stage al Data
Warehouse.

Gráfico. 48. ETL Carga Dimensión Institución Educativa.


Fuente: El Autor

3.15.6.6 ETL-Carga Dimensión Ubicación Geográfica.-Es el flujo de datos que


transporta los datos fuente de la base de datos temporal stage al Data
Warehouse.

Gráfico. 49. ETL Carga Dimensión Ubicación Geográfica.


Fuente: El Autor

- 85 -
3.15.6.7 ETL-Carga Tabla de Hechos.- Es el flujo de datos que obtiene las
claves subrogadas de cada Dimensión, para insertarlas en el Data Warehouse.

Gráfico. 50. ETL Carga Tabla de Hechos.


Fuente: El Autor

Para crear la Transformación ETL Carga Tabla de Hechos, se utilizó varios


steeps:

Se utilizó el Steep Table input para establecer la conexión al


repositorio stage y leer los datos mediante una consulta SQL,
preparada en Squirrel.

select to_number(to_char(fecha_grado, 'yyyyMM'),'999999') as


sk_fecha,
coalesce(cedula,'0') as cedula, apellidos_nombres,
parroquia,
cood_amie,
titulo, especializacion,
prom_edu_basica, prom_bachillerato, prom_exa_grado,
nota_monografia from stg_matriz_excel;

Se utilizó el Steep Dimension lookup/update, para obtener las


claves subrogadas de las dimensiones.

Se utilizó el Steep Insert/Update, para cargar los datos del


repositorio stage a la tabla de hechos del Data Warehouse, aquí
seleccionamos todas las claves subrogadas de las dimensiones.

- 86 -
Gráfico. 51. Propiedades del Steep Insert Update.
Fuente: El Autor

3.15.7 Carga de JOBS.-Una vez construidos los flujos de carga de datos


necesitamos crear JOBs (trabajos), para Ejecutar las transformaciones, donde el
resultado contendrá todo tipo de resultados relacionados con la ejecución,
incluyendo número de errores, archivos analizados, entre otros.

3.15.7.1 JOB-Carga de datos fuente (Excel) al repositorio temporal Stage.


En Pentaho Data Integration hacer clic derecho sobre el directorio Jobs y elegir
la opción New.

Gráfico. 52. JOB Carga stage


Fuente: El Autor

Para crear el Job Carga STAGE se utilizaron los steeps:

Se utilizó el Steep Start, para ejecutar el JOB.

- 87 -
Se utilizó el Steep Transformation para referenciar a la transformación
que contiene la carga de la fuente de datos Excel al repositorio
temporal Stage.

Gráfico. 53. Referenciar a las transformaciones.


Fuente: El Autor

Finalmente se utilizó el Steep Success para finalizar el JOB.

3.15.7.2 JOB- Carga Dimensiones.


Este Job contiene las transformaciones de cada Dimensión, fue construido con los
Steeps explicados en el JOB Carga Stage.

Gráfico. 54. JOB Carga Dimensiones


Fuente: El Autor

3.15.7.3 JOB. Carga Data Warehouse.


El JOB Carga Data Warehouse (Job Maestro) contiene los sub Jobs: Carga
Stage, Carga Dimensiones y carga tabla de hechos, que poblaran al Data
Warehouse.

- 88 -
Gráfico. 55. JOB Carga Data Warehouse
Fuente: El Autor

Para crear el Job Maestro se utilizó varios steeps:

Se utilizó el Steep Start, para ejecutar el Job Maestro.

Se utilizó el Steep Job para referenciar a los Jobs que conforman el


Data Warehouse.

Gráfico. 56. Referencia a los JOBS


Fuente: El Autor

Se Utilizó el Steep Transformation para referenciar a la tabla de


hechos.

Con las transformaciones y Jobs contenedoras de los flujos de datos ya tenemos


poblado el Data Warehouse y podemos empezar a crear nuestro modelo
metadatos, construir el Cubo de análisis OLAP y diseñar los reportes
institucionales, utilizando como fuente de datos al Data Warehouse.

- 89 -
3.16 Crear un Modelo Metadatos, con Pentaho Metadata Editor (PME).

Un modelo metadatos lo podemos construir utilizando la herramienta Pentaho


Metadata Editor (PME), en el cual creamos un modelo derivado del Data
Warehouse con definiciones orientadas al análisis, usando campos calculados y
formateados, que servirán para generar reportes a Demanda utilizando la
herramienta WAQR por los usuarios finales.

3.16.1 Instalación y Configuración de PME.

La herramienta lo podemos descargar desde la siguiente web:

http://sourceforge.net/projects/pentaho/files/Pentaho%20Metadata/

 Una vez descargado PME lo extraemos dentro del directorio “pentaho”,


previamente creado.
 Ir al directorio metadata-editor y copiar el driver postgresql-9.3-1102-
jdbc4.jar al subdirectorio llamado lib.
 Identificar y Ejecutar metadata-editor.bat.

Gráfico. 57. Interfaz de Pentaho Metadata editor y configuración de conexión del DWH.
Fuente: El Autor
3.16.2 Pasos para construir un modelo metadatos.

Definir la localización de Español Ecuador, configurar la conexión al Data


Warehouse, importar las tablas con las que se desee crear el modelo.

-A nivel de Capa Física.- Se realizó la configuración de la conexión al DWH, se


ocultó claves subrogadas y primarias, campos de versión, valido desde, hasta,
marcando la propiedad Hidden for the user.

- 90 -
-A nivel de Capa Lógica Se dio formato a los campos numéricos usando la
propiedad Mask for number or Date utilizando el valor (#.00), además se creó el
campo calculado definiendo la formula [promedio_edu_basica] +
[promedio_bachillerato] + [nota_proyecto_grado] + [promedio_examen_grado],
marcar la propiedad is the Formula Exact y definir la propiedad Default
Aggregation.

-A nivel de Capa de Presentación.- Se marca las tablas que se quiere mostrar al


usuario final y establecer el orden de las mismas.

Gráfico. 58. Modelo Metadata Editor.


Fuente: El Autor

Finalmente utilizar Query Editor para verificar que el modelo este correcto y
publicar el modelo de metadatos a bi server.

3.16.3 Publicar un Modelo Metadatos a Bi Server.

Gráfico. 59. Publicación del Modelo Metadata Editor.


Fuente: El Autor
En la sección de Aplicación del Usuario final explico el procedimiento para
Visualizar un Modelo Metadatos.

- 91 -
3.17 Construcción del Cubo de análisis OLAP, con Pentaho Schema
Workbench.
El Cubo de análisis OLAP, lo construiremos utilizando Pentaho Schema
Workbench.

3.17.1 Instalación y Configuración.

Descargar Pentaho Schema Workbench desde la siguiente dirección web.

http://sourceforge.net/projects/pentaho/files/Data%

 Extraer el archivo: psw-ce-3.8.0.0-209.zip dentro del directorio llamado


“pentaho”
 Copiar el Driver jdbc: postgresql-9.3-1102.jdbc4.jar a la ruta: schema-
workbench\drivers
 Identificar y Ejecutar el Archivo workbench.bat

Gráfico. 60. Interfaz de Schema Workbench


Fuente: El Autor
Configuración de la conexión al dwh_edu. Ver Anexo # 08.

3.17.2 Nuevo Esquema (Un esquema es un contenedor de cubos que tendrá un


único archivo XML) Aquí definimos las propiedades del esquema como: el nombre
(Sin emplear caracteres especiales), la descripción, un nombre para agrupar las
medidas y un rol por defecto para utilizar la conexión a la Base de Datos.

Pasos:
File/New/Schema.

- 92 -
Gráfico. 61. Crear Nuevo Schema
Fuente: El Autor

3.17.3 Agregar un Cubo al Esquema. El cubo contendrá la tabla de hechos, las


dimensiones, medidas y campos calculados. Dar clic derecho sobre el Schema y
elegir Add cube; definir el nombre del cubo sin emplear caracteres especiales; en
la etiqueta caption podemos dar el nombre tal como va a mostrarse al usuario.

Gráfico. 62. Agregar un Cubo al Esquema.


Fuente: El Autor

En la parte inferior centro de Schema Workbench, muestra el texto de ayuda de


color rojo, que nos va guiando durante la construcción del Cubo.

(Establecer el nombre del hecho)

Gráfico. 63. Texto de Ayuda en la construcción del Cubo.


Fuente: El Autor

3.17.4 Agregar la Tabla de Hechos.-Dar Clic derecho sobre el cubo y elegir Add
Table, luego en la etiqueta name seleccionar la tabla de hechos del modelo
dimensional. (fact_rendimiento_academico)

- 93 -
Gráfico. 64. Agregar Tabla de Hechos.
Fuente: El Autor

Hacer clic en el botón de Modo de Edición para visualizar el Script que va


generándose, a medida que se va construyendo el Cubo.

Script del Cubo

Gráfico. 65. Lenguaje MDX.


Fuente: El Autor

3.17.5 Agregar Dimensiones.

Iniciaremos explicando el procedimiento para agregar la Dimensión Fecha, el


resto de dimensiones se construyen de la misma forma.

Pasos.-Dar Clic Derecho sobre el Cubo y elegir Add Dimension, en la etiqueta


name dar el nombre de la Dimensión sin caracteres especiales y en caption
escribir el nombre de la Dimensión como va a mostrar al usuario, en foreignKey
seleccionar la clave subrogada (Sk) de la Dimensión, el Type (Tipo) es
TimeDimension, únicamente la dimensión fecha, para el resto de dimensiones es
StandardDimension.

- 94 -
Gráfico. 66. Agregar la Dimensión Fecha.
Fuente: El Autor

Al momento de agregar Dimensiones, se crea automáticamente el Nivel Todos


New Hierarchy 0 (La jerarquía), al que lo llamaremos Default a través de la
etiqueta name, en allMemberName, alMemberCaption, digitamos Todas Las
Fechas, y en la etiqueta caption escribimos el nombre de la dimensión como se
va a mostrar al usuario, en PrimaryKey, seleccionamos la clave subrogada (Sk)
de la Dimensión Fecha.

El Nivel Todos se caracteriza por tener la etiqueta hasAll, en la que se debe


marcar con un visto, como se muestra en la imagen a continuación:

Gráfico. 67. Jerarquía Nivel Todos.


Fuente: El Autor

Luego se debe agregar la tabla dimensional contenedora de los campos que


conformaran los Sub Niveles de la Jerarquía, para ello, hacer clic derecho sobre
el Nivel Todos (Default) y seleccionar Add Table, en la etiqueta Schema
seleccionar public y en la etiqueta name seleccionar la dimensión fecha.
(dim_fecha)

- 95 -
Gráfico. 68. Agregar la tabla de la Dimensión Fecha, del modelamiento dimensional.
Fuente: El Autor

Para la construcción de las Dimensiones restantes como: (Ubicación Geográfica,


Institución Educativa y Titulo), se siguió el mismo procedimiento de Agregación de
la Dimensión Fecha, lo que hay que cambiar es la etiqueta type a
StandardDimension y el LevelType a Regular.

Dimensión Estudiante.

Gráfico. 69. Dimensión Estudiante.


Fuente: El Autor

- 96 -
Dimensión Ubicación Geográfica.

Gráfico. 70. Dimensión Ubicación Geográfica.


Fuente: El Autor
Dimensión Institución Educativa.

Gráfico. 71. Dimensión Institución Educativa.


Fuente: El Autor
Dimensión Título.

Gráfico. 72. Dimensión Título.


Fuente: El Autor

- 97 -
3.17.6 Agregar Sub Niveles.- Consta el orden de la Jerarquía de mayor a menor.

Agregar Sub Nivel Año.- Dar clic derecho sobre (Default) y seleccionar Add
Level, en la etiqueta name digitar anio sin caracteres especiales como consta en
el modelo dimensional y en la etiqueta caption escribir Año, como va a visualizar
el usuario; en la etiqueta column seleccionar el campo anio del modelo
dimensional, en Type, seleccionar String, en levelType marcar sobre TimeYears
y en hideMemberlf, dejar en Never.

Gráfico. 73. Agregar el nivel de jerarquía Año.


Fuente: El Autor
Agregar Sub Nivel Mes.-Lo que hay que cambiar es en levelType seleccionar
TimeMonths.

Gráfico. 74. Agregar el nivel de jerarquía Mes.


Fuente: El Autor
Con estos pasos ya hemos agregado la primera Dimensión llamada (Fecha), con
tres sub niveles jerárquicos: Todos,anio y mes.

- 98 -
Schema Workbench posee de un texto de ayuda que guía la construcción de los
cubos Olap, en el caso de nuestro proyecto en el texto de ayuda nos indica que el
Cubo debe contener al menos una medida.

Gráfico. 75. Texto Guía en la construcción del Cubo.


Fuente: El Autor

3.17.7 Agregar Medidas.-Dar clic derecho sobre el Cubo y marcar Add Measure;
en la etiqueta name digitar el nombre sin caracteres especiales, en la etiqueta
caption escribir el nombre de la medida como va a mostrar al usuario, en column
seleccionar la medida de la tabla de hechos del modelo dimensional y la función
de agregación (aggregator) seleccionar avg, que significa (Promedio)

Gráfico. 76. Agregar una Medida


Fuente: El Autor

Una Vez agregada la medida debemos asegurarnos que no presente errores el


Cubo, por lo que verificamos dando clic en la opción MDX Query.

- 99 -
Gráfico. 77. Verificación del Cubo con MDX Query.
Fuente: El Autor
Medida Promedio Bachillerato.

Gráfico. 78. Medida Promedio Bachillerato.


Fuente: El Autor
Medida Promedio Educación Básica.

Gráfico. 79. Medida Promedio Educación Básica.


Fuente: El Autor

- 100 -
Medida Promedio Exámenes de Grado.

Gráfico. 80. Medida Promedio Exámenes de Grado.


Fuente: El Autor

3.17.8 Agregar Campos Calculados.


Los campos calculados se utilizan para realizar operaciones con valores de otros
campos o medidas, en el proyecto utilizamos para obtener la nota final de grado.

Procedimiento.- Dar Clic derecho sobre el Cubo y elegir Add Calculated


Member, en la etiqueta name digitar el nombre sin caracteres especiales, en
caption escribir el nombre a mostrar al usuario, en Dimensions elegir Measures,
y en la etiqueta formula escribir [Measures].[NombreMedida1]+
[Measures].[NombreMedida2]+ [Measures].[NombreMedidaN]

Gráfico. 81. Agregar Campo Calculado Nota Final.


Fuente: El Autor
Nota: Ejecutar el MDX Query para verificar la construcción correcta del Cubo y
finalmente publicar a bi-server.

- 101 -
3.17.9 Publicar un Cubo OLAP
Pasos.-Dar clic en File, después en Publish, digitar el nombre de usuario y
contraseña de Pentaho. Además escribir el nombre del Data Warehouse con el
que está configurado bi-server y solo por primera vez marcar la casilla Register
XMLA Data Source, las futuras publicaciones ya no se marcara la casilla.

Gráfico. 82. Publicar Cubo.


Fuente: El Autor
Nota: Para publicar un Cubo OLAP, debe permanecer seleccionado el esquema
de Mondrián y estar levantado bi-server.

3.17.10 Volver a publicar un Cubo


En el caso que haya que corregir algo en el Cubo, tendremos que volver a
publicar, para ello seguir los pasos indicados en la publicación del cubo; lo que
hay que desmarcar es el casillero Register XMLA Data Source y sobre escribir el
cubo previamente publicado. Finalmente refrescar nuestro navegador de internet.

Gráfico 83.- Mensaje de Sobre escribir el Cubo.


Fuente: El Autor

3.18 Especificación de Aplicaciones para Usuarios Finales.

La Directora Distrital de Educación, podrá acceder al portal de entrega de


información de Pentaho 5.2, a través de un navegador de internet y un usuario
con el Rol de Admistrador, para que tenga acceso a Administrar la seguridad,
leer contenido, publicar contenido, gestionar fuentes de datos, ejecutar y crear
contenido.
- 102 -
Pentaho será configurado en PostgreSQL 9.3, con una interfaz en español, podrá
visualizar la información del Cubo OLAP, a través de los visores (JPivot y Saiku
Analytics); también podrá crear reportes a demanda utilizando la herramienta
WAQR y generar reportes institucionales, para consumir la información
proporcionada por el Data Warehouse y responder a las preguntas planteadas en
un inicio del Proyecto. Esto representa el Front End de Pentaho Analysis
Services.

3.19 Aplicación para el Usuario final.

Una vez descargado el archivo biserver-ce-5.2.0.0-209, crear un directorio


llamado Pentaho en la raíz del disco local del computador. (Ejemplo: C:\pentaho)
y extraer ahí los archivos de biserver-ce.

3.19.1 Instalación y Configuración de BI-Server.

Antes de iniciar Pentaho bi-server, debemos realizar la Instalación de JDK. 7 y


configurar las variables de entorno.

3.19.1.1 Instalar JDK.

 Descargar el instalador JDK versión SE 7 update 71 desde la siguiente


dirección web:http://www.oracle.com/technetwork/java/javase/downloads/jdk7-
downloads-1880260.html
 Seguir todos los pasos del asistente e instalar el Java Runtime Enviroment
(JRE)
 Al Finalizar todos los archivos de instalación se crearan en el directorio:
C:\Program Files\Java\jdk1.7.0_71

Nota: Para prevenir futuros inconvenientes se recomienda desactivar las


Actualizaciones automáticas de Java.

- 103 -
Gráfico 84. Desactivar las Actualizaciones Automáticas de JAVA.
Fuente.- El Autor.

3.19.1.2 Configurar las Variables de Entorno.

Para el correcto funcionamiento de las aplicaciones de software libre que se


trabaje, es necesario configurar las variables de entorno JAVA_HOME y Path.

-Configurar la Variable JAVA_HOME

Ir a Inicio/ Equipo/Propiedades/cambiar la configuración/Opciones avanzadas,


Variables de Entorno/ Nueva: digitar: JAVA_HOME y en el campo valor de la
variable copiar la ruta de instalación de java (jdk): C:\Program
Files\Java\jdk1.7.0_45, quedando le la siguiente manera:

Gráfico 85.- Configuración de la variable JAVA_HOME.


Fuente.- El Autor.

-Configurar la Variable PATH.


Repetir el procedimiento de la variable JAVA_HOME hasta variables de entorno.
Buscar la variable Path, elegir Editar y en el campo valor de la variable escribir al
inicio de la ruta: %JAVA_HOME%\bin;

- 104 -
Gráfico 86.- Configuración de la variable Path.
Fuente.- El Autor.
Para verificar que la instalación y configuración se realizó exitosamente, abrir una
consola de comando y ejecutar el comando java –version

3.19.1.3 Iniciar el servidor Tomcat.

a) Identificar y ejecutar el archivo start-pentaho.bat en el directorio


pentaho/biserver- ce.

Nos mostrara los miles segundos una vez que esté listo el ServidorTomcat

Gráfico 87.- Muestra los mile segundos.


Fuente.- El Autor.

b) Abrir un Navegador de Internet y digitar localhost:8080.

Gráfico 88.- Acceder a la consola de usuario de Pentaho.


Fuente.- El Autor.

Pentaho utiliza el puerto 8080

Nos mostrara la Consola de Usuario de Pentaho (PUC).

- 105 -
Gráfico 89.- Consola de Usuario de Pentaho.
Fuente: El Autor

c) Por primera vez accedemos con el usuario y contraseña de prueba.

User Name: Admin

Password: password

Tenemos el portal de entrega de información al usuario, donde se puede explorar


los archivos, crear nuevos análisis, reportes, gestionar la conexión a la fuente de
datos y acceder a documentación en línea sobre pentaho.

Gráfico 90.- Perspectivas y Portal de Entrega de información.


Fuente: El Autor
La perspectiva destacada es Marketplace, motivo que permite a los usuarios
probar los plugins que son más relevantes.

- 106 -
Pentaho BI Server 5.2 viene con la Base de Datos HSQLDB, no recomendable
para ambientes de producción, por lo que nuestra solución la instalaremos en un
motor de base datos más robustos como es PostgreSQL 9.3.

3.19.1.4 Configuración de Pentaho BI-Server CE 5.2, en PostgreSQL 9.3.

Prerrequisitos:

 Tener Instalado y Configurado (JDK) versión 7, acorde a la Arquitectura del


Sistema Operativo x86-64.
 Tener instalado el motor de base de datos PostgreSQL 9.3 Ver Anexo # 09
 Haber descargado el controlador JDBC Tipo 4 para PostgreSQL y pegar en
el directorio: biserver-ce\tomcat\lib. Lo podemos descargar desde la
siguiente dirección web: https://jdbc.postgresql.org/download.html

Configuración pasó a paso.

El biserver-ce, viene con los scripts para MySQL, Oracle y PostgreSQL.

Los repositorios de configuraciones: hibernate, jackrabbit y quartz; se los conoce


también como metadatos.

 Ir al directorio \biserver-ce\data aquí se encuentran los scripts para


MySQL, Oracle y PostgreSQL.
 Copiar los scripts para PostgreSQL: create_jcr_postgresql.sql,
create_quartz_postgresql.sql, create_repository_postgresql.sql al
directorio: \PostgreSQL\9.3\scripts y ejecutar los tres scripts ejecutando el
archivo llamado runpsql.bat, presionar la tecla enter hasta que solicite la
contraseña de PostgreSQL, luego digitar el nombre del script (Ejemplo: \i
create_jcr_postgresql.sql)

Nota: Debe estar iniciado PostgreSQL, password es la contraseña por defecto


para el usuario hibuser del repositorio hibernate, pentaho_user del repositorio
quartz, y jcr_user del repositorio jackrabbit.

- 107 -
En la base de datos quartz debemos conectarnos a la base de datos postgres con
el comando \connect postgres postgres.

Con este procedimiento crearemos las base de datos: hibernate, jackrabbit,


quartz, y usuarios: hibuser, jcr_user, pentaho_user. La contraseña de postgresql
dependerá de la ingresada al momento de la instalación. Estos repositorios son
críticos al momento de levantar una solución.

Gráfico 91.- Creación de Repositorios de configuración de Postgresql


Fuente: El Autor

-Configuración de Tomcat.

Copiar el Driver JDBC Tipo 4 de PostgreSQL. (postgresql-9.3-1102-jdbc4.jar) al


directorio: biserver-ce\tomcat\lib

Editar el archivo context.xml ubicado en el directorio: \biserver-


ce\tomcat\webapps\pentaho\META-INF, colocar la siguiente configuración para
cambiar la conexión a PostgreSQL: Para apuntar a la base de datos postgres y no
a HSQLDB.

- 108 -
Gráfico 92.- Edición de Context XML
Fuente: El Autor
Eliminar el archivo: pentaho.xml del directorio: \biserver-
ce\tomcat\conf\Catalina\localhost

Editar la línea 76 del archivo web.xml, del directorio:


\tomcat\webapps\pentaho\WEB-INF

Gráfico 93.- Edición de Web. XML


Fuente: El Autor

-Configuración en Pentaho BI Server.

Todos los archivos de configuración del servidor central de Pentaho 5.2 se


encuentran en el directorio: \biserver-ce\pentaho-solutions\system, el resto de
configuraciones se realizarán en este directorio.

Paso 1.-Ir al sub directorio: \hibernate y editar el archivo: hibernate-settings.xml,


cambiar la etiqueta. <config-file> al valor:

<config-file>
system/hibernate/system/hibernate/postgresql.hibernate.cfg.xml
</config-file>

- 109 -
Paso 2.-Editar el archivo: applicationContext-spring-security-
hibernate.properties

Gráfico 94.- Edición de aplicationContext-spring-security-hibernate.properties


Fuente: El Autor
Paso 3.-En la base de datos quartz en PostgreSQL crear la tabla “QRTZ”, con el
siguiente script:

Gráfico 95.- Creación de Tabla QRTZ


Fuente: El Autor

Paso 4.-Editar el archivo: repository.xml en el directorio: \biserver-ce\pentaho-


solutions\system\jackrabbit. Comentar y des comentar, para apuntar jackrabbit al
repositorio de base de datos creado en PostgreSQL. (Iniciar Comentario <!--
Finalizar comentario -->)

-Des comentar la línea 61 a la 68. Comentar la línea 71 a la 73. Configuración del


File System.

-Des comentar la línea 114 a la 125. Comentar la línea 129. (Configuración del
Data Store.)

-Des comentar la línea 214 a la 221. Comentar la línea 225 a la 227. Des
comentar la línea 262 a la 269. Comentar la línea 273 a la 276. (Configuración del
Workspace)

- 110 -
-Des comentar la línea 344 a la 351. Comentar la línea 354 a la 356. Des
comentar la línea 392 a la 399. Comentar la línea 402 a la 405. (Configuración del
Versionamiento)

Nota: Podemos presionar la combinación de teclas Ctrl+G en el editor de texto


(Notepad ++) para buscar las líneas y verificar que este habilitado todo lo que
corresponde a PostgreSQL.

Paso 5.- Eliminar Cache y archivos Temporales de Windows.

Si se ejecutó pentaho bi-server previamente usando la base de datos por defecto


HSQLDB, debemos eliminar el contenido generado en los siguientes directorios,
para evitar inconvenientes imprevistos.

 \biserver-ce\tomcat\work\Catalina
 \biserver-ce\tomcat\temp
 \biserver-ce\pentaho-solutions\system\osgi\cache
 \biserver-ce\pentaho-solutions\system\jackrabbit\repository (El Directorio)

Paso 6.-Reiniciar el Servidor de Pentaho CE.

3.19.2 Crear Usuarios en Pentaho CE. 5.2.

a) Desde la perspectiva Administration/Usuarios & Roles/dar clic en (+) definir


nombre de usuario y contraseña

Gráfico 96.- Creación de Usuario


Fuente: El Autor

- 111 -
b) Asignar Rol de Administrador y conceder permisos.

Gráfico. 97. Asignar Rol y Permisos


Fuente: El Autor
3.19.3 Cambiar el Idioma de Pentaho 5.2 a Español.

El idioma predeterminado de Pentaho es el inglés, por lo que nosotros


trabajaremos con el idioma en español.

Dirigirse a la perspectiva Marketplace buscar el framework Spanish Language


Pack Installer y dar clic en install y ok.

Gráfico 98.- Cambiar el Idioma de Pentaho- Marketplace


Fuente: El Autor
Reiniciar biserver-ce.

Dirigirse a la Opción Tools/Language Packs/Spanish Language Pack


Installer/Install

Gráfico 99.- Instalar el Idioma de Pentaho.


Fuente: El Autor

- 112 -
Refrescar el navegador de Internet, presionando la combinación de teclas
(Ctrl+Shif+R)

Gráfico 100.- Portal de entrega de información en español.


Fuente: El Autor

3.19.4 Ocultar Usuarios de Prueba.

Pentaho CE, dispone de usuarios y contraseñas de prueba, por lo tanto para un


proyecto se debe ocultar.

Pasos:
-Ir al directorio pentaho-solutions/ system
-Editar el archivo Pentaho.xml.
-Ubicar la etiqueta Login Show simple
users hint cambiar a false.
-Guardar

Gráfico 101.- Ocultar Login as an Evaluator


Fuente: El Autor

Nota: Este procedimiento debe ser realizado con el Servidor Tomcat detenido.

3.19.5 Instalar Reportedaor WAQR.

Pasos:
-Ir a Perspectiva Marketplace
-Ubicar el pluggin WAQR
-Dar clic en Install/Ok
-Reiniciar el Servidor Tomcat.

Gráfico. 107. Instalar WAQR


Fuente: El Autor

- 113 -
3.19.5.1 Quitar las Alertas de WAQR.

 Ir al Directorio \biserver-ce\pentaho-solutions\system\waqr\resources.
 Editar el Archivo waqr.html
 Comentar el Contenido desde la línea 448 hasta la 460. (Iniciar el
comentario <!-- Finalizar -->)
 Refrescar el Navegador de Internet.

Gráfico 103.- Alerta WAQR


Fuente: El Autor

Nota: Para realizar la configuración, debe estar detenido el Servidor Tomcat.

3.19.6 Gestionar la Conexión del Data Warehouse en Pentaho BI-Server-CE.

Ir a la opción Gestionar fuente de datos (Manage Data Sources), en la consola de


usuario de Pentaho, elegir el tipo de base de datos, dar un nombre a la conexión,
digitar el nombre del puerto, el nombre del data warehouse, digitar las
credenciales de postgres y dar clic en test, para probar la conexión.

Gráfico 104.- Gestionar la fuente de datos en Pentaho bi-server.


Fuente: El Autor

- 114 -
3.19.7 Reportes con WAQR.
a) Una vez publicado un modelo metadatos desde Pentaho Metada Editor al
servidor Pentaho, debemos verificar la publicación del modelo desde el
portal de entrega de información y la opción Gestionar Fuente de Datos.

Gráfico 105.- Gestión de Fuente de Datos, tipo Metadata.


Fuente: El Autor

b) Dar clic en la Opción Crear Nuevo/WAQR/Next.

Gráfico 106.- Reporteador WAQR


Fuente: El Autor

c) Para demostración vamos analizar cómo está el rendimiento académico del


promedio de educación básica por Instituciones y por años. (Seleccionar
las dimensiones y medidas a analizar y llevarlas a la sección Details, con el
botón Add Colum (s)/Next/Next.

- 115 -
Gráfico 107.- Procedimiento de Generación de Reporte a demanda
Fuente: El Autor

Gráfico 108.- Crear Reporte a demanda


Fuente: El Autor

- 116 -
Gráfico 109.- Reporte a demanda
Fuente: El Autor

3.19.8 Cambiar al encoding UTF-8 en BI Server.

Nota: Para evitar inconvenientes con los caracteres especiales en pentaho 5.2
hay que cambiar el encoding de Pentaho a UTF-8.

Editar el archivo start-pentaho.bat en el directorio \biserver-ce.

Gráfico 110.- Cambiar el encoding de pentaho a UTF-8


Fuente: El Autor

3.19.9 Explorar el Cubo con JPivot.


Previamente publicado el esquema de Mondrian, dirigirse a la opción Crear
Nuevo/JpivotView/Ok.

- 117 -
Gráfico 111.- Explorar el Cubo OLAP
Fuente: El Autor

Mondrian consulta a la base de datos relacional, utilizando sql, Jpivot hace la


traducción; MDX es el lenguaje para consultar los cubos OLAP, sobre los ejes,
filas, columnas; se ve como tabla cruzada, es una herramienta potente que
permite ir desagregando cada dimensión y generando perspectivas de análisis.

Gráfico 112.- Vista del Cubo OLAP con JPivot.


Fuente: El Autor

- 118 -
En el siguiente grafico focalizamos el análisis por años, tipo de título y la nota
final de grado de los estudiantes por género de una institución educativa.

Gráfico 113.- Profundizando en los datos con JPivot.


Fuente: El Autor

En esta tabla pivoteable, podemos cambiar el orden; que las filas se conviertan en
columnas y viceversa, empleando el botón intercambiar ejes.

Gráfico 114.- Vista del Cubo Intercambiando Ejes.


Fuente: El Autor

También podemos entrar en detalle, haciendo clic en el botón del mismo nombre
y hacer en el análisis OLAP Drill Down cuando desplegamos y Drill Up cuando
regresamos.

- 119 -
Gráfico 115.- Vista del Cubo haciendo Drill Down y Drill Up.
Fuente: El Autor

Además podemos mostrar los datos de origen, dando clic en el botón mostrar
datos de origen y también permite ordenar los datos, haciendo clic en la viñeta de
la medida.

Gráfico 116.- Mostrar Datos de Origen.


Fuente: El Autor

También tenemos el MDX Query Editor, que tiene la estructura similar a la de un


campo calculado.

- 120 -
Gráfico 117-. MDX Query Editor.
Fuente: El Autor
El visor Jpivot, también puede mostrar gráficos, haciendo clic en el Icono Mostrar
Grafico.

Gráfico 118.- Mostar gráfico.


Fuente: El Autor
Además podemos cambiar el tipo de grafico en el Icono Configurar Gráficos.

Gráfico 119.- Configurar gráficos.


Fuente: El Autor
Se pueden crear un número indefinido de vistas de análisis y se pueden exportar
a pdf o guardarlos en un directorio.

- 121 -
3.19.9.1 Quitar las Alertas de Jpivot.

 Ir al Directorio C:\pentaho\biserver-c\/pentaho-solutions\system\pentaho-
jpivot-plugin\jpivot\table
 Editar el archive mdxtable.css.
 Al final del Archivo colocar lo siguiente:

#deprecatedWarning {
display: none;
}

Gráfico 120.- Alerta Jpivot.


Fuente: El Autor

3.19.10 Explorar el Cubo con Saiku Analytics y Saiku Chart Plus.

Saiku Analytics es un visor adicional de Pentaho, que permite explorar fuentes de


datos complejas, utilizando una carga familiar y soltar interfaz y fácil de entender.
Permite verlo de diferentes perspectivas, profundizar en detalle y una vez que
tenga la respuesta guardar los resultados o exportarlos a Excel, Pdf, Cvs, todo
dentro de un navegador.

3.19.10.1 Instalar Saiku Analytics.

Pasos:
-Ir a Perspectiva
Marketplace
-Ubicar el pluggin Saiku
Analytics
-En Available, elegir la
versión (Stable) -Dar
clic en Install/Ok
-Reiniciar el Servidor
Tomcat

Gráfico. 121. Instalación del visor de Cubos OLAP Saiku Analytics


Fuente: El Autor

- 122 -
3.19.10.2 Instalar Saikus Analytics Chart Plus.

Seguir el mismo procedimiento de la Instalación de Saiku Analytics; pero elegir el


pluggin Saiku Chart Plus. Este visor tiene otro tipo de gráficos y mapas basado en
Saiku Proyecto, Highchart y Google Maps.

Reiniciar bi-server y mostrara el icono de Saiku Chart Plus, en Saiku Analytics.

Gráfico. 122. Visor Saiku Chart Plus


Fuente: El Autor

3.19.10.3 Procedimiento de exploración del Cubo.

Dar clic en el Botón Crear Nuevo/ Saiku Analytics/Create a New Query.

Gráfico. 123 Crear Análisis con Saiku Analytics


Fuente: El Autor

Lo primero que nos despliega es el esquema y los diferentes cubos, en la primera


sección nos muestran las medidas y dimensiones, arrastrar los elementos con los
que deseamos crear el análisis.

- 123 -
Gráfico 124.- Visor Saiku Analytics.
Fuente: El Autor

Con el Cubo Olap vamos a responder las preguntas, planteadas en la entrevista


por la Directora Distrital de Educación. Por ejemplo deseamos conocer como ha
estado el rendimiento académico durante el transcurso de los años 2010 al 2014,
para ello arrastramos la medida Nota Final y la Dimensión Fecha e Institución
Educativa, para generar el análisis.

Gráfico 125.- Análisis con Saiku Analitycs.


Fuente: El Autor

También podemos realizar operaciones de agregación haciendo clic en el icono


similar al de una Sumatoria, llamado Basic Statistics (Estadística Básica).

Gráfico 126.- Estadística Básica.


Fuente: El Autor

- 124 -
Además permite analizar mediante gráficos.

Gráfico 127.- Análisis Saiku Analytics, gráficos.


Fuente: El Autor

Con el botón Show MDX podemos ver la consulta Multidimensional.

Gráfico 128.- Consulta MDX.


Fuente: El Autor

Con el icono Chart Mode, podemos ir generando diferentes tipos de gráficos.

Análisis Global

Gráfico 129.-. Análisis con Saiku Analytics, con el tipo de gráfico line.
Fuente: El Autor

Los análisis se pueden exportar a PDF, Excel, Cvs, o guardar en un Directorio en


Pentaho. El Cubo Olap se puede utilizar como fuente para Pentaho Report
Designer.

- 125 -
Gráfico 130.- Análisis con Saiku Analytics, con el tipo de gráfico Múltiple bar Chart.
Fuente: El Autor

Analisis del Componente que Incide en el bajo rendimiento Académico.

Gráfico. 131. Análisis con Saiku Chart Plus, con el tipo de gráfico bar.
Fuente: El Autor

Análisis del sostenimiento de la institución en la que obtienen bajo rendimiento


académico.

Gráfico 132.- Análisis con Saiku Analytics, con el tipo de gráfico Sunburst
Fuente: El Autor

- 126 -
3.20 Reportes con Pentaho Report Designer (PRD).

Es la herramienta grafica permite crear, editar, y publicar reportes a


Pentaho Bi-Server, los reportes son guardados con la extensión .prpt

3.20.1 Instalación de PRD.

PRD, lo podemos descargar desde la siguiente dirección Web:

http://sourceforge.net/projects/pentaho/files/Report%20Designer/

 Extraer el archivo: prd-ce-5.2.0.0-209.zip dentro del directorio “pentaho”

 Copiar el Driver JDBC al directorio pentaho/report-designer/lib; de

preferencia eliminar el jdbc anterior.

3.20.2 Configuración de la Conexión JNDI.

 Ir al directorio del nombre de la cuenta de usuario y verificar que este auto

creada la carpeta .pentaho

Gráfico 133.- Configuración de la conexión JNDI-carpeta.pentaho


Fuente: El Autor

 Abrir la carpeta: .pentaho y crear un archivo de bloc de notas llamado

default.propiertes, eliminar la extensión .txt.

Gráfico 134.- Configuración de la conexión JNDI - archivo default.properties


Fuente: El Autor

- 127 -
 Editar el archivo creado con Notepad ++ y digitar el siguiente código, donde

se hace referencia al driver de Postgresql y el nombre del Data

Warehouse, mismo que es sensible a mayúsculas y minúsculas.

Gráfico 135.- Código de referencia al driver de postgresql y data warehouse.


Fuente: El Autor

 Editar el archivo context.xml en la siguiente dirección: \biserver-

ce\tomcat\conf, con el nombre del data warehouse.

Gráfico 136.- Edición del archivo context.xml.


Fuente: El Autor
 Editar el archivo web.xml en la etiqueta insert additional resource-refs con

el nombre del Data Warehouse en la siguiente dirección: \biserver-

ce\tomcat\webapps\pentaho\WEB-INF.

Gráfico 137.- Edición del archivo web.xml.


Fuente: El Autor

- 128 -
3.20.3 Iniciar Pentaho Report Designer.

 Identificar y Ejecutar el archivo report-designer.bat

 Dar clic en el icono de Nuevo Reporte.

Gráfico 138.- Asistente de Creación de Reportes PRD.


Fuente: El Autor

Gráfico 139.- Interfaz de Pentaho Report Designer.


Fuente: El Autor
BANDAS FUNCIÓN
Page Header Encabezado del Reporte.
Details Muestra los detalles, resultado del
reporte.
No Data Muestra mensaje en el caso que no
existan datos para la consulta.
Page Footer Pie de página del Reporte.

Tabla 25.- Bandas de Pentaho Report Designer

Fuente: El Autor

- 129 -
3.20.4 Construcción del Reporte Institucional.

Con Pentaho Report Designer creamos nuestra plantilla, misma que servirá para
nuestros futuros reportes. Está compuesta por Bandas, mismas que se pueden
mostrar y ocultar desde la sección Structure. Para nuestra plantilla utilizamos las
siguientes herramientas y atributos en cada banda:

3.20.4.1 Personalizando el Page Header.

Arrastramos del Panel de Herramientas:

HERRAMIENTA USO DESTINO/BANDA


Crear Etiquetas de texto. Page Header
Label.
Insertar Imágenes. Ej. Logo Page Header
Image
Insertar líneas Page Header
Horizontal-line (Horizontales)
Tabla 26.- Herramientas utilizadas en el Page Header

Fuente: El Autor

3.20.4.2 Personalizando el Page Footer.

HERRAMIENTA USO DESTINO/BANDA ATRIBUTO


Crear Page Footer
Label.
Etiquetas de
texto.
Insertar: fecha Page Footer $(report.date,date,dd/M
Message
y hora M/yyy hh:mm:ss)
Text-field Numero de Page Footer PageOfPagesFunction0
Página.
Insertar líneas Page Footer
Horizontal- (Horizontales)
line
Tabla 27.- Herramientas utilizadas en el Page Footer

Fuente: El Autor

3.20.4.3 Personalizando la banda No Data.

Habilitar la banda No Data desde la sección Structure/Group/Details Body/No


Data/clic derecho Hide Element.

- 130 -
HERRAMIENTA USO DESTINO/BANDA CONTENIDO
Crear Etiquetas No Data Digitar un texto que haga
Label.
de texto. referencia que no existen
datos para la consulta, dar
formato al texto.
Tabla 28.- Herramientas utilizadas en la Banda No Data

Fuente: El Autor

Se puede visualizar la vista previa del reporte haciendo un clic en Run y


eligiendo el formato deseado: Pdf, Html, Excel, Rtf, Text, Cvs.

Gráfico 140.- Plantilla del reporte institucional.


Fuente: El Autor
Nota: Las Bandas se pueden mostrar u ocultar desde la sección Structure,
haciendo clic derecho sobre la banda y habilitando la propiedad Hide Element.

Como se puede observar en el diseño del reporte institucional se trabajó en las


bandas Page Header, para el Encabezado del reporte con logo del Distrito
Educativo, Page Footer, pie de página del reporte con la fecha/hora y el número
de página; en la banda No Data, muestra un mensaje cuando la consulta está
vacía y en la Banda Details mostrara los resultados de las consultas.

Nota: Algo importante al momento de arrastrar las consultas desde la Seccion


Data Sets a la banda Details, estas no deben sobreponerse.

- 131 -
3.20.5 Reporte utilizando como fuente JDBC.

Ir a la sección Data, Data Sets, clic derecho, elegir JDBC. (En esta sección
podemos visualizar el tipo de fuentes soportadas por Pentaho Report Designer)

Grafico 141.- Fuentes Soportadas por Pentaho Report Designer


Fuente: El Autor
Examinar y abrir la plantilla institucional, en la sección Data Sets elegir JDBC,
crear la conexión (+) al dwh_edu. Ver Anexo #10; agregar una nueva consulta (+)
a la que la llamaremos Consulta JDBC.

Grafico 142.- Consulta JDBC


Fuente: El Autor

Grafico 143.- Vista Previa de la consulta JDBC.


Fuente: El Autor

- 132 -
Se puede visualizar el resultado de la consulta en la sección Data Sets, donde se
debe arrastrar cada viñeta a la banda Details, para ejecutar una vista previa y
publicar a bi-server.

Grafico 144.- Resultado de la consulta JDBC.


Fuente: El Autor
3.20.6 Reporte utilizando como fuente un Modelo Metadatos.

Realizar el procedimiento anterior del reporte JDBC, en Data Sets hay que
seleccionar Metadata.

Grafico 145.- Fuente Metadata


Fuente: El Autor
Examinar el Modelo de Metadatos.

Grafico 146.- Examinar el Modelo Metadata


Fuente: El Autor

- 133 -
Crear la conexión al dwh_edu y crear una nueva consulta haciendo clic en el

icono de edit the Selected Query nos mostrara el modelo metadatos listo
para crear el análisis que deseemos, simplemente llevar los campos haciendo clic
en las flechas de color verde.

Grafico 147.- Editando la Consulta Metadata


Fuente.- El Autor

Grafico 148.- Consulta Metadatos


Fuente: El Autor
Pre visualizar la consulta dando clic en Preview.

Grafico 149.- Vista Previa de la Consulta metadatos


Fuente: El Autor
Nota: No olvidar que debe coincidir los nombres del Domain ID/ Bi Server
Solution Name en Pentaho Report Designer y en Data Sources de Bi Server.

- 134 -
3.20.7 Reporte utilizando como fuente un Cubo OLAP.

En la sección Data Sets y elegir OLAP/Pentaho Analysis.

Grafico 150.- Fuente OLAP


Fuente. El Autor
Examinar el esquema de Mondrian, siguiendo los pasos de la examinacion del
Modelo Metadatos.

Crear la conexión al dwh_edu y crear una nueva consulta haciendo clic (+)

Grafico 151.- Consulta MDX


Fuente: El Autor
Nota: La consulta puede ser generada en Saiku Analytics.

Ejecutar la vista previa en Preview

Grafico 152.-Vista Previa de la consulta MDX


Fuente: El Autor

- 135 -
3.20.8 Guardar y Publicar Reportes.

Guardar.- Se recomienda crear un sub directorio llamado archivos-bi dentro del


directorio pentaho. File/Save As/Nombre del Reporte.

Publicar.- File/Publish, digitar el nombre de usuario y contraseña de pentaho.

Dar un nombre al Reporte, un Título, una descripción y ubicarlo en la estructura


de directorios de la solución.

Grafico 153.- Publicar un Reporte.


Fuente: El Autor

3.20.9 Visualización de los Reportes desde Pentaho Bi-Server.

Dirigirse a la perspectiva Inicio/Examinar/Navegar en la estructura de Directorios y


hacer doble clic sobre el reporte previamente publicado.

Gráfico 154.- Alojamiento del Reporte.


Fuente: El Autor

- 136 -
Hacemos doble Clic en el nombre del Reporte “Mi primer reporte utilizando
Pentaho Report Designer”

Gráfico 155.- Vista Previa del Reporte desde Bi Server.


Fuente: El Autor
Y podemos elegir el tipo de salida: HTML, PDF, Excel, CVS, Texto, RTF

3.20.10 Estructura de Directorios de la Solución.

Ir a la perspectiva Examinar (Browse Files) elegir Nueva Carpeta (New Folder).


Se creó un Directorio llamado Análisis Rendimiento Académico y dos Sub
Directorios denominados: Cubo OLAP y Reportes, que alojaran las consultas
ejecutadas y los reportes publicados a biserver-ce.

Gráfico 156.- Estructura de Directorios


Fuente: El Autor

- 137 -
3.21 Implementación

El proyecto ha sido implantado en la Dirección Distrital de Educación Intercultural


y Bilingüe del Cantón Guaranda, tomando en cuenta las siguientes
consideraciones, para un óptimo rendimiento. Ver la certificación de la
implementación consta en el Anexo # 11 & 11.1.

REQUERIMIENTOS DE HARDWARE REQUERIMIENTOS DE SOFTWARE

Procesador Core i7 OS. Windows 7 x86/x64

Memoria RAM 4 GB PostgreSQL 9.3 (Alojamiento del Data


Warehouse)

Capacidad de 500 GB JAVA 7


Almacenamiento

Tabla. 28 Requerimientos de Hardware y Software

Fuente. El Autor

Los Roles y usuarios serán administrados por el departamento de Tecnología.


Los usuarios del sistema recibirán capacitaciones básicas sobre el uso del mismo.

3.22 Mantenimiento y Crecimiento.

El mantenimiento y crecimiento será responsabilidad del departamento de


Tecnología de la Dirección Distrital de Educación Intercultural y Bilingüe del
Cantón Guaranda.

3.23 Gestión del Proyecto.

La gestión del proyecto hasta la etapa de implementación fue realizada por el


Autor y monitoreada por el Departamento de Tecnología de la Dirección Distrital
de Educación.

- 138 -
3.24 CONCLUSIONES:

 Las actividades analíticas permiten conocer donde ha estado, donde esta y


donde estará una entidad o empresa, a través de reportes, análisis OLAP o
minería de datos; facilitando la toma de decisiones, el mejoramiento de la
gestión interna, la disminución de costos y hasta la creación nuevos
productos.

 El uso de una metodología es muy importante al momento de darle un


estándar al sistema de soporte a la toma de decisiones; razón que divide al
proyecto por etapas; donde cada etapa puede ser evaluada y corregida a
tiempo, facilitándole el desarrollo del Proyecto.

 Los datos se fueron descartando a medida que se realizó el análisis para el


Data Warehouse, en base a los requerimientos de la Directora Distrital de
Educación; esto permitió que el almacén centralizado de datos contenga
información necesaria y útil

 La utilización de herramientas Open Source de la suite de Pentaho CE 5.2,


permitió la implementación del Data Warehouse de una manera ágil, fácil
de comprender y brindando la estabilidad necesaria al momento de integrar
los datos.

 Las decisiones gerenciales no pueden ser manejadas con presentimientos


o intuición, se deben tomar basadas en conocimiento con la información
apropiada que la misma empresa o institución genera.

- 139 -
3.25 RECOMENDACIONES.

 Es importante en el desarrollo de este tipo de proyectos, partir de la


necesidad del usuario, tomando la entrevista al gerente, director (a) o
administrador de la institución o empresa, para determinar los
requerimientos que debe responder la solución.

 Se recomienda crear una política interna de carácter obligatorio en la


Dirección Distrital de Educación, Guaranda que determine el control y
ordenamiento de los datos digitales para futuras actividades analíticas.

 Es importante utilizar herramientas que permitan optimizar tiempo y reducir


costo; la plataforma de Pentaho Community Edition cumple con este
requerimiento a más de controlar cada etapa del proyecto.

 El uso de un esquema estrella se verá reflejado en el acceso a los datos,


tiempo de consulta, almacenamiento y calidad de información que
contenga el Data Warehouse.

 Se recomienda cada año a la Dirección Distrital de Educación realizar un


análisis del rendimiento académico, para de esta manera verificar los
avances que se hayan logrado en la gestión educativa; con la finalidad de
realizar un seguimiento de la evolución que ha tenido el sistema de soporte
a la toma de decisiones.

- 140 -
BIBLIOGRAFIA

Abraham Silberschatz, Henry F. Korth, S. Sudarshan. (2006). Fundamentos de Base de Datos.


Madrid: Mc Graw Hill.

Adrián Sergio Pulvirenti, M. C. (2011). Pentaho Data Integration 4 Cookbook. Packt Publishing Ltd.

Amaya, J. (2010). Toma de desiciones gerenciales. Bogotá: Ecoe Ediciones.

Barreto, K. (18 de 02 de 2006). Implementación Incremental para el Data Warehouse. Obtenido


de Implementación Incremental para el Data Warehouse:
http://www.gestiopolis.com/implementacion-incremental-para-data-warehouse/

Blejmar, B. (2009). Gestionar es hacer que las cosas sucedan. Buenos Aires: Novedades
Educativas.

Bouman, R. (2009). Pentaho Solutions: Business Intelligence and Data Warehousing with Pentaho
and MySQL. Estados Unidos: WILEY.

Caceres, K. (03 de 06 de 2014). Toma de Decisiones. Obtenido de Toma de Decisiones:


http://www.buenastareas.com/ensayos/Toma-De-Deciciones/53409290.html

CERVERA, G. J. (2011). Diseño y creación de un Sistema de Soporte a la toma de Decisiones.


España.

Chiavenato, I. (01 de 2008). Promo Negocios. Net. Obtenido de Promo Negocios. Net:
http://www.promonegocios.net/administracion/definicion-administracion.html

Cronicas. (18 de 01 de 2010). La toma de decisiones empresariales. Obtenido de La toma de


decisiones empresariales: http://www.cronicas.com.uy/HNoticia_14199.html

Dirección Distrital de Educación . (2014). PLAN ESTRATÉGICO. Guaranda: S/N.

Dongen, R. B. (2009). Pentaho Solutions Bussines Intelligence an Data Warehousing with Pentaho
and MySql. Indiana: WILEY.

Drucker, P. (2011). Gestion del Conocimiento en las Organizaciones. España: Deusto.

Educación, C. N. (2006-2015.). Hacia el Plan Decenal de Educación del Ecuador. Quito.

Educación, M. d. (05 de MARZO de 2014). MANUAL DE CALIDAD GESTIÓN ADMINISTRATIVA


DISTRITAL. QUITO, PICHINCHA, ECUADOR.

Espinosa, R. (07 de Abril de 2011). El Rincon de BI Descubriendo el Business Intelligence. Obtenido


de https://churriwifi.wordpress.com/

Espinoza, R. (2009). Importancia de los Sistemas de Información . Perú, Perú, Perú.

-1-
Fuentes, J. (2009). Gestión Escolar. México.

Garsd, A. (1997). BUENA INVESTIGACION. New York.

Gómez, A. (2010). Sistemas de Información. México: Alfaomega.

Gravitar. (2015). Introducción a PENTAHO. Obtenido de http://gravitar.biz/bi/introduccion-


pentaho-parte-1/

Gutiérrez, D. (21 de 03 de 2005). Data WareHouse. Obtenido de Data WareHouse:


http://www.monografias.com/trabajos17/data-warehouse/data-
warehouse.shtml#loseleme

Helgueros, L. (2004). Antología de Enfoques administrativos aplicados a la gestión escolar.


México.

Hernandez Baltazar, M. E. (2006). Planeación y gestión educativa en Ventanas Abiertas presentes


y por venir de la Planeación educativa. México: Amapsi.

HERNANDEZ TRASOBARES, A. (2005). LOS SISTEMAS DE INFORMACION: EVOLUCION Y


DESARROLLO. España.

Hernandez, G. (13 de 06 de 2012). Data Mart (Mercado de Datos). México, México, México.

Iboamericana, S. G. (13 de Julio de 2011). 2021 METAS EDUCATIVAS LA EDUCACION QUE


QUEREMOS PARA LA GENERACION DE LOS BICENTENARIOS. Obtenido de LA GENERACION
DE LOS BICENTENARIOS METAS EDUCATIVAS 2021: http://www.oei.es/metas2021.pdf

kimball, R. (1998). The Data Warehouse Lifecycle Toolkit. EEUU: Wiley.

L., J. y. (2001). Organización escolar. MEXICO: SERBIULA (sistema Librum 2.0) .

Laudon Kenet, Laudon Jane. (2008). Sistemas de información gerencial. México: Prentice-Hall.

Laudon, L. K. (2008). Sistemas de Información Gerencial. México, México, México: Pearson


Educación.

LAUREANO., J. y. (2001). Organización escolar. MEXICO: SERBIULA (sistema Librum 2.0) .

López, I. (2011). Base de Datos. Madrid: GARCETA.

Martínez, R. (2013). PostgreSQL-es. Obtenido de http://www.postgresql.org.es/sobre_postgresql

McLeod, D. (2010). Introducción a los sistemas de base de datos. Venezuela: Pearson Prentice
Hall.

MENENDEZ Mariano, L. M. (2012). Sistema para la toma de decisiones en el ambito universitario.


Argentina: Consorcio SIU.

-1-
Ministerio de Educación del Ecuador. (11 de Diciembre de 2014). Ministerio de Educación.
Recuperado el 11 de Diciembre de 2014, de www.educacion.gob.ec

Mojica, J. (2005). Toma de desiciones a travez de métodos cuantitativos. México: Trillas.

Murillo, I. C. (12 de 11 de 2012). Data Warehousing y Business Intelligence con herramientas Open
Source. Obtenido de http://ingmmurillo-dwh-bi.blogspot.com

Murillo, M. (18 de 05 de 2012). Data Warehousing y Business Intelligence con herramientas Open
Source . Obtenido de Data Warehousing y Business Intelligence con herramientas Open
Source : http://ingmmurillo-dwh-bi.blogspot.com

Murillo, M. (Enero de 2013). Data Warehousing Básico con Pentaho. Quito, Pichincha, Ecuador.

Murillo, M. (Marzo de 2015). Business Intelligence con Pentaho. Quito, Pichincha, Ecuador.

OpenRed. (05 de Agosto de 2014). Open Red Soluciones en Software Libre. Recuperado el 11 de
Marzo de 2015, de http://www.openred.es

Ortega, V. V. (2006). Ingenieria Aplicada a la Cooperacion para el Desarrollo, Volumen 5. España:


Agusti Perez-Foguet.

Pérez César, Santin Daniel. (2007). Data mining, soluciones con enterprise miner. México:
Alfaomega.

Pérez, E. (22 de Mayo de 2008). Data Warehouse, Modelo, Conceptos e Implementación orientada
a SQL Server. Obtenido de Data Warehouse, Modelo, Conceptos e Implementación
orientada a SQL Server: http://www.monografias.com/trabajos57/data-warehouse-
sql/data-warehouse-sql.shtml

QUINTERO, B. (2008). Mineria de datos para los Sistemas Gestores de Base de Datos. Mexico.

Ricardo, C. M. (2004). Bases de Datos. México: Mc Graw Hill.

Robert Anthony y Vijay Govindarajan. (2007). Management Control Systems. Nueva York:
McGraw-Hill/Irwin.

Scott, G. y. (2004). Los Sistemas de Informacion. Madrid: McGraw-Hill.

Sinnexus. (2012). SINEXUS Business Intelligence Informática Estrtatégica. Obtenido de


http://www.sinnexus.com/business_intelligence/index.aspx

Thomas Lockhart. (01 de Mayo de 2000). Manual del usuario de PostgreSQL. Australia. Obtenido
de http://palomo.usach.cl/Docs/postgres/Postgres-Tutorial.pdf

Todo BI: Business Intelligence, Open Source, Big Data y mucho más. (2015). Todo Bi - Business
Intelligence. Obtenido de Todo Bi - Business Intelligence: http://todobi.blogspot.com

Vinueza, J. (07 de 09 de 2013). Business Intelligence. Ecuador.


Weihrich, K. y. (2007). Administración una Pespectiva Global. México: McGrawHill.

Whitten, J. (05 de Mayo de 2009). Metodología para el desarrollo de sistemas de información y


comunicación. Venezuela, Venezuela, Venezuela.

CHACÓN Alejandro, (2007), “Datawarehouse”, www.monografias.com

LONG Magdalena, (2007) “La toma de decisiones empresariales”, www.carle-


andrioli.com/espanol/boletines/nuevos/LaTomaDeDecisionesEmpresariale.pdf
Plan Estratégico de la Dirección Provincial de Educación Hispana de Bolívar, Recuperado de la
Secretaria de la Institución, Ecuador, 2014.

POZNER,Pilar. (2004) El director como gestor de aprendizajes escolares. Atique, BuenosAires

UNESCO/Oficina Regional de Educación para América Latina, Satisfacción de las necesidades


básicas de aprendizaje.
HERNANDEZ BALTAZAR, Ma.Eugenia. Planeación y gestión educativa en Ventanas
Abiertas: presentes y porvenir de la Planeación educativa. Editorial Amapsi
Curso para supervisores y directores de las instituciones educativas, Argentina, 2005

ESTANDARES DE CALIDAD EDUCATIVA – Ministerio de Educación del Ecuador, 2012.

-1-
ANEXOS
Anexo # 01

ENCUESTA APLICADA A LOS SERVIDORES PÚBLICOS DE LA DIRECCIÓN


DISTRITAL DE EDUCACIÓN DEL CANTÓN GUARANDA, 2014.

Pregunta Nro. 1
Título: ¿Considera que existen datos históricos del rendimiento académico que
deberían ser procesados y analizados para que sirvan de soporte a la toma de
decisiones?
A veces ( ) Siempre ( ) Nunca ( )

Pregunta Nro. 2

Título: ¿Conoce usted como ha estado y como está el rendimiento académico de


las Instituciones Educativas de su distrito educativo?

Si ( ) No ( )

Pregunta Nro. 3
Título: ¿Qué formato se utiliza para la entrega y recepción de información
entre la Dirección Distrital de Educación y las instituciones?

Físico ( ) Digital ( ) Digital y Físico ( )

Pregunta Nro. 4
Título: ¿Usted lleva el control y organización de sus datos digitales?

Si ( ) No ( )

Pregunta Nro. 5
Título: Dispone de infraestructura tecnológica el departamento de ciencia y
tecnología, de su Dirección Distrital para implementar el Sistema de soporte a la
toma de decisiones?
Si ( ) No ( )
Anexo # 02

ENCUESTA DIRIGIDA A LAS AUTORIDADES DE LAS INSTITUCIONES


EDUCATIVAS DE EDUCACIÓN MEDIA DE LA DIRECCIÓN DISTRITAL DE
EDUCACIÓN CANTÓN GUARANDA, 2014.
Pregunta Nro. 1
Título: ¿Considera usted que los Servidores Públicos de la Dirección Distrital de
Educación en varias ocasiones solicitan información repetitiva?
A veces ( ) Siempre ( ) Nunca ( )

Pregunta Nro. 2
Título: ¿Usted está consiente que la falta de un sistema de soporte a la toma de
decisiones incide negativamente en el mejoramiento de la gestión educativa?
Si ( ) No ( )

Pregunta Nro. 3
Título: ¿Cuál cree que sería el mejor medio tecnológico para facilitar el flujo de
información?
CD ( ) Formulario Web ( ) Email ( )

Pregunta Nro. 4

Título: Apoya la noción que toda información enviada a la Dirección Distrital


debería ser almacenada, procesada y analizada, para en su momento apoyar a la
toma de decisiones en beneficio de la gestión educativa.

Si ( ) No ( )

Pregunta Nro. 5
Título: Considera necesario implementar un sistema de soporte a la toma de
decisiones en la Dirección Distrital de Educación, para trasformar los datos en
información y obtener indicadores claves de la realidad de la educación.
Si ( ) No ( )
Anexo # 03

Fotos de Aplicación de encuestas a las autoridades de las Instituciones


Educativas.
Anexo # 04

Certificación de Aplicación de Encuestas a Funcionarios de la Dirección


Distrital.
Anexo # 05

CRONOGRAMA

Para poder desarrollar todas las estrategias en un tiempo determinado se utilizó


un cronograma basado en el modelo de GANTT, en el cual constan todos los
procesos con su respectivo tiempo de avance.
Anexo # 06

Caracterización de Datos con Data Cleaner.

Se realizó la limpieza de datos campo por campo.


Anexo # 07

Configuración del repositorio de datos para Pentaho Data Integration.

Configurando Spoon.bat Seleccionar Ketle Database Repository.

Hacer clic en el botón New para crear la


conexión a la base de datos
pdi_repo_tesis.

Seleccionar el tipo de Base de


datos/Ingresar el nombre del
dwh/puerto/usuario y contraseña del
servidor de base de datos/clic en test.

Hacer un clic en Create or Upgrade.


Anexo # 08

Crear la conexión al Data Warehouse desde Pentaho Schema Workbench.


Anexo # 09

Instalación de Postgres.9.3
Lo podemos descargar desde: http://www.postgresql.org/download/

Ejecutar el Asistente Wizard, acorde a la Arquitectura.

Nota: Tomar muy en cuenta la contraseña ingresada durante la instalación,


motivo que dependerá para gestionar las conexiones desde las herramientas de
Pentaho
Anexo # 10

Establecer la conexión al Data Warehouse desde Pentaho Report Designer.


Anexo # 11

Certificación de la implementación del sistema de soporte a la toma de


decisiones.
ANEXO# 11.1

Foto de la Implementación.

Anexo # 12

COSTO
Cada Etapa del proyecto que se efectúo tiene un costo asociado:

ACTIVIDAD COSTO DE LA
ETAPA
Planeación del Proyecto $500
Diseño Técnico de la Arquitectura $100
Selección e Instalación del producto $300
Definición de Requerimientos $150
Modelamiento Dimensional $200
Diseño Físico $250
Diseño y Desarrollo ETL $300
Especificación de Aplicaciones BI $100
Desarrollo de la Aplicación $500
Implantación $50
Mantenimiento y Crecimiento $0
Gestión Total del Proyecto $2.450
Anexo # 13

Script del Modelamiento Dimensional.

CREATE TABLE DIM_UBICACION_GEOGRAFICA (


SK_UBICACION_GEOGRAFICA INTEGER NOT NULL,
PK_UBICACION_GEOGRAFICA VARCHAR(8) DEFAULT '0' NOT NULL,
PROVINCIA VARCHAR(40) DEFAULT 'DESCONOCIDO' NOT NULL,
PARROQUIA VARCHAR(40) DEFAULT 'DESCONOCIDO' NOT NULL,
CANTON VARCHAR(40) DEFAULT 'DESCONOCIDO' NOT NULL,
ZONA_INEC VARCHAR(12) DEFAULT 'DESCONOCIDO' NOT NULL,
VALIDO_DESDE DATE,
VALIDO_HASTA DATE,
VERSION INTEGER NOT NULL,
CONSTRAINT dim_ubicacion_geografica_pk PRIMARY KEY
(SK_UBICACION_GEOGRAFICA)
);

CREATE TABLE DIM_INSTITUCION_EDUCATIVA (


SK_INSTITUCION_EDUCATIVA INTEGER NOT NULL,
PK_INSTITUCION_EDUCATIVA VARCHAR(16) DEFAULT '0' NOT
NULL,
DISTRITO VARCHAR(16) DEFAULT '0' NOT NULL,
CIRCUITO VARCHAR(20) DEFAULT '0' NOT NULL,
INSTITUCION VARCHAR(100) DEFAULT 'DESCONOCIDO' NOT NULL,
SOSTENIMIENTO VARCHAR(20) DEFAULT 'DESCONOCIDO' NOT NULL,
JURISDICCION VARCHAR(20) DEFAULT 'DESCONOCIDO' NOT NULL,
MODALIDAD VARCHAR(20) DEFAULT 'DESCONOCIDO' NOT NULL,
REGIMEN VARCHAR(20) DEFAULT 'DESCONOCIDO' NOT NULL,
JORNADA VARCHAR(20) DEFAULT 'DESCONOCIDO' NOT NULL,
VALIDO_DESDE DATE,
VALIDO_HASTA DATE,
VERSION INTEGER NOT NULL,
CONSTRAINT sk_institucion_educativa PRIMARY KEY
(SK_INSTITUCION_EDUCATIVA)
);

CREATE TABLE DIM_ESTUDIANTE (


SK_ESTUDIANTE INTEGER NOT NULL,
PK_CEDULA VARCHAR(13) DEFAULT '0' NOT NULL,
NOMBRES VARCHAR(128) DEFAULT 'DESCONOCIDO' NOT NULL,
SEXO VARCHAR(16) DEFAULT 'DESCONOCIDO' NOT NULL,
VALIDO_DESDE DATE,
VALIDO_HASTA DATE,
VERSION INTEGER NOT NULL,
CONSTRAINT sk_estudiante PRIMARY KEY (SK_ESTUDIANTE)
);

CREATE TABLE DIM_TITULO (


SK_TITULO INTEGER NOT NULL,
PK_TITULO VARCHAR(8) DEFAULT '0' NOT NULL,
TITULO VARCHAR(36) DEFAULT 'DESCONOCIDO' NOT NULL,
TIPO_TITULO VARCHAR(36) DEFAULT 'DESCONOCIDO' NOT NULL,
ESPECIALIZACION VARCHAR(36) DEFAULT 'DESCONOCIDO' NOT
NULL,
VALIDO_DESDE DATE,
VALIDO_HASTA DATE,
VERSION INTEGER NOT NULL,
CONSTRAINT sk_titulo PRIMARY KEY (SK_TITULO)
);

CREATE TABLE DIM_FECHA (


SK_FECHA INTEGER NOT NULL,
ANIO INTEGER NOT NULL,
MES INTEGER NOT NULL,
NOMBRE_MES VARCHAR(36) NOT NULL,
CONSTRAINT sk_fecha PRIMARY KEY (SK_FECHA)
);

CREATE TABLE FACT_RENDIMIENTO_ACADEMICO (


SK_FECHA INTEGER NOT NULL,
SK_TITULO INTEGER NOT NULL,
SK_ESTUDIANTE INTEGER NOT NULL,
SK_INSTITUCION_EDUCATIVA INTEGER NOT NULL,
SK_UBICACION_GEOGRAFICA INTEGER NOT NULL,
PROMEDIO_EDU_BASICA NUMERIC(6,2) NOT NULL,
PROMEDIO_BACHILLERATO NUMERIC(6,2) NOT NULL,
NOTA_PROYECTO_GRADO NUMERIC(6,2) NOT NULL,
PROMEDIO_EXAMEN_GRADO NUMERIC(6,2) NOT NULL
);

ALTER TABLE FACT_RENDIMIENTO_ACADEMICO ADD CONSTRAINT


dim_ubicacion_geografica_fact_rendimiento_academic_fk
FOREIGN KEY (SK_UBICACION_GEOGRAFICA)
REFERENCES DIM_UBICACION_GEOGRAFICA (SK_UBICACION_GEOGRAFICA)
ON DELETE NO ACTION
ON UPDATE NO ACTION
NOT DEFERRABLE;

ALTER TABLE FACT_RENDIMIENTO_ACADEMICO ADD CONSTRAINT


dim_institucion_educativa_fact_rendimiento_academic_fk
FOREIGN KEY (SK_INSTITUCION_EDUCATIVA)
REFERENCES DIM_INSTITUCION_EDUCATIVA (SK_INSTITUCION_EDUCATIVA)
ON DELETE NO ACTION
ON UPDATE NO ACTION
NOT DEFERRABLE;

ALTER TABLE FACT_RENDIMIENTO_ACADEMICO ADD CONSTRAINT


dim_estudiante_fact_rendimiento_academic_fk
FOREIGN KEY (SK_ESTUDIANTE)
REFERENCES DIM_ESTUDIANTE (SK_ESTUDIANTE)
ON DELETE NO ACTION
ON UPDATE NO ACTION
NOT DEFERRABLE;

ALTER TABLE FACT_RENDIMIENTO_ACADEMICO ADD CONSTRAINT


dim_titulo_fact_rendimiento_academic_fk
FOREIGN KEY (SK_TITULO)
REFERENCES DIM_TITULO (SK_TITULO)
ON DELETE NO ACTION
ON UPDATE NO ACTION
NOT DEFERRABLE;
ALTER TABLE FACT_RENDIMIENTO_ACADEMICO ADD CONSTRAINT
dim_fecha_fact_rendimiento_academic_fk
FOREIGN KEY (SK_FECHA)
REFERENCES DIM_FECHA (SK_FECHA)
ON DELETE NO ACTION
ON UPDATE NO ACTION
NOT DEFERRABLE;

Anexo # 14
Script. Carga Dimensión Fecha.

ALTER TABLE dim_fecha ADD COLUMN sk_fecha_KTL DOUBLE PRECISION;


UPDATE dim_fecha SET sk_fecha_KTL=sk_fecha;
ALTER TABLE dim_fecha DROP COLUMN sk_fecha;
ALTER TABLE dim_fecha RENAME sk_fecha_KTL TO sk_fecha;

;
ALTER TABLE dim_fecha ADD COLUMN anio_KTL DOUBLE PRECISION;
UPDATE dim_fecha SET anio_KTL=anio;
ALTER TABLE dim_fecha DROP COLUMN anio;
ALTER TABLE dim_fecha RENAME anio_KTL TO anio;

;
ALTER TABLE dim_fecha ADD COLUMN mes_KTL DOUBLE PRECISION;
UPDATE dim_fecha SET mes_KTL=mes;
ALTER TABLE dim_fecha DROP COLUMN mes;
ALTER TABLE dim_fecha RENAME mes_KTL TO mes;

;
ALTER TABLE dim_fecha ADD COLUMN nombre_mes_KTL VARCHAR(10);
UPDATE dim_fecha SET nombre_mes_KTL=nombre_mes;
ALTER TABLE dim_fecha DROP COLUMN nombre_mes;
ALTER TABLE dim_fecha RENAME nombre_mes_KTL TO nombre_mes;

;
Anexo # 15

Script. Carga Dimensión Estudiante.

ALTER TABLE dim_estudiante ADD COLUMN pk_cedula_KTL TEXT;


UPDATE dim_estudiante SET pk_cedula_KTL=pk_cedula;
ALTER TABLE dim_estudiante DROP COLUMN pk_cedula;
ALTER TABLE dim_estudiante RENAME pk_cedula_KTL TO pk_cedula;

;
ALTER TABLE dim_estudiante ADD COLUMN nombres_KTL TEXT;
UPDATE dim_estudiante SET nombres_KTL=nombres;
ALTER TABLE dim_estudiante DROP COLUMN nombres;
ALTER TABLE dim_estudiante RENAME nombres_KTL TO nombres;

;
ALTER TABLE dim_estudiante ADD COLUMN sexo_KTL VARCHAR(6);
UPDATE dim_estudiante SET sexo_KTL=sexo;
ALTER TABLE dim_estudiante DROP COLUMN sexo;
ALTER TABLE dim_estudiante RENAME sexo_KTL TO sexo;
;
CREATE INDEX idx_dim_estudiante_lookup ON dim_estudiante(pk_cedula, nombres)
;
Anexo # 16

Script. Carga Dimensión Titulo.

ALTER TABLE dim_titulo ADD COLUMN pk_titulo_KTL TEXT;


UPDATE dim_titulo SET pk_titulo_KTL=pk_titulo;
ALTER TABLE dim_titulo DROP COLUMN pk_titulo;
ALTER TABLE dim_titulo RENAME pk_titulo_KTL TO pk_titulo;

;
CREATE INDEX idx_dim_titulo_lookup ON dim_titulo(pk_titulo, tipo_titulo)
;

Anexo # 17

Script. Carga Dimensión Institución Educativa.

ALTER TABLE dim_institucion_educativa ADD COLUMN pk_institucion_educativa_KTL


TEXT;
UPDATE dim_institucion_educativa SET
pk_institucion_educativa_KTL=pk_institucion_educativa;
ALTER TABLE dim_institucion_educativa DROP COLUMN pk_institucion_educativa;
ALTER TABLE dim_institucion_educativa RENAME pk_institucion_educativa_KTL TO
pk_institucion_educativa;

;
ALTER TABLE dim_institucion_educativa ADD COLUMN institucion_KTL TEXT;
UPDATE dim_institucion_educativa SET institucion_KTL=institucion;
ALTER TABLE dim_institucion_educativa DROP COLUMN institucion;
ALTER TABLE dim_institucion_educativa RENAME institucion_KTL TO institucion;

;
ALTER TABLE dim_institucion_educativa ADD COLUMN circuito_KTL TEXT;
UPDATE dim_institucion_educativa SET circuito_KTL=circuito;
ALTER TABLE dim_institucion_educativa DROP COLUMN circuito;
ALTER TABLE dim_institucion_educativa RENAME circuito_KTL TO circuito;

;
ALTER TABLE dim_institucion_educativa ADD COLUMN sostenimiento_KTL TEXT;
UPDATE dim_institucion_educativa SET sostenimiento_KTL=sostenimiento;
ALTER TABLE dim_institucion_educativa DROP COLUMN sostenimiento;
ALTER TABLE dim_institucion_educativa RENAME sostenimiento_KTL TO sostenimiento;

;
ALTER TABLE dim_institucion_educativa ADD COLUMN jurisdiccion_KTL TEXT;
UPDATE dim_institucion_educativa SET jurisdiccion_KTL=jurisdiccion;
ALTER TABLE dim_institucion_educativa DROP COLUMN jurisdiccion;
ALTER TABLE dim_institucion_educativa RENAME jurisdiccion_KTL TO jurisdiccion;

;
ALTER TABLE dim_institucion_educativa ADD COLUMN modalidad_KTL TEXT;
UPDATE dim_institucion_educativa SET modalidad_KTL=modalidad;
ALTER TABLE dim_institucion_educativa DROP COLUMN modalidad;
ALTER TABLE dim_institucion_educativa RENAME modalidad_KTL TO modalidad;

;
ALTER TABLE dim_institucion_educativa ADD COLUMN regimen_KTL TEXT;
UPDATE dim_institucion_educativa SET regimen_KTL=regimen;
ALTER TABLE dim_institucion_educativa DROP COLUMN regimen;
ALTER TABLE dim_institucion_educativa RENAME regimen_KTL TO regimen;

;
ALTER TABLE dim_institucion_educativa ADD COLUMN distrito_KTL TEXT;
UPDATE dim_institucion_educativa SET distrito_KTL=distrito;
ALTER TABLE dim_institucion_educativa DROP COLUMN distrito;
ALTER TABLE dim_institucion_educativa RENAME distrito_KTL TO distrito;

;
ALTER TABLE dim_institucion_educativa ADD COLUMN jornada_KTL TEXT;
UPDATE dim_institucion_educativa SET jornada_KTL=jornada;
ALTER TABLE dim_institucion_educativa DROP COLUMN jornada;
ALTER TABLE dim_institucion_educativa RENAME jornada_KTL TO jornada;

;
CREATE INDEX idx_dim_institucion_educativa_lookup ON
dim_institucion_educativa(pk_institucion_educativa, institucion, circuito,
sostenimiento, jurisdiccion, modalidad, regimen, distrito, jornada)
;

Anexo # 18

Script. Carga Dimensión ubicación Geográfica.

ALTER TABLE dim_ubicacion_geografica ADD COLUMN pk_ubicacion_geografica_KTL


TEXT;
UPDATE dim_ubicacion_geografica SET
pk_ubicacion_geografica_KTL=pk_ubicacion_geografica;
ALTER TABLE dim_ubicacion_geografica DROP COLUMN pk_ubicacion_geografica;
ALTER TABLE dim_ubicacion_geografica RENAME pk_ubicacion_geografica_KTL TO
pk_ubicacion_geografica;

;
CREATE INDEX idx_dim_ubicacion_geografica_lookup ON
dim_ubicacion_geografica(pk_ubicacion_geografica)
;

Anexo # 19

Script. Carga Tabla de Hechos.

ALTER TABLE fact_rendimiento_academico ADD COLUMN sk_fecha_KTL DOUBLE PRECISION;


UPDATE fact_rendimiento_academico SET sk_fecha_KTL=sk_fecha;
ALTER TABLE fact_rendimiento_academico DROP COLUMN sk_fecha;
ALTER TABLE fact_rendimiento_academico RENAME sk_fecha_KTL TO sk_fecha;

;
ALTER TABLE fact_rendimiento_academico ADD COLUMN promedio_edu_basica_KTL DOUBLE
PRECISION;
UPDATE fact_rendimiento_academico SET
promedio_edu_basica_KTL=promedio_edu_basica;
ALTER TABLE fact_rendimiento_academico DROP COLUMN promedio_edu_basica;
ALTER TABLE fact_rendimiento_academico RENAME promedio_edu_basica_KTL TO
promedio_edu_basica;

;
ALTER TABLE fact_rendimiento_academico ADD COLUMN promedio_bachillerato_KTL
DOUBLE PRECISION;
UPDATE fact_rendimiento_academico SET
promedio_bachillerato_KTL=promedio_bachillerato;
ALTER TABLE fact_rendimiento_academico DROP COLUMN promedio_bachillerato;
ALTER TABLE fact_rendimiento_academico RENAME promedio_bachillerato_KTL TO
promedio_bachillerato;

;
ALTER TABLE fact_rendimiento_academico ADD COLUMN promedio_examen_grado_KTL
DOUBLE PRECISION;
UPDATE fact_rendimiento_academico SET
promedio_examen_grado_KTL=promedio_examen_grado;
ALTER TABLE fact_rendimiento_academico DROP COLUMN promedio_examen_grado;
ALTER TABLE fact_rendimiento_academico RENAME promedio_examen_grado_KTL TO
promedio_examen_grado;

;
ALTER TABLE fact_rendimiento_academico ADD COLUMN nota_proyecto_grado_KTL DOUBLE
PRECISION;
UPDATE fact_rendimiento_academico SET
nota_proyecto_grado_KTL=nota_proyecto_grado;
ALTER TABLE fact_rendimiento_academico DROP COLUMN nota_proyecto_grado;
ALTER TABLE fact_rendimiento_academico RENAME nota_proyecto_grado_KTL TO
nota_proyecto_grado;

;
CREATE INDEX idx_fact_rendimiento_academico_lookup ON
fact_rendimiento_academico(sk_fecha, sk_estudiante, sk_ubicacion_geografica,
sk_institucion_educativa, sk_titulo)
;

Vous aimerez peut-être aussi