Académique Documents
Professionnel Documents
Culture Documents
UNIANDES
TEMA:
AUTOR:
TUTOR:
AMBATO – ECUADOR
2015
-1-
-2-
-3-
DEDICATORIA
Este arduo trabajo dedico a mi novia Eugenia, en vista de que juntos hemos
atravesado momentos difíciles y felices, a mi Padre que con su ejemplo y trabajo
nos ha regalado la mejor herencia que es la Educación y nos ha enseñado a ser
personas correctas, a mi hermano que desde niños crecimos juntos; me ha
guiado y aconsejado.
También dedico a mis Maestros, que con su sabiduría me formaron para el futuro,
a mis compañeros de trabajo que han compartido su experiencia, a mis amigos de
Colegio Diego y Jhonny que siempre con sus ocurrencias me han sacado una
sonrisa a pesar de las circunstancias y demás familiares cercanos que siempre
me han estado apoyando y aconsejando continuamente.
Finalmente dedico este trabajo de postgrado a todas las Madres solteras que son
bien fuertes y tienen la valentía de seguir luchando para salir adelante.
Angel
-4-
AGRADECIMIENTO
Agradezco primero a Dios y a la Virgencita del Huayco, razón que ellos son los
únicos que saben que es lo que realmente nos está pasando en nuestro interior y
nos dan ánimos y fuerzas para seguir adelante.
Angel
-5-
ÍNDICE GENERAL
-6-
1.1.3 Sistema de soporte a la toma de decisiones…………………….. 12-13
1.1.3.1 Tipos de sistemas de soporte a decisiones……………………… 13
1.1.3.1.1 Sistema de información gerencial………………………………… 13
1.1.3.1.2 Sistema de información ejecutiva…………………………………. 13
1.1.3.1.3 Sistemas expertos basados en inteligencia artificial……………. 13
1.1.3.1.4 Sistema de apoyo a decisiones en grupo………………………... 13
1.1.4 Sistemas del Ministerio de Educación……………………………. 14
1.1.4.1 Sigee………………………………………………………………..... 14
1.1.4.2 Sime………………………………………………………………….. 14
1.1.4.3 Amie………………………………………………………………….. 14
1.1.5 Sistema Data Warehouse/Bussines Intelligence………………... 14
1.2 Base de Datos………………………………………………………. 15
1.2.1 Software de Base de Datos……………………………………….. 15-16
1.2.2 Roles en el entorno de la base de datos integrada…………….. 16-17
1.2.3 Principales Sistemas de gestión de base de datos……………... 17-18
1.2.3.1 PostgreSQL………………………………………………………….. 18
1.2.3.1.1 Características de PostgreSQL…………………………………… 18-19
1.3 Data Warehouse……………………………………………………. 19-20
1.3.1 Objetivos fundamentales de un Data Warehouse………………. 20
1.3.2 Elementos básicos de un Data Warehouse……………………… 20-21
1.3.3 Procesos básicos del Data Warehouse………………………….. 21
1.3.4 Desafíos de un Data Warehouse…………………………………. 21-22
1.3.5 Metodología para el desarrollo de un Data Warehouse………... 22
1.3.5.1 El enfoque de Bill Inmon…………………………………………… 22
1.3.5.2 Metodología de Ralph Kimball…………………………………….. 23
1.3.6 Tabla comparativa CIF-MD………………………………………… 23
1.3.7 Ciclo de vida de la metodología de Ralph Kimball……………… 24
1.3.8 Requerimientos de un Data Warehouse…………………………. 24-25
1.3.9 Data Mining………………………………………………………….. 25
1.4 Pentaho………………………………………………………………. 25
1.4.1 Pentaho Community Edition……………………………………….. 25
1.4.2 Pentaho Enterprise Edition………………………………………… 25
1.4.3 Plataforma de Pentaho…………………………………………….. 26
1.4.3.1 Pentaho Data Integration…………………………………………... 26
1.4.3.1.1 ETL…………………………………………………………………… 26
1.4.3.1.2 Arquitectura de Pentaho Data Integration………………………... 27
-7-
1.4.3.2 Pentaho Report Designer………………………………………….. 27
1.4.3.2.1 Estructura de bandas de un reporte………………………………. 27-28
1.4.3.3 Pentaho Schema Workbench……………………………………… 28
1.4.3.3.1 Arquitectura de Pentaho Analysis Services……………………… 28
1.4.3.3.2 Mondrián……………………………………………………………... 29
1.4.3.3.3 Cubo OLAP………………………………………………………….. 29
1.4.3.3.3.1 Jerarquías, Niveles y Miembros…………………………………… 29
1.4.3.4 Community Dashboard Framework………………………………. 30
1.4.3.5 Pentaho Metadata Editor…………………………………………... 30
1.4.3.5.1 Arquitectura de Pentaho Metadata Layer………………………… 30
1.4.3.5.2. Capas de un Modelo Metadatos…………………………………... 31
1.5 Esquema para el modelado de datos…………………………….. 31
1.5.1 Esquema en Estrella……………………………………………….. 31
1.6 Bussines Intelligence……………………………………………….. 31-32
1.7 La toma de decisiones……………………………………………… 32
1.7.1 Elementos de la toma de decisiones……………………………... 32-33
1.8 La Gestión…………………………………………………………… 33
1.8.1 Administrar…………………………………………………………... 34
1.8.2 Enfoques Administrativos y de Gestión........…………………….. 34
1.8.3 El Proyecto Educativo Institucional……………………………….. 34
1.8.3.1 Importancia del PEI…………………………………………………. 35
1.8.3.2 Características del PEI……………………………………………... 35
1.8.4 Liderazgo Directivo…………………………………………………. 35
1.8.5 Gestión Educativa………………………………………………….. 36
1.8.6 Políticas Educativas del Ministerio de Educación del Ecuador... 36
1.8.7 Nuevo Modelo de Gestión Educativa…………………………….. 36-37
1.8.7.1 Zonas, Distritos y Circuitos………………………………………… 38
1.9 Conclusiones parciales del capítulo………………………………. 39
CAPITULO II
MARCO METODOLOGICO
2.1 Caracterización del sector…………………………………………. 40-41
2.1.1 Misión………………………………………………………………… 42
2.1.1 Visión…………………………………………………………………. 42
2.1.3 Organigrama Institucional………………………………………….. 42
2.2 Descripción del procedimiento metodológico……………………. 43
2.2.1 Modalidad de la Investigación……………………………………... 43
-8-
2.2.1.1 Tipos de Investigación……………………………………………… 43
2.2.1.2 Población y Muestra………………………………………………... 43-44
2.2.1.2.1 Distribución de la población……………………………………….. 44
2.2.2 Métodos utilizados en la investigación de campo………………. 44-45
2.2.3 Técnicas aplicadas en la investigación…………………………… 45
2.2.4 Procesamiento de datos…………………………………………… 45
2.2.4.1 Encuesta aplicada a los Servidores Públicos de la Dirección
Distrital de Educación del cantón Guaranda…………………….. 46-50
2.2.4.2 Encuesta dirigida a las autoridades de las Instituciones
Educativas de educación media de la Dirección Distrital de
Educación, del cantón Guaranda…………………………………. 51-55
2.2.4.3 Resumen de la entrevista realizada a la Directora Distrital de
Educación Intercultural y Bilingüe del cantón Guaranda……….. 56-57
2.3 Propuesta del Investigador………………………………………… 57
2.4 Conclusiones parciales del capítulo………………………………. 58
CAPITULO III
MARCO PROPOSITIVO
3.1 Tema…………………………………………………………………. 59
3.2 Objetivo General……………………………………………………. 59
3.3 Objetivos Específicos………………………………………………. 59
3.4 Planificación y Administración del Proyecto……………………... 59
3.4.1 Definición del Proyecto…………………………………………….. 59
3.4.2 Preparación de un Proyecto Data Warehouse…………………... 60
3.4.3 Alcance………………………………………………………………. 60
3.4.4 Fundamentación…………………………………………………….. 60
3.4.5 Planificación del Proyecto………………………………………….. 60
3.4.6 Administración del Proyecto……………………………………….. 61
3.5 Definición de Requerimientos……………………………………... 61-62
3.6 Diseño Técnico de la Arquitectura………………………………… 62
3.6.1 Entorno Back Room………………………………………………… 62-63
3.6.2 Entorno Front Room………………………………………………... 63
3.6.3 Arquitectura de flujo de datos con Pentaho……………………… 64
3.7 Selección e Instalación del Producto……………………………... 64-65
3.8 Modelamiento Dimensional………………………………………... 66
3.8.1 Técnicas de Modelamiento………………………………………… 66
3.8.1.1 Dimensiones………………………………………………………… 66
-9-
3.8.1.2 Hechos………………………………………………………………. 66
3.9 Principios de Diseño………………………………………………... 66
3.10 Granularidad y Agregación………………………………………… 67
3.11 Funciones de Agregación SQL……………………………………. 67
3.12 Técnicas SCD (Control de Cambios)……………………………... 67-68
3.13 Diseño Físico del Data Warehouse……………………………….. 69
3.13.1 Diccionario de datos del Data Warehouse……………………….. 70-73
3.14 Herramienta Auxiliar para la limpieza de datos………………….. 74
3.15 Diseño y Desarrollo de ETL con Pentaho Data Integration……. 74
3.15.1 Instalación de Pentaho Data Integration…………………………. 74
3.15.2 Configuración del Repositorio……………………………………... 75
3.15.3 Ejecución de Pentaho Data Integration…………………………... 75
3.15.4 Principales componentes de Pentaho Data Integration………... 75
3.15.4.1 Transformaciones…………………………………………………… 75
3.15.4.2 Jobs…………………………………………………………………... 76
3.15.5 Características de las Transformaciones y Jobs………………... 76
3.15.6 Procesos ETL……………………………………………………….. 76
3.15.6.1 ETL-Migrar datos fuente al repositorio temporal Stage………… 76-83
3.15.6.2 ETL-Carga Dimensión Fecha……………………………………… 83
3.15.6.3 ETL-Carga Dimensión Estudiante………………………………… 84
3.15.6.4 ETL-Carga Dimensión Titulo………………………………………. 85
3.15.6.5 ETL-Carga Dimensión Institución Educativa…………………….. 85
3.15.6.6 ETL-Carga Dimensión Ubicación Geográfica……………………. 85
3.15.6.7 ETL-Carga Tabla de Hechos………………………………………. 86-87
3.15.6.8 Carga de JOBS……………………………………………………… 87
3.15.6.8.1 Job Carga datos fuente al repositorio temporal Stage…………. 87-88
3.15.6.8.2 Job Carga Dimensiones……………………………………………. 88
3.15.6.8.3 Job Carga Data Warehouse……………………………………….. 88-89
3.16 Crear un Modelo Metadatos con Pentaho Metadata Editor……. 90
3.16.1 Instalación y Configuración de Pentaho Metadata Editor……… 90
3.16.2 Pasos para construir un Modelo Metadatos……………………... 90
3.16.3 Publicar un Modelo Metadatos……………………………………. 91
3.17 Construcción del Cubo de Análisis OLAP con Pentaho
Schema Workbench………………………………………………… 92
3.17.1 Instalación y configuración de Pentaho Schema
Workbench………………………………………………………….. 92
- 10 -
3.17.2 Nuevo Esquema…………………………………………………….. 92-93
3.17.3 Agregar un Cubo al Esquema……………………………………... 93
- 11 -
3.20.4 Construcción del Reporte Institucional…………………………… 130
3.20.4.1 Personalizando el Page Header…………………………………... 130
3.20.4.2 Personalizando el Page Footer……………………………………. 130
3.20.4.3 Personalizando la banda No Data………………………………… 130-131
3.20.5 Reportes utilizando como fuente JDBC………………………….. 132-133
3.20.6 Reportes utilizando como fuente Modelo Metadatos…………… 133-134
3.20.7 Reportes utilizando como fuente un Cubo OLAP……………….. 135
3.20.8 Guardar y Publicar los Reportes………………………………….. 136
3.20.9 Visualización del Reporte desde Pentaho Bi-Server……………. 136
3.20.10 Estructura de Directorios de la Solución…………………………. 137
3.21 Implementación……………………………………………………... 138
3.22 Mantenimiento y Crecimiento……………………………………… 138
3.23 Gestión del Proyecto……………………………………………….. 138
3.24 Conclusiones………………………………………………………… 139
3.25 Recomendaciones………………………………………………….. 140
Bibliografía
Anexos
- 12 -
ÍNDICE DE GRAFICOS
- 13 -
Gráfico 34. Campos de la fuente de Datos………………………………………….. 78
Gráfico 35. Vista Previa de los datos………………………………………………… 78
Gráfico 36. Pase de Steep…………………………………………………………….. 78
Gráfico 37. Propiedades del Steep Select Values………………………………….. 79
Gráfico 38. Configuración de la conexión al repositorio de datos Stage…………. 80
Gráfico 39. Creación de la tabla stg_matriz_excel………………………………….. 81
Gráfico 40. Proceso de Creación de la tabla stg_matriz_excel…………………… 81
Gráfico 41. Verificación de las columnas creadas en el Stage……………………. 81
Gráfico 42. Vista Previa de la transformación……………………………………….. 82
Gráfico 43. Ejecución de la Transformación Paso 1………………………………... 82
Gráfico 44. Ejecución de la Transformación Paso 2………………………………... 82
Gráfico 45. ETL-Carga Dimensión Fecha…………………………………………… 83
Gráfico 46. ETL-Carga Dimensión Estudiante……………………………………… 84
Gráfico 47. ETL-Carga Dimensión Titulo ……………………………………………. 85
Gráfico 48. ETL-Carga Dimensión Institución Educativa…………………………... 85
Gráfico 49. ETL-Carga Dimensión Ubicación Geográfica…………………………. 85
Gráfico 50. ETL-Carga Tabla de Hechos……………………………………………. 86
Gráfico 51. Propiedades del Steep Insert Update………………………………….. 87
Gráfico 52. Job-Carga Stage…………………………………………………………. 87
Gráfico 53. Referenciar a las Transformaciones……………………………………. 88
Gráfico 54. Job-Carga Dimensiones…………………………………………………. 88
Gráfico 55. Job-Carga Data Warehouse…………………………………………….. 89
Gráfico 56. Referenciar a los JOBS………………………………………………….. 89
Gráfico 57. Interfaz de Pentaho Metadata Editor y conexión al Data Warehouse. 90
Gráfico 58. Modelo Metadatos Editor………………………………………………… 91
Gráfico 59. Publicación del Modelo Metadatos……………………………………… 91
Gráfico 60. Interfaz de Pentaho Schema Workbench……………………………… 92
Gráfico 61. Crear Nuevo Esquema…………………………………………………… 93
Gráfico 62. Agregar un Cubo al Esquema…………………………………………… 93
Gráfico 63. Texto de ayuda en la construcción del Cubo………………………….. 93
Gráfico 64. Agregar Tabla de Hechos………………………………………………... 94
Gráfico 65. Lenguaje MDX…………………………………………………………….. 94
Gráfico 66. Agregar Dimensiones…………………………………………………….. 95
Gráfico 67. Agregar Jerarquía Nivel Todos…………………………………………. 95
Gráfico 68. Agregar la Tabla de la dimensión fecha del modelo dimensional…… 96
Gráfico 69. Dimensión Estudiante……………………………………………………. 96
- 14 -
Gráfico 70. Dimensión Ubicación Geográfica……………………………………….. 97
Gráfico 71. Dimensión Institución Educativa………………………………………... 97
Gráfico 72. Dimensión Titulo………………………………………………………….. 97
Gráfico 73. Agregar el nivel de jerarquía año……………………………………….. 98
Gráfico 74. Agregar el nivel de jerarquía mes………………………………………. 98
Gráfico 75. Texto guía en la construcción del Cubo……………………………….. 99
Gráfico 76. Agregar una medida……………………………………………………… 99
Gráfico 77. Verificar el Cubo con MDX Query……………………………………… 100
Gráfico 78. Medida Promedio de Bachillerato………………………………………. 100
Gráfico 79. Medida Promedio de Educación Básica……………………………….. 100
Gráfico 80. Medida Promedio Exámenes de Grado………………………………... 101
Gráfico 81. Agregar Campo Calculado………………………………………………. 101
Gráfico 82. Publicar un Cubo…………………………………………………………. 102
Gráfico 83. Mensaje de Sobrescribir el Cubo………………………………………. 102
Gráfico 84. Desactivar las actualizaciones automáticas de JAVA……………….. 104
Gráfico 85. Configuración de la variable JAVA_HOME……………………………. 104
Gráfico 86. Configuración de la variable Path………………………………………. 105
Gráfico 87. Muestra los miles segundos…………………………………………….. 105
Gráfico 88. Acceder a la consola de usuario de Pentaho………………………….. 105
Gráfico 89. Consola de usuario de Pentaho………………………………………… 106
Gráfico 90. Perspectivas y Portal de entrega de información…………………….. 106
Gráfico 91. Creación del repositorios de configuración de PostgreSQL…………. 108
Gráfico 92. Edición del context.xml………………………………………………….. 109
Gráfico 93. Edición del web.xml………………………………………………………. 109
Gráfico 94. Edición de aplication.context……………………………………………. 110
Gráfico 95. Creación de la tabla QUARTZ…………………………………………... 110
Gráfico 96. Creación de usuario………………………………………………………. 111
Gráfico 97. Asignación de Rol y Permisos…………………………………………... 112
Gráfico 98. Cambiar el idioma de Pentaho - Marketplace…………………………. 112
Gráfico 99. Instalar el idioma de Pentaho……………………………………………. 112
Gráfico 100. Portal de entrega de información……………………………………… 113
Gráfico 101. Ocultar Login as Evaluator…………………………………………….. 113
Gráfico 102. Instalar WAQR………………………………………………………….. 113
Gráfico 103. Alerta WAQR……………………………………………………………. 114
Gráfico 104. Gestionar la fuente de datos en Pentaho bi-server………………….. 114
Gráfico 105. Gestionar la fuente de datos tipo Metadatos…………………………. 115
- 15 -
Gráfico 106. Reportes WAQR………………………………………………………… 115
Gráfico 107. Procedimiento de generación de reportes a demanda……………… 116
Gráfico 108. Crear reporte a demanda………………………………………………. 116
Gráfico 109. Reporte a demanda…………………………………………………….. 117
Gráfico 110. Cambiar el encoding de Pentaho a UTF-8…………………………… 117
Gráfico 111. Explorar el Cubo OLAP………………………………………………… 118
Gráfico 112. Vista del Cubo OLAP con JPivot………………………………………. 118
Gráfico 113. Profundizando en los datos con JPivot……………………………….. 119
Gráfico 114. Vista del Cubo intercambiando ejes………………………………….. 119
Gráfico 115. Vista del Cubo haciendo Drill Down………………………………….. 120
Gráfico 116. Muestra Datos de origen………………………………………………. 120
Gráfico 117. MDX Query Editor……………………………………………………….. 121
Gráfico 118. Mostrar Grafico…………………………………………………………. 121
Gráfico 119. Configurar Grafico………………………………………………………. 121
Gráfico 120. Alerta JPivot……………………………………………………………… 122
Gráfico 121. Instalación del visor de cubos OLAP Saiku Analytics………………. 122
Gráfico 122. Visor Saiku Chart Plus………………………………………………….. 123
Gráfico 123. Crear análisis con Saiku Analytics……………………………………. 123
Gráfico 124. Visor Saiku Analytics……………………………………………………. 124
Gráfico 125. Análisis con Saiku Analytics……………………………………………. 124
Gráfico 126. Estadística básica……………………………………………………….. 124
Gráfico 127. Análisis con Saiku Analytics…………………………………………… 125
Gráfico 128. Consulta MDX…………………………………………………………… 125
Gráfico 129. Análisis con Saiku Analytics, grafico tipo Line……………………….. 125
Gráfico 130. Análisis con Saiku Analytics, grafico tipo Múltiple Bar………………. 126
Gráfico 131. Análisis con Saiku Chart Plus, grafico tipo Bar………………………. 126
Gráfico 132. Análisis con Saiku Analytics, grafico tipo Sunburst………………….. 126
Gráfico 133. Configuración de la conexión JNDI carpeta.pentaho……………….. 127
Gráfico 134. Configuración de la conexión JNDI archivo default.properties…….. 127
Gráfico 135. Código de referencia al driver de PostgreSQL y Data Warehouse.. 128
Gráfico 136. Edición del archivo context.xml………………………………………... 128
Gráfico 137. Edición del archivo web.xml……………………………………………. 128
Gráfico 138. Asistente de creación de reportes PRD………………………………. 129
Gráfico 139. Interfaz de Pentaho Report Designer…………………………………. 129
Gráfico 140. Plantilla del reporte Institucional………………………………………. 131
Gráfico 141. Fuentes soportadas por Pentaho Report Designer…………………. 132
- 16 -
Gráfico 142. Consulta JDBC…………………………………………………………... 132
Gráfico 143. Vista previa de la consulta JDBC……………………………………… 133
Gráfico 144. Resultado de la consulta JDBC……………………………………….. 133
Gráfico 145. Fuente Metadata………………………………………………………… 133
Gráfico 146. Examinar el Modelo Metadata…………………………………………. 133
Gráfico 147. Editando la consulta Metadata………………………………………… 134
Gráfico 148. Consulta Metadatos…………………………………………………….. 134
Gráfico 149. Vista previa de la consulta Metadatos………………………………... 134
Gráfico 150. Fuente OLAP……………………………………………………………. 135
Gráfico 151. Consulta MDX…………………………………………………………… 135
Gráfico 152. Vista previa de la consulta MDX………………………………………. 135
Gráfico 153. Publicar un Reporte…………………………………………………….. 136
Gráfico 154. Alojamiento del Reporte……………………………………………….. 136
Gráfico 155. Vista previa del reporte desde bi-server……………………………… 137
Gráfico 156. Estructura de directorios de la solución………………………………. 137
- 17 -
ÍNDICE DE TABLAS.
- 18 -
RESUMEN EJECUTIVO.
Por mucho tiempo nadie se ha preocupado por conocer como estuvo, como esta y
como puede estar la gestión educativa en la Dirección Distrital de Educación
Intercultural y Bilingüe del cantón Guaranda, e identificar en que componentes
fortalecer para enriquecer los procesos pedagógicos con el fin de responder a las
necesidades educativas locales, regionales, nacionales e internacionales.
- 19 -
ABSTRACT
For a long time no one has bothered to know it was like, like this and how it can be
educational management in the District Direction of Intercultural Bilingual
Education of the Canton Guaranda, and identify which components strengthened
to enrich teaching processes in order to respond local, regional, national and
international educational needs.
The system will follow the dataflow architecture with CE 5.2 Pentaho, ranging from
obtaining supplies, construction of Data Warehouse Metadata design models,
reports, construction of Cube OLAP analysis, and finally the implementation of
portal providing information to the end user.
The research methodology applied in the project had to do with several field
investigations, conducting surveys, making interviews with the different actors in
the unfolding of the investigation, which allowed ratification of the problem and
guide the solution.
The research on which this part of this graduation project has to do with
information and communication technologies.
- 20 -
INTRODUCCION
Antecedentes de la Investigación.
También se puede señalar el trabajo de: Galuth Irene García y Carmen Silvana
Murillo, 2008 con Su tema titulado: “Estudio de Herramientas Business
Intelligence para la implementación de un sistema de información gerencial en la
unidad de planificación de la ESPOCH”, donde se puede resumir: “Contar con
información válida y oportuna para la toma de decisiones puede marcar la
diferencia entre el éxito o el fracaso, por lo que se recomienda el uso de
Herramientas Business Intelligence acorde a las necesidades, tamaño y
capacidad financiera de las empresas”.
-1-
Por otro lado podemos señalar que la Ex Dirección Provincial de Educación
Hispana de Bolívar se desconcentro hace tres años atrás, formándose la
Dirección Distrital de Educación Intercultural y Bilingüe del cantón Guaranda,
desde aquel entonces empezaron a proliferar mucho más los datos, con el
transcurrir del tiempo, nadie se ha preocupado por procesarlos y analizarlos para
obtener información que apoye a la toma de decisiones.
-2-
Formulación del Problema
OBJETIVOS
Objetivo General.
Objetivos Específicos:
-3-
Validar la propuesta en base al criterio de expertos.
Idea a Defender
Justificación
-4-
proceso toma de decisiones en el campo de la informática, por todo esto se
justifica plenamente la realización de este trabajo de grado.
Metodología
-5-
señalan los objetivos específicos, la justificación y algunos aspectos informativos
generales.
Capitulo I.- El marco teórico, que constituye el fundamento científico del trabajo y
que se lo ha elaborado con información relacionada a los sistemas informáticos, a
las bases de datos y a las metodologías para construir el data warehouse,
Pentaho, se complementa finalmente con el proceso de toma de decisiones y la
gestión educativa.
Aporte Teórico.
Significación Práctica.
La significación Práctica puede ser vista desde tres aspectos que son:
-6-
El sistema de soporte a la toma de decisiones usa la arquitectura de flujo
de datos de Pentaho.
También se debe mencionar la aplicación de todos los conocimientos
adquiridos y aprendidos durante los tres semestres, esto implica que está
íntimamente ligada la teoría con la práctica.
Novedad Científica.
-7-
CAPITULO I
MARCO TEÓRICO
1.1 Sistemas.
Para (Gómez, 2010), la información se obtiene una vez que los hechos se
procesan, agregan y presentan de la manera adecuada para que puedan ser
útiles a alguien dentro de una institución o empresa, por lo que de este modo
estos datos organizados y procesados presentan un mayor valor que en su
estado original.
Datos Transformación,
agregación, presentación Información
-8-
1.1.1.1 Características que debe cumplir la información.
DIMENSIÓN
HUMANA
SISTEMAS DE
INFORMACIÓN
DIMENSIÓN
TECNOLÓGICA DIMENSIÓN
ORGANIZATIVA
-9-
1.1.2.1 Características de los sistemas de información.
Bloque Descripción
- 10 -
1.1.2.3 Clasificación de los sistemas de información.
Nivel estratégico
Nivel de Gestión
Nivel Operativo
- 11 -
Los Propietarios del sistema.-Son aquellos que fomentan el desarrollo y
funcionamiento del sistema, ellos pueden ser entidades públicas o privadas y sus
fines pueden ser muy variados.
Los diseñadores del sistema.-Son los que traducen los requerimientos de las
organizaciones en una solución técnica factible, ve al sistema en términos de un
plan de diseño para guiar la construcción del sistema final.
- 12 -
de un Sistema de Soporte a Decisiones garantiza la calidad y la integración de
los datos entre las diferentes unidades de la empresa.
Cada usuario dispone de información adecuada a su perfil. No se trata de
que todo el mundo tenga acceso a toda la información, sino de que tenga
acceso a la información que necesita para que su trabajo sea lo más eficiente
posible.
Disponibilidad de información histórica. En estos sistemas está a la orden
del día comparar los datos actuales con información de otros períodos
históricos de la compañía, con el fin de analizar tendencias, fijar la evolución
de parámetros de negocio. (Sinnexus, 2012)
- 13 -
1.1.4 Sistemas del Ministerio de Educación.
- 14 -
1.2 Bases de datos.
Primordialmente son dos los objetivos de una base de datos según (McLeod,
2010), uno de ellos es minimizar la redundancia de los datos (duplicación de los
datos) y el otro lograr la independencia de los datos (la capacidad de modificar la
estructura de los datos sin tener que modificar los programas que procesan los
datos).
Las aplicaciones de bases de datos suelen dividirse en dos o tres partes, esto es
lo que se denomina arquitectura dos o tres capas.
Usuario Usuario
Aplicación
Cliente de aplicaciones
Servidor de aplicaciones
Sistema de base
de datos Sistema de base de datos
- 15 -
sea explícita o implícita, se denomina sistema de administración de base de
datos.
Salida 1
Aplicación 1
Base de
Salida 2
datos
DBMS
Aplicación 1 Salida 3
Aplicación 1 Salida 4
Todas aquellas entidades, personas que de una u otra forma están integrados en
las operaciones de un sistema de gestión de base de datos cumplen diferentes
roles en la forma cómo interactúan con la base de datos. Así se puede citar los
siguientes roles:
Usuarios finales, son aquellos que usan los datos que están almacenados en
la base de datos.
- 16 -
Programadores de aplicación, quienes escriben código en cualquier lenguaje
para desarrollar software que utilizaran otros usuarios.
Administradores de la base de datos, son los responsables del diseño,
creación de la estructura y mantenimiento de una base de datos. (Ricardo,
2004)
Base de datos
- 17 -
(Edición gratuita para MAGIC
Linux) Microsoft Access
1.2.3.1 PostgreSQL.
Ventajas Desventajas
- 18 -
Puede operar sobre distintas En comparación con MySQL es más
plataformas, incluyendo Linux, lento en inserciones y actualizaciones.
Windows, Unix, Solaris y MacOS X.
Buen sistema de seguridad mediante la Límite del tamaño de cada fila de las
gestión de usuarios, grupos de usuarios tablas a 8kb
y contraseñas.
El término Data Warehouse fue acuñado por primera vez por (Bill Inmon, 2000), y
se traduce literalmente como almacén de datos. No obstante, y como cabe
suponer, es mucho más que eso. Según definió el propio Bill Inmon, un Data
Warehouse se caracteriza por ser:
- 19 -
Histórico: el tiempo es parte implícita de la información contenida en un Data
Warehouse. La información almacenada en el Data Warehouse sirve, entre
otras cosas, para realizar análisis de tendencias.
No volátil: el almacén de información de un Data Warehouse existe para ser
leído, pero no modificado.
Solo hay una salida verdadera del Data Warehouse: las decisiones que son
hechas después de que el Data Warehouse haya presentado las evidencias.
- 20 -
f) OLAP: actividad general de búsquedas para presentación de texto y
números del Data Warehouse, también un estilo dimensional especifico de
búsquedas y presentación de información. (Gutiérrez, 2005)
- 21 -
referencial), valores nulos, volumen de datos (1Pb) y rendimiento, solo índices
binarios, particiones, agregaciones, vistas materializadas), captura de cambios de
datos consiste en identificar qué datos han sido insertados, modificados o
borrados. (Bouman, 2009)
- 22 -
1.3.5.2 Metodología de Ralph Kimball.-Está basada en la elaboración de
experimentos y prototipos, no requiere grandes inversiones por que la idea
consiste en construir Data Marts independientes que se diseñan con detalle y
después se relacionen con otros Data Marts para formar un sistema completo.
- 23 -
1.3.7 Ciclo de vida de la Metodología de Ralph Kimball.
ENTRADA DESCRIPCION
Tema Área o Proceso de Negocio
Audiencia Para Quien es la Solución
Propietario Quien será el Propietario de la Solución.
Necesidad del Usuario Que necesita el usuario y como usara la
solución.
Preguntas a Responder Preguntas que serán respondidas por la
solución.
Beneficios de la Entidad. Que ganará la Entidad construyendo el
Data Warehouse.
Mecanismos de Entrega Emails, Gráficos, Reportes, Tableros de
Mando, Cubos de Datos.
- 24 -
Fuentes de Información. A que personas se puede preguntar
sobre la gestión Educativa.
Fuentes de Datos. De que sistemas y base de datos se
obtendrán los datos.
Estimación. Estimación de tiempo para desarrollar la
solución.
1.4 Pentaho.
Es una plataforma OSBI (Open Source Bussines Intelligence), que apoya a todo
el proceso de construcción del sistema Data Warehouse/Business Intelligence,
existen dos ediciones: Community (CE) y Enterprise (EE), fue programado con
Java y tecnologías relacionadas. (Murillo M. , Business Intelligence con Pentaho,
2015)
- 25 -
1.4.3 Plataforma de Pentaho Community Edition.
PSW
Analysis
PRD CDF
Reporting Dashboards
PDI PME
Data Reportes
Integration Ad hoc
1.4.3.1.1 ETL.
Los Proyectos de Pentaho Data Integration son construidos sobre dos tipos de
objetos: Transformaciones y JOBS (Trabajos). La herramienta de trabajo será
Spoon, anteriormente denominada Kettle.
- 26 -
1.4.3.1.2 Arquitectura de Pentaho Data Integration.
Soporta las siguientes fuentes de datos (Data Sets) JDBC, Modelo Metadatos,
Mongo DB, Pentaho Data Integration, OLAP, XML.
- 27 -
No Data.-Contenido a mostrar cuando el resultado de la consulta esta
vacía.
Watermark.-Marca de agua que mostrara como fondo en cada reporte.
ESQUEMA DE
MONDRIAN
(ARCHIVO XML)
MOTOR ROLAP
MONDRIAN
- 28 -
1.4.3.3.2 Mondrian.- Es una de las aplicaciones más importantes de la plataforma
Pentaho BI es un servidor OLAP open source que gestiona la comunicación entre
una aplicación OLAP (escrita en Java) y la base de datos con los datos fuente, es
decir, Mondrian actúa como “JDBC para OLAP”. (Gravitar, 2015)
- 29 -
1.4.3.4 Community Dashboard Framework (CDF).-Tablero de mando, muestra
indicadores claves; pero se necesita un buen conocimiento en HTML5, CSS y
JavaScript para desarrollarlas.
Pentaho tiene soporte para acceder y almacenar metadatos a través de una capa
de metadatos llamada Pentaho Metadata Layer (PML).
La capa de metadatos permite: Describir tablas y columnas en términos claros,
define los niveles de autorización, permite tener datos pre formateados; además
minimiza el impacto en los cambios del modelo dimensional del Data Warehouse.
Metadata Query
Language.
Basada en la
Especificación
CWM (Common
Warehouse
Metamodel,
OMG)
- 30 -
1.4.3.5.2 Capas de un modelo Metadatos:
- 31 -
De acuerdo al nivel y a la complejidad de análisis, las actividades de inteligencia
pueden ser agrupadas en tres categorías: a) Reporteo. b) Procesamiento
Analítico en línea. c) Minería de Datos.
- 32 -
Se debe verificar si la decisión a tomar es programada o no programada. En el
primer caso nos referimos a decisiones que se toman sobre problemas
estructurados o rutinarios, problemas comunes en la organización, por lo cual
estas decisiones se toman basándose en los conocimientos previos y criterios
previamente definidos, reglas, pautas o principios.
Por otro lado, según (Barreto, 2007) las decisiones no programadas son
aquellas que se toman frente a problemas sin estructurar, problemas nuevos,
no rutinarios, que requieren una solución específica.
Se deben definir las condiciones límites, estas son: los fines, metas y
condiciones que debe satisfacer la decisión.
Se debe confirmar que la decisión a la cual se llegó es la correcta antes de
ponerla en práctica.
Llevar la decisión a la práctica. Esta es la parte que exige más tiempo.
La retroalimentación. Es muy importante que luego de poner en práctica la
decisión se analice si la misma está llevando a los resultados buscados.
(Caceres, 2014)
1.8 La Gestión.
La gestión tiene dos aspectos en su campo de acción uno de ellos tiene que ver
con la acción y efecto de gestionar y la segunda con la acción y efecto de
administrar. La idea de gestión está relacionada al direccionamiento y a los
resultados, es por eso que la gestión más que hacer en forma directa, crea las
condiciones para el mejor hacer del colectivo institucional.
Para (Blejmar, 2009) la gestión es una intervención en doble sentido, por lo cual
la gestión crea condiciones, construye escenarios adecuados, provee
capacidades e instrumentos a los equipos de trabajo, además señala que la
gestión no es un evento, no es una sola acción.
- 33 -
deseo cualquiera. Se desprende entonces que gestionar es hacer las acciones o
trámites necesarios para conseguir un objetivo.
1.8.1 Administrar.
- 34 -
1.8.3.1 Importancia del PEI.
Práctico.
•Integrador
Inclusivo
Generador
Flexible
•Generador
- 35 -
1.8.5 Gestión Educativa.
- 36 -
En ese marco, el Nuevo Modelo persigue la desconcentración de la Autoridad
Educativa Nacional, a su vez, una nueva práctica de realización del servicio
público (mejor distribución de personal capacitado e idóneo); así como la
racionalización recursos, distribución de competencias y responsabilidades.
Objetivo General.
Objetivos Específicos:
regulación.
Educativos.
- 37 -
Gráfico 22. Desconcentración del Ministerio de Educación.
Fuente: (http://www.educacion.gob.ec)
- 38 -
1.9 Conclusiones parciales del Capítulo.
Hoy en día los datos existen en múltiples fuentes, tienen un gran valor, razón
que dándoles el tratamiento adecuado, pueden generar conocimiento y apoyar
en el análisis y la toma de decisiones.
Todo Data Warehouse tiene al menos una Dimensión Fecha y una Tabla de
análisis (hechos.)
- 39 -
CAPITULO II
MARCO METODOLÓGICO
- 40 -
Es la institución que fomenta el desarrollo de la educación y el acervo cultural, y
asegura el acceso a la misma a toda la población Guarandeña; por ello, debe
promover el mejoramiento y democratización en su accionar, impulsa la
planificación, organización, gestión y evaluación de las actividades académico-
administrativas de la institución que contribuyen al análisis, estudio y solución de
los problemas vitales que afectan a la comunidad educativa y sociedad local y
nacional.
Entre otras fortalezas que dispone es la ética y la capacidad para actuar ante
situaciones que se presentan. Además, de tener una proyección de una entidad
emprendedora con enfoque de calidad, comprometida con el desarrollo social y
respetuoso de la diversidad e interculturalidad.
- 41 -
2.1.1 Misión. Garantizar el acceso y calidad de la educación inicial, básica y
bachillerato a los y las habitantes del territorio nacional, mediante la formación
integral, holística e inclusiva de niños, niñas, jóvenes y adultos, tomando en
cuenta la interculturalidad, la plurinacionalidad, las lenguas ancestrales y género
desde un enfoque de derechos y deberes para fortalecer el desarrollo social,
económico y cultural, el ejercicio de la ciudadanía y la unidad en la diversidad de
la sociedad ecuatoriana.
- 42 -
2.2 DESCRIPCIÓN DEL PROCEDIMIENTO METODOLÓGICO
2.2.1 Modalidad de la Investigación
- 43 -
El segundo estrato está representado por treinta y cuatro Autoridades de las
instituciones educativas de Educación media. Estos dos estratos pertenecientes a
la ciudad de Guaranda y sus áreas de influencia por lo que la población queda de
la siguiente manera.
- 44 -
recopilará la información existente en libros, revistas e internet y se la sintetizará
en el denominado marco teórico.
- 45 -
2.2.4.1.-Encuesta Aplicada a los Servidores Públicos de la Dirección Distrital
de Educación del cantón Guaranda, 2014.
Pregunta Nro. 1
Título: ¿Considera que existen datos históricos del rendimiento académico que
deberían ser procesados y analizados para que sirvan de soporte a la toma de
decisiones?
Variable Frecuencia Porcentaje
A veces 3 4%
Siempre 70 96%
Nunca 0 0%
Total 73 100%
Siempre
96%
ANALISIS E INTERPRETACION:
- 46 -
Pregunta Nro. 2
Si 2 3%
No 71 97%
Total 73 100%
3%
97%
Si No
ANALISIS E INTERPRETACION.
- 47 -
Pregunta Nro. 3
Físico 39 54%
Digital 25 34%
Total 73 100%
Físico
Digital
Fuente: El Autor
ANALISIS E INTERPRETACION
- 48 -
Pregunta Nro. 4
Si 11 15%
No 62 85%
Total 73 100%
Si
15%
No
85%
Si No
ANÁLISIS E INTERPRETACIÓN
- 49 -
Pregunta Nro. 5
Título: Dispone de infraestructura tecnológica el departamento de ciencia y
tecnología, de su Dirección Distrital para implementar el Sistema de soporte a la
toma de decisiones?
Si 73 100%
No 0 0%
Total 73 100%
No
0%
Si
100%
Si No
ANALISIS E INTERPRETACION
- 50 -
2.2.4.2.-Encuesta dirigida a las autoridades de las instituciones educativas
de educación media de la Dirección Distrital de Educación del cantón
Guaranda, 2014.
Pregunta Nro. 1
Título: ¿Considera usted que los Servidores Públicos de la Dirección Distrital de
Educación en varias ocasiones solicitan información repetitiva?
Siempre
75%
ANALISIS E INTERPRETACION
- 51 -
Pregunta Nro. 2
Título: ¿Usted está consiente que la falta de un sistema de soporte a la toma de
decisiones incide negativamente en el mejoramiento de la gestión educativa?
SI 54 74%
NO 19 26%
Total 73 100%
26%
74%
Si No
ANALISIS E INTERPRETACION
- 52 -
Pregunta Nro. 3
Título: ¿Cuál cree que sería el mejor medio tecnológico para facilitar el flujo de
información?
CD 7 9%
Email 13 18%
Total 73 100%
18% 9%
73%
ANALISIS E INTERPRETACION
En el grafico podemos observar y evidenciar que la mayoría de autoridades
educativas están conscientes que se debería utilizar formularios web para
canalizar la entrega de la información e ir automatizando los procesos, una
minoría decide mantener la manera tradicional del correo electrónico y CD.
- 53 -
Pregunta Nro. 4
SI 73 100%
No 0 0%
Total 73 100%
USO DE LA INFORMACIÓN
No
0%
Si
100%
Si No
ANALISIS E INTERPRETACION
- 54 -
Pregunta Nro. 5
Título: Considera necesario implementar un sistema de soporte a la toma de
decisiones en la Dirección Distrital de Educación, para trasformar los datos en
información y obtener indicadores claves de la realidad de la educación.
Si 73 100%
No 0 0%
Total 73 100%
Si
100%
Si No
Fuente: El Autor
ANALISIS E INTERPRETACION.
Todas las autoridades de las instituciones educativas están de acuerdo que se
implemente un sistema de soporte a la toma de decisiones, para poder identificar
en que componentes educativos mejorar y encaminar hacia la excelencia
educativa.
- 55 -
2.2.4.3 Resumen de la entrevista aplicada a la Directora Distrital de
Educación Intercultural y Bilingüe del Cantón Guaranda.
- 56 -
modalidad la presencial.
semipresencial, en
relación a la
presencial?
- 57 -
2.4 Conclusiones parciales del Capítulo.
La problemática existe y cada vez se acentúa más, eso significa que se están
tomando decisiones muy poco eficientes, es decir sin datos de respaldo.
- 58 -
CAPITULO III
MARCO PROPOSITIVO
3.1 Tema.
- 59 -
3.4.2 Preparación de un Proyecto Data Warehouse.
3.4.3 Alcance
3.4.4 Fundamentación.
- 60 -
3.4.5 Planificación del Proyecto.
Desarrollador: El Autor.
Mensualmente se realiza una reunión para monitoreo del avance del proyecto por
parte del Director del Proyecto y el Autor. El Cronograma de Actividades de
encuentra en el Anexo # 05.
- 61 -
¿Qué género es el que mejor rendimiento reporta por años?
Dimensiones Fecha
Candidatas: Institución Educativa
Estudiante
Titulo
Ubicación Geográfica.
Indicadores Nota final de grado.
Candidatos:
- 62 -
Gráfico. 26 Entorno Back Room
Fuente: El Autor
Todos los análisis, informes y reportes serán visualizados a través del Portal de
entrega de información de Pentaho CE 5.2, por medio de un navegador de
internet.
- 63 -
Hibernat Quartz Jacckrabit
3.6.3 Arquitectura de flujo de datos con Pentaho. e
Metadatos
PENTAHO BI SERVER
Reportes a
M
Demanda
Base de Datos. PENTAHO E (Ad Hoc)
-Oracle
META T
-My SQL A
DATA D WQR Reportes
-Postgres
Metadatos EDITOR
A Simples
T
PDI_REPO O
(PME) S
PDI_REPO
PENTAHO
Archivos de
ETL REPORT
texto. ETL
Cvs DESIGNER (PDI) Reportes
Txt STAGE DWH Avanzados
PENTAHO
PENTAHO DATA INTEGRATION
SCHEMA
WORKBENCH
Cubos OLAP
(PSW)
- 64 -
http://sourceforge.net/projects/pentaho/files/Business%20Intelligence%20Server/
- 65 -
3.8 Modelamiento Dimensional.
3.8.1.1 Dimensiones.
3.8.1.2 Hechos.
Un hecho representa una medida para el análisis. (Ejemplo: Nota del Proyecto de
grado). Los hechos son CUANTITATIVOS.
PREFIJO ALCANCE
STG_ Para tablas de almacenamiento temporal.
DIM_ Para tablas de dimensiones.
FACT_ Para tabla de hechos.
- 66 -
c) Modelar una Dimensión para para la fecha utilizando el formato
AAAAMMDD
d) Tener un Registro (Desconocido) en cada Dimensión en vez de Null.
- 67 -
Nueva Situación.
Nueva Situación.
3.12.3 Slowly Changing Dimensions -Tipo 3.- Consiste en agregar una columna
por cada una que se quiera registrar el cambio.
Situación Actual.
Nueva Situación.
- 68 -
3.13 Diseño Físico del Data Warehouse.
Se utilizó SQL Power Architect para crear el modelamiento dimensional del Data
Warehouse. La herramienta lo podemos descargar desde el siguiente link:
http://www.sqlpower.ca/page/architect_download_os
Instalación.
Configuración.
Tabla DIM_FECHA
Tabla DIM_TITULO
- 70 -
VERSION Control de Cambios INTEGER - -
Tabla DIM_ESTUDIANTE
Tabla DIM_UBICACION_GEOGRAFICA
- 71 -
SK_UBICACION_ Clave Subrogada de la INTEGER - PK
GEOGRAFICA dimensión ubicación geográfica..
Tabla DIM_INSTITUCION_EDUCATIVA
- 72 -
JORNADA Nombre de la Jornada VARCHAR 20 -
Tabla FACT_RENDIMIENTO_ACADEMICO.
- 73 -
3.14 Herramienta Auxiliar para limpieza de datos fuente.
http://sourceforge.net/projects/datacleaner/files/datacleaner%20%28stable%29/
http://sourceforge.net/projects/pentaho/files/Data%20Integration/
- 74 -
3.15.2 Configuración del Repositorio.
Requisitos
Conexión al repositorio
stage
- 75 -
3.15.4.2 Trabajos (Jobs).-Consiste en una colección de transformaciones o
Steps de trabajos, cada steep del trabajo indica una tarea del proceso ETL y la
salida de un Steep de trabajo produce un Status de ejecución.
Definen el flujo del proceso ETL, contiene los metadatos del proceso ETL:
Descripción de los datos, fuentes de entrada y salida, Planificador.
Dar doble clic en Microsoft Excel Input para ver las propiedades del Steep y
configurar la conexión a la fuente de datos.
- 76 -
examinar la ubicación de nuestra fuente de datos, posteriormente damos clic en el
botón Add. Quedando de la siguiente manera:
- 77 -
Posterior a esto nos dirigimos a la pestaña !Fields y damos clic en el botón Get
fields from header row y nos mostrara todos los campos con el tipo dato asociado
de la fuente de datos.
- 78 -
Propiedades del Steep Select Values.
Dar doble clic en el Steep Select Values, donde podemos visualizar si los campos
de la fuente de datos son amigables es decir (Que no contengan caracteres
especiales, ni sean demasiado extensos); caso contrario en estas propiedades lo
podemos renombrar
- 79 -
Gráfico. 38. Configuración de la conexión al repositorio de datos stage.
Fuente: El Autor
- 80 -
Gráfico. 40. Proceso de Creación de la tabla stg_matriz_excel.
Fuente: El Autor
- 81 -
Gráfico. 42. Vista Previa de la Transformación.
Fuente: El Autor
Ejecución de la Transformación.
Dar clic en el botón Ejecutar que muestra la imagen encerrado en un círculo rojo
y posteriormente dar clic en el botón Launch.
- 82 -
Con esta transformación cargamos los datos fuente al repositorio temporal stage;
cuando nos visualiza los vistos de color verde sobre los steeps, nos indica que
todo está correctamente configurado, caso contrario tendremos que revisar la
sección de Logging para identificar el error.
Para crear la transformación ETL Carga Dimensión Fecha se utilizó varios steeps:
- 83 -
3.15.6.3 ETL-Carga Dimensión Estudiante.-Es el flujo de datos que transporta
los datos fuente almacenados en el repositorio temporal stage al Data
Warehouse.
- 84 -
3.15.6.4 ETL- Carga Dimensión Titulo.- Es el flujo de datos que transporta los datos
fuente de la base de datos temporal stage al Data Warehouse.
- 85 -
3.15.6.7 ETL-Carga Tabla de Hechos.- Es el flujo de datos que obtiene las
claves subrogadas de cada Dimensión, para insertarlas en el Data Warehouse.
- 86 -
Gráfico. 51. Propiedades del Steep Insert Update.
Fuente: El Autor
- 87 -
Se utilizó el Steep Transformation para referenciar a la transformación
que contiene la carga de la fuente de datos Excel al repositorio
temporal Stage.
- 88 -
Gráfico. 55. JOB Carga Data Warehouse
Fuente: El Autor
- 89 -
3.16 Crear un Modelo Metadatos, con Pentaho Metadata Editor (PME).
http://sourceforge.net/projects/pentaho/files/Pentaho%20Metadata/
Gráfico. 57. Interfaz de Pentaho Metadata editor y configuración de conexión del DWH.
Fuente: El Autor
3.16.2 Pasos para construir un modelo metadatos.
- 90 -
-A nivel de Capa Lógica Se dio formato a los campos numéricos usando la
propiedad Mask for number or Date utilizando el valor (#.00), además se creó el
campo calculado definiendo la formula [promedio_edu_basica] +
[promedio_bachillerato] + [nota_proyecto_grado] + [promedio_examen_grado],
marcar la propiedad is the Formula Exact y definir la propiedad Default
Aggregation.
Finalmente utilizar Query Editor para verificar que el modelo este correcto y
publicar el modelo de metadatos a bi server.
- 91 -
3.17 Construcción del Cubo de análisis OLAP, con Pentaho Schema
Workbench.
El Cubo de análisis OLAP, lo construiremos utilizando Pentaho Schema
Workbench.
http://sourceforge.net/projects/pentaho/files/Data%
Pasos:
File/New/Schema.
- 92 -
Gráfico. 61. Crear Nuevo Schema
Fuente: El Autor
3.17.4 Agregar la Tabla de Hechos.-Dar Clic derecho sobre el cubo y elegir Add
Table, luego en la etiqueta name seleccionar la tabla de hechos del modelo
dimensional. (fact_rendimiento_academico)
- 93 -
Gráfico. 64. Agregar Tabla de Hechos.
Fuente: El Autor
- 94 -
Gráfico. 66. Agregar la Dimensión Fecha.
Fuente: El Autor
- 95 -
Gráfico. 68. Agregar la tabla de la Dimensión Fecha, del modelamiento dimensional.
Fuente: El Autor
Dimensión Estudiante.
- 96 -
Dimensión Ubicación Geográfica.
- 97 -
3.17.6 Agregar Sub Niveles.- Consta el orden de la Jerarquía de mayor a menor.
Agregar Sub Nivel Año.- Dar clic derecho sobre (Default) y seleccionar Add
Level, en la etiqueta name digitar anio sin caracteres especiales como consta en
el modelo dimensional y en la etiqueta caption escribir Año, como va a visualizar
el usuario; en la etiqueta column seleccionar el campo anio del modelo
dimensional, en Type, seleccionar String, en levelType marcar sobre TimeYears
y en hideMemberlf, dejar en Never.
- 98 -
Schema Workbench posee de un texto de ayuda que guía la construcción de los
cubos Olap, en el caso de nuestro proyecto en el texto de ayuda nos indica que el
Cubo debe contener al menos una medida.
3.17.7 Agregar Medidas.-Dar clic derecho sobre el Cubo y marcar Add Measure;
en la etiqueta name digitar el nombre sin caracteres especiales, en la etiqueta
caption escribir el nombre de la medida como va a mostrar al usuario, en column
seleccionar la medida de la tabla de hechos del modelo dimensional y la función
de agregación (aggregator) seleccionar avg, que significa (Promedio)
- 99 -
Gráfico. 77. Verificación del Cubo con MDX Query.
Fuente: El Autor
Medida Promedio Bachillerato.
- 100 -
Medida Promedio Exámenes de Grado.
- 101 -
3.17.9 Publicar un Cubo OLAP
Pasos.-Dar clic en File, después en Publish, digitar el nombre de usuario y
contraseña de Pentaho. Además escribir el nombre del Data Warehouse con el
que está configurado bi-server y solo por primera vez marcar la casilla Register
XMLA Data Source, las futuras publicaciones ya no se marcara la casilla.
- 103 -
Gráfico 84. Desactivar las Actualizaciones Automáticas de JAVA.
Fuente.- El Autor.
- 104 -
Gráfico 86.- Configuración de la variable Path.
Fuente.- El Autor.
Para verificar que la instalación y configuración se realizó exitosamente, abrir una
consola de comando y ejecutar el comando java –version
Nos mostrara los miles segundos una vez que esté listo el ServidorTomcat
- 105 -
Gráfico 89.- Consola de Usuario de Pentaho.
Fuente: El Autor
Password: password
- 106 -
Pentaho BI Server 5.2 viene con la Base de Datos HSQLDB, no recomendable
para ambientes de producción, por lo que nuestra solución la instalaremos en un
motor de base datos más robustos como es PostgreSQL 9.3.
Prerrequisitos:
- 107 -
En la base de datos quartz debemos conectarnos a la base de datos postgres con
el comando \connect postgres postgres.
-Configuración de Tomcat.
- 108 -
Gráfico 92.- Edición de Context XML
Fuente: El Autor
Eliminar el archivo: pentaho.xml del directorio: \biserver-
ce\tomcat\conf\Catalina\localhost
<config-file>
system/hibernate/system/hibernate/postgresql.hibernate.cfg.xml
</config-file>
- 109 -
Paso 2.-Editar el archivo: applicationContext-spring-security-
hibernate.properties
-Des comentar la línea 114 a la 125. Comentar la línea 129. (Configuración del
Data Store.)
-Des comentar la línea 214 a la 221. Comentar la línea 225 a la 227. Des
comentar la línea 262 a la 269. Comentar la línea 273 a la 276. (Configuración del
Workspace)
- 110 -
-Des comentar la línea 344 a la 351. Comentar la línea 354 a la 356. Des
comentar la línea 392 a la 399. Comentar la línea 402 a la 405. (Configuración del
Versionamiento)
\biserver-ce\tomcat\work\Catalina
\biserver-ce\tomcat\temp
\biserver-ce\pentaho-solutions\system\osgi\cache
\biserver-ce\pentaho-solutions\system\jackrabbit\repository (El Directorio)
- 111 -
b) Asignar Rol de Administrador y conceder permisos.
- 112 -
Refrescar el navegador de Internet, presionando la combinación de teclas
(Ctrl+Shif+R)
Pasos:
-Ir al directorio pentaho-solutions/ system
-Editar el archivo Pentaho.xml.
-Ubicar la etiqueta Login Show simple
users hint cambiar a false.
-Guardar
Nota: Este procedimiento debe ser realizado con el Servidor Tomcat detenido.
Pasos:
-Ir a Perspectiva Marketplace
-Ubicar el pluggin WAQR
-Dar clic en Install/Ok
-Reiniciar el Servidor Tomcat.
- 113 -
3.19.5.1 Quitar las Alertas de WAQR.
Ir al Directorio \biserver-ce\pentaho-solutions\system\waqr\resources.
Editar el Archivo waqr.html
Comentar el Contenido desde la línea 448 hasta la 460. (Iniciar el
comentario <!-- Finalizar -->)
Refrescar el Navegador de Internet.
- 114 -
3.19.7 Reportes con WAQR.
a) Una vez publicado un modelo metadatos desde Pentaho Metada Editor al
servidor Pentaho, debemos verificar la publicación del modelo desde el
portal de entrega de información y la opción Gestionar Fuente de Datos.
- 115 -
Gráfico 107.- Procedimiento de Generación de Reporte a demanda
Fuente: El Autor
- 116 -
Gráfico 109.- Reporte a demanda
Fuente: El Autor
Nota: Para evitar inconvenientes con los caracteres especiales en pentaho 5.2
hay que cambiar el encoding de Pentaho a UTF-8.
- 117 -
Gráfico 111.- Explorar el Cubo OLAP
Fuente: El Autor
- 118 -
En el siguiente grafico focalizamos el análisis por años, tipo de título y la nota
final de grado de los estudiantes por género de una institución educativa.
En esta tabla pivoteable, podemos cambiar el orden; que las filas se conviertan en
columnas y viceversa, empleando el botón intercambiar ejes.
También podemos entrar en detalle, haciendo clic en el botón del mismo nombre
y hacer en el análisis OLAP Drill Down cuando desplegamos y Drill Up cuando
regresamos.
- 119 -
Gráfico 115.- Vista del Cubo haciendo Drill Down y Drill Up.
Fuente: El Autor
Además podemos mostrar los datos de origen, dando clic en el botón mostrar
datos de origen y también permite ordenar los datos, haciendo clic en la viñeta de
la medida.
- 120 -
Gráfico 117-. MDX Query Editor.
Fuente: El Autor
El visor Jpivot, también puede mostrar gráficos, haciendo clic en el Icono Mostrar
Grafico.
- 121 -
3.19.9.1 Quitar las Alertas de Jpivot.
Ir al Directorio C:\pentaho\biserver-c\/pentaho-solutions\system\pentaho-
jpivot-plugin\jpivot\table
Editar el archive mdxtable.css.
Al final del Archivo colocar lo siguiente:
#deprecatedWarning {
display: none;
}
Pasos:
-Ir a Perspectiva
Marketplace
-Ubicar el pluggin Saiku
Analytics
-En Available, elegir la
versión (Stable) -Dar
clic en Install/Ok
-Reiniciar el Servidor
Tomcat
- 122 -
3.19.10.2 Instalar Saikus Analytics Chart Plus.
- 123 -
Gráfico 124.- Visor Saiku Analytics.
Fuente: El Autor
- 124 -
Además permite analizar mediante gráficos.
Análisis Global
Gráfico 129.-. Análisis con Saiku Analytics, con el tipo de gráfico line.
Fuente: El Autor
- 125 -
Gráfico 130.- Análisis con Saiku Analytics, con el tipo de gráfico Múltiple bar Chart.
Fuente: El Autor
Gráfico. 131. Análisis con Saiku Chart Plus, con el tipo de gráfico bar.
Fuente: El Autor
Gráfico 132.- Análisis con Saiku Analytics, con el tipo de gráfico Sunburst
Fuente: El Autor
- 126 -
3.20 Reportes con Pentaho Report Designer (PRD).
http://sourceforge.net/projects/pentaho/files/Report%20Designer/
- 127 -
Editar el archivo creado con Notepad ++ y digitar el siguiente código, donde
ce\tomcat\webapps\pentaho\WEB-INF.
- 128 -
3.20.3 Iniciar Pentaho Report Designer.
Fuente: El Autor
- 129 -
3.20.4 Construcción del Reporte Institucional.
Con Pentaho Report Designer creamos nuestra plantilla, misma que servirá para
nuestros futuros reportes. Está compuesta por Bandas, mismas que se pueden
mostrar y ocultar desde la sección Structure. Para nuestra plantilla utilizamos las
siguientes herramientas y atributos en cada banda:
Fuente: El Autor
Fuente: El Autor
- 130 -
HERRAMIENTA USO DESTINO/BANDA CONTENIDO
Crear Etiquetas No Data Digitar un texto que haga
Label.
de texto. referencia que no existen
datos para la consulta, dar
formato al texto.
Tabla 28.- Herramientas utilizadas en la Banda No Data
Fuente: El Autor
- 131 -
3.20.5 Reporte utilizando como fuente JDBC.
Ir a la sección Data, Data Sets, clic derecho, elegir JDBC. (En esta sección
podemos visualizar el tipo de fuentes soportadas por Pentaho Report Designer)
- 132 -
Se puede visualizar el resultado de la consulta en la sección Data Sets, donde se
debe arrastrar cada viñeta a la banda Details, para ejecutar una vista previa y
publicar a bi-server.
Realizar el procedimiento anterior del reporte JDBC, en Data Sets hay que
seleccionar Metadata.
- 133 -
Crear la conexión al dwh_edu y crear una nueva consulta haciendo clic en el
icono de edit the Selected Query nos mostrara el modelo metadatos listo
para crear el análisis que deseemos, simplemente llevar los campos haciendo clic
en las flechas de color verde.
- 134 -
3.20.7 Reporte utilizando como fuente un Cubo OLAP.
Crear la conexión al dwh_edu y crear una nueva consulta haciendo clic (+)
- 135 -
3.20.8 Guardar y Publicar Reportes.
- 136 -
Hacemos doble Clic en el nombre del Reporte “Mi primer reporte utilizando
Pentaho Report Designer”
- 137 -
3.21 Implementación
Fuente. El Autor
- 138 -
3.24 CONCLUSIONES:
- 139 -
3.25 RECOMENDACIONES.
- 140 -
BIBLIOGRAFIA
Adrián Sergio Pulvirenti, M. C. (2011). Pentaho Data Integration 4 Cookbook. Packt Publishing Ltd.
Blejmar, B. (2009). Gestionar es hacer que las cosas sucedan. Buenos Aires: Novedades
Educativas.
Bouman, R. (2009). Pentaho Solutions: Business Intelligence and Data Warehousing with Pentaho
and MySQL. Estados Unidos: WILEY.
Chiavenato, I. (01 de 2008). Promo Negocios. Net. Obtenido de Promo Negocios. Net:
http://www.promonegocios.net/administracion/definicion-administracion.html
Dongen, R. B. (2009). Pentaho Solutions Bussines Intelligence an Data Warehousing with Pentaho
and MySql. Indiana: WILEY.
-1-
Fuentes, J. (2009). Gestión Escolar. México.
Hernandez, G. (13 de 06 de 2012). Data Mart (Mercado de Datos). México, México, México.
Laudon Kenet, Laudon Jane. (2008). Sistemas de información gerencial. México: Prentice-Hall.
McLeod, D. (2010). Introducción a los sistemas de base de datos. Venezuela: Pearson Prentice
Hall.
-1-
Ministerio de Educación del Ecuador. (11 de Diciembre de 2014). Ministerio de Educación.
Recuperado el 11 de Diciembre de 2014, de www.educacion.gob.ec
Murillo, I. C. (12 de 11 de 2012). Data Warehousing y Business Intelligence con herramientas Open
Source. Obtenido de http://ingmmurillo-dwh-bi.blogspot.com
Murillo, M. (18 de 05 de 2012). Data Warehousing y Business Intelligence con herramientas Open
Source . Obtenido de Data Warehousing y Business Intelligence con herramientas Open
Source : http://ingmmurillo-dwh-bi.blogspot.com
Murillo, M. (Enero de 2013). Data Warehousing Básico con Pentaho. Quito, Pichincha, Ecuador.
Murillo, M. (Marzo de 2015). Business Intelligence con Pentaho. Quito, Pichincha, Ecuador.
OpenRed. (05 de Agosto de 2014). Open Red Soluciones en Software Libre. Recuperado el 11 de
Marzo de 2015, de http://www.openred.es
Pérez César, Santin Daniel. (2007). Data mining, soluciones con enterprise miner. México:
Alfaomega.
Pérez, E. (22 de Mayo de 2008). Data Warehouse, Modelo, Conceptos e Implementación orientada
a SQL Server. Obtenido de Data Warehouse, Modelo, Conceptos e Implementación
orientada a SQL Server: http://www.monografias.com/trabajos57/data-warehouse-
sql/data-warehouse-sql.shtml
QUINTERO, B. (2008). Mineria de datos para los Sistemas Gestores de Base de Datos. Mexico.
Robert Anthony y Vijay Govindarajan. (2007). Management Control Systems. Nueva York:
McGraw-Hill/Irwin.
Thomas Lockhart. (01 de Mayo de 2000). Manual del usuario de PostgreSQL. Australia. Obtenido
de http://palomo.usach.cl/Docs/postgres/Postgres-Tutorial.pdf
Todo BI: Business Intelligence, Open Source, Big Data y mucho más. (2015). Todo Bi - Business
Intelligence. Obtenido de Todo Bi - Business Intelligence: http://todobi.blogspot.com
-1-
ANEXOS
Anexo # 01
Pregunta Nro. 1
Título: ¿Considera que existen datos históricos del rendimiento académico que
deberían ser procesados y analizados para que sirvan de soporte a la toma de
decisiones?
A veces ( ) Siempre ( ) Nunca ( )
Pregunta Nro. 2
Si ( ) No ( )
Pregunta Nro. 3
Título: ¿Qué formato se utiliza para la entrega y recepción de información
entre la Dirección Distrital de Educación y las instituciones?
Pregunta Nro. 4
Título: ¿Usted lleva el control y organización de sus datos digitales?
Si ( ) No ( )
Pregunta Nro. 5
Título: Dispone de infraestructura tecnológica el departamento de ciencia y
tecnología, de su Dirección Distrital para implementar el Sistema de soporte a la
toma de decisiones?
Si ( ) No ( )
Anexo # 02
Pregunta Nro. 2
Título: ¿Usted está consiente que la falta de un sistema de soporte a la toma de
decisiones incide negativamente en el mejoramiento de la gestión educativa?
Si ( ) No ( )
Pregunta Nro. 3
Título: ¿Cuál cree que sería el mejor medio tecnológico para facilitar el flujo de
información?
CD ( ) Formulario Web ( ) Email ( )
Pregunta Nro. 4
Si ( ) No ( )
Pregunta Nro. 5
Título: Considera necesario implementar un sistema de soporte a la toma de
decisiones en la Dirección Distrital de Educación, para trasformar los datos en
información y obtener indicadores claves de la realidad de la educación.
Si ( ) No ( )
Anexo # 03
CRONOGRAMA
Instalación de Postgres.9.3
Lo podemos descargar desde: http://www.postgresql.org/download/
Foto de la Implementación.
Anexo # 12
COSTO
Cada Etapa del proyecto que se efectúo tiene un costo asociado:
ACTIVIDAD COSTO DE LA
ETAPA
Planeación del Proyecto $500
Diseño Técnico de la Arquitectura $100
Selección e Instalación del producto $300
Definición de Requerimientos $150
Modelamiento Dimensional $200
Diseño Físico $250
Diseño y Desarrollo ETL $300
Especificación de Aplicaciones BI $100
Desarrollo de la Aplicación $500
Implantación $50
Mantenimiento y Crecimiento $0
Gestión Total del Proyecto $2.450
Anexo # 13
Anexo # 14
Script. Carga Dimensión Fecha.
;
ALTER TABLE dim_fecha ADD COLUMN anio_KTL DOUBLE PRECISION;
UPDATE dim_fecha SET anio_KTL=anio;
ALTER TABLE dim_fecha DROP COLUMN anio;
ALTER TABLE dim_fecha RENAME anio_KTL TO anio;
;
ALTER TABLE dim_fecha ADD COLUMN mes_KTL DOUBLE PRECISION;
UPDATE dim_fecha SET mes_KTL=mes;
ALTER TABLE dim_fecha DROP COLUMN mes;
ALTER TABLE dim_fecha RENAME mes_KTL TO mes;
;
ALTER TABLE dim_fecha ADD COLUMN nombre_mes_KTL VARCHAR(10);
UPDATE dim_fecha SET nombre_mes_KTL=nombre_mes;
ALTER TABLE dim_fecha DROP COLUMN nombre_mes;
ALTER TABLE dim_fecha RENAME nombre_mes_KTL TO nombre_mes;
;
Anexo # 15
;
ALTER TABLE dim_estudiante ADD COLUMN nombres_KTL TEXT;
UPDATE dim_estudiante SET nombres_KTL=nombres;
ALTER TABLE dim_estudiante DROP COLUMN nombres;
ALTER TABLE dim_estudiante RENAME nombres_KTL TO nombres;
;
ALTER TABLE dim_estudiante ADD COLUMN sexo_KTL VARCHAR(6);
UPDATE dim_estudiante SET sexo_KTL=sexo;
ALTER TABLE dim_estudiante DROP COLUMN sexo;
ALTER TABLE dim_estudiante RENAME sexo_KTL TO sexo;
;
CREATE INDEX idx_dim_estudiante_lookup ON dim_estudiante(pk_cedula, nombres)
;
Anexo # 16
;
CREATE INDEX idx_dim_titulo_lookup ON dim_titulo(pk_titulo, tipo_titulo)
;
Anexo # 17
;
ALTER TABLE dim_institucion_educativa ADD COLUMN institucion_KTL TEXT;
UPDATE dim_institucion_educativa SET institucion_KTL=institucion;
ALTER TABLE dim_institucion_educativa DROP COLUMN institucion;
ALTER TABLE dim_institucion_educativa RENAME institucion_KTL TO institucion;
;
ALTER TABLE dim_institucion_educativa ADD COLUMN circuito_KTL TEXT;
UPDATE dim_institucion_educativa SET circuito_KTL=circuito;
ALTER TABLE dim_institucion_educativa DROP COLUMN circuito;
ALTER TABLE dim_institucion_educativa RENAME circuito_KTL TO circuito;
;
ALTER TABLE dim_institucion_educativa ADD COLUMN sostenimiento_KTL TEXT;
UPDATE dim_institucion_educativa SET sostenimiento_KTL=sostenimiento;
ALTER TABLE dim_institucion_educativa DROP COLUMN sostenimiento;
ALTER TABLE dim_institucion_educativa RENAME sostenimiento_KTL TO sostenimiento;
;
ALTER TABLE dim_institucion_educativa ADD COLUMN jurisdiccion_KTL TEXT;
UPDATE dim_institucion_educativa SET jurisdiccion_KTL=jurisdiccion;
ALTER TABLE dim_institucion_educativa DROP COLUMN jurisdiccion;
ALTER TABLE dim_institucion_educativa RENAME jurisdiccion_KTL TO jurisdiccion;
;
ALTER TABLE dim_institucion_educativa ADD COLUMN modalidad_KTL TEXT;
UPDATE dim_institucion_educativa SET modalidad_KTL=modalidad;
ALTER TABLE dim_institucion_educativa DROP COLUMN modalidad;
ALTER TABLE dim_institucion_educativa RENAME modalidad_KTL TO modalidad;
;
ALTER TABLE dim_institucion_educativa ADD COLUMN regimen_KTL TEXT;
UPDATE dim_institucion_educativa SET regimen_KTL=regimen;
ALTER TABLE dim_institucion_educativa DROP COLUMN regimen;
ALTER TABLE dim_institucion_educativa RENAME regimen_KTL TO regimen;
;
ALTER TABLE dim_institucion_educativa ADD COLUMN distrito_KTL TEXT;
UPDATE dim_institucion_educativa SET distrito_KTL=distrito;
ALTER TABLE dim_institucion_educativa DROP COLUMN distrito;
ALTER TABLE dim_institucion_educativa RENAME distrito_KTL TO distrito;
;
ALTER TABLE dim_institucion_educativa ADD COLUMN jornada_KTL TEXT;
UPDATE dim_institucion_educativa SET jornada_KTL=jornada;
ALTER TABLE dim_institucion_educativa DROP COLUMN jornada;
ALTER TABLE dim_institucion_educativa RENAME jornada_KTL TO jornada;
;
CREATE INDEX idx_dim_institucion_educativa_lookup ON
dim_institucion_educativa(pk_institucion_educativa, institucion, circuito,
sostenimiento, jurisdiccion, modalidad, regimen, distrito, jornada)
;
Anexo # 18
;
CREATE INDEX idx_dim_ubicacion_geografica_lookup ON
dim_ubicacion_geografica(pk_ubicacion_geografica)
;
Anexo # 19
;
ALTER TABLE fact_rendimiento_academico ADD COLUMN promedio_edu_basica_KTL DOUBLE
PRECISION;
UPDATE fact_rendimiento_academico SET
promedio_edu_basica_KTL=promedio_edu_basica;
ALTER TABLE fact_rendimiento_academico DROP COLUMN promedio_edu_basica;
ALTER TABLE fact_rendimiento_academico RENAME promedio_edu_basica_KTL TO
promedio_edu_basica;
;
ALTER TABLE fact_rendimiento_academico ADD COLUMN promedio_bachillerato_KTL
DOUBLE PRECISION;
UPDATE fact_rendimiento_academico SET
promedio_bachillerato_KTL=promedio_bachillerato;
ALTER TABLE fact_rendimiento_academico DROP COLUMN promedio_bachillerato;
ALTER TABLE fact_rendimiento_academico RENAME promedio_bachillerato_KTL TO
promedio_bachillerato;
;
ALTER TABLE fact_rendimiento_academico ADD COLUMN promedio_examen_grado_KTL
DOUBLE PRECISION;
UPDATE fact_rendimiento_academico SET
promedio_examen_grado_KTL=promedio_examen_grado;
ALTER TABLE fact_rendimiento_academico DROP COLUMN promedio_examen_grado;
ALTER TABLE fact_rendimiento_academico RENAME promedio_examen_grado_KTL TO
promedio_examen_grado;
;
ALTER TABLE fact_rendimiento_academico ADD COLUMN nota_proyecto_grado_KTL DOUBLE
PRECISION;
UPDATE fact_rendimiento_academico SET
nota_proyecto_grado_KTL=nota_proyecto_grado;
ALTER TABLE fact_rendimiento_academico DROP COLUMN nota_proyecto_grado;
ALTER TABLE fact_rendimiento_academico RENAME nota_proyecto_grado_KTL TO
nota_proyecto_grado;
;
CREATE INDEX idx_fact_rendimiento_academico_lookup ON
fact_rendimiento_academico(sk_fecha, sk_estudiante, sk_ubicacion_geografica,
sk_institucion_educativa, sk_titulo)
;