Académique Documents
Professionnel Documents
Culture Documents
TESIS
para optar el Titulo Profesional de Ingeniero de
Sistemas
AUTORES
Arturo Eguila Canales
Alex Alsey Parco Iquiapaza
Lima Peru
2007
INDICE
RESUMEN
ABSTRACT
INDICE...1
INDICE DE FIGURAS.............................................................................3
INDICE DE TABLAS...............................................................................5
INTRODUCCIN.....................................................................................8
CAPITULO I
1. DEFINICIN DEL PROBLEMA.....9
1.1.
Descripcin de la realidad.............11
1.2.
1.3.
1.4.
CAPITULO II
2. OBJETIVOS
2.1.
Objetivos generales...........36
2.2.
Objetivos especficos.............37
CAPITULO III
3. MARCO TERICO CONCEPTUAL
3.1.
3.2.
Bases tericas..40
3.3.
CAPITULO IV
4. METODOLOGA DE LA INVESTIGACIN
4.1.Metodologa de Desarrollo...144
4.1.1. Planificacin del Proyecto...147
4.1.2. Definicin de Requerimientos de Negocios.149
4.1.3. Modelado Dimensional150
4.1.4. Diseo Fsico168
4.1.5.
Diseo
Desarrollo
de
Presentacin
de
Datos..170
4.1.6. Diseo de La Arquitectura Tcnica190
4.1.7.
Seleccin
de
Productos
de
Instalacin.....191
4.1.8.
Especificacin
de
Aplicaciones
para
usuarios
Finales...191
4.1.9. Desarrollo de aplicaciones para usuarios Finales..192
4.1.10. Implementacin..213
4.1.11. Gerenciamiento...214
CONCLUSIONES ......215
RECOMENDACIONES......216
REFERENCIAS BIBLIOGRFICAS.......217
INDICE DE FIGURAS
Fig. 1.1. Causas nuevas por ao, Juzgados de Familia.....................................13
Fig. 1.2. Acciones en las causas en seguimientos por ao, Juzgados Familia..15
Fig. 1.3. Procesos iniciados por ao, Juzgados penales....................................16
Fig. 1.4. Acciones en procesos en seguimiento por ao, Juzgados Penales.....16
Fig. 1.5. Procesos iniciados por ao, Salas Penales..........................................17
Fig. 1.6. Acciones en procesos en seguimiento por ao, Salas Penales............18
Fig. 3.1. Niveles de la Organizacin....................................................................46
Fig. 3.2. Clasificacin de los Gerentes en las Organizaciones............................49
Fig. 3.3. Data Warehouse Integrado....................................................................52
Fig. 3.4. Data Warehouse Temtico....................................................................53
Fig. 3.5. Data Warehouse No Voltil...................................................................54
Fig. 3.6. Data Warehouse variante en el Tiempo................................................55
Fig. 3.7. Arquitectura real de un Data Warehouse..............................................61
Fig. 3.8. Esquema Estrella..................................................................................69
Fig. 3.9. Esquema Copo de Nieve......................................................................70
Fig. 3.10. Constelacin de Hechos......................................................................70
Fig. 3.11. Ejemplo de un Cubo con tres dimensiones.........................................71
Fig. 3.12. Dimensin con Niveles........................................................................72
Fig. 3.13. Slice & Dice..........................................................................................73
Fig. 3.14. Rotacin...............................................................................................74
Fig. 3.15. Drill-Down y Drill-Up.............................................................................75
Fig. 3.16. Roll-Up.................................................................................................76
Fig. 3.17. Drill-Across...........................................................................................76
Fig. 3.18. Drill-Trough..........................................................................................77
Fig 3.19. Ventas.81
Fig. 3.20. Identificacin de Dimensin82
Fig. 3.21. Datamart de Ventas.83
Fig. 3.22. Calificacin de Productos85
Fig. 3.23. ETL Datamart86
Fig. 3.24. MOLAP............................95
INDICE DE TABLAS
Tabla 1.1: Causas nuevas del ao 2006........................................................................14
Tabla.3.1: Diferencias entre Sistema Tradicional versus Data Warehouse...................58
Tabla 3.2: Modelo Dimensional Complejo......................................................................84
Tabla 3.3.: MOLAP, ROLAP, HOLAP.............................................................................99
RESUMEN
ABSTRACT
The present work develops the Analysis and Design for the
development and future implementation of a tool of Business Intelligence
for the taking of decisions in the Area of Defensora de Oficio of the
Justice Ministry, the intention of the implementation of this tool is to have a
better control and management of the information of the office defenders
system so, it will help to improve the quality of the service that gives this
organization, by the efficient decision taking from the information that this
system provides to the managers of this organization.
This work shows the methodology used for the development of
the Datamart, which we will show as to develop it and we will show by
means of prototypes its operation.
Key words: Datamart, Minjus, Project, OLAP, Transaction,
Methodology, Defensora.
INTRODUCCIN
CAPITULO I
de
Oficio
proporciona
reportes
para
encontrar
las
Procesos Iniciados
Durante el ao 2006, los Defensores de Oficio asignados en los
juzgados penales iniciaron un total de 64 626 procesos a nivel nacional,
cifra inferior en 348 (0,54 %) respecto al ao anterior que registr 64
974 procesos.
En la Actualidad no se pueden tomar decisiones acertadas en cuanto
a la cantidad de personal adecuado para el rea de Defensores de
oficio por que no se tiene muchas referencias en cuanto a la exactitud
del volumen de trabajo ni de la calidad de los servicios prestado por los
Defensores de Oficio.
1.2
El Reto
En el ao de 2002 se detect la necesidad de contar con un Sistema
de Informacin que le ofreciera, tanto a la direccin como a los
diferentes responsables de las reas un ambiente grfico y de fcil
manejo con capacidad de anlisis dinmico para servir de apoyo en la
toma de decisiones. Las reas involucradas fueron Crdito, Cobranza,
Comercializacin, Tesorera, Nminas y Contabilidad.
Este sistema de informacin ejecutivo se diseara en base a las
necesidades de informacin de la Direccin y las Gerencias y se
apoyara en un Datawarehouse para almacenar informacin actual e
histrica. Todo esto manteniendo el equilibrio entre Costo-Beneficio.
La Propuesta.
Al iniciar el proyecto de Inteligencia de Negocios de Mundihogar el
primer Mdulo a desarrollar fue Crdito y Cobranza donde se incluy
informacin de la cartera, la cobranza y la tendencia de cobranza lo que
le permiti a Mundihogar analizar el comportamiento pasado de sus
cuentas por cobrar as como estimar la recuperacin probable en base a
la tendencia de cobranza del mes en curso. El siguiente Modelo que se
desarroll fue la parte Contable en donde se consolid la informacin de
las
diferentes
empresas
que
conforman
el
grupo
(tanto
de
El Cambio.
El gran avance registrado por Mundihogar ha hecho que la direccin
general de la compaa cuente con la informacin clara, oportuna,
confiable y automtica para la toma de decisiones, es la eficiencia total
de
la
empresa,
como
coment
el
Director
General.
El Reto.
En el ao de 1998 la Empresa con el apoyo de el Departamento de
Sistemas implement un sistema de operacin ERP Enterprise
Resource Planning, en este se lleva la operacin de toda la empresa,
pero surgi la necesidad de contar con una herramienta alterna, el
sistema transaccional satisfaca la operacin pero no as la extraccin y
la explotacin de la informacin, por lo que se comenz a buscar
alternativas con las cuales se pudiera crear un Data Warehouse. La
opcin elegida tendra que ser de manejo sencillo y de precio razonable,
para lograr un parmetro alto de costo-beneficio.
La Propuesta.
Cuando se inicia el proyecto de BI en CPIngredientes se toma la
decisin de arrancar con el departamento de ventas teniendo como
principal objetivo el conocer su mercado, es decir, hacia donde iba su
mercanca, cmo estaban vendiendo, cunto estaban vendiendo y
dnde estaba el potencial de crecimiento de la empresa.
Conforme avanz el proyecto este fue creciendo hacia otras reas
por lo que se cre un Datamart para el departamento de Logstica
(Transportes).
Empresa AVON
Aqu se llevaron a cabo los siguientes procesos: Anlisis, diseo y
Desarrollo de un Datamart Comercial para la explotacin de informacin
de campaas comerciales por las reas de Marketing y Ventas.
Implementacin de herramienta E.T.L (Extraccin, Transformacin y
carga). Herramientas BI, desarrollo del proceso de migracin de data del
AS 400 a Oracle 9i. (Data Clearing).Extraccin, Transformacin.
El Proyecto de migracin de Data llevado acabo el ao 2005
Servicio de Tunning para la optimizacin de BD mejor la calidad de la
informacin obtenida ofreciendo informacin consolidada y a tiempo
para el personal de la empresa.
La implementacin del Datamart actualmente les permite ahorrar en su
presupuesto y obtener informacin consolidada para la toma de
decisiones, reducir los tiempos de respuesta de informacin y obtener
reportes actuales de su informacin ms importante.
Laboratorios Hersil
se necesita una
Finalidad
La finalidad del presente trabajo de investigacin es proponer una
herramienta de Inteligencia de negocios que contribuya a la mejorar la
administracin del rea de defensora, lo cual nos favorecer a todos los
peruanos para mejorar la calidad del servicio prestado.
Importancia
El trabajo es importante en primer lugar, porque contribuir a orientar a
la Direccin de Defensora de Oficio y contar con una herramienta que
juegue el papel de soporte para la toma de decisiones, de respuesta gil
y rpida, con informacin precisa.
La informacin consolidada permitir realizar un mejor control con la
aplicacin de tecnologas de informacin, en este caso, el uso de
Datamart, esto contribuir en beneficio de todos los peruanos con lo cual
Limitaciones de la investigacin
1.4.1. Delimitacin Temporal
La parte descriptiva de la investigacin se realizar en el perodo
comprendido entre los meses de Julio y Agosto del 2007. En este
periodo se implementar los prototipos de la herramienta de
Inteligencia de Negocios sobre una metodologa Ad Hoc debido al
periodo de tiempo corto para su respectivo desarrollo.
CAPITULO II
2.1.
OBJETIVOS
Se busca la implementacin futura de una herramienta de Inteligencia
CAPITULO III
Antecedentes de la investigacin:
3.2.
Con BI se puede:
Compartir
informacin
entre
reas
departamentos
de
una
organizacin.
Anlisis multidimensionales.
Generar y procesar datos.
Cambiar la estructura de toma de decisiones.
Mejorar el servicio al cliente.
a)
analizndola?
b)
luzcan bien?
d)
Quisiera tener una gua sobre las cosas que han sucedido cuando
la empresa?
f)
periodo determinado?
g)
retrasada?
i)
reportes?
j)
planeados?
k)
3.2.1.1. DATAWAREHOUSE
Conceptos Previos
SISTEMAS DE INFORMACIN
a. Sistemas Estratgicos
Estn orientados a soportar la toma de decisiones, facilitan la labor de la
direccin, proporcionando un soporte bsico, en forma de mejor
informacin, para la toma de decisiones. Se caracterizan porque son
sistemas sin carga peridica de trabajo, es decir, su utilizacin no es
predecible, al contrario de los casos posteriores, cuya utilizacin es
peridica.
Destacan entre estos sistemas: los Sistemas de Informacin Gerencial
(MIS), Sistemas de Informacin Ejecutivos (EIS), Sistemas de Informacin
Georeferencial (GIS), Sistemas de Simulacin de Negocios (BIS y que en la
prctica son sistemas expertos o de Inteligencia Artificial - AI).
b. Sistemas Tcticos
Diseados para soportar las actividades de coordinacin y manejo de
documentacin, definidos para facilitar consultas sobre informacin
almacenada en el sistema, proporcionar informes y, en resumen, facilitar la
gestin independiente de la informacin por parte de los niveles intermedios
de la organizacin.
d. Sistemas Interinstitucionales
DATA WAREHOUSE
CARACTERSTICAS
Siguiendo con la definicin de Inmon, un Data Warehouse se
caracteriza por ser:
Integrado
se
muestra
de
muchas
maneras:
en
conversiones
de
nombres
Temticos
No Voltil
Variante en el Tiempo
SISTEMA TRADICIONAL
DATA WAREHOUSE
Predomina la actualizacin
Predomina la consulta
de la
transaccin instantnea
Estructura relacional
Visin multidimencional
Explotacin de la informacin
relacionada
sobre
frecuencias
de
carga,
mecanismo
de
historizacin, etc.
MODELO DE DATOS
Modelo Relacional
El modelo relacional puede considerarse como un lenguaje de
programacin mas bien abstracto, orientado de manera especfica hacia
las aplicaciones de bases de datos.
En trminos tradicionales una relacin se asemeja a un archivo,
una tupla a un registro, y un atributo a un campo. Pero estas
correspondencias son aproximadas, en el mejor de los casos.
Una relacin no debe considerarse como solo un archivo, sino
ms bien como un archivo disciplinado, siendo el resultado de esta
disciplina una simplificacin considerable de las estructuras de datos
con las cuales debe interactuar el usuario, lo cual a su vez simplifica los
operadores requeridos para manejar esas estructuras.
El modelo relacional es el pilar fundamental para el diseo de la
mayora de las bases de datos que existen hoy en las grandes y
pequeas empresas. La composicin de estas bases de datos son
decenas de tablas relacionadas a travs de una compleja tela de araa
de uniones.
La implementacin de bases de datos con un modelo relacional da
lugar a escenarios como los siguientes:
Modelo Multidimensional
El modelo multidimensional es una tcnica para modelar bases de
datos simples y entendibles al usuario final, ya sea, para presentar la
informacin en un marco estndar e intuitivo que permitan un acceso de
alto rendimiento. Los objetivos del modelo multidimensional son:
Medida: Las medidas son un dato numrico que representa una actividad
especfica de un negocio, mientras que una dimensin representa una
perspectiva de los datos. Cada dimensin est descrita por un conjunto de
atributos (datos agregados). A su vez se pueden intersectar estas
dimensiones para obtener un valor, llamado medida.
Una medida contiene una propiedad numrica y una frmula. Existen tres
clases de medidas:
Ventajas DW:
Da apoyo al CRM.
Cumple muy bien funciones de marketing.
Se anticipa a las necesidades de los clientes.
Administra mucha informacin.
Desventajas DW:
Es muy costoso.
Se invierte mucho tiempo en implementarlo.
Se invierte mucho tiempo en poblarlo.
3.2.1.2. DATAMART
Las corporaciones de hoy se esfuerzan por conducir sus negocios hacia una
base internacional. Vemos compaas que surgieron en Estados Unidos y se
expandieron a Europa, Asia y frica. La expansin del negocio crea la necesidad
de acceder a datos corporativos que estn ubicados en diferentes puntos
geogrficos. Por ejemplo, un ejecutivo de ventas de una compaa con origen en
Per que est situado en Brasil puede necesitar acceso a la base de datos de la
empresa para identificar los clientes potenciales que residen solo en Brasil.
Este problema se soluciona creando versiones ms pequeas del
DataWarehouse, los datamarts. Estas versiones se crean usando algn criterio
particular, como por ejemplo el lugar geogrfico. En el ejemplo anterior los datos
de los clientes que residen en Brasil se deben almacenar en el datamart de la
sucursal en ese pas.
La existencia de los datamarts crea nuevas formas de pensar cuando se
disean los repositorios corporativos de datos.
Algunas corporaciones reemplazan completamente el concepto de tener un
DataWarehouse central, por varios datamarts ms pequeos que se alimenten
directamente de los sistemas operacionales.
Otras compaas usan datamarts para complementar sus DataWarehouses,
mueven datos desde el DataWarehouse hacia varios datamarts con el fin de
permitir un anlisis ms eficiente. La separacin de los datos se determina
segn criterios como departamentos, reas geogrficas, periodos de tiempo, etc.
analizados
explotados
por
los
usuarios,
por
ejemplo:
Tema: Ventas
Indicadores: Cantidad Vendida, Precio Unitario, Total, Descuento, IGV, etc.
Ventas
Cliente_Id (FK)
Producto_Id (FK)
Tipo_Venta_Id (FK)
Empleado_Id (FK)
Tienda_Id (FK)
Dia_Venta_Id (FK)
Cantidad_Vendida
Precio_Unitario
Total
Por ejemplo:
Pegunta
Respuesta
Dimensin
Quin vende
El Empleado xxxx
Empleado
Qu se vende
El Producto xxx
Producto
A quien se vende
Al Cliente xxxx
Cliente
Cmo se vende
A Crdito
Tipo Pago
Dnde se Vende
En la oficina xxx
Geografa
Cundo se Vende
El 1 de Nov.
Tiempo
disear un modelo
Datamart de Ventas
Descripcin
Ejemplo
Bandas, Rangos
Califica a un indicador
0 500> [500
1000>
Grupos Personalizados y
Califica a un atributo
Tipo Producto
Consolidados
Por ejemplo:
Si queremos segmentar a productos segn la rotacin de los ltimos 6
meses, se puede crear un grupo personalizado llamado: Calificacin de
productos en el que se especifica si tiene alta, mediana o baja rotacin.
Calificacion_Productos
Calificacion_Productos_Id
Calificacion_Productos_Desc
Familia_Productos
Familia_Productos_Id
Familia_Productos_Desc
Producto
Producto_Id
Producto_Desc
Familia_Productos_Id (FK)
Calificacion_Productos_Id (FK)
Paso 8: ETL
Consiste en extraer, transformar y cargar los datos de los sistemas fuentes
hacia la base de datos del datamart.
Los programas de ETL deben
cumplir con las especificaciones que
se desarrollaron en el paso 5, con la
finalidad de llevar una correcta
documentacin del proyecto.
Los programas de cargas deben
verificar los errores de integridad
referencial y limpiarla en el caso que
se detecte alguna ocurrencia.
Figura 3.23: ETL - Datamart
Paso 9: Implementacin
un motivo relevante por el cual los usuarios no utilizan los datamart es por
falta de capacitacin
c. Las
herramientas
de
gestin.-
Los
usuarios
deben
ser
Ventajas:
Se puede contar con l en menor tiempo.
Permite probar en un rea especfica de la empresa, para determinar
si es factible o no implementar un Data warehouse.
Permite diferir los altos costos del Data Warehouse durante el tiempo
en
que
se
vayan
implementando
los
DataMart.
Desventajas:
De esta forma, posterga an ms la implementacin del Data
Warehouse.
Al enfocarse a un rea especfica, no logra cumplir un papel de
anticipador de necesidades.
HERRAMIENTAS OLAP
Las
herramientas
de
OLAP
presentan
al
usuario
una
visin
ESTRATEGIAS DE ALMACENAMIENTO.
OLAP soporta tres tipos de almacenamiento:
MOLAP
En el modo de almacenamiento MOLAP (OLAP Multidimensional) una
copia de los datos de origen del cubo, junto con sus agregaciones, es
almacenada en una estructura multidimensional.
Debemos tener en cuenta que mientras los datos de origen cambian
directamente con las operaciones, los objetos con almacenamiento
MOLAP deben ser procesados para incorporar estos cambios.
El tiempo comprendido entre un procesamiento y el siguiente, crea un
periodo de latencia durante el que puede que la informacin OLAP no
coincida con los datos de origen actuales.
AGREGACIONES
Y DATOS
Vista de
Usuario
Base de Datos
Relacional
Base de Datos
Multidimensional
ROLAP
En un modelo ROLAP (OLAP Relacional) toda la informacin del cubo, sus
datos, su agregacin, sumas, etc., son almacenados en una base de datos
relacional.
AGREGACIONES
Y DATOS
Base de Datos
Relacional
Base de Datos
Multidimensional
Vista de
Usuario
HOLAP
HOLAP (OLAP hbrido) combina atributos de MOLAP y ROLAP.
Al igual que MOLAP, HOLAP hace que las agregaciones se almacenen en una
estructura multidimensional, y los datos a nivel de detalle, en una base de datos
relacional como lo hace el almacenamiento ROLAP.
Para procedimientos de bsqueda que accedan datos sumarizados, HOLAP es
equivalente a MOLAP. Por el contrario, si los procesos de consultas accedieran
a los mximos niveles de detalle, deberan recuperar los datos de la base de
datos relacional y esto no seria tan rpido comparado con una estructura
MOLAP.
Los cubos almacenados como HOLAP, son ms pequeos que los MOLAP y
responden ms rpidos que los ROLAP.
Usos comunes de HOLAP
Cubos que requieren rpida respuesta
Cuando existen sumarizaciones basadas en una gran cantidad de datos
de origen.
Solucin de compromiso para bajar el espacio ocupado sin perjudicar
totalmente el rendimiento de las consultas.
DATOS
AGREGACIONES
Base de Datos
Relacional
Base de Datos
Multidimensional
Vista de
Usuario
Debemos tener en cuenta que si los usuarios generan consultas que deben
utilizar los datos del nivel mas bajo HOLAP no suele ser la mejor opcin
MOLAP
Almacenamiento Modelo
de las
Agregaciones
ROLAP
Base de datos
Multidimensional relacional
HOLAP
Modelo
Multidimensional
Almacenamiento Modelo
Base de datos
Base de datos
de los datos
Multidimensional relacional
relacional
Facilidad de
Sencillo
Muy Sencillo
Sencillo
Buena
Regular o Baja
Buena para
Creacin
Velocidad de
consultas que
respuesta
posean
agregaciones,
Regular para datos
de bajo nivel
Problemas de
Son ms
escalabilidad
escalables
Recomendados
para
frecuente
frecuentemente
Escalabilidad
usados
3.2.1.4. DATAMINING.
Las bases de datos pueden ser grandes tanto en profundidad como en ancho:
incluyen
rboles
de
Clasificacin
Regresin
Mining, la mejor manera para realizar esto es dejando de lado ciertos datos para
aislarlos del proceso de Data Mining. Una vez que el proceso est completo, los
resultados pueden ser testeados contra los datos excluidos para confirmar la
validez del modelo. Si el modelo funciona, las observaciones deben mantenerse
para los datos excluidos.
Entonces, los pasos tpicos para realizar Data Mining son los siguientes:
Ventajas:
Permite obtener una imagen detallada de la informacin solicitada.
Se puede llegar al conjunto de transacciones que generaron la
informacin.
Desventajas:
Puede colapsar el ancho de banda.
Puede disminuir la capacidad de procesamiento.
Puede empeorar el tiempo de respuesta.
MODELADO DIMENSIONAL
La definicin de los requerimientos del negocio determina los datos
necesarios para cumplir los requerimientos analticos de los usuarios.
Disear los modelos de datos para soportar estos anlisis requieren un
enfoque diferente al usado en los sistemas operacionales. Bsicamente
se comienza con una matriz donde se determina la dimensionalidad de
cada indicador y luego se especifican los diferentes grados de detalle
(atributos) dentro de cada concepto del negocio (dimensin), como as
tambin la granularidad de cada indicador (variable o mtrica) y las
diferentes jerarquas que dan forma al modelo dimensional del negocio
(BDM) o mapa dimensional.
DISEO FSICO
Plan:
1. Crear un diagrama de flujo fuente-destino esquemtico, de una
pgina y de muy alto nivel.
2. Probar, elegir e implementar una herramienta de data staging.
transformaciones
complejas.
Grficamente
Carga de dimensiones:
planos sirven para comunicar los deseos entre los clientes y el arquitecto,
como as tambin para medir esfuerzos y materiales necesarios para la
obra
(comunicacin,
planificacin,
flexibilidad
mantenimiento,
por
dispositivos
no
estndares
para
usuarios
internos/externos, etc.
Kimball se concentra sobre el proceso de creacin de aplicaciones
templates. Comienza definiendo el concepto de la aplicacin para
usuario final y su rol en el acceso a la informacin del negocio. Brinda un
marco metodolgico bastante estndard en lo que ha desarrollo de
aplicaciones (como piezas de software) se refiere. Divide el proceso de
creacin de las aplicaciones para usuarios finales en dos grandes fases:
especificacin y desarrollo. Clasifica a los usuarios segn su perfil de
consulta, desde usuarios con un perfil ms estratgico y menos
predecibles (power users) hasta usuarios netamente operacionales que
consumen una serie de reportes estndares (final users) pasando por los
usuarios gerenciales con uso de interfases push-button (EIS users).
Kimball destaca, como uno de los requisitos a cumplir por las
aplicaciones, la posibilidad de hacer anlisis AD HOC. Anlisis ad hoc es
simplemente la habilidad para los usuarios de cambiar los parmetros
sobre un reporte para crear sus propias versiones personalizadas de ese
reporte. De esta forma se dar respuesta a necesidades como Quiero ver
este reporte, pero por mes en lugar de trimestre, Puedo ver este reporte
a nivel provincia en lugar de regin?, Puedo ver esta evolucin de
ventas mensual pero slo de mi equipo de ventas?. Ms importante an
es que las respuestas a estos interrogantes lo resuelven los propios
usuarios sin la necesidad de la intervencin del departamento sistemas y
mximizando el tiempo de anlisis por sobre el tiempo de construccin e
integracin de la informacin.
Kimball define entonces que las aplicaciones Templates para
usuarios finales proveen el marco (layout) y la estructura de un reporte
para ser especializado por un conjunto de parmetros. El usuario
selecciona los parmetros de una pick list o aceptando los valores por
defecto cuando ejecuta el Template. Este enfoque orientado a parmetros
permite a los usuarios generar docenas o potencialmente cientos de
reportes de estructura similar desde un mismo Template. Todo esto de
forma amigable y con interfases grficas que hacen uso de todo el trabajo
realizado en la construccin del warehouse en etapas previas del BDL.
Una advertencia que hace Kimball es el tiempo que existe entre el
relevamiento y especificacin de las aplicaciones para usuarios finales y
el momento del desarrollo e implementacin de la misma. Como pudimos
ver, durante las primeras semanas del proyecto se realiza el relevamiento
de los requerimientos de los usuarios y recin una vez que existen datos
en el warehouse (aunque ms no sea datos de prueba) puede
comenzarse con la construccin de la aplicacin final (al menos es lo
Herramienta propietaria
_ Mayor complejidad de uso
_ Para usuarios ms capacitados
_ Instalacin local
EIS
_ Acceso estructurado
_ Secuencialidad de pantallas
_ Push-Button
Interfase personalizada
_ API (Application Programming Interface)
_ Desarrollos propios sobre la base de un conjunto de
funcionalidades
Desarrollo de la aplicacin
_ Definicin de herramienta de acceso al MetaData
_ Desarrollo de templates y esquema de navegacin de la
aplicacin
_ Seleccin de reportes para pre-ejecucin
_ Informacin duplicada
_ Relaciones entre atributos
_ Consistencia e integridad de datos con sistemas fuentes
Mantenimiento
_ Nuevos templates
_ Incorporacin de nuevos sistemas fuentes
_ Monitoreo de performance
_ Eliminacin de templates en desuso
IMPLEMENTACIN
En
esta
etapa,
mucho
menos
tcnico
ms
orientado
al
los
componentes
del
sistema
deben
ser
testeados
MANTENIMIENTO Y CRECIMIENTO
das o
PUNTOS PROBLEMTICOS DE UN DW
una
unidad
de
informacin
ms
compleja,
necesitada
CAPITULO IV
4. METODOLOGA DE LA INVESTIGACIN
Dimensiones
1. Tiempo
2. Cliente
3. Defensor
4. Materia
5. Dependencia
6. Gestin
Dimensin Tiempo
Descripcin
Almacena las fechas para las que el Datamart contiene informacin relevante.
Jerarquas
Contiene la fecha (da, mes, ao) y el nmero de semana en el ao.
Nivel
Atributos
Nivel 1
Ao
Nivel 2
Semestre
Nivel 3
Trimestre
Nivel 4
Mes
Nivel 5
Da
Atributos
Contenido
Nombre del Atributo
Descripcin
TiempoKey
Llave
primaria
Dimensin Tiempo
Ao
Formato
de
la Cadena
caracteres
Contenido
Nombre del Atributo
Descripcin
Semestre
Formato
Trimestre
Mes
Dia
Dimensin Cliente
Descripcin
Contiene los datos de los clientes que solicitan los servicios de defensa
legal gratuita a la defensora de oficio.
Jerarquas
Datos generales del Cliente.
Nivel
Atributos
Nivel 1
IdCliente
Nivel 2
IdSexo
Nivel 2
IdDepartamento
Nivel 3
IdProvincia
Nivel 4
IdDistrito
Atributos
Contenido
Nombre del Atributo
Descripcin
ClienteKey
IdCliente
Formato
Dimensin Cliente
caracteres
Nmero entero
Ninguno
Contenido
Nombre del Atributo
Descripcin
IdDepartamento
Formato
Cdigo
Ninguno
IdProvincia
Ninguno
IdDistrito
Nmero entero
Ninguno
IdSexo
Nmero entero
Ninguno
Nombre
Cadena
Departamento
de Ninguno
caracteres
DescripcinDepartamento
Descripcin
del Cadena
Departamento
DescripcinProvincia
Descripcin
caracteres
de
Provincia
DescripcinDistrito
de Ninguno
la Cadena
de Ninguno
caracteres
de Ninguno
caracteres
DescripcinSexo
Cadena
de Ninguno
caracteres
Edad
Edad
Numrico
Ninguno
Dimensin Defensor
Descripcin
Contiene los datos de los defensores quienes son los abogados que
prestan sus servicios a los clientes.
Jerarquas
Datos generales del defensor.
Nivel
Atributos
Nivel 1
IdDefensor
Nivel 2
IdSexo
Nivel 2
IdDepartamento
Nivel 3
IdProvincia
Nivel 4
IdDistrito
Atributos
Contenido
Nombre del Atributo
Descripcin
DefensorKey
IdDefensor
Formato
Dimensin Defensor
caracteres
Nmero entero
Ninguno
Contenido
Nombre del Atributo
Descripcin
IdDepartamento
Formato
Cdigo
Ninguno
IdProvincia
Ninguno
IdDistrito
Nmero entero
Ninguno
IdSexo
Nmero entero
Ninguno
Nombre
Departamento
de Ninguno
caracteres
DescripcinDepartamento
Descripcin
del Cadena
Departamento
DescripcinProvincia
Descripcin
caracteres
de
Provincia
DescripcinDistrito
de Ninguno
la Cadena
de Ninguno
caracteres
de Ninguno
caracteres
DescripcinSexo
Cadena
caracteres
de Ninguno
Dimensin Materia
Descripcin
Contiene los datos de las materias o delitos en que incurre el cliente.
Jerarqua
Datos generales de la materia.
Nivel
Atributos
Nivel1
IdMateria
Atributos
Contenido
Nombre del Atributo
Descripcin
MateriaKey
Llave
principal
Formato
de
la Cadena
dimensin Materia
caracteres
idMateria
Cdigo de la materia
Nmero entero
Descripcin
Descripcin de la Materia
Cadena
de Ninguno
caracteres
(se
Ninguno
utilizar
maysculas)
Dimensin Dependencia
Descripcin
Contiene los datos de las dependencias, tipo de dependencias y distritos
judiciales.
Jerarquas
La Jerarqua representa la clasificacin de la dependencia.
Nivel
Atributos
Nivel1
IdDependencia
Nivel2
IdDistritoJudicial
Nivel2
IdTipoDependencia
Atributos
Contenido
Nombre del Atributo
Valor
Descripcin
Formato
Defecto
DependenciaKey
Llave
principal
de
la Cadena
de Ninguno
dimensin dependencia
caracteres
idDependencia
Cdigo de la dependencia
Nmero entero
Ninguno
distritoJudicialId
Nmero entero
Ninguno
pertenece la dependencia.
por
Contenido
Nombre del Atributo
Valor
Descripcin
Formato
Defecto
tipoDependenciaId
Ninguno
pertenecen la dependencia.
DependenciaDescri
Descripcin
pcin
dependencia
DistritoDependencia Descripcin
de
la Cadena
caracteres
del
Judicial
Distrito Cadena
de Ninguno
caracteres
Cadena
pendencia
caracteres
dependencia
de Ninguno
de Ninguno
por
Dimensin Gestin
Descripcin
Contiene las Gestiones que son todas las acciones o diligencias que
realiza el defensor.
Jerarquas
Datos generales de las Gestiones.
Nivel
Atributos
Nivel 1
IdGestin
Nivel 2
IdResultado
Nivel 3
IdApelacin
Atributos
Contenido
Nombre del Atributo
Descripcin
GestinKey
Llave
principal
Formato
de
la Cadena
dimensin Gestin
caracteres
IdGestin
Cdigo de la Gestin
Nmero entero
Ninguno
IdResultado
Nmero entero
Ninguno
IdApelacin
Cdigo de la Apelacin
Nmero entero
Ninguno
GestinDescripcin
Descripcin de la Gestin
Cadena
caracteres
de Ninguno
Contenido
Nombre del Atributo
Descripcin
ResultadoDescripcin Descripcin del Resultado
Formato
Cadena
caracteres
ApelacinDescripcin Descripcin de la Apelacin Cadena
caracteres
de Ninguno
Facts Procesos
Los hechos son medidas numricas del negocio.
Nmero de Casos
Cantidad de Delitos
Los hechos son agregados utilizando sumas, promedios, mnimos, mximos, etc.
Descripcin
Contiene las llaves de las dimensiones y las medidas que fueron
levantadas en las etapas anteriores del proyecto de acuerdo a las
especificaciones del equipo de requerimiento.
Granularidad
N Nombre de la Dimensin
Descripcin
Llave Primaria
1. . Tiempo
2.
Cliente
3.
Defensor
4.
Materia
5.
Dependencia
Dependencia
donde
Si
se Si
desarrolla el proceso
6.
Gestin
Medidas
N Nombre
1.
Descripcin
2.
Num_SalAlternativas_Totales
3.
Num_Detenciones_Ilegales
N de Detenciones ilegales.
4.
Num_Absoluciones
N de Absoluciones.
5.
Num_Medidas_Cautelares
N de Medidas Cautelares.
6.
Num_Imputados_Ingresados
N de Imputados ingresados.
7.
Num_Imputados_Terminados
8.
Num_Visitas_Carcel
N de Visitas a crceles.
9.
Num_Casos_Ingresados
N de Casos Ingresados.
10. Num_CasosxDefensor
11. Num_Casos_Terminados
N de Casos Terminados.
12. Num_Casos_Nuevos
N de Casos Nuevos.
13. Num_Casos_Archivados
N de Casos Archivados.
14. Num_Casos_Seguimiento
N de Casos en Seguimiento.
15. Num_Delitos_Atendidos
N de Delitos Atendidos.
16. Num_Delitos_Absolutorias
17. Num_Delitos_Condenatorios
Defensor
<pi> I
<M>
cod_defensor
apellido_paterno
VA20
apellido_materno
VA20
nombres
VA20
cod_sexo
I
fecha_nacimiento
DT
telefono
VA20
correo_electronico
VA10
ruc
VA20
dni
VA20
tipoetapa
cod_tipoetapa <pi> I
<M>
descripcion
DESCRIPCION <M>
pk_ttipoficha <pi>
Cliente
cod_cliente
<pi> I
<M>
apellido_paterno
VA50
apellido_materno
VA50
nombres
VA50
fecha_nacimiento
DT
cod_tipodocumento
I
numero_documento
VA50
cod_sexo
I
tipogestion
apelacion
cod_tipogestion <pi> I
<M>
descripcion
VA20
<M>
cod_apelacion <pi> I
descripcion
DESCRIPCION <M>
ipk_tdiligencia <pi>
pk_ttipoapelacion <pi>
Key_1 <pi>
pk_mpatrocinado <pi>
Reference_12
Reference_4
Reference_10
Gestion
Reference_14
cod_gestion
<pi> I
<M>
cod_defensor
A6
<M>
observacion
TEXTO
fecha_diligencia
DT
fecha_apelacion
DT
fecha_resultado
DT
Proceso
cod_proceso
<pi> I
<M>
observacion
TEXTO
fecha_cierre
DT
fecha_inicioproceso
DT
numero_expediente
VA10
Etapa
Reference_7
pk_dfichadiligencia <pi>
cod_etapa
<pi> I
<M>
fecha_sentencia
DT
fecha_fallo
DT
fecha_creacion
DT
fecha_denuncia
DT
fecha_cierre
DT
observacion
TEXTO
Reference_6
sentencia
cod_sentencia <pi> I
<M>
descripcion
VA100
Reference_18
pk_mficha <pi>
Reference_11
Reference_17
pk_mcaso <pi>
Key_1 <pi>
Reference_16
fallo
Reference_8
resultado
cod_resultado <pi> I
<M>
descripcion
VA20
Reference_15
cod_fallo
<pi> I
<M>
descripcion
DESCRIPCION <M>
pk_ttipofallo <pi>
tipodependencia
pk_tresultado <pi>
Reference_2
Reference_3
Materia
cod_materia <pi> I <M>
pk_dfichadelito <pi>
cod_tipodependencia <pi> I
<M>
descripcion
DESCRIPCION
pk_ttipodependencia <pi>
pena
cod_pena <pi> I
<M>
descripcion
DESCRIPCION <M>
pk_ttipopena <pi>
Reference_13
distritojudicial
dependencia
tipoMateria
cod_tipomateria <pi> I
<M>
descripcion
DESCRIPCION <M>
pk_ttipodelito <pi>
cod_dependencia <pi> I
<M>
descripcion
DESCRIPCION
pk_tdependenciajudicial <pi>
Reference_1
cod_distritojudicial <pi> I
<M>
descripcion
DESCRIPCION
pk_tdistritojudicial <pi>
Cliente
cod_cliente
apellido_paterno
apellido_materno
nombres
fecha_nacimiento
cod_tipodocumento
numero_documento
cod_sexo
tipoetapa
cod_tipoetapa int
<pk>
descripcion
varchar(100)
int
<pk>
varchar(50)
varchar(50)
varchar(50)
datetime
int
varchar(50)
int
Defensor
cod_defensor
apellido_paterno
apellido_materno
nombres
cod_sexo
fecha_nacimiento
telefono
correo_electronico
ruc
dni
int
<pk>
varchar(20)
varchar(20)
varchar(20)
int
datetime
varchar(20)
varchar(10)
varchar(20)
varchar(20)
tipogestion
apelacion
<pk>
cod_tipogestion int
descripcion
varchar(20)
cod_apelacion int
<pk>
descripcion
varchar(100)
FK_PROCESO_REFERENCE_CLIENTE
FK_GESTION_REFERENCE_APELACIO
FK_GESTION_REFERENCE_TIPOGEST
Gestion
cod_proceso
cod_etapa
cod_gestion
cod_defensor
cod_tipogestion
cod_resultado
cod_apelacion
observacion
fecha_diligencia
fecha_apelacion
fecha_resultado
int
int
int
char(6)
int
int
int
text
datetime
datetime
datetime
FK_GESTION_REFERENCE_RESULTAD
<pk,fk1>
<pk,fk1>
<pk>
<fk2>
<fk3>
<fk4>
Proceso
FK_ETAPA_REFERENCE_TIPOETAP
int
<pk>
cod_proceso
int
<pk,fk2>
cod_cliente
int
<fk1>
int
<pk>
cod_defensor
int
<fk2>
int
<fk3>
observacion
text
int
<fk1>
fecha_cierre
datetime
FK_ETAPA_REFERENCE_PROCESO
int
<fk1>
fecha_inicioproceso datetime
int
<fk1>
numero_expediente varchar(10)
int
<fk4>
int
<fk5>
int
<fk6>
datetime
sentencia
FK_ETAPA_REFERENCE_SENTENCI
datetime
cod_sentencia int
<pk>
datetime
descripcion
varchar(100)
datetime
datetime
text
fallo
FK_ETAPA_REFERENCE_FALLO
cod_fallo
int
<pk>
descripcion varchar(100)
Etapa
cod_proceso
cod_etapa
cod_tipoetapa
cod_distritojudicial
FK_GESTION_REFERENCE_ETAPA cod_tipodependencia
cod_dependencia
cod_pena
cod_fallo
cod_sentencia
fecha_sentencia
fecha_fallo
fecha_creacion
fecha_denuncia
fecha_cierre
observacion
FK_MATERIA_REFERENCE_ETAPA
FK_PROCESO_REFERENCE_DEFENSOR
resultado
cod_resultado int
<pk>
descripcion
varchar(20)
FK_DEPENDEN_REFERENCE_TIPODEPE
cod_proceso
cod_etapa
cod_materia
cod_tipomateria
int
int
int
int
<pk,fk1>
<pk,fk1>
<pk>
<fk2>
tipodependencia
cod_tipodependencia int
<pk>
descripcion
varchar(100)
Materia
FK_ETAPA_REFERENCE_PENA
pena
cod_pena int
<pk>
descripcion varchar(100)
FK_MATERIA_REFERENCE_TIPOMATE
dependencia
FK_ETAPA_REFERENCE_DEPENDEN
tipoMateria
cod_tipomateria int
<pk>
descripcion
varchar(100)
cod_distritojudicial
cod_tipodependencia
cod_dependencia
descripcion
distritojudicial
cod_distritojudicial int
<pk>
int
<pk,fk1>
FK_DEPENDEN_REFERENCE_DISTRITO
descripcion
varchar(100)
int
<pk,fk2>
int
<pk>
varchar(100)
Modelo Dimensional
El esquema Estrella diseado en el proyecto consiste de siete tablas, una tabla
de hechos llamada Fact_Procesos y seis tablas de dimensiones llamadas
Dimensin_Tiempo,
Dimensin_Dependencia,
Dimensin_Gestin,
Clustering
Es una tcnica muy til para el acceso secuencial de grandes cantidades
de datos. El clustering se obtiene definiendo un ndice clustering para una
tabla, el cual determina el orden secuencial fsico en el que se almacenan
las filas en los conjuntos de datos.
Esta tcnica es importante porque mejora drsticamente la performance
del acceso secuencial, y este tipo de acceso es el ms usado en el
procesamiento OLAP.
Indexado
Existen dos estrategias extremas de indexado: una es indexar todo, y la
otra es no indexar nada, pero ninguna de las dos es conveniente. Las
columnas que se elijan para indexar deben ser las que se usan mas
frecuentemente para recuperar las filas, y las que tienen una alta
distribucin de valores.
de
datos
entre
dos
orgenes
de
datos
diferentes.
DTS tiene una arquitectura OLE DB por lo que puede copiar y transformar
mltiples orgenes de datos.
Carga Original Data
Carga de Dimensiones
Arquitectura de Extraccin
Metadata
Informacin
detallada
DW
Informacin
resumida
Extraccin,
Transformacin
y Carga
Informacin
Histrica
Defensores
Sistemas
Transaccionales
Fuente
Tipo
Conexin
Fuente
Sybase ASE
ODBC
Nombre de Tabla
Descripcin
Cliente (ASE
Cliente
Sybase)
(personas naturales)
Llave
Tipo
Formato
Limpieza
Valor por
Defecto
Cod_cliente
Si
Nmero (Entero
Numrico
Largo)
Nombre
No
Texto
Fuentes de Datos
Tabla:
Cliente
Texto
No debe
(Mayscula)
ser nulo
No tiene
Nombre
Llave
Tipo
Formato Consideracin
Importante
Cod_cliente
Si
Numrico
Nmero
nombres
No
Texto
Texto
apellido_paterno
No
Texto
Texto
apellido_materno
No
Texto
Texto
fecha_nacimiento
No
Texto
Texto
Cod_tipodocumento
No
Numrico
Nmero
Nmero_documento
No
Texto
Texto
Cod_sexo
No
Texto (1)
Texto
Puede ser M o F.
Tabla Destino
Tabla:
tmpCliente
Campo
Tipo
Mapeo
ClienteKey
TEXTO(20)
ClienteKey
llenarCeros(cliente_Id,20)
IdCliente
Nmero (Entero
Cliente.cliente_id
Largo)
Nombre
Texto(50)
Concatenar(cliente.nombres,
cliente.apellido_paterno,
cliente.apellido_materno)
Sexo
Texto(1)
cliente.sexo
Tabla:
tmpCliente
Campo
Tipo
Mapeo
Edad
Nmero
Campo calculado
Proceso
1. Borrar Tablas Temporal
Eliminar la tabla temporal tmpCliente
3. Carga de la Dimensin
Tomar los valores de la tabla temporal tmpCliente y llevarla a la dimensin
Cliente. En caso que sean nuevos clientes insertarlos, en caso que sean
clientes registrados, actualizar slo: Nombre
Dimensin Defensor
Descripcin
Representa la carga de la dimensin Defensor
Descripcin de Tablas Fuentes
Tipo de Fuente
Nombre de Tabla
Descripcin
Proveedor (ASE
Defensor
Ubicacin
Contiene Departamentos ,
Sybase)
Ubicacin_Geogrfica(
ASE Sybase)
Llave
Tipo
Formato
Limpieza
Valor por
Defecto
Cod_defensor
Departamento
PK
Texto
Texto
Nmero Numrico
NO TIENE
Provincia
Nmero Numrico
Distrito
Nmero Numrico
Nombre
Llave
Tipo
Formato
Limpieza
Valor por
Defecto
Cod_sexo
No
Texto
Texto
(1)
Puede ser
sexo_id
M o F.
Fuentes de Datos
Tabla:
Defensor
Nombre
Llave
Tipo
Formato
Consideracin
Importante
Cod_defensor
Nmero
Nombres
Texto(20) Texto
apellido_paterno
Texto(20) Texto
apellido_materno
Texto(20) Texto
idUbicacin_Geogrfica
FK
Texto(6)
Numrico
Texto
fecha_nacimiento
DateTime dd/mm/yyyy
Ruc
TEXT(11) Texto
Dni
TEXT(8)
Telfono
TEXT(10) Text
correo_electrnico
TEXT(20) Text
Cod_sexo
Texto (1)
Text
Texto
Puede ser M o
F.
Tabla:
Ubicacin_Geogrfica
Nombre
Llave
Tipo
Format Consideracin
o
idUbicacin_Geogrfica
PK
Departamento
Importante
TEXTO(6) TEXTO
Nmero
Numri
co
Provincia
Nmero
Numri
co
Distrito
Nmero
Numri
co
Tabla Destino
Tabla:
TmpDefensor
Campo
Tipo
Mapeo
DefensorKey
TEXTO(20)
DefensorKey
llenarCeros(cod_defensor,20)
Cod_Defensor
Nmero
Defensor.cod_defensor
Tabla:
TmpDefensor
Campo
Tipo
Mapeo
Nombres
TEXTO (30)
Defensor.Nombres
IdSexo
TEXTO(1)
Mayscula(Defensor.sexo_id)
Departamento
Nmero
Mayscula(Ubicacin_Geogrfica.Departamento)
Provincia
Nmero
Mayscula(Ubicacin_Geogrfica.Provincia)
Distrito
Nmero
Mayscula(Ubicacin_Geogrfica.Distrito)
Proceso
1. Borrar Tablas Temporal
Eliminar la tabla temporal tmpDefensor
3. Carga de la Dimensin
Tomar los valores de la tabla temporal tmpDefensor y llevarla a la dimensin
Defensor. En caso que sean nuevos defensores insertarlos.
Dimensin Materia
Descripcin
Representa la carga de la dimensin Materia.
Descripcin de Tablas Fuentes
Tipo de Fuente
Nombre de Tabla
Descripcin
Delito (ASE
Materia
Sybase)
Estandarizacin de Datos y Limpieza de Datos
Nombre
Llave
Tipo
Formato
Limpieza
Valor por
Defecto
Cod_materia
Si
Nmero Numrico
Descripcin
No
Texto
Texto
No debe
(Mayscula)
ser nulo
No tiene
Fuentes de Datos
Tabla:
Nombre
Materia
Llave
Tipo
Formato Consideracin
Importante
Cod_materia
Si
Numrico
Nmero
Descripcin
No
Texto
Texto
Tabla Destino
Tabla:
tmpMateria
Campo
Tipo
Mapeo
MateriaKey
TEXTO(20)
MateriaKey
llenarCeros(cod_materia,20)
IdMateria
Nmero
Materia.cod_materia
Descripcin
Texto(50)
Materia.descripcin
Proceso
3. Carga de la Dimensin
Tomar los valores de la tabla temporal tmpMateria y llevarla a la dimensin
Materia.
Dimensin Dependencia
Descripcin
Representa la carga de la dimensin Dependencia.
Descripcin de Tablas Fuentes
Tipo de Fuente
Nombre de Tabla
Descripcin
Dependencia
dependencia
distritojudicial
(ASE Sybase)
DistritoJudicial
(ASE Sybase)
dependencias
TipoDependencia(
tipodependencia
ASE Sybase)
Llave
Tipo
Formato
Limpieza
Valor por
Defecto
Cod_dependen PK
Numrico Nmero
cia
Cod_distritoJudi PK
cial
Numrico Nmero
Nombre
Llave
Tipo
Formato
Limpieza
Valor por
Defecto
Cod_tipoDepen PK
Numrico Nmero
dencia
dependenciaDe
Texto
scripcin
distritojudicialD
Texto
escripcin
tipodependenci
Texto
aDescripcin
Texto(Ma
yscula)
Nulo
Texto(Ma
yscula)
Nulo
Texto(Ma
yscula)
Nulo
Fuentes de Datos
Tabla:
Dependencia
Nombre
Llave
Tipo
Formato
Consideracin
Importante
Cod_dependencia
PK
Numrico
Nmero
Cod_distritojudicial
PK
Numrico
Nmero
Cod_tipodependencia
PK
Numrico
Nmero
TEXTO
TEXTO
Descripcin
Tabla:
DistritoJudicial
Nombre
Llave
Tipo
Formato
Consideracin
Importante
Cod_distritojudicial
PK
Descripcin
Tabla:
Numrico
Nmero
TEXTO
TEXTO
TipoDependencia
Nombre
Llave
Tipo
Formato
Consideracin
Importante
Cod_tipodependencia
PK
Numri Nmero
co
Descripcin
TEXTO TEXTO
Tabla Destino
Tabla:
TmpDependencia
Campo
Tipo
DependenciaKey
TEXTO(20)
idDependencia
Numrico
Mapeo
Dependencia.
Cod_dependencia
idDistritoJudicial
Numrico
DistritoJudicial.
Cod_distritoJudicial
Tabla:
TmpDependencia
Campo
Tipo
Mapeo
idTipoDependencia
Numrico
TipoDependencia.cod_tipoDep
endencia
dependenciaDescripcin
TEXTO(255)
Mayscula(Dependencia.Descr
ipcin)
distritoJudicialDescripcin
TEXTO(255)
Mayscula(DistritoJudicial.Des
cripcin)
tipoDependenciaDescripcin
TEXTO(255)
Mayuscula(TipoDependencia.D
escripcin)
Proceso
5. Carga de la Dimensin
Tomar los valores de la tabla temporal tmpDependencia y llevarla a la
dimensin Dependencia.
Dimensin Gestin
Descripcin
Representa la carga de la dimensin Gestin.
Fuentes de Datos
Tabla:
Gestin
Nombre
Llave
Tipo
Formato
Consideracin
Importante
Cod_gestin
PK
Numrico Nmero
Cod_TipoGestin
FK
Numrico Nmero
Cod_resultado
FK
Numrico Nmero
Cod_apelacin
FK
Numrico Nmero
Fecha_diligencia
DateTime DateTime
Fecha_resultado
DateTime DateTime
Fecha_apelacin
DateTime DateTime
Tabla:
Nombre
TipoGestin
Llave
Tipo
Formato
Consideracin
Importante
TipoGestin_id
Descripcin
PK
Numrico Nmero
TEXTO
TEXTO
Tabla:
resultado
Nombre
Llave
Tipo
Formato
Consideracin
Importante
Tiporesultado_id
PK
Numrico Nmero
Descripcin
Tabla:
TEXTO
TEXTO
apelacion
Nombre
Llave
Tipo
Formato
Consideracin
Importante
Tipoapelacin_id
Descripcin
PK
Numrico Nmero
TEXTO
TEXTO
Tabla Destino
Tabla:
TmpGestin
Campo
Tipo
Mapeo
GestinKey
TEXTO(20)
GestinKey
llenarCeros(cod_gesti
n,20)
IdDigestin
Numrico
TipoDiligencia.diligenci
aId
IdResultadp
Numrico
TipoResultado.resultad
oId
Tabla:
TmpGestin
Campo
Tipo
Mapeo
IdApelacin
Numrico
TipoApelacin.apelaci
nId
diligenciaDescripcin
TEXTO(255)
Mayuscula(tipogestin.
Descripcin)
resultadoDescripcin
TEXTO(255)
Mayscula(resultado.D
escripcin)
apelacionDescripcin
TEXTO(255)
Mayscula(apelacin.
Descripcin)
Proceso
6. Carga de la Dimensin
Tomar los valores de la tabla temporal tmpGestin y llevarla a la dimensin
Gestin.
En esta fase se construye la vista de los reportes que sern usados por
los usuarios finales, dichos reportes estn basados en la informacin que
a proporcionado el equipo de requerimientos.
Para la generacin de reportes se han considerado desarrollar consultas
agrupadas y dentro de cada grupo tener una serie de reportes.
Vistas y Reportes
Tema
Reporte
Anlisis de Casos
Anlisis de Delitos
Anlisis de Clientes
ANLISIS DE CASOS
CASOS POR PERIODO
Diseo:
Tipo: Barras
Filas:
No. Dimensin
Nivel
casos
Caso
Columnas:
No. Dimensin
Nivel
Fecha
Tiempo
Filtro:
No. Operacin
1
Tumbes
4%
Tacna
4%
Trujillo
5%
Lima
50%
Arequipa
21%
Piura
16%
Nivel
etapa
caso
Columnas:
No. Dimensin
Nivel
distritoJudicial
Dependencia
Medida:
No. Medida
Formato
Entero
Nmero de casos
Filtro:
No. Operacin
1
ANLISIS DE DELITOS
DELITOS MS FRECUENTES
Diseo:
Filas:
No. Dimensin
Nivel
materia
Materia
Columnas:
No. Dimensin
Nivel
Cliente
Ubicacin
Tiempo
Medida:
No. Medida
Formato
Entero
Cantidad
Filtro:
No. Operacin
1
Tipo: crosstab
Filas:
No. Dimensin
Nivel / Categora
Materia
Materia
Columnas:
No. Dimensin
Nivel / Categora
Meses
Tiempo
Medida:
No. Medida
Formato
Integer
Filtro:
No. Operacin
1
No. Operacin
2
Periodo 1= <Mes>
Tipo: crosstab
Filas:
No. Dimensin
Nivel / Categora
delito
Delito
Columnas:
No. Dimensin
Nivel / Categora
Trimestre
Tiempo
Medida:
No. Medida
Formato
Integer
Filtro:
No. Operacin
1
No. Operacin
3
Periodo 1= <Trimestre>
ANLISIS DE IMPUTADOS
Tipo: Crosstab
Filas:
No. Dimensin
Nivel
distritoJudicial
Dependencia
Columnas:
No. Dimensin
Nivel
Ao, mes
Tiempo
Medida:
No. Medida
1
Formato
Num_Imputados_Ingresados Entero
Filtro:
No. Operacin
1
Tipo: Barras
Filas:
No. Dimensin
Nivel
cliente
Cliente
Columnas:
No. Dimensin
Nivel
Ao
Tiempo
Medida:
No. Medida
1
Formato
Num_Imputados_Ingresados Entero
Filtro:
No. Operacin
1
Clientes
Femenino
Masculino
Semestre 1
Semestre 2
Periodo
Nivel
distritoJudicial
Dependencia
Femenino
Columnas:
No. Dimensin
Nivel
Ao,Semestre
Tiempo
Medida:
No. Medida
1
Formato
Num_Imputados_Ingresados Entero
Filtro:
No. Operacin
1
Tipo: Crosstab
Filas:
No. Dimensin
Nivel
distritoJudicial
Dependencia
Columnas:
No. Dimensin
Nivel
Ao,Semestre
Tiempo
Medida:
No. Medida
1
Formato
Num_Imputados_Ingresados Entero
Filtro:
No. Operacin
1
Reporte
Casos por Periodo.
Casos por Distrito Judicial.
Relacin entre imputados en trmite y
terminados ingresados en los ltimos
doce meses por distrito judicial.
4.1.10.Implementacin
Para poder realizar la implementacin del sistema previamente se debe
haber realizado el anlisis de los requerimientos de los usuarios del
sistema, pudiendo definir as reglas del negocio, luego proceder a realizar
el Diseo del Datamart y crear los procesos ETL, que son necesarios para
crear el Datamart y crear las consultas.
Cuando se realiza la implementacin se debe de tener en cuenta los
siguientes puntos:
La capacitacin, el soporte tcnico, la comunicacin, las estrategias de
feedback. Todas estas tareas deben ser tenidas en cuenta antes de que
cualquier usuario pueda tener acceso al Datamart
Plan de Implementacin.- El plan de implementacin considera las
siguientes actividades:
1. Capacitacin del sistema a los usuarios que disponga la Direccin
Nacional de Justicia, los mismos que luego podrn capacitar a los
usuarios de las diferentes defensoras.
2. Capacitacin tcnica de la herramienta al personal de Sistemas, con el
propsito que puedan dar el soporte informtico a los usuarios y el
mantenimiento posterior del mismo.
3. Verificacin Final de los datos antes de inicio de la operacin.
Inicio de Operacin y soporte de puesta en marcha.
CONCLUSIONES
RECOMENDACIONES
REFERENCIAS BIBLIOGRFICAS
[3]] To BI or not to BI
http://www.monografias.com/trabajos14/bi/bi.shtml
2003
Sistemas Decisionales
http://gobiernotic.blogspot.com/2007/06/8-claves-para-el-xitode-un-cuadro-de.html
Tecnologa Datawarehousing
http://html.rincondelvago.com/datawarehousing.html
Proceso de Datamining
http://www.sonda.com/es/global/home/capacidades/business_i
ntelligence/data_mining/