Académique Documents
Professionnel Documents
Culture Documents
SEMANA 2
Introducción a la
inteligencia de negocios.
Parte 2
ÍNDICE
OBJETIVOS ESPECÍFICOS ...................................................................................................................... 3
INTRODUCCIÓN ................................................................................................................................... 3
1. MINERÍA DE DATOS ..................................................................................................................... 4
1.1. TIPOS DE PATRONES QUE SE PUEDEN EXTRAER ................................................................. 6
1.2. LIMPIEZA, INTEGRACIÓN Y TRANSFORMACIÓN DE LOS DATOS ......................................... 8
2. MULTIDIMENSIONALIDAD......................................................................................................... 10
2.1. ¿QUÉ ES LA MULTIDIMENSIONALIDAD? ........................................................................... 10
2.2. DIMENSIONES.................................................................................................................... 11
2.3. TABLAS DE HECHOS ........................................................................................................... 12
3. APLICACIONES ANALÍTICAS ....................................................................................................... 13
3.1. CARACTERÍSTICAS.............................................................................................................. 13
3.2. ELEMENTOS DE UNA APLICACIÓN ANALÍTICA .................................................................. 14
3.3. DASHBOARDS .................................................................................................................... 15
3.4. BALANCED SCORECARD ..................................................................................................... 16
4. SISTEMAS DE REPORTES ............................................................................................................ 18
4.1. REPORTES DE GESTIÓN ..................................................................................................... 18
4.2. REPORTES DE PRODUCCIÓN.............................................................................................. 19
4.3. REPORTES OPERACIONALES Y TRANSACCIONALES ........................................................... 20
COMENTARIO FINAL.......................................................................................................................... 21
REFERENCIAS ..................................................................................................................................... 22
2
ESTE DOCUMENTO CONTIENE LA SEMANA 2
INTRODUCCIÓN A LA INTELIGENCIA DE NEGOCIOS. PARTE 2
OBJETIVOS ESPECÍFICOS
Comprender las características y alcances de la minería de datos en la inteligencia de
negocios.
Analizar las características, los usos y los distintos tipos de sistemas de reportes.
INTRODUCCIÓN
En esta semana se abordarán temas como la minería de datos que consiste en la extracción de
información útil de los antecedentes de una organización, principalmente buscando patrones
(descriptivos y predictivos) en grandes volúmenes de información, en donde se prepara y procesa
de forma iterativa. El estudiante podrá observar un ejemplo de análisis en minería de datos
utilizando una herramienta llamada Weka.
Para finalizar serán explicados los conceptos de dashboard, scorecard y reportes, ejemplificando
cada uno de ellos, e indicando la utilidad de las herramientas analíticas y su aporte dentro de una
organización.
3
ESTE DOCUMENTO CONTIENE LA SEMANA 2
1. MINERÍA DE DATOS
La minería de datos o exploración de datos se definió como un área de estudio de la informática
cuyos procesos de desarrollo intentan descubrir patrones en grandes volúmenes de datos a través
de diferentes sistemas de manejo de bases de datos. Por tanto, el objetivo general de la minería
de datos consiste en extraer información de un conjunto de datos y transformarla en una
estructura comprensible para su uso posterior.
Entonces, a partir del gran volumen de información que posee y maneja una organización, surge la
necesidad de convertir esos datos en conocimiento útil y valioso. De esta forma, las organizaciones
pueden obtener más información favorable y utilizarla de manera más eficiente, como por
ejemplo: mejorar la fidelización de sus clientes, elaborar estrategias de marketing o realizar un
análisis del crecimiento del mercado (Han y Kamber, 2006).
4
ESTE DOCUMENTO CONTIENE LA SEMANA 2
De acuerdo al esquema de una arquitectura de minería de datos se detalla lo siguiente:
Motor de la minería de datos: esto es esencial para el sistema de minería de datos y consiste
en un conjunto de módulos funcionales para tareas como la caracterización, asociación,
análisis, correlación, clasificación y predicción.
Evaluación del patrón: este componente utiliza normalmente medidas e interactúa con los
módulos de minería de datos con el fin de centrar la búsqueda hacia patrones interesantes. Se
pueden utilizar umbrales para filtrar los patrones descubiertos. Alternativamente, el módulo
de evaluación puede integrarse con el módulo de minería, dependiendo de la implementación
del método de minería de datos utilizado.
Interfaz de usuario: este módulo se comunica entre los usuarios y el sistema de extracción de
datos, permitiendo al usuario interactuar con el sistema mediante la especificación de una
consulta o tarea de minería de datos, proporcionando información que ayuda a enfocar la
búsqueda.
1) Limpieza de datos.
2) Integración de datos.
3) Selección de datos.
4) Transformación de los datos.
5) Minería de datos.
6) Evaluación de patrones.
7) Presentación del conocimiento.
Se puede ver que la minería de datos es solo un paso dentro de un proceso, en el cual se
presentan los patrones que le interesan al usuario, pudiéndose estos almacenar como un nuevo
conocimiento. Además, dentro del proceso de descubrimiento de conocimiento se pueden revelar
5
ESTE DOCUMENTO CONTIENE LA SEMANA 2
nuevos patrones los cuales pueden ser utilizados para obtener información relevante para el
dominio de negocio.
Predictivos: describen inferencias sobre los datos actuales con el fin de hacer predicciones.
Hay ocasiones en que los usuarios no tienen claridad sobre qué tipos de patrones encontrados en
sus datos pueden ser importantes, debido a esto puede surgir la necesidad de buscar patrones en
paralelo. Por lo tanto, es necesario contar con un sistema de minería de datos que extraiga
diversos tipos de patrones para cumplir con las expectativas de los usuarios o aplicaciones.
Entonces, el sistema de minería de datos debe ser capaz de descubrir patrones en distinta
granularidad, es decir, en variados niveles de abstracción.
Existe un software open source creado por la Universidad de Waikato llamado Weka (Waikato
Environment for Knowledge Analysis o Entorno para Análisis del Conocimiento de la Universidad
de Waikato), el cual aplica métodos de aprendizaje automático, es decir, analiza un gran volumen
de datos y destaca o discrimina la información que es más relevante. Esta información puede ser
utilizada para realizar predicciones o ayudar a una organización a tomar decisiones estratégicas u
operativas de forma más rápida y con mayor precisión.
6
ESTE DOCUMENTO CONTIENE LA SEMANA 2
A continuación se presenta el siguiente ejemplo: Se requiere buscar información dentro de las
compras realizadas por algunos clientes. Se cuenta con un archivo .csv con la siguiente
información:
Con Weka se puede extraer la información requerida dentro de la muestra. En este caso: sexo,
tipo de artículo y monto de compra.
7
ESTE DOCUMENTO CONTIENE LA SEMANA 2
1.2. LIMPIEZA, INTEGRACIÓN Y TRANSFORMACIÓN DE LOS DATOS
La información del mundo real suele ser incompleta e inconsistente. La limpieza de datos consiste
en rutinas que intentan rellenar valores perdidos y “suavizar el ruido” mientras se identifican los
valores y las inconsistencias de estos (Han y Kamber, 2006).
Por ejemplo, si se necesita analizar las ventas de una línea de productos de electrónica e
información de los clientes, ¿cómo se pueden ir rellenando los valores que faltan para este
atributo? A continuación se indicarán distintos métodos:
1
En matemáticas, una tupla es una lista ordenada de elementos.
2
Modelo de predicción utilizado en el ámbito de la inteligencia artificial.
8
ESTE DOCUMENTO CONTIENE LA SEMANA 2
En los métodos mencionados del 3 al 6 la forma de rellenar los datos puede no ser correcta. Por su
parte el método 6 es el más popular, ya que se utilizan datos actuales para predecir los valores
faltantes.
Cabe destacar que la falta de datos no siempre significa un error, puesto que pueden ser datos
opcionales dentro de un formulario, sin embargo lo correcto sería dejar ese campo como “no
aplicable” o con un símbolo distintivo en la base de datos, de esta forma se pueden identificar los
valores que correctamente no se encuentran completados por el usuario. A pesar de los distintos
métodos para limpiar los datos, es importante realizar un buen diseño de base de datos y de los
procedimientos de ingreso de información para minimizar los errores.
La tarea de análisis de datos implica la integración de datos, que combina información desde
múltiples fuentes en un almacén de datos coherente. Estas fuentes pueden incluir múltiples bases
de datos, cubos de datos o archivos planos.
La redundancia es otro tema importante en la integración de los datos. Un atributo (como ingresos
anuales, por ejemplo) puede ser redundante si puede ser derivado de otro atributo o conjunto de
atributos. Inconsistencias en un atributo también pueden causar redundancias en el conjunto de
datos resultante.
La resolución de los datos es muy relevante cuando existen conflictos en los valores. Por ejemplo,
en una cadena de hoteles el precio de las habitaciones en diferentes ciudades puede implicar no
solo a las distintas monedas, sino también diferentes servicios (como desayuno incluido) y los
impuestos. El atributo moneda puede llamarse de la misma forma desde distintas fuentes, pero su
contenido es distinto.
9
ESTE DOCUMENTO CONTIENE LA SEMANA 2
Existen softwares comerciales que realizan el proceso de extracción, transformación y carga de
datos, a este proceso se le llama ETL.
2. MULTIDIMENSIONALIDAD
10
ESTE DOCUMENTO CONTIENE LA SEMANA 2
A continuación se muestra un ejemplo de un cubo multidimensional también llamado OLAP
(Online Analytical Processing o procesamiento analítico en línea):
En el cubo se pueden observar las unidades vendidas de cada uno de los libros, para los distintos
clientes y en los distintos años. Este es el concepto de multidimensionalidad. Se dispone de las
unidades vendidas de cada uno de los libros para cada uno de los clientes y en cada uno de los
años: el contenido de un cubo individual son las ventas de un libro a un cliente en un año. Los
contenidos de cada uno de los cubos individuales del cubo mayor recogen lo que se llama hechos
(en el ejemplo, las unidades vendidas). En la actualidad, las soluciones OLAP permiten que cada
uno de los cubos individuales pueda contener más de un hecho (Cano, 2007).
2.2. DIMENSIONES
Las dimensiones se conforman por atributos que generalmente son textos que permiten realizar
filtros y agrupar indicadores. En un ejemplo de sistema de venta de productos de acero las
dimensiones pueden ser: clientes, tiempo y producto.
Cada una de las dimensiones debe tener la mayor cantidad de atributos que permitan realizar un
análisis detallado, es decir, en el caso de la dimensión tiempo es importante saber el nivel de
detalle (granularidad) del análisis, el que puede ser por día, mes, año, hora, minuto y segundo.
11
ESTE DOCUMENTO CONTIENE LA SEMANA 2
En la siguiente tabla se muestra un ejemplo de dimensión cliente:
En el siguiente esquema se puede visualizar que la tabla de hechos contiene la llave única de cada
dimensión, esto permitirá acceder a través de ella a los atributos que se encuentran en las
dimensiones.
12
ESTE DOCUMENTO CONTIENE LA SEMANA 2
3. APLICACIONES ANALÍTICAS
Una aplicación analítica radica en un conjunto lógicamente integrado de informes dinámicos que
incluyen dashboards y scorecards. La principal ventaja es el acceso a una gran cantidad de
usuarios y al análisis de datos de diversas tareas que se administran en la actividad comercial de
una organización; como lo son las ventas, servicios y operaciones (TWDatos, 2006). La siguiente
imagen representa una aplicación analítica:
3.1. CARACTERÍSTICAS
Las características de las aplicaciones analíticas son las siguientes (TWDatos, 2006):
1) Integración lógica: dentro de las características principales que contiene una aplicación
analítica está la lógica comercial, que es incluida para ayudar a los usuarios en la interacción
con la aplicación, permitiendo navegar dentro de una serie de tareas. Una aplicación analítica
muestra distintos tipos de informes interactivos o vista de datos dimensionales.
Los usuarios que visualizan los reportes solo en ocasiones requieren guías analíticas que les
proporcionen ayuda para el análisis de los datos y la toma de decisiones. La navegación guiada
puede ser a través de pestañas que identifican la información de análisis. Algunas
herramientas de business intelligence (BI) entregan recomendaciones a los usuarios con
13
ESTE DOCUMENTO CONTIENE LA SEMANA 2
alertas que permiten ver las acciones que se deben tomar.
2) Reportes interactivos que facilitan a los usuarios acceder, analizar y actuar: al visualizar una
aplicación transaccional usualmente se puede ver que contienen interfaces predefinidas, en
cambio los reportes analíticos son interactivos, es decir, los usuarios pueden ingresar con una
vista global de un reporte e ir hacia un nivel más detallado. Los informes interactivos son
proporcionados por distintas tecnologías como: cubos OLAP, reportes parametrizados,
formulación estadística y técnicas avanzadas de visualización, entre otras.
3) Información integrada: una aplicación analítica es un objeto soportado por un repositorio de
almacenamiento de datos de la organización. Un solo almacén de datos puede contener
variadas aplicaciones analíticas.
4) Dirección de un dominio comercial: la definición de una aplicación analítica determinada por
los requerimientos de negocio que solicite el área comercial. Estas pueden ser de servicios,
ventas de productos o infraestructura. Por ejemplo, en una aplicación del área de ventas lo
importante a visualizar son las ventas por sucursales, el producto más vendido, la información
histórica de las ventas por cada año. Toda la información se encuentra enlazada dentro de un
modelo lógico.
1) Visualización: esto consiste en una interfaz gráfica amigable para el usuario, con detalle de
colores, tipos de fuentes de fondos de pantalla, además de entregar la navegación entre las
distintas áreas de trabajo.
2) Reportes y análisis: los reportes pueden ser presentados de forma estática o interactiva,
permitiendo acceder a un detalle más profundo dentro del informe o filtrar por distintos
atributos que se obtienen de las diversas vistas. Con respecto al análisis, incorpora cálculos,
algoritmos estadísticos y visualizaciones avanzadas que ayudan a los usuarios a analizar
grandes volúmenes de información.
3) El servidor de análisis: es el responsable de procesar peticiones utilizando run-time3 de
metadatos definidos y de guardarlos en la memoria del servidor. El servidor de análisis
también realiza funciones administrativas como la seguridad, entrega de reportes, rastreo,
clustering y archivos de almacenamiento.
4) Lógica de negocios: las reglas de navegación de los usuarios es paso a paso a través de
reportes, vistas, acciones.
3
O tiempo de ejecución. Es el intervalo de tiempo en el que un programa de computadora se ejecuta en un
sistema operativo.
14
ESTE DOCUMENTO CONTIENE LA SEMANA 2
5) Modelo de datos: es el core de una aplicación analítica, el cual trabaja en conjunto con la capa
semántica de BI, representa los elementos de los datos en las condiciones comerciales
comunes, los modelos de datos son usados en las definiciones de los cubos OLAP.
6) El mapeo de las fuentes de datos: en este se establecen las transformaciones requeridas para
llevar los datos de origen al modelo de datos analítico.
3.3. DASHBOARDS
Los dashboards proporcionan una interfaz intuitiva que permite supervisar y analizar los datos. El
objetivo es entregar información del rendimiento de la organización sobre sus distintas áreas.
Generalmente son creados para directivos y ejecutivos que requieren una visión global del
funcionamiento de la organización (TWDatos, 2006).
15
ESTE DOCUMENTO CONTIENE LA SEMANA 2
Dashboard de datos en Oracle Business Intelligence
4
Profesor de la Escuela de Negocios de Harvard.
5
Destacado teórico de los negocios estadounidense, experto en el management empresarial a nivel
mundial.
16
ESTE DOCUMENTO CONTIENE LA SEMANA 2
El cuadro de mando integral tiene sus raíces en el trabajo pionero de General Electric en la
presentación de informes de medición del desempeño en la década de 1950 y en el trabajo de los
ingenieros de proceso franceses (que crearon el tableau de bord, literalmente: tablero de las
medidas de rendimiento) en la primera mitad del siglo XX (Knapp, 2001).
Según lo definido por Kaplan y Norton (1996, p. 8): “El balanced scorecard traduce la misión de
una organización y estrategia en un conjunto integral de medidas de rendimiento que proporciona
el marco para una medida estratégica y sistema de gestión”. Este sistema de gestión estratégica
mide el desempeño organizacional en cuatro perspectivas equilibradas:
Financiera
Cliente
Contiene medidas como identificar al cliente y segmentos de mercado en los que la
unidad de negocio competirá y las medidas de rendimiento de la unidad de negocio
en estos segmentos objetivos.
Medidas de los procesos internos críticos en los que la organización debe sobresalir.
Innovación y crecimiento
17
ESTE DOCUMENTO CONTIENE LA SEMANA 2
Determinación del balanced scorecard
4. SISTEMAS DE REPORTES
Los sistemas de reportes entregan información relevante para decisiones de análisis en una
organización. Existen múltiples tipos de reportes, los cuales se encuentran enfocados a tres
distintas áreas: la gestión, la producción y los operacionales y transaccionales (Metrics and
Statistics, 2010).
18
ESTE DOCUMENTO CONTIENE LA SEMANA 2
solicitados. Como ejemplos de reportes de gestión están el informe de cobranzas o el detalle de
facturación por razón social y vendedor.
En la siguiente tabla se visualiza un ejemplo de reporte de gestión por montos facturados por
vendedor y razón social:
19
ESTE DOCUMENTO CONTIENE LA SEMANA 2
4.3. REPORTES OPERACIONALES Y TRANSACCIONALES
Estos tipos de reportes son informes detallados que se basan en una fuente de datos operacional
o transaccional como, por ejemplo, un sistema ERP (Enterprise Resource Planning o sistemas de
planificación de recursos empresariales) que registra la operatividad diaria de una organización.
20
ESTE DOCUMENTO CONTIENE LA SEMANA 2
COMENTARIO FINAL
De acuerdo a los contenidos de esta semana se mostraron en general ejemplos prácticos para
cada uno de ellos, entre estos se explicó el funcionamiento de la herramienta de minería de datos
Weka, la cual permite obtener conocimiento a partir de un gran volumen de información y desde
distintos tipos de fuentes. Al conocer la herramienta Weka y profundizar en su funcionamiento los
estudiantes podrán aportar en una organización para obtener información relevante que no se
conoce de antemano.
Además, se explicaron los distintos tipos de reportes que pueden ser utilizados dentro de una
organización para analizar desde diferentes perspectivas y según las necesidades de cada área.
21
ESTE DOCUMENTO CONTIENE LA SEMANA 2
REFERENCIAS
Cano, J. (2007). Business intelligence: Competir con información. España. Fundación Cultural
Banesto.
Han, J. y Kamber, M. (2006). Data mining concepts and techniques. 2ª edición. San Francisco: Asma
Sthefan.
Kaplan, R. y Norton, D. (1996). The balanced scorecard: Translating strategy into action. EE. UU.:
Hardcover.
Kimball, R. y Ross, M. (2002). The data warehouse toolkit. The complete guide to dimensional
Knapp, K. R. (2001). The balanced scorecard: Historical development and context, as developed by
Markov, Z. y Russell, I. (s. f.). An introduction to the WEKA data mining system. Disponible en:
http://www.cs.ccsu.edu/~markov/weka-tutorial.pdf
Metrics and Statistics. (2010). Business intelligence report types. Disponible en:
http://johnetl.hubpages.com/hub/Business-Intelligence-report-types.
Oracle. Help Center. (2015). Fusion middleware user’s guide for Oracle Business Intelligence
http://docs.oracle.com/cd/E28280_01/bi.1111/e10544/getstart.htm#BIEUG1004
http://www.twdatos.com/sitio/(S(322e3w45kmcisuvvdhwxnv45)A(YKCFqBZmzgEkAAAAM
22
ESTE DOCUMENTO CONTIENE LA SEMANA 2
TA0Zjc2ODMtZTc4YS00Yjk4LWE0NTAtM2QxNWIxZmNiNjgx-
51cS7l1rMe4H0kKLYL7rJVY1UA1))/Publicaciones/aplicacionesanaliticas.aspx.
Intelligence. Semana 2.
23
ESTE DOCUMENTO CONTIENE LA SEMANA 2
24
ESTE DOCUMENTO CONTIENE LA SEMANA 2