Vous êtes sur la page 1sur 11

Trabajo prctico

Explotacin de informacin
Integrantes:
Leandro Mouzo, Leandro Ros,
Nahuel Rodrguez.

Ctedra:

Ingeniera del software III


Licenciatura en Sistemas.

2016

Tanagra
Ejercicio 1
Una bodega ha recolectado la informacin relativa a la composicin qumica de sus vinos
producidos durante los ltimos aos (archivo:"TP1-Calidad-Vinos.xls"). Con fines de confeccionar
futuras lneas de vinos que tengan diferentes calidades, se desea realizar un anlisis de los vinos
producidos para conocer los tipos de calidad disponibles con sus caractersticas ms relevantes.
a) Determine el o los procesos de explotacin de informacin a utilizar.
Se utiliz el mtodo de Ponderacin de Reglas de Comportamiento o de Pertenencia a
Grupos a fin de descubrir qu atributos del producto impactan ms sobre la calidad.

b) Utilice la herramienta Tanagra para desarrollar los procesos de explotacin de


informacin identificados.
Se procedi a cargar la base de datos (archivo: "TP1-Calidad-Vinos.xls") con la
herramienta Tanagra y se emple primero un algoritmo TDIDT (C4.5), debido a que el
atributo clave se encontraba definido en el dataset (la calidad). Por medio del mismo se
descubrieron las reglas de pertenencia a cada grupo de calidad, para finalmente aplicar
Redes Bayesianas (Naive Bayes) para ponderar dichas reglas de pertenencia.

c) Discuta los resultados y de una interpretacin.


A partir de los resultados puede inferirse en primer lugar que los tipos de calidad ms
frecuentes en el dataset son el 5 y el 6, con un 78,5% del total de muestras. A partir de la
ponderacin obtenida con la aplicacin del algoritmo Naive Bayes puede establecerse que el
tipo de vino afecta a la calidad, con una mayor ponderacin para los blancos en las calidades
ms altas. Tambin puede destacarse que los vinos con mayor calidad se destacan por una
baja acidez fija, (menor que 6,3) y voltil (menor que 0,21), un contenido de aido ctrico
entre 2,3 y 5, bajo contenido de cloruros (menor que 0,036) un contenido de dixido de
azufre entre 33 y 45, una densidad ms baja (menor que 0,9918), un pH menor que 3,08 y un
nivel de alcohol mayor que 11,6.

Ejercicio 2
Una compaa de telefona celular ha formulado una encuesta a un grupo de usuarios para
obtener informacin (archivo: "TP1-fidelidad-telefonia.xls") sobre la visin de dicho grupo sobre la
calidad del servicio prestado. Con carcter posterior a dicho trabajo de investigacin de mercado
surge el inters de caracterizar el comportamiento de los que continua comprando los servicios y los
que no.
a) Determine el o los procesos de explotacin de informacin a utilizar.
Se utiliz el mtodo de Descubrimiento de Reglas de Comportamiento a fin de
determinar qu caractersticas de los clientes redundaban en una mayor fidelidad hacia la
compaa.

b) Utilice la herramienta Tanagra para desarrollar los procesos de explotacin de


informacin identificados.
Se procedi a cargar la base de datos (archivo: "TP1-fidelidad-telefonia.xls") con la
herramienta Tanagra y se aplic al dataset un algoritmo TDIDT (C4.5) tomando al atributo
CONTINUA_COMPRANDO como clave. Luego se aplic el mismo algoritmo, pero
tomando como clave el atributo CAMBIA_PROVEEDOR a fin de caracterizar a los clientes
que podran cambian de proveedor.

c) Discuta los resultados y de una interpretacin.


De los resultados obtenidos podemos concluir que el atributo que ms se asocia con la
fidelidad a la compaa es el de recomendacin. En el 90,72% de los casos el cliente que ha
recibido una recomendacin contina comprando los productos de la compaa, mientras
que para aquellos que no la han recibido el factor ms importante es el nivel de gasto, con el
65,31% de los clientes que se encuentran satisfechos con su nivel de gasto fieles a la
compaa. Se pueden observar los siguientes rboles de decisiones:

Ejercicio 3
Una compaa importadora de autos de alta gama, ha decidido revisar su poltica de venta
dirigida a las concesionarias minoristas, en la que las mismas pueden ofrecer la promocin de
reparaciones sin cargo para el cliente (pero con cargo a la compaa importadora) durante el primer
ao, a partir de la informacin que tiene de la red de talleres que le prestan dicho servicio (archivo:
"TP1-Repacion-autos.xls"). Esta revisin parte de la sospecha de maniobras dolosas surgidas de la
posible connivencia entre algunas concesionarias y algunos talleres respecto de algn tipo de
reparacin no verificable.
a) Determine el o los procesos de explotacin de informacin a utilizar.
Para resolver este caso, hemos aplicado la tcnica de Ponderacin de Interdependencia de
Atributos.

b) Utilice la herramienta Tanagra para desarrollar los procesos de explotacin de


informacin identificados.
Se procedi a cargar la base de datos (archivo: "TP1-Repacion-autos.xls") con la
herramienta Tanagra y se aplic al dataset un algoritmo de Redes Bayesianas (Naive bayes)
a fin de descubrir cules son los atributos que podran indicar maniobras dolosas por
reparaciones no verificables.
A partir del dataset supusimos que las reparaciones no verificables son las que implican
nicamente mano de obra sin el cambio de ningn repuesto, por lo que tomamos como
atributo clave al costo de materiales, esperando encontrar cules son los atributos con mayor
incidencia para costo de materiales cero o muy prximo a cero.

c) Discuta los resultados y de una interpretacin.


Encontramos que hay una alta proporcin (24,85%) de reparaciones con costo de
materiales cercano a cero, pero no detectamos ningn atributo que cause especialmente un
costo de materiales bajo.

Ejercicio 4
Con base en el anlisis de su cartera histrica de clientes hipotecarios (archivo: "TP1Otorgamiento-Creditos.xls") un banco desea relanzar la lnea de crditos en el rea para lo cual ha
establecido las siguientes necesidades: [i] sistematizar los criterios de otorgamiento de crditos, [ii]
identificar y caracterizar grupos de clientes en orden a estudiar lneas de crdito diferenciales por
grupo.
a) Determine el o los procesos de explotacin de informacin a utilizar.
En este caso se han aplicado dos tcnicas de explotacin de informacin:
La tcnica de Descubrimiento de Reglas de Comportamiento y la tcnica de
Descubrimiento de Reglas de Pertenencia a Grupos.

b) Utilice la herramienta Tanagra para desarrollar los procesos de explotacin de


informacin identificados.
Se procedi a cargar la base de datos (archivo: "TP1-Otorgamiento-Creditos.xls") con la
herramienta Tanagra.
Para resolver la necesidad de sistematizar los criterios de otorgamiento de crditos, se
aplic la tcnica de Descubrimiento de Reglas de Comportamiento. A tal fin se aplic un
algoritmo TDIDT (C4.5) al dataset, tomando como clave el atributo Otorga_Crditos.
Para resolver la necesidad de identificar y caracterizar grupos de clientes se aplic la
tcnica de Descubrimiento de Reglas de Pertenencia a Grupos. A tal fin, primero se aplic
un algoritmo de mapas auto organizados de Kohonen (Kohonen-SOM), identificando los
distintos grupos de clientes. A la clusterizacin obtenida se le aplic un algoritmo TDIDT
(C4.5) a fin de descubrir las reglas que definen la pertenencia a cada grupo.
c) Discuta los resultados y de una interpretacin.
En cuanto a las reglas de otorgamiento de crditos podemos ver que el primer factor a
considerar es la existencia de otros crditos del mismo solicitante, seguido de la
composicin familiar, el ingreso y finalmente la vivienda.
En cuanto a la caracterizacin de grupos de clientes podemos decir que se detectaron
cuatro grupos. Podemos ver como resultados para ambas partes del ejercicio sus respectivos
rboles de decisiones:

Explotacin de informacin
Ejercicio 1
Genere con su grupo de trabajo un problema de inteligencia de negocio que describa los aspectos
de negocio que se estimen pertinentes para la mejor comprensin de dicho problema y que
requieran la utilizacin del proceso de descubrimiento de comportamiento.
La resolucin deber contener:
a) Descripcin del negocio y de los aspectos del negocio pertinentes al problema de
inteligencia de negocio.
Una cadena de supermercados ha recolectado informacin de las ventas de productos
provenientes de cada ticket de compra, que se ha registrado a lo largo de un ao. Buscando
mejorar sus ingresos, quieren realizar nuevas promociones de productos en base a las ventas
de productos que estn relacionados entre s. Se puede contemplar las promociones de este
tipo de acuerdo a una fecha u horario en particular.

b) Descripcin del problema de inteligencia de negocio.


Se desea saber qu productos incitan o elevan la venta de otros productos para poder
generar promociones en base a dicha relacin.

c) Descripcin de los datos del negocio que se estiman de utilidad para aplicar el proceso de
explotacin de informacin de referencia.
Los datos de negocio que se estiman de utilidad son los que se generan a partir de un
ticket: producto y su cantidad correspondiente, fecha y hora.

Ejercicio 2
Idem Ejercicio 1 para el proceso de descubrimiento de grupos.
a) Descripcin del negocio y de los aspectos del negocio pertinentes al problema de
inteligencia de negocio.
Los encargados del sistema de becas universitarias nacional han obtenido los datos de
todos los estudiantes de las universidades pblicas. Desean modificar su poltica de becas
para poder llegar a ms estudiantes que realmente necesiten de ayuda econmica e

incentivar a aquellos que teniendo sus necesidades bsicas satisfechas se ven tentados a
volcarse al mundo laboral abandonando los estudios.

b) Descripcin del problema de inteligencia de negocio.


En base a esto surge el inters de separar a los estudiantes en distintos niveles de acuerdo
a caractersticas econmicas y acadmicas, para que los encargados de las becas puedan
asignarles a cada nivel una beca de determinadas caractersticas (diferentes entre un nivel y
otro).

c) Descripcin de los datos del negocio que se estiman de utilidad para aplicar el proceso de
explotacin de informacin de referencia.
Los datos de negocio que se estiman de utilidad son: promedio acadmico, composicin
familiar, ingresos familiares, domicilio.

Ejercicio 3
dem Ejercicio 1 para el proceso de ponderacin de interdependencia de atributos.
a) Descripcin del negocio y de los aspectos del negocio pertinentes al problema de
inteligencia de negocio.
La empresa Adidas se dedica a la venta de ropa e indumentaria deportiva.

b) Descripcin del problema de inteligencia de negocio.


La empresa Adidas quiere saber qu caractersticas de su indumentaria la hicieron una de
las lderes a nivel mundial y hacen que logre mantener una gran cantidad de clientes con
fidelidad a la marca, por lo cual guarda toda la informacin de ventas en su base de datos.

c) Datos del negocio que se estiman de utilidad para aplicar el proceso de explotacin de
informacin.
Los datos de negocio que se estiman de utilidad son: calidad, precio, publicidad,
garantaDeLaCompra, competencia y atencionAlCliente.

Ejercicio 4
dem Ejercicio 1 para el proceso de descubrimiento de reglas de pertenencia a grupos.

a) Descripcin del negocio y de los aspectos del negocio pertinentes al problema de


inteligencia de negocio.
Una cadena de supermercados, en base a un historial de ventas recolectado durante un
ao, busca mejorar sus ganancias y mejorar su atencin en aquellos lugares donde cuenta
con presencia. Adems, se cuenta con un relevamiento que indica el ingreso medio por zona
donde operan los supermercados.

b) Descripcin del problema de inteligencia de negocio.


Se quiere elaborar una serie de perfiles de clientes con sus caractersticas por zona para
poder establecer en ellas el tipo de supermercado adecuado a cada perfil. Lo que se quiere
hacer, de esta forma, es ofrecer al comprador pudiente un supermercado con productos que
no se van a encontrar en un supermercado ubicado en una zona de clientes con bolsillos
menos pudientes. As, buscan ofrecer los productos adecuados al tipo de cliente adecuado,
aumentando las ganancias, la atencin al cliente y la reduccin de stock de productos que
son poco comprados o directamente no son comprados porque no se corresponden al tipo de
cliente adecuado.

c) Datos del negocio que se estiman de utilidad para aplicar el proceso de explotacin de
informacin.
Los datos de negocio que se estiman de utilidad son: Producto y cantidad, zona, ingresos
medios por zona.

Ejercicio 5
dem Ejercicio 1 para el proceso de ponderacin de reglas de comportamiento o de pertenencia a
grupos.

a) Descripcin del negocio y de los aspectos del negocio pertinentes al problema de


inteligencia de negocio.
Una compaa telefnica ha recolectado durante un ao informacin de los nmeros
telefnicos correspondientes a llamadas entrantes y salientes, calificndolos como nmeros
locales o de larga distancia, as como la duracin de las mismas de todos sus abonados.

b) Descripcin del problema de inteligencia de negocio.


Para mejorar su competitividad frente a otras empresas, se desea realizar un anlisis para
determinar los tipos de llamadas ms comunes, a fin de ofrecer planes de voz que se ajusten
a los tipos de llamadas caractersticos en cada regin donde opera.

c) Datos del negocio que se estiman de utilidad para aplicar el proceso de explotacin de
informacin.
Los datos de negocio que se estiman de utilidad son: Nmeros de llamadas entrantes y
salientes, duracin de llamada, localidad, entre otros.

Vous aimerez peut-être aussi