Vous êtes sur la page 1sur 33

Diplomado Inteligencia de Negocios

Unidad 3: Minería de Datos


Educación Profesional
Escuela de Ingeniería UC

Relator: Christian Pieringer


Contexto del curso en Diplomado de
Inteligencia de Negocios

Horas de
Curso Módulo/Unidades Relator
Duración
Fundamentos básicos de Inteligencia de
Fundamentos de Inteligencia Negocios 18 Patricio Cofré
de Negocios
Infraestructura de Inteligencia de Negocios 18 Marco Ramírez

Análisis de Negocios Minería de Datos 18 Christian Pieringer


Avanzados Business Analytics 18 Jaime Caiceo
Aplicaciones de Inteligencia de Negocios a 18
Inteligencia de Negocios Jaime Caiceo
Gestión Estratégica. 18
Aplicada a Gestión Estratégica
Gobernancia en Inteligencia de Negocios. 18 Cristián Rodriguez
Gestión de Proyectos de Inteligencia de 18
Gestión de Proyecto y Cristián Rodríguez
Negocios.
Tendencias en Inteligencias de
Rodrigo Alegre
Negocios Tendencias en Inteligencia de Negocios. 18

2
Ponderaciones del curso Análisis de
Negocios Avanzados
• Cada unidad del curso tendrá evaluaciones para medir los
contenidos de cada una de ellas
• De cada unidad se obtendrá una nota final que será ponderada
para calcular la nota del curso según la tabla presentada a
continuación:

Evaluaciones curso Análisis de Negocios Avanzados Ponderación

Unidad 3: Minería de Datos.


50%

Unidad 4: Análisis de Negocios.


50%

3
Objetivo General

Al termino del módulo los alumnos sean capaces de:


• Comprender las bases teóricas y prácticas del área de Minería
de Datos, y
• Desarrollar soluciones a problemas reales de Inteligencia de
Negocios que involucren la necesidad de técnicas de Minería
de Datos

4
Metodología

• Exposiciones conceptuales y participativas apoyadas por


material de clases.
• Ejercicios / Ejemplos prácticos para apoyar los conceptos
usando herramientas de software para minería de datos

5
Evaluación

Las evaluaciones consisten en:


• Dos controles teóricos individuales
• Un taller grupal práctico por clases
• Nota final (NF) se calcula como:

𝑁𝐹 = 0.4 × 𝐶𝑜𝑛𝑡𝑟𝑜𝑙𝑒𝑠 + 0.6 × 𝑇𝑎𝑙𝑙𝑒𝑟𝑒𝑠

Requisitos de aprobación
• Asistencia: 80%
• 𝑁𝐹 ≥ 4.0 en las evaluaciones del curso.

6
Equipo Académico: Relator

Christian Pieringer
Ingeniero Electrónico PUCV,
Magíster en Ingeniería y Doctor en Ciencias de la Computación PUC
Instructor Adjunto
Jefe de proyecto, Unidad de Negocios y Transferencia,
Instituto de Ingeniería Matemática y Computacional UC
Escuela de Ingeniería UC.

Áreas de interés
Data Science e Inteligencia de máquina, Visión por computador

E-mail: cppierin@ing.puc.cl

7
INTRODUCCIÓN
Capacidad abrumadora para generar
grandes volúmenes de datos

Registros

Archivos

Bases de datos

9
“Data are becoming the new raw material of
bussiness: Economic input is almost equivalent to
capital and labor”.
The Economist, 2010.
“Information will be The 21th Century Oil ”.
Gartner Company, 2010.
Minería de Datos

Área de Ciencia de la Computación donde se estudian


distintas técnicas para extraer conocimiento relevante
desde grandes cantidades de información

12
Minería de Datos consiste en
encontrar valor en los datos

Mining of gold from rocks Gold Mining

Mining of Data from Data Mining


Information sources

13
“You could only own a bunch of data other than big
data if you do not utilize the collected data.”
Jay Parikh,
Deputy Chief Engineer of Facebook
Minería de datos ayuda a descubrir
patrones ocultos en los datos

• Tamaño de las bases de


datos dificulta el análisis
manual
• Existen patrones no
evidentes a simple vista
• Necesidad de herramientas
automáticas que realicen
ciertas tareas

15
Big Data se resume en 4Vs

Volumen Variedad

Big
Valor
Data
Velocidad Veracidad
El nuevo conocimiento agrega valor
Data Mining permite identificar
comportamientos y hábitos

18
Recomendar productos para aumentar
tasa de conversión

19
Recomendación usando datos
colaborativamente

20
Conocer los hábitos de consumo permite
ofrecer descuentos personalizados

21
Data Mining sirve como herramienta
para predecir fuga de clientes

22
Data Mining permite descubrir
fraudes y delitos
Análisis y Visualización de
Patrones en Texto Libre

24
El análisis de redes permite generar
intuiciones sobre grupos

25
Desde Offline a Online: Reporte y Análisis

26
El conocimiento encontrado se
permite ir del análisis al reporte

27
Las empresas más exitosas utilizan data
mining en su modelo de negocio
Aplicaciones en medicina y biotecnología

Members of BTB Gene Family of


Scaffold Proteins Suppress Nitrate
Discriminative local subspaces in gene
Uptake and Nitrogen Use
expression data for effective gene function
Efficiency1
prediction
Viviana Araus et al. 2016.
Tomás Puelma et al. 2012.

29
Aplicaciones en Astronomía

Clasificación
de Estrellas
Variables

30
Proceso KDD
(Knowledge Discovery in Databases)
Evaluación y
Presentación
Selección y Data Mining
Transformación
Filtraje e
Integración Conocimiento
Data Lake
Modelos y
Bases de datos
Patrones
Datos
transformados
Data
Warehouse
Archivos planos

Preprocesamiento
31
Tópicos del Módulo

Técnicas Técnicas
Predictivas Descriptivas
Árboles de Decisión
Reglas de Asociación
Clasificación Bayesiana
(Naive Bayes)
Razonamiento Basado
en Instancias
Clustering
Evaluación de Modelos

32

Vous aimerez peut-être aussi