Académique Documents
Professionnel Documents
Culture Documents
PARA DATA
MINING
MINERAÇÃO DE
DADOS
Joao Antonio Aparecido Cardoso
DATA MINING – MINERAÇÃO DE DADOS
INTRODUÇÃO
DEFINIÇÃO
6
DATA MINING – MINERAÇÃO DE DADOS
EVOLUÇÃO
Evolução Perguntas Tecnologia disponível Características
8
DATA MINING – MINERAÇÃO DE DADOS
OBJETIVO
9
DATA MINING – MINERAÇÃO DE DADOS
Bancos de Dados
Limpeza
(consistência,
preenchimento
de informações,
remoção de ruído
e redundâncias)
(Data Marts e
Data
Warehouses)
Um analista
refina e conduz o
processo até que
valiosos padrões
apareçam.
DATA MINING –
MINERAÇÃO DE
DADOS
• As descritivas se concentram em
encontrar padrões que descrevam
os dados de forma interpretável
pelos seres humanos.
• As preditivas realizam
interferência nos dados para
construir modelos que serão usados
para predições do comportamento
de novos dados.
DATA MINING – MINERAÇÃO DE DADOS
TÉCNICAS
Regras e
Clustering; Lógica Fuzzy; Árvores de
Decisão;
Redes Neurais.
12
DATA MINING – MINERAÇÃO DE DADOS
FERRAMENTAS
• Enterprise Miner, ferramenta de data mining do SAS
• Microsoft SQL Server, ferramenta originalmente de banco de dados que a
cada nova versão tem ganho novas funcionalidades de Business Intelligence.
Possui 8 algorítmos na versão do SQL Server 2008 e sua plataforma é
extensível para integração de outros algorítmos desenvolvidos.
• IlliMine Projeto de mineração de dados escrito em C++.
• InfoCodex Aplicação de mineração de dados com uma base de dados
linguística.
• KDB2000 Uma ferramenta livre em C++ que integra acesso à bases de dados,
pre-processamento, técnicas de transformação e um vasto escopo de
algoritmos de mineração de dados.
• KXEN Ferramenta de mineração de dados comercial, utiliza conceitos do
Profesor Vladimir Vapnik como Minimização de Risco Estruturada (Structured
Risk Minimization ou SRM) e outros.
13
DATA MINING – MINERAÇÃO DE DADOS
FERRAMENTAS
• KNIME Plataforma de mineração de dados aberta que implementa o
paradigma de pipelining de dados. Baseada no eclipse
• LingPipe API em Java para mineração em textos distribuída com código-
fonte.
• MDR Ferramenta livre em Java para detecção de interações entre atributos
utilizando o método da multifactor dimensionality reduction (MDR).
• Orange Tookit livre em Python para mineração de dados e aprendizado de
máquina.
• Pimiento Um ambiente para mineração em textos baseado em Java.
• PolyaAnalyst Ambiente que permite a montagem de fluxos para mineração
de dados e texto.
• Tanagra Software livre de mineração de dados e estatística.
• WEKA Software livre em java para mineração de dados.
• Cortex Intelligence Sistema de PLN para mineração de textos aplicado à
Inteligência Competitiva
14
DATA MINING – MINERAÇÃO DE DADOS
FERRAMENTAS ANALISADAS
• KNIME Plataforma de mineração de dados aberta que implementa
o paradigma de pipelining de dados. O pipeline de dados é um
conjunto de ações que extrai dados (analíticos e visualização) de
várias fontes. Através de plugins, os usuários podem adicionar
módulos para o texto, imagem, e processamento de séries
temporais e a integração de vários outros projetos de código
aberto, como a linguagem de programação R, Weka, o Chemistry
Development Kit, e LIBSVM.
• WEKA Environment for Knowledge Analysis - é uma ferramenta de
KDD open-source, escrita em Java, que contempla uma série de
algoritmos de diversas técnicas de mineração de dados,
desenvolvida pela Universidade de Waikato, na Nova Zelândia que
disponibiliza algoritmos para pré-processamento, classificação,
regressão, agrupamento, regras de associação e visualização de
dados provenientes de uma base de dados ou integradas a uma
aplicação Java (WEKA, 2017).
15
DATA MINING – MINERAÇÃO DE DADOS
FERRAMENTAS ANALISADAS
• RapidMiner anteriormente chamado de YALE (Yet Another Learning
Environment), é um ambiente para experiências de aprendizado de
máquina e mineração de dados desenvolvida pela empresa de
mesmo nome que fornece um ambiente integrado para preparação
de dados, aprendizado de máquina, aprendizado profundo,
mineração de texto e análise preditiva.
16
DATA MINING – MINERAÇÃO DE DADOS
FERRAMENTAS ANALISADAS
• KNIME - O Konstanz Information Miner é uma ferramenta de
mineração criada pela Universidade de Konstanz, na Alemanha, cujo
propósito inicial era analisar os dados do segmento de mercado
farmacêutico. É uma plataforma gratuita de análise de dados,
relatórios e integração de dados. Integra vários componentes para
aprendizado de máquina e mineração de dados através de seu
conceito modular de pipelining de dados. O Knime aproveita a
capacidade de extensão do módulo do Eclipse por meio do uso de
plug-ins
• Sistemas operacionais: Windows, Linux, OS X.
• Gravado em: Java
• Custo: 0,00
17
DATA MINING – MINERAÇÃO DE DADOS
FERRAMENTAS ANALISADAS
• RapidMiner Studio, Server (On-Premise), e Radoop.
• Sistemas operacionais: Windows, Linux, OS X.
DATA MINING – MINERAÇÃO DE DADOS
FERRAMENTAS ANALISADAS
• RapidMiner Server (On-Premise)
DATA MINING – MINERAÇÃO DE DADOS
FERRAMENTAS ANALISADAS
SAS Enterprise Miner é uma solução para criar modelos preditivos e descritivos
precisos em grandes volumes de dados em diferentes origens da organização.
Detectar fraudes, minimizar riscos, demandas de recursos, reduzir o tempo de
inatividade de recursos, campanhas e reduzir o atrito com clientes.
CARACTERÍSTICAS
• Interface gráfica fácil de usar e processamento em lote
• Sofisticada preparação, resumo e exploração de dados
• modelagem preditiva e descritiva avançada
• Integração open source com R
• Capacidades de alto desempenho
• Maneira rápida, fácil e auto-suficiente para os usuários de negócios gerarem
modelos
• Comparações, relatórios e gerenciamento de modelos
• processamento escalável
• opção de implantação na nuvem
PREÇO
Contato para Preços - oferece período de TESTE GRÁTIS
DATA MINING – MINERAÇÃO DE DADOS
FERRAMENTAS ANALISADAS
Weka - (Waikato Environment for Knowledge Analysis) começou a ser escrito em
1993, usando Java, na Universidade de Waikato, Nova Zelândia sendo adquirido
posteriormente por uma empresa no final de 2006.
CUSTO: 0,00
DATA MINING – MINERAÇÃO DE DADOS
ESTUDO DE CASO
Artigo: Avaliação de Ferramentas de Mineração de Dados: Uma
Abordagem Com o Modelo TAM
O TAM foi proposto por Davis (1989) sendo uma adaptação do modelo da
Teoria da Ação Raciocinada (TRA). Ele foi projetado para compreender a
relação causal entre variáveis externas de aceitação dos usuários e o uso
real do computador, buscando entender o comportamento do usuário
através do conhecimento da utilidade e da facilidade de utilização
percebida por ele (DAVIS, 1989).
https://support.sas.com/resources/papers/proceedings15/3101-
2015.pdf
DATA MINING – MINERAÇÃO DE DADOS
CONCLUSÃO