Académique Documents
Professionnel Documents
Culture Documents
Tema 1:
Introdução
Sumário
1. Introdução
2. OLAP
3. Data mining
Pontuando
1. Introdução
OLAP
Análise de n-variáveis simultaneamente para descobrir a aderência
ou não nos conjuntos de dados perante uma questão
Data Mining
Tecnologia de reconhecimento de padrão nos dados e predição do
comportamento futuro
Big Data
BI com as seguintes características típicas (3V’s):
Volume, Velocidade e Variedade
Prof. Dr. Lawrence Chung Koo
Usos típicos em BI
Consultas e Relatórios
Data Mining
Data Mining
1. Introdução
2. OLAP
3. Data mining
Pontuando
2. OLAP
Definição
Clientes Clientes
Tempo
Produtos
Tempo
2. OLAP
Operações
• Dice (cubo): mostra um subcubo.
Clientes
Clientes
Produtos
Tempo
Produtos
Tempo
2. OLAP
Operações
• Roll-up ou Drill-up (enrolar para cima): quando
temos níveis hierárquicos de dados, ele sobe um
nível.
Homens
Mulheres
Clientes
Produtos
Tempo
Produtos
Tempo
2. OLAP
Operações
• Drill-down (desenrolar): é o contrário do Roll-up,
ele desce um nível detalhando mais a informação.
Maria
Homens
João
Mulheres
José
Produtos Ana
Tempo
Produtos
Tempo
2. OLAP
Operações
• Pivot/Rotate (eixo/rotacionar): muda o eixo da
análise.
Cliente Cliente
Produtos Tempo
Tempo Produtos
2. OLAP
Operações
• Selection (seleção): filtra dos dados de acordo com
os parâmetros passados.
Cliente: Maria
Cliente Produto: Arroz
Tempo: 01/11
Produtos
Tempo
Tema 3:
Data Mining
Sumário
1. Introdução
2. OLAP
3. Data mining
Pontuando
3. Data Mining
Definição
• Mineração de dados é a busca de evidências que apontem
tendências e padrões de comportamento.
• Utiliza técnicas matemáticas e estatísticas para modelar o
problema e eventos de interesse de maneira mais correta (ou
seja, mais científica).
• A escolha da técnica depende da análise que se pretende
realizar.
3. Data Mining
• O data mining é necessário para aprofundar a investigação
sobre as causas dos eventos e determinar sua provável
evolução.
• Baseando-se apenas no OLAP (que é extremamente útil, mas
não suficiente) podemos chegar a conclusões incompletas ou
incorretas.
• Vejamos o exemplo seguinte, que sumariza as vendas de três
produtos em três lojas diferentes.
Data Mining
- Classificação: Designar os objetos em classes
- Estimativa: Saída discreta de resultado - sim,não,
quantidade de filhos por família...
- Predição: Estimativa com premissas
- Regras de Associação/Affinity Group: Carrinho de
compra
- Clustering: Segmentação em grupos com similaridade
- Descrição e Visualização: Suporte para entendimento de
uma grande quantidade de dados.
Classes
Tarefas
• Sumarização: busca um modelo que identifique as
características em comum dentre os registros.
Registros Padrões
3. Data mining
Tarefas
• Detecção de desvios: busca um modelo que
identifique registros que estão fora do padrão.
Registros
Padrão
3. Data mining
Tarefas
• Análise de evolução: busca um modelo que
consiga identificar comportamentos regulares e
tendências dos objetos de estudo em função do
tempo.
Primitivas
• Dados relevantes para a tarefa: especificam
quais são as tabelas e campos que serão utilizados;
• Tipo de tarefa: determina a tarefa a ser realizada;
• Medidas e limites: são definidas para avaliar as
descobertas encontradas pelos reconhecedores de
padrão
3. Data mining
Primitivas
• Conhecimento prévio: é utilizar conhecimentos
prévios sobre os dados para ajudar a realizar as
consultas. Exemplo: a tabela de endereço, sabemos
que um número é subordinado a uma rua que está
associada a uma cidade, pertencente a um estado.
• Tipo de representação: definem quais os tipos de
representação dos dados, pode ser um dashboard,
um relatório, regras, cubos etc.
Sumário
1. Introdução
2. OLAP
3. Data mining
Pontuando
Pontuando