Vous êtes sur la page 1sur 6

UNIVERSIDADE FEDERAL DO MARANHÃO

CENTRO DE CIÊNCIAS EXATAS E TECNOLOGIA


DEPARTAMENTO DE INFORMÁTICA
CURSO DE CIÊNCIA DA COMPUTAÇÃO

PROPOSTA DE TESE:

“Mineração de Dados por Extração de Regras de Associação


Usando o software Weka”

Fábio Silva Sousa

São Luís
2010

1
_______________________________________
Fábio Silva Sousa
Concludente do Curso de Ciência da Computação

_______________________________________
Profº Msc. Ivo José da Cunha Serra
Orientador

_______________________________________
Profº Dr. Carlos Eduardo Portela Serra de Castro
Coordenador do Curso de Ciência da Computação

2
SUMÁRIO

1 APRESENTAÇÃO ....................................................................................... 4
2 OBJETIVO................................................................................................... 5
3 JUSTIFICATIVA .......................................................................................... 5
4 METODOLOGIA DE TRABALHO ............................................................... 5
5 CRONOGRAMA DE EXECUÇÃO ............................................................... 6
REFERÊNCIAS .................................................................................................. 6

3
MINERAÇÃO DE DADOS POR EXTRAÇÃO DE REGRAS DE
ASSOCIAÇÃO USANDO O SOFTWARE WEKA

1 APRESENTAÇÃO

Regras de Associação

No dia a dia as instituições armazenam grandes quantidades de


dados que possuem informações valiosas. Como por exemplo, a grande
quantidade de dados de clientes que são juntadas diariamente nos balcões das
mercearias, aplicações como a bioinformática, diagnósticos médicos,
mineração na Web e análise de dados científicos.
Geralmente essas informações não são devidamente exploradas,
mas podem conter informações valiosas nesses diversos campos do
conhecimento. No varejo os dados de compras podem revelar padrões
interessantes de comportamento de consumidores, ajudando assim a
promoção de vendas. Na medicina como um centro de apoio de decisões,
baseadas nas associações entre doenças e tratamentos.
No estudo de análise associativa encontramos métodos para extrair
relacionamentos ocultos em um grande conjunto de dados, tais
relacionamentos são expressos em regras de associação [1].

Weka

Para demonstrarmos o processo de extração de regras de associação em


um conjunto de dados, utilizaremos a ferramenta Weka (Waikato Environment
for Knowledge Analysis) para fazer a análise associativa. E testaremos os
algoritmos e parâmetros disponíveis para demonstrar seus usos e finalidades.
Weka é uma coleção de algoritmos de aprendizado de máquina para
mineração de dados de tarefas. Os algoritmos podem ser aplicados
diretamente a um conjunto de dados ou chamado a partir do seu próprio código
Java. Weka contém ferramentas para os dados de pré-processamento,
classificação, regressão, clusterização, regras de associação e visualização. É

4
também ideal para o desenvolvimento de novos modelos de aprendizagem de
máquina [2].

2 OBJETIVO

O que se pretende alcançar, ao final desse trabalho, é fazer um


estudo de caso descrevendo a utilização das técnicas de Análise Associativa.
Utilizando um conjunto de dados desejamos fazer testes no Weka com o
objetivo de demonstrar seu funcionamento e gerar regras interessantes
esperando descobrir um padrão interessante não conhecido dos dados.

3 JUSTIFICATIVA

A grande quantidade de informação disponível nos dados que vem


sendo armazenada há muito tempo tem praticamente se perdido, em parte pela
limitação na capacidade de processamento por outro lado pela falta de técnicas
de mineração eficientes.
A evolução das técnicas de Análise Associativa ao lado do avanço
no poder de processamento tem se tornado um terreno fértil para o surgimento
de softwares para Extração de Regras de Associação em conjuntos grandes de
dados, área interessante de ser estudada e compreendida.

4 METODOLOGIA DE TRABALHO

Como forma de atingir o objetivo proposto serão realizadas as


seguintes atividades:

I. Levantamento bibliográfico
II. Revisão das técnicas de Análise Associativa.
III. Análise de um estudo de caso interessante de ser estudado.
IV. Revisão das funcionalidades do Weka para Análise Associativa.
V. Criação dos conjuntos de dados no formato padrão de entrada do Weka.
VI. Teste e avaliação das regras geradas pelo Weka.
VII. Elaboração da monografia

5
VIII. Apresentação da monografia

5 CRONOGRAMA DE EXECUÇÃO

2011
Janeiro Fevereiro Março Abril Maio Junho
Etapa I
Etapa II
Etapa III
Etapa IV
Etapa V
Etapa VI
Etapa VII
Etapa VIII

REFERÊNCIAS

[1] Pang-Ning Tan, Steinbach M., e Kumar V. Introdução ao Data Mining


(Mineração de Dados), Ed. Ciência Moderna, 2009.
[2] Weka - www.cs.waikato.ac.nz/ml/weka/

Vous aimerez peut-être aussi