Académique Documents
Professionnel Documents
Culture Documents
Sumrio
INFORMAES TCNICAS..................................................................................................................3 MINERAO DE DADOS.................................................................................................................3 CLASSIFICAO...............................................................................................................................3 WEKA...................................................................................................................................................3 GUIA DE INSTALAO DO WEKA................................................................................................3 ARFF.....................................................................................................................................................4 FALSOS NEGATIVO E POSITIVO...................................................................................................4 THRESHOLD.......................................................................................................................................4 UTILIZAO DO WEKA PARA CLASSIFICAO DE UMA BASE DE DADOS ARFF...............5 CONCLUSO.........................................................................................................................................11
INFORMAES TCNICAS
MINERAO DE DADOS
A minerao de dados, basicamente, a transformao de grandes quantidades de dados em padres e regras significativos.
CLASSIFICAO
A tcnica cria uma rvore de classificao (uma rvore de deciso), onde os dados podem ser minerados para determinar as probabilidades de certo fato acontecer.
WEKA
WEKA um produto da Universidade de Waikato (Nova Zelndia) e foi implementado pela primeira vez em sua forma moderna em 1997. Ele usa a GNU General Public License (GPL). O software foi escrito na linguagem Java e contm uma GUI para interagir com arquivos de dados e produzir resultados visuais (pense em tabelas e curvas). Ele tambm tem uma API geral, assim possvel incorporar o WEKA, como qualquer outra biblioteca, a seus prprios aplicativos para fazer coisas como tarefas de minerao de dados automatizadas no lado do servidor.
ARFF
ARFF (Attribute-Relation File Format) um arquivo de texto ASCII que descreve uma lista de instncias que compartilham um conjunto de atributos. Os arquivos ARFFs foram desenvolvidas pelo Projeto Machine Learning no Departamento de Cincia da Computao da Universidade de Waikato para uso com o software de aprendizagem de mquina Weka.
3 - Selecione Open file... depois v at a pasta onde se encontra o arquivo de extenso .arff e aperte o boto Open.
5 - As vezes necessrio remover algumas colunas da base de dados pois elas podem atrapalhar ou no sou obrigatrias para a anlise.
8 - Mude a forma de teste para Use trainng set, com o intuito de melhorar o aprendizado do WEKA.
9 - Start. O WEKA ir analisar a base de dados e mostrar os falsos positivos e falsos negativos.
12 - Dentre as opes de visualizar a rvore existem varias outras, uma delas de visualizar o threshold das classes.
CONCLUSO
Com o WEKA consegue-se uma anlise mais completa dos dados e uma vasta gama de tcnicas de classificao e filtragem de dados, que auxiliam em tarefas do dia a dia dos analistas.