Vous êtes sur la page 1sur 7

Crditos

O material a seguir consiste de adaptaes e extenses dos originais cedidos gentilmente por:

INTRODUO AO WEKA
Estagirio PAE: Pablo Andretta Jaskowiak Professor: Ricardo J. G. B. Campello SCC0173 Minerao de Dados Biolgicos

Prof. Dr. Andr C. P. L. F. Carvalho Thiago F. Coves

Sumrio
Introduo Funcionalidades Interfaces Formato dos Dados Documentao Noes Bsicas de Uso

Introduo
Minerao de Dados
Escrever cdigo do zero Reaproveitar cdigo existente Utilizar um ambiente dedicado
Ferramentas apropriadas para cada etapa do processo Menor esforo por parte do usurio Agilidade na realizao de experimentos

Introduo
Pssaro tpico da Nova Zelndia

Introduo
Waikato Environment for Knowledge Analysis Desenvolvido na Universidade de Waikato, NZ Minerao de dados e Aprendizado de Mquina Escrito na linguagem JAVA
Distribudo sob a licena GPL (GNU Public License)

Introduo
Verso atual
WEKA 3.7 (instvel) WEKA 3.6 (estvel)

Introduo
Caractersticas
Diversos algoritmos disponveis Software livre Independente de plataforma Fcil utilizao Atualizado freqentemente
Adio de novos algoritmos e funcionalidades

Verso do livro
WEKA 3.4
Witten, I. H., Frank E., Data Mining: Practical Machine Learning Tools and Techniques, Second Edition, 2005.

Funcionalidades
Possui mdulos para:
Pr-processamento Uso de algoritmos de AM/MD Visualizao de dados, resultados e modelos Comparao de modelos e algoritmos

Interfaces
Quatro principais

Interfaces
Simple CLI (Command Line Interface)
Antiga Utilizao em sistemas sem interface grfica Simples e til Requer maior intimidade

Interfaces
Simple CLI

Interfaces
KnowledgeFlow
Interface drag-and-drop Trabalha com fluxo de dados Descrio visual do processo Tem sido aprimorada recentemente

Interfaces
KnowledgeFlow

Interfaces
Experimenter
Realizao dos experimentos em modo batch Comparao de algoritmos Distribuio dos experimentos Prtico quando so utilizados
Diversos algoritmos Diversas bases de dados

Interfaces
Experimenter

Interfaces
Explorer
Explorao de dados Rpido e prtico Mesmas funcionalidades do KnowledgeFlow
Sem descrio visual do processo

Interfaces
Explorer

Formato dos Dados


Atributos
Numricos Nominais

Formato dos Dados

Formato padro
ARFF Attribute-Relation File Format

Suporta tambm alguns outros formatos


CSV

Maiores informaes
http://weka.wikispaces.com/ARFF

Documentao
Documentao online
Site Oficial
http://www.cs.waikato.ac.nz/ml/weka/

Noes Bsicas de Uso


Utilizao da interface Explorer
Visualizando bases ARFF Carregando bases de dados Pr-processamento
Discretizao de atributos Normalizao de atributos Amostragem de dados

Javadoc
http://www.opendocs.net/javadoc/weka/

Wiki
http://weka.wikispaces.com/

Visualizando os dados
Avaliao visual de atributos

Noes Bsicas de Uso


Utilizao da interface Explorer
Aplicando algoritmos de classificao
1Rule kNN
Ponderao da distncia

Noes Bsicas de Uso


Utilizao da interface KnowledgeFlow

Nave Bayes rvores de deciso


Visualizao das rvores resultantes

Gerando curvas ROC

Dvidas?