Académique Documents
Professionnel Documents
Culture Documents
com Python
Luciana Fujii
Campus Party BH 2016
Aprendizado de maquina
Aprendizado de maquina
scikit-learn
Set Up
Instalacao:
numpy
scikit-learn
scipy
Standard datasets
Standard datasets
Aprendizado e predicao
Um pouco de teoria
Perceptron
Perceptron
Criando um classificador
>>> from sklearn.neural network import MLPClassifier
>>> clf = MLPClassifier()
>>> clf.fit(digits.data[:-5],digits.target[:-5])
>>> clf.predict(digits.data[-5:])
>>> clf MLPClassifier(activation=relu, alpha=0.0001, ...
)
Feature Scaling
Feature Scaling
Scaling between 1 and -1:
>>> import numpy as np
>>> X /= np.max(X) * 1.0
Standardizing:
>>> from sklearn.preprocessing import StandardScaler
>>> scaler = StandardScaler()
>>> # Dont cheat - fit only on training data
>>> scaler.fit(X train)
>>> X train = scaler.transform(X train)
>>> # apply same transformation to test data
>>> X test = scaler.transform(X test)
scikit-learn: Aprendizado de maquina 101 com Python
21 / 30
N
Aprendizado nao-supervisionado
Clusterizacao
Clusterizacao
Nos devemos utilizar dados de teste que nos nao utilizamos pra
treinar
train test split divide seus dados entre conjunto de treinamento e
conjunto de teste
Validacao cruzada
Validacao cruzada
Conjunto de validacao:
Problema de reduzir demais o seu conjunto de treino
Escolher os melhores hiper parametros para o conjunto de
validacao, nao necessariamente generalizando
Validacao cruzada:
Mantem o conjunto de teste
Separar o conjunto de treino em k subconjuntos
Treinar sem usar um dos subconjuntos e validar nesse subconjunto
Repetir mudando o subconjunto usado pra validacao para cada k
subconjuntos
O desempenho e medido na media dos valores conseguidos
Pode se tornar caro computacionalmente
Escolhendo um estimator
Links uteis
http://scikit-learn.org/
http://scikit-learn.org/stable/tutorial/machine learning map/
http://cs.stanford.edu/people/karpathy/convnetjs/