Vous êtes sur la page 1sur 50

Apprentissage statistique,

Cr eer des machines intelligentes

Ga el Varoquaux

1 Lapprentissage statistique en deux mots 2 De lactivit e des neurones ` a la pens ee 3 Scikit-learn: une boite ` a outils dapprentissage

G Varoquaux

1 Lapprentissage statistique en deux mots

G Varoquaux

1 Une perspective historique Intelligence articielle Concevoir des r` egles de d ecision


Mangeable? Grand? Mobile?

ann ees 80

G Varoquaux

1 Une perspective historique Intelligence articielle Concevoir des r` egles de d ecision Apprentissage machine Les cr eer ` a partir dobservations ann ees 80 ann ees 90

G Varoquaux

1 Une perspective historique Intelligence articielle Concevoir des r` egles de d ecision Apprentissage machine Les cr eer ` a partir dobservations ann ees 80 ann ees 90

Apprentissage statistique ann ees 2000 Mod eliser le bruit dans les observations

G Varoquaux

1 Une perspective historique Intelligence articielle Concevoir des r` egles de d ecision Apprentissage machine Les cr eer ` a partir dobservations ann ees 80 ann ees 90

Apprentissage statistique ann ees 2000 Mod eliser le bruit dans les observations Big data Beaucoup dobservations, des r` egles simples maintenant

G Varoquaux

1 Une perspective historique Intelligence articielle Concevoir des r` egles de d ecision Apprentissage machine Les cr eer ` a partir dobservations ann ees 80 ann ees 90

Apprentissage statistique ann ees 2000 Mod eliser le bruit dans les observations Big data Beaucoup dobservations, des r` egles simples maintenant

Big data isnt actually interesting without machine learning Steve Jurvetson, VC, Silicon Valley
G Varoquaux 4

1 Lapprentissage statistique Exemple: reconnaissance de visage

Andr e

Bernard

Charles

Didier

G Varoquaux

1 Lapprentissage statistique Exemple: reconnaissance de visage

Andr e

Bernard

Charles

Didier

G Varoquaux

1 M ethode na ve

1 Stocker des images connues (bruit ees) et les noms


qui vont avec.

2 A partir dune photo (bruit ee aussi), trouver limage


qui lui ressemble le plus.

M ethode des plus proches voisins

G Varoquaux

1 M ethode na ve

1 Stocker des images connues (bruit ees) et les noms


qui vont avec.

2 A partir dune photo (bruit ee aussi), trouver limage


qui lui ressemble le plus.

M ethode des plus proches voisins


Quel taux derreurs sur les images d ej` a vues? ... 0: pas derreurs Donn ees de test = donn ees dapprentissage
G Varoquaux 6

1 1er probl` eme: le bruit Donn ees non li ees ` a la variable ` a pr edire

Taux de prediction

1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.0 0.5 1.0 1.5 2.0 2.5 3.0

Niveau de bruit

G Varoquaux

eme probl` 1 2` eme: nombre de descripteurs

Trouver une aiguille dans une botte de foin


0.95 0.90 0.85 0.80 0.75 0.70 0.65 1 2 3 4 5 6 7 8 9 10

Taux de prediction

Fraction utile du cadre

G Varoquaux

1 Lapprentissage statistique Exemple: reconnaissance de visage Apprentissage ` a partir de descripteurs num eriques Dicult es: i) bruit, Andr e Bernard Charles Didier ii) nombre de descripteurs T ache supervis ee: labels connus T ache non supervis ee: labels inconnus

G Varoquaux

1 Apprentissage supervis e: r egression Un seul descripteur: une dimension

G Varoquaux

10

1 Apprentissage supervis e: r egression Un seul descripteur: une dimension

x
Quel mod` ele pr ef erer?

G Varoquaux

10

1 Apprentissage supervis e: r egression Un seul descripteur: une dimension

x x Probl` eme du sur-apprentissage Minimiser lerreur nest pas toujours favorable (apprentissage du bruit) Donn ees de test = donn ees dapprentissage
G Varoquaux 10

1 Apprentissage supervis e: r egression Un seul descripteur: une dimension

x x Pr ef erer les mod` eles simples = concept de r egularisation


Equilibrer le nombre de param` etres ` a apprendre avec la quantit e de donn ees
G Varoquaux 10

1 Apprentissage supervis e: r egression Un seul descripteur: une dimension Deux descripteurs: 2 dimensions
y

X_2 X_1

Plus de param` etres

G Varoquaux

10

1 Apprentissage supervis e: r egression Un seul descripteur: une dimension Deux descripteurs: 2 dimensions
y

X_2 X_1

Plus de param` etres besoin de plus de donn ees mal ediction de la dimensionalit e
G Varoquaux 10

1 Apprentissage supervis e: classication Variable ` a pr edire cat egorielle, par ex. des chires
X2

X1
G Varoquaux 11

1 Apprentissage non supervis e Structure de la bourse

G Varoquaux

12

1 Apprentissage non supervis e Structure de la bourse Donn ees non lab elis ees plus courantes que les donn ees labelis ees

G Varoquaux

12

1 Syst` emes de recommandation

G Varoquaux

13

1 Syst` emes de recommandation

Andr e Bernard Charles Didier Edouard Peu de recoupement entre utilisateurs

G Varoquaux

13

1 Lapprentissage statistique

Des d es Statistiques Computationels

G Varoquaux

14

1 Strat egies dapprentissage sur du big data

Big data
Lacc` es aux donn ees limite plus que la puissance de calcul

G Varoquaux

15

1 Strat egies dapprentissage sur du big data 1 R eduction de donn ees ` a la vol ee

Une r eduction rapide, respectant les propri et es statistiques des donn ees Limite la charge m emoire + disque
G Varoquaux 15

1 Strat egies dapprentissage sur du big data 1 R eduction de donn ees ` a la vol ee 2 Algorithmes en ligne

Consomment les donn ees en ux Convergent vers des grandeurs moyennes


G Varoquaux 15

1 Strat egies dapprentissage sur du big data 1 R eduction de donn ees ` a la vol ee 2 Algorithmes en ligne 3 Parall elisme par d ecoupage des donn ees Stratication pour suivre la structure statistique et de stockage des donn ees Taille des blocs adapt e aux unit es de calcul

G Varoquaux

15

1 Strat egies dapprentissage sur du big data 1 2 3 4 R eduction de donn ees ` a la vol ee Algorithmes en ligne Parall elisme par d ecoupage des donn ees Caching

Minimiser la latence dacc` es aux donn ees Ne pas recalculer la m eme chose

G Varoquaux

15

1 Strat egies dapprentissage sur du big data 1 2 3 4 5 R eduction de donn ees ` a la vol ee Algorithmes en ligne Parall elisme par d ecoupage des donn ees Caching Acc` es rapide aux donn ees

Repr esentation coh erente avec les motifs dacc` es Compression pour limiter la bande consomm ee
G Varoquaux 15

1 Apprentissage statistique et big data Un fort potentiel Apprendre une logique d ecisionnelle riche Des d es Statistiques
grande dimension

Computationels De mise en oeuvre


G Varoquaux 16

2 De lactivit e des neurones ` a la pens ee

G Varoquaux

17

2 LIRM fonctionnelle

Enregistrement de lactivit e c er ebrale

G Varoquaux

18

2 NeuroImagerie cognitive

Apprendre un lien bilateral entre activit e c er ebrale et fonction cognitive


G Varoquaux 19

2 Decodage

Lire dans les pens ees


G Varoquaux 20

2 Mod` eles dencodage

Pr edire la r eponse neurale apprendre les repr esentations


G Varoquaux 21

2 Accumulation de donn ees pour la sp ecicit e Chaque exp erience ne touche qu` a peu de domaines cognitifs m eta analyses

G Varoquaux

22

2 Accumulation de donn ees pour la sp ecicit e

Motor High level

Atlas cognitif

Visual

Audio
G Varoquaux 23

2 Accumulation de donn ees pour la sp ecicit e

Motor High level

Atlas cognitif

Probl ematique dapprentissage et de big data en Visual science fondementale

Audio
G Varoquaux 23

3 Scikit-learn: une boite ` a outils dapprentissage

G Varoquaux

c Theodore W. Gray

24

3 scikit-learn Lapprentissage statistique pour tous


Pas de domaine dapplication sp ecique Pas de pr erequis en machine learning

Librairie logicielle de qualit e


Interfaces pens ees pour lutilisateur

D eveloppement communautaire
License BSD, contributeurs tr` es vari es

http://scikit-learn.org
G Varoquaux 25

3 Une biblioth` eque Python Une biblioth` eque, pas un programme Plus expressif et polyvalent Facile ` a integrer Python: Un langage haut niveau - interactif, - facile ` a debugger, - dapplication g en erale Ecosyst` eme tr` es dynamique

G Varoquaux

26

3 Performance computationelle scikit-learn SVM 5.2 LARS 1.17 Elastic Net 0.52 kNN 0.57 PCA 0.18 k-Means 1.34 mlpy pybrain pymvpa 9.47 17.5 11.52 105.3 37.35 73.7 1.44 1.41 0.56 8.93 0.79 mdp shogun 40.48 5.63 0.58 1.36 0.47 0.33 35.75 0.68

Optimisations algorithmiques et non bas niveau Minimiser les copies des donn ees

G Varoquaux

27

3 D eveloppement comunautaire Enormement de fonctionnalit es: b en eces dune grande equipe Croissance du projet:

Plus de 200 contributeurs 12 d eveloppeurs coeur 1 ing enieur INRIA temps plein Co ut de d eveloppement estim e: 6 millions $ Mod` ele COCOMO,
http://www.ohloh.net/p/scikit-learn
G Varoquaux 28

3 Cl es de succ` es du d eveloppement libre 1 Un march e dynamique 2 D eveloppement transparent 3 Identit e du projet non monopolis ee 4 Grande qualit e technique du projet 5 Contributeurs valoris es 6 Recrutement actif 7 Communication / marketing

G Varoquaux

29

3 Cl es de succ` es du d eveloppement libre 1 Un march e dynamique Les transparent limites du mod` ele 2 D eveloppement 3 Identit e du projet non monopolis ee Fuite des cerveaux. 4 Grande qualit e technique du ` projet Nous narrivons pas a payer assez les meilleurs d e 5 Contributeurs valoris e svelopeurs. Ils sontactif embauch es grace ` a leurs 6 Recrutement contributions mais disparaissent. 7 Communication / marketing

G Varoquaux

29

Apprentissage statistique et big data Lapprentissage conf` ere de la valeur au big data Il sappuie sur les statistiques, et linformatique th eorique et appliqu ee Toutes les disciplines connaissent un essort du big data Le logiciel est critique et le d eveloppement libre bien adapt e

@GaelVaroquaux