Académique Documents
Professionnel Documents
Culture Documents
Machine Learning selon son inventeur Arthur Samuel, un mathématicien américain qui a développé un
programme pouvant apprendre tout seul comment jouer aux Dames en 1959.
Un autre américain du nom de Tom Mitchell donna en 1998 une définition un peu plus moderne du
Machine Learning en énonçant qu’une machine apprend quand sa performance à faire une certaine tâche
s’améliore avec de nouvelles expériences.
En Machine Learning, on compile ces exemples (x, y) dans un tableau que l’on appelle Dataset :
• La variable y porte le nom de target (la cible). C’est la valeur que l’on cherche à prédire.
• La variable x porte le nom de feature (facteur). Un facteur influence la valeur de y, et on a en
général beaucoup de features (x1, x2, …) dans notre Dataset que l’on regroupe dans une matrice
X.
Ci-dessous, un Dataset qui regroupe des exemples d’appartements avec leur prix y ainsi que certaines de
leurs caractéristiques (features).
erreurs).
Allons droit au but : Avoir un bon modèle, c’est avoir un modèle qui nous donne de petites erreurs, donc
une petite Fonction Coût.
Bien sûr ! C’est même plutôt simple. Nul besoin de savoir s’il s’agit de cellules animales, de bactéries ou
de protéines pour apprendre à classer ces images. Votre cerveau a en fait reconnu des structures
communes dans les données que vous lui avez montrées.
Dans l’apprentissage non-supervisé, on dispose ainsi d’un Dataset (x) sans valeur (y), et la machine
apprend à reconnaitre des structures dans les données (x) qu’on lui montre. On peut ainsi regrouper des
donnés dans des clusters (c’est le Clustering), détecter des anomalies, ou encore réduire la dimension
de données très riches en compilant les dimensions ensembles. Pour ce faire, il existe des méthodes
comme : l’Algorithme de K-Mean Clustering, le réseau de neurones, …
parvenir, il faut souvent fournir : Un Dataset beaucoup plus grand (des millions de données), Un temps
d’apprentissage plus long (parfois plusieurs jours), Une plus grande puissance de calcul.
IV. Les 4 notions clefs du Machine Learning que vous devez absolument retenir
Le Machine Learning est un domaine vaste et complexe, et de mon expérience les gens perdent parfois de
vue l’essentiel, même en suivant des formations. Pour sortir du lot, il faut avoir les idées claires sur les
bases du Machine Learning. Vous devez ainsi retenir 4 notions essentielles, et vous verrez qu’elles vous
suivront dans tous vos projets de Machine Learning.
IV.1. Le Dataset
En Machine Learning, tout démarre d’un Dataset qui contient nos données. Dans l’apprentissage
supervisé, le Dataset contient les questions (x) et les réponses (y) au problème que la machine doit
résoudre.