Académique Documents
Professionnel Documents
Culture Documents
25pts
Le but du Machine Learning est de prédire des résultats sur des données non
vues par la fonction prédictive.
1. Apprentissage supervisé
C’est quoi l’ Apprentissage supervisé ?
Ce cadre de machine learning part du fait que les données historiques (ou
exemples) sont annotées ou labelisées ou étiquetées.
Regression
Classification
2. Apprentissage non-supervisé
Données non étiquetées
3. Apprentissage Semi-supervisé
En quoi consiste l’apprentissage Semi-supervisé ?
Exemple
Solution
𝑵𝒐𝒖𝒗𝒆𝒂𝒖 , 𝑿𝟔 = {𝟑, 𝟏𝟐, 𝟒, 𝟕, 𝟖}
5
K=1
Après calcul de distance , on calcul l’élément le plus proche de , 𝑿𝟔
Donc , 𝑿𝟓 .
On conclut que , 𝑿𝟔 𝒆𝒔𝒕 𝒅𝒆 𝒄𝒍𝒂𝒔𝒔𝒆 𝟐.
K=3
Après calcul de distance , on calcul les 0 3 éléments les plus proche de
𝑿𝟔 .
Donc : 𝑿𝟓 (𝒅𝒆 𝒄𝒍𝒂𝒔𝒔𝒆 𝟐), 𝑿𝟐 (𝒅𝒆 𝒄𝒍𝒂𝒔𝒔𝒆 𝟐), 𝑿𝟏 (𝒅𝒆 𝒄𝒍𝒂𝒔𝒔𝒆 𝟏).
On choisit la classe majoritaire pour 𝑿𝟔 . Donc 𝑿𝟔 𝒆𝒔𝒕 𝒅𝒆 𝒄𝒍𝒂𝒔𝒔𝒆 𝟐.
SVM
SVM linéaire
Ici on fait l’hypothèse que tous les problème sont linéairement séparable.
Ou encore
Les SVM ont pour but de séparer les données en classes à l’aide d’une frontière
aussi « simple » que possible, de telle façon que la distance entre les différents
groupes de données et la frontière qui les sépare soit maximale. Cette distance
est aussi appelée « marge » et les SVMs sont ainsi qualifiés de « séparateurs à
vaste marge », les « vecteurs de support » étant les données les plus proches de
la frontière.
Def
Les SVMs permettent de projeter les données dans un espace de plus grande
dimension via une fonction noyau pour les séparer linéairement.
validation croisée.
La validation croisée aide à l’évaluation des modèles d’apprentissage
automatique.
Overfitting : un modèle trop spécialisé sur les données du Training Set (les
données qu’il a déjà “vues” et auxquelles il s’y est adapté) et qui se généralisera
mal.