Académique Documents
Professionnel Documents
Culture Documents
Machine Learning
Mais ils ont tous un point commun : ils partent de la bonne compréhension
du problème ; les données et les algorithmes seront sélectionnés en fonction.
C’est de cette manière, peu importe le domaine, qu’un modèle de Machine
Learning (ML) connaîtra le succès.
1. Compréhension du problème
2. Objectif mesurable
𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 . 𝑅𝑒𝑐𝑎𝑙𝑙
𝐹1 − 𝑆𝑐𝑜𝑟𝑒 = 2
𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 + 𝑅𝑒𝑐𝑎𝑙𝑙
𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 . 𝑅𝑒𝑐𝑎𝑙𝑙
𝐹 − 𝑆𝑐𝑜𝑟𝑒 = ( 1 + 𝛽² )
𝛽² ( 𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 + 𝑅𝑒𝑐𝑎𝑙𝑙 )
Dans cette phase, l’idée est de se mettre à l’aise avec notre base de données,
de comprendre au maximum les différentes variables pour ensuite définir une
bonne stratégie de modélisation.
4. Prétraitement (Preprocessing)
L’accès aux données ne suffit pas. Elles doivent être nettoyées et de bonne
qualité pour être utiles. Donc dans cette phase, nous allons essayer de
transformer notre base de données pour le mettre dans un format propice au
développement de modèle de Machine Learning.
5. Modélisation
6. Déploiement
▪ Analyse de forme
- Identification de la target
- Vérifier les dimensions du dataset
- Identifier les types de variables
- Identifier les valeurs manquantes
▪ Analyse de fond
- Visualiser la target (Histogramme/Boxplot)
- Compréhension des différentes variables
- Visualiser les relations features-target (Histogramme/Boxplot)
- Identifier les outliers
❖ Prétraitement