Vous êtes sur la page 1sur 5

Étude comparative des méthodes de

classification de machine learning et de deep


learning
GBODJO Junior - SAMAKE Adama

1 Introduction tructions strictes, les algorithmes de machine lear-


ning utilisent des modèles statistiques pour recon-
L’augmentation de la quantité de données au fil naître des schémas et des relations au sein des
des ans dans de nombreux domaines tels que la données. Ces modèles sont ensuite utilisés pour
santé, l’industrie ou la finance, a donné place à un prendre des décisions, effectuer des prédictions ou
enjeu crucial qu’est l’analyse et le traitement auto- résoudre des problèmes. Les algorithmes d’appren-
matisé de ces données pour en extraire des informa- tissage peuvent se catégoriser selon le mode d’ap-
tions significatives. Différentes méthodes existent prentissage qu’ils emploient. Il y a trois tech-
mais nous nous intéresserons aux techniques de niques de Machine Learning : l’apprentissage su-
classification en machine learning et en deep lear- pervisé, l’apprentissage non-supervisé, et l’appren-
ning. Cette étude comparative vise l’analyse des tissage par renforcement. Dans le cas de l’appren-
méthodes de classification issues de ces deux do- tissage supervisé, les données sont étiquetées afin
maines, ainsi que l’évaluation des performances de d’indiquer à la machine quelles patterns elle doit
chaque approche. Nous chercherons à dégager des rechercher. Si les classes sont prédéterminées et les
informations essentielles pour guider dans le choix exemples connus, le système apprend à classer se-
et la mise en œuvre de méthodes de classification lon un modèle de classification ou de classement ; on
en fonction des différents scénarios et des spéci- parle alors d’apprentissage supervisé ou d’analyse
ficités des données. Dans notre article, première- discriminante. Par contre dans le cas de l’appren-
ment nous présenterons les différentes techniques tissage non supervisé, les algorithmes apprennent à
de classification et leurs mesures de performances. trouver des schémas ou des groupes dans les don-
Deuxièmement, nous discuterons des travaux déjà nées non étiquetées avec très peu d’intervention hu-
effectués dans les différents domaines, ensuite nous maine. Voici quelques algorithmes de classification
présenterons les résultats de ces différentes études de machine learning : KNN (K-Nearest Neighbor),
tout en les comparant. Pour finir nous aborderons decision tree (arbre de decision), SVM (Support
la conclusion et les perspectives d’amélioration du Vector Machine), Logistic Regression (Regression
travail. Logistique), K-means.

Le deep learning ou apprentissage profond, est


2 Généralités une branche avancée du machine learning axée
sur l’utilisation de réseaux de neurones artificiels
Le machine learning ou apprentissage automa- pour apprendre des représentations hiérarchiques
tique, est un champ d’étude de l’intelligence arti- des données. Les algorithmes de Deep Learning
ficielle qui se fonde sur des approches mathéma- sont basés sur des réseaux de neurones artificiels
tiques et statistiques pour donner aux ordinateurs qui imitent le fonctionnement du cerveau humain.
la capacité d’« apprendre » à partir de données, Ces réseaux sont constitués de nombreuses couches
c’est-à-dire d’améliorer leurs performances à ré- de neurones artificiels qui fonctionnent ensemble
soudre des tâches sans être explicitement program- pour apprendre et traiter l’information. Il nécessite
més pour chacune. Plutôt que de suivre des ins- souvent des quantités massives de données et de

1
puissance de calcul pour fonctionner efficacement. prédictions effectuées. Sa formule est la suivante :
L’apprentissage profond est utilisé dans une variété
de domaines, tels que la reconnaissance d’images, prédictions correctes
Accuracy =
la reconnaissance de caractères manuscrits, etc. Le total de prédictions effectuées
processus d’apprentissage est qualifié de profond Bien qu’elle soit simple à comprendre, dans cer-
parce que la structure des réseaux neuronaux ar- taines situations, elle peut prêter à confusion, en
tificiels se compose de plusieurs couches d’entrée, particulier lorsque les classes ne sont pas équili-
de sortie et masquées. Chaque couche contient des brées.
unités qui transforment les données d’entrée en in-
formations que la couche suivante peut utiliser une
tâche prédictive spécifique. Grâce à cette structure, 4.2 Precision
une machine est capable d’apprendre au travers de Comme l’accuracy, elle est couramment utilisée
son propre traitement de données. Voici quelques comme mesure. Elle évalue la proportion d’ins-
algorithmes de classification de deep learning : Ré- tances correctement prédites en tant que positive
seaux neuronaux convolutifs (CNN ou Convolutio- parmi toutes les instances prédites comme positives
nal Neural Network), ANN (Artificial Neural Net- par le modèle. Sa formule est :
work), MLP (Multi-Layer Perceptron).
vrais positifs
Précision =
vrais positifs + faux positifs
3 Buts et objectifs Elle est particulièrement utile lorsque les faux po-
Cet article vise l’évaluation de la performance des sitifs sont coûteux ou indésirables. Cependant, elle
techniques de classification de machine learning et peut être trompeuse dans certains cas, notamment
de deep learning. lorsque les classes sont déséquilibrées.
Dans les divers domaines, on fournira les in-
formations sur les techniques de classification em- 4.3 Recall
ployés. Ensuite nous les comparerons en indiquant
Encore appelé rappel en français, il représente le
les avantages et les limites de chacune.
nombre de vrais positifs parmi tous les exemples
Pour finir nous donnerons notre avis concernant positifs réels, permet de savoir le pourcentage de
le choix d’une technique de classification basé sur positifs bien prédit par le modèle de classification.
la revue de littérature effectuée. Sa formule est la suivante :
vrais positifs
Rappel =
4 Mesures d’évaluation de per- vrais positifs + faux négatifs
formance Le recall est particulièrement important lorsque la
détection de toutes les instances positives est cru-
Dans cette section, nous définirons les mesures ciale. Par exemple, dans le domaine médical, il peut
couramment utilisées pour évaluer la performance être essentiel de détecter tous les cas de maladie,
des algorithmes de machine learning et de deep lear- même au risque d’avoir un certain nombre de faux
ning. Il est à noter que la comparaison des diffé- positifs.
rentes techniques de classification est l’objectif re-
cherché.
4.4 F1-score
Le F1-score est calculé en utilisant la moyenne
4.1 Accuracy harmonique de la précision et du rappel, donnant
C’est une mesure de performance couramment ainsi plus de poids aux valeurs faibles. Sa formule
utilisée pour évaluer la qualité d’un modèle de clas- est la suivante :
sification. Elle représente le nombre de prédictions Précision × Rappel
correctes effectuées par le modèle sur l’ensemble des F 1-score = 2 ×
Précision + Rappel

2
Une valeur de F1-score proche de 1 indique une adéquates dans ce cas précis.
bonne performance du modèle, avec un équilibre D’autres part des recherches ont été menées dans
entre la précision et le rappel. Il convient de noter le domaine de la vision par ordinateur pour la
que le F1-score est une mesure spécifique à la clas- classification d’objets 2D en utilisant des tech-
sification binaire. Pour les problèmes de classifica- niques d’apprentissage automatique et d’apprentis-
tion multiclasse, il existe des variantes du F1-score, sage profond. Une version modifiée du jeu de don-
telles que le F1-score macro et le F1-score pondéré, nées de panneaux de signalisation routière belges
qui prennent en compte les différentes classes. (Belgium Traffic Sign dataset) a été utilisé pour
tester leurs modèles. Leur version personnalisée du
jeu de données contient plusieurs images de dif-
4.5 Courbe ROC férents panneaux de signalisation routière répar-
ROC ou Receiver Operating Characteristics est tis en 34 classes, avec un total de 3056 images
une méthode de conceptualisation, d’organisation dans l’ensemble de données d’entraînement et 2149
et de sélection des classificateurs sur la base de leur images dans l’ensemble de données de test. Les
performance. C’est un tracé graphique qui illustre chercheurs Efstathios Karypidis, et al.[1] ont uti-
la capacité de diagnostic d’un système de classifica- lisé plusieurs techniques de machine learning, no-
tion. La courbe ROC est le tracé du taux de vrais tamment celui du K-NN (K-Nearest Neighbor) et
positifs par rapport au taux de faux positifs. Un celui du SVM (Support Vector Machine). En ce
graphique ROC décrit les compromis relatifs entre qui concerne les techniques de Deep Learning, ils
les avantages (vrais positifs) et les coûts (faux posi- ont utilisé : les réseaux de neurones convolution-
tifs). Cependant, pour résumer la performance d’un nels (CNN). Après comparaison des résultats de
modèle avec un seul nombre, on utilise générale- leurs modèles personnalisés de CNN avec les ré-
ment l’aire sous la courbe ROC (AUC-ROC). Une sultats des méthodes de machine learning tradi-
AUC-ROC proche de 1 indique une excellente capa- tionnelles. Les réseaux de neurones convolutionnels
cité de distinction de classes, tandis qu’une valeur (CNN) ont obtenu des résultats significativement
proche de 0,5 indique une performance comparable meilleurs en termes d’exactitude et d’efficacité com-
à celle d’un classificateur aléatoire. putationnelle. En particulier, leur modèle person-
nalisé de CNN a atteint des niveaux de précision
légèrement supérieurs à 90 %, ce qui est compa-
5 État de l’art rable aux résultats des récents progrès scientifiques
dans le domaine.
L’apprentissage automatique est une technique Par contre une étude comparative de huit al-
de plus en plus utilisée dans le domaine médical gorithmes d’apprentissage automatique qui réalisé
pour la prédiction de diverses maladies, y compris par Ratna Patil, et al.[4] favorise l’apprentissage
les maladies cardiaques. Les chercheurs ont uti- machine traditionnel. Les huit algorithmes sont :
lisé l’ensemble de données de Cleveland pour en- régression logistique, KNN, SVM (Support Vector
traîner différents modèles d’apprentissage automa- Machine), arbre de décision (Decision tree), MLP
tique, tels que la régression logistique et les ma- (Multi-Layer Perceptron) qui est un type d’algo-
chines à vecteurs de support (SVM), et des mo- rithme ANN, Random Forest et Bayes naïf gaus-
dèles d’apprentissage profond comme les réseaux sien (Gaussian Naïve). Les chercheurs ont utilisé
de neurones pour la prédiction des maladies car- un ensemble de données Pima Indian Diabetes ex-
diaques. Les chercheurs Divyansh Khanna, et al. trait du référentiel UCI pour évaluer les perfor-
[2] ont utilisé des mesures d’évaluation telles que la mances des différents algorithmes de classification.
precision, le score F1 et les courbes ROC pour com- Les performances ont été mesurées en termes de
parer l’exactitude des différents modèles. Les résul- MAE, RMSE, ROC, exactitude du test, précision
tats de l’étude ont montré que les modèles moins et rappel obtenus à partir de l’ensemble de test.
complexes (Machine learning) étaient plus précis Les résultats ont montré les performances des dif-
dans la prédiction des maladies cardiaques que les férents algorithmes en termes de précision, d’erreur
modèles plus complexes (Deep learning). Ainsi les absolue moyenne (MAE) et de RMSE (Root Mean
techniques de classification traditionnelles sont plus Square Error). La régression logistique a obtenu la

3
précision la plus élevée de 79,54 %, avec une er- D’autre part, dans des domaines tels que la vi-
reur absolue relative de 21,65 % et une RMSE de sion par ordinateur, les réseaux de neurones convo-
46,52 % suivis de près par le Bayes naïf gaussien et lutionnels (CNN) ont montré des résultats remar-
le réseau neuronal. Les autres algorithmes ont éga- quables en termes de précision et d’efficacité com-
lement obtenu des performances raisonnables mais putationnelle. Leur capacité à apprendre des re-
légèrement inférieures. Ce qui montrent ici que la présentations hiérarchiques à partir des données a
régression logistique est l’algorithme de classifica- permis d’atteindre des niveaux de performance dif-
tion le plus performant pour la prédiction des cas ficiles à égaler par les méthodes traditionnelles de
de diabètes. machine learning.
En 2021, les chercheurs Azar Abid Salih et Ad- Cependant, il est important de noter que le
nan Mohsin Abdulazeez [5] ont réalisés une étude choix entre les méthodes de classification de ma-
comparative de quelques algorithmes de machine chine learning et de deep learning dépendra for-
learning à savoir le Decision Tree (DT) , Random tement du contexte spécifique de la tâche, de la
Forest, SVM (Support Machine Learning), KNN taille des données, de la disponibilité des ressources
(K-Nearest Neighbor), Naïve Bayes, et Logistic Re- de calcul et des exigences de performance. Dans
gression (LR). Ils ont utilisé un ensemble de don- certains cas, où l’interprétabilité du modèle est
nées KDD’99 cup (ensemble de données populaire cruciale, les méthodes de machine learning tradi-
utilisé pour le système de détection d’intrusion). tionnelles pourraient être privilégiées. En revanche,
Après comparaison des résultats obtenus des diffé- pour des tâches complexes impliquant des données
rents algorithmes de machine learning, ils ont re- non structurées comme des images, le deep learning
marqué que le Random Forest a obtenu la plus pourrait offrir une meilleure solution.
grande précision pour classer différents types d’at-
taques. Il est à noter que la plupart des chercheurs
ont utilisé un algorithme de classification hybride 7 Conclusion
pour construire des systèmes de détection d’intru-
sion plutôt que la classification individuelle. Cet article a abordé une étude comparative des
méthodes de classification de machine learning et
de deep learning. Nous avons présenté les concepts
6 Comparaison et discussion de base du machine learning et du deep learning,
ainsi que les mesures d’évaluation de performance
Dans cette section, nous allons comparer les per- couramment utilisées pour évaluer ces méthodes. À
formances des méthodes de classification de ma- travers l’examen de travaux de recherche existants,
chine learning et de deep learning en se basant sur nous avons observé que les performances varient en
les résultats présentés dans la section précédente. fonction du domaine d’application, de la taille des
Nous allons discuter des avantages et des limites données et des spécificités des ensembles de don-
de chaque approche, ainsi que des scénarios dans nées.
lesquels l’une ou l’autre méthode pourrait être pré- Il est essentiel de comprendre que le choix entre
férable. les méthodes de classification ne doit pas être basé
L’état de l’art nous montre des résultats variés en sur une approche unique, mais plutôt sur une éva-
fonction des domaines et des ensembles de données luation minutieuse des avantages et des limites de
utilisés. Dans certains cas, les méthodes de classifi- chaque méthode en fonction des besoins spécifiques
cation traditionnelles telles que la régression logis- de la tâche. En outre, des recherches continues dans
tique et les machines à vecteurs de support (SVM) le domaine du machine learning et du deep lear-
ont montré des performances comparables voire su- ning sont nécessaires pour explorer de nouvelles
périeures à celles des méthodes de deep learning, techniques et améliorer encore davantage les per-
comme dans le domaine médical. Cela peut s’ex- formances des modèles de classification.
pliquer par le fait que les ensembles de données En fin de compte, cette étude comparative four-
peuvent être de taille relativement petite et que les nit des éclaircissements importants pour les prati-
modèles plus simples sont suffisamment capables de ciens et les chercheurs qui souhaitent choisir et ap-
capturer les motifs présents. pliquer efficacement des méthodes de classification

4
dans divers domaines d’application.

Références
[1] Efstathios Karypidis, Stylianos G. Mouslech,
Kassiani Skoulariki, and Alexandros Gazis.
Comparison Analysis of Traditional Machine
Learning and Deep Learning Techniques for
Data and Image Classification. WSEAS TRAN-
SACTIONS ON MATHEMATICS, 21 :122–
130, March 2022.
[2] Divyansh Khanna, Rohan Sahu, Veeky Baths,
and Bharat Deshpande. Comparative Study of
Classification Techniques (SVM, Logistic Re-
gression and Neural Networks) to Predict the
Prevalence of Heart Disease. International
Journal of Machine Learning and Computin, 5,
October 2015.

[3] lgayhardt. Apprentissage profond et appren-


tissage automatique - Azure Machine Learning,
June 2023.
[4] Ratna Patil and Sharavari Tamane. A Compa-
rative Analysis on the Evaluation of Classifica-
tion Algorithms in the Prediction of Diabetes.
International Journal of Electrical and Compu-
ter Engineering (IJECE), 8(5) :3966, October
2018.
[5] Azar Abid Salih and Adnan Mohsin Abdula-
zeez. Evaluation of Classification Algorithms
for Intrusion Detection System : A Review.
Journal of Soft Computing and Data Mining,
2(1) :31–40, April 2021. Number : 1.
[6] Wikipédia. Apprentissage automatique — Wi-
kipédia, 2023.

[7] Wikipédia. Apprentissage profond, July 2023.


Page Version ID : 206515698.

Vous aimerez peut-être aussi