Académique Documents
Professionnel Documents
Culture Documents
1
puissance de calcul pour fonctionner efficacement. prédictions effectuées. Sa formule est la suivante :
L’apprentissage profond est utilisé dans une variété
de domaines, tels que la reconnaissance d’images, prédictions correctes
Accuracy =
la reconnaissance de caractères manuscrits, etc. Le total de prédictions effectuées
processus d’apprentissage est qualifié de profond Bien qu’elle soit simple à comprendre, dans cer-
parce que la structure des réseaux neuronaux ar- taines situations, elle peut prêter à confusion, en
tificiels se compose de plusieurs couches d’entrée, particulier lorsque les classes ne sont pas équili-
de sortie et masquées. Chaque couche contient des brées.
unités qui transforment les données d’entrée en in-
formations que la couche suivante peut utiliser une
tâche prédictive spécifique. Grâce à cette structure, 4.2 Precision
une machine est capable d’apprendre au travers de Comme l’accuracy, elle est couramment utilisée
son propre traitement de données. Voici quelques comme mesure. Elle évalue la proportion d’ins-
algorithmes de classification de deep learning : Ré- tances correctement prédites en tant que positive
seaux neuronaux convolutifs (CNN ou Convolutio- parmi toutes les instances prédites comme positives
nal Neural Network), ANN (Artificial Neural Net- par le modèle. Sa formule est :
work), MLP (Multi-Layer Perceptron).
vrais positifs
Précision =
vrais positifs + faux positifs
3 Buts et objectifs Elle est particulièrement utile lorsque les faux po-
Cet article vise l’évaluation de la performance des sitifs sont coûteux ou indésirables. Cependant, elle
techniques de classification de machine learning et peut être trompeuse dans certains cas, notamment
de deep learning. lorsque les classes sont déséquilibrées.
Dans les divers domaines, on fournira les in-
formations sur les techniques de classification em- 4.3 Recall
ployés. Ensuite nous les comparerons en indiquant
Encore appelé rappel en français, il représente le
les avantages et les limites de chacune.
nombre de vrais positifs parmi tous les exemples
Pour finir nous donnerons notre avis concernant positifs réels, permet de savoir le pourcentage de
le choix d’une technique de classification basé sur positifs bien prédit par le modèle de classification.
la revue de littérature effectuée. Sa formule est la suivante :
vrais positifs
Rappel =
4 Mesures d’évaluation de per- vrais positifs + faux négatifs
formance Le recall est particulièrement important lorsque la
détection de toutes les instances positives est cru-
Dans cette section, nous définirons les mesures ciale. Par exemple, dans le domaine médical, il peut
couramment utilisées pour évaluer la performance être essentiel de détecter tous les cas de maladie,
des algorithmes de machine learning et de deep lear- même au risque d’avoir un certain nombre de faux
ning. Il est à noter que la comparaison des diffé- positifs.
rentes techniques de classification est l’objectif re-
cherché.
4.4 F1-score
Le F1-score est calculé en utilisant la moyenne
4.1 Accuracy harmonique de la précision et du rappel, donnant
C’est une mesure de performance couramment ainsi plus de poids aux valeurs faibles. Sa formule
utilisée pour évaluer la qualité d’un modèle de clas- est la suivante :
sification. Elle représente le nombre de prédictions Précision × Rappel
correctes effectuées par le modèle sur l’ensemble des F 1-score = 2 ×
Précision + Rappel
2
Une valeur de F1-score proche de 1 indique une adéquates dans ce cas précis.
bonne performance du modèle, avec un équilibre D’autres part des recherches ont été menées dans
entre la précision et le rappel. Il convient de noter le domaine de la vision par ordinateur pour la
que le F1-score est une mesure spécifique à la clas- classification d’objets 2D en utilisant des tech-
sification binaire. Pour les problèmes de classifica- niques d’apprentissage automatique et d’apprentis-
tion multiclasse, il existe des variantes du F1-score, sage profond. Une version modifiée du jeu de don-
telles que le F1-score macro et le F1-score pondéré, nées de panneaux de signalisation routière belges
qui prennent en compte les différentes classes. (Belgium Traffic Sign dataset) a été utilisé pour
tester leurs modèles. Leur version personnalisée du
jeu de données contient plusieurs images de dif-
4.5 Courbe ROC férents panneaux de signalisation routière répar-
ROC ou Receiver Operating Characteristics est tis en 34 classes, avec un total de 3056 images
une méthode de conceptualisation, d’organisation dans l’ensemble de données d’entraînement et 2149
et de sélection des classificateurs sur la base de leur images dans l’ensemble de données de test. Les
performance. C’est un tracé graphique qui illustre chercheurs Efstathios Karypidis, et al.[1] ont uti-
la capacité de diagnostic d’un système de classifica- lisé plusieurs techniques de machine learning, no-
tion. La courbe ROC est le tracé du taux de vrais tamment celui du K-NN (K-Nearest Neighbor) et
positifs par rapport au taux de faux positifs. Un celui du SVM (Support Vector Machine). En ce
graphique ROC décrit les compromis relatifs entre qui concerne les techniques de Deep Learning, ils
les avantages (vrais positifs) et les coûts (faux posi- ont utilisé : les réseaux de neurones convolution-
tifs). Cependant, pour résumer la performance d’un nels (CNN). Après comparaison des résultats de
modèle avec un seul nombre, on utilise générale- leurs modèles personnalisés de CNN avec les ré-
ment l’aire sous la courbe ROC (AUC-ROC). Une sultats des méthodes de machine learning tradi-
AUC-ROC proche de 1 indique une excellente capa- tionnelles. Les réseaux de neurones convolutionnels
cité de distinction de classes, tandis qu’une valeur (CNN) ont obtenu des résultats significativement
proche de 0,5 indique une performance comparable meilleurs en termes d’exactitude et d’efficacité com-
à celle d’un classificateur aléatoire. putationnelle. En particulier, leur modèle person-
nalisé de CNN a atteint des niveaux de précision
légèrement supérieurs à 90 %, ce qui est compa-
5 État de l’art rable aux résultats des récents progrès scientifiques
dans le domaine.
L’apprentissage automatique est une technique Par contre une étude comparative de huit al-
de plus en plus utilisée dans le domaine médical gorithmes d’apprentissage automatique qui réalisé
pour la prédiction de diverses maladies, y compris par Ratna Patil, et al.[4] favorise l’apprentissage
les maladies cardiaques. Les chercheurs ont uti- machine traditionnel. Les huit algorithmes sont :
lisé l’ensemble de données de Cleveland pour en- régression logistique, KNN, SVM (Support Vector
traîner différents modèles d’apprentissage automa- Machine), arbre de décision (Decision tree), MLP
tique, tels que la régression logistique et les ma- (Multi-Layer Perceptron) qui est un type d’algo-
chines à vecteurs de support (SVM), et des mo- rithme ANN, Random Forest et Bayes naïf gaus-
dèles d’apprentissage profond comme les réseaux sien (Gaussian Naïve). Les chercheurs ont utilisé
de neurones pour la prédiction des maladies car- un ensemble de données Pima Indian Diabetes ex-
diaques. Les chercheurs Divyansh Khanna, et al. trait du référentiel UCI pour évaluer les perfor-
[2] ont utilisé des mesures d’évaluation telles que la mances des différents algorithmes de classification.
precision, le score F1 et les courbes ROC pour com- Les performances ont été mesurées en termes de
parer l’exactitude des différents modèles. Les résul- MAE, RMSE, ROC, exactitude du test, précision
tats de l’étude ont montré que les modèles moins et rappel obtenus à partir de l’ensemble de test.
complexes (Machine learning) étaient plus précis Les résultats ont montré les performances des dif-
dans la prédiction des maladies cardiaques que les férents algorithmes en termes de précision, d’erreur
modèles plus complexes (Deep learning). Ainsi les absolue moyenne (MAE) et de RMSE (Root Mean
techniques de classification traditionnelles sont plus Square Error). La régression logistique a obtenu la
3
précision la plus élevée de 79,54 %, avec une er- D’autre part, dans des domaines tels que la vi-
reur absolue relative de 21,65 % et une RMSE de sion par ordinateur, les réseaux de neurones convo-
46,52 % suivis de près par le Bayes naïf gaussien et lutionnels (CNN) ont montré des résultats remar-
le réseau neuronal. Les autres algorithmes ont éga- quables en termes de précision et d’efficacité com-
lement obtenu des performances raisonnables mais putationnelle. Leur capacité à apprendre des re-
légèrement inférieures. Ce qui montrent ici que la présentations hiérarchiques à partir des données a
régression logistique est l’algorithme de classifica- permis d’atteindre des niveaux de performance dif-
tion le plus performant pour la prédiction des cas ficiles à égaler par les méthodes traditionnelles de
de diabètes. machine learning.
En 2021, les chercheurs Azar Abid Salih et Ad- Cependant, il est important de noter que le
nan Mohsin Abdulazeez [5] ont réalisés une étude choix entre les méthodes de classification de ma-
comparative de quelques algorithmes de machine chine learning et de deep learning dépendra for-
learning à savoir le Decision Tree (DT) , Random tement du contexte spécifique de la tâche, de la
Forest, SVM (Support Machine Learning), KNN taille des données, de la disponibilité des ressources
(K-Nearest Neighbor), Naïve Bayes, et Logistic Re- de calcul et des exigences de performance. Dans
gression (LR). Ils ont utilisé un ensemble de don- certains cas, où l’interprétabilité du modèle est
nées KDD’99 cup (ensemble de données populaire cruciale, les méthodes de machine learning tradi-
utilisé pour le système de détection d’intrusion). tionnelles pourraient être privilégiées. En revanche,
Après comparaison des résultats obtenus des diffé- pour des tâches complexes impliquant des données
rents algorithmes de machine learning, ils ont re- non structurées comme des images, le deep learning
marqué que le Random Forest a obtenu la plus pourrait offrir une meilleure solution.
grande précision pour classer différents types d’at-
taques. Il est à noter que la plupart des chercheurs
ont utilisé un algorithme de classification hybride 7 Conclusion
pour construire des systèmes de détection d’intru-
sion plutôt que la classification individuelle. Cet article a abordé une étude comparative des
méthodes de classification de machine learning et
de deep learning. Nous avons présenté les concepts
6 Comparaison et discussion de base du machine learning et du deep learning,
ainsi que les mesures d’évaluation de performance
Dans cette section, nous allons comparer les per- couramment utilisées pour évaluer ces méthodes. À
formances des méthodes de classification de ma- travers l’examen de travaux de recherche existants,
chine learning et de deep learning en se basant sur nous avons observé que les performances varient en
les résultats présentés dans la section précédente. fonction du domaine d’application, de la taille des
Nous allons discuter des avantages et des limites données et des spécificités des ensembles de don-
de chaque approche, ainsi que des scénarios dans nées.
lesquels l’une ou l’autre méthode pourrait être pré- Il est essentiel de comprendre que le choix entre
férable. les méthodes de classification ne doit pas être basé
L’état de l’art nous montre des résultats variés en sur une approche unique, mais plutôt sur une éva-
fonction des domaines et des ensembles de données luation minutieuse des avantages et des limites de
utilisés. Dans certains cas, les méthodes de classifi- chaque méthode en fonction des besoins spécifiques
cation traditionnelles telles que la régression logis- de la tâche. En outre, des recherches continues dans
tique et les machines à vecteurs de support (SVM) le domaine du machine learning et du deep lear-
ont montré des performances comparables voire su- ning sont nécessaires pour explorer de nouvelles
périeures à celles des méthodes de deep learning, techniques et améliorer encore davantage les per-
comme dans le domaine médical. Cela peut s’ex- formances des modèles de classification.
pliquer par le fait que les ensembles de données En fin de compte, cette étude comparative four-
peuvent être de taille relativement petite et que les nit des éclaircissements importants pour les prati-
modèles plus simples sont suffisamment capables de ciens et les chercheurs qui souhaitent choisir et ap-
capturer les motifs présents. pliquer efficacement des méthodes de classification
4
dans divers domaines d’application.
Références
[1] Efstathios Karypidis, Stylianos G. Mouslech,
Kassiani Skoulariki, and Alexandros Gazis.
Comparison Analysis of Traditional Machine
Learning and Deep Learning Techniques for
Data and Image Classification. WSEAS TRAN-
SACTIONS ON MATHEMATICS, 21 :122–
130, March 2022.
[2] Divyansh Khanna, Rohan Sahu, Veeky Baths,
and Bharat Deshpande. Comparative Study of
Classification Techniques (SVM, Logistic Re-
gression and Neural Networks) to Predict the
Prevalence of Heart Disease. International
Journal of Machine Learning and Computin, 5,
October 2015.