Académique Documents
Professionnel Documents
Culture Documents
ART20203995 FR
ART20203995 FR
ART20203995 FR
Résumé : L'apprentissage automatique est l'étude scientifique des algorithmes et des modèles statistiques que les systèmes
informatiques utilisent pour effectuer une tâche spécifique sans être explicitement programmés. Les algorithmes d'apprentissage se
retrouvent dans de nombreuses applications que nous utilisons quotidiennement. Chaque fois qu'un moteur de recherche comme Google
est utilisé pour effectuer une recherche sur l'internet, l'une des raisons pour lesquelles il fonctionne si bien est qu'un algorithme
d'apprentissage a appris à classer les pages web. Ces algorithmes sont utilisés à diverses fins, comme l'exploration de données, le
traitement d'images, l'analyse prédictive, etc. pour n'en citer que quelques-unes. Le principal avantage de l'apprentissage automatique
est qu'une fois qu'un algorithme a appris ce qu'il faut faire avec des données, il peut effectuer son travail automatiquement. Dans ce
document, un bref examen et les perspectives d'avenir des vastes applications des algorithmes d'apprentissage automatique ont été
réalisés.
Mots-clés : Algorithme, Apprentissage automatique, Pseudo-code, Apprentissage supervisé, Apprentissage non supervisé, Apprentissage par
renforcement
L'apprentissage automatique s'appuie sur différents mieux, etc. Voici un aperçu de quelques-uns des algorithmes
algorithmes pour résoudre les problèmes de données. Les couramment utilisés dans l'apprentissage automatique (AAM)
scientifiques des données aiment à souligner qu'il n'existe
pas de type d'algorithme unique qui soit le mieux adapté à la Apprentissage supervisé
résolution d'un problème. Le type d'algorithme utilisé L'apprentissage supervisé est la tâche d'apprentissage
dépend du type de problème que vous souhaitez résoudre, du automatique qui consiste à apprendre une fonction qui associe
nombre de variables, du type de modèle qui conviendrait le une entrée à une sortie sur la base d'exemples de paires
Volume 9 Numéro 1, janvier 2020
www.ijsr.net
Sous licence Creative Commons Attribution CC BY
ID papier : DOI : 10.21275/ART20203995 381
Journal international des sciences et de la recherche
(IJSR)
ISSN : 2319-7064
entrée-sortie. Il déduit une fonction à partirFacteur
ResearchGate de données
d'impactapprendre
(2018) : 0.28 | SJIFtypes
certains (2018)
de :modèles à partir de l'ensemble
d'apprentissage étiquetées constituées d'un ensemble7.426de données d'apprentissage et les appliquer à l'ensemble de
d'exemples d'apprentissage. Les algorithmes d'apprentissage données de test à des fins de prédiction ou de classification.
automatique supervisé sont ceux qui nécessitent une Le déroulement des algorithmes d'apprentissage automatique
assistance externe. L'ensemble des données d'entrée est supervisé est présenté dans la figure ci-dessous. Les
divisé en ensembles de données de formation et de test. algorithmes d'apprentissage automatique supervisé les plus
L'ensemble de données de formation contient des variables connus ont été présentés ici.
de sortie qui doivent être prédites ou classées. Tous les
algorithmes
Navie Bayes
Il s'agit d'une technique de classification basée sur le
théorème de Bayes avec une hypothèse d'indépendance entre
les prédicteurs. En termes simples, un classificateur Naïve
Bayes suppose que la présence d'une caractéristique
particulière dans une classe n'est pas liée à la présence d'une
autre caractéristique. Naïve Bayes s'adresse principalement
au secteur de la classification des textes. Il est
principalement utilisé pour le regroupement et la
classification en fonction de la probabilité conditionnelle
d'occurrence.
Figure : Machine à vecteur de
support
SVM transductif
Les machines à vecteurs de support transductives (TSVM)
ont été largement utilisées comme moyen de traiter les
données partiellement étiquetées dans l'apprentissage semi-
supervisé. Elle est entourée d'un certain mystère en raison
d'un manque de compréhension de son fondement dans la
généralisation. Il est utilisé pour étiqueter les données non
étiquetées de manière à ce que la marge soit maximale entre
les données étiquetées et non étiquetées. Trouver une
solution exacte par TSVM est un problème NP- difficile.
Modèles génératifs
Un modèle génératif est celui qui peut générer des données.
Il modélise à la fois les caractéristiques et la classe (c'est-à-
dire les données complètes). Si nous modélisons P(x,y) : Je
peux utiliser cette distribution de probabilité pour générer
des points de données - et donc tous les algorithmes
modélisant P(x,y) sont génératifs. Un exemple étiqueté par
composant suffit pour confirmer la distribution du mélange.
Auto-formation
Dans le cas de l'auto-apprentissage, un classificateur est
formé avec une partie des données étiquetées. Le
classificateur est ensuite alimenté par des données non
étiquetées. Les points non étiquetés et les étiquettes prédites
sont ajoutés ensemble dans l'ensemble de formation. Cette
procédure est ensuite répétée. Le classificateur s'auto-
apprend, d'où le nom d'auto-apprentissage.
Apprentissage d'ensemble
L'apprentissage d'ensemble est le processus par lequel de
multiples modèles, tels que des classificateurs ou des
experts, sont stratégiquement générés et combinés pour
résoudre un problème particulier d'intelligence
informatique. L'apprentissage d'ensemble est
principalement utilisé pour améliorer les performances d'un
modèle ou pour réduire la probabilité d'une sélection
malheureuse d'un mauvais modèle. Parmi les autres
applications de l'apprentissage d'ensemble, citons
l'attribution d'un degré de confiance à la décision prise par
le modèle, la sélection de caractéristiques optimales, la
fusion de données, l'apprentissage incrémental,
l'apprentissage non stationnaire et la correction d'erreurs.
Renforcer :
Le terme "Boosting" fait référence à une famille
d'algorithmes qui convertit les apprenants faibles en
apprenants forts. Le boosting est une technique
d'apprentissage d'ensemble utilisée pour réduire les biais et
la variance. Le boosting est basé sur la question posée par
Kearns et Valiant : "Un ensemble d'apprenants faibles
peut-il créer un seul apprenant fort ?" Un apprenant
faible est défini comme un classificateur, un apprenant fort
est un classificateur qui est arbitrairement bien corrélé avec
la vraie classification.
Ensachage
L'agrégation par échantillonnage ou bootstrap est appliquée
lorsque la précision et la stabilité d'un algorithme
d'apprentissage automatique doivent être améliorées. Il est
applicable à la classification et à la régression. L'agrégation
diminue également la variance et aide à gérer l'ajustement
excessif.
Figure : Pseudo-code de
l'ensachage
Réseaux neuronaux
Un réseau neuronal est une série d'algorithmes qui
s'efforcent de reconnaître les relations sous-jacentes dans un
ensemble de données grâce à un processus qui imite le
fonctionnement du cerveau humain. En ce sens, les réseaux
neuronaux font référence à des systèmes de neurones, d e
nature organique ou artificielle. Les réseaux neuronaux
peuvent s'adapter à des données d'entrée changeantes, de
sorte que le réseau génère le meilleur résultat possible sans
qu'il soit nécessaire de redéfinir les critères de sortie. Le
concept des réseaux neuronaux, qui trouve son origine dans
l'intelligence artificielle, gagne rapidement en popularité
dans le développement des systèmes de négociation.
2. Conclusion
L'apprentissage automatique peut être supervisé ou non
supervisé. Si vous disposez de moins de données et de
données clairement étiquetées pour la formation, optez pour
l'apprentissage supervisé. L'apprentissage non supervisé
donne généralement de meilleures performances et de
meilleurs résultats pour les grands ensembles de données. Si
vous disposez d'un vaste ensemble de données, optez pour
les techniques d'apprentissage en profondeur. Vous avez
également appris l'apprentissage par renforcement et
l'apprentissage par renforcement profond. Vous savez
maintenant ce que sont les réseaux neuronaux, leurs
applications et leurs limites. Ce document passe en revue
différents algorithmes d'apprentissage automatique.
Aujourd'hui, tout le monde utilise l'apprentissage
automatique, sciemment ou non. Qu'il s'agisse d'obtenir un
produit recommandé lors d'un achat en ligne ou de mettre à
jour des photos sur des sites de réseaux sociaux. Ce
document présente la plupart des algorithmes d'apprentissage
automatique les plus populaires.
Références
[1] W. Richert, L. P. Coelho, "Building Machine Learning
Systems with Python", Packt Publishing Ltd, ISBN 978-
1-78216-140-0
[2] J. M. Keller, M. R. Gray, J. A. Givens Jr, "A Fuzzy K-
Nearest Neighbor Algorithm", IEEE Transactions on
Systems, Man and Cybernetics, Vol. SMC-15, No. 4,
Août 1985
[3] https://www.geeksforgeeks.org/machine-learning/
[4] ] S. Marsland, Machine learning : an algorithmic
perspective. CRC press, 2015.
[5] M. Bkassiny, Y. Li, et S. K. Jayaweera, "A survey on
machine learning techniques in cognitive radios," IEEE
Communications Surveys & Tutorials, vol. 15, no. 3,
pp. 1136-1159, oct. 2012.
[6] https://en.wikipedia.org/wiki/Instance-based_learning
[7] R. S. Sutton, "Introduction : The Challenge of
Reinforcement Learning", Machine Learning, 8, page
225-227, Kluwer Academic Publishers, Boston, 1992.
[8] P. Harrington, "Machine Learning in action", Manning
Publications Co, Shelter Island, New York, 2012