ART20203995 FR

Vous aimerez peut-être aussi

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 11

Journal international des sciences et de la recherche

Abonnez-vous à DeepL Pro pour traduire des fichiers plus volumineux.


(IJSR)
Visitez www.DeepL.com/pro pour en savoir plus.
ISSN : 2319-7064
ResearchGate Facteur d'impact (2018) : 0.28 | SJIF (2018) :
7.426

Algorithmes d'apprentissage automatique


- Une revue
Batta Mahesh

Résumé : L'apprentissage automatique est l'étude scientifique des algorithmes et des modèles statistiques que les systèmes
informatiques utilisent pour effectuer une tâche spécifique sans être explicitement programmés. Les algorithmes d'apprentissage se
retrouvent dans de nombreuses applications que nous utilisons quotidiennement. Chaque fois qu'un moteur de recherche comme Google
est utilisé pour effectuer une recherche sur l'internet, l'une des raisons pour lesquelles il fonctionne si bien est qu'un algorithme
d'apprentissage a appris à classer les pages web. Ces algorithmes sont utilisés à diverses fins, comme l'exploration de données, le
traitement d'images, l'analyse prédictive, etc. pour n'en citer que quelques-unes. Le principal avantage de l'apprentissage automatique
est qu'une fois qu'un algorithme a appris ce qu'il faut faire avec des données, il peut effectuer son travail automatiquement. Dans ce
document, un bref examen et les perspectives d'avenir des vastes applications des algorithmes d'apprentissage automatique ont été
réalisés.

Mots-clés : Algorithme, Apprentissage automatique, Pseudo-code, Apprentissage supervisé, Apprentissage non supervisé, Apprentissage par
renforcement

1. Introduction célèbre pour son programme de jeu de dames.


L'apprentissage automatique est utilisé pour enseigner aux
Depuis son évolution, l'homme utilise de nombreux types machines comment traiter les données plus efficacement.
d 'outils pour accomplir diverses tâches de manière plus Parfois, après avoir consulté les données, nous ne parvenons
simple. La créativité du cerveau humain a conduit à pas à interpréter ou à extraire les informations qu'elles
l'invention de différentes machines. Ces machines ont contiennent. Dans ce cas, nous appliquons l'apprentissage
facilité la vie de l'homme en lui permettant de répondre à automatique. Avec l'abondance des ensembles de données
divers besoins, notamment en matière de déplacements, disponibles, la demande d'apprentissage automatique est en
d'industries et d'informatique. L'apprentissage automatique hausse. De nombreuses industries utilisent l'apprentissage
est l'une d'entre elles. automatique pour extraire des données pertinentes. L'objectif
de l'apprentissage automatique est d'apprendre à partir des
Selon Arthur Samuel L'apprentissage automatique est défini données. De nombreuses études ont été menées sur la
comme le domaine d'étude qui donne aux ordinateurs la manière dont les machines peuvent apprendre d'elles-mêmes
capacité d'apprendre sans être explicitement programmés. sans être explicitement programmées. De nombreux
Arthur Samuel était mathématiciens et programmeurs appliquent plusieurs
approches pour trouver la solution à ce problème qui
comporte d'énormes ensembles de données.

L'apprentissage automatique s'appuie sur différents mieux, etc. Voici un aperçu de quelques-uns des algorithmes
algorithmes pour résoudre les problèmes de données. Les couramment utilisés dans l'apprentissage automatique (AAM)
scientifiques des données aiment à souligner qu'il n'existe
pas de type d'algorithme unique qui soit le mieux adapté à la Apprentissage supervisé
résolution d'un problème. Le type d'algorithme utilisé L'apprentissage supervisé est la tâche d'apprentissage
dépend du type de problème que vous souhaitez résoudre, du automatique qui consiste à apprendre une fonction qui associe
nombre de variables, du type de modèle qui conviendrait le une entrée à une sortie sur la base d'exemples de paires
Volume 9 Numéro 1, janvier 2020
www.ijsr.net
Sous licence Creative Commons Attribution CC BY
ID papier : DOI : 10.21275/ART20203995 381
Journal international des sciences et de la recherche
(IJSR)
ISSN : 2319-7064
entrée-sortie. Il déduit une fonction à partirFacteur
ResearchGate de données
d'impactapprendre
(2018) : 0.28 | SJIFtypes
certains (2018)
de :modèles à partir de l'ensemble
d'apprentissage étiquetées constituées d'un ensemble7.426de données d'apprentissage et les appliquer à l'ensemble de
d'exemples d'apprentissage. Les algorithmes d'apprentissage données de test à des fins de prédiction ou de classification.
automatique supervisé sont ceux qui nécessitent une Le déroulement des algorithmes d'apprentissage automatique
assistance externe. L'ensemble des données d'entrée est supervisé est présenté dans la figure ci-dessous. Les
divisé en ensembles de données de formation et de test. algorithmes d'apprentissage automatique supervisé les plus
L'ensemble de données de formation contient des variables connus ont été présentés ici.
de sortie qui doivent être prédites ou classées. Tous les
algorithmes

Figure : Processus d'apprentissage supervisé

Volume 9 Numéro 1, janvier 2020


www.ijsr.net
Sous licence Creative Commons Attribution CC BY
ID papier : DOI : 10.21275/ART20203995 382
Journal international des sciences et de la recherche
(IJSR)
ISSN : 2319-7064
Arbre de décision ResearchGate Facteur d'impact (2018) : 0.28 | SJIF (2018) :
L'arbre de décision est un graphique qui représente les choix7.426
et leurs résultats sous la forme d'un arbre. Les nœuds du
graphique représentent un événement ou un choix et les
arêtes du graphique représentent les règles de décision ou les
conditions. Chaque arbre est constitué de nœuds et de
branches. Chaque nœud représente les attributs d'un groupe
à classer et chaque branche représente une valeur que le
nœud peut prendre.

Figure : Navie Bayes

Pseudo-code de Navie Bayes


Input :
Ensemble de données de formation T,
F= (f1, f2, f3,.., fn) // valeur de la variable prédictive dans
l'ensemble de données de test.
Sortie : Une classe d'ensembles de données de test.
Les étapes :
1) Lire l'ensemble de données d'apprentissage T ;
2) Calculez la moyenne et l'écart-type des variables
Figure : Arbre de décision prédictives dans chaque classe ;
3) Répéter Calculer la probabilité de fi à l'aide de l'équation
Pseudo-code de l'arbre de décision : de densité de Gauss dans chaque classe ; jusqu'à ce que la
déf probabilité de toutes les variables prédictives (f1, f2,
decisionTreeLearning(exemples, attributs, f3,..., fn) ait été calculée.
parents_exemples) : 4) Calculer la vraisemblance pour chaque classe ;
si len(exemples) == 0 : 5) Obtenir la plus grande probabilité
return pluralityValue(parent_examples)
# renvoie la réponse la plus probable car il n'y a plus de Machine à vecteur de support
données d'apprentissage. Une autre technique d'apprentissage automatique de pointe
elif len(attributes) == 0 : très largement utilisée est la machine à vecteur de support
return pluralityValue(examples) (SVM). Sur le site , lesmachines à vecteur de support
elif (tous les exemples se classent de la même manière) : sont des modèles
renvoient leur classification d'apprentissage supervisés avec des algorithmes
A = max(attributs, key(a)=importance(a, exemples) # d'apprentissage associés qui analysent les données utilisées
choisir l'attribut le plus prometteur à conditionner tree pour la classification et l'analyse de régression. Outre la
= new Tree(root=A) classification linéaire, les SVM peuvent effectuer
pour valeur dans A.values() : efficacement une classification non linéaire en utilisant ce
exs = exemples[e.A == valeur] que l'on appelle l'astuce du noyau, en cartographiant
subtree = decisionTreeLearning(exs, attributes.remove(A), implicitement leurs entrées dans des espaces de
examples) caractéristiques à haute dimension. Il s'agit essentiellement
# noter que la mise en œuvre devrait probablement de tracer des marges entre les classes. Les marges sont
envelopper les retours du cas trivial dans des arbres pour des tracées de m a n i è r e à ce que la distance entre la marge et
raisons de cohérence tree.addSubtreeAsBranch(subtree, les classes soit maximale, ce qui minimise l'erreur de
label=(A, value) classification.
retour arbre

Navie Bayes
Il s'agit d'une technique de classification basée sur le
théorème de Bayes avec une hypothèse d'indépendance entre
les prédicteurs. En termes simples, un classificateur Naïve
Bayes suppose que la présence d'une caractéristique
particulière dans une classe n'est pas liée à la présence d'une
autre caractéristique. Naïve Bayes s'adresse principalement
au secteur de la classification des textes. Il est
principalement utilisé pour le regroupement et la
classification en fonction de la probabilité conditionnelle
d'occurrence.
Figure : Machine à vecteur de
support

Volume 9 Numéro 1, janvier 2020


www.ijsr.net
Sous licence Creative Commons Attribution CC BY
ID papier : DOI : 10.21275/ART20203995 383
Journal international des sciences et de la recherche
(IJSR)
ISSN : 2319-7064
Pseudo-code de la machine à vecteur de support
ResearchGate Facteur d'impact (2018) : 0.28 | SJIF (2018) :
initialiser Yi = YI pour i � I 7.426
répéter

Volume 9 Numéro 1, janvier 2020


www.ijsr.net
Sous licence Creative Commons Attribution CC BY
ID papier : DOI : 10.21275/ART20203995 384
Journal international des sciences et de la recherche
(IJSR)
ISSN : 2319-7064
calculer la solution svm vv , b ResearchGate
pour l'ensembleFacteur d'impact (2018) : 0.28 | SJIF (2018) :
des données
avec les étiquettes imputées calculer les sorties ii = (vv , xi)7.426
+ b pour tous les xi dans l'ensemble des sacs positifs yi =
sgn(fi) pour chaque i e i, yi = 1
for (every positive bag bi)
end if (liei(l + yi)/2 == 0)
compute i* = arg maxiei ii
set yi* = 1
end
while (imputed labels have changed)
output (vv, b) Figure : Apprentissage non supervisé
Apprentissage non supervisé : Analyse en composantes principales
On parle d'apprentissage non supervisé car, contrairement à L'analyse en composantes principales est une procédure
l'apprentissage supervisé, il n'y a pas de réponses correctes statistique qui utilise une transformation orthogonale pour
ni d'enseignant. Les algorithmes sont laissés à eux-mêmes convertir un ensemble d'observations de variables
pour découvrir et présenter la structure intéressante des éventuellement corrélées en un ensemble de valeurs de
données. Les algorithmes d'apprentissage non supervisé variables linéairement non corrélées appelées composantes
apprennent peu de caractéristiques à partir des données. principales. La dimension des données est ainsi réduite pour
Lorsque de nouvelles données sont introduites, ils utilisent rendre les calculs plus rapides et plus faciles. Elle est utilisée
les caractéristiques apprises précédemment pour reconnaître pour expliquer la structure de variance-covariance d'un
la classe des données. Ils sont principalement utilisés pour le ensemble de variables par le biais de combinaisons linéaires.
regroupement et la réduction des caractéristiques. Elle est souvent utilisée comme technique de réduction de la
dimensionnalité.

Figure : Analyse en composantes principales

Regroupement K-Means Figure : Regroupement K-Means


K-means est l'un des algorithmes d'apprentissage non
supervisé les plus simples qui résolvent le problème bien
connu du regroupement. La procédure suit une méthode
simple et facile pour classer un ensemble de données donné
à travers un certain nombre de grappes. L'idée principale est
de définir k centres, un pour chaque grappe. Ces centres
doivent être placés de manière astucieuse, car un
emplacement différent entraîne des résultats différents. Le
meilleur choix est donc de les placer le plus loin possible les
uns des autres.

Volume 9 Numéro 1, janvier 2020


www.ijsr.net
Sous licence Creative Commons Attribution CC BY
ID papier : DOI : 10.21275/ART20203995 385
Journal international des sciences et de la recherche
(IJSR)
ISSN : 2319-7064
L'étape suivante consiste àResearchGate Facteurpoint
prendre chaque d'impact (2018) : 0.28 | SJIF (2018) :
appartenant à un ensemble de données donné et à l'associer 7.426
au centre le plus proche. Lorsqu'aucun point n'est en
attente, la première étape est terminée et un premier âge de
groupe est effectué. À ce stade, nous devons recalculer k
nouveaux centroïdes en tant que centres de base des
groupes résultant de l'étape précédente.

Figure : Pseudo-code du regroupement K-Means

Volume 9 Numéro 1, janvier 2020


www.ijsr.net
Sous licence Creative Commons Attribution CC BY
ID papier : DOI : 10.21275/ART20203995 386
Journal international des sciences et de la recherche
(IJSR)
ISSN : 2319-7064
Apprentissage semi-supervisé ResearchGate
: Facteur d'impact (2018) : 0.28 | SJIF (2018) :
L'apprentissage automatique semi-supervisé est une7.426Apprentissage multitâche
combinaison de méthodes d'apprentissage automatique L'apprentissage multitâche est un sous-domaine de
supervisées et non supervisées. Il peut s'avérer fructueux l'apprentissage automatique qui vise à résoudre plusieurs
dans les domaines de l'apprentissage automatique et de tâches différentes en même temps, en tirant parti des
l'exploration de données où les données non étiquetées sont similitudes entre les différentes tâches. Cela peut améliorer
déjà présentes et où l'obtention des données étiquetées est un l'efficacité de l'apprentissage et agir comme une
processus fastidieux. Avec les méthodes d'apprentissage régularisation. Formellement, s'il y a n tâches (apprentissage
automatique supervisé plus courantes, vous entraînez un profond conventionnel
algorithme d'apprentissage automatique sur un ensemble de
données "étiquetées" dans lequel chaque enregistrement
contient les informations relatives au résultat. Certains
algorithmes d'apprentissage semi-supervisé sont décrits ci-
dessous

SVM transductif
Les machines à vecteurs de support transductives (TSVM)
ont été largement utilisées comme moyen de traiter les
données partiellement étiquetées dans l'apprentissage semi-
supervisé. Elle est entourée d'un certain mystère en raison
d'un manque de compréhension de son fondement dans la
généralisation. Il est utilisé pour étiqueter les données non
étiquetées de manière à ce que la marge soit maximale entre
les données étiquetées et non étiquetées. Trouver une
solution exacte par TSVM est un problème NP- difficile.

Modèles génératifs
Un modèle génératif est celui qui peut générer des données.
Il modélise à la fois les caractéristiques et la classe (c'est-à-
dire les données complètes). Si nous modélisons P(x,y) : Je
peux utiliser cette distribution de probabilité pour générer
des points de données - et donc tous les algorithmes
modélisant P(x,y) sont génératifs. Un exemple étiqueté par
composant suffit pour confirmer la distribution du mélange.

Auto-formation
Dans le cas de l'auto-apprentissage, un classificateur est
formé avec une partie des données étiquetées. Le
classificateur est ensuite alimenté par des données non
étiquetées. Les points non étiquetés et les étiquettes prédites
sont ajoutés ensemble dans l'ensemble de formation. Cette
procédure est ensuite répétée. Le classificateur s'auto-
apprend, d'où le nom d'auto-apprentissage.

Apprentissage par renforcement


L'apprentissage par renforcement est un domaine de
l'apprentissage automatique qui s'intéresse à la manière dont
les agents logiciels doivent agir dans un environnement afin
de maximiser une certaine notion de récompense
cumulative. L'apprentissage par renforcement est l'un des
trois paradigmes de base de l'apprentissage automatique,
avec l'apprentissage supervisé et l'apprentissage non
supervisé.

Figure : Apprentissage par renforcement

Volume 9 Numéro 1, janvier 2020


www.ijsr.net
Sous licence Creative Commons Attribution CC BY
ID papier : DOI : 10.21275/ART20203995 387
Journal international des sciences et de la recherche
(IJSR)
ISSN : 2319-7064
ResearchGate
visent à résoudre une seule tâche Facteur
à l'aide d'un d'impact (2018) : 0.28 | SJIF (2018) :
modèle
particulier), où ces n tâches ou un sous-ensemble d'entre 7.426
elles sont liées les unes aux autres mais pas exactement
identiques, l'apprentissage multi-tâches (AMT) permettra
d'améliorer l'apprentissage d'un modèle particulier en
utilisant les connaissances contenues dans l'ensemble des n
tâches.

Apprentissage d'ensemble
L'apprentissage d'ensemble est le processus par lequel de
multiples modèles, tels que des classificateurs ou des
experts, sont stratégiquement générés et combinés pour
résoudre un problème particulier d'intelligence
informatique. L'apprentissage d'ensemble est
principalement utilisé pour améliorer les performances d'un
modèle ou pour réduire la probabilité d'une sélection
malheureuse d'un mauvais modèle. Parmi les autres
applications de l'apprentissage d'ensemble, citons
l'attribution d'un degré de confiance à la décision prise par
le modèle, la sélection de caractéristiques optimales, la
fusion de données, l'apprentissage incrémental,
l'apprentissage non stationnaire et la correction d'erreurs.

Renforcer :
Le terme "Boosting" fait référence à une famille
d'algorithmes qui convertit les apprenants faibles en
apprenants forts. Le boosting est une technique
d'apprentissage d'ensemble utilisée pour réduire les biais et
la variance. Le boosting est basé sur la question posée par
Kearns et Valiant : "Un ensemble d'apprenants faibles
peut-il créer un seul apprenant fort ?" Un apprenant
faible est défini comme un classificateur, un apprenant fort
est un classificateur qui est arbitrairement bien corrélé avec
la vraie classification.

Figure : Pseudo-code de stimulation

Ensachage
L'agrégation par échantillonnage ou bootstrap est appliquée
lorsque la précision et la stabilité d'un algorithme
d'apprentissage automatique doivent être améliorées. Il est
applicable à la classification et à la régression. L'agrégation
diminue également la variance et aide à gérer l'ajustement
excessif.

Volume 9 Numéro 1, janvier 2020


www.ijsr.net
Sous licence Creative Commons Attribution CC BY
ID papier : DOI : 10.21275/ART20203995 388
Journal international des sciences et de la recherche
(IJSR)
ISSN : 2319-7064
ResearchGate Facteur d'impact (2018) : 0.28Figure
| SJIF :(2018)
Réseau: neuronal supervisé
7.426

Figure : Pseudo-code de
l'ensachage

Réseaux neuronaux
Un réseau neuronal est une série d'algorithmes qui
s'efforcent de reconnaître les relations sous-jacentes dans un
ensemble de données grâce à un processus qui imite le
fonctionnement du cerveau humain. En ce sens, les réseaux
neuronaux font référence à des systèmes de neurones, d e
nature organique ou artificielle. Les réseaux neuronaux
peuvent s'adapter à des données d'entrée changeantes, de
sorte que le réseau génère le meilleur résultat possible sans
qu'il soit nécessaire de redéfinir les critères de sortie. Le
concept des réseaux neuronaux, qui trouve son origine dans
l'intelligence artificielle, gagne rapidement en popularité
dans le développement des systèmes de négociation.

Figure : Réseaux neuronaux

Un réseau neuronal artificiel se comporte de la même


manière. Il fonctionne sur trois couches. La couche d'entrée
reçoit les données. La couche cachée traite l'entrée. Enfin, la
couche de sortie envoie la sortie calculée.

Réseau neuronal supervisé


Dans le réseau neuronal supervisé, la sortie de l'entrée est
déjà connue. La sortie prédite par le réseau neuronal est
comparée à la sortie réelle. En fonction de l'erreur, les
paramètres sont modifiés, puis réintroduits dans le réseau
neuronal. Le réseau neuronal supervisé est utilisé dans le
réseau neuronal à avance directe.

Volume 9 Numéro 1, janvier 2020


www.ijsr.net
Sous licence Creative Commons Attribution CC BY
ID papier : DOI : 10.21275/ART20203995 389
Journal international des sciences et de la recherche
(IJSR)
ISSN : 2319-7064
Réseau neuronal non supervisé ResearchGate Facteur d'impact (2018) : 0.28 | SJIF (2018) :
Le réseau neuronal n'a aucune idée préalable de la sortie de 7.426
l'entrée. La principale tâche du réseau consiste à classer les
données en fonction de certaines similitudes. Le réseau
neuronal vérifie la corrélation entre les différentes entrées
et les regroupe.

Figure : Réseau neuronal non supervisé

Réseau neuronal renforcé


L'apprentissage par renforcement fait référence aux
algorithmes orientés vers un but, qui apprennent à atteindre
un objectif complexe (but) ou à maximiser une dimension
particulière sur plusieurs étapes ; par exemple, maximiser
les points gagnés dans un jeu sur plusieurs coups. Ils
peuvent partir d'une page blanche et, dans les bonnes
conditions, atteindre des performances surhumaines.
Comme un enfant encouragé par des fessées et des
bonbons, ces algorithmes sont pénalisés lorsqu'ils prennent
de mauvaises décisions et récompensés lorsqu'ils prennent
les bonnes - c'est ce que l'on appelle le renforcement.

Figure : Réseau neuronal renforcé

Apprentissage basé sur les instances


L'apprentissage par instance fait référence à une famille de
techniques de classification et de régression, qui produisent
une étiquette/prédiction de classe basée sur la similarité de
la requête avec son ou ses voisins les plus proches dans
l'ensemble de formation. Contrairement à d'autres méthodes
telles que les arbres de décision et les réseaux neuronaux,
les algorithmes d'apprentissage par instance ne créent pas
d'abstraction à partir d'instances spécifiques. Ils se
contentent de stocker toutes les données et, au moment de
l'interrogation, de dériver une réponse à partir de l'examen
des plus proches voisins de l'interrogation.

Voisin le plus proche (K-Nearest Neighbor)


L'algorithme des k-voisins les plus proches (KNN) est un
algorithme d'apprentissage automatique simple et supervisé
qui peut être utilisé pour résoudre les problèmes de
classification et de régression. Il est facile à mettre en
œuvre et à comprendre, mais il présente l'inconvénient
majeur de

Volume 9 Numéro 1, janvier 2020


www.ijsr.net
Sous licence Creative Commons Attribution CC BY
ID papier : DOI : 10.21275/ART20203995 390
Journal international des sciences et de la recherche
(IJSR)
ISSN : 2319-7064
se ralentit considérablement auResearchGate
fur et à mesureFacteur d'impact (2018) : 0.28 | SJIF (2018) :
que la taille
des données utilisées augmente. 7.426

Figure : Pseudo-code du KNN

2. Conclusion
L'apprentissage automatique peut être supervisé ou non
supervisé. Si vous disposez de moins de données et de
données clairement étiquetées pour la formation, optez pour
l'apprentissage supervisé. L'apprentissage non supervisé
donne généralement de meilleures performances et de
meilleurs résultats pour les grands ensembles de données. Si
vous disposez d'un vaste ensemble de données, optez pour
les techniques d'apprentissage en profondeur. Vous avez
également appris l'apprentissage par renforcement et
l'apprentissage par renforcement profond. Vous savez
maintenant ce que sont les réseaux neuronaux, leurs
applications et leurs limites. Ce document passe en revue
différents algorithmes d'apprentissage automatique.
Aujourd'hui, tout le monde utilise l'apprentissage
automatique, sciemment ou non. Qu'il s'agisse d'obtenir un
produit recommandé lors d'un achat en ligne ou de mettre à
jour des photos sur des sites de réseaux sociaux. Ce
document présente la plupart des algorithmes d'apprentissage
automatique les plus populaires.

Références
[1] W. Richert, L. P. Coelho, "Building Machine Learning
Systems with Python", Packt Publishing Ltd, ISBN 978-
1-78216-140-0
[2] J. M. Keller, M. R. Gray, J. A. Givens Jr, "A Fuzzy K-
Nearest Neighbor Algorithm", IEEE Transactions on
Systems, Man and Cybernetics, Vol. SMC-15, No. 4,
Août 1985
[3] https://www.geeksforgeeks.org/machine-learning/
[4] ] S. Marsland, Machine learning : an algorithmic
perspective. CRC press, 2015.
[5] M. Bkassiny, Y. Li, et S. K. Jayaweera, "A survey on
machine learning techniques in cognitive radios," IEEE
Communications Surveys & Tutorials, vol. 15, no. 3,
pp. 1136-1159, oct. 2012.
[6] https://en.wikipedia.org/wiki/Instance-based_learning
[7] R. S. Sutton, "Introduction : The Challenge of
Reinforcement Learning", Machine Learning, 8, page
225-227, Kluwer Academic Publishers, Boston, 1992.
[8] P. Harrington, "Machine Learning in action", Manning
Publications Co, Shelter Island, New York, 2012

Volume 9 Numéro 1, janvier 2020


www.ijsr.net
Sous licence Creative Commons Attribution CC BY
ID papier : DOI : 10.21275/ART20203995 391

Vous aimerez peut-être aussi