Académique Documents
Professionnel Documents
Culture Documents
L'analyse peut concerner des graphes, arbres, ou courbes (par exemple, la courbe
d'évolution temporelle d'une mesure ; on parle alors de données continues, par
opposition aux données discrètes associées à des attributs-valeurs classiques) au
même titre que de simples nombres. Voir l'article Inférence bayésienne.
Principes
Les algorithmes utilisés permettent, dans une certaine mesure, à un système piloté par
ordinateur (un robot éventuellement), ou assisté par ordinateur, d'adapter ses analyses
et ses comportements en réponse, en se fondant sur l'analyse de données empiriques
provenant d'une base de données ou de capteurs.
La difficulté réside dans le fait que l'ensemble de tous les comportements possibles
compte tenu de toutes les entrées possibles devient rapidement trop complexe à
décrire (on parle d'explosion combinatoire). On confie donc à des programmes le soin
d'ajuster un modèle pour simplifier cette complexité et de l'utiliser de manière
opérationnelle. Idéalement, l'apprentissage visera à être non supervisé, c'est-à-dire que
la nature des données d'entrainement n'est pas connue.
Applications
L'apprentissage automatique est utilisé pour doter des ordinateurs ou des machines de
systèmes de : perception de leur environnement : vision, reconnaissance d'objets
(visages, schémas, langages naturels, écriture, formes syntaxiques…) ; moteurs de
recherche ; aide aux diagnostics, médical notamment, bio-informatique, chémo-
informatique ; interfaces cerveau-machine ; détection de fraudes à la carte de
crédit, analyse financière, dont analyse du marché boursier ; classification des
séquences d'ADN ; jeu ; génie logiciel ; adaptation de sites Web ; locomotion de
robots ; analyse prédictive en matière juridique et judiciaire…
Exemples :
Un système d'apprentissage automatique peut permettre à un robot ayant la
capacité de bouger ses membres mais ne sachant initialement rien de la
coordination des mouvements permettant la marche, d'apprendre à marcher. Le
robot commencera par effectuer des mouvements aléatoires, puis, en
sélectionnant et privilégiant les mouvements lui permettant d'avancer, mettra peu
à peu en place une marche de plus en plus efficace ;
La reconnaissance de caractères manuscrits est une tâche complexe car deux
caractères similaires ne sont jamais exactement égaux. On peut concevoir un
système d'apprentissage automatique qui apprend à reconnaître des caractères
en observant des « exemples », c'est-à-dire des caractères connus.
Historique
Depuis l'antiquité, le sujet des machines pensantes préoccupe les esprits. Ce concept
est la base de pensées pour ce qui deviendra ensuite l'intelligence artificielle, ainsi
qu'une de ses sous-branches : l'apprentissage automatique.
La concrétisation de cette idée est principalement due à Alan Turing et son concept de
la "Machine universelle" en 19362 qui sont à la base des ordinateurs d'aujourd'hui. Il
continuera à poser les bases de l'apprentissage automatique, avec son article sur
"L'ordinateur et l'Intelligence" en 19503 dans lequel il développe entre autres le Test de
Turing.
En 2015, une nouvelle étape importante est atteinte, lorsque l'ordinateur Google
"AlphaGo" gagne contre un des meilleurs joueurs au jeu de plateau considéré comme
le plus dur du monde : le jeu de Go12. En 2016, un système d'intelligence artificielle à
base d'apprentissage automatique nommé LipNet parvient à lire les lèvres avec un
grand taux de succès.
Types d'apprentissage
Les algorithmes d'apprentissage peuvent se catégoriser selon le mode d'apprentissage
qu'ils emploient :
Apprentissage supervisé
si les classes sont prédéterminées et les exemples connus, le système apprend à
classer selon un modèle de classement ; on parle alors d'apprentissage supervisé (ou
d'analyse discriminante). Un expert (ou oracle) doit préalablement étiqueter des
exemples. Le processus se passe en deux phases. Lors de la première phase (hors
ligne, dite d'apprentissage), il s'agit de déterminer un modèle des données étiquetées.
La seconde phase (en ligne, dite de test) consiste à prédire l'étiquette d'une nouvelle
donnée, connaissant le modèle préalablement appris. Parfois il est préférable
d'associer une donnée non pas à une classe unique, mais une probabilité
d'appartenance à chacune des classes prédéterminées (on parle alors d'apprentissage
supervisé probabiliste).ex. : L'analyse discriminante linéaire ou les SVM en sont des
exemples typiques. Autre exemple : en fonction de points communs détectés avec
les symptômes d'autres patients connus (les exemples), le système peut catégoriser de
nouveaux patients au vu de leurs analyses médicales en risque estimé (probabilité) de
développer telle ou telle maladie.
Apprentissage semi-supervisé
Effectué de manière probabiliste ou non, il vise à faire apparaître la distribution sous-
jacente des exemples dans leur espace de description. Il est mis en œuvre quand des
données (ou « étiquettes ») manquent… Le modèle doit utiliser des exemples non
étiquetés pouvant néanmoins renseigner. ex. : En médecine, il peut constituer une aide
au diagnostic ou au choix des moyens les moins onéreux de tests de diagnostic.
Algorithmes utilisés
Ce sont dans ce domaine :
Les algorithmes élaborés pour résoudre des problèmes concernant les objets de cette
théorie ont de nombreuses applications dans tous les domaines liés à la notion de
réseau (réseau social, réseau informatique, télécommunications, etc.) et dans bien
d'autres domaines (par exemple génétique) tant le concept de graphe, à peu près
équivalent à celui de relation binaire (à ne pas confondre donc avec graphe d'une
fonction), est général. De grands théorèmes difficiles, comme le théorème des quatre
couleurs, le théorème des graphes parfaits, ou encore le théorème de Robertson-
Seymour, ont contribué à asseoir cette matière auprès des mathématiciens, et les
questions qu'elle laisse ouvertes, comme la conjecture de Hadwiger, en font une
branche vivace des mathématiques discrètes.