Vous êtes sur la page 1sur 10

Chapitre 1

Introduction au Machine Learning


1. Introduction
Vous trouverez facilement des exemples où les concepts d'apprentissage
automatique et d'apprentissage profond sont utilisés de manière interchangeable
dans les médias. Cependant, les experts les distinguent généralement. Si vous avez
décidé d’étudier ce domaine, il est important que vous compreniez ce que
signifient ces mots et, plus important encore, en quoi ils diffèrent. Qu'est-ce qui
vous est arrivé quand vous avez entendu le terme «Machine Learning» pour la
première fois ? Réfléchissez un peu !
Comprendre le machine learning mal entraînera une grave confusion. Bien
que l'apprentissage soit une branche de l'intelligence artificielle, il donne une idée
très différente de ce que c’est « apprendre »
En général, l’intelligence artificielle, l’apprentissage automatique et
l’apprentissage en profondeur sont liés comme suit:
«L'apprentissage en profondeur est une sorte d'apprentissage machine et
l'apprentissage est une sorte d'intelligence artificielle.»
Cette classification peut ne pas être aussi absolue que les lois de la nature,
mais elle est largement acceptée. Laissez-nous creuser un peu plus loin.
L'intelligence artificielle est un mot très commun qui peut impliquer beaucoup de
choses différentes. Il peut indiquer toute forme de technologie comportant des
aspects intelligents plutôt que de cibler un domaine technologique spécifique. En
revanche, l’apprentissage automatique fait référence à un domaine spécifique. En
d'autres termes, nous utilisons Machine Learning pour indiquer un groupe
technologique spécifique d'intelligence artificielle. L'apprentissage automatique
comprend également de nombreuses technologies. L'un d'eux est Deep Learning,
Le fait que l’apprentissage profond soit un type d’apprentissage automatique
est très important et c’est la raison pour laquelle nous passons en revue ce long
examen sur les liens qui unissent intelligence artificielle, apprentissage
automatique et apprentissage profond. Deep Learning (apprentissage profond) a
récemment été sous les feux des projecteurs, car il a résolu avec compétence
certains problèmes qui ont mis au défi l'intelligence artificielle. Ses performances
sont sûrement exceptionnelles dans de nombreux domaines. Cependant, il fait
également face à des limites. Les limites de Deep Learning proviennent de ses
concepts fondamentaux hérités de son ancêtre, le Machine Learning. En tant que
type d’apprentissage automatique, Deep Learning ne peut pas éviter les problèmes
fondamentaux auxquels l’apprentissage automatique est confronté. C'est pourquoi
nous devons passer en revue le Machine Learning avant de discuter du concept de
Deep Learning.
2. Qu'est-ce que l'apprentissage automatique ?
En bref, Machine Learning est une technique de modélisation qui implique
des données. Cette définition peut être trop courte pour que les débutants puissent
saisir ce que cela signifie. Alors, laissez-moi élaborer un peu sur ce sujet.
L'apprentissage automatique est une technique qui définit le «modèle» à partir de
«données». Ici, les données désignent littéralement des informations telles que
documents, audio, images, etc. Le «modèle» est le produit final de Machine
Learning.
Avant d'aller plus loin dans l’explication de ce que c’est le modèle, laissez-
moi s'écarter un peu. N’est-il pas étrange que la définition de l’apprentissage
automatique ne traite que des concepts de données et de modèle et n’ait rien à voir
avec «l’apprentissage» ? Le nom lui-même indique que la technique analyse les
données et trouve le modèle par elle-même plutôt que par un humain. Nous
appelons cela «apprendre» parce que le processus ressemble à une formation
avec des données pour résoudre le problème de la recherche d'un modèle. Par
conséquent, les données utilisées par Machine Learning dans le processus de
modélisation sont appelées données «de formation». La figure 1-2 illustre ce qui
se passe dans le processus d’apprentissage automatique.

Figure 1-2. Que se passe-t-il pendant le processus d'apprentissage automatique?


Maintenant, reprenons notre discussion sur le modèle. En réalité, le modèle
n’est rien de plus que ce que nous voulons réaliser comme produit final. Par
exemple, si nous développons un système de filtrage automatique pour supprimer
le courrier indésirable, le filtre de courrier indésirable est le modèle dont nous
parlons. En ce sens, nous pouvons dire que le modèle est ce que nous utilisons
réellement. Certains appellent le modèle une hypothèse. Ce terme semble plus
intuitif pour ceux qui ont des connaissances en statistiques. L'apprentissage
automatique n'est pas la seule technique de modélisation. Dans le domaine de la
dynamique, les gens utilisent depuis longtemps une certaine technique de
modélisation qui utilise, par exemple, les lois de Newton et décrit le mouvement
des objets sous la forme d’une série d’équations appelées équations du
mouvement. Dans le domaine de l'intelligence artificielle, nous avons le système
expert, qui est un modèle de résolution de problème basé sur les connaissances et
le savoir-faire des experts. Le modèle fonctionne aussi bien que les experts eux-
mêmes. Cependant, dans certains domaines, les lois et le raisonnement logique ne
sont pas très utiles pour la modélisation. Des problèmes typiques peuvent être
rencontrés au niveau de l'intelligence, tels que la reconnaissance d'images, la
reconnaissance de la parole et le traitement du langage naturel. Laisse-moi vous
donner un exemple. Regardez la figure 1-3 et identifier les nombres.

Figure 1-3. Comment un ordinateur identifie-t-il les numéros quand ils ne


possèdent pas de motif reconnaissable ?

Je suis sûr que vous avez terminé la tâche en un rien de temps. La plupart
des gens le font. Faisons maintenant un ordinateur faire la même chose. Si nous
utilisons une technique de modélisation traditionnelle, nous devrons trouver une
règle ou un algorithme permettant de distinguer les nombres écrits. Pourquoi
n'appliquons-nous pas les règles que vous venez d'utiliser dans votre cerveau pour
identifier les nombres? Assez facile, n'est-ce pas ? Eh bien pas vraiment. En fait,
c'est un problème très difficile. Il fut un temps où les chercheurs pensaient que
c'était un jeu d'enfant pour les ordinateurs, car c'est très facile, même pour un
humain, et les ordinateurs sont capables de calculer beaucoup plus rapidement que
les humains. Eh bien, cela ne leur a pas pris beaucoup de temps jusqu'à ce qu'ils
réalisent leur erreur de jugement !

Comment avez-vous pu identifier les numéros sans une spécification claire


ou une règle ? Il est difficile de répondre, n’est-ce pas ? Mais pourquoi ? C'est
parce que nous n'avons jamais appris une telle spécification. Depuis tout jeune,
nous venons d’apprendre que c’est 0, et que c’est 1. Nous avons juste pensé que
c’était ce que c’était et nous sommes parvenus à distinguer les chiffres de plus en
plus différents. Qu'en est-il des ordinateurs, alors ? Pourquoi ne laissons-nous pas
les ordinateurs faire la même chose ? C'est tout ! À partir de cet exemple, vous
pouvez saisir le concept d’apprentissage automatique. Machine Learning a été
créé pour résoudre les problèmes pour lesquels des modèles analytiques sont
difficilement disponibles. L'idée principale de Machine Learning est de créer un
modèle utilisant les données d'apprentissage lorsque les équations et les lois ne
sont pas prometteuses.

3. Les défis de l'apprentissage automatique

Nous venons de découvrir que le Machine Learning est la technique utilisée


pour trouver (ou apprendre) un modèle à partir des données. Il convient aux
problèmes impliquant l'intelligence, tels que la reconnaissance d'images et la
reconnaissance de la parole, lorsque les lois physiques ou les équations
mathématiques ne produisent pas des modèles exploitables. D'une part, l'approche
utilisée par Machine Learning est la clé du succès du processus. Par contre, cela
pose des problèmes inévitables. Cette section présente les problèmes
fondamentaux auxquels Machine Learning est confrontée.

Une fois que le processus d'apprentissage automatique a trouvé le modèle à


partir des données d'apprentissage, nous l'appliquons aux données de terrain
réelles. Ce processus est illustré à la figure 1-4. Le flux vertical de la figure
indique le processus d'apprentissage, et le modèle formé est décrit comme le flux
horizontal, appelé inférence.
Figure 1-4. Appliquer un modèle basé sur des données de terrain.

Les données utilisées pour la modélisation dans le Machine Learning et les


données fournies dans l'application de terrain sont distinctes. Ajoutons un autre
bloc à cette image, comme illustré à la figure 1-5, pour mieux illustrer cette
situation.

Figure 1-5. Il faut faire la différence entre les données d’apprentissage (Training Data) et les
données réelles appelées Input Data en anglais (ou de terrain, ou pratiques)
La spécificité des données de formation (appelées aussi données
d’apprentissage) et des données d'entrée est le défi structurel auquel le Machine
Learning doit faire face. Il n’est pas exagéré de dire que chaque problème de
Machine Learning provient de cela. Par exemple, qu’en est-il de l’utilisation des
données de formation, composées de notes manuscrites d’une seule personne ? Le
modèle reconnaîtra-t-il l'écriture d’une autre personne ? La possibilité sera très
faible.
Aucune approche d'apprentissage automatique ne peut atteindre l'objectif
souhaité avec des données de formation erronées. La même idéologie s'applique
à l'apprentissage profond. Par conséquent, il est essentiel que les approches
d’apprentissage automatique obtiennent des données de formation (données
d’apprentissage) non biaisées qui reflètent correctement les caractéristiques des
données de terrain. Le processus utilisé pour assurer la cohérence des
performances du modèle, quelles que soient les données d'apprentissage ou les
données d'entrée, est appelé généralisation. Le succès de l’apprentissage
automatique dépend en grande partie de la qualité de la généralisation.
4. Surinterprétation (Overfiting)
La surinterprétation est l’une des principales causes de détérioration du
processus de généralisation. Oui, un autre nouveau terme. Cependant, il n'y a pas
besoin d'être surpris ! Ce concept est facile à retenir. Ce sera beaucoup plus facile
à comprendre avec une étude de cas qu'avec de simples phrases. Considérons un
problème de classification illustré à la figure 1-6. Nous devons diviser les
données de position (ou de coordonnées) en deux groupes. Les points sur la figure
sont les données d'apprentissage. L'objectif est de déterminer une courbe qui
définit la frontière des deux groupes en utilisant ces données d'apprentissage
illustrées sur figure 1-6.

Figure 1-6. Déterminer une courbe pour diviser deux groupes de données
Bien que nous voyions des valeurs aberrantes s'écartant de l'aire adéquate, la
courbe illustrée à la figure 1-7 semble constituer une frontière raisonnable entre
les groupes.

Figure 1-7. Courbe permettant de différencier deux types de données


Lorsque nous jugeons cette courbe, certains points ne sont pas correctement
classés en fonction de la frontière. Pourquoi ne pas regrouper parfaitement les
points à l’aide d’une courbe complexe, comme illustré à la figure 1-8 ?

Figure 1-8. Mieux grouper, mais à quel prix ?


Ce modèle offre les performances de regroupement parfaites pour les
données d'apprentissage. De quoi ça a l’air ? Aimez-vous ce modèle mieux ? Cela
semble-t-il refléter correctement le comportement général ?
Maintenant, utilisons ce modèle dans le monde réel. La nouvelle entrée dans
le modèle est indiquée par le symbole ■, comme illustré à la figure 1-9.

Figure 1-9. Une nouvelle entrée est placée dans les données prédédentes

Ce modèle (la courbe), sans erreur, identifie les nouvelles données en tant
que classe Δ. Cependant, la tendance générale des données de formation nous
indique que cela est douteux. Le regrouper en classe semble plus raisonnable.
Qu'est-il arrivé au modèle qui a produit une précision de 100% pour les données
d’entraînement ?
Examinons de nouveau les points de données. Certaines valeurs aberrantes
pénètrent dans la zone de l'autre groupe et perturbent la limite. En d'autres termes,
ces données contiennent beaucoup de bruit. Le problème est qu'il n'y a aucun
moyen pour le Machine Learning de faire la distinction. Lorsque le Machine
Learning prend en compte toutes les données, même le bruit, il finit par produire
un modèle incorrect (une courbe dans ce cas). Comme vous le remarquerez peut-
être ici, les données d'entraînement ne sont pas parfaites et peuvent contenir
différentes quantités de bruit. Si vous pensez que chaque élément des données de
formation (autrement dit d’apprentissage) est correct et s’adapte parfaitement au
modèle, vous obtiendrez un modèle moins généralisable. C'est ce qu'on appelle
l'overfitting.
Certes, en raison de sa nature, le Machine Learning devrait tout mettre en
œuvre pour obtenir un excellent modèle à partir des données de formation.
Cependant, un modèle de travail des données d'apprentissage peut ne pas refléter
correctement les données de terrain. Cela ne signifie pas que nous devrions rendre
le modèle moins précis que les données de formation. Cela va saper la stratégie
fondamentale de Machine Learning.

Vous aimerez peut-être aussi