Machine Learning (ML) : Imane Allaouzi

Machine Learning (ML)
Imane Allaouzi
imane.allaouzi@gmail.com
Plan
Machine Learning: Histoire
Machine Learning: c’est quoi ?
Machine Learning: Usage
Les types de Machine Learning
Supervised Learning
Machine Learning: Histoire
➢Le Machine Learning a été inventé par Arthur Samuel en 1959.
➢Arthur Samuel a développé le premier programme de jeu de Dames doté d’une intelligence
artificielle. Ce programme avait appris à jouer aux Dames tout seul, sans recevoir la moindre
instruction de son développeur.
➢C'était la première réfutation forte de l'affirmation selon laquelle les ordinateurs ne peuvent rien
faire à moins qu'ils ne soient explicitement programmés pour le faire.
Machine Learning: C’est quoi ?
➢Arthur Samuel a formulé la définition historique du Machine Learning :
“Machine Learning is the field of study that gives computers the ability to learn without being explicitly programmed. ”
—Arthur Samuel, 1959
“Le Machine Learning est le domaine d’étude qui donne aux ordinateurs la capacité d’apprendre sans être explicitement
programmé. ” —Arthur Samuel, 1959
➢Tom Mitchell en donne une définition un peu plus moderne :
“ A computer program is said to learn from experience E with respect to some task T and some performance measure P, if
its performance on T, as measured by P, improves with experience E”. —Tom Mitchell, 1997
“ Un programme informatique se dit d’apprendre de l’expérience E par rapport à une catégorie de tâches T et mesure de la
performance P, si sa performance à des tâches T, telle que mesurée par P, s’améliore avec l’expérience E. ”.—Tom Mitchell,
1997
Machine Learning : c’est quoi?
➢Quatre éléments principaux pour ML:
Données Quantitaves, Textes, Images ,Vidéos, sons, etc.
Tâche à Reconnaissance d’image, Prédiction de la radiation solaire,

accomplir Identification des transactions frauduleuses, etc.
Decision Tree, SVM, réseau de neurones, régression

Modèle de ML linéaire,etc.
Mesure de
Accuracy, precision, recall, F-score, kappa cohen ,etc.
performance
Machine Learning: c’est quoi?
Task
Trail-Error Experiences
Train ML Algorithm Prediction

Data
No Yes
Evaluation Deploy
Machine Learning: c’est quoi?
Test
Data Data
Building the ML model
ML Algorithm Prediction
Train Data
No Yes
Evaluation Deploy
Task
Machine Learning: Usage
➢Le machine learning est idéal pour:
❑Problèmes pour lesquels les solutions existantes nécessitent de nombreux réglages

manuels ou de longues listes de règles : un algorithme d'apprentissage automatique peut
souvent simplifier le code et être plus performant.
Ex: Détection/filtrage des courriers indésirables, détection des fraudes (l'ennemi s'adapte donc
nous devons nous adapter aussi).
❑Problèmes complexes pour lesquels il n'y a pas de bonne solution du tout en utilisant
une approche traditionnelle (par exemple, la reconnaissance vocale, la vision, le langage): les
meilleures techniques de Machine Learning peuvent trouver une solution.
❑Obtenir des informations sur des problèmes complexes et de grandes quantités

de données. Par exemple, une fois que le filtre anti-spam a été formé sur suffisamment de
spam, il peut facilement être inspecté pour révéler la liste des mots et des combinaisons de
mots qui, selon lui, sont les meilleurs prédicteurs de Spam.
Il existe tellement de types différents de systèmes d'apprentissage automatique qu'il est utile de les
classer en grandes catégories en fonction de :
✓Qu'ils soient ou non entrainés sous supervision humaine (Supervised, Unsupervised, Semi-supervisé
et Reinfrocement learning).
✓S'ils peuvent ou non apprendre progressivement à partir d'un flux de données entrantes (Online
learning ou Offline learning).
✓Qu'ils fonctionnent simplement en comparant de nouveaux données à des données connus, ou qu'ils
détectent plutôt des modèles dans les données d'apprentissage et construisent un modèle prédictif
(apprentissage basé sur des instances ou basé sur des modèles).
❖Apprentissage supervisé:
-Les données d’entrainement sont annotées.
-Le but de cette méthode est que l’algorithme d’apprentissage puisse apprendre en comparant les sorties réelles avec les
sorties prédites pour trouver des erreurs et modifier le modèle en conséquence.
❖Apprentissage non-supervisé:
-Les données d’entrainement ne sont pas annotées.
-Le but de cette méthode est que l ’algorithme d’apprentissage puisse trouver tout seul les similarités et les distinctions
au sein de ces données, et à regrouper ensemble celles qui partagent des caractéristiques communes.
❖Apprentissage semi-supervisé:
-Certaines données d’entrainement sont annotées et d'autres non.
-Cette méthode est hybride , elle tire parti des deux mondes (supervised et unsupervised), mais bien sûr apporte son lot
de difficultés.
❖Apprentissage par renforcement:
-Le système d'apprentissage, appelé agent dans ce contexte, peut observer l'environnement, sélectionner et effectuer
des actions, et obtenir des récompenses en retour (ou des pénalités sous forme de récompenses négatives). Il doit alors
apprendre par lui-même quelle est la meilleure stratégie, appelée politique, pour obtenir le plus de récompenses au fil
du temps. Une politique définit l'action que l'agent doit choisir lorsqu'il se trouve dans une situation donnée.
❖Batch learning (Offline learning):
Dans l'apprentissage par lots, le système est incapable

d'apprendre de manière incrémentale : il doit être
entraîné en utilisant toutes les données disponibles, puis
il est lancé en production et fonctionne sans plus
d'apprentissage ; il applique simplement ce qu'il a appris.
❖Online learning:
Dans l'apprentissage en ligne, le système est entrainé de

manière incrémentielle en lui alimentant des instances de
données de manière séquentielle, soit individuellement,
soit par petits groupes appelés mini-batch (c'est ce qu'on
appelle out-of-core learning).
L'apprentissage en ligne est idéal pour les systèmes qui

reçoivent des données sous forme de flux continu
(Streaming data) et doivent s'adapter au changement
rapidement ou de manière autonome.
❖Instance-based learning
Le système apprend les exemples par cœur, puis généralise à de nouveaux cas en les comparant aux
exemples appris (ou à un sous-ensemble d'entre eux), à l'aide d'une mesure de similarité.
❖Model-based learning:
Le système apprend et prédit à l'aide d'un modèle.

Supervised Learning
➢En machine learning, l'apprentissage supervisé consiste à entrainer un modèle à partir
de données préalablement étiquetées ou annotées. Le nom “Apprentissage Supervisé” vient donc
du fait que l’on supervise (tel un professeur) l’apprentissage de la machine en lui fournissant des exemples
de question/réponse à étudier.
➢En apprentissage supervisé, on a un ensemble de données X={x(1), ..., x(m)} associé à un ensemble de
résultats Y={y(1), ..., y(m)} . Le but est de créer un modèle ML qui apprend à prédire Y à partir de X.
➢Formellement, notre objectif est, étant donné un ensemble d'apprentissage,

d'apprendre une fonction h : X → Y de sorte que h(x) soit un « bon » prédicteur
pour la valeur correspondante de y.
Par convention:
x(i): Input Features , également appelée input variables ou independent variables.

y(i): The “output” or target variable , également appelée independent variable.
y’: The predicted output (la sortie prédite).
(x(i), y(i)): a training example.
m : Number of training examples.
(x(i), y(i)) ; i=1,…,m : training set (L’ensemble d’apprentissage).
(i): est simplement un index dans l'ensemble d'apprentissage et n'a rien à voir avec l'exponentiation.
h: Pour des raisons historiques, cette fonction est appelée une hypothèse.
Supervised Learning
➢Il existe deux types d'algorithmes d'apprentissage supervisé, où le type de variable de résultat
détermine s’il s’agit d’un problème de régression ou de classification.
Supervised Learning « Regression »
➢Les problèmes de Régression correspondent aux situations dans lesquelles la machine doit prédire
la valeur d’une variable quantitative (variable continue).
➢Problématique: Quelle température fera-t-il demain ?
Target variable Input features

Supervised Learning « Classification»
➢Les problèmes de Classification correspondent aux situations dans lesquelles la machine doit
prédire la valeur d’une variable qualitative (variable discrète). Autrement dit, la machine
doit classer ce qu’on lui donne dans des classes.
➢Problématique: Quel temps fera-t-il demain ?
Target variable Input features

Machine Learning (ML) : Imane Allaouzi

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Machine Learning (ML) : Imane Allaouzi

Transféré par

Droits d'auteur :

Formats disponibles

Machine Learning (ML)

Machine Learning: c’est quoi ?

Machine Learning: Usage

Les types de Machine Learning

➢Le Machine Learning a été inventé par Arthur Samuel en 1959.

➢Tom Mitchell en donne une définition un peu plus moderne :

➢Quatre éléments principaux pour ML:

Données Quantitaves, Textes, Images ,Vidéos, sons, etc.

Tâche à Reconnaissance d’image, Prédiction de la radiation solaire,

Decision Tree, SVM, réseau de neurones, régression

Train ML Algorithm Prediction

Building the ML model

➢Le machine learning est idéal pour:

❑Problèmes pour lesquels les solutions existantes nécessitent de nombreux réglages

❑Obtenir des informations sur des problèmes complexes et de grandes quantités

❖Apprentissage par renforcement:

Dans l'apprentissage par lots, le système est incapable

Dans l'apprentissage en ligne, le système est entrainé de

L'apprentissage en ligne est idéal pour les systèmes qui

Le système apprend et prédit à l'aide d'un modèle.

➢Formellement, notre objectif est, étant donné un ensemble d'apprentissage,

x(i): Input Features , également appelée input variables ou independent variables.

➢Problématique: Quelle température fera-t-il demain ?

Target variable Input features

➢Problématique: Quel temps fera-t-il demain ?

Target variable Input features

Vous aimerez peut-être aussi