Chapitre1 ML

Université Moulay Ismail Meknès
Faculté des Sciences Meknès

Département d’informatique
Support de cours
APPRENTISSAGE ARTIFICIEL
(« Machine-Learning »)
Année universitaire 2022/2023
Pr. Mohammed OUANAN
1
Objectifs pédagogiques :
 Resituez le Machine Learning au sein de la Data Science
 Identifiez les possibilités du Machine Learning
 Identifiez les techniques et outils du Machine Learning
 Entraînez quelques algorithmes du Machine Learning
 Identifiez les limites du Machine Learning
2 Pr Mohammed OUANAN
Plan du cours
 Chapitre1:Introduction à l’apprentissage automatique

 Introduction
 Concepts de bases
Chapitre2:
 Classification et Régression
Chapitre3:
 Machine à vecteurs de support (SVM)
 Les arbres de décision
Chapitre4:
 Clustering
Chapitre5:
 Réseaux de neurones
Dans ce premier chapitre, nous allons voir :
 Pourquoi le Machine Learning est vraiment utile
 La définition du Machine Learning
 Les 3 méthodes d’apprentissage
 Les 4 notions clefs qui s’appliquent à tout le Machine Learning
• Documents
– Le livre
"L'apprentissage artificiel. Concepts et
algorithmes" (Eyrolles. 3ème éd. 2018)
A. Cornuéjols & L. Miclet & V. Barra
2
Introduction
Qu’est ce que la machine Learning?

(apprentissage automatique)
Est la science (et l’art) de programmer les

ordinateurs de sorte qu’ils puissent apprendre à
partir de données
Introduction
 Le Machine Learning est tout autour de nous. Il intervient chaque fois que
nous cherchons un mot dans Google, une série sur Netflix, une vidéo sur
YouTube, un produit sur Amazon.
 Grâce au Machine Learning, des millions de cancers peuvent être

diagnostiqués chaque année, des milliards de spams et de virus informatiques
sont bloqués pour protéger nos ordinateurs, et sans lui la voiture autonome
n’existerait peut-être jamais.
Motivation:
Comprendre au mieux ce qu’est le Machine Learning
Nous, les êtres humains, sommes quotidiennement confronté à des

problèmes que nous cherchons à résoudre. Par exemple : Comment
construire un pont plus solide ? Comment augmenter nos bénéfices ?
Comment éliminer le cancer ? Ou tout simplement quelle route
emprunter pour aller au travail ?
Pour nous aider dans nos recherches, nous avons inventé l’ordinateur, qui
permet de résoudre en quelques minutes des calculs qui nous
prendraient des millions d’années à effectuer.
Mais il faut savoir qu’un ordinateur ne sait en réalité faire qu’une chose
: résoudre les calculs qu’on lui donne.
Motivation:
À partir de là, deux situations possibles :
1. On connait le calcul à effectuer pour résoudre notre problème. Dans ce cas, facile ! On
entre ce calcul dans l’ordinateur, c’est ce qu’on appelle la programmation, et
l’ordinateur nous donne le résultat.
Exemple :
 Déterminer la structure d’un pont
 Le problème du voyageur de transport
2. On ne connait pas le calcul qui résout notre problème Dans ce cas... on est bloqué.
Impossible de donner à un ordinateur un calcul que nous ne connaissons pas.
Exemples :
 Reconnaitre un visage sur une photo
 Prédire le cours de la Bourse
 Eliminer le cancer
 Composer de la musique
 Conduire une voiture
Motivation:
Doit-on donc perdre tout espoir de voir un jour un ordinateur nous aider
dans la lutte contre le cancer ?
Non Bien sûr que !
Le Machine Learning a justement été inventé pour venir débloquer la

deuxième situation .
Le Machine Learning consiste à laisser l’ordinateur apprendre quel

calcul effectuer, plutôt que de lui donner ce calcul (c’est-à-dire le
programmer de façon explicite).
Mais comment apprendre ?
Pour donner à un ordinateur la capacité d’apprendre, on utilise des
méthodes d’apprentissage qui sont fortement inspirées de la façon dont
nous, les êtres humains, apprenons à faire des choses.
Par exemple:
Depuis sa naissance l’enfant apprend :
 La voix de sa mère
 Apprend à marcher, à parler
 Apprend à raisonner
…
Programmation classique
Data
Computer Output
Program
Machine Learning(apprentissage machine)
Data
Computer Program
Output
Pr Mohammed OUANAN
12
Apprentissage Automatique(Artificiel )
"Donner la capacité aux machines d'apprendre sans les programmer

explicitement"
Arthur Samuel, 1959
Qu'est-ce que l'Apprentissage machine ?
Etant donné :
 de l'expérience E, Statistiques
 une classe de tâches T utilité
 une mesure de performance P, Optimisatio
On dit d'un ordinateur qu'il apprend si n
sa performance sur une tâche de T
mesurée par P
augmente avec l'expérience E
Tom Mitchell, 1998
 Par exemple : Programme capable d’estimer le prix des appartements
 Expérience (E) : La description de l’appartement et son prix réel
 Tâche (T) : Estimer le prix des appartements
 Performance (P) : La précision de la prédiction faite par l’algorithme et à
quel point elle est proche du prix réel
14
Les machines (agents) ont besoin d’apprendre Pourquoi?
 Exemple: La reconnaissance optique de caractères (OCR)
 Par énumération de règles?

si intensité du pixel à la position(10,12) est plus grand que 70 et
intensité du pixel a la position(15,32) est plus grand que 10…. Alors
c'est un « 7 ».
Trop fastidieux, difficile de couvrir tous les cas d’espèce qu’on pourrait
rencontrer.
Applications pratiques de l'AA(1)
 1er application en ML: filtre anti-spam

Depuis 1990 application qui touche un large public,
La tache T consiste à identifier parmi les nouveaux emails
ceux qui sont frauduleux;
L’expérience E est constitué par les données d’entrainement
(un ensemble de règles qui permet de distinguer entre les
emails spam ou non)
Performance P doit être définie( par exemple le
pourcentages de courriels correctement classé (en anglais
accuracy) souvent utilisé en classification.
Applications pratiques de l'AA(2)
 systèmes experts
 méthode d'acquisition de connaissances alternative ou
complémentaire au recueil d'expertise
 traitement automatique du langage naturel (écrit)
 traitement (synthèse et reconnaissance) de la parole
 reconnaissance d'images
Applications pratiques de l'AA (3)
 planification, robotique
 personnalisation de logiciels :
 lecteurs de news ou de mail
 jeux
 activités beaucoup plus terre-à-terre : industrie chimique, agriculture,
 ...
Un domaine interdisciplinaire
INTELLIGENCE
ARTIFICIELLE
STATISTIQUES, OPTIMISATION
analyse de données
Apprentissage
machine
AUTOMATIQUE, VISION
commande,
robotique
Pr Mohammed OUANAN
Différence entre machine Learning et Data Mining
Data Mining : retraiter les données déjà connues pour en

sortir des propriétés et des précisions encore inconnues
Machine Learning : apprendre aux systèmes à prédire ce

que pourrait être le résultat sorti de données encore
inconnues à partir de données connues.
Concepts Générale
Jeu de données(Dataset)
un Data Set est une collection nommée qui contient des unités de
données individuelles organisées (formatées) et accessibles par une
méthode d'accès spécifique basée sur l'organisation de l'ensemble de
données. Le jeu de données peut être organisé de façon séquentielle,
séquentielle relative, séquentielle indexée et partitionnée.).
Feature extraction
L’extraction de caractéristique (feature) a pour but de caractériser les
données d’apprentissage:
 Réduction de la dimension du problème
 Définies par un expert ou un algorithme
Exemples:
 Individu: âge, taille, poids,…
 Caractère: valeur des pixels du caractère redimensionné
 Cours boursier: open, close, high, low
Que sont les données( features)?
 Une donnée est un nombre, une caractéristique, qui m’apporte une
information sur un individu, un objet ou une observation. Par exemple, 30
est un nombre sans intérêt, mais si quelqu’un vous dit « J’ai 30 ans», 30
devient une donnée qui vous permettra d’en savoir un peu plus sur lui.
On distingue Les données dites privées et des données dites publiques:
- Les données privées sont tout simplement les données qui en théorie
n’appartiennent qu’à vous ou à votre organisation.
- Les données publiques, c’est-à-dire accessibles à tous. Dans ce cas, vous

disposez d’une source de données quasi infinie: Internet.
- Pour cela, trois modes de collecte de données existent:
• Les open data, qui correspondent à la mise à disposition gratuite de données
de la société civile, sur des sites tels que www.data.gov, www.data.gouv.fr, etc.
• Les open API (Application Programming Interface), qui sont des

technologies permettant d’accéder à des données sur Internet. Elles vous
permettent de récupérer par exemple des données mises à disposition par
Google, Twitter, etc. Pour en savoir plus sur les API disponibles, consultez par
exemple l’annuaire http://www.programmableweb.com.
• Le Web en tant que tel est lui aussi directement source de données. Pour
cela, il faut un minimum d’expertise en programmation pour être capable de
faire ce que l’on nomme du web scraping, qui consiste à récupérer des
données directement à partir des pages des sites Internet.
Les principaux types de données
On distingue généralement les données quantitatives des données qualitatives.
 Les données quantitatives sont des valeurs qui décrivent une quantité
mesurable, sous la forme de nombres sur lesquels on peut faire des calculs
(moyenne, etc.) et des comparaisons (égalité/différence,
infériorité/supériorité, etc.). Elles répondent typiquement à des questions
du type «combien». On fait parfois la différence entre:
Les données quantitatives continues, qui peuvent prendre n’importe quelle

valeur dans un ensemble de valeurs: la température, le PIB, le taux de chômage
Les données quantitatives discrètes, qui ne peuvent prendre qu’un

nombre limité de valeurs dans un ensemble de valeurs: le nombre
d’enfants par famille, le nombre de pièces d’un logement, etc.
26
Les principaux types de données
 Les données qualitatives décrivent quant à elles des qualités ou des
caractéristiques. Elles répondent à des questions de la forme « quel
type » ou « quelle catégorie». Ces valeurs ne sont plus des nombres,
mais un ensemble de modalités. On ne peut pas faire de calcul sur ces
valeurs, même dans l’éventualité où elles prendraient l’apparence
d’une série numérique. On distingue:
les données qualitatives nominales (ou catégorielles), dont les modalités ne

peuvent être ordonnées. Par exemple: la couleur des yeux (bleu, vert,
marron, etc.), le sexe (homme, femme), la région d’appartenance, etc.).
les données qualitatives ordinales, dont les modalités sont ordonnées selon
un ordre « logique». Par exemple: les tailles de vêtements (S, M, L, XL), le
degré d’accord à un test d’opinion (fortement d’accord, d’accord, pas
d’accord, fortement pas d’accord).
Type de données Opérations supportées
Quantitatives continues continues Calculs, égalité/différence,
infériorité/supériorité
Quantitatives discrets continues Calculs, égalité/différence,
Qualitatives nominales Égalité/différence
Qualitatives ordinales Égalité/ différence,

L'apprentissage Automatique (Machine Learning)
Apprentissage supervisée
 Imaginez que vous commenciez à apprendre le chinois. Pour ce faire, il vous faudra soit
acheter un livre de traduction chinois-français, ou bien trouver un professeur de chinois.
 Le rôle du professeur ou du livre de traduction sera de superviser votre apprentissage en

vous fournissant des exemples de traductions français- chinois que vous devrez
mémoriser.
 On parle ainsi d’apprentissage supervisé lorsque l’on fournit à une machine beaucoup
d’exemples qu’elle doit étudier.
Pour maîtriser l’apprentissage supervisé, il faut absolument comprendre

et connaitre les 4 notions suivantes :
 Le Dataset
 Le Modèle et ses paramètres
 La Fonction Coût
 L’Algorithme d’apprentissage
Notion 1 : Apprendre à partir d’exemples (Dataset)
lorsque l’on fournit à une machine beaucoup d’exemples (x,y) dans le but de lui faire
apprendre la relation qui relie x à y
En Machine Learning, on compile ces exemples (x,y) dans un tableau que l’on
appelle Dataset :
 La variable y porte le nom de target (la cible). C’est la valeur que l’on cherche à prédire.
La variable x porte le nom de feature (facteur). Un facteur influence la valeur de y et
on a en général beaucoup de features (x1,x2… ) dans notre Dataset que l’on regroupe
dans une matrice X
Exemple
un Dataset qui regroupe des exemples d’appartements avec leur prix

ainsi que certaines de leurs caractéristiques (features)
Notion 2: Développer un modèle à partir du Dataset
En Machine Learning, on développe un modèle à partir de ce Dataset. Il peut s’agir d’un
modèle linéaire comme vous pouvez le voir à gauche, ou bien un modèle non-linéaire comme
vous pouvez le voir à droite
On note a,b,c les paramètres du modelé
Notion 3 : Les erreurs de notre modèle - la
Fonction
Coût
à noter est qu’un modèle nous retourne des erreurs par rapport à notre
Dataset. On appelle Fonction Coût l’ensemble de ces erreurs (le plus
souvent on prend la moyenne quadratique des erreurs)
un bon modèle, c’est avoir un modèle qui nous donne de petite erreurs,
donc une petite Fonction Coût.
Notion 4 : Apprendre, c’est minimiser la Fonction
Coût
Apprentissage: optimisation des paramètres pour minimiser la

Fonction Coût (erreur sur les exemples ) Pour cela, on utilise un
algorithme d’apprentissage, l’exemple le plus courant étant
l’algorithme de Gradient Descent,
Généralisation: estimer de bonnes réponses pour des x inconnues
Apprentissage visant à apprendre à partir d’un ensemble d’exemples
étiquètes a étiqueter des éléments inconnus.
Autrement formulé, a partir d’un set input et d’un set output on cherche
a trouver la relation(classifieur) liant input et output,
Exemples entrée-sortie
(x1,y1), (x2,y2), … , (xn, yn)
H famille de ALGORITHME fH
modèles mathématiques D’APPRENTISSAG
E
Hyper-paramètres pour
l’algorithme d’apprentissage
Meilleure hypothèse f*
?
Apprentissage supervisé: classification
Dans un problème de classification, on cherche à classer un objet dans

différentes classes, c’est-à-dire que l’on cherche à prédire la valeur d’une
variable discrète (qui ne prend qu’un nombre fini de valeurs).
Exemples
 Prédire si un email est un spam (classe y=1) ou non (classe y=0) selon le
nombre de liens présent dans l’email ( les x)
 Prédire si un tumeur est maligne ( y=1) on non (y=0) selon la taille du
tumeur (x1) et l'âge du patient (x2)
 Détection de visage, classes={présence, absence}
 OCR, classes={caractères identifiables}
Apprentissage supervisé: régression
Dans les problèmes de régression, on cherche à prédire la valeur d’une

variable continue, c’est-à-dire une variable qui peut prendre une infinité de
valeurs.
Exemples:
 Prédire le prix d’un appartement (y )selon sa surface habitable (x)
 Prédire la quantité d’essence consommée (y) selon la distance parcourue
(x)
 Prévision de la charge d’un serveur
 Prévision de la fréquentation des routes
 Estimation de la consommation d’electricité d’un ménage
La force du Machine Learning, c’est qu’il est très facile de développer des
modèles très complexes qui peuvent analyser des milliers de features (x) qu’un
être humain ne serait pas capable de prendre en compte pour faire son calcul
(et Excel non plus).
Par exemple, pour prédire le prix d’un appartement (y) un modèle de Machine
Learning peut prendre en compte :
 sa surface (x1)
 sa localisation (x2)
 sa qualité (x3)
 sa proximité avec un parc (x4)
 etc.
Plus il y a de features disponibles, plus il existe

d’informations pour que le modèle prenne des décisions
‘intelligentes’, c’est l’intelligence artificielle.
Apprentissage non supervisé
Extraire des patterns( structure sous-jacente) dans un training non
étiqueté, on observe un set de données pour trouver les relations cachées
qui s’est trouve. Le partitionnement de données, data clustering,
Classes désirées inconnues, exemples connus

Ce qu’il faut déterminer : fonction classifieur+les
classes
Apprentissage NON supervisé à partir de données
Base d’exemples
de type « entrée seule» :
X= {x1, x2, … , xn}
(xid, souvent avec d « grand ») hH telle que
H famille de critère J(h,X)
modèles mathématiques ALGORITHME soit vérifié ou
[ chaque hH  agent D’APPRENTISSAG optimisé
avec comportement y=h(x) ] E
Hyper-paramètres pour
l’algorithme
d’apprentissage
Exemple typique : le « clustering »
 h(x)C={1,2, …, K} [ chaque i  « cluster » ]
 J(h,X) : dist(xi,xj) « plus faible pour xi,xj tq h(xi)=h(xj)
que pour des xi,xj tq h(xi)h(xj)»
Apprentissage non supervisé: Clustering
Former des groupes homogènes à l’intérieur d’une population:
 Etant donne un ensemble de points, chacun ayant un ensemble d’attributs, et
une mesure de similarité définie sur eux, trouver des groupes (classes,
segments, clusters) tels que :
 Les points à l’intérieur d’un même groupe sont très similaires entre eux.
Les points appartenant à des groupes différents sont très dissimilaires.
 Le choix de la mesure de similarité est important.
Exemples:
 Text mining : textes proches, dossiers automatiques.
 Web mining : pages web proches
 BioInformatique : gènes ressemblants
 Marketing : segmentation de la clientèle
Apprentissage par renforcement
 Apprendre un comportement (policy) optimal au sein d’un
environnement en se basant sur un fedback régulier de la série
d’actions effectuée
 Orienté pour la prise de décision cet apprentissage se base
sur l’expérience (échecs et succès constatés).
Exemples :
 La robotique
 Education des animaux de compagnie
 jeu d’échec, poker, backgammon, go…
 behaviorisme: (pavlov, watson,skinner)
 Black-box
 Contingence de renforcement:( state, action,reward)
On a besoin:
1) Ensemble de données d’apprentissage
2) Ensemble de données de Test
3) Algorithme d’apprentissage(ou d’adaptation des paramètres)
L’apprentissage se déroule en deux parties distinctes :
La phase d’entraînement : la machine(le programme) apprend une

tâche à partir d’une série d’exemples.
La phase de test : Les performances de la machine sont mesurées sur

une nouvelle série d’exemples
L'idée du test est de vérifier la qualité de la procédure de classification

induite.(qualité du classifieur)
Algorithme machine learning
Dilemme Biais-Variance
 Il est impossible d’effectuer un apprentissage sans poser un

aprioris (biais) sur les données que l’on étudie.
Définition:
 Biais : à quel point le modèle est flexible
 Variance: à quel point le résultat d’apprentissage va varier
suite à une faible modification du training set( base
d’apprentissage).
 Lorsqu'on minimise la fonction de cout du modèle on minimise
en fait simultanément deux sources d’erreurs:
(biais) c’est l’erreur provenant d’hypothèses erronées dans
l’algorithme d'apprentissage.
 Biais élevé sous-apprentissage ou underfitting
On pourrait alors se dire qu’il suffit de développer des modèles moins
complexes avec moins de features… Et Pouf ! Plus de problème de variance !
C’est vrai, Mais on risque alors d’avoir un modèle erroné qui manque de
précision. On appelle ça Under fitting, et on dit que le modèle a un grand
biais.
 La variance c’est l’erreur du a la sensibilité de notre modèle
aux petites fluctuations de l’échantillon de l’apprentissage.
 variance élevé sur-apprentissage ou overrfitting
Le modèle B ne donne aucune erreur par rapport au Dataset, donc
d’après ce que nous avons vu, il devrait être parfait ! Pourtant, le
modèle A semble plus convaincant, alors que celui-ci donne une
Fonction Coût plus élevée.
Le modèle B souffre ici d’un problème appelé Over fitting, qui est un
phénomène très courant en Machine Learning et qu’il vous faut
absolument éviter.
Comment trouver alors le juste milieu entre biais et variance ? C’est une
des grandes questions à laquelle sont confrontés les Data Scientists
Solution: La Régularisation: permet de limiter la variance d’un

modèle sans sacrifier son biais
Différentes méthodes de validation
• validation simple : diviser les données disponibles en deux ensembles

(les ensembles d'apprentissage et de validation), sans qu'une donnée ne
soit commune (souvent on garde 2/3 des données dans l'ensemble
d'apprentissage et 1/3 pour la validation).
• Cette méthode n'est justifiable que lorsque le nombre N de données
est très important (vis-à vis de la dimension de l'espace d'entrée et de
la complexité de la relation à approximer).
• split-samples : réserve un troisième ensemble de données appelé

ensemble de test, pour tester le réseau sur des données qui n'ont jamais
été utilisées ni pour l'apprentissage ni pour la validation.
Différentes méthodes de validation
• Cross-validation: L'ensemble des données de départ est découpé en k

parties de taille égale. Le modèle est entraîné k fois, chaque fois en
utilisant k-1 parties pour l'apprentissage et la dernière pour la
validation.
Si k est de la taille de l'ensemble de départ, on parle de "leave one-out''

(car chaque apprentissage n'est validé que sur un seul exemple), sinon on
parle de "leave-v-out''.
La performance de généralisation du modèle - appelée "score de

validation croisée" - est estimée en réalisant la moyenne quadratique des
k erreurs obtenues.
• …
Validation croisée à k plis (k-fold)
Données
Apprend sur jaune, test sur rose  erreur1
k-way split Apprend sur jaune, test sur rose  erreur4

erreur =  erreuri / k
Test / Validation
 Mesurer le sur-apprentissage
 GENERALISATION
 la connaissance acquise est-elle utilisable dans des circonstances nouvelles
?
 Ne pas valider sur l'ensemble d'apprentissage !
 Validation sur ensemble de test supplémentaire
 Validation Croisée
Sur-apprentissage
Data pre-processing: Comment préparer votre
Dataset
 Il est fréquent qu’un Dataset contienne quelques anomalies, voire
des erreurs, qu’il faut supprimer pour ne pas biaiser l’apprentissage
de la machine (vous ne voudriez pas que la machine apprenne quelque
chose de faux).
 Il est aussi important de normaliser vos données, c’est-à-dire les
mettre sur une même échelle pour rendre l’apprentissage de la
machine plus rapide et aussi plus efficace
 Si vous avez des valeurs manquantes, il faut être capable de leur
assigner une valeur défaut.
 Si vous avez des features catégoriales (exemple : homme/femme) il
faut les convertir en données numériques (homme=0, femme=1).
 Egalement, il est très important de nettoyer le Dataset des features
redondantes (qui ont une forte corrélation) pour faciliter
l’apprentissage de la machine
 Typiquement, sklearn et pandas disposent des fonctions nécessaires
pour faire un bon data pre-processing. Pour charger un fichier Excel au
format csv, utiliser la librairie pandas.
 Les données doivent toujours venir de la même distribution
Le plus important, ce n’est pas l’algorithme, ce

sont les Données
Prétraitement des données
 Pour chaque paramètre on normalise
µ
Xnorm
 Ou on standardise la valeur entre 0 et 1
( )
Xstd ( ) from sklearn.preprocessing
 Codification import LabelEncoder,
OneHotEncoder
from sklearn.preprocessing import Imputer

 Les données manquantes
Résumé
 Attention à votre fonction de coût :
 qu’est-ce qui importe pour la mesure de performance ?
 Données rares :
 Attention à la répartition entre données d’apprentissage et données test.
Validation croisée.
 N’oubliez pas l’ensemble de validation
 L’évaluation est très importante

 Ayez l’esprit critique
 Convainquez-vous vous même !
Machine learning avec Python
Conclusion
Il convient de retenir quelques étapes simples à effectuer dans l’ordre :
 Récupération des données à analyser. Cette étape semble triviale mais est souvent celle qui
prend plus de temps… Si vous souhaitez faire de la reconnaissance de visages, vous allez devoir
prendre/disposer de photos de milliers de visages pour (prétendre) avoir un classifieur
performant.
 Sélection des caractéristiques. les données brutes sont souvent inexploitables, il faut
procéder à un prétraitement des données afin d’extraire les caractéristiques des données
pertinentes pour la prise de décision autrement appelées caractéristiques (features).
Cette extraction de caractéristiques (feature selection) fait souvent appel au bon sens, à des
facteurs de corrélation statistiques ou à des itérations successives (choix empirique).
 Choix du modèle. Comme pour la sélection des features, il n’y a pas de méthodes
automatiques. Cela dépend en grande partie des données à analyser et de facteurs empiriques.
 Entraînement du modèle. Pour chaque modèle, il existe un algorithme d’entraînement. Cette
étape prend souvent beaucoup de temps et augmente avec la taille des données d’entrée.
 Evaluation du modèle. En général, on procède par validation croisée. Une des déclinaisons
de cette méthode consiste à découper l’ensemble de données en deux, d’entraîner le modèle avec
la première moitié et de tester le modèle sur la seconde moitié. On calcule ensuite plusieurs
indicateurs pour évaluer le modèle, en particulier sa précision (nombre de bonnes prévisions
divisées par le nombre total de prévisions).

Chapitre1 ML

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Chapitre1 ML

Transféré par

Droits d'auteur :

Formats disponibles

Université Moulay Ismail Meknès

Faculté des Sciences Meknès

 Resituez le Machine Learning au sein de la Data Science

 Identifiez les possibilités du Machine Learning

 Identifiez les techniques et outils du Machine Learning

 Entraînez quelques algorithmes du Machine Learning

 Identifiez les limites du Machine Learning

 Chapitre1:Introduction à l’apprentissage automatique

 Pourquoi le Machine Learning est vraiment utile

 La définition du Machine Learning

 Les 3 méthodes d’apprentissage

 Les 4 notions clefs qui s’appliquent à tout le Machine Learning

Qu’est ce que la machine Learning?

Est la science (et l’art) de programmer les

 Grâce au Machine Learning, des millions de cancers peuvent être

Nous, les êtres humains, sommes quotidiennement confronté à des

Le Machine Learning a justement été inventé pour venir débloquer la

Le Machine Learning consiste à laisser l’ordinateur apprendre quel

 Apprend à marcher, à parler

Machine Learning(apprentissage machine)

"Donner la capacité aux machines d'apprendre sans les programmer

 Exemple: La reconnaissance optique de caractères (OCR)

 Par énumération de règles?

 1er application en ML: filtre anti-spam

Data Mining : retraiter les données déjà connues pour en

Machine Learning : apprendre aux systèmes à prédire ce

On distingue Les données dites privées et des données dites publiques:

- Les données publiques, c’est-à-dire accessibles à tous. Dans ce cas, vous

• Les open API (Application Programming Interface), qui sont des

Les données quantitatives continues, qui peuvent prendre n’importe quelle

Les données quantitatives discrètes, qui ne peuvent prendre qu’un

les données qualitatives nominales (ou catégorielles), dont les modalités ne

Qualitatives ordinales Égalité/ différence,

 Le rôle du professeur ou du livre de traduction sera de superviser votre apprentissage en

Pour maîtriser l’apprentissage supervisé, il faut absolument comprendre

un Dataset qui regroupe des exemples d’appartements avec leur prix

On note a,b,c les paramètres du modelé

Apprentissage: optimisation des paramètres pour minimiser la

Généralisation: estimer de bonnes réponses pour des x inconnues

Dans un problème de classification, on cherche à classer un objet dans

Dans les problèmes de régression, on cherche à prédire la valeur d’une

Plus il y a de features disponibles, plus il existe

Classes désirées inconnues, exemples connus

La phase d’entraînement : la machine(le programme) apprend une

La phase de test : Les performances de la machine sont mesurées sur

L'idée du test est de vérifier la qualité de la procédure de classification

 Il est impossible d’effectuer un apprentissage sans poser un

 Biais élevé sous-apprentissage ou underfitting

 variance élevé sur-apprentissage ou overrfitting

Solution: La Régularisation: permet de limiter la variance d’un

• validation simple : diviser les données disponibles en deux ensembles

• split-samples : réserve un troisième ensemble de données appelé

• Cross-validation: L'ensemble des données de départ est découpé en k

Si k est de la taille de l'ensemble de départ, on parle de "leave one-out''

La performance de généralisation du modèle - appelée "score de

Apprend sur jaune, test sur rose  erreur1

Apprend sur jaune, test sur rose  erreur2

Apprend sur jaune, test sur rose  erreur3

k-way split Apprend sur jaune, test sur rose  erreur4

Apprend sur jaune, test sur rose  erreur5

Apprend sur jaune, test sur rose  erreur6

Apprend sur jaune, test sur rose  erreur7

Apprend sur jaune, test sur rose  erreur8