IA Version 5 Mon Cours Éléve Très Réduit

L’intelligence artificielle (IA)
-Machine Learning-
1) Introduction à l’IA :
 Définition de l’intelligence artificielle IA :
L’intelligence artificielle (IA) (en anglais, Artificial Intelligence - AI) est l’ensemble des
théories et des techniques mises en œuvre en vue de réaliser des machines capables de simuler
l’intelligence humaine.
L’intelligence artificielle (IA) consiste à imiter l’intelligence de l’être humain, en implantant
un algorithme (programme) qui donne à la machine la capacité d’apprendre.
 Champs d'application de l'IA :
L'intelligence artificielle est utilisée dans plusieurs domaines tels que :
- Domaine de la banque : systèmes experts d'évaluation de risque lié à l'octroi d'un crédit ;
- Domaine militaire : systèmes autonomes tels que les drones ;
- Domaine des jeux ;
- Domaine de la médecine : systèmes experts d'aide au diagnostic (mieux interpréter les
radiographies que les médecins (Détection d’une personne atteinte du COVID19 )) ;
Médecine prédictive : Diabète en fonction analyse sanguin, du chrome et ….
Tumeur en fonction de l’âge, dimensions, genre, analyse sanguin…;
- Domaine de la logistique : résolution de problème de satisfaction de contraintes, assistance

au diagnostic (appareils, voitures…);
- Maintenance prédictive : des pièces susceptibles de se détériorer.
Exemples de problèmes d'intelligence artificielle :
- Le dialogue automatique : se faire comprendre d'un ordinateur en lui parlant ;

- la traduction automatique, si possible en temps réel ou très légèrement différé ;
- l'apprentissage automatique (conduire des voitures, créer (musique, peinture, meubles));
- la reconnaissance de formes, des visages et la vision en général (ex : Imaginer une partie
manquante d'une photographie, Détection du contenu d’une image);
- l'aide à la décision ;
- l'assistance par des machines dans les tâches dangereuses, ou demandant une grande
précision.
1
 IA dans le cadre des sciences de l'ingénieur :
Au programme de SII, on désigne par le terme d'Intelligence Artificielle des méthodes

permettant :
- d'effectuer une prise de décision (aussi appelée prédiction) à partir de la reproduction
d'un comportement ;
- d’observer sur des données réelles, et non à partir d'un modèle de connaissance choisi
par un humain.
Ces données peuvent être :
- Des mesures temporelles (exemple : mesure de la vitesse de rotation et de la tension
d'alimentation d'un moteur à différents instants).
- Des données statiques décrivant les performances d'un système (exemples : erreur statique
mesurée pour différents réglages de correcteurs, rendement d'un système mesuré avec
différents choix de composants...)
A partir de ces données, on souhaite apprendre un modèle permettant de prévoir des grandeurs qui
seraient longues / difficiles à obtenir par l'intervention d'un humain. Il sera donc nécessaire de
constituer une base de données d'entrainement obtenue en effectuant un suffisamment grand
nombre d'expériences, et l'utiliser pour entraîner une fonction de prédiction répliquant le
comportement observé sur ces exemples d'entraînement et pouvant alors effectuer des prédictions
à partir de nouvelles données.
 Définition du Machine Learning : L'apprentissage machine ou L'apprentissage

automatisé
Le machine Learning correspond à un ensemble d'algorithmes utilisables pour obtenir une

intelligence artificielle. Le ML est un domaine de l’IA qui consiste à implanter un algorithme
(programme) qui donne à une machine la capacité d’apprendre à réaliser des tâches.
Exemple :
Pour créer un programme avec lequel dialoguer en fonction de vos besoins, les questions à
poser à l'utilisateur sont préenregistrées et en fonction des réponses, l'algorithme suit une logique
pré-programmée (programmation à base d'instructions conditionnelles) pour vous poser d'autres
questions. Ce genre d'intelligence nécessite d'avoir une base de connaissance importante si on ne
veut pas que l'algorithme tourne en rond rapidement.
En ML de l’IA on peut parler de deux grandes phases:

Le programme apprend par des exemples (par des situations) qui sont donnés
dans une base (ou table) de données (Dataset) ; afin de développer un modèle qui
effectue une approximation de la réalité. (phase d’apprentissage).
La machine peut également faire des prédictions sur de nouvelles données qui
ne sont pas fournies dans la phase d’apprentissage. Ceci se fait par un modèle qui
effectue une approximation de la réalité, en se basant sur les informations
données par la base de données. (phase de prédiction ou d’inférence).
2
La différence entre l’algorithme classique et l’algorithme d’apprentissage :
Exemple :
Ingrédients Recette Tarte
Exemple Tarte :
Ingrédients Recette
Apprentissage
Des Tartes
Algorithme d’apprentissage
Recette
Autres Ingrédients Nouvelle Tarte
 Pour le Machine Learning ML on a besoin de :
*) Données (Base de données) ;

*) Algorithme d’apprentissage (Entrainement) ;
*) Nouvelles entrées (pour la prédiction).
3
2) Modes d’apprentissage :
Pour donner à un ordinateur la capacité d’apprendre, on utilise des méthodes d’apprentissage qui
sont fortement inspirées de la façon dont nous, les êtres humains, apprenons à faire des choses.
Parmi ces méthodes, on a les 3 modes d’apprentissage suivants :
 Apprentissage supervisé (Supervised Learning SL)

 Apprentissage non supervisé (Unsupervised Learning UL)
 Apprentissage par renforcement (Reinforcement Learning RL : Hors
programme)
2-1) L’apprentissage supervisé (Supervised Learning) :
C’est un apprentissage à partir d’une base de données (informations) d’entraînement (Dataset)

qui est constituée d’un nombre de « n » exemples qui sont des paires d’entrées et de leurs sorties
(xi , yi ) . La machine reçoit des données caractérisées par des variables xi et annotées d’une
variable i , on parle de données avec étiquettes.
 La variable yi porte le nom de target (la cible ou sortie). C’est la valeur que l’on
cherche à prédire.
4
 La variable xi porte le nom de features (caractéristiques) que l’on regroupe dans
une matrice.
Si la sortie contient des réels, on parle de régression, si la sortie est un ensemble de
groupement, on parle de classification.
L'apprentissage supervisé avec la classification permet de labelliser des objets comme des images
et la régression permet de réaliser des prévisions sur des valeurs numériques. L'apprentissage est
supervisé car il exploite des bases de données d'entraînement qui contiennent des labels ou des
données contenant les réponses aux questions que l'on se pose. En gros, le système exploite des
exemples et acquiert la capacité à les généraliser ensuite sur de nouvelles données de production.
5
2.1.1 Régression
Les valeurs des sorties appartiennent à l’ensemble IR (réel).
2.1.1.1 Apprentissage supervisé : Régression Monovariable
Surface Prix
x y
1
2
3
4
5
m:
étiquettes
6
2.1.1.2 Apprentissage supervisé : Régression Multivariable
Features: variables d’un appartement Target(Sortie)
Surface Age chambres étage Prix
x1 x2 x3 X4 y
1
2
3
4
5
m:
etiquettes
Prédire :
 Prix d’une maison en fonction de la surface, …. ;

 Température en fonction de pression CO2, CFC…. ;
 Le prix des actions dans les bourses ;
 La vitesse d’écoulement de l’air en fonction de la surface, la géométrie, l’inclinaison du
corps…
 La production d’une ferme en fonction de la quantité d’eau, les périodes de pluies, la
température…
2.1.2 Classification :
Les valeurs des sorties appartiennent à des classes, valeurs discrètes (ne sont pas continues).
Features: variables d’une personne Target(sortie)

Genre(M/F) Age Taille[ m] Poids [Kg] Classe
x1 x2 x3 X4 y
1 Tennis
2 Foot
3 Volley
4 Basket
5 Foot
Foot
Volley
Tennis
m: étiquettes Basket
7
Exemples de sorties (target) :
 Triangles, carrés, ronds, étoiles.

 Foot, basket, volley, tennis.
 Rouge, verte, bleu.
 Chiffres: 0, 1, 2,….., 9.
 Lettres: a, b, c,…….., z.
 Cas particuliers:
Message email : spam oui / non ;
Analyse médicale (chrome, zinc, globules rouges, ..): diabète oui / non.
Photos : chat oui / non ;
IRM : Tumeur Benigne/tumeur maline ;
IRM : Covid OUI/ NON ;
Vrai/Faux; Oui/Non; 0 /1.
Quelques représentations :
Apprentissage supervisé
Bénigne
Maligne
Taille tumeur
Figure : Une seule Variable : la taille de la tumeur ; la sortie est la tumeur Bénigne en rouge ou Maligne en
bleu.
Apprentissage supervisé avec 2 attributs ( 2 variables)
Age
Taille tumeur
Figure : Deux variables qui sont : la taille de la tumeur et l’âge ; la sortie est la tumeur Bénigne en rouge
ou Maligne en bleu
8
Figure : 64 Entrées qui représentent la taille
de l’image (8*8=64 Pixels), la sortie le chiffre
correspondant (0…9)
Figure : Les entrées sont des emails (textes, chiffres,

symboles), la sortie : spam ou pas spam.
2.1.3 Définition mathématique de l’apprentissage supervisé :
Algorithme Modèle
Observations
étiquetées d’apprentissage prédictif
But : Apprendre un modèle prédictif.
Formalisation :
Données :
*) p variables d’entrées donc l’ensemble des données est X =
9
*) n observations (Cas) donc peut donc être considéré comme un vecteur de dimension n:
;
*) n étiquettes (leurs évaluations):
Régression :
Classification :
Cas particulier Classification binaire :
Sortie : Modèle
Inférence étant donné un
2-2) L’apprentissage non supervisé (Unsupervised Learning) :

Clustering (Regroupement)
Dans la base de donnée, on ne possède que les variables d’entrées, On ne connait pas les
sorties, on dit la base de donnée n’est pas étiquetée.
L’algorithme doit faire des regroupements sur des critères pour obtenir des similarités entre les
données, créer des clusters (partitions ou regroupement).
Exemple 1 :
10
Exemple 2 :
Classification des photos dans les téléphones, selon les paysages, les fêtes, juste des visages…
Exemple 3 :
X2
X1
2 variables X1 et X2, pas de sortie (Situation initiale d’un apprentissage non supervisé)
Les classes ne sont pas définies.
X2
X1
2 variables X1 et X2, les sorties sont regroupées en 2 classes, par l’algorithme
2-3) L’apprentissage par renforcement (Reinforcement Learning) (hors

programme des CPGE).
L’apprentissage par renforcement permet de créer une base de données en fonction de la

supervision de l’environnement (capteurs).
C'est une forme d'apprentissage supervisé incrémental qui utilise des données arrivant au fil de
temps pour modifier le comportement du système. Il est utilisé par exemple en robotique, dans les
jeux ou dans les chatbots capables de s'améliorer en fonction des réactions des utilisateurs.
Au cours du fonctionnement du système, l’algorithme donne une récompense positive à la

situation recherchée et une récompense négative à des situations non voulues. Ainsi, par
apprentissage et en fonction des récompenses le système peut savoir les bonnes tâches et les
mauvaises, en plus, à partir de la base de données enrichi par le nombre de situations, le système
peut prédire d’autres tâches.
Exemple : Les tâches d’un robot ; Le déplacement d’une voiture dans un parcours…
Remarque :
Dans le programme de CPGE, on s'intéresse à quelques algorithmes de machine Learning :

- Méthode des K- plus proches voisins (Kpp) (K- Nearest Neighbors KNN);
- Régression Linéaire (pas polynomiale) : monovariable (simple), multiple;
- Réseaux de neurones (Neural Network).
11
Cependant, ces trois algorithmes ne sont qu'une partie de l'ensemble des algorithmes possibles
pour réaliser du machine Learning.
3) Résumé :
ML
Apprentissage Apprentissage non Apprentissage par

supervisé supervisé renforcement
Clustering
Régression Classification
(Regroupement)
Régression Linéaire KNN

Réseaux de
KNN K_means neurones
Réseaux de neurones Réseaux de neurones
A-Algorithme de régression
1-Base de donnée (Dataset) :
Exemple :
Exemple 1
Surface*100 Prix*10^(6)
m2 DH 12
Variable y: Prix * 10^(6) DH
x y 10
8
1 2
6
2 5
4
2.99 7,5
2
4 8
0
5.01 9 0 2 4 6 8
6 10 Variable x: Surface * 100 en m2
Question : Prédire le prix de l’appartement de surface 4,5*100 m2
12
2- Modèle de représentation ( Juste le modèle linéaire, au programme des CPGE)
On modélise ce graphique (ou la base de donnée) par une fonction qui décrit le plus précisément
possible la relation entre y et x, avec un minimum d’erreur entre le modèle et le réel qui est donné
dans la base de données (le modèle choisi est une régression linéaire).
La précision du modèle sera évaluée par le calcul de l’erreur, exprimée par : RMS, RMSE, le
coefficient R2 … (L’évaluation du modèle sera développée dans le paragraphe ….)
*) Modèle linéaire
Exemple 1
12
10
0
0 1 2 3 4 5 6 7
Variable x: Surface * 100 en m2
Figure 1 : Choix du modèle linéaire.
Exemple 1
12
y = 1,5x + 1,6667
10
0
0 1 2 3 4 5 6 7
Figure 2 : Equation du modèle qui minimise l’erreur.
13
Exemple 1
12
y = 1,5x + 1,6667
10
R² = 0,9113
8
0
0 1 2 3 4 5 6 7
Figure 3 : Erreur entre réel et le modèle, évaluée par le coefficient R2.
3- Fonction coût
Le coût d’un modèle est une fonction qui détermine l’erreur entre le réel (tableau des données) et le modèle
choisi (dans notre cas modèle linéaire), donc la fonction coût est liée à l’erreur.
Minimiser la fonction coût revient à minimser l’erreur entre le modèle et le réel. Elle permet de déterminer
les paramètres a et b qui minimisent cette erreur, la fonction coût évalue donc le modèle choisi.
Meilleurs paramètres ===> Erreur minimale ===> meilleur modèle.
f(x) = a.x+b
Figure 10 : Erreurs entre le modeèle et le réel
14
La fonction coût est liée à l’erreur globale de tous les points, définie soit par :
*)
*) ( y - f(x) )2 : Norme Euclidienne
Somme des erreurs quadratiques
: Error Somme Squared: la somme des erreurs quadratiques
Rappel : yi : le réel (vrai valeur de xi), f(xi) = a.xi+b :le modèle (qui sera utilisé pour la prédiction)
*) Erreur quadratique moyenne MSE (Mean Squared Error)
La fonction coût :
MSE : Mean Squared Error, l’erreur quadratique moyenne
*) Racine de l’erreur quadratique moyenne RMSE :
RMSE : Root Mean Squared Error, racine de l’erreur quadratique moyenne
*) Erreur carrée relative (RSE) et R2
RSE : Relative Squared Error, l’erreur carrée relative
le coefficient de détermination noté: R2.
R2= 1- RSE ; le modèle idéal donne R2=1
4- Algorithme de minimisation du coût
Méthode 1 : Méthode des moindres carrés
On cherche les paramètres a et b du modèle : ou
Par la méthode des moindres carrés
on aura :
15
Application :
Surface*100 Prix*10^(6)
m2 DH Application
x y 12

10
1 2
8
2 5
6
2.99 7,5 4
4 8 2
5.01 9 0
0 1 2 3 4 5 6 7
6 10
Question : Prédire le prix de l’appartement de surface 4,5*100 m2
====================
Réponse : Par la méthode des moindres carrés, on cherche a et b.
D’oû :
16
Application
12
y = 1,5x + 1,6667
10
?
8
0
0 1 2 3 4 4,5 5 6 7
Le prix de l’appartement de surface p=4,5*100 m2 est : f(p)= 1,5*4,5+1,66667= 8,41667*10^6 Dh
NB : Méthode simple mais elle est appliquée pour une seule variable x et 2 paramètres (a,b).
Méthode 2 : Descente du gradient (Gradient descent) pour minimiser le coût (minimiser l’erreur)
L’allure de la fonction J(a,b) est :
J(a,b)
a rech
On cherche numériquement la valeur de « a » , à partir d’une valeur aléatoire initiale notée ao, qui
minimise la fonction coût et qui est le point de la tangente horizontale de la fonction convexe J(a,b), c’est la
descente du gradient :
17
pour
si
si
…….
Ainsi de suite jusqu’à retrouver
J(a,b)
ao a rech
J(a,b)
ao a1 a rech
18
J(a,b)
a1 a rech
La méthode de la descente du gradient est refaite pour le paramètre b
5- Régression linéaire multiple (multivariable)
*) Base de données Dataset
n variables d’entrées
(n=4)
Features: variables Target:

Surface âge chambres Prix
x1 x2 x3 y
1
2
3
m exemples 4
5
Matrice des entrées x et matrice des sorties Y, connues.
19
(m*n) = (m*3) (m*1)
*) Modèle Régression linéaire
de dimensions m*1
Sous forme matricielle le modèle s’écrit:
*) Fonction coût
Sous forme matricielle
20
B- Algorithme KNN (K Nearest Neighbors)
1- Introduction
L’algorithme KNN, est utilisé principalement dans la classification des données en
machine learning ML, en effet à partir d’une base de données de classification (dont la sortie
correspond à des catégories/classes), on cherche à prédir la catégorie d’une nouvelle entrée en
lui attribuant la catégorie des voisins les plus proches (Neighbors Nearest)
Exemple 1: Les valeurs des sorties appartiennent à des classes, valeurs discrètes (pas continues).

genre age Taille en m poids Classe
x1 x2 x3 X4 y
1 M 15 1.70 60 Tennis
2 M 26 1.68 70 Foot
3 F 32 1.8 75 Volley
4 M 12 1.55 58 Basket
5 F 18 1.75 69 Foot
Foot
Volley
Tennis
m: étiquettes Basket
Question : Prédire la catégorie d’une personne: F, 19 ans, 1.48m et 55Kg
Exemple 2 :

genre age Taille en m poids Classe
x1 x2 x3 X4 y
1 F 19 1.70 60
2 M 34 1.68 70
3 M 25 1.8 75
4 F 57 1.55 58
5 F 13 1.75 69
m: étiquettes
Question : Prédire la catégorie d’une personne : M, 36 ans, 1.65m et 45kg
21
2- Principe
On cherche les distances entre le point considéré et tous les autres points, puis on déduit les K
points les plus proches, après on identifie les catégories des K voisins, finalement on attribut à notre point
la catégorie du maximum des points les plus proches (K en général impair).
Exemple : Pour K=5 (On cherhche les 5 plus proches à notre point), si on a retrouvé parmi les 5 plus
proches, 3 qui ont la catégorie foot et 2 qui ont la catégorie Basket, notre point prend la catégorie foot.
Nouveau point Nouveau point
Classe A Classe B Classe A

Classe B
X2 X2
X1 X1
Avant K-NN Après K-NN
Figure : Prédiction de la catégorie d’un nouveau point par KNN.
3- Calcul des distances

Distance Euclidienne
Distance Euclidienne entre A et B est donnée par :
forme générale pour plusieurs entrées :
Exemple pour une base de données qui contient : age, taille, poids et genre comme variables
22
Distance de Manhattan
Distance de Manhattan entre A et B est donnée par :
4- Evaluation d’un modèle de classification :
La matrice de confusion (Confusion Matrix) est utilisée pour l’évaluation d’un modèle de
classification. Dans la table de données (dataset), aléatoirement, 75% de ces données sont utilisées pour
l’apprentissage et 25% sont réservées aux tests.
Pour les combinaisons des données dans le test (25% de la table), puisque on connait déjà les vraies
valeurs des sorties (réels), on peut comparer ces vraies valeurs avec les prédictions données par
l’algorithme. Ce qui permet l’évaluation de cet algorithme.
*) Etapes pour la Prédiction pour un modèle satisfait
 Introduire le nombre K de voisins (facultatif peut être défini déjà dans le programme)
 Introduire l’entrée à prédire
 Obtenir le résultat de la prédiction
NB :
o Une valeur très faible pour K, telle que K=1 ou K=2, peut être bruitée et entraîner des effets de
valeurs aberrantes dans le modèle.
o Les grandes valeurs pour K sont bonnes, mais cela peut rencontrer des difficultés du temps
d’exécution du programme.
C) RESEAUX de NEURONES :
1) Réseau de neurones naturels
La figure 2, représente les connexions entre plusieurs neurones naturels, le neurone 1 envoie les
informations, par ces dendrites qui représentent les sorties du neurone, aux synapses qui correspondent
aux entrées des autres neurones.
23
Figure 2: Connexions entre plusieurs
neurones
2) Neurone artificiel
2-1) Modèle
Un neurone artificiel, nommé : un perceptron, est inspiré du neurone naturel, la figure 3 représente un
modèle de représentation, le 1er perceptron apparait en 1956.
Le modèle représente un neurone, d’entrées A et B, et de sortie y ; un poids W1 pour l’entrée X1, et W2

pour X2, en plus d’un poids (biais) C du noyau du neurone.
y
A
y
A
C
A
A
B
A
Figure 3 : Représentation d’un neurone artificiel.
Exemple : Le modèle représente un neurone, d’entrées X1 et X2, et de sortie Z ; en plus d’un poids W1
pour l’entrée X1, un poids W2 pour X2 et un poids b du noyau.
X1
W1
Z= X1*W1+X2*W2+b
Z
b
X2
W2 24
Pour W1=0,3 ; W2= 0,2 et b= -0,4
 Pour X1=1 X2=0 on retrouve : Z = -0,1

 Pour X1=1 X2=1 on retrouve : Z = +0,1
2-2) Neurone avec fonction d’activation
2-2-1) Introduction
Le signal envoyé par le neurone actuel de sortie Z, vers le neurone suivant doit être 1 ou 0, donc la valeur
de Z qui est quelconque, doit être converti en 0 ou 1, ce qui nécessite de rajouter une fonction appelée :
Fonction d’activation qui spécifie un seuil pour obtenir la sortie correspondante.
La figure 4, présente un modèle de neurone avec une fonction d’activation (Act.) de type Heaviside, le
résultat attendu est binaire (2 catégories).
Si z 0 ==> Y=1
Si z 0 ==> Y=0
Act.
b
A
Figure 4 : Modèle d’un perceptron avec la fonction activation.
Exemple 1 :
Z= X1*W1+X2*W2+b
X1
W1
z Y =1 si z >0
b Act..
Y=0 si z 0
X2
W2
Calculer Y pour les 4 cas de X1 et X2.
avec W1= 0.3, W2= 0.2 b=-0.4

25
====> C’est la fonction ‘’ ET’’
Exemple 2 : Calculer Y pour les 4 cas de X1 et X2 avec W1= 0,4 , W2= 0,5, b= -0,3
C’est la fonction ‘’OU’’
2-2-3) Fonction d’activation SIGMOIDE (probabilité)
Fonction d’activation Sigmoide est :
Elle est appliquée au résultat Z du neurone, pour donner toujours un résultat binaire (0 ou 1) avec une
certaine probabilité, plus que la probabilité est grande plus le résultat est proche de la valeur 1.
Z= X1*W1+X2*W2+b
X1
W1
b z Y =1 si >0,5 ou P(Y=1) >50%
X2 Y=0 si < 0,5 ou P(Y=1) < 50%

W2
 X1=1 X2=1 W1=0,3 W2= 0,2 b=-0,4

On retrouve Z= +0,1
===> =0,52= 52%
===> P(Y=1) =52% >50% donc Y=1 avec une probabilité de 52%
NB : Le résultat n’est pas loin de la limite de décision, On aura aussi P(Y=0) = 1- P(Y=1)= 48%
 X1=1 X2=0 W1=0,3 W2= 0,2 b= -0,4

On retrouve Z= -0,1
===> =0,47
===> P(Y=1) = 47% pour être à 1 Ou P(Y=0) =1- P(Y=1) = 53%
donc y= 0 puisque la probabilité P(Y=0) > 50%
 X1=0 X2=1 W1=0,3 W2= 0,2 b=-0,4

On retrouve Z= -0,2
===> = 0,45 = 47%
===> P(Y=1)= 45% pour être à 1
ou P(Y=0) = 1- P(Y=1) = 55% donc y= 0
 X1=0 X2=0 W1=0,3 W2= 0,2 b=-0,4
26
On retrouve Z= -0,4
===> = 0,40 = 40%
===> P(Y=1) = 40% pour être à 1
ou P(Y=0) = 1- P(Y=1) = 60% donc y= 0
Exercice 1 :
Après entraînement d’un modèle prédictif, on affiché la matrice de confusion associée aux
prédictions sur la base de données de validation.
Matrice de confusion sans normalisation :
0-
1-
2-
3-
4-
5-
6-
True label
7-
8-
9-
0 1 2 3 4 5 6 7 8 9
Predicted label
Q1.Quel type de problème d'apprentissage est adressé ici ?

Q2. Proposer une métrique permettant de mesurer la performance de ce système.
Q3) Calculer la justesse ?
Q4) Dresser la matrice de confusion normalisée. Conclure.
27
28

IA Version 5 Mon Cours Éléve Très Réduit

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

IA Version 5 Mon Cours Éléve Très Réduit

Transféré par

Droits d'auteur :

Formats disponibles

L’intelligence artificielle (IA)

 Champs d'application de l'IA :

L'intelligence artificielle est utilisée dans plusieurs domaines tels que :

Médecine prédictive : Diabète en fonction analyse sanguin, du chrome et ….

Tumeur en fonction de l’âge, dimensions, genre, analyse sanguin…;

- Domaine de la logistique : résolution de problème de satisfaction de contraintes, assistance

- Maintenance prédictive : des pièces susceptibles de se détériorer.

Exemples de problèmes d'intelligence artificielle :

- Le dialogue automatique : se faire comprendre d'un ordinateur en lui parlant ;

Au programme de SII, on désigne par le terme d'Intelligence Artificielle des méthodes

 Définition du Machine Learning : L'apprentissage machine ou L'apprentissage

Le machine Learning correspond à un ensemble d'algorithmes utilisables pour obtenir une

En ML de l’IA on peut parler de deux grandes phases:

Ingrédients Recette Tarte

 Pour le Machine Learning ML on a besoin de :

*) Données (Base de données) ;

 Apprentissage supervisé (Supervised Learning SL)

2-1) L’apprentissage supervisé (Supervised Learning) :

C’est un apprentissage à partir d’une base de données (informations) d’entraînement (Dataset)

2.1.1.1 Apprentissage supervisé : Régression Monovariable

 Prix d’une maison en fonction de la surface, …. ;

Features: variables d’une personne Target(sortie)

 Triangles, carrés, ronds, étoiles.

Apprentissage supervisé avec 2 attributs ( 2 variables)

Figure : Les entrées sont des emails (textes, chiffres,

2.1.3 Définition mathématique de l’apprentissage supervisé :

But : Apprendre un modèle prédictif.

*) p variables d’entrées donc l’ensemble des données est X =

*) n étiquettes (leurs évaluations):

Cas particulier Classification binaire :

Inférence étant donné un

2-2) L’apprentissage non supervisé (Unsupervised Learning) :

2-3) L’apprentissage par renforcement (Reinforcement Learning) (hors

L’apprentissage par renforcement permet de créer une base de données en fonction de la

Au cours du fonctionnement du système, l’algorithme donne une récompense positive à la

Dans le programme de CPGE, on s'intéresse à quelques algorithmes de machine Learning :

Apprentissage Apprentissage non Apprentissage par

Régression Linéaire KNN

Question : Prédire le prix de l’appartement de surface 4,5*100 m2

Figure 1 : Choix du modèle linéaire.

Figure 2 : Equation du modèle qui minimise l’erreur.

Figure 3 : Erreur entre réel et le modèle, évaluée par le coefficient R2.

Meilleurs paramètres ===> Erreur minimale ===> meilleur modèle.

Figure 10 : Erreurs entre le modeèle et le réel

*) ( y - f(x) )2 : Norme Euclidienne

Somme des erreurs quadratiques

: Error Somme Squared: la somme des erreurs quadratiques

*) Erreur quadratique moyenne MSE (Mean Squared Error)

MSE : Mean Squared Error, l’erreur quadratique moyenne

*) Racine de l’erreur quadratique moyenne RMSE :

RMSE : Root Mean Squared Error, racine de l’erreur quadratique moyenne

*) Erreur carrée relative (RSE) et R2

RSE : Relative Squared Error, l’erreur carrée relative

le coefficient de détermination noté: R2.

R2= 1- RSE ; le modèle idéal donne R2=1

4- Algorithme de minimisation du coût

Méthode 1 : Méthode des moindres carrés

On cherche les paramètres a et b du modèle : ou

Par la méthode des moindres carrés

Variable y: Prix * 10^(6) DH

Question : Prédire le prix de l’appartement de surface 4,5*100 m2

Réponse : Par la méthode des moindres carrés, on cherche a et b.

Le prix de l’appartement de surface p=4,5*100 m2 est : f(p)= 1,5*4,5+1,66667= 8,41667*10^6 Dh

Le prix de l’appartement de surface p=4,5100 m2 est : f(p)= 1,54,5+1,66667= 8,41667*10^6 Dh