IA 2020 Halahala

Intelligence Artificielle &
Apprentissage Automatique
LISI3
Hala Bezine
Maître de Conf., FS-Sfax
hala.bezine@fss.rnu.tn
A.U.: 2022-2023 H. Bezine 1

Plan du cours
I. Partie A; Fondements de l’IA
1. Introduction à l’IA
2. Représentation des connaissances et résolution de problèmes
2.1 Formalisation d’un Problème
2.2 Stratégies de Résolution
2.3 Notion d’Heuristiques et l’algorithme A*
2.4 Jeux Stratégiques de Recherche Min-Max & Alpha-Beta
II. Partie B; Introduction à l’AA
Hala Bezine Machine Learning & Intelligence Artificielle

Introduction
L’intelligence artificielle VS machine learning et DEEP learning
Intelligence Artificielle
Machine learning
Deep learning

Introduction
Qu’est-ce que c’est l’Intelligence Artificielle ?

« L’intelligence artificielle IA est la science qui consiste à aboutir à des
1
machines capables de reproduire ce que l’Homme fait moyennant une
certaine intelligence » M. Minsky.
2 « L’ IA est le domaine de l’informatique qui étudie comment faire à

l’ordinateur des tâches pour lesquelles l’Homme est aujourd’hui encore
le meilleur. » E. Rich.
3 « L’IA est l’étude des idées et des faits qui permettent aux ordinateurs
d’être intelligents » P. H. Winston.
« L’IA est l’étude des facultés mentales à l’aide de modèles de type

4
calculatoire » McDermott & Charniak

Introduction

 L’IA est l’étude des moyens pour que l’ordinateur accomplisse des
tâches qui sont actuellement mieux réalisées par les Humains.
 C’est l’étude des facultés mentales et la compréhension de la nature
de l’intelligence Humaine en construisant des programme imitant
cette dernière.
 Concevoir des systèmes capables de reproduire le comportement
de l’Humain dans ses habilités et activités de raisonnement.
 L’IA concerne la conception d’un être artificiel (machine) capable de
posséder ou d’exhiber les capacités et caractéristiques propres à un
cerveau Humain.
 Apprendre aux machines à penser.

Introduction; IA et Science Cognitive

Introduction
l’Intelligence Artificielle est une Branche de l’Informatique

Introduction
l’Intelligence Artificielle est Une Science/ Une technique

Définitions de l’IA

Comment aboutir ça?

Comment aboutir ça?

Introduction
Algorithmique vs non Algorithmique

 Un algorithme est une séquence finie d’instructions qui permet de
résoudre un problème en un temps fini.
 La définition de l’IA comme domaine de la programmation non

algorithmique (structure & but) est équivoque.
Caractéristiques de l’IA VS informatique classique

 Informatique plus symbolique
 Aspects plus déclaratif, moins procédural
 On privilégie la satisfaction à l’optimisation
 Données incomplètes, inexactes, conflictuelles
 La notion de représentation d’un problème est fondamentale
 Pluridisciplinaire: logique, psycho-cognitive, biologie, neurosciences,

philosophies, mathématiques …
Introduction
Réalisations
 Jeux : dames, échecs
 Diagnostic : médical, spatial, industriel
 Contrôle flow (débit) : véhicules, caméras
 Aide à la décision : banque, assurance, conduite de procédé, domaine

militaire
 Reconnaissance de la parole, dictée vocale, télématique
 Traitement de la langue écrite : compréhension, traduction
 Lecture optique (OCR)
 Interprétation de signaux : surveillance, conduite
 Traitement d’image et vision : inspection, imagerie médicale

Introduction
Historique
En 1956 : exécution sur machine du premier programme d’IA

développé par Newell, Shaw et Simon. Ce programme est capable de
démontrer des théorèmes de la logique des prépositions.
Le terme et le domaine d’ IA est proposé et accepté pendant cette
même année par la communauté scientifique en tant que nouvelle science.
Beaucoup de travaux autour de cette nouvelle thématique : Jeux
d’échecs, démonstration de théorème, traitement du langage naturel,
traduction automatique, etc…
naissance des langages de programmation adaptés. Tel que, le
langage LISP, le plus utilisé en IA, créé en 1960 par John McCarthey.

Introduction
Historique
 Programmes capables de jouer aux échecs (premières idées en 1950 par
Shannon!) -> première victoire sur un maître en 1997 Deep Blue bat
Kasparov
 1957 :
 GPS (General Problem Solver)
 NSS ( jeu d'échecs)
 Test « d’intelligence » (Evans 1963) : trouver la suite d’une série de figures.
 Résolution de problèmes par propagation de contraintes (Waltz 1975)
 Dialogue en « langage naturel » (Eliza, Weizenbaum 1965) (Système

SHRDLU, Winograd 1971)

Introduction
Les domaines concernés par l'IA Perception
Tâches
routinières Vision
Parole naturels
Tâches
formelles
Réseaux
neuroniques
Systèmes
experts

Présentation des Problèmes
Introduction
Langages de programmation pour l’IA ?

Introduction
Les domaines concernés par l'IA

Introduction

 Tâches formelles
 Jeux
 Échecs
 Dames
 Mathématiques
 Géométrie
 Logique
 Calcul intégral
 Preuves de théorèmes

Introduction
 Systèmes experts
 Ingénierie
 Conception
 Réparation
 Planification industrielle
 Analyse scientifique
 Diagnostic médical
 Analyse financière

Introduction

 Réseaux neuromimétiques
 Classification
 Apprentissage supervisé et non-supervisé
 Perceptrons multicouches
 Réseaux auto-organisés
 Simulations biologiques
 Imagerie et reconnaissance de formes

Introduction
Applications de l’IA
 Les systèmes experts

 La reconnaissance de la parole;
 Les interfaces homme-machine;
 La vision par ordinateur;
 La robotique;
 La productique;
 Tâches assistées par ordinateurs : CAO,GMAO,DAO,TAO,EAO,…XAO

Résolution des Problèmes
Classification des méthodes de résolution
Résolution des Problèmes; types de méthodes de résolution
Résolution des Problèmes; Notion d’Heuristique
Notion d’Heuristique
Introduction
Historique

Introduction

Les domaines d’application de l’intelligence artificielle :
Perception : Il s’agit de doter la machine de facultés de reconnaissance de la
parole, de l’écriture ou de scènes visuelles
La perception met à disposition un ensemble de facultés intellectuelles
complexes. (commander l’ordinateur oralement)
Compréhension du langage naturel : Comprendre un texte pour le cas d’ une

machine est très difficile à concevoir puisque comprendre un langage naturel,
compte tenu des liens intimes entre la pensée et le langage, c’est presque
comprendre comment fonctionne la pensée.

Introduction
Déduction et jugement : La faculté de déduire des conséquences d’un
ensemble d’énoncés est maintenant un problème largement résolu en IA, grâce
aux travaux en logique mathématique. Il est toutefois à faire pour que l’ordinateur
puisse analyser une situation complexe et faire preuve d’un jugement.
Résolution de problèmes, planification : De nombreuses méthodes
générales de résolutions de problèmes ont été développées. Souvent on se sert
des heuristiques qui sont des méthodes permettant de guider la recherche dans
les solutions plausibles les plus favorables pour atteindre une solution.
Apprentissage : C’est le fait de faire apprendre à la machine des
connaissances. D’ou l’idée de créer des programmes qui génèrent leurs propres
connaissances, en se modifiant à partir de leurs succès et leurs erreurs.

Introduction

Représentation des connaissances : Tous les domaines de
l’intelligence artificielle impliquent que l’on construit et que l’on transforme des
connaissances de divers types. La façon dont ces connaissances seront
représentées dans l’ordinateur constitue certainement un point central critique
pour l’évolution des systèmes artificiels intelligents.

Introduction

Pourquoi peut-on lire aisément le paragraphe suivant ?

Introduction

 Compréhension de langage et résolution de problème
 IBM et son programme pour centre d'appel
 Proverb, le programme de résolution de mots croisés
 Autonomie et planification
 Deep Space 1 , un navire spatial autonome ou presque
 Le corps par la nature, l'astronef par la NASA
 Jeux de stratégies
 Deep blue, la machine qui a battu l'homme aux échecs
 Contrôle autonome
 Meteor, le train sans conducteur
 La voiture intelligente
 L'IA et la médecine
 Le diagnostic automatique
 La chirurgie assistée par ordinateur et le simulateur d'opérations
chirurgicales

Introduction
Traitement symbolique des connaissances

 Le meilleur programme d’échec n’arrive pas à gagner les meilleurs joueurs
humains.
 Les recherches en traduction automatique ne peuvent réussir uniquement en
accumulant plus d’informations de type syntaxique.
 Les recherches en robotique se heurtent au problème de la vision qui
nécessitent le traitement d’un nombre gigantesque d’informations.
 il faut s’orienter vers l’observation plus attentive de l’être Humain pour extraire
des connaissances nécessaires et imiter son comportement.
 on commence à construire des programmes qui parvenaient à comprendre le
sens d’une phrase dans le cadre d’un sous-monde très restreint.

Introduction
Traitement symbolique des connaissances

 traduction automatique et en compréhension du langage naturel,
 développement de nombreux systèmes experts,
 progrès marqués en reconnaissances des formes,
 développement de la programmation logique et des modes de représentation
des connaissances.
On peut distinguer trois phases de développement en informatique :
 l’ordinateur traite presque exclusivement l’information numérique,
 traitements alphanumériques tels qu’on les retrouve par exemple dans le
fichier base d’une base de données,
 avec l’intelligence artificielle, on franchit une nouvelle étape où les
connaissances (faits, énoncés, équations, méthodes, etc) sont
représentées par des systèmes de symboles qu’il s’agit de les
transformer.
Représentation des
Connaissances et
Résolution de Problèmes
Représentation des connaissances et résolution de problèmes
La place de la résolution de problèmes en IA
Type de problème à étudier
Exemples de problèmes
Comment raisonner sur un problème
Les modes de représentation d’un cheminement de résolution
de problème
L’espace des états
Représentation en espaces d’états
Technique aveugle de développement de l’arbre de résolution
Techniques faisant intervenir les heuristiques
La réduction du problème en sous problèmes
La représentation en graphe ET/OU
Technique de recherche d’une solution
Lien avec l’espace des états
La place de la résolution de problèmes en IA
Définition
Un problème est une situation devant laquelle on ne voit pas directement les
étapes permettant de dépasser la situation et satisfaire un besoin.
Résoudre un problème: c’est chercher un chemin qui permet d’aller d’une

situation initiale à une situation finale pour atteindre un but.

Type de problème à étudier

Parmi les problèmes que l’on tente de faire résoudre par une machine sont :
 les jeux,
 la preuve de théorèmes.
 Au départ, nous avons cru que les ordinateurs sont capables de résoudre ces
problèmes plus vite que l’homme vue leurs capacités de mémorisation et la
rapidité de traitement de l’information. Mais puisque le nombre de chemins à
explorer pour arriver à une solution est gigantesque, la structure matérielle de
la machine reste insuffisante. Dans la plupart des cas, le joueur se base sur
des règles et des capacités stratégiques et non sur la puissance de calcul. Il
s’agit de doter la machine de telles capacités.
 La résolution de problème nécessite des techniques de l’IA fondées sur des
démarches de nature intelligente.

Les exemples d’illustration dans la résolution de problèmes sont les jeux ou la
prise de décision.
a) Le fermier, le loup, la chèvre et le chou

Ces quatre se trouvent sur la rive gauche d’une rivière. Un bateau
transporte le fermier et un des trois autres. En absence du fermier, le loup
mange la chèvre et la chèvre mange le chou. Comment faire pour passer de
la rive gauche à la rive droite sans se faire manger les uns les autres.
b) Les récipients
Nous avons un récipient de 5L plein d’eau et un récipient de 2L vide. Il s’agit
de verser de l’eau d’un récipient à un autre. Comment obtenir 1L dans le
récipient de 2L.





Un algorithme de « réparation
itérative » commence typiquement
à partir d'un placement de toutes les
dames sur l'échiquier, par exemple
avec
. Il essaie ensuite
toutes les permutations des
colonnes (il n'y a que des conflits
diagonaux à tester) pour
.
Il y a 8! = 40'320 placements à
explorer.
Placez initialement les 8 dames sur la diagonale de l'échiquier, puis
échangez deux colonnes choisies au hasard.
jusqu'à ce .
on es dames très simplement : pour chaque

colonne, on note sur quelle ligne se trouve la dame, et on lui soustrait
1. La position ci-contre sera : [1, 3, 5, 7, 2, 0, 6, 4]
• on passe très facilement d'une configuration à une configuration
voisine (qui ne satisfait pas forcément les contraintes du problème) :
il Une position voisine de celle ci-
contre pourrait être [1, 0, 5, 7, 2, 3, 6, 4].
Le taquin 3x3
Comment à partir d’une configuration initiale atteindre une autre

finale.
d) Le voyageur de commerce
Un voyageur de commerce part d’une ville et veut se rendre dans un certain
nombre de villes sans passer deux fois par la même ville et doit revenir à la
ville de départ en fin de voyage. On connaît les distances entre les villes.
Quelle est le trajet à faire en minimisant la distance

parcourue.
Jeu de Taquin
Données :
Situation de Départ D
Situation d’Arrivée A
Solution: passer de D à A
par une suite de mouvements autorisés.
Mouvements autorisés :

Jeu de Taquin

Formulation d’un Problème de Recherche
 Entrées :
• Un nœud (état) initial n0 (situation initiale)
• Une fonction But(n) qui retourne vraie ssi le but est atteint dans le
nœud n
• Une fonction de transition Successeurs (n) qui génère les nœuds
successeurs de n.
• Mémorisation des arêtes et des Sommets atteints (les marquer
comme étant visités).
 Sorties :
• Solution = Chemin dans un Graphe (séquence nœuds/transitions)
Trouver une solution consiste à trouver un chemin allant d’un état
initial vers un état final.
• Le Coût d’une solution est la somme des coûts des arêtes dans le
graphe.

Formulation d’un Problème de Recherche
• On part du principe que tous les problèmes étudiés sont composés d’un
ensemble de situations ou objets que l’on peut décrire de façon
univoque à l’aide d’un ensemble de variables appelés variables d’états
du problème.
• l’état d’un problème est alors l’ensemble des valeurs prises par les
variables à un instant donné.
• l’espace d’état d’un problème est l’ensemble de tous les états
possibles de ce problème
• On peut considérer que la résolution d’un problème est la découverte
d’un état du problème ayant des caractéristiques données (= la
solution).

Parcours dans les graphes & les arbres
Chemin Un chemin entre deux arêtes v et w d’un graphe (N;A) est une suite
C = (v; u1; : : : ; un; w) de nœuds de N tels que (v; u1) ∈ A, (ui; ui+1) ∈ A et (un;
w) ∈ A.
Si v = w, le chemin C est fermé.
Si ∀ i; j ui ≠ uj, le chemin est simple.
Un cycle est un chemin fermé simple.
Graphe non dirigé connexe ∀ i; j ∈ N ; ∃ un chemin de i à j.
Un arbre est un graphe connexe sans cycle.

Un arbre de n nœuds a donc exactement n-1 arêtes.
Tout graphe connexe contient un graphe partiel (N; A’), avec A’ ⊆ A, qui est
un arbre. On dit que l’arbre est un arbre recouvrant du graphe (en anglais
spanning tree).
Un arbre pointé est un arbre où on a distingué un sommet qcq. Ce sommet

est la racine de l’arbre.
Pour un graphe orienté, la racine de l’arbre est un nœud qui n’a pas d’arcs
entrants (il est unique).

Parcours dans les graphes & les arbres; Les éléments de base

Parcours dans les graphes & les arbres; Les éléments de base

e) Les tours de hanoï
Trois disques grand, moyen et petit enfilés sur une tige selon un ordre. On
veut les déplacer sur une tige sachant un nombre d’opérations autorisées.
f) Le singe et les bananes

Un singe affamé veut se saisir d’une banane accessible uniquement en
montant sur une caisse. Les opérations autorisées sont : se déplacer seule,
se déplacer en poussant la caisse, grimper, attraper la banane.

Méthodes de Résolution
Exacte (non informée): Aveugle, garantit la solution mais dans

un temps très grand
Approchée (informée): Intelligente, rapide trouve souvent (mais
sans garantir) la solution optimale.

Les Méthodes de Recherche Non Informées; Caractéristiques

Les Méthodes de Recherche; Caractéristiques

Les Méthodes de Recherche Non Informées; Algorithme Général

Les Méthodes de Recherche Non Informées/ Informées

Les Méthodes de Recherche Non Informées; Variantes d’Algorithmes

Recherche en Largeur; Présentation

Recherche en Largeur; Algorithme général

Recherche en Largeur; Stratégie & Algorithme

Recherche en Largeur; Algorithme

Recherche en Largeur; Exemple d’application; Navigation d’un Robot

Recherche en Largeur. Exemple d’application; Navigation d’un Robot



Recherche en Largeur; Exemple 2
A étant nœud racine Graphe non Orienté B
File A
(A A B C E C
B C D F F
C D E E D
D E
Père A A A B E
Parcours (A, B, C, D, E, F)

Recherche en Largeur ; Récapitulation

Recherche en Largeur; Récapitulation

Recherche en Profondeur ; Présentation

Recherche en Profondeur; Algorithme général

Recherche en Profondeur; Exemple d’application; Navigation d’un Robot

Recherche en Profondeur ; Récapitulation

Méthodes aveugles ; Recherche en Profondeur

Recherche en Profondeur ; Récapitulation

A étant nœud racine Graphe non Orienté B
A
F C
C E F
B B B D E D
(A A A A A
Pile
Père A B B E A
Parcours (A, B, C, E, F, D)


Méthodes aveugles ; comparaison entre les deux méthodes
• La recherche en largeur BFS; éclatement de l’espace
mémoire.
• Le DFS, ne pose pas ce problème mais il peut se bloquer
dans une branche très profonde.
• A chaque fois, de l’appel de la fonction (DFS), les
variables de l’environnement sont sauvegardés dans la
pile.
• Un problème de dépassement de mémoire (overflow), à
cause de l’empilement des variables à chaque fois dans
la mémoire, graphe très profond.
• Un compromis entre le BFS et le DFS (le DFS récursif),
il s’agit de la recherche en profondeur Itérative.

Méthodes aveugles ; Recherche en Profondeur limitée
>0

Méthodes aveugles ; Recherche en Profondeur Itérative
• On n’est pas obligé de parcourir tous les chemins en

arrière et voir les nœuds restants accessibles à partir de
la racine, tant que la solution est là.
• Solution optimale; il s’agit d’une recherche en largeur
simulé par une recherche en profondeur.
(Combinaison des deux stratégies; BFS & DFS)
Méthodes aveugles ; Recherche en Profondeur Itérative

Méthodes aveugles ; Recherche en Profondeur Incrémentale
 appelé encore la recherche en profondeur Itérative.
 Faire tourner le DFS, de plus fixer une certaine limite
pour la profondeur.
 Augmenter la limite de la profondeur fixée de +1 , et
recommencer la recherche.
 faire appel à la fonction de recherche en profondeur
limitée autant de fois que nécessaire jusqu'à y arriver à
notre solution et destination.
 c. à. d., il faut partir d’une valeur égale à 0 au début
(test sur le nœud initial).,
 Ça marche pas, on incrémente à 1, (on explore l’état
initial et les fils d’ordre 1). Si ça marche pas, on
incrémente encore à 2, … jusqu'à arriver au nœud de
destination.
Méthodes Informées
Heuristique : Représentation et résolution de problèmes

Problème des 8 reines : trouver une configuration de 8 reines sans prise sur un
échiquier. Aucune ligne, colonne, ou diagonale ne doit comporter plus d’une
reine.
 Approche par transformation de solution potentielle:
Partir d’une configuration, la tester, si elle ne constitue pas une solution, la

modifier localement, et recommencer
 Approche constructive :
Procéder à chaque étape en plaçant une Kième reine sans prise sur un
échiquier où figurent k-1 reines.

Problème des 4 couleurs : colorer une carte géographique sans que deux pays
voisins ne soient identiquement colorés.
 Approche par transformation de solution potentielle:
Partir d’une coloration complète, la tester et la modifier localement si de part

et d’autre d’une frontière on trouve la même couleur…
 Approche constructive :
colorer un kième pays, lorsque k-1 le sont déjà, en le différenciant de ses

voisins déjà colorés.
MofdiBezine
Hala DHOUIB Machine Learning
Intelligence
& Intelligence
Artificielle Artificielle
Plan de voyage : la recherche d’un itinéraire et d’un plan de voyage entre deux
points géographiquement éloignés.
 S’intéresser au moyen de quitter le local où l’on se trouve !!!
 Décomposition du problème en sous problèmes :
 Choisir le principal mode de transport et les étapes intermédiaires qu’il

impose : changement de continent, port ou aéroports de départ et
d’arrivée, …
 Le même problème se pose entre le point de départ et la première de

ces étapes, que l’on peut décomposer à son tour en recherche
d’itinéraires plus simples…

Introduction
Heuristique
 L’heuristique est le plus souvent fondée sur une simplification du problème
initial, sur une relaxation des contraintes qui font que ce problème est
difficile
 La simplification la plus grossière fournit en général l’heuristique la plus
pauvre et la moins efficace pour guider la recherche
 La simplification la plus élaborée conduit à une heuristique plus complexe à
évaluer. Le compromis est difficile à apprécier.
 La qualité d’une heuristique peut se mesurer en termes de réduction de la
complexité de la recherche:
Une heuristique h1 est préférable à h2, si dans tous les cas h1 conduit à explorer
moins d’alternatives que h2


Méthodes Informées : Meilleur d’abord/ en premier


Exemple Illustratif

Méthodes Informées : l’algorithme A*
Résolution de problèmes par recherche dans un graphe:
• Comprendre l’A* (notion d’heuristique, propriétés théoriques)

• Implémenter et simuler l’A*

Méthodes Informées : l’algorithme A*
 Si le graphe est fini, l’alg. A* termine toujours, (les coûts associés aux
différentes transitions sont strictement positifs, de même ceci étant dû à la
liste fermée, qui permet de détecter les cycles s’ ils existent.
 Si un chemin vers le but (destination) existe, dans ce cas l’Alg. A* va en trouver

un.
 La fonction h retourne toujours une estimation inférieure ou égale au coût

réel à venir, ainsi on dit que h est admissible.
 Dans ce cas l’alg. A* retourne obligatoirement un chemin optimal.
 Si l’heuristique est parfaite , l’Algo A* convergera immédiatement
vers le but (ss explorer de branches inutiles)
 Ainsi, pour s’assurer que l’Alg. A* retourne une solution optimale on peut
imposer dés le départ cette condition telle que ; f(n) =h(n) + g(n) et que h(n)
est admissible.
 A* est admissible ssi il utilise une heuristique admissible.

Méthodes Informées : algorithme A*
 Si f *(n) le coût exact pas un estimé du chemin optimal du nœud initial au

nœud but, passant par n.
 Si g*(n) le coût exact du chemin optimal du nœud initial au nœud n.
 Si h*(n) le coût exact du chemin optimal du nœud n au nœud but.
 On a donc f*(n) = g*(n) + h*(n)
 Chaque fois que l’alg. A* choisit un nœud au début de

la liste ouverte, A* a alors trouvé le chemin optimal
vers ce nœud.
Le nœud ne sera plus jamais revisité.
 Si on a deux heuristiques admissibles h1 et h2 tel que

h1(n)<h2(n), alors h2(n) conduit plus vite au but. (avec
h2, l’alg A* explore moins de nœuds avant d’arriver au
but qu’avec h1).
Algorithme A* (solutions admissibles)

Algorithme A* : Propriétés
 Complétude : un Algo. est dit complet lorsqu'il débouche sur une solution
qd il en existe une, l’Algorithme A* est complet pour tous les graphes.
 Admissibilité : un algo est dit admissible lorsqu’il donne une solution

optimale à chaque fois qu’il en existe une.
 Dominance : un Algo A1 domine un algorithme A2 si tout sommet développé

par A1 l’est aussi par A2. A1 domine strictement A2 si A1 domine A2 mais A2 ne
domine pas A1. (Algo plus efficace car il explore moins de sommets).
 Si on a deux heuristiques admissibles h1 et h2 tel que h1(n)<h2(n), alors

h2(n) conduit plus vite au but. (avec h2, l’alg A* explore moins de nœuds
avant d’arriver au but qu’avec h1).
 Optimalité : un Algorithme est optimal dans une classe d’algorithme s’il

domine tous les autres membres de sa classe.
 Dans le pire des cas la complexité en temps de l’Algo A* est égale à 2N

Jeux Stratégiques de Recherche
 Il s'agissait de modéliser les jeux à somme nulle où la somme des gains entre
les joueurs est toujours égale à zéro (2 joueurs).
 Un jeu de somme nulle est un jeu où la somme des gains et des pertes de
tous (au nombre de 2) les joueurs est égale à 0. Cela signifie donc que le gain
de l'un constitue obligatoirement une perte pour l'autre.
 L'algorithme minimax visite l'arbre de jeu pour faire remonter à la racine une
valeur (appelée « valeur du jeu ») qui est calculée récursivement de la façon
suivante :

L’Algorithme Recherche Min-Max
Les jeux à deux joueurs que nous avons évoqués précédemment ont
d’autres points communs que ceux déjà mentionnés. Ce sont tous
des jeux à information complète et à somme nulle.
 jeu à information complète

les deux joueurs ont à tout moment toute l’information sur l’état du jeu. Il
n’y a par exemple pas de carte dans la main d’un joueur que l’autre ne
connaît pas. Il en résulte que chaque joueur connaît toutes les
informations à disposition de son adversaire au moment où celui-ci doit
jouer.
 jeu à somme nulle

les gains réalisés par un joueur sont des pertes pour l’autre joueur. Il y a
donc forcément un gagnant et un perdant (ou un match nul). Mais il n’y a
pas un joueur qui gagne beaucoup et l’autre moins. Il en résulte que les
intérêts des deux joueurs sont opposés. Les meilleurs coups de jeu
pour l’un sont les pires pour l’autre.
Il existe un algorithme qui permet de faire jouer un programme à de tels
jeux. Il s’agit de l’ Alg. Min-Max que nous allons tenter de présenter
brièvement.
Puisque le jeu est à information complète chaque joueur a la possibilité (théorique)

de calculer cet arbre de jeu. Le problème qui se pose au joueur qui doit jouer, c’est-à-
dire celui qui doit choisir à partir de la situation courante initiale, est donc de choisir
une branche de l’arbre qui l’amène vers la meilleure situation finale possible, c’est-à-
dire, si possible une victoire. La question qui se pose à lui est donc :
Quel coup jouer maintenant pour gagner plus tard ?
L’objectif est donc la qualité de la situation visée “dans le futur” et non pas celle
atteinte immédiatement, et cette qualité doit être la meilleure possible. Comment faire
? Et bien comme tout joueur humain le fait, l’algorithme va “calculer des coups à
l’avance” et prendre sa décision en fonction de ces calculs.
1.Le premier principe de l’algorithme min-max est donc de déployer l’arbre de jeu et
d’attribuer une note aux situations atteintes à la fin de l’arbre : les feuilles de
l’arbre. Cette note doit refléter la qualité de la situation. Elle doit donc être croissante
avec la qualité de la situation : meilleure est la situation, plus haute est la note.
On appelle fonction d’évaluation la fonction d’attribution de la note à une situation.
La note attribuée correspond au gain espéré si l’on atteint cette situation.
Puisque seul le gain final nous intéresse, ce sont bien uniquement aux situations
positionnées en feuille de l’arbre qu’est appliquée la fonction d’évaluation.
Le problème qui se pose maintenant est de déterminer comment utiliser ces valeurs
positionnées sur les situations feuilles de l’arbre de jeu.

2. Le second principe de l’algorithme min-max est de propager vers le haut de l’arbre les
valeurs qui ont été attribuées aux situations feuilles afin d’attribuer, par propagation, une
note aux autres situations présentes au sein de l’arbre de jeu jusqu’à la situation initiale
située à la racine de l’arbre. L’objectif du joueur est donc maintenant d’attribuer une note
aux situations. Etudions un peu cette propagation.
Quand il doit choisir entre plusieurs situations l’objectif du joueur est d’atteindre la
situation avec la meilleure note. Donc supposons qu’il soit parvenu à attribuer une note
à toutes les situations immédiatement atteignables à partir de la situation courante alors
puisqu’il doit choisir l’une de ces situations il prend celle avec la plus grande note (=
meilleure qualité). Cette note devient donc celle de la situation courante, elle a pour
valeur le max des valeurs suivantes (cf. figure à droite). En effet : s’il arrive dans cette
situation, il joue au mieux donc choisit la meilleure situation possible pour lui et
obtiendra donc le gain de cette situation, qui devient le gain de la situation courante.


L’Algorithme Recherche Min-Max; algorithme

Amélioration de Min-Max; coupure alpha/Beta
 Ne pas explorer de branches inutiles.

Amélioration de Min-Max; coupure alpha/Beta

L’Algorithme Recherche Min-Max; coupure alpha/Beta




Méthodes Informées : Escalade
 Cette méthode de recherche en profondeur utilise une fonction heuristique pour
choisir à chaque étape le nœud à générer. C’est la stratégie de l’alpiniste qui
choisit la direction de la pente la plus forte pour arriver au sommet le plus vite.
 C’est une méthode de recherche locale, qui choisit un état meilleur, qui se
trouve au voisinage de l’état courant, (mais pas nécessairement le meilleur). Si
un tel voisin n’existe pas, on arrête et on retourne le nœud courant comme
solution.
 Si on arrive à un maximum local de la fonction d’évaluation (un nœud dont

l’évaluation est supérieure à tous ses successeurs), il n’ y a plus de choix
possibles et l’algorithme s’arrête, sans avoir trouvé la solution. Il faut alors
décider arbitrairement d’une reprise pour relancer la recherche au risque de
reprendre un sommet déjà visité.
 Rien ne garantie la solution (but), optimale.

Méthode:
1. Le nœud courant est initialisé au nœud initial
2. Itérativement, le nœud courant est comparé à ses successeurs
(voisins) immédiats.

Méthodes Informées : Escalade
Méthode:
1. Le nœud courant est initialisé au nœud initial

2. Itérativement, le nœud courant est comparé à ses successeurs
(voisins) immédiats.
3. Le meilleur voisin n’ ayant la plus grande valeur F(n’) et telle que
F(n’)>F(n) devient le nœud courant.
4. Si un tel voisin n’existe pas, on arrête et on retourne le nœud
courant comme solution.

Méthodes Méta-Heuristiques : récuit simulé

Introduction
Les domaines actuels de l'IA

 Machine Learning, reinforcement learning
 Datamining : classification supervisée et non supervisée; combinaison de

classificateurs
 Vision artificielle, reconnaissance des formes
 Reconnaissance et traitement de la parole, sens commun
 Définition de méthodes métaheuristiques : ants algorithm, local search,

algorithme génétique
 Systèmes multiagents (intelligence distribuée, planification multiagents)
 Agents intelligents (sur internet); Objets Intelligents
 Programmation automatique
 Philosophie de l’Esprit : Hard Problem of consciousness

Introduction
Les domaines actuels de l'IA
 Robotique sensorielle (Cog, Kismet)
 Artificial Life
 Chimie computationnelle
 Etude du chaos dans les réseaux de neurones
 Evolutionary robotics

Introduction
Hala Bezine Machine Learning

Intelligence
& Intelligence
Introduction

Introduction

Introduction

Intelligence
& Intelligence
Apprentissage par renforcement

Introduction

Introduction

Intelligence
& Intelligence
Introduction

Introduction

Intelligence
& Intelligence
Introduction

Processus de ML

Traitement des données « data preprocessing »

Machine Learning process

Machine Learning process
Introduction, définition, Historique
Classification des réseaux de neurones
1 En fonction du mode d’apprentissage

supervisé / non supervisé
En fonction de la fonction réalisée
2 Extraction primitives /Décision /Extraction-Décision
3 En fonction de l’architecture/mode de connexion, etc…

Généralités: Modes d’apprentissage
Supervisé Non Supervisé
Exemples : (x1, d1) ... (xm, dm) Exemples : x1, ..., xm
Architecture : A Architecture : A
Poids initiaux : W° Poids initiaux : W°
TROUVER DES POIDS W (et éventuellement modifier A)

POUR QUE :
Supervisé Non Supervisé
Interpolation : dk = FA,W (xk) pour k=1, - - Les images des exemples sont
..., m bien groupées
- Généralisation : d = FA,W (x) - Les images des nouveaux

pour de nouveaux couples (x, d) exemples
sont "proches "de leurs semblables.
H. Bezine 132
Apprentissage Supervisé et non Supervisé
 L'apprentissage supervisé est l'adaptation des coefficients

synaptiques d'un réseau afin que pour chaque exemple, la
sortie du réseau corresponde à la sortie désirée.
 FONCTION DE COÛT: problème de minimisation

Soient n exemples (Xp; Dp) et Yp la sortie donnée par le réseau
On définit l'erreur qui peut être quadratique de la forme
E(W)=∑(Yp-Dp)2
 L'apprentissage revient à déterminer W =ArgMin(E).

En général, on utilise des méthodes de gradient, total, partiel
ou stochastique : W (t +1)= W (t)- grad (E)

Discrimination Linéaire
X v.a. à valeurs dans R d (d caractéristiques)

d
frontière de décision linéaire :  w j x j  b  0
j 1
règle de décision linéaire
d
 j 1
wj x j  b  0 (ronds rouges)
d
 wj x j  b  0 (croix verte) +
 j 1 + +
+ + +
+ +
 x1   w1  +
 ...   ...  + + +
+
   
x   x j  , w   w j  , frontière de décision : w' x  b  0
 ...   ... 
   
 xd  Codage {-1,1},
 wd fonction de décision de type « heaviside SEUIL »
Discrimination Linéaire par un seul neurone (Séparation Linéaire)
Y W.X<0
W.X
W.X>0
Fonction type (Seuil Heaviside)

loi d'apprentissage :
• Wk+1 = Wk + h eq(k) * Xk
• Wk+1 = Wk si X bien classé
• Convergence de l'algorithme dans le cas séparable
• Impossible de savoir si un problème est non séparable.
H. Bezine 135
Neurone formel : Neurone de perceptron
Le neurone formel de McCulloch&Pitts
.AND
. OR
? .AND
.…....
.XOR.
Fonctions
logiques

Version circuit à seuil
x1 
1
a y
xn  
wn q
N
w x
Circuit à seuil
a  XW  T
n n
n 1 xN 
wN
 1 si a  q
y   Combinateur linéaire adaptatif
 0 sinon.
Modèle du neurone formel de
McCulloch & Pitts 1943
Intelligence
& Intelligence
Exemplesde Fonctions
x1  x1 
w1=+1  q   1.5 w1=+1  q -1.5
x2  x2 
w2=+1 ET w2=+1 OU
x1 x2 Sortie ET Sortie OU
0 0 0 0
0 1 0 1
1 0 0 1
1 1 1 1
Hala Bezine Intelligence Artificielle

Apprentissage des poids synaptiques
1  deux classes C1 et C2
Apprentissage ? linéairement séparables
Surface de séparation :
2 N
q   wn xn  
3 Apprentissage
n 1
Base d’exemples
(Xk, d(k)) Estimer wn et q
d(k) = {0,1} ou {-1,+1}
H. Bezine 139
Principe de propagation et MLP

Principe de propagation et MLP



Apprentissage des poids synaptiques ; Algorithme du GD stochastique

Deep Learning « apprentissage profond »
Qu’est ce que le Deep learning ?
C’est une branche du machine learning qui s’appuyant sur les réseaux de
neurones (plusieurs couches)
Il est préférable quand on parle d’IA de parler de machine learning et de deep

learning
L’apprentissage profond (deep learning) est une notion issue du fait que les
réseaux neurones disposaient de plus en plus de couches cachées et que
le nombres élevés de couches devenait une source de problèmes. En effet,
à partir d’un nombre de couches, le réseau neuronal n’était plus capable
d’assimiler les informations et d’apprendre correctement.

Intelligence
& Intelligence
Types de Fonctions d’activation en DL
 Non Linéaires
 ReLu;
 Unité de Rectification Linéaire, augmente
les chances de converger du réseau, et ne
provoque pas de saturation des neurones
comme pour les deux fonctions
précédentes.

Architecture d’un DNN et processus d’apprentissage

CNN

CNN & caractéristiques
Réseaux convolutionnels CNN sont des réseaux avec des "champs de

réception" se chevauchant effectuant des tâches de convolution.
Les réseaux de neurones convolutifs (CNN) sont conçus pour

reconnaître les images. Il a des circonvolutions à l'intérieur, qui voient
les bords d'un objet reconnu sur l'image.
1.CNN prend des entrées de taille fixe et génère des sorties de taille
fixe.
2.CNN est un type de réseau de neurones artificiels à action directe -
sont des variantes de perceptrons multicouches qui sont conçus pour
utiliser des quantités minimales de prétraitement.
3.Les CNN utilisent un modèle de connectivité entre ses neurones et
s'inspirent de l'organisation du cortex visuel animal, dont les
neurones individuels sont disposés de manière à répondre aux régions
qui se chevauchent et qui recouvrent le champ visuel.
4.Les CNN sont idéaux pour les images et le traitement vidéo.
5.Les couches Conv. Utilisent des filtres qui scannent l’entrée I suivant
ses dimensions en utilisant des opérations de convolutions. La sortie O
est appelée « Feature Map »

Architecture d’un CNN et processus d’apprentissage
1. Le processus d’apprentissage d’un DNN est la descente de Gradient

Stochastique (SGD)
2. Minimisation du Gradient de l’erreur.
3.CNN est un type de réseau de neurones artificiels à action directe -
sont des variantes de perceptrons multicouches qui sont conçus pour
utiliser des quantités minimales de prétraitement.
4.Les CNN utilisent un modèle de connectivité entre ses neurones et
s'inspirent de l'organisation du cortex visuel animal, dont les
neurones individuels sont disposés de manière à répondre aux régions
qui se chevauchent et qui recouvrent le champ visuel.
5.Ils contiennent une ou plus. Couches convolutionnelles et Couches de
Pooling » mutualisation, qui utilisent des opérations de convolution pour
pouvoir corréler les informations spatiales, les vecteurs caractéristiques
en entrée…
6.Ces opérateurs donnent naissance à des vecteurs poids locaux au
niveau de chaque couche appelé filtre.
7.Grace à ces filtres de convolution les ens. De données sont minimisés
et l’efficacité de l ’apprentissage augmente.
8.Les couches de pooling utilisent une opération de sous-
échantillonage tjrs appliquée après une Couche de Convolution en
vue de l’aggrégation des caractéristiques locales pour mieux définir
les caractéristiques complexes.
CNN & caractéristiques
 Les types de pooling les plus utilisés sont le Max (Max de la surface) et
la Moyenne qui sélectionne la valeur Moyenne de la surface.
 Les couches de Fully Connected sont tjrs présentes dans les CNN à
la fin des architectures.

RNN & caractéristiques
Réseaux récurrents RNN sont des réseaux avec des connexions

récurrentes (allant dans la direction opposée du flux de signal "normal") qui
forment des cycles en la topologie du réseau.
Les réseaux de neurones récurrents (RNN) sont conçus pour reconnaître des
séquences, par exemple, un signal vocal ou un texte. Le réseau récurrent a
des cycles à l'intérieur qui impliquent la présence d'une mémoire courte
dans le réseau. Nous avons appliqué CNN ainsi que RNN en choisissant un
algorithme d'apprentissage automatique approprié pour classer les signaux
EEG pour BCI:
1.RNN peut gérer des longueurs d'entrée/sortie arbitraires.

2.RNN contrairement aux réseaux de neurones à action directe - peut
utiliser sa mémoire interne pour traiter des séquences arbitraires
d'entrées.
3.Les réseaux de neurones récurrents utilisent des informations
chronologiques. c'est-à-dire que ce que j'ai dit en dernier aura un impact
sur ce que je vais dire ensuite.
4.Les RNN sont idéaux pour l'analyse de texte et de parole.

CNN & RNN
Réseaux de neurones convolutifs (CNN) pour la vision par ordinateur et

réseaux de neurones récurrents (RNN) pour le traitement du langage
naturel.
Bien que cela puisse être appliqué dans d'autres domaines, les RNN ont
l'avantage de réseaux qui peuvent faire passer des signaux dans les deux
sens en introduisant des boucles dans le réseau.
Les réseaux de rétroaction sont puissants et peuvent devenir
extrêmement compliqués. Les calculs dérivés de l'entrée précédente sont
réinjectés dans le réseau, ce qui leur donne une sorte de mémoire. Les
réseaux de rétroaction sont dynamiques: leur état change continuellement
jusqu'à ce qu'ils atteignent un point d'équilibre.
En ce sens, CNN est un type de NN récursif. En revanche, le NN

récurrent est un type de NN récursif basé sur la différence de temps. Par
conséquent, à mon avis, le CNN et le NN récurrent sont différents, mais
tous deux sont dérivés du NN récursif.

Introduction

Introduction

Apprentissage profond ; Réseaux de Neurones Convolutifs (CNN)

Architecture d’un DNN

But de la Régression Linéaire

Modélisation du Problème de Régression Linéaire
 Y étant la variable à expliquer (VD)

 X1 étant la variable explicative (VI)
 A partir d’un { } de couplet (yi, x1i), de l’ordre de n, on cherche à exprimer
une relation linéaire (nuage de points alignés) entre la variable Y et X1.
 Etude des cas suivants le signe de b1

Régression Linéaire Simple
 L’{ } des points est étiré mais les points ne sont pas alignés.
 D’autres variables ayant une influence sur la variable Salaire (
dépendante) (erreurs de mesure)
 L’équation générale peut être MAJ; droite +erreur (ε)

Evaluation de la Performance de Modèles de Régression Linéaire Simple
 Critère des moindres carrés; parmi toutes les droites possibles, on

cherche la droite pour laquelle la somme des carrés des écarts
verticaux (Résidus) des points à la droite est minimale.
 La méthode des moindres Carrés fournit les coefficients estimés (b0 et b1).
Pour chaque individu, on calcule:
 𝑦𝑖 la valeur ajustée ou prédite (estimée) par le modèle (point sut la droite)

𝑦𝑖 =𝑏0 +𝑏1xi
 ei=yi - 𝑦𝑖 ; le résidu de l’observation i; c’est l’écart entre la valeur de Y

observé sur l’individu i et la valeur prédite. (résidu >0 ou <0 selon le
positionnement du point)
 On cherche à minimiser la somme des carrés des résidus pour les n

points possibles appartenant au nuage de points.
 Afin d’avoir une idée globale de la qualité d’ajustement linéaire, on définit R2

Appelé coefficient de détermination.

 𝑦 la valeur moyenne autour de laquelle varient les différentes observations yi .
 yi - 𝑦 = (yi - 𝑦𝑖 ) + (𝑦𝑖 -𝑦) ; La qualité de l’ajustement dépend de ces deux

sources de variations; la variance résiduelle ou non expliquée et la variance
expliquée par le modèle de régression.
𝑛 𝑛 𝑛
 𝑖=1(yi −𝑦)2 = 2
𝑖=1(yi −𝑦𝑖 ) +
2
𝑖=1(𝑦𝑖 −𝑦) ; la variation totale des
observations avec ; 𝑛𝑖=1(yi −𝑦𝑖 )2 ; c’est la variance résiduelle ou non
expliquée.
 Afin d’avoir une idée globale de la qualité d’ajustement linéaire, on définit R2

Appelé coefficient de détermination.

Coefficient de détermination

Evaluation de modèle de Régression

Régression Linéaire Multiple

Les Machines à vecteurs supports SVM
 Les SVM sont des séparateurs à vaste marge, une généralisation

des classifieurs linéaires.
 Les SVM élaborent une approche statistique très intéressante pour
l'approximation et l’estimation des fonctions.
 capacité à travailler avec des données de grandes dimensions, le faible
nombre d'hyperparamètres.
 Apprentissage supervisé

Les Machines à vecteurs supports; Pb de classification Linéaire
le principe des SVM, revient à la recherche d’un hyperplan identifié comme

solution d’un problème d’optimisation sous contraintes dont la fonction
objective est exprimée à l’aide de produits scalaires entre vecteurs et
dans lequel le nombre de contraintes « actives » ou vecteurs supports
contrôle la complexité du problème.

Les Machines à vecteurs supports
 The SVM idea is to maximize the distance between The hyperplane

and the closest sample point.
 In the optimal hyperplane: The distance to the closest negative
point = The distance to the closest positive point.

Choix du plan séparateur; Pb linéairement séparables)
SVM’s goal is to maximize the Margin which is twice the distance “d”
between the separating hyperplane and the closest sample.
.
The SVM approach: Linear separable case
Why it is the best?
-Robust to outliners as
we saw and thus strong
generalization ability. xi
-It proved itself to have

better performance on test
data in both practice and in
theory.

SVM et Problèmes non linéaires
 la recherche des surfaces séparatrices pour les Pbs NL revient à

l’émergence d’une fonction noyau (Kernel) dans le produit scalaire
induisant une transformation non linéaire de la dimension de l’espace vers
un espace de plus grande dimension (noyau non linéaire). Les
performances de SVM dépendent du noyau utilisé tels que les noyaux de
type : linéaire, polynomial, RBF et sigmoïde. Notons que l’utilisation de
noyaux permet d’intégrer de la non linéarité sans modifier la complexité
algorithmique du problème à résoudre.

Intelligence
& Intelligence
Représentation en espaces d’états
La représentation en espace d’états met en œuvre deux types d’entités :

 Etat : structures de données donnant la spécification d’une situation du
problème dans son évolution vers la solution (si elle existe).
 Opérateur : moyen de faire passer le problème d’un état vers un autre.
L’ensemble des états initiaux, intermédiaires et finaux d’un problème défini dans
une représentation d’espace est appelée Espace des états.

Une représentation en espace d’états d’un problème est entièrement défini par la
donnée de :
 Un ensemble des états initiaux, soit S cet ensemble.

 Un ensemble des états finaux, soit G cet ensemble.
 Un ensemble des opérateurs, soit O cet ensemble.
Trouver une solution c’est donner la liste d’opérateurs qui permettent de passer
d’un état initial vers un état final.


Exemple : Jeu de taquin (matrice 3x3). Soit l’état S suivant
Soit l’ensemble G = {ensemble des états dont la somme des chiffres des
diagonales est égale à 6 avec la case vide est au milieu}. Une des solutions
possibles est la suivante :
L’ensemble O = {H,B,G,D} avec H : Haut, c’est à dire déplacer la case vide d’une
position vers le haut. B : Bas. G : Gauche et D : Droite.
On défini l’espace des états par :
Où xi  {*,1,2,3,4,5,6,7,8} i  {1,2,…9} et xi ≠ xj  i ≠ j .
Définition : un espace d’états est l’ensemble des états initiaux + les états
finaux+ les états générés par application d’une suite d’opérateurs à partir de
l’état initial


Exemple : Voyageur de commerce.
Etant donné un ensemble de 4 villes à visiter A,B,C et D. Il s’agit de trouver un

itinéraire débutant en A et se terminant par A en ayant visiter toutes les autres villes
une seule fois.
Définir la structure de donnée représentant un état. Définir les ensembles S, G et O.
Structure : Une liste (ordonnée) des villes visitées : (x1, x2, . . . , xn)/xi ∈ {A,B,C,D}
S ={(A)}
G ={(A, x1, x2, . . . , xn,A)}/xi ∈ {B,C,D}, xi ≠ xj∀i ≠ j
={(A,B,C,D,A), (A,B,D,C,A), (A,C,B,D,A), (A,C,D,B,A),
(A,D,B,C,A), (A,D,C,B,A)}
O ={O1}

O1 Aller (ED,EA) : ED → EA/EA = ED + (xj)

Remarque : En progressant dans le graphe nous avons une explosion
combinatoire du nombre de nœud.
Techniques aveugles de développement de l’arbre de résolution
Recherche en largeur(breadth ﬁrst search)

Il s’agit de développer de façon prioritaire les nœuds situés au même niveau de
profondeur.
OUVERT : liste des nœuds apparus ou mis en évidence.
FERME : liste des nœuds développés (pour lesquels nous avons mis en évidence
les descendants éventuels).

L’algorithme de recherche peut être décrit comme suit :

Début
1. Mettre le nœud initial dans OUVERT (initialement vide)
2. Tant que OUVERT ≠ ∅ et BUT non atteint
Faire
Déterminer si la tête de OUVERT est le but
2.1 Si oui, ne rien faire
2.2 Sinon, enlever la tête de OUVERT
la mettre dans FERME
ajouter ses descendants en QUEUE de OUVERT
3. Si le BUT est atteint alors succès sinon échec
Fin

Avantages :
 Trouver une solution si elle existe
 Si l’arbre possède un nombre fini de branche alors la recherche est
dite algorithmique.
Inconvénients :
 Gourmande en espace mémoire
 Nombre de nœuds à mémoriser par niveau crois exponentiellement
 Très peu adapté à une solution admettant plusieurs chemins de
solution et la solution se trouve très loin.

Recherche en profondeur (depth ﬁrst search)
C’est une recherche fournissant les nœuds les plus récents mis en évidence.
Il s’agit d’explorer un chemin en allant vers les degrés de profondeurs
croissants.
La profondeur d’un nœud est définie par :

 profondeur du nœud initial est égale à zéro
 profondeur du nœud fils est égale à la profondeur du nœud père
plus un


L’algorithme peut s’écrire de la manière suivante :
Début
1. Mettre dans OUVERT le nœud de départ
2. Tant que OUVERT ≠ ∅ et le nœud BUT non atteint
Faire
Déterminer si le premier nœud est un nœud BUT
2.1 Si oui, ne rien faire
2.2 Sinon,
enlever le premier nœud de OUVERT
le mettre dans FERME
ajouter les descendants de nœud en tête de OUVERT
3. Si le BUT est atteint alors succès sinon échec
Fin
Mofdi DHOUIB -
Hala Bezine Intelligence
Machine Learning Artificielle Artificielle
& Intelligence
Inconvénients :
 Peut s’enforcer dans une boucle infinie. C’est pourquoi cette méthode est
dite non algorithmique.
 Pour la rendre algorithmique, nous pouvons ajouter la profondeur limitée.
Dans ce cas, la recherche se fait jusqu’à cette limite.

Techniques faisant intervenir les heuristiques
Les méthodes heuristiques viennent pour surmonter les problèmes des

méthodes systémiques qui sont :
 Peu efficaces puisqu’elles ne tiennent pas compte des spécificités
des problèmes.
 Loin de la méthode de recherche pratiquée chez l’homme.
 La solution trouvée n’est pas forcément optimale.

Recherche heuristique
Définition
L’heuristique introduit des stratégies de contrôle de la recherche.
Technique : Il s’agit d’utiliser une fonction d’évaluation pour chiffrer la validité
d’un nœud par rapport à l’autre. à chaque étape, les nœuds sont réordonnés au
lieu d’être mis dans une pile ou une file.
On parle dans ce cas d’une recherche ordonnée.
Définition
La recherche ordonnée revient à choisir de développer le nœud ayant les
meilleures chances de mener au but.

Principe de la méthode :
Le principe consiste à définir un ordre total sur tous les choix à un moment
de la recherche en utilisant une fonction coût.
Soit f(n) le coût idéal du chemin passant par un nœud n pour arriver au but
:
f(n) = g(n) + h(n) avec g(n) est la fonction coût réel et h(n) est la fonction
heuristique.

L’algorithme se fondant sur f(n) pour ordonner les nœuds est appelé l’algorithme A∗
.Début
1. OUVERT← U0, FERME← ∅, g(U0) ← 0 et U ← U0
2. Tant que OUVERT ≠ ∅ et U T
Faire
2.1 Supprimer U de OUVERT et le placer dans FERME
2.2 itérer sur { v ∈ Successeur (U)}
Si v  {OUVERT ou FERME} ou (g(v) > g(U)+k(U, v))
Faire
2.2.1 g(v) ← g(U)+k(U,v)
2.2.2 f(v) ← g(v) + h(v)
2.2.3 père (v) ← U
OUVERT est rangé dans l’ordre croissant de f et décroissant de g
Fin Faire
Fin itération 2.2
2.3 Si OUVERT ≠ ∅ alors U← tête de OUVERT
3. Fin itérer 2
4. Si OUVERT = ∅ alors pas de solution sinon la solution est fournie par le
chemin créé par père(U)
Fin

Exemple : Jeu de taquin Appliquons A∗
pour le jeu de taquin avec g étant le nombre de jetons déplacés
et h le nombre de jeton mal placés.
.

Exemple : Jeu de taquin avec une profondeur limitée =3.

La réduction du problème en sous problèmes
La représentation en graphe ET/OU
Définition : Une représentation du problème en sous-problèmes consiste à découper le problème en sous-

problèmes élémentaires ou composés.
Un problème est dit élémentaire s’il admet une solution immédiate. Les transformations qui permettent de
réaliser la décomposition sont appelées des opérateurs.
Une représentation par réduction de problèmes est définie par les éléments suivants :
1. une description du problème à résoudre.
2. L’ensemble des opérateurs de réduction.
3. Une description des problèmes primitifs ou élémentaires

Exemple : Tour de Hanoy à 3 quilles.
Contraintes :
On ne peut déplacer qu’un seul disque à la fois.
On ne peut pas placer un disque sur un disque de taille inférieure. Nous pouvons
représenter la situation de départ : ((A,B,C),(),()) et la situation d’arrivée : ((),(),(A,B,C))
Problème primitif : une description dans laquelle il s’agit de passer d’une situation de départ
à une situation désirée moyennant le déplacement d’un seul disque d’une quille i vers la
quille j ne contenant pas de disque de taille inférieure.
Un seul opérateur de décomposition suffit et il est défini comme suit : étant donné les quilles
i, j, k, le problème de déplacer une pile de la quille i à la quille k peut être remplacé par les
trois problèmes suivants :
 Déplacer une pile de la quille i vers la quille j.
 Déplacer une pile de la quille i vers la quille k.
 Déplacer une pile de la quille j vers la quille k.

Technique de recherche d’une solution

Il s’agit de parcourir les arbres (graphes ET/OU) en prenant tous les nœuds à
l’alternative ET et un seul nœud à l’alternative OU.
En ce qui concerne les techniques de recherche aveugles, elles se rapprochent
beaucoup de ceux déjà vue de même pour les techniques heuristiques.
Soit AO∗ l’algorithme de recherche équivalent à A∗ mais dans le cadre d’une
représentation en graphe ET/OU.


La différence entre les deux représentations traduit deux modes de raisonnement
par rapport à un énoncé. Dans le premier cas, on parle d’opérateurs de
transformation d’un état à un autre. Dans le deuxième cas, il s’agit d’opérateurs de
décomposition du problème en sous problèmes. Il faut noter qu’un même problème
peut être résolu par les deux méthodes. Le choix de la méthode devient un
problème en soit qui dépend de la :
• nature du problème,
• définition des opérateurs,
• fonction de décomposition,
• etc.3

Cependant on peut être guidé dans le choix par les considérations suivantes :
• Si la solution du problème se représente de façon pratique comme une
structure d’arbre (ou de graphe) alors l’approche réduction de problèmes
est plus appropriée.
• Si la solution du problème se représente de façon pratique comme un
chemin représentant une suite inconditionnelle d’actions alors l’approche
espaces d’états est plus appropriée.

Représentation par graphe d’états
 On structure l’ensemble des états du problème par un graphe orienté
 Un sommet du graphe est un état du problème
 Il y a un arc du nœud u au nœud v, si on dispose d’un opérateur permettant

de transformer l’état u en l’état v
 Pour un même problème donné, plusieurs représentations par graphe d’états

sont possible


Les 8 reines
 La position des pièces sur l’échiquier définit complètement l’état du

problème
 Description de chaque état par un tableau
 échiquier(i,j)  {vide, reine} avec i et j entre 1 et 8
 Un opérateur est nécessaire : « Placer-reine(i,j) :
si échiquier(i,j) = vide alors échiquier(i,j)  reine »
 2 tests complètent la représentation du problème :
 « échiquier-sans-prise » : au plus 1 reine par ligne, colonne ou

diagonale.
 « échiquier-complet » : total de 8 reines dans l’échiquier

 Du nœud initial (échiquier vide) partent 64 arcs (diverses façons de placer une
reine)
 De chacun des successeurs partent 63 arcs (placer 2ème reine)…
 Ce graphe comporte des cycles (il est possible d’atteindre le même état de
diverses façons)
1. Une solution au problème est un chemin du graphe reliant le nœud initial à

un nœud quelconque vérifiant les deux tests
 Tous les nœuds sur un tel chemin doivent vérifier la condition :
 « échiquier-sans-prise »
 Une grande partie des 264 états de la représentation suivante est inutile
tout état avec une reine en prise ou tout successeur d’un tel état.


 Il faut inclure le test « échiquier-sans-prise » dans les conditions
d’application de l’opérateur « placer-reine »
2. intégrer une partie des contraintes du problème à la représentation : la

description suivante par un vecteur à 8 composantes :
 « Ligne(i)=j si la ième ligne de l’échiquier comporte une reine en colonne j ,
 Et ligne(i)=0 si cette ligne est vide »
 Ne permet pas de représenter un état de l’échiquier avec plus d’une reine

par ligne.
 Il reste à tester l’absence de prise en colonne et diagonale.
 Ainsi on réduit l’espace des états.


SOLUTION : L(1) =2, L(2) =4, L(3) =6, L(4) =8, L(5) =3, L(6) =1, L(7) =7, L(8) =5
1 2 3 4 5 6 7 8

1

2

3

4

5

6

7

8

Génération de plans
 Dans un univers de cubes, un bras manipulé muni d’une pince permet de

saisir un objet, de le placer, de le poser sur un plan de travail ou de l’empiler
sur d’autres objets.
 La pince ne peut prendre qu’un seul objet à la fois. Seul un objet sur lequel
rien n’est empilé peut être saisi.
 Partant d’un ensemble d’objets dans une configuration initiale, on désire

obtenir la séquence d’opération élémentaires qui permet de les réarranger
dans une configuration donnée.

 On dispose de n objets (numérotés de 1 à n) :
 Accessible(k)  { vrai, faux }
 Posé-sur(k)  { plan-de-travail }  { 1,2, … , n }
 Pince-tient(k)  { vide }  { 1,2, … , n }
 L’objectif à atteindre est donné comme un état explicite par rapport auquel on
teste l’état courant.
 Une solution au problème est un chemin dans le graphe entre le nœud initial
et le nœud final : le plan recherché est la séquence d’opérateurs, étiquetant
les arc de ce chemin.
  (voir la partie du graphe d’états)


 Saisir(X) : si pince-tient = vide et accessible (X) = vrai et posé-sur(X) = plan-de-travail
Alors faire : pince-tientX ; accessible(X) faux
Si pince-tient=vide et accessible(X) = vrai et posé-sur(X)=Y et posé-sur(Y) = plan-de-

travail
Alors faire : pince-tient X; accessible(X) faux; accessible(Y) vrai
 Poser(X) : si pince-tient=X
Alors faire : posé-sur(X)  plan-de-travail;
Accessible(X) vrai ; pince-tient vide
 Poser (X,Y) : si pince-tient=X et accessible(Y) = vrai
alors faire : posé-sur(X)  y ; accessible(Y) faux ;
accessible(X)  vrai ; pince-tient  vide
  (voir la partie du graphe d’états)

Notion d’heuristique Exemple de navigation d’un robot

B
A
C D
E

IA 2020 Halahala

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

IA 2020 Halahala

Transféré par

Droits d'auteur :

Formats disponibles

Intelligence Artificielle &

A.U.: 2022-2023 H. Bezine 1

I. Partie A; Fondements de l’IA

2. Représentation des connaissances et résolution de problèmes

2.1 Formalisation d’un Problème

2.2 Stratégies de Résolution

2.3 Notion d’Heuristiques et l’algorithme A*

2.4 Jeux Stratégiques de Recherche Min-Max & Alpha-Beta

II. Partie B; Introduction à l’AA

Hala Bezine Machine Learning & Intelligence Artificielle

L’intelligence artificielle VS machine learning et DEEP learning

Hala Bezine Machine Learning & Intelligence Artificielle

Qu’est-ce que c’est l’Intelligence Artificielle ?

2 « L’ IA est le domaine de l’informatique qui étudie comment faire à

« L’IA est l’étude des facultés mentales à l’aide de modèles de type

Hala Bezine Machine Learning & Intelligence Artificielle

Qu’est-ce que c’est l’Intelligence Artificielle ?

Hala Bezine Machine Learning & Intelligence Artificielle

Hala Bezine Machine Learning & Intelligence Artificielle

l’Intelligence Artificielle est une Branche de l’Informatique

Hala Bezine Machine Learning & Intelligence Artificielle

l’Intelligence Artificielle est Une Science/ Une technique

Hala Bezine Machine Learning & Intelligence Artificielle

Hala Bezine Machine Learning & Intelligence Artificielle

Hala Bezine Machine Learning & Intelligence Artificielle

Hala Bezine Machine Learning & Intelligence Artificielle

Algorithmique vs non Algorithmique

 La définition de l’IA comme domaine de la programmation non

Caractéristiques de l’IA VS informatique classique

 Aspects plus déclaratif, moins procédural

 On privilégie la satisfaction à l’optimisation

 Données incomplètes, inexactes, conflictuelles

 La notion de représentation d’un problème est fondamentale

 Pluridisciplinaire: logique, psycho-cognitive, biologie, neurosciences,

 Diagnostic : médical, spatial, industriel

 Contrôle flow (débit) : véhicules, caméras

 Aide à la décision : banque, assurance, conduite de procédé, domaine

 Reconnaissance de la parole, dictée vocale, télématique

 Traitement de la langue écrite : compréhension, traduction

 Lecture optique (OCR)

 Interprétation de signaux : surveillance, conduite

 Traitement d’image et vision : inspection, imagerie médicale

Hala Bezine Machine Learning & Intelligence Artificielle

En 1956 : exécution sur machine du premier programme d’IA

Hala Bezine Machine Learning & Intelligence Artificielle

 GPS (General Problem Solver)

 NSS ( jeu d'échecs)

 Test « d’intelligence » (Evans 1963) : trouver la suite d’une série de figures.

 Résolution de problèmes par propagation de contraintes (Waltz 1975)

 Dialogue en « langage naturel » (Eliza, Weizenbaum 1965) (Système

Hala Bezine Machine Learning & Intelligence Artificielle

Hala Bezine Machine Learning & Intelligence Artificielle

Langages de programmation pour l’IA ?

Hala Bezine Machine Learning & Intelligence Artificielle

Hala Bezine Machine Learning & Intelligence Artificielle

Les domaines concernés par l'IA

Hala Bezine Machine Learning & Intelligence Artificielle

Hala Bezine Machine Learning & Intelligence Artificielle

Les domaines concernés par l'IA

 Apprentissage supervisé et non-supervisé

 Imagerie et reconnaissance de formes

Hala Bezine Machine Learning & Intelligence Artificielle

Les domaines concernés par l'IA

 Les systèmes experts