Vous êtes sur la page 1sur 27

CONFLITS DE RATIONALITE

LE DUEL DEEP BLUE / KASPAROV 1

CHRISTOPHE ASSENS
Maître de conférences habilité à diriger des recherches

Université de Versailles Saint-Quentin-en-Yvelines


LAREQUOI, laboratoire de recherche en Management
47, Boulevard Vauban
F-78 047 Guyancourt
Tel (33) 0139255534
christophe.assens@quoi.uvsq.fr

JACQUES ANGOT
Professeur associé

IESEG School Of Management,


3 Rue De La Digue,
Catholic University of Lille, 59000, France.
Tel: +33/320-545-892. Fax: +33/320-574-855.
email: j.angot@ieseg.fr

Résumé :

Les principaux courants de la recherche sociologique et économique, font état de


plusieurs formes de rationalité. A travers ses décisions, l'homme semble animé par des
objectifs dont il prend conscience grâce à ses facultés cognitives. La façon dont il
raisonne dépend également des décisions et des comportements des personnes qui
l'entourent, même si ces raisonnements sont contradictoires ou opposés entre eux. Afin
de comprendre cette logique de l'affrontement, nous avons effectué une étude empirique
dans laquelle le mode de raisonnement d'un ordinateur est opposé à celui d'un joueur
d'échec. De cette enquête quasi-clinique, nous tirons des enseignements sur la manière
de gérer les conflits et les antagonismes lorsque ceux-ci portent sur des divergences
cognitives.

Mots-clés : réseau, rationalité, conflit, jeu d’échec, informatique, intelligence.

1 Cette recherche a bénéficié


du soutien financier de la FNEGE. Les auteurs tiennent à remercier Bernard
Amy, Directeur de Recherche au CNRS (UMR 5522), à l’Institut National Polytechnique de Grenoble et
Marc Feuilloley, Professeur à l’Université de Rouen, membre du laboratoire de microbiologie du froid,
(UPRES 2123), pour leurs recommandations dans la rédaction de cet article.
INTRODUCTION

Depuis l'apparition de la théorie des jeux, on enferme les décisions selon un


schéma déterministe dans lequel chaque joueur adapte son comportement à celui des
autres en fonction des règles propres à un environnement donné. Le but du jeu et les
règles sont identiques pour tous. Ce sont des paramètres exogènes qui affectent le
raisonnement des joueurs.

En acceptant ce postulat, la tentation est grande, par exemple, de comparer


l'économie à un gigantesque champ de bataille dans lequel les stratégies militaires
s’appliquent. C'est la raison pour laquelle Sun Tzu (1978) et Clausevitz (1955) ont
inspiré de nombreux développements théoriques en management stratégique. La plupart
des stratégies issues du domaine militaire conduit à percevoir les tactiques des
entreprises sous l'angle de l'affrontement (décision, concurrence, compétition,
élaboration de solutions) de l'évitement ou de l'entente entre plusieurs entités (
entreprises, individus, etc ).

Dans cet article, nous cherchons à renouveler la conception traditionnelle de


l'affrontement qui tend à mettre l'accent sur le rapport des forces dans un univers donné.
En étudiant le déroulement d'un conflit en fonction des ressources et des objectifs
affichés, on oublie en effet de considérer le phénomène d'interaction entre les forces (Sun
Tzu 1987). De ce fait, on tend à oublier que chaque opposant ne partage pas la même
conception de l'art de la guerre. On oublie alors de considérer les situations où les
belligérants adoptent des modes de raisonnement différents qui les amènent à se
comporter en dehors d'une référence commune. En ce sens, l'issue du conflit porte plus
sur l'opposition des styles de rationalité que sur un véritable rapport des forces.

Pour étayer ces remarques, il nous semble important de montrer que la victoire
dans un conflit repose dans la supériorité du raisonnement. Dans cette perspective, nous
avons mené une étude « quasi-clinique » à travers l’observation d’un tournoi d’échec
entre le champion du monde Gary Kasparov et un ordinateur programmé par IBM,
Deep Blue. Ce tournoi oppose deux formes de rationalités différentes : le raisonnement
de l’homme fondé sur l’expérience et l’ingéniosité avec une capacité d’analyse limitée à
une centaine de coups ; le raisonnement de la machine dont la fonction de masse permet
d’atteindre une puissance de calcul de 2 millions de coups par seconde. En dépit du
rapport des forces favorable à l’ordinateur, la victoire appartient à l’individu. En
examinant attentivement les phases de jeu, nous expliquons les raisons de cette
supériorité par la capacité d’intégrer le raisonnement de l’adversaire dans sa propre
stratégie. De cette manière, nous sommes en mesure de mieux comprendre la logique
d’interaction des décisions qui échappent aux aspects purement exogènes (règles du jeu)
ou purement endogènes (ressources et objectifs) d’un conflit.

Dans une première partie, nous préciserons les grilles de lecture théorique dans la
prise de décision rationnelle. Puis, dans une deuxième partie, nous préciserons les
conditions d’observation d’un affrontement de rationalités. Enfin, dans une troisième
partie, nous tirerons des conséquences, sur la fiabilité de la méthode, puis sur la portée
et la généralisation des résultats.

2
1. LECTURE THEORIQUE DE LA RATIONALITE

Le concept de rationalité est à l'origine d'une grande diversité de littérature.


Cependant, les réflexions qui les ont nourries sont souvent résumées trop simplement à
la différence introduite par Simon (1976) à savoir une rationalité substantive ( la
meilleure adéquation des moyens en vues d'atteindre une fin : on tend vers une rationalité
du résultat ) versus une rationalité procédurale ( c'est-à-dire se focaliser sur le caractère
rationnel de la démarche conduisant aux résultats ). Dans cette optique, Simon (1976)
définit la rationalité comme « un style de comportement qui est approprié pour atteindre
des objectifs donnés à l'intérieur de limites imposées par des conditions et des
contraintes données ». Par le biais notamment de son concept de rationalité limitée (
Simon 1957, March & Simon 1958 ), les travaux de Simon (1976) mettent en valeur la
dimension cognitive dans le concept de la rationalité ; ce qui s'apprécie d'autant mieux si
l'on revient sur les principaux points des différentes disciplines qui ont abordé le
concept de rationalité.

1.1 La rationalité philosophique

Une première étape est de nous référer aux philosophes et aux bases qu'ils ont
données à l'idée de raison. En fait, l'idée de la rationalité est liée sensiblement au courant
du rationalisme pour qui le motif déterminant est l'hypothèse que la réalité peut être
atteinte en quelque façon et les actions humaines évaluées sinon gouvernées par l'usage
de la raison. Dans cette mesure, le problème est de savoir ce que recouvre le concept de
« raison ». Au travers de la diversité des sens qui lui ont été donné, quelques traits
distinctifs semblent se maintenir notamment sur le fait que la raison est liée à
l'intelligence, et non pas à l'instinct ou aux réactions affectives. De plus la raison renvoie
à des principes cadres de la connaissance et de l'action qui sont plus ou moins explicites
mais appellent et supportent l'élucidation. Enfin, la raison procède par enchaînement de
concepts et non par juxtaposition et enchevêtrement d'images, de métaphores et de
mythes.

En référence au rationalisme de l'antiquité classique, un trait fondamental de


l'attitude rationaliste est le rôle fondamental accordé à la représentation de toute
expérience dans un système de symboles médiateurs qui s'interposent entre le sujet
récepteur d'une impression et le réel qu'il veut saisir, décrire et manipuler. C'est
pourquoi, il ne peut être envisageable de recevoir la connaissance prise comme telle : le
passage par le symbolisme de la langue ( langues naturelles, langues formulaires comme
les mathématiques ) et par la réglementation d'une grammaire est requis. Ainsi, l'idée
qu'on ne peut connaître assurément le réel fait que l'on doit se focaliser non plus sur
l'accès critique de la pensée au réel mais sur les modalités de cet accès.

L'importance accordée à l'expérience se retrouve au sein des travaux de Descartes


(1637). Celui-ci considère en effet que la découverte sensorielle fournit l'occasion de
préciser les phénomènes à expliquer. De plus, les expériences étudiées servent à vérifier
le bien fondé de conjectures déduites de « principes ou premières causes ». Enfin,
l'exercice de la raison conduit à une connaissance mécanicienne qui reconstitue les
phénomènes à l'image de machines et par conséquent devrait nous mettre en état de les
manipuler comme tels.

3
Si l'on se réfère aux critiques de Kant (1781), une des remarques les plus
importantes est que le domaine de la connaissance proprement dite, par lequel nous
saisissons des objets à partir des impressions sensibles est organisé dans le cadre de
formes à priori de l'espace et du temps et catégories comme celles de la causalité ou
comme le dit Kant (1781) : « Notre raison n'est pas en quelque sorte une plaine qui
s'étende sur une distance indéterminée et dont on ne connaisse pas les bornes que d'une
manière générale ; mais elle doit plutôt être comparée à une sphère dont le diamètre peut
être trouvé à partir de la courbure de l'arc de sa surface. En dehors de cette sphère ( le
champ de l'expérience ), il n'y a plus d'objets pour elle ».

Or la raison et le raisonnement sont utiles à un organisme faisant face à de


nouvelles situations et essayant d'éviter de futures difficultés. Cela donne à la rationalité
la tâche explicite de se charger des changements ( dans les faits, les besoins, etc. ) et
peut-être de modifier nos "patterns" de comportements quand nous apprenons qu'ils
sont mal adaptés. La rationalité a dans cette perspective une fonction évolutionniste qui
rend capable d'agir vis-à-vis des situations changeantes ou à venir et qui sont présagées
par des indicateurs complexes ( Nozick 1993 ).

Selon Granger (1987), la rationalité s'appuie sur la nécessité d'exercer un jugement


orienté vers l'appréciation des frontières des diverses connaissances : être rationnel ne
consiste pas à mettre en œuvre des « principes et la réalisation forcenée de leurs
conséquences, c'est agir en faisant porter son jugement sur les considérations des
circonstances de l'application de ces principes ».

Cette orientation se détache d'ambitions prescriptives et d'évaluations par les


conséquences. Elle s'appuie sur nos connaissances limitées ( comblées par des croyances
selon Nozick 1993 ) et donc sur la modestie de nos principes actuels. De ce fait, on n'est
rationnel que si l'on réfléchit et apprécie les circonstances dans lesquelles on est amené à
agir. Encore faut-il avoir les aptitudes de mener une réflexion mais aussi d'apprécier les
circonstances. C'est pourquoi, nous pensons que la rationalité est étroitement liée aux
dispositions de l'entité ( à qui on veut attribuer un comportement rationnel ) à apprécier
la réalité, en faire une représentation dont elle peut apprécier les caractéristiques et en
tirer une expérience pour le futur.

1.2 La rationalité économique

L'essentiel de cette partie est de convaincre que les économistes purs traduisent
la notion de raison par l'idée de calcul et développent les hypothèses de bases au modèle
rationnel de prise de décision en introduisant les principes d'utilité ( représentation des
objectifs ), de pleine connaissance des solutions et conséquences de celles-ci et surtout
de maximisation. Cette règle d'évaluation qu'est la maximisation constitue une constante
dans l'esprit des économistes en matière de rationalité. Elle deviendra « satisfaction » par
l'intermédiaire de Simon (1957) et de ses collègues sur la rationalité limitée, mais sous-
entend néanmoins une volonté d'atteindre un seuil minimum d'utilité et un désir de s'y
maintenir.

4
L'introduction du concept de rationalité limitée résulte de l'idée selon laquelle
l'homme ne peut être parfaitement rationnel du fait de ses capacités cognitives limitées à
recueillir et traiter l'information dont il a besoin pour agir de manière rationnelle au sens
substantif. Par conséquent, du fait de son environnement interne, l'homme ne peut se
soumettre qu'à une rationalité liée à ses contraintes cognitives et temporelles, d'où une
rationalité subjective, pouvant être variable au cours du temps pour un même individu et
variables selon les individus ( Shoemaker 1990 ). C'est par l'intermédiaire de la rationalité
limitée, que l'on passe conceptuellement d'une rationalité parfaite à une rationalité non
parfaite tendant vers une interrogation plus profonde : le résultat doit-il être le point
central de rationalité ?

Concernant les partisans de la rationalité procédurale, la réponse est non. On


préfère alors décrire la procédure de raisonnement et non de prédire de manière certaine
l'aboutissement de ce raisonnement. Cela permet d'évaluer une progression par rapport à
une intention mais pas par rapport à un but final.

1.3 La rationalité sociologique

Contrairement aux économistes, les sociologues considèrent en général que


l'analyse des moyens par le sujet social est de peu d'intérêt et que seul compte l'étude
des objectifs qu'il se donne. De plus, lorsqu'il se fixe des objectifs, le sujet social est le
siège de forces qu'il ne maîtrise que très imparfaitement. En fait, une grande partie des
courants sociologiques va consister à populariser le caractère irrationnel du sujet social
au lieu de se demander si cette étrangeté ne serait pas le produit d'une différence entre sa
situation et celle de celui qui l'observe. Il y a une tendance naturelle au sociocentrisme de
l'observateur conduisant à considérer sa rationalité non pas parfaite, mais universelle. De
ce fait, tout élément ne pouvant s'expliquer dans le cadre de notre pensée conduit à
l'inévitable déduction de l'irrationalité du sujet observé.

La question qui se pose alors est de savoir ce qui compose une rationalité.
Plusieurs réponses sont avancées. Boudon (1991-1993) parle de plusieurs niveaux de
rationalités pouvant se représenter en cercles circonscrits : premièrement la rationalité du
type utilitaire ou téléologique, deuxièmement la rationalité axiologique ( les deux
premiers cercles constituent la rationalité Weberienne ), troisièmement un cercle
coextensif qui inclut le fait d'avoir de "bonnes raisons" pour avoir agi de cette manière,
enfin, le cercle des actes affectifs, impulsifs correspondant à la conception classique de
l'irrationalité.

Reynaud (1993) préfère se focaliser sur la notion de règles dont la création donne
un sens aux objets traités ( faste ou néfaste, moral ou immoral, etc. ). Créer des règles de
relations, c'est donner un sens à l'espace social et créer les règles d'un système c'est créer
une rationalité commune à ceux qui habitent le système. De plus, le sens d'une décision
n'est pas entièrement contenu dans cette décision. Les conséquences qu'elle entraîne le
modifient en retour. Mais surtout, la « rationalité des acteurs évolue, se transforme,
change, notamment à l'épreuve de la conjonction de ses conséquences ». Il est alors
souvent utile de remonter à l'origine du raisonnement pour le comprendre, non pas parce
que l'origine détient la clé du sens mais pour mieux saisir la logique qui a conduit à la
situation actuelle.

5
1.4 La rationalité managériale

Beaucoup de travaux adhèrent au concept de rationalité limitée, mais comme le


suggère March (1978), l'environnement organisationnel permet d'envisager plus
largement deux catégories : la rationalité calculée et la rationalité systémique s'articulant
autour du principe que l'action est plus ou moins intentionnelle.

La rationalité calculée présume que l'action suit un calcul explicite de ses


conséquences par rapport aux objectifs. Devant les limites d'un modèle rationnel naïf, on
met en avant la mauvaise unité d'analyse ou la caractérisation inexacte des préférences
impliquées. De ce fait se sont développées différentes notions de rationalité ( rationalité
limitée, contextuelle, de jeu, de processus ). Dans cette optique, les être humains sont
présumés intelligents. A ce titre, ils évaluent les conséquences de leurs actions et
agissent de manière sensée pour atteindre leurs objectifs. L'action est alors supposée
conséquentielle, liée « consciemment et significativement à la connaissance des buts
personnels et des résultats futurs contrôlés par l'intention personnelle » ( March 1978 ).

Une autre approche de la rationalité consiste à présumer que « l'action suit des
règles de comportement qui se sont développées à travers des processus qui ont un sens
mais qui empêchent une information complète sur la justification rationnelle de ces
règles » ( March 1978 ). En fait, la connaissance évolue avec le temps à l'intérieur d'un
système où elle est liée à des acteurs et à des organisations qui n'ont pas une complète
conscience de son histoire. De ce fait, les acteurs effectuent une action sans qu'ils aient
une compréhension de sa raison d'être. Au sein de ces considérations se sont développés
trois types de rationalités (rationalité d'adaptation, sélective, a posteriori). La rationalité
systémique n'est pas intentionnelle c'est-à-dire que le comportement n'est pas considéré
comme découlant d'un calcul des conséquences. Ces notions affirment qu'il y a de
l'intelligence dans l'absence de calcul.

1.5 Synthèse : définition de la rationalité

Au vu de cette littérature, la rationalité se définit en fonction de différents


facteurs économiques, sociologiques, politiques, structurels liés d'une part aux objectifs
et à la finalité du raisonnement et d'autre part aux moyens mis en œuvre pour atteindre
cette finalité. On peut expliquer le raisonnement par les causes ou par les finalités,
toujours propres à un individu. Comprendre la rationalité d'un individu implique alors de
saisir, d'une part, les circonstances dans lesquelles il se situe, et, d'autre part, la façon
dont il prend en compte son environnement en fonction des autres individus qui s'y
trouvent.

Dans cette optique, nous proposons d'étudier la rationalité d'un individu comme
la faculté d'adopter un comportement ( attitude, action, réflexion ) dans un univers perçu
et interprété en fonction des objectifs et des moyens dont il dispose à un moment donné.
Cette définition prend en considération le fait qu'un acteur puisse avoir plusieurs
objectifs qu'il essaye de mettre en œuvre compte tenu des circonstances qui bloquent ou
favorisent leur réalisation.

6
Nous partons du principe que la raison se base sur une représentation du réel et
donc que la situation peut être perçue et comprise soit de manière identique à d'autres
acteurs ou au contraire de manière différente. En définitive, dans ce travail, nous
retiendrons que la rationalité s'articule autour de deux axes importants : les "moyens"
avec la perception et la représentation de l'environnement ( traitement de l'information,
raisonnement, réponses émotionnelles, réflexes ) ; les « fins » avec la formulation et la
hiérarchisation des objectifs (perception du sens, décomposition en objectifs, orientation
ou non-orientation vers un but). Par cette définition des moyens et des fins, la rationalité
d'un acteur peut se lire selon deux axes : d'une part, la structure « cognitive » et son
fonctionnement, d'autre part, la finalité et la perception du sens.

2. L’OBSERVATION D’UN AFFRONTEMENT DE RATIONALITES

2.1 Une étude « quasi-clinique »

L’objectif de notre étude empirique consiste à découvrir comment sont


mobilisées toutes les formes de rationalité évoquées dans la littérature. Dans le cadre de
la coopération, il est admis que les partenaires cherchent à concilier des points de vue
divergents en acceptant des concessions dans leur façon de raisonner. Un consensus peut
se dégager au bénéfice de tous par la prise en compte des différentes rationalités. En
revanche, dans le cadre d’un conflit la remise en question n’est pas facile, car la
différence de pensée est souvent à l’origine même des rivalités entre les acteurs. Pourtant
la question se pose de savoir s’il existe des formes d’influence réciproque comme dans la
collaboration, ou s’il existe une forme de rationalité supérieure aux autres, qui se
détacherait dans la victoire ? Ainsi, est-il possible de raisonner en toute indépendance de
l’adversaire en cherchant à lui imposer ses propres certitudes ? Pour ce qui est de
l'affrontement, peu étudié sous cet angle dans la littérature en sciences sociales, notre
souhait est de montrer l'importance pour un acteur d’intégrer la rationalité de son
adversaire dans sa propre logique de pensée.

Nous considérons que la victoire ou la défaite n’est pas un phénomène


inéluctable, imposé ou souhaité, mais un phénomène qui se construit au cours d’un
processus dans l’interaction et par l’opposition entre plusieurs formes de pensée. Pour
illustrer ce postulat, il faut être en mesure de pouvoir observer des raisonnements qui
s’affrontent. Le seul moyen de parvenir à cet objectif ambitieux, consiste à étudier des
comportements résultants de décisions et de choix rationnels au sens économique
(possibilité de reconstituer la faiblesse ou la force du raisonnement par le calcul), au sens
sociologique (possibilité d’interpréter les aspects psychologiques), au sens managérial
(possibilité de gérer la pensée et la force du raisonnement en fonction d’objectifs et de
moyens). Or, dans la vie quotidienne, il est pratiquement impossible de découvrir
l’origine d’une décision ou d’attribuer une action à un choix précis, contrairement aux
grilles de lecture théorique. En effet, l’action est influencée par différents facteurs
sociaux temporels qui ne sont pas toujours imputables à la raison. Croyant observer un
comportement réfléchi et raisonné, nous pouvons être confronté à des actions
influencées par d’autres déterminismes, indépendant de l’acteur, ou par le hasard.

Pour parvenir à reconstituer le lien entre un raisonnement et une action, il faut


donc être en mesure de contrôler de façon clinique tous les paramètres qui peuvent
perturber l’analyse : les paramètres extérieurs à l’action (les variables spatio-

7
temporelles, les variables sociologiques…) ; les paramètres internes (les variables de
hasard ou d’inconscience).

Le jeu d’échec1 résout ces difficultés d’ordre épistémologique. Il offre en effet


l'avantage de pouvoir analyser un processus de décision qui découle d'un raisonnement
au cours d'une situation d'affrontement. Ce processus n'est ni le fruit du hasard et encore
moins le résultat d'une variable extérieure à l'individu. Toutes les variables exogènes
comme le temps et le hasard sont contrôlées. Dans une partie d'échec, l'affrontement se
déroule dans les mêmes conditions de jeu pour chaque joueur. La victoire ne tient ni à un
phénomène aléatoire (univers fini, la chance ne fait pas partie des règles du jeu) ni au
phénomène temporel (un minuteur contrôle la variable temporelle), ni au phénomène
contextuel (changement de règles en cours de partie).

Ces constantes permettent d'une part de comparer les raisonnements sur une
base commune et d'autre part d'associer la victoire ou la défaite à une confrontation de
rationalité et non pas à un phénomène fortuit. Cela ne signifie pas pour autant que tout
soit parfaitement prévisible dans un jeu d'échec, bien au contraire. Malgré son apparente
simplicité, les échecs sont d'une complexité évidente.

Nous ne reviendrons pas sur les critiques liées à l'utilisation du jeu d'échec
comme métaphore de la stratégie et a fortiori du management stratégique. Nous pensons
qu'elles sont fondées et, c'est pourquoi, nous l'utilisons à une fin beaucoup plus précise
et en adéquation avec une des principales caractéristiques de la pratique du jeu d'échec :
l'incertitude logique. Ainsi, Simon (1976) dans son utilisation du jeu d'échec a
parfaitement compris l'intelligence sous-jacente d'une métaphore basée sur le jeu d'échec
à condition de la considérer comme un cas d'affrontement semblable à un jeu à somme
nulle, à moyens et objectifs initiaux identiques pour chacun des « joueurs ». Donc, cette
métaphore met en avant le fait qu'à partir d'une incroyable source de déterminisme (
pièces, nombre de coups, nombre de cases, pas de changement de couleur, etc ), le jeu
d'échec conduit à l'incertitude la plus complète basée aussi bien sur le principe des
anticipations que sur celui de l'interaction.

En effet, l'incertitude aux échecs n'est pas liée au pur hasard, contestable selon
Ekeland (1991). Elle est le fruit de notre ignorance dans un univers complexe par trop de
déterminisme. Par exemple, une relation de cause à effet devient incertaine à partir du
moment où on n'arrive plus à identifier son origine et sa fin. Dans le jeu d'échec, la
stratégie du joueur reste logique et prévisible à partir du moment où on l'isole de son
contexte. En relation avec celle de l'autre joueur, la stratégie devient interdépendante. Le
processus d’interaction provoque alors des ajustements laissant place à une marge
d'incertitude et à une prise de risques à cause des limites d'anticipation. Le niveau

1 Le jeu d'échec apparaît au 5ème siècle sous l'appellation de "Tchateranga". Deux armées alliées
composées de l'éléphant, du cheval et du navire combattent aux quatre coins d'un carré. Le jeu se propage
ensuite en perse sous une autre version. Enfin au moyen-âge, il ne cesse dévoluer sous différentes
dénominations ( Skeres, Axederes, Ajedres, Scacchi ) avant de prendre sa forme définitive. Echec signifie
alors butin. A partir de cette époque, le jeu d'échec se compose d'un plateau de 64 cases sur lequel
s'affrontent deux armées de 16 pièces. Le but du jeu consiste alors à conquérir le territoire adverse en
s'emparant du Roi.

8
d'anticipation est ainsi limité pour chaque joueur, car aucun d'entre eux ne sait jusqu'à
quel stade l'autre va conduire ses propres prévisions.

Prenons un exemple simple avec deux joueurs A et B. Si A déplace son cavalier


dans un certain contexte, B peut anticiper que dans des conditions analogues A déplacera
de nouveau son cavalier ; mais A peut également anticiper que B anticipe son
raisonnement et décide de modifier sa façon de jouer ; ce qui peut également être perçu
par B s'il poursuit son raisonnement à ce niveau et ainsi de suite. Ce qui fait que ni A ni
B ne peuvent avoir une anticipation précise et complète du jeu de l'adversaire.

2.2 La méthode d’observation

Dans ce contexte, nous allons utiliser la métaphore du jeu d'échec pour étudier
une situation d'affrontement entre l’intelligence humaine et l’intelligence artificielle1. Le
jeu d’échec fait appel à des qualités comme la prudence, la circonspection, la
prévoyance, le renoncement ou la persévérance. Pour des raisons techniques, il se prête à
merveille aux tentatives de modélisation informatique contrairement au jeu de go par
exemple (Ginsberg 1998). Ainsi, le jeu d'échec requiert de combiner la reconnaissance des
formes et le raisonnement mathématique avec des qualités plus complexes comme
l'intuition. Depuis les années 50, les programmateurs ont essayé de relever ce défi en
concevant des machines suffisamment intelligentes pour jouer aux échecs. Claude
Schannon et Alan Turing ont été les premiers à se pencher sur la programmation des
échecs.

Les premiers ordinateurs étaient programmés à partir de règle simple portant sur
l'avantage de coup ( points gagnés ou perdus au cours d'un échange de pièces ) et sur
l'avantage de position ( position avantageuse ou désastreuse en début, milieu ou fin de
partie). Un arbitrage logique permettait également de choisir l'avantage de pièce ou
l'avantage de position. Avec les progrès technologiques réalisés dans le domaine des
processeurs, l'ordinateur a gagné en vitesse de calcul jusqu'à atteindre un niveau proche
des meilleurs joueurs mondiaux.

C'est la raison pour laquelle, l'actuel champion du monde, Kasparov, a décidé


d'associer son nom à la principale marque d'appareils de jeu : Sytech. Kasparov est né le
13 avril 1963 à Bakou. Très rapidement il devient l'un des joueurs les plus prodigieux de
sa génération. Champion du monde junior à 17 ans, il devient à 22 ans le plus jeune
champion du monde de l'histoire des échecs. Le 31 aôut 1994 à Londres, il se heurte à un
adversaire hors du commun : un ordinateur de jeu fonctionnant avec un processeur
Pentium. Le programme chess-génius emporte la partie semi-rapide ( 50 minutes ) face à
Kasparov, grâce à sa puissance de calcul de l'ordre de 50 000 coups par seconde. Tandis
que Kasparov s'entraîne à améliorer son jeu face à la vitesse de calcul d'un automate, une
équipe d'ingénieurs d'IBM met au point un ordinateur de jeu surpuissant : Deep Blue.

1 L’intelligence « artificielle » est un terme à manipuler avec précaution sous peine de faire un abus de
langage et de tomber dans le travers de l’anthropomorphisme. La machine n’est pas intelligente,
contrairement aux programmeurs informatiques. Dans cet article, les règles humaines de programmation
et les principes mécaniques de fonctionnement priment dans l’étude du comportement d’un ordinateur.

9
Avec 32 processeurs montés en parallèle, Deep Blue est capable de calculer 200
00 coups par seconde. Comme base de données, il se réfère à toutes les parties jouées
depuis un siècle en championnat. Deep Blue fonctionne d'une part sur la recherche des
coups enregistrés dans sa mémoire et sur l'évaluation des coups à partir des règles de
programmation. À partir d'une position donnée, il est capable de calculer toutes les
combinaisons possibles et leurs conséquences 7 ou 8 coups plus tard. En théorie, il est
possible de programmer toutes les phases de jeu et toutes les combinaisons imaginables
dans cet univers fini de 64 cases.

Mais Deep Blue est programmé plutôt en fonction de la personnalité de


Kasparov, car plus on enregistre des données et plus le temps de réponse de la machine
est long. Or, les parties sont chronométrées. Il faut donc produire un coup toutes les
trois minutes en moyenne. Les informaticiens ont donc jugé plus utile de privilégier la
vitesse de cacul à l'exhaustivité pour l’ordinateur.

Pour étudier les logiques d’opposition entre le cerveau humain et l’ordinateur,


nous avons cherché à reconstituer leur raisonnement à partir de l’analyse des parties
d’échecs et du déplacement des pièces lors de la rencontre historique en 1996 entre Deep
Blue et Kasparov à Philadelphie. Pour cela nous exploitons une base de données issue du
serveur d'IBM sur Internet ( www.http//.IBM.com. ) comprenant 300 pages de
commentaires et d'analyses effectuées en temps réel par des informaticiens et des
joueurs d'échec. Cette base de donnée nous sert à identifier les phases de jeu décisives et
les tournants dans chaque partie, c'est-à-dire tous les coups joués par l'homme ou la
machine qui ne suscitent pas un consensus entre les différents commentateurs aidés en
cela par d'autres logiciels informatiques. À ce titre, notre démarche s’inspire de la
consultation d’expert. Cela consiste à confronter systématiquement des points de vues
individuels pour obtenir une vision collective des évènements.

En reconstituant le déroulement de chaque partie sur un plateau d’échec et par


ordinateur, nous avons identifié les situations critiques et les coups décisifs révélés par
les experts, c'est-à-dire les phases de jeu décisives dans chaque partie 1. Nous avons
ensuite analysé les manœuvres de jeu décisives, qui traduisent à chaque fois un clivage
dans le raisonnement entre l'homme et la machine. Ces coups particuliers sont
identifiables lorsqu'il n'y a pas de consensus entre les commentateurs pour interpréter le
déplacement d'une pièce, ou lorsque les experts ne parviennent pas à apporter une
explication au mouvement d'une pièce soit parce qu'il s'agit d'un coup prodigieux, soit
parce qu'il s'agit d'une faiblesse dans la réflexion d'un des joueurs. Généralement ces
coups décisifs apparaissent en milieu de partie. L'un des deux adversaires emporte alors
un avantage irréversible.

Pour mieux présenter les résultats de nos observations empiriques, nous avons
choisi d’isoler trois situations caractéristiques d'affrontement : un affrontement brutal
qui met en lumière la puissance de calcul de la machine, un affrontement équilibré qui
met en exergue l’adaptation de l’homme par rapport à la machine, et un affrontement

1 L'intérêt scientifique de cette recherche réside dans une situation d'incertitude majeure qui contraint les
deux joueurs (Homme / Machine) à s'affronter sans arrangement et sans concertation a priori. Dans ces
conditions, la validité de ce travail repose sur le caractère imprévisible des parties qui se sont jouées.

10
déséquilibré qui met en évidence les facultés d’imagination de l’homme face au
raisonnement itératif de la machine.

2.3 Les phases de jeu

Cas d'affrontement n°1 : l'orgueil contre le calcul

Dans la première partie du tournoi, Kasparov pratique un jeu offensif, lié à sa


personnalité. En multipliant les possibilités d'attaque, celui-ci mise sur sa faculté à
produire des coups prodigieux, imprévisibles par nature, y compris pour l'ordinateur
dont la banque de données en mémoire ne couvre pas l'intégralité des déplacements
possibles et imaginables. Il évalue les avantages et les inconvénients du positionnement
des pièces, non seulement en fonction de leur poids ou de leur hiérarchie mais également
en fonction du rapport qu'elles entretiennent avec les autres pièces. Cette vision
instinctive du jeu lui permet d'évoluer sans connaître à l'avance le déroulement des
phases de jeu. Il met ainsi l'accent sur certains facteurs - clés : garder la position avancée
d'un pion ou former un carré avec les pièces au centre du plateau. En adoptant cette
tactique de jeu, Kasparov vise à imprimer le rythme de la partie en raisonnant sur des
configurations plutôt que sur des séquences d'évènements. Il applique la stratégie qui lui
permet de détenir le titre de champion du monde d’échec depuis 1985. Cette longévité au
sommet de la nomenclature des joueurs s’explique par une volonté farouche d’imposer le
jeu à son adversaire, en misant sur la peur de perdre qu’il suscite. Toutefois, contre
l’ordinateur, il ne peut pas disposer de cet avantage psychologique développé par les
signes de la communication non verbale. Il s’engage dans une escalade de coups qui ne
parviennent pas à déstabiliser le raisonnement mécanique de l’ordinateur.

La « fuite en avant » de sa stratégie d’attaque l’expose ainsi aux réactions


défensives de son adversaire. De façon surprenante, cette tactique habituelle chez
Kasparov devient favorable à Deep Blue, plus à l'aise en défense qu'en attaque. En effet,
un comportement agressif requiert une prise d'initiative dont l’ordinateur est dénué. Par
contre en position défensive, Deep Blue par son mode de calcul exhaustif des
combinaisons, est capable de balayer un champ des possibles, plus large que celui de
Kasparov. Face à cette différence de puissance de calcul, ce dernier ne peut plus
maîtriser le déroulement du jeu, car il n'avait pas prévu les réactions de Deep Blue faute
d'avoir pu les évaluer pendant son temps de réflexion. La figure 1 récapitule cette
situation au 21ème coup. Kasparov joue en noir au premier plan contre Deep Blue avec
les blancs. A ce stade, il convient de noter la structure de pions affaiblie pour Kasparov
dont la stratégie d'attaque s'est retournée contre lui. Cela illustre les points faibles du
raisonnement de Kasparov face à la machine dans un contexte donné : l'attaque
instinctive ouverte sur de multiples combinaisons.

11
Fig 1 : la débâcle de Kasparov

Au cours des parties suivantes, Kasparov va modifier sensiblement sa façon de


jouer en apprenant à exploiter les faiblesses du raisonnement de Deep Blue, c'est-à-dire
en évitant de jouer un jeu trop ouvert, trop offensif, où des situations complexes et
incontrôlables, par leur multiplicité, surgissent inévitablement.

Cas d'affrontement n°2 : l'effet de miroir

Dans la partie 5, Kasparov se contente de donner la réplique à Deep Blue sans


chercher à prendre l'initiative du jeu. L'ouverture des quatre premiers coups aboutit à une
position symétrique des pièces adverses par rapport à la ligne médiane de l'échiquier. Le
rapport des forces se reflète comme dans un miroir. Kasparov renvoie l'image de Deep
Blue en lui laissant l'initiative dans un univers fermé, où il n'a pas beaucoup de marge de
manœuvre. La figure 2 illustre cette stratégie dans la partie 5 au 4ème coup, entre Deep

12
Blue avec les noirs au premier plan, et Kasparov avec les blancs. Cette symétrie des
positions sera respectée dans la suite du déroulement du jeu.

Fig 2 : l'effet de miroir

Cette configuration est une source d'incertitude majeure que Deep Blue ne
parvient pas à gérer. Celle-ci provient d'une situation d'affrontement de type paradoxal
où il ne suffit pas de calculer aveuglément les avantages et les inconvénients attachés à
des éventualités qui sont soit équivalentes, soit contradictoires.

Dans ce genre de situation, Deep Blue n'est pas en mesure de faire preuve
d'imagination. Cette limite le contraint à jouer de façon orthodoxe, rendant encore plus
prévisibles ces coups au fur et à mesure que le jeu se prolonge et que la marge de liberté
se réduit. Au 23ème coup Kasparov estime que la partie est suffisamment équilibrée
pour proposer un nul à Deep Blue. En fait, Kasparov manque de temps pour réfléchir
dans de bonnes conditions. Par ailleurs il souhaite se ménager pour être dans de bonnes

13
conditions pour la dernière partie du championnat. Mais Deep Blue n'a pas les mêmes
critères d'évaluations du jeu que Kasparov.

L’ordinateur ne se sert que d’algorithme 1 (séries de règles définissant les étapes


pour résoudre un problème ou déterminer l’exactitude d’une position) pour effectuer un
calcul de type arithmétique 2 à l'instant t du poids des pièces et des positions qu'il
compare de façon analytique à celles de Kasparov. Pour Deep Blue, le tout est égal à la
somme des parties.

Ce type de raisonnement s’explique car l’ordinateur fonctionne sur un mode


séquentiel (le programme de Deep Blue ne peut examiner une position que s’il connaît la
position précédente) et itératif (sans idée précise sur la tactique ou sur la finalité, il
procède par essai - erreur, de manière heuristique). Son raisonnement s'effectue de façon
inconsciente et involontaire. Cela conduit la machine à raisonner séquence par séquence
en isolant chaque élément d'information de son contexte, et en traitant nécessairement
des milliers de solutions erronées ou absurdes. Dans le traitement de l’information
propre à la machine, chaque information peut être déterminée, de manière précise, en
étant séparé de son contexte. La réalité se décompose alors comme un ensemble
d'événements distincts, avec une origine et une fin bien déterminée. En faisant
abstraction du contexte passé (les échecs étant un jeu à information permanente),
l'ordinateur réduit son attention à la nature et au contenu des événements. À plus ou
moins long terme, il évite ainsi de tenir compte des effets de maillage entre les
événements. Le point de vue de l'ordinateur se focalise sur les informations en les isolant
les unes des autres. Son analyse de la situation globale est réduite à la juxtaposition ou à
la comparaison d'évènements considérés localement. Le tout se confond alors avec la
somme des parties3.

À l'inverse, Kasparov ne sait pas calculer avec exactitude le rapport des forces,
mais il sait l'évaluer de façon dynamique et interactive. Il sait qu'au cours de la partie des
évènements imprévisibles vont venir se greffer qui vont transformer le cours du jeu et
que l'on ne retrouve pas au niveau des parties prises séparément. Pour Kasparov, le tout
n'est pas équivalent à la somme des parties. En fait, l'homme n'est ni un calculateur
maître de lui, tel que le conçoivent les économistes. Il n'est pas non plus un être passif
soumis à son destin ou à des forces échappant à son influence comme le présentent les

1 Pour faire une métaphore avec le langage, l’intelligence artificielle accède à des opérations syntaxiques,
contrairement à l’esprit humain qui met en jeu des opérations sémantiques. Les opérations syntaxiques
sont différentes des contenus sémantiques et insuffisantes en elles-mêmes pour atteindre le niveau
sémantique. L’ordinateur ne peut pas donner du sens aux coups joués, car il n’a pas de conscience et de
recul sur l’action qu’il mène. Il procède à un calcul mathématique abstrait qui n’existe que relativement à
des interprètes ou à des observateurs extérieurs à lui : les programmeurs.
2 L’ordinateur procède à un calcul pour comparer les meilleurs coups possibles. Les pièces et les cases de
l’échiquier correspondent aux signes élémentaires du calcul ; les positions réglementaires des pièces sur
l’échiquier aux formules du calcul ; les positions de départ des pièces, aux axiomes et aux formules de
départ du calcul ; les positions ultérieures des pièces, aux formules dérivées des axiomes ; et les règles du
jeu, aux règles d’inférence utilisées dans le calcul.
3 Au sujet de la comparaison entre le tout et les parties voir la "méthode" de Morin (1977).

14
sociologues. La logique de la pensée est tellement complexe que l'acteur n'en a pas la
parfaite maîtrise. De ce fait, l'acte ou la décision n'est pas le fruit d'une intention
mûrement réfléchie, consistant à maximiser une utilité ou un profit comme dans le cadre
de l’ordinateur. Pour autant, l'acteur n'est pas totalement passif, immergé dans un monde
extérieur à lui. La réalité agit sur ses représentations et ses actes, mais en retour, l'homme
par ses représentations mentales façonne également la réalité à son image. L'art illustre
cet aspect.

La finalité de la pensée échappe donc au déterminisme le plus pur ou au


volontarisme le plus absolu. En conséquence, la finalité de la pensée est une construction
qui tient compte des limites de la rationalité humaine. L'homme n'agit pas de façon
totalement intentionnelle car il n'a pas une connaissance pure et parfaite de son
environnement.

Simon (1957) nous explique à ce sujet que l'être humain ne peut être totalement
calculateur car il ne dispose pas des capacités suffisantes pour recueillir et traiter toutes
les informations dont il a besoin. Même s'il le pouvait, des contraintes de temps l'en
empêchent le plus souvent : lorsque Deep Blue calcule plusieurs milliards de
combinaisons, Kasparov ne peut évaluer que quelques dizaines (au mieux quelques
centaines) de possibilités. Il est obligé d'agir dans l'urgence dans les limites de ses
facultés de jugement. Pour compenser cette faiblesse, l'homme a la faculté de raisonner
en raccourci, en adoptant une vue d'ensemble sur des problèmes complexes.

Dans le cas des échecs, Ginsberg (1998) nous explique que le bon joueur
n’examine qu’une poignée de positions possibles, au regard de l’expérience, par un
processus d’identification des structures1 (pattern matching). Kasparov compare une
configuration sur l’échiquier avec d’autres situations rencontrées dans le passé. Il utilise
ce qu’il a appris de l’analyse des positions pour déterminer de bons coups. Cette
identification de structure est un processus parallèle qui s’oppose à la démarche
analytique et séquentielle de l’ordinateur2.

Cette différence dans le raisonnement pousse Deep Blue à refuser le nul proposé
par Kasparov et l'oblige à continuer la partie que l'ordinateur finira par perdre. En effet,
la fin de partie est une phase de jeu favorable au mode de raisonnement de l’humain.
Avec la réduction de la complexité, en limitant le nombre d'arborescences ou la
multiplication des combinaisons, Kasparov joue avec une longueur d'avance sur
l'ordinateur. Il est alors capable d'évaluer les conséquences d'une décision dix ou douze
coups plus tard alors que l'ordinateur a une capacité de calcul qui n'évolue pas en
fonction du degré de complexité du jeu. Au-delà de cinq ou six coups, sa vision à long
terme s'obscurcit. A ce niveau de réflexion, le hasard ou l'expérience servent de relais

1 L’homme exclut de façon immédiate les solutions absurdes. Cette faculté de raisonnement réside dans
le cortex préfrontal qui traite l’information par champ conceptuel. Des informations qui ont été acquises
en même temps (la configuration de plusieurs pièces sur un plateau d’échecs) sont stockées dans un
« bassin d’attraction », une mémoire commune qui est activée lorsque la position de l’une ou l’autre
pièce correspond à la configuration. De cette manière, le cortex préfrontal est en mesure de traiter en
parallèle l’information et de comparer les pièces éparpillées sur le plateau à des configurations déjà
mémorisées, jusqu’à l’obtention d’une solution considérée comme satisfaisante (Tassin 1998)
2 Le jeu d’échec n’est pas, dans son essence, parallèle ou séquentiel, car aussi bien les techniques
parallèles (l’identification des structures) que séquentielles (la recherche calculatoire de Deep Blue)
s’applique au jeu. Tout l’art de Kasparov dans ce tournoi consiste justement à provoquer des situations de
jeu, où son mode de raisonnement prime sur celui de l’adversaire.

15
pour prendre malgré tout une décision ; or Deep Blue n'est pas programmé pour prendre
une décision au hasard, dans la mesure où il puise dans un répertoire d'action tiré du
passé qui le rend prévisible aux yeux de Kasparov. En revanche, l'humain est toujours en
mesure de produire un coup surprenant qui n'était pas mémorisé par l'ordinateur.

Cas d'affrontement n°3 : le « calcul » contre le calcul

La partie 6 se déroule dans la lignée de la partie 5. Kasparov pousse Deep Blue


dans ses retranchements en l'amenant à prendre des décisions conformes à ses attentes,
sans chercher à les lui imposer par la force ( cas n° 1 ), mais par la contrainte ( cas n°2 ),
c'est-à-dire en réduisant les possibilités de déplacement sur l'échiquier et en anticipant
plus facilement les réactions préprogrammées. Durant les 20 premiers mouvements,
Kasparov campe sur ses positions à partir desquelles il va construire méthodiquement sa
victoire. Son objectif vise à réduire l'autonomie de Deep Blue sans chercher à conclure de
façon prématurée.

Cette progression inexorable perturbe le jeu de Deep Blue en contrariant sa


puissance de calcul. Tout au long de la partie, le déplacement des pièces de Deep Blue
s'effectue sous la contrainte de Kasparov. De cette manière, celui-ci réduit
considérablement sa propre incertitude, tout en augmentant l'incertitude de son
adversaire. A un moment donné, Kasparov améliore son avance par un échange de
pièces. Au 33ème coup, Kasparov propose à l'ordinateur un échange qui lui est
défavorable selon la méthode du calcul des points. En échangeant un fou contre un
cavalier en fin de partie il donne l'impression d'accorder un avantage décisif à son
adversaire. Sans percevoir la subtilité de cette phase de jeu, Deep Blue tombe dans le
piège et accepte l'échange.

Par une évaluation mécanique du rapport des forces, Deep Blue a une perception
limitée du jeu. A contrario, la perception de Kasparov est fondée sur les processus non
linéaires d'interactions ( anticipations, rétroactions ) qui donnent accès aux "chunk of
knowledge", autrement dit à une reconnaissance des formes et à une comparaison des
configurations. Cette différence d'appréciation explique en grande partie la défaite de
l'ordinateur dans un jeu où la force brute n'est pas l'unique facteur clé de succès comme le
montre la figure 3. Au 43 ème coup l'abandon de Deep Blue en noir se justifie par la
stratégie d'enfermement territorial menée par Kasaparov avec les blancs. Sur l'échiquier,
la marge de manœuvre de Deep Blue est complètement cloisonnée par les positions
tenues par Kasparov.

16
Fig 3 : la neutralisation de Deep Blue

3. CONTRIBUTIONS DE LA RECHERCHE

3.1 Analyse des résultats et commentaires

Les résultats de Kasparov s'améliorent notablement au cours des parties


contrairement à ceux de l'ordinateur (cf. tableau 1). C'est le signe d'un phénomène
d'apprentissage que reconnaît Kasparov :

“ I think the main distinction between us and computers, at least you can learn and I
learned a lot from game 1 and game 2. And I think after the last two games, it was the
result of me learning and playing the positions and playing the moves that are most
unpleasant for the machine.”

17
Tableau 1 : la comparaison des résultats
( score 0 = défaite , score O,5 = partie nulle , score 1 = victoire )

Partie 1 Deep Blue 1 Kasparov 0


Partie 2 Deep Blue 0 Kasparov 1
Partie 3 Deep Blue 0,5 Kasparov 0,5
Partie 4 Deep Blue 0,5 Kasparov 0,5
Partie 5 Deep Blue 0 Kasparov 1
Partie 6 Deep Blue 0 Kasparov 1

Alors que la programmation de Deep-Blue n’est pas remise en question, au cours


des 6 parties, Kasparov modifie sensiblement sa façon de jouer. Il ne se concentre pas
uniquement sur les coups ingénieux ou habiles, mais il étudie également des
déplacements qui ne facilitent pas le jeu de Deep Blue, dans des situations fermées, avec
peu d'ouverture. Au lieu de chercher la victoire rapide, il attend patiemment les erreurs
de la machine. Il pousse Deep Blue dans ses retranchements, après avoir tester les
limites de son algorithme au cours des deux premières parties. Plusieurs stratégies de
Kasparov sont basées sur cet apprentissage.

On peut évoquer la stratégie de l'indifférence. Cela consiste à réduire


volontairement son niveau de jeu (principe de rationalité limitée) de manière à contrôler
plus facilement l'issue de la partie. En évitant des situations trop compliquées, Kasparov
réduit la liberté d’action de Deep Blue, et augmente la sienne par la même occasion. Il
laisse volontairement certains choix en dehors de son contrôle. L'ordinateur est alors
conduit à prendre des initiatives, alors que son point fort réside dans sa faculté de
réaction.

La deuxième stratégie est celle de l'escalade de l'engagement. Dans une partie, le


temps est irrévocable. Kasparov mesure cette dimension qui échappe en partie à Deep
Blue. Au fur et à mesure, il place l'ordinateur face à un danger. Pour se prémunir contre
ce danger, Deep Blue protège des pièces, ou il cherche une meilleure position. Ce -
faisant il s'expose à un danger encore plus grand dont il n'a pas conscience. En raisonnant
au coup par coup de façon séquentielle, Deep Blue ne mesure pas toujours
l'irrévocabilité de certaines décisions.

Cela provoque un phénomène d'escalade dans l'engagement de la partie dont


Kasparov mesure l'issue avant Deep Blue à cause de son intuition, de son bon sens ou de
son expérience. L'intuition remplace le savoir dans l’urgence. C'est la raison pour laquelle

18
la perception de l'homme est spontanée. Un autre point fort de Kasparov réside dans sa
capacité à innover, à jouer des coups prodigieux, que personne ne peut imiter. En effet,
tous les paramètres de jeu ne peuvent pas être modélisés ou quantifiés. Certains d'entre
eux comme l'intuition (la faculté à comprendre le jeu sans en mesurer tous les détails)
échappent aux efforts de standardisation ou de normalisation.

On ne peut apprendre à l'ordinateur tous les principes de jeu hétérodoxes, toutes


les exceptions à la règle. En effet, l'ordinateur lui ne peut ni créer ses propres règles
(imagination), ni en apprendre de nouvelles ( apprentissage) ni les appliquer
différemment selon le contexte (intuition). Cette limite se manifeste surtout dans des
situations ambiguës ou contradictoires, justement celles où il faut faire preuve d'une
intelligence autonome.

Plusieurs tactiques de Kasparov reposent sur ce point faible. On peut évoquer la


stratégie de l'auto - destruction. Kasparov essaye de leurrer l'ordinateur en faussant le
rapport des forces. Il sacrifie des pièces sans grande importance. En procédant ainsi, il
modifie arbitrairement les paramètres de calcul de l'ordinateur pour l'amener à réagir
différemment en prenant encore plus de risques. Il cherche par exemple à diviser les
forces adverses par une stratégie de diversion. Dans le même registre, on peut parler de
la stratégie du paradoxe pour conduire l'ordinateur à une impasse là où il faut émettre des
jugements de valeur ou des appréciations sensibles. L'un des commentateurs nous
l'explique par un exemple :

" In chess, of course, you have what is known as the paradox. I mean you have a
situation where you say, okay the queen is the most powerful piece on the board. And yet
sometimes the best way to win the game of chess is to sacrifice the queen. "

Dans ce registre, on peut relever trois sortes de paradoxes. Le paradoxe de la


contradiction, le paradoxe de l'ambiguïté, le paradoxe de la redondance. Trois décisions
ont les mêmes chances de réussite après calcul. Pourtant elles sont toutes les trois
différentes ( 1 ≠ 2 ≠ 3 ). Laquelle faut-il choisir ? Trois éventualités se présentent, mais
il n'y a aucun moyen de les quantifier pour les comparer sur une base commune ( 1 / 2 / 3
). Laquelle faut-il choisir ? Trois possibilités s'offrent à l'ordinateur. Elles sont toutes
identiques ( 1 = 2 = 3 ). Laquelle doit être prioritaire ? Ces problèmes d'appréciation
font appel aux facultés cognitives complexes dont l'ordinateur est privé.

3.2 Interprétation des résultats de la recherche

L’interprétation des résultats consiste à lire et à analyser les situations


d'affrontement sous l'angle des fonctions cognitives. Notre analyse de départ sur ce sujet
nous a permis de mettre en exergue deux dimensions principales : les "moyens" avec la
perception du sens et la représentation de l'environnement et les "fins" avec la
formulation et la hiérarchisation des objectifs. À ce stade, nous allons détailler pour
l'homme et la machine les différences qui les caractérisent dans leur mode de pensée, tant
au niveau du traitement de l’information que des objectifs attendus.

19
Le traitement de l’information

L'ordinateur a un mode de fonctionnement d'ordre séquentiel. Des informations


sont introduites dans la machine pour analyser qu’un certain nombre de coups possibles,
voisins de la position obtenue, afin d’éviter des recherches trop longue. Au moyen d’un
algorithme, il est possible d’évaluer et de comparer des solutions, à partir d’un arbre de
positions, sans considérer l’intégralité des coups possibles (Ginsberg 1998).

Chaque information est traité au sein d’un arbre de décision dont les branches
sont représentées par des choix possibles, et dont les nœuds représentent les positions
de toutes les pièces après un mouvement, et plus généralement, l’état de la partie.

En comparaison, l’homme opère un traitement parallèle de l’information qui le


conduit à sélectionner les informations judicieuses. Ainsi Kasparov mémorise 10 000
positions clés, mais en cours de partie, il élimine 99 % des mauvaises possibilités pour
ne retenir que 3 ou 4 positions possibles dans des situations complexes. Inconsciemment
une partie en évoque une autre d’analogue jouée dans le passé. Le recours à l’expérience
est précieux pour obtenir une représentation holiste de la réalité en situant des
évènements spécifiques, à l'intérieur d’un contexte plus général.

Par contre, dans l’ordinateur, chaque information est analysée de manière


distincte, en étant séparé de son contexte. La réalité se décompose alors comme un
ensemble d'évènements distincts, avec une origine et une fin bien déterminée. En faisant
abstraction du contexte, l'ordinateur réduit son attention à la nature et au contenu des
évènements. À plus ou moins long terme, il évite ainsi de tenir compte des effets de
maillage entre les évènements. La perspective de l'ordinateur se focalise sur les
informations en les isolant les unes des autres (vision de type locale et fragmentée sur le
schéma n°4). Le tout informationnel se confond avec la somme des parties visibles.

À l'inverse, l’homme, par son expérience ou son intuition, ne peut pas isoler les
évènements de leur contexte avant de leur donner une signification (vison de type globale
et holiste sur le schéma n°4 ). En connectant en parallèle chaque information, et en
effectuant un tri et une sélection simultanée, l’individu saisit des propriétés qui n'étaient
pas visibles au niveau des évènements considérés séparément mais au niveau de leur
enchaînement ou de leur combinaison. Dans cette approche, le tout informationnel est
supérieur ou inférieur à la somme des parties visibles.

Fig.4 : traitement de l'information

vision vision
locale globale

20
Vision locale : une situation est étudiée par morceaux avec un traitement
de l’information analytique
Vision globale : une situation est étudiée en entier avec un traitement
de l’information holiste

L’autre distinction majeure entre l’homme et la machine réside dans la perception


du sens et la finalité des objectifs élaborés à partir du traitement méthodique ou
heuristique de l’information.

Finalité et perception du sens

Etudier la finalité d'un raisonnement ou le sens d'une réflexion consiste à


comprendre la logique qui amène ce raisonnement ou cette réflexion. L'homme est animé
par une rationalité de type connexionniste dans la mesure où la cause et la finalité d'une
décision sont indissociablement liées. De ce fait l'homme n'est ni un calculateur maître de
lui tel que le conçoivent les économistes, ni un être passif soumis à son destin ou à des
forces échappant à son influence comme le présentent les sociologues. La logique de la
pensée est tellement complexe que l'acteur n'en a pas la parfaite maîtrise. De ce fait,
l'acte ou la décision n'est pas le fruit d'une intention consistant à maximiser une utilité ou
un profit par exemple. Pour autant, l'acteur n'est pas totalement passif, immergé dans un
monde extérieur à lui. La réalité agit sur ses représentations mentales et ses actes, mais
en retour l'homme façonne également la réalité à son image. L'art illustre cet aspect.

La finalité de la pensée humaine échappe donc au déterminisme le plus pur ou au


volontarisme le plus absolu. La finalité de la pensée est une construction qui tient
compte des limites de la rationalité humaine. L'homme n'agit pas de façon totalement
intentionnelle car il n'a pas une connaissance pure et parfaite de son environnement.
Simon (1957) nous explique que l'être humain ne peut être totalement calculateur car il
ne dispose pas des capacités suffisantes pour recueillir et traiter toutes les informations
dont il a besoin. Même s'il le pouvait, des contraintes de temps l'en empêchent la
plupart du temps. Il est obligé d'agir dans l'urgence en limitant sa faculté de jugement.
Ses décisions sont le fruits d'une construction de sa pensée, influencée par le milieu et
l'hérédité (Piaget 1977). Les habitudes et les conventions tendent également à priver
l'homme d'une totale liberté de pensée (Boudon 1986).

Dans cette mesure, on ne peut pas isoler les causes et les conséquences d’une
décision car l’objectif (déstabiliser Deep Blue) peut être considéré à la fois comme une
conséquence (gagner la partie grâce aux faiblesses de l’adversaire) et comme le fondement
des actes (miser sur les points faibles pour gagner la partie). La chaîne de raisonnement
devient non linéaire avec des points de rupture, des zones d’ombre et des phases de
retour en arrière : voir figure 5.

À l'inverse, l'ordinateur adopte un raisonnement dont on peut reconstituer en


continu la chaîne moyens - fins, sans point de ruptures et sans zones d’ombres. La
décision suit un calcul implicite des conséquences par rapport à un objectif donné.
L'ordinateur dispose d'un objectif à partir duquel il évalue les moyens d'y parvenir. Ce

21
raisonnement est intentionnel car il présuppose une parfaite connaissance de
l'environnement et des paramètres qui s'y rattachent. La finalité (maximiser une utilité ou
un profit) permet alors d'expliquer le choix d'une décision ou le raisonnement qui produit
cette décision. Pour atteindre un objectif, l'ordinateur va émettre des hypothèses qu'il va
ensuite comparer selon des critères (le choix le plus rapide, le choix le moins coûteux)
afin de sélectionner une décision. L'hypothèse retenue sera celle qui permet d'atteindre
l'objectif sous la contrainte de programmation. Le but devient une conséquence linéaire et
directe des moyens mis en œuvre : voir figure 5.

Fig.5 : la perception du sens

causalité causalité
linéaire non linéaire

Causalité linéaire : la finalité et les moyens s’enchaînent dans un ordre


séquentiel.
Causalité non linéaire : la finalité et les moyens sont imbriqués dans
une boucle récursive.

CONCLUSION

Ce travail empirique montre la nécessité d'utiliser la notion de rationalité pour


mieux appréhender la logique des modes d'affrontement entre plusieurs entités
décisionnelles. Trois types de conflit ont été mis à jour dans le cadre de cette étude :

- le premier porte sur les différences de perception et d'interprétation des situations :


asymétrie de l'information et de son traitement entre adversaires.
- le deuxième porte sur les moyens à mettre en œuvre pour gagner : stratégie
d'apprentissage versus stratégie de domination par le calcul.
- enfin le troisième porte sur le sens donné à l'action : polyvalence des objectifs versus
finalité unique.

Deux points sont essentiels à retenir dans ce duel entre l’homme et la machine
que nous avons commenté : la faculté d’adaptation de l’homme et la réduction du niveau
d’incertitude par un méta – raisonnement humain. Ainsi, Kasparov ajuste son
comportement de jeu en fonction des points faibles de la logique de Deep Blue. De ce
fait, il est nécessaire à Kasparov de modifier son approche instinctive du jeu et
principalement la vision offensive qu'il en a. Il le fait par un comportement attentiste en
réduisant l'espace de jeu et par là même, l'incertitude liée aux réactions de son adversaire.

22
En fait Kasparov résout le problème de l'affrontement en transposant les facteurs
d'incertitude sur la réflexion de son adversaire. Plus généralement, il modifie une
incertitude globale, relative à l'espace de jeu en une incertitude localisée sur certaines
dimensions de la rationalité de Deep Blue. En effet, Kasparov crée les circonstances lui
permettant de bénéficier des avantages intellectuels nécessaires à la victoire. Pour cela, il
apprend à inclure dans son raisonnement les biais de son adversaire en évoluant vers des
situations de jeux1 dont la complexité est réduite au cours du temps.

Nous pouvons en déduire que dans l’incertitude, le meilleur point de repère


réside dans la faculté d'intégrer le raisonnement de l'adversaire dans sa propre stratégie.
Cette idée n’est pas nouvelle, mais elle n’a jamais été démontrée de cette façon par une
méthodologie qui met en relief l’intégration d’une rationalité au sein d’une autre dans un
contexte de rivalité. Elle remet en question les présupposés en sciences sociales pour
lesquelles, le conflit de personnes se déroule en fonction de règles du jeu définies en
dehors des joueurs (Von Neumann, Morgerstern,1947), ou par la recherche d’un pouvoir
liée à la rétention d’informations ou à la détention de ressources rares et non
substituables (Reynaud 1993). En conséquence, la prise en compte des divergences de
raisonnement est souvent perçue comme un aveu d’impuissance par des acteurs
orgueilleux, habitués à commander sans remise en question lors d’une rivalité. Cet article
démontre au contraire l’utilité d’une démarche visant à tenir compte des forces et des
faiblesses du raisonnement d’autrui, avant de résoudre un affrontement. L'issue du
conflit et de l'incertitude qui en découle dépend alors d'une faculté à anticiper et à
contrôler la pensée adverse, en acceptant de modifier au prix d’un effort sa propre
pensée.

Par rapport aux résultats de notre étude empirique, la base de la résolution d'un
conflit dépend d'une prise de distance par rapport à ce conflit. Pour cela il faut être
conscient des objectifs que l'on souhaite atteindre et des moyens que l'on est prêt à
mettre en œuvre. Est-ce que le conflit provient d'une crise du sens ou d'une crise des
ressources ? Se poser ce genre de questions est un préalable qui devrait permettre aux
dirigeants des entreprises de mieux contrôler les états d'incertitude et d'affrontement. En
évaluant non seulement les forces en présence mais la logique qui les anime, il est alors
possible d'amener l'adversaire à se déplacer là on pourra tirer un avantage de la situation (
Sun Tzu 1978 ).

Une autre piste de résolution d'un affrontement consiste à intégrer la pensée


adverse dans son propre raisonnement. Cette hypothèse donne lieu à réfléchir sur des

1 Ainsi, Kasparov a réussi à traduire les différences de raisonnement dans le champ des stratégies
adaptées aux règles du jeu : Stratégie d'indifférence dont le principe consiste à réduire volontairement le
niveau offensif de jeu, de manière à contrôler plus facilement l'issue de la partie. L'adversaire mécanique
est amené à prendre des initiatives originales en dehors de ses facultés de raison. Stratégie de l'escalade
dont le principe consiste à utiliser le caractère irrévocable du temps notamment en plaçant l'adversaire
dans une logique de court terme (succession de coups non planifiée forçant l'adversaire à agir dans
l'urgence).Stratégie de bluff par des défauts de position ou par des sacrifices de pièces volontaires dont le
principe consiste à fausser la perception du rapport des forces. Stratégie d'innovation qui fait appel à
l'imagination, l'intuition ou à des facultés de compréhension du jeu sans en mesurer tous les détails qui
échappent aux efforts de standardisation ou de normalisation de la machine. Stratégie du paradoxe dont le
principe consiste à conduire l'adversaire à des alternatives contradictoires, précisément là où il faut émettre
des jugements de valeur ou des appréciations sensibles.

23
possibilités de fusion ou d'intégration de rationalité : l'idée de rationalité "collective".
Ainsi, ne faudrait-il pas considérer l'influence des différentes rationalités existantes au
sein d'un même secteur ou à l'intérieur d'un même marché ? Un travail de recherche
devrait apprécier alors les modalités de cette coexistence et les caractéristiques de la
rationalité "collective" dominante ( domination d'un raisonnement par rapport à un
autre, émergence d'une nouvelle rationalité ( combinaison particulière ( à identifier ) des
rationalités existantes ). Enfin, dans cette optique, il serait également intéressant de voir
l'influence de la rationalité "collective" sur les rationalités individuelles et sur leur
évolution en terme d' apprentissage cognitif ou de mémorisation organisationnelle.

Enfin, nous pensons qu'il serait intéressant de réfléchir sur cette


problématique en terme d'outils. En effet, plutôt que de développer des outils
"parfaitement" rationnels, issu d'une seule rationalité, il serait important de s'orienter
vers de nouvelles configurations, notamment en créant des instruments de management
capable d'intégrer de multiples rationalités. Ces outils se baseraient sur l'idée d'un
élargissement cognitif afin d'appréhender et d'apprécier au mieux les différents " jeux de
pensée " existants au sein de l'organisation sociale.

Toutefois, il ne nous est pas possible, en l’état actuel, de transposer ou de


généraliser les résultats de notre recherche à partir de l’étude d’un cas unique, sans tester
les hypothèses de résolution d’un conflit de rationalité à partir d’une une base de donnée
plus importante. La généralisation de ces travaux nécessiterait de définir une base
d’information statistique suffisamment large pour en tirer des constations généralisables
à l’échelle d’une population d’acteurs. À l’image des travaux de Ginsberg (1988), nous
pourrions travailler dans l’univers de la théorie des jeux et répliquer notre méthode
d’enquête pour découvrir si notre interprétation s’applique à d’autres contextes,
notamment pour les jeux à information partielle où les joueurs ne connaissent pas toutes
les cartes, ou autres éléments de jeu détenus par leurs adversaires, comme le Poker. Cette
perspective serait un moyen de tester également la fiabilité de notre méthode d’enquête
basée sur la notion d’expertise. Comme pour d’autres méthodes d’analyse ou de
prévision par expertise, notre enquête repose sur la confrontation d’avis et d’opinions
entre spécialistes, méthode efficace pour déceler les failles d’un raisonnement,
insuffisante pour en expliquer tous les rouages de l’extérieur. De surcroît, des biais de
rationalisation a posteriori ou des risques d’influence mutuelle peuvent perturber les
consultations individuelles dans un cadre collectif.

REFERENCES

Amar G (1993), Qu'est-ce qui n'est pas un réseau ?, Flux, n°13 / 14, 56-58.

Assens C (1999), Connivence, discorde et schisme dans un réseau d’entreprises,


Les cahiers de l’Artemis, Presses Universitaires de Nantes, n°1, 55-88.

Assens C (1997), Réseau neuronal et réseau d'entreprises, Revue Française de


Gestion, n°113, 5-13.

24
Assens C (1996), Du modèle bureaucratique au modèle organique : l'organisation en
réseau, Flux, n°23, 38-42.

Atlan H (1979), Entre le cristal et la fumée , Paris, Ed. du Seuil.

Atlan H (1981), Postulats métaphysiques et méthodes de recherche,Supra ,113-


120.

Bateson P.P.G (1986), Sociobiology and human politics, in Rose S and Appignanesi
L (eds), Science and beyond, Oxford, Basil Blackwell.

Bouchon-Meunier B (1993), La logique floue, Que sais je, Presses Universitaires de


France.

Boudon R. (1986), L'idéologie, Paris, Ed. Fayard.

Boudon R. (1991), L'art de se persuader, Ed. Fayard.

Boudon R. (1993), La rationalité de l'acteur social, Encyclopédie Universalis.

Changeux J.P. (1983), L'homme neuronal, Ed. Fayard.

Clausevitz (1955), De la guerre, Ed. De Minuit.

Daft R.L, Weick K.E (1984), Toward a model of organizations as interpretation


systems, Academy of Management Review, vol 9, n°2, 284-295.

Davalo E.& Naim P. (1989), Des réseaux de neurones, Ed. Eyrolles.

Descartes. (1637), Le discours de la méthode, in Ed. Larousse - 1969.

Dörner D (1989), La logique de l'échec, Paris, Ed. Flammarion.

Drazin R, Sandelands L (1992), Autogenesis : a perspective on the process of


organizing, Organization Science, vol 3, n°2, 230-249.

Ekeland I (1984), Le calcul, l'imprévu : les figures du temps de Kepler à Thom, Paris,
Editions du Seuil.

Ekeland I. (1991), Au hasard : la chance, la science et le monde, Ed. Seuil.

Ginsberg M (1998), L’intelligence des jeux, Pour la Science, n°254, 172 -177.

Ginsberg M (1988), La mathématique des jeux, Editions pour la science.

Granger G. (1987), Pour la connaissance philosophique, Ed. Odile Jacob.

Hebb D.O (1949), The organization of behavior : a neuropsychological theory, John


Wiley & Sons, New York.

25
Kant (1781), La critique de la raison pure, in Ed. Larousse - 1969.

Kaufmann A, Faure R, Le Garff A (1960), Les jeux d'entreprises, Paris, Que sais je,
Presses Universitaires de France.

Kohonen T (1988), Self-organization and associative memory, 2nd.ed, Springer-Verlag,


Berlin.

Kung R, Paul E (1991), Le réseau intelligent, L'écho des recherches , vol 146 n°4, 37-50.

Le Roy F (1999), Les conditions de l’application de la stratégie militaire au management,


Revue Française de Gestion, Jan-Fev, 6-16.

Lorigny J (1992), Les systèmes autonomes : relation aléatoire et sciences de l'esprit,


Paris, Ed. Dunod.

March J. (1978), Bounded rationality, ambiguity and the engineering of choice, The Bell
Journal of Economics, vol 9, n°2, automne, p.587-608.

March J. & Simon H. (1958), Les organisations, Ed. Dunod.

Miliken, F.J. (1987), Three types of perceived uncertainty about the environment :
state, effect and response uncertainty, Academy of Management Review, 12:1, p133-
143.

Mintzberg H & Raisinghani D & Theoret A. (1976), The structure of unstructured


decision process, Administrative Science Quarterly, Vol 21, p 246-275.

Monod J (1970), Le hasard et la nécessité, Paris, Ed. du Seuil.

Morin E (1977), La méthode ( la nature de la nature ), Paris, Ed. du Seuil.

Nadal J.P (1993), Réseaux de neurones : de la physique à la psychologie, Ed Armand


Colin.

Nozick R. (1993), The nature of rationality, Princeton University Press.

Perez J.C. (1990), La révolution des ordinateurs neuronaux, Ed. Hermes.

Piaget J. (1977), Mes idées, Ed. Denoël & Gonthier.

Prigogine I, Stengers I (1979), La nouvelle alliance, Paris, Ed. Gallimard.

Reynaud J.D. (1993), Les règles du jeu : l'action collective et la régulation sociale, Ed.
Armand Colin.

Ruelle D (1981), Hasard et déterminisme le problème de la prédictibilité, Traverses,


n°23,

26
Shoemaker P.J. (1990), Strategy, complexity and economic rent, Management Science,
vol 36, n°10, p 37-50.

Simon H. (1957), Models of man, social and rational, NY.Wiley.

Simon H. (1976), From substantive rationality to procedural rationality, in Spiro J.


Latsis, ( Eds )., Methods and Apraisal , Cambridge University Press.

Sun Tzu. (1978), L'art de la guerre, Ed. Flammarion.

Tassin J.P (1998), Qu’est ce que l’intelligence, Pour la Science, n°254, 30-33

Thietart R.A, Forgues B (1993), Chaos theory and organization, Organization Science,
Vol 6, n°1, 19-31.

Von Neumann J & Morgerstern O. (1947), Theory of games and economic behavior,
Princeton University Press.

Weisbuch G. (1989), Dynamique des systèmes complexes : une introduction aux réseaux
d'automates, InterEditions.

27

Vous aimerez peut-être aussi