Dauphins Et Rationalite

COLE DES HAUTES TUDES EN SCIENCES SOCIALES COLE DOCTORALE CERVEAU, COGNITION
ET COMPORTEMENT
INSTITUT JEAN-NICOD
LES ANIMAUX SONT-ILS RATIONNELS ?
Doctorat nouveau rgime Philosophie
Benoit Hardy-Valle
Thse dirige par: Jolle PROUST, EHESS, Institut Jean-Nicod
Aurlie, ltre rationnel par excellence
ii
RSUM / ABSTRACT
Les animaux sont-ils rationnels ? Rsum (117 mots) Le point de vue adopt dans cette thse est que la question de la rationalit animale concerne ltendue, dans le monde vivant, de la rationalit conomique. Il est suggr de considrer les agents rationnels comme des espces naturelles plutt que comme des catgories normatives. Un modle mcaniste de la comptence rationnelle est propos, inspir des thories du contrle adaptatif, et contrast avec la conception standard, qui assimile la rationalit linterprtabilit. On conclut que cette conception rencontre de nombreux problmes, et que la question de la rationalit animale touche la biologie comparative plus qu linterprtation psychologique. La catgorie des vertbrs est prsente comme tant une catgorie apte tre dote des proprits typiques des agents conomiques.
Are animal rationals ? Abstract (117 words) The point of view adopted in this thesis is that the question of animal rationality must be addresed as a question of the extent, in the biological world, of economic rationality. It is suggested that rational agents should be classified as natural kinds rather than normative kinds. A mechanistic model of rational competence is proposed, inspired from adaptive control theories, and contrasted with the standard conception, which assimilate rationality with interpretability. It is concluded that the interpretivist conception encounters many problems, and that the question of animal rationality is a problem of comparative biology rather than psychological interpretation. The vertebrate category is presented as a category that may be equipped with typical properties implemented by economic agents. Mots-cls : Rationalit, animaux, volution, conomie, dcision, naturalisation, biologie. Keywords : Rationality, animals, evolution, economics, decision, naturalisation, biology.
Thse doctorale prpare lInstitut Jean-Nicod, 1bis avenue du Lowendal, Paris, sous la direction de Jolle Proust.
iii
REMERCIEMENTS
Je tiens remercier en tout premier lieu ma directrice, Jolle Proust, pour toutes les connaissances transmises, de mme que les conseils et les encouragements. Ce fut un honneur dtre ltudiant dune philosophe de cette envergure, aussi me faut-il le souligner (bien sr, tout non-sens ou erreur mest entirement attribuable). Le lecteur ne manquera pas de voir combien les propos avancs ici sinspirent des siens. Jai tent autant que possible didentifier les passages o des ides proviennent de ses propres recherches; il est toutefois possible, vu la quantit, que certaines aient t oublies, et donc ces remerciements sont aussi des excuses pour ces potentielles omissions. Mes remerciements acadmiques se divisent de part et dautres de lAtlantique. Montral, grce au support du Laboratoire dAnalyse Cognitive de lInformation de lUniversit du Qubec Montral (UQAM) et de ses multiples activits de recherches, jai pu entreprendre des travaux qui ont fait progresser mes rflexions. Plus particulirement, les professeurs Pierre Poirier et Serge Robert mont offert un support indfectible depuis le dbut de mes tudes, me permettant de travailler sur des sujets stimulants tout en mescrimant mes premires publications. Grce Mathieu Marion jai pu avoir connaissance des approches computationnelles de la rationalit et je len remercie. Jean-Guy Meunier et Luc Faucher sont aussi des professeurs qui mont grandement influenc et grce qui jai pu dvelopper plusieurs de mes ides. Je remercie grandement les membres du groupe Approches Interdomaines de la Rationalit volutionniste qui, ces deux dernires annes, ont particip aux rencontres et discussions portant sur des sujets aussi divers que les neurosciences de la dcision, la thorie des jeux ou encore la rationalit cologique. Jai aussi eu la chance de discuter de la pratique scientifique et de questions de physique avec Vincent Bouchard (Oxford), David Cot et Sylvie Brunet (Stanford), de thorie de linformation et de sciences sociales avec Jean Robillard (TELUQ) et Luciano Floridi (Oxford). Je remercie Jean en particulier pour mavoir inclu dans lorganisation des sminaires Communication Information et Cognition. Grce au projet McDonnell de neurophilosophie orchestr par luniversit Simon Fraser, jai pu bnficier dun sjour au California Institute of Technology et enrichir mes connaissances la croise en philosophie des neurosciences. Je tiens donc manifester ma reconnaissance pour toutes ces personnes et institutions. Un remerciement doit aussi tre adress Nicolas Payette pour les graphiques du chapitre 3. Paris, jai eu la chance de travailler lInstitut Nicod, un des meilleurs institut de philosophie dEurope, de ctoyer des chercheurs de
iv
renomme internationale et de vivre dans une communaut intellectuellement stimulante; je suis reconnaissant de cette opportunit, des ressources auxquelles nous avons accs. Mon passage a Paris fut une exprience enrichissante autant sur le plan acadmique et social. Merci Benjamin Sylvand, Julien Dutant, Damin Justo, Dario Taraborelli, Jrme Dokic et tout les membres de linstitut avec qui jai eu la chance dchanger. Jespre que cette interaction pavera la voie de plus grandes collaborations entre le Qubec et la France. Il me faut aussi remercier le Conseil de Recherches en Sciences Humaines du Canada, le Fond Qubcois pour la Recherche en Sciences Humaines et le Laboratoire dAnalyse Cognitive de lInformation pour leur soutient financier. La pratique dune philosophie informe par les sciences ne pourrait tre aussi aisment accessible de nos jours si des institutions, prives comme publiques, navaient pas procd linformatisation et la diffusion en ligne de nombreux livres et articles; la plupart des connaissances acquises au cours de la prparation de cette thse sont tributaires de cette diffusion. Je me dois dexprimer ma gratitude envers ces institutions pour avoir permis une telle dmocratisation des ides. Dans un registre plus personnel, jadresserais des remerciements mes amis avec qui jai eu loccasion de discuter abondamment du contenu de cette thse, Jean-Frdric de Pasquale qui me fut une source inestimable de connaissances, que ce soit en philosophie, en informatique ou en biologie, et Alexandre Brunet qui sest gnreusement offert pour relire ma thse et discuter des ides avances ici. Merci mon frre Michel pour son aide pour des questions techniques et logicielles. Je ne saurais remercier autant que je ne le pourrais mes parents pour leur support indfectible, lencouragement et la curiosit intellectuelle quils mont transmis, de mme que pour leur support financier lorsque, comme disait Ferr, cette fameuse fin du mois [revenait] sept fois par semaine . Jai eu la chance davoir des parents qui valorisent la connaissance, la rflexion et les tudes, je leur dois donc normment. Milles mercis. Merci aussi tous mes amis que jai si peu vu dans les derniers mois, de mme que mon fils Raphal. Finalement, un dernier remerciement pour ma fiance, et bientt mon pouse, Aurlie, qui cette thse est ddie. Sa patience, sa prsence, son support et son aide pour la correction mont permis daccomplir ce travail. Merci de tout coeur.
TABLES DES MATIRES

RSUM / ABSTRACT ........................................................................................... II REMERCIEMENTS ............................................................................................... III LISTE DES FIGURES .......................................................................................... VIII INTRODUCTION .................................................................................................. 10 1 QUELLE RATIONALIT POUR LES ANIMAUX ? ............................................... 15 1.1 La naturalisation dune question ................................................. 16 1.1.1 Le gymnaste et le naturaliste ............................................... 16 1.1.2 Analyse smantique vs analyse conceptuelle...................... 17 1.1.3 Espces naturelle vs espces nominales .............................. 19 1.1.4 Espces naturelles et naturalisme, synthse....................... 21 1.2 Varits de la rationalit ...............................................................23 1.2.1 Classification philosophique des concepts de rationalit ..24 1.2.2 Classification scientifique des concepts de rationalit.......27 1.2.3 Classification conomique des concepts de rationalit......30 1.3 La rationalit conomique comme domaine danalyse appropri 36 1.3.1 Pertinence conceptuelle.........................................................36 1.3.2 Pertinence pistmologique .................................................. 37
LA NATURE DE LAGENT RATIONNEL CONOMIQUE ..................................... 40 2.1 Les espces despces ................................................................... 40 2.1.1 Les espces naturelles nomothtiques ................................ 40 2.1.2 Les espces naturelles historiques........................................42 2.1.3 Les espces normatives .........................................................46 2.2 De quelle espce est lagent rationnel ? .......................................50 2.2.1 La comptence et la performance rationnelle .................... 51 2.2.2 Lagent rationnel comme espce nomothtique..................52 2.2.3 Problmes pour la conception nomothtique......................56 2.2.4 Lagent rationnel comme espce normative ....................... 61 2.2.5 Problmes avec la conception normativiste........................66 2.3 Lagent rationnel comme espce historique................................74 2.3.1 Ergodicit et temporalit ...................................................... 75 2.3.2 Les systmes dynamiques ..................................................... 75 2.3.3 Les systmes non-ergodiques ............................................... 77 2.3.4 systmes dynamiques et rationalit: synthse ..................78
vi
LINGNIRIE DE LA DCISION .................................................................... 81 3.1 La rationalit limite : compatible avec les normes ? ................82 3.1.1 Des agents plus ralistes .......................................................82 3.1.2 Le principe de sparation .....................................................84 3.1.3 Obligation ou description ? vers une troisime voie ..........85 3.2 La conception ingnirique de la rationalit.............................. 88 3.2.1 De la connaissance ingnirique......................................... 88 3.2.2 Explication et modle mcaniste .........................................92 3.2.3 Critique et dfense de lapproche ingnirique...................99 3.3 Modles de la comptence rationnelle ......................................104 3.3.1 Le contrle embarqu.......................................................... 107 3.3.2 Le contrle optimisateur .................................................... 110 3.3.3 Le contrle adaptatif ............................................................113 3.3.4 Contrle et dynamique de population ................................119 3.3.5 Rationalit limite et optimisation : conflit ? ................... 126 3.3.6 Le contrle base de simulations ......................................128 3.4 Synthse. Lagent rationnel, architecture de contrle.............. 136
DE LA PSYCHOLOGIE ORDINAIRE LA BIOLOGIE COMPARATIVE ................. 139 4.1 Linterprtivisme et sa mthode ................................................140 4.1.1 Davidson : La rationalit comme interprtation.............140 4.1.2 Psychologie ordinaire et interprtation de lanimal ........ 142 4.1.3 Interprter pour catgoriser .............................................. 145 4.1.4 De linterprtation la biologie comparative................... 147 4.2 Homologie et catgories biologiques ......................................... 149 4.2.1 L homologie en biologie comparative............................... 149 4.2.2 La reconstruction cladistique .............................................150 4.2.3 Des homologies comme espces naturelles ....................... 154 4.3 Homologie, mcanismes et adaptation ..................................... 157 4.3.1 Lexplication homologique-mcaniste-adaptative ........... 158 4.3.2 Des homologie cognitives.................................................... 159 4.3.3 De linterprtation larchitecture .................................... 163
LA RATIONALIT VERTBRE..................................................................... 165 5.1 Hume et Mller ........................................................................... 165 5.2 Animalis economicus. Les performances rationnelles des animaux...................................................................................................... 169 5.2.1 Un animal peut-il prendre des dcisions ?........................ 170 5.2.2 Des animaux maximisateurs dutilit ................................ 172
vii
5.2.3 5.2.4
Rationalit stratgique et sociale animale........................ 176 Utilit vs Aptitude ................................................................ 179
5.3 La comptence rationnelle animale........................................... 185 5.3.1 Les contrleurs embarqus................................................. 185 5.3.2 Contrle adaptatif et apprentissage..................................188 5.3.3 Le contrle base de modles ............................................ 196 5.3.4 Le contrle dans une dynamique de population ............. 203 5.4 6 Synthse ...................................................................................... 206 CONCLUSION. LCONOMIE DE LA NATURE................................................210
INDEX .............................................................................................................. 217 BIBLIOGRAPHIE ............................................................................................... 219
viii
LISTE DES FIGURES

Figure 1-1 Procdure de naturalisation.................................................................... 22 Figure 1-2 Concepts philosophiques et scientifiques de rationalit........................29 Figure 1-3 Le diamand de Nixon ..............................................................................30 Figure 1-4 Typologie des concepts de rationalit .................................................... 36 Figure 2-1 Urne de Polya........................................................................................... 77 Figure 3-1 Dcomposition mcaniste, d'aprs Craver (2001) ................................ 93 Figure 3-3 Architecture minimale de contrle....................................................... 108 Figure 3-4 Distributions probabilistes ....................................................................114 Figure 3-5 Distribution gale de stratgies ........................................................... 124 Figure 3-6 Distribution variable de stratgies ...................................................... 124 Figure 3-7 Contrle base de modles................................................................... 134 Figure 4-1 Matrice de traits ..................................................................................... 151 Figure 4-2 Cladogramme......................................................................................... 151 Figure 4-3 Cladogramme de traits......................................................................... 153 Figure 4-4 Varits de fonctions des membres pentadactyles...............................155 Figure 4-5 Dcomposition mcaniste de la mmoire spatiale (Craver 2002)..... 162 Figure 5-1 Espace dtats de la navigation chez le homard Homanus Americanus ...............................................................................................................172 Figure 5-2 Algorithme simplifi de fourragement, daprs (McFarland, 1999)...174 Figure 5-3 Stratgies d'histoires de vies................................................................. 184 Figure 5-4 SHV et comportement........................................................................... 184 Figure 5-5 Cladogramme des organismes dots d'un systme nerveux central . 186 Figure 5-6 Voies dopaminergiques (copyleft : www.lecerveau.mcgill.ca)...........191 Figure 5-7 Activits de neurones dopaminergiques, daprs (Schultz et al., 1997) .................................................................................................................................. 194 Figure 5-8 Rseau de neurones, d'aprs(Rumelhart et al., 1986))....................... 198 Figure 5-9 Rseau de neurons dot d'un modle interne (Rumelhart et al., 1986) .................................................................................................................................. 198 Figure 5-10 Cerveau vertbr gnrique (Shimizu, 2004)....................................205 Figure 5-11 Phylognie des rcepteurs de dopamine, (Le Crom et al., 2003)......206 Figure 5-12 Mcanismes de lagentivit rationnelle ..............................................207
Si lhomme navait pas t son propre classificateur, il net jamais song fonder un ordre spar pour sy placer (Darwin, 2004[1871]: 128) Tu as agi comme agirait quelque autre animal dou de raison, la grue, par exemple, si, distribuant les noms suivant ton procd, elle opposait les grues comme une espce distincte la multitude des animaux, et se faisait ainsi honneur elle-mme, tandis que, enveloppant tous les autres tres, y compris les hommes, dans une mme catgorie, elle les confondrait tous sous le nom de btes. Tchons donc de nous tenir dsormais en garde contre ces sortes derreurs. - Platon, Le Politique 263d
INTRODUCTION
Ltude psychologique du comportement rationnel nous rvle toutes sortes de discordances entre les thories de la rationalit, comme par exemple la thorie de la dcision, et le comportement rel des agents rationnels. Les thories de la rationalit, semble-t-il, sont trs exigeantes quant ce que doit faire un agent rationnel. Des expriences montrent par exemple que lorsquon offre des sujets le choix entre deux options, A et B, la premire tant incertaine mais trs payante, la seconde tant moins payante mais assure, les sujets prfrent systmatiquement la seconde, mme si en multipliant la probabilit par lutilit des options, la premire savre plus intressante. Les sujets dmontrent une aversion au risque, ce qui tendrait montrer que les agents ne se conforment pas aux thories normatives. Dans une autre exprience, un sujet doit choisir rptition entre une option A et une option B, lesquelles ne sont pas galement payantes. Un agent parfaitement rationnel devrait systmatiquement choisir l'option qui s'est rvle la plus payante, alors que dans les faits, les sujets vont apparier les probabilits: si A a t payante dans 70% des cas et B dans 30%, les sujets ont tendance essayer A dans 70% des cas et B dans 30%, ce qui au final est moins payant que d'essayer A dans 100% des cas. Finalement, dans cette autre exprience, on offre aux sujets le choix entre deux options A et B, dont l'utilit subjective est identique: A est plus intressante mais n'est offerte qu'aprs un certain dlai, alors que B est moins intressante mais est offerte immdiatement. Une troisime option, C, est encore moins intressante et offerte avec un plus grand dlai. Un agent parfaitement rationnel devrait tre indiffrent entre A et B, mais prfrer A C et B C. Lorsqu'on prsente aux sujets seulement les options A et B, ils dnotent une lgre prfrence pour A; lorsque toutefois ils ont le choix entre A, B et C, on observe alors une forte prfrence pour A. Or les thories de la dcision rationnelle stipulent que que des prfrences entre deux options ne doivent pas tre influences par la prsence ou l'absence d'une troisime option.
11
Ces rsultats ne sont pas en soi si surprenants : il nest pas inattendu que des agents rels ne se comportent pas comme le prdisent des thories qui dcrivent des agents idaliss. Sauf que dans ce cas-ci, les premiers sujets sont des rats, les seconds des singes et les troisimes des tourneaux, et que les choix , si on se refuse utiliser cette expression, taient des quantits de nourriture ou des gouttes de jus.1 Est-il vraiment justifi de dire que ces animaux ont pris des dcisions irrationnelles ? Pour poser un geste irrationnel, il faut bien tre, la plupart du temps, rationnel : un caillou ou une voiture ne peuvent pas tre irrationnels parce quil ny a aucun sens dire quils sont rationnels. Y a-t-il toutefois un sens dire que des animaux sont rationnels ou irrationnels ? Notre attitude intuitive nous indique que non, quun animal suit les instincts que lui dicte sa nature et que, sans capacits rflexives ou langagires, le comportement animal obit des principes rgls. Cette faon de penser saccorde tout--fait avec notre psychologie et notre biologie ordinaire, savoir nos thories intuitives du mental et du vivant. On a alors affaire ce quon pourrait appeler, pour reprendre une distinction de Sellars (Sellars, 1963) limage manifeste de lanimal. Or cette image manifeste peut gagner tre compare limage scientifique de lanimal. Il se peut que, comme limage manifeste de la cognition ou de la physique, ltude systmatique de la ralit ne saccorde pas avec nos intuitions. Cette question intresse bien sr la philosophie. Trop souvent toutefois, les philosophes ont parl des animaux pour parler de lhumain. Divisant le monde vivant en deux grandes classes, nous et eux , la philosophie sest contente de dfinir lanimal non humain par la ngative : par ce quil nest pas, ne fait pas ou ne dit pas, et sert ainsi dexemple pour dfinir ce que nest pas un tre rationnel. On court alors le risque dexpliciter non pas la nature de lanimal, mais de ce quon en dit, et de systmatiser nos prsuppos psychologiques et biologiques. Cette thse sintresse plutt limage scientifique de lanimal, ce que nous dit la biologie, les neurosciences et dautres domaines concerns par les animaux. Il est en effet philosophiquement important de dterminer ce quest un animal, ce que sont les animaux autres que ceux de notre espce, et dans quelles mesure on peut dire ou non quils sont rationnels. La question, bien sr, nest pas nouvelle, et toutes les recherches en thologie cognitive et en psychologie compare nont pas manqu de susciter lintrt des philosophes naturalistes : dans quelle
(Glimcher et al., 2005; Kagel et al., 1995; Schuck-Paim et al., 2004)
12
mesure les animaux ont-ils des thories de lesprit , des concepts, un langage, des croyances, etc. Ce ne sont toutefois pas ces questions qui seront abordes ici. Ces questions de psychologie animale sont intressantes en soi, mais dnotent un parti-pris pour une certaine conception de la rationalit et une certaine approche de la biologie animale. En effet, ces questions touchent plus ce quon appelera la rationalit thorique ou la rationalit des penses ou des croyances. Il sagit l dun certain type de rationalit et on ne peut affirmer a priori que la rationalit se rduit penser rationnellement. Pour lconomiste, lagent rationnel nest pas celui qui pense rationnellement, mais qui dmontre des prfrences rationnelles : sil prfre A B, il choisira A B. Lentit qui est value par des critres de rationalit nest pas une pense, mais un comportement. Le consommateur qui prfre acheter un item A un item B parce que le premier est moins coteux dmontre une forme de rationalit diffrente de la capacit articuler rationnellement des penses. Or si la question de la rationalit des penses animales est justifiable, la question de la rationalit de laction lest aussi, et par action nous entendrons ici des moyens comportementaux pour maximiser lutilit. De mme, plutt que de nous intresser en premier la psychologie animale, nous nous intresserons plutt aux approches cologiques et volutionnistes du comportement animal pour dterminer si, et dans quels sens, des animaux sont conomiquement rationnels. Prcisons tout dabord ce quest un animal. Le concept qui sapproche le plus de ce quon appelle usuellement un animal est le clade2 mtazoaire (si lon exclut les ponges), constitu des organismes eucaryotes (dot dADN), multicellulaires, mobiles et htrotrophes (ne produisant pas leur propre nourriture). Lhtrotrophie les distingue des plantes : alors que ces dernires, en majorit, autotrophes, les mtazoaires doivent rechercher leur source dnergie. Leur cologie les destine tre prdateurs, parasites ou dtrivores. La question de la rationalit animale, telle quelle sera pose ici, doit tre lue comme signifiant quelles espces animales sont conomiquement rationnelles ? Pour ce faire, il faut toutefois trouver un point de dpart neutre. On pourrait en effet compiler lensemble des recherches sur le comportement animal, ou encore dfinir la rationalit humaine et voir si elle sapplique aux animaux. Chaque point de dpart comporte ses problmes : dans le premier cas, on ne sait pas trs bien quels critres nous permettraient de juger de la rationalit animale, alors que dans lautre, on suit une dmarche qui suppose dj quun agent rationnel est quelque chose qui se
Nous renvoyon le lecteur au chapitre 4 pour une prsentation du concept de clade.
13
mesure laune de la rationalit humaine. Notre approche sera plutt diffrente. Avant de considrer quoi que ce soit sur ltendue de la rationalit conomique dans le monde vivant, nous nous intresserons plutt la nature de lagent rationnel. Cette nature, lconomie la dcrit en partie, mais ces descriptions ont rencontr certains problmes qui seront abords, entre autres celui de sappliquer difficilement notre espce. Outre ce problme descriptif, ces thories, bien quelles dcrivent les contraintes que doit satisfaire un agent conomiquement rationnel, sont aussi muettes quant aux mcanismes de traitement de linformation par lesquels des agents atteignent leurs objectifs. Elles offrent cependant un vocabulaire et des concepts assez prcis pour construire un modle gnral de lagent rationnel. Pour reprendre une mtaphore qui sera utilise plus loin, tudier la rationalit animale revient dcouper ltoffe ontologique de la biologie avec des ciseaux philosophiques de faon y regrouper seulement les agents rationnels; le problme crucial de cette entreprise est quelle implique quon conoive aussi le patron de la dcoupe. Une fois celui-ci dtermin, le dcoupage en suivra aisment les contours. Ce nest donc quune fois quon a statu sur la nature de lagent rationnel, sur le type de rationalit implique, sur les comptences que doit possder un agent rationnel et sur la juste manire pour dterminer lextension de ce concept quon peut alors poser la question de la rationalit animale. Il faut ainsi spcifier la nature de ce concept dans lespace logique de nos connaissances scientifiques et juger ce qui dtermine ce concept et ce quil dtermine, au plan pistmologique, ontologique, conceptuel et scientifique. Aussi cette thse traitera-t-elle en grande partie dun agent rationnel, en proposera un modle gnral, labor partir de travaux en intelligence artificielle, en thorie du contrle et en conomie. La question de la rationalit animale se rsoud donc la question de ltendue, dans le monde vivant, de la rationalit conomique, et que cette question relve en partie de la biologie comparative plutt que de nos capacits attribuer de lintentionalit, de lintelligence ou du mental. Prcisons quils sagit ici de philosophie des sciences, de lconomie et la biologie, plutt que de la philosophie de lesprit ou du langage. Au premier chapitre, nous ferons valoir avec plus de dtails limportance de la rationalit conomique animale. Les autres concepts de rationalit seront discuts, et la pertinence du concept conomique de rationalit pour cette entreprise sera dtaille. Le second chapitre se penche sur lattitude ontologique approprie lgard des agents rationnels, et conclut quils doivent tre considrs comme une espce naturelle historique : ce ne sont ni des espces nomothtiques (dcrites par des lois) ni des espces uniquement normative (dcrites par des normes humaines).
14
Le troisime chapitre propose, pour rgler diffrentes questions qui touchent laspect normatif du concept de rationalit, de considrer que la rationalit est une notion ingnirique plutt que scientifique ou philosophique (ce qui nempche pas bien sr les autres disciplines de sy intresser). Nous prsenterons un modle mcaniste de la comptence rationnelle, inspir des thories du contrle adaptatif ainsi que de divers rsultats en intelligence artificielle. Le quatrime chapitre argumente leffet que la conception couramment employe pour catgoriser les tres rationnels, soit linterprtivisme, commet une erreur de raisonnement car il a recours un critre homoplasique (similarit de fonction) pour individuer des traits, alors que la catgorisation en biologie est surtout homologique (similarit danctre). Dterminer ce qui, dans le monde vivant, est dot dune comptence rationnelle signifie quon identifie une classe de mcanismes homologiques, et que ltendue des agents rationnels est une question de biologie comparative et non dinterprtabilit. Le cinquime chapitre propose de considrer que la classe des agents rationnels et le clade vertbr sont co-extensifs et constituent ainsi une espce naturelle, dot de prorprits scientifiquement pertinentes. Les vertbrs exhibent certaines proprits de surface, savoir des performances de comportements maximisateurs dutilit, ainsi que le montre lcologie du comportement. Ces performances sexpliquent par un mcanisme sous-jacent, la comptence rationnelle, dont les composantes mcaniques sont des homologues dans tout le clade vertbr. Le rle des systmes de neurones dopamingergiques sera discut cet gard.
15
QUELLE RATIONALIT POUR LES ANIMAUX ?
Non, les animaux ne sont pas rationnels. tre rationnel, peu importe ce quon entend par l, nest pas une proprit constitutive du concept ANIMAL3 et en cela le biologiste, le philosophe et le sens commun saccordent. Ils doivent toutefois prendre cette affirmation au pied de la lettre : il nest pas le cas que tous les animaux soient rationnels. Cela ne veut pas dire pour autant quaucun animal nest rationnel : il y a aprs tout au moins un animal rationnel connu, notre espce. Ce qui signifie que de lanimalit on ne peut infrer la rationalit, et que la rponse la question les animaux sont-ils rationnels ? se rsoud en rpondant la question quels animaux sont rationnels ? . Mais comment rpondre cette question ? La premire partie de ce chapitre (1.1) rejette lide quune seule analyse smantique sera suffisante, et invite plutt rechercher o, dans lameublement du monde, se trouvent les agents rationnels et quelles proprits objectives font quun agent est rationnel. Pour dterminer si certains animaux sont rationnels ou non, il faut bien sr dterminer ce que lon entend par rationalit . cette fin, diffrents concepts philosophiques et scientifiques de rationalit seront discuts et valus. Il sera propos que le sens de rationalit soit restreint son sens conomique, selon lequel un agent rationnel maximise son utilit (section 1.2). La pertinence conceptuelle et pistmologique de ce choix seront discuts (section 1.3).
Conformment lusage en sciences cognitives, nous utiliserons les majuscules pour signifier que nous parlons du concept de X, non du mot x ou x lui-mme.
3
16
1.1
LA NATURALISATION DUNE QUESTION
La question de la rationalit animale, ainsi que nous entendons la reformuler, est une question qui touche ltude des proprits objectives des constituants du monde. Cette tude implique ladoption dune certaine attitude philosophique quon peut qualifier de naturaliste4 : la continuit entre la philosophie et la science. Au sens o il sera entendu ici, le naturalisme signifiera lemploi critique des mthodes, thories et concepts scientifiques, dans un processus que Goodman appelait quilibre rflchi (Goodman, 1984[1954]) : une dynamique dajustement rciproque entre des connaissances scientifiques et des problmes philosophiques. Cet quilibre demande la fois un certain libralisme relativement aux concepts scientifiques le philosophe nest pas tenu, comme le dit Proust (1997: 344), dtre linterprte passif des thories empiriques en vigueur - et un certain conservatisme dans la mise jour des concepts philosophiques: ceux-ci se trouvent en effet contraints par les thories scientifiques lorsque les deux types de connaissances traitent du mme objet. Lune des contraintes qui sera souligne ici est de type ontologique : lorsque la science procde des catgorisations, une partie de cette tche consiste identifier des espces naturelles, soit des catgories dont on dit, comme le veut la formule, quelles dcoupent la nature ses articulations. Le philosophe qui entend alors fournir une explication naturaliste dun phnomne peut lchafauder laide de ces catgories. 1.1.1 LE GYMNASTE ET LE NATURALISTE
Dans le Criton , Platon se demande qui un gymnaste doit faire confiance pour pour son rgime. Doit-il suivre lavis de chacun ? Non, ditil, il faut qu'il fasse ses exercices, rgle son rgime, mange et boive sur l'avis de celui-l seul qui prside la gymnastique et qui s'y connat, plutt que d'aprs l'opinion de tous les autres ensemble . Son matre de gymnastique est mieux plac pour le conseiller ce sujet, parce quil connat aussi bien le gymnaste que la gymnastique. Le naturaliste, en philosophie, opte pour la mme attitude lgard des concepts thoriques: plutt que de se fier uniquement au sens commun, il se fie aux disciplines qui touchent ce concept. La coupure est toutefois moins radicale dans ce cas-ci, car pour certains concepts, les spcialistes sont des philosophes. Mais avec le progrs des sciences, la perspective de concepts
Voir (Dretske, 1981, 1988, 1995; Godfrey-Smith, 1996; Kornblith, 2002; Millikan, 1984, 2005; Papineau, 2003; Proust, 1997, 2003, 2005, 2006; Sterelny, 2003b; Walsh, 2001) pour dautres projets de naturalisation de lesprit ou de la rationalit.
4
17
exclusivement philosophique est obsolte5. Ainsi, les tentatives danalyser a priori la nature de lespace se sont rvles tre des checs : contrairement lintuition, la physique moderne nous enseigne que la structure de lespace nest pas euclidienne. Cela ne signifie pas quil ny ait pas de questions philosophiquement pertinentes poser sur lespace. Nos intuitions linguistiques peuvent servir expliciter une dfinition usuelle dun terme, mais lusage correct dun terme devra au final tre en continuit ou du moins cohrent avec lusage scientifique. Toute mthode a priori ne peut que renforcer ou clarifier des convictions dj prsentes, une tche certes louable, mais sa capacit gnrer des nouvelles connaissances est limite. Quant elle, la philosophie nest pas une discipline dtache de la science, mais une activit qui salimente de la science tout en la nourrissant. Appliqu la question de la rationalit animale, cela signifie que pour rpondre cette question, il faut sattendre employer les concepts et lontologie des sciences qui touchent aux animaux et aux tre rationnels, les valuer ou les critiquer, dans une perspective dquilibre rflchi. 1.1.2 ANALYSE SMANTIQUE VS ANALYSE CONCEPTUELLE On a cependant souvent prfr, la question de lextension de AGENT RATIONNEL , une approche par la smantique et les dfinitions qui rgissent ce concept (et ses corrlats : CROYANCE, DSIR, ACTION, etc.) Dans aucun cas il nest question de sengager ontologiquement envers lexistence de certaines proprits causalement responsables des comptences ou performances rationnelles6. Ainsi Davidson, dans son texte Animaux Rationnels, prcise quil ne veut pas dterminer si les dauphins, les singes ou les humains sont des animaux rationnels, mais ce qui fait quun animal (ou quoi que ce soit dautre, si lon veut) est rationnel (1991 :63), ; dans Rationality, Bennett, linstar dAristote, spcifie doffice quil entend par rationalit est ce que les humains possdent et qui les dmarque, relativement aux capacits intellectuelles, de faon claire et importante des autres espces (Bennett, 1971:5). Lanalyse smantique ne conduit pas ncessairement celui qui lendosse faire des humains les seuls animaux rationnels; on pourrait, par le mme principe, arriver une thse oppose. Lanalyse smantique ne dtermine pas en elle-mme une rponse particulire, bien que des
Tout comme la perspective de concepts scientifiques sans contenu philosophique est irrelle. Pour paraphraser Keynes, un scientifique qui se dit pratique , sans rflexion philosophique, est souvent victime dun philosophe dcd.
5 6
Une dfense de cette faon de faire est dveloppe dans (Jackson, 1998).
18
arguments comme ceux de Davidson et Bennett aient t courants parmi les analyses smantique de rationnel . Distinguons lanalyse smantique de lanalyse conceptuelle : la premire analyse les infrences quun concept autorise (de CHIEN, dduire MAMMIFRE ); la seconde est une analyse plus gnrale, qui consiste dcomposer, critiquer, et reformuler un concept, ce que Carnap appelait lexplication :
la tche qui consiste rendre plus exact un concept qui soit vague ou pas tout--fait exact dans son usage quotidien ou dans un tat antrieur du dveloppement scientifique ou logique, ou encore le remplacer par un concept nouvellement construit qui soit plus exact. (1947: 8-9.)
Lanalyse conceptuelle, mme pour les philosophes naturalistes, nest pas condamnable en soi, lorsquelle dbouche sur des nouvelles connaissances. Le travail des philosophes des sciences apportent de nombreuses clarifications aux thories scientifiques : ils soulvent des zones grises ou des incohrences, tentent de systmatiser et de critiquer des intuitions rpandues, tablissent des liens entre diffrentes disciplines, et suggrent des rarrangements conceptuels, entre autres. Au bout du compte, le travail demeure un travail danalyse conceptuelle. On peut toutefois souligner certains problmes dans lanalyse conceptuelle lorsque le travail philosophique ne sintresse qu lintension des concepts, et ne se penche pas sur leur rfrence, sur les objets, proprits et vnements qui sont regroups ensemble par lanalyse du concept, de mme que ceux que cette analyse exclut, surtout lorsquon dispose dune connaissance scientifique considrable sur le sujet. Prenons lexemple des motions : sil est louable dexpliciter les diverses significations des motions, qui sont pour certains philosophes (Nussbaum, 1990) une sorte de jugement ou dattitude propositionnelle, cette entreprise ne peut faire la sourde oreille aux neuroscientifiques qui affirment que des motions primaires entrent dans le cours de nos penses sans pour autant tre dots de contenu propositionnel (Damasio, 1999). Ou bien ceux-ci se trompent, et ne parlent pas rellement dmotions, ou bien ces philosophes ont intellectualis les motions et sont dans lerreur. Peu importe la position quon prend, une analyse valable du concept MOTION ne peut faire lconomie de connaissances qui portent sur les motions en elles-mmes et qui peuvent ainsi seconder le travail dexplicitation et de clarification philosophique. Les mmes remarques sappliquent la question de la rationalit animale. Lthologie, la neurobiologie, lconomie, la psychologie comparative et la biologie volutionniste tant des sciences plutt jeunes, il est normal que les philosophes dantan naient pu faire appel des donnes et concepts de ces sciences pour justifier leurs positions et en appellent plutt lintuition. Il y a certes quelques utilisations
19
anecdotiques du comportement animal (le chien de Chrysippe ou encore les chevaux et les chiens chez Hume), mais aucune qui ne soit une authentique intervention de connaissances scientifiques dans la querelle des btes . Si on peut le comprendre pour les philosophes dautrefois, il est en revanche moins comprhensible que de nombreux philosophes contemporains sen remettent leur thorie biologique intuitive (folkbiology), laquelle, on le sait, est minemment biaise et ne saccorde pas toujours avec les catgories biologiques relles (Medin & Atran, 1999). 1.1.3 ESPCES NATURELLE VS ESPCES NOMINALES Quand Davidson affirme qu tre un animal rationnel, cest prcisment avoir des attitudes propositionnelles (Davidson, 1991: 63), et que ce critre constitue une condition ncessaire et suffisante pour tre un animal rationnel, nous nen savons pas plus sur les animaux, rationnels ou non, mais disposons plutt un mode demploi du langage intentionnel (Proust : 1997 :54). Cette mthode est moins susceptible de nous apporter de nouvelles connaissances que de consolider des connaissances ou croyances dj tablies7. Ontologiquement, le problme de lanalyse smantique est quelle dbouche sur des espces nominales plutt que naturelles8, et que seules les dernires sont mme de nous enseigner sur lameublement du monde. Une espce nominale est une catgorie dentits dtermine par des dfinitions, des rgles, des conditions ncessaires et suffisantes ou plus gnralement par des essences nominales. La catgorie aristotlicienne OBJETS SUPRALUNAIRES , les objets situs au-del de la lune, est une catgorie qui, si elle peut tre dcrite en conditions ncessaires et suffisantes, constitue un ensemble htroclite de quasar, dtoiles, de comtes, etc. Cette catgorie est cre par une dfinition, mais ne peut soutenir aucune induction scientifique. De mme, une catgorie comme JADE est une espce nominale : tous les chantillons de jade sont faits dune pierre prcieuse verdtre mais cette catgorie nest pas une espce naturelle: ce qu'on appelle jade est en fait une catgorie htrogne compose de deux types de minraux, la jadite [Na(Al, Fe)Si2O6] et la nphrite [Ca2(Mg,Fe)5Si8O22(OH)]. En gnral, outre les espces
Voir (Peirce, 1877) pour une discussion clairante des diffrentes mthodes pour fixer les croyances : la mthode de la tnacit, de lautorit, a priori et scientifique.
7
La notion despces et dessences naturelles ou relles, contrastes avec les espces et essences nominales, a une longue histoire en philosophie, continuellement associe la question de linduction. Voir (Locke, [1689]2001; Mill, 1848; Whewell, [1860] 1971) pour les rfrences classiques, (Kripke, 1972; Putnam, 1975; Quine, 1969) pour la rintroduction du concept dans la philosophie contemporaine et (Boyd, 1991, 1999b; Griffiths, 1994, 1997; Hacking, 1991; Riggs, 1996) pour des discussions rcentes.
8
20
mathmatiques9, les espces nominales ne sont pas scientifiquement pertinentes. Une catgorie est pertinente si elle mne ce que Sperber et Wilson appelle un effet cognitif positif 10: mener une vraie conclusion, rviser rationnellement des croyances, rpondre une question, etc. En science, les catgories ont des effets cognitifs positifs lorsquils soutiennent des infrences faillibles mais informatives comme des inductions, gnralisations ou prdictions ou encore lorsquelles figurent dans des explications. Dterminer ltendue dun concept en tentant de mettre jour les rgles dinfrences qui le gouverne ou encore des conditions ncessaires et suffisantes peut identifier une catgorie scientifiquement pertinente, mais offre moins de garantie cet effet quune rduction des espces naturelles. Les catgories scientiquement pertinentes sont des espces dites naturelles (natural kind). Une espce naturelle est une catgorie dentits dont lhomognit ou la ressemblance ne provient pas dune dfinition, mais dune nature commune considre comme tant objective; elles sont form[e]s par la nature, non par de simples dfinitions 11. Ces catgories soutiennent des inductions en vertu de la possession dun ensemble de proprits unies par des relations empiriques (causalement ou par corrlation) plutt que logique. Les espces naturelles comportent des proprits de surfaces et une structure sous-jacente, usuellement identifie par des dcouvertes scientifiques. Les proprits de surface des membres la classe sont expliques par une structure sous-jacente qu'une thorie aura mis au jour. L'eau, par exemple, possde certaines proprits de surface par lesquelles nous l'identifions: son poids, son point d'bullition, sa liquidit temprature normale, etc. Ces proprits sont expliques par le fait que tout chantillon d'eau possde la mme structure molculaire, savoir H2O. La structure sous-jacente partage par chaque membre de la catgorie EAU fait en sorte qu'un chantillon d'un liquide dot de cette structure sera de l'eau. Si en revanche, un liquide ne possde pas cette structure, il ne peut tre considr comme de l'eau, mme s'il a les mmes proprits superficielles.
TRIANGLE et TANGENTE, par exemple sont des espces mathmatiques qui supportent linduction : la somme des angles de tout triangle dans une gomtrie euclidienne sera de 180, une tangente ne touche qu un point dun courbe.
9 10
(Sperber & Wilson, 1989, 2004) La dfinition est de William Whewell ([1860] 1971, 290).
11
21
L'identification d'une espce naturelle circonscrit des corrlations de proprits projectibles (Goodman, 1984[1954]), cest--dire quelles permettent de faire des prdictions: ce qui sera dcouvert avec un chantillon d'eau E1 pourra tre gnralis l'ensemble des membres de la classe, et on est justifi de croire que le prochain chantillon d'eau E2 se comportera comme E1. La ressemblance superficielle dchantillon de jades, en revanche, ne s'explique pas par une structure sous-jacente commune et donc on ne peut justifier des inductions propos des chantillons de jade. La rfrence de JADE est partielle, et ce concept est donc aussi inutile en science que VLEUE (Goodman, Ibid.), cest--dire vert jusqu' un certain moment t et bleu ensuite . Le problme avec les espces nominales, c'est qu'elles risquent dtre identifies par des conditions qui ne sont, en fait, ni ncessaires ni suffisantes pour individuer une espce, comme Kripke et Putnam l'ont soulign12. On peut trs bien faire rfrence X tout en se trompant propos de X, il demeure qu'on fait toujours rfrence la mme substance. Lorsquon a dcouvert que les baleines sont des mammifres et non des poissons, lnonc les baleines sont des poissons n'tait plus vrai, mais baleine et BALEINE rfre toujours aux baleines. De mme, si sur une autre plante trouve un liquide dot des mmes proprits de surface que l'eau mais dont la structure molculaire est diffrente, alors ce liquide n'est pas de l'eau, mais quelque chose d'autre. La connaissance avance donc par la mise au jour des espces naturelles; si en plus elles peuvent tre dcrites par des conditions ncessaires et suffisantes, tant mieux; la rectitude dfinitionnelle nest cependant pas la premire vertu des concepts scientifiques, car on lui prfre souvent le potentiel inductif et explicatif. GNE est une espce naturelle bien qu'on soit loin d'avoir une dfinition en termes de conditions ncessaires et suffisantes (Falk, 2000) : cette catgorie est toutefois pertinente, parce qu'elle guide la recherche en biologie. 1.1.4 ESPCES NATURELLES ET NATURALISME, SYNTHSE Limportance des espces naturelles, pour le philosophe naturaliste, est quelles permettent de distinguer dune part, les catgories partir desquelles des inductions pertinentes et des explications informatives pourront tre produites et, dautre part, des catgories non pertinentes. Des concepts artificiels comme NON-CHAT ou OBJET DE PLUS DE 100 KILOS, nont pas de structures sous-jacentes qui puissent expliquer leur suppose unit. ce titre, elle ne figurent pas dans lontologie dune science mature.
12
(Kripke, 1972; Putnam, 1975)
22
Notons au passage que certaines catgories peuvent tre des espces naturelles pour une science mais non pour une autre : ANIMAL DOMESTIQUE nest pas une espces naturelle de la biologie volutionniste, mais peut ltre pour lanthropologie ou la sociologie : cette classe est unie par un processus de domestication humaine. Le naturalisme, le ralisme lgard des espces naturelles et la conception de lexplication telle que la voyait Carnap nous donnent une procdure pour analyser des concepts de faon scientifiquement pertinente. partir des proprits de surface dune catgorie, on peut tenter de dterminer si la catgorie : est une espce naturelle (ex : EAU) est un ensemble despces naturelles (ex : JADE) est un ensemble despce naturelles et non naturelles (ex : les MOTIONS, selon Griffiths, qui sont en partie des espces sociales.) est un ensemble despces non naturelles (ex : les DMONS) Ce quon peut reprsenter comme un algorithme :
Figure 1-1 Procdure de naturalisation
On sait alors si le concept de dpart est un concept intressant pour la connaissance, sil faut lliminer ou le scinder. Nous appliquerons cette faon de faire au concept dAGENT RATIONNEL. Quon ne stonne pas, donc,
23
de ne pas trouver dans ce travail des dfinitions en termes de conditions ncessaires et suffisantes : ce ne sont pas des traits distinctifs des espces naturelles, mais des espces nominales, produits de louvrage de lentendement (Locke, [1689]2001) plutt que de la nature. Le propre des espces naturelles est plutt davoir un nombre inexhaustible de proprits qui se rvleront dans la recherche plutt quun nombre fixe de proprits dtermines par des dfinitions.
EN RSUM : naturaliser la question de la rationalit animale signifie rechercher lextension relle de la catgorie AGENT RATIONNEL. Lextension de cette catgorie nest pertinente que si elle constitue une espce naturelle.
1.2
VARITS DE LA RATIONALIT
linverse de la mthodologie naturaliste ici, lanalyse smantique, elle, ne nous amne pas mieux comprendre les proprits objectives des entits tudies. Analyser le concept AGENT RATIONNEL pour le rendre logiquement correct et cohrent avec le sens commun ne nous apprend rien sur la rationalit et son lien avec le monde vivant, mme si nous tions effectivement les seuls animaux rationnels. Tout au plus, cela permet dexpliciter comment lhumain se reprsente sa rationalit ou celle des autres. Ce quil nous faut, pour une thorie naturalise de la rationalit, cest une connaissance de lextension de ce concept, ce que lanalyse du sens commun peut difficilement garantir. O trouverons-nous ces espces naturelles qui nous permettront davoir une conception naturaliste de la rationalit (et par le fait mme de son extension) ? Ultimement, dans la biologie (neurobiologie et cladistique). La biologie nest toutefois pas une science des agents rationnels; elle constituera plutt le point darrive de notre rflexion, le domaine dans lequel nous tenterons dancrer les catgorie qui figurent dans les thories de la rationalit. Pour linstant, il importe de distinguer certains concepts de rationalit pour viter tout malentendu. Le problme est que philosophes et scientifiques ne sentendent pas toujours sur les types de rationalit, aussi faudra-t-il diffrencier des classifications philosophiques, scientifiques et conomiques et y mettre un minimum dordre.
24
1.2.1 CLASSIFICATION PHILOSOPHIQUE
DES CONCEPTS DE RATIONALIT
La rationalit se dit de plusieurs faons mais on peut, en philosophie, les rduire deux grandes catgories13. La rationalit pratique concerne les critres de rationalit des actions, des dcisions, des intentions ou des plans, alors que la rationalit thorique concerne les critres de rationalit des propositions, des croyances, des penses, des infrences et des raisonnements qui sont valus ainsi14. Dans le premier cas, les raisons de lagent rationnel sont des raisons dagir, dans le second, des raisons de croire15. Plus gnralement, on peut caractriser ces deux ordres dvaluation par ce quils maximisent : la rationalit pratique vise le bien, le bonheur ou la satisfaction des dsirs de lagent, ce quon peut rsumer par lutilit; la rationalit thorique, elle, maximise la vrit et la cohrence logique. Nous distinguerons ces deux concepts, en essayant de rduire la confusion qui parfois assimile lun lautre. Notons que nous ne traiterons pas pour linstant de la rationalit limite , procdurale ou cologique : ces concepts rfrent des modles plus ralistes et descriptifs de rationalit pratique, et en cela sont des varits de la rationalit pratique. La rationalit thorique Un agent thoriquement rationnel, dans sa forme idale, a des croyances vraies et justifies, les revise en fonction des vidences et selon prescriptions du thorme de Bayes16, matrise les rgles dun langage qui lui permet dexprimer et justifier ces croyances, les organisent en thories systmatiques, lesquelles sont values par leur adquation aux thories produites par une communaut dexperts; partir de ces croyances, il peut en infrer dautres en suivant des rgles logiques ou mathmatiques. Lpistmologie, la logique ou la smantique sont des entreprises de
13
Nous ignorerons cependant des conceptions qui lassimile la moralit. Voir Harman (1999, chapitre 1).
14
(H. I. Brown, 1995: 745), dans le Oxford Companion to Philosophy : [La rationalit] est une proprit que les agents cognitifs exhibent lorsquils adoptent des croyances sur la base de raisons appropries
15 16 Le
thorme de Bayes stipule que la probabilit a posteriori dune hypothse H, tant donn une observation O, est proportionnelle au produit de la probabilit de O tant donn H, multipli par la probabilit a priori de H, divis par la probabilit de O : P ( H /O ) = P ( O /H) x P (H) P (O)
25
formalisation de la rationalit thorique, alors que lactivit scientifique et philosophique est un exercice de cette rationalit. La question de la rationalit thorique animale ne se pose pas : il est clair quils nont pas de logiciens, de scientifiques ou de mathmaticiens ni les structures sociales ncessaires au dveloppement des connaissances (universits, institut de recherches,e tc.), lesquelles fournissent les thories aptes justifier des croyances. Lastrologie et la numrologie sont des systmes de croyances typiquement considres comme irrationnelles; bien sr les animaux ny adhrent pas, non parce quils sont rationnels cet gard, mais parce quils nont pas la possibilit dy adhrer ou non. Pour adhrer lastrologie, il faut pouvoir lire son horoscope dans le journal ou des livres ce sujet, consulter des astrologues, etc, quelque chose quaucun animal ne peut faire. La rationalit thorique est inhrente aux activits humaines qui impliquent le langage, la science et la technologie; elle est une rationalit essentiellement sociale (Goldman, 1999), car les raisons de nos croyances tout comme nos croyances ellemmes sont explicites par le langage. Nous dmontrons notre rationalit thorique par la lecture, lcriture, la discussion mais aussi et surtout par ce que Brandom (Brandom, 1994) appelle la production et la demande de raisons : les agents thoriquement rationnels sont, en principe, capable doffrir des justifications pour leur croyances et dexiger des autres quils expriment des raisons pour les leurs. La rationalit pratique-thorique En revanche, la question de la rationalit pratique animale nest pas aussi simple. Sans avoir duniversits ou de logiciens, les animaux non humains posent, en un sens ordinaire, non philosophique, des actions. Il chassent, fuient, se reproduisent, etc. On est en droit de se demander dans quelle mesure ces actions peuvent tre des actions rationnelles au sens o lentend le philosophe, et si les animaux peuvent tre des agents rationnels, donc si il y a une rationalit pratique animale. On ne peut carter a prori la question, moins de rduire la rationalit pratique une forme de rationalit thorique. Ce que fait par exemple Velleman (1989:10), qui soutient que:
() la dliberation consiste en une introspection (self scrutiny) et les intentions en des croyances rflexives. Jenvisage de rduire le raisonnement pratique une forme de raisonnement thorique, et les conclusions pratiques une sorte de conclusion thorique.
Ce faisant, on rduit les raisons dagir aux raisons de croire et la thorie de laction la thorie de la connaissance; plus gnralement, on sur-intellectualise lesprit (Hurley, 2003). La rationalit pratique nest quune forme de rationalit thorique, dote dun contenu pratique.
26
Dans cette faon de concevoir la rationalit pratique, agir de faon rationnelle signifie agir selon des croyances (et des dsirs) dont lagencement est conforme aux critres de rationalit thorique. Chaque dcision doit tre justifiable, ce qui implique quune dcision ne peut tre rationnelle moins quon puisse reconstruire un argument dont la conclusion est une intention ou une croyance leffet que cette action doit tre pose. On suppose alors que lagent a des croyances et dsir tels quil aurait pu dmontrer, par dduction, que son acte tait dsirable (D. Davidson, 1993a). Les consquences pour le domaine de la rationalit sont claires : cette notion sapplique uniquement des tres humains, capables de justifier leurs actes. Sans capacit dvoquer des croyances pour se justifier, les animaux ne peuvent tre des agents rationnels. Qui plus est, pour pouvoir se justifier, il faut encore entretenir des attitudes propositionnelles, et cela ne peut se faire sans langage. Or cette conception, que nous appellerons rationalit pratique-thorique, nest pas acceptable car elle gomme la diffrence entre la rationalit pratique et thorique, la rationalit thorique tant un ensemble de procdures dont lissue est une croyance (vraie, justifie, cohrente avec dautres, etc.), alors que la rationalit pratique mne une action, ou du moins lintention ou la planification dune action. La rduction de la rationalit thorique la rationalit pratique est une confusion des valeurs althique et pragmatique17. On pourrait cependant poser la question dune rationalit cognitive animale : la capacit reviser des croyances face des vidences, la possession danticipations ou encore de mtacognition. On sait par exemple que la dtection de lincertitude est semblable chez les dauphins, les singes et les humains (Beran et al., 2006; J. D. Smith et al., 2003). Rien dans cette conception de la rationalit ne nous oblige considrer que la possession du langage ou dinstitutions intellectuelles est constitutive de la rationalit individuelle. Aussi importante cette question soit-elle, nous nen traiterons pas ici, la question ayant t souvent aborde18, et lobjet de cette thse est dexplorer la possibilit dune rationalit du comportement plutt quune rationalit psychologique. videmment, ces deux projets sont complmentaires; les ides avancs ici visent participer un seul de ces projets.
Voir (Doyle, 1992) pour limportance de la distinction en intelligence artificielle entre la rationalit logique (thorique) et conomique (pratique).
17 18
Voir par exemple (Proust, 1997, 2003, 2006).
27
Rationalits pratique et thorique Il faut donc diffrencier clairement la rationalit pratique de la rationalit thorique. Harman (1999) distingue les deux par leur traitement de larbitraire des choix et de la pense magique (wishful thingking ). Sil faut dcider de croire A ou B et quaucune information nest disponible pour soutenir lun ou lautre (chaque croyance est quiprobable), adopter lun ou lautre est irrationnel, car alors la croyance nest pas justifie par des raisons. Tirer pile ou face pour savoir la vrit de quelque chose est contraire la raison thorique. En revanche, dans un contexte daction, lorsquon doit choisir entre faire A ou B, chaque action ayant autant dutilit, il peut tre tout fait rationnel dopter arbitrairement pour lun ou lautre. Si le chemin A ou le chemin B vous permette darriver votre travail dans le mme laps de temps, et reprsente pour vous la mme utilit, un choix arbitraire nest pas irrationnel. Ce qui serait irrationnel, ce serait de demeurer dans linaction, comme lne de Buridan, incapable de choisir entre un seau d'avoine et un seau d'eau, les deux tant galement dsirables. Quant la pense magique , elle nest pas justifie dans un contexte thorique : laisser un dsir influencer une croyance, comme croire que demain il fera beau car on dsire quil en soit ainsi, est thoriquement irrationnel; laisser un dsir influencer son action, comme un dsir de russir un examen qui amne tudier de faon approfondie, nest pas irrrationnel. De faon plus gnrale, lirrationalit thorique se manifeste dans lenchanement des raisons, lorsque quelquun par exemple commet le sophisme de la ngation de lantcdent; lirrationalit pratique se manifeste dans lenchanement des raisons avec laction (allumer une cigarette alors quon veut arrter de fumer, par exemple), telle quil se rvle dans lakrasie. Dans un cas on choue maximiser la vrit, dans lautre cas maximiser notre utilit. On peut donc distinguer assez clairement la rationalit thorique de la rationalit pratique, et la rationalit dite pratique-thorique est un confus mlange des deux notions. En soi, le concept de rationalit pratique est trop vague pour tre appliqu directement aux animaux. Nous proposons donc de le subdiviser, en faisant intervenir dautres concepts de rationalit utiliss en science. 1.2.2 CLASSIFICATION SCIENTIFIQUE DES CONCEPTS DE RATIONALIT Kacelnik (2005) rpertorie 3 concepts de rationalit en fonction de lusage qui est fait des thories de la rationalit en science. Cette classification recouvre partiellement celle des philosophes. La premire catgorie est la B-rationalit (maximisation de laptitude, telles quon la retrouve en b iologie), la E-rationalit (maximisation de lutilit, en
28
conomie), et la PP-rationalit (le concept de rationalit en philosophie et psychologie, que nous appelons maximisation de la vrit ). La B-rationalit, qui na de la rationalit que le nom et le caractre maximisateur, fait rfrence tous les modles de gntique des populations o on suppose que des agents maximisent leur propre valeur daptitude.19 Ces modles postulent une fonction daptitude (fitness ) optimiser et un agent qui la maximise. Il va de soi que, comme tous les animaux (mais aussi les plantes) sont des individus biologiques qui maximisent leur aptitude, cette conception est limine doffice: rduire la rationalit de laction la seule maximisation de laptitude, dans lesprit de la sociobiologie de Wilson, est considr gnralement comme fallacieux : les organismes vivants sont plutt des excuteurs dadaptations (ils se comportement en fonction de leur dispositions adaptes) que des maximisateurs daptitude (Tooby & Cosmides, 2005: 14). La PP-rationalit, en tant quelle porte sur la rationalit des croyances, regroupe la rationalit thorique au sens strict et la rationalit pratique-thorique, (voir fig. 1-2). Le concept de E-rationalit, ou de rationalit conomique, correspond en fait la branche de la rationalit pratique qui ne suppose pas une capacit avoir des croyances justifie. La rationalit conomique est une forme de rationalit pratique pure : la simple maximisation de lutilit, ou encore la cohrence de laction avec les prfrences. Elle traite de la rationalit pratique telle quelle intervient dans la thorie de la dcision, des jeux ou du march. On peut ainsi accomoder les deux schmes classificatoires et montrer lambivalence du concept de rationalit pratique-thorique :
19
cf. (Grafen 1999)
29
Figure 1-2 Concepts philosophiques et scientifiques de rationalit
Cette ambivalence devrait toutefois nous induire rejetter un concept de rationalit de laction fond essentiellement sur la dlibration, car inclure un tel concepts dans nos classification introduit un problme que lintelligence artificielle et la logique non-monotone appelle le diamant de Nixon (Pearl, 1988). Ce problme survient lorsquon dipose dinformations comme : Nixon est un Quaker, Nixon est un rpublicain, les rpublicains ne sont pas pacifistes, les Quaker sont pacifistes.20 Comme Nixon est un Quaker, on peut infrer quil est pacifiste; comme il est rpublicain, on peut infrer quil nest pas pacifiste; donc Nixon est la fois pacifiste et non pacifiste. De mme, en vertu des distinctions proposes plus haut, entre la rationalit pratique et la rationalit thorique, un agent rationnel au sens de celui qui veut rduire la rationalit pratique la rationalit thorique doit infrer quun agent est alors la fois PP-rationnel et non-PP-rationnel (fig. 1.3). On considre en gnral quil y a un problme de confusion dans les infrences. Une bonne faon de rsoudre cette confusion est deffectuer une sparation claire entre rationalit pratique et rationalit thorique et dviter de considrer quune raison de croire est identique une raison dagir. On peut alors utiliser un autre concept de rationalit pratique, plus prcis, celui de rationalit conomique, qui connat trois principales espces.
Candidat aux prsidentielles amricaines pour le parti rpublicain, lors de la guerre du Vietnam, Nixon avait fait savoir quil tait Quaker, pour dmontrer son pacifisme.
20
30
Figure 1-3 Le diamand de Nixon
1.2.3 CLASSIFICATION CONOMIQUE DES CONCEPTS DE RATIONALIT Le concept de rationalit conomique peut tre scind en 3 espces, fonctions du nombre dagents impliqus : la rationalit paramtrique (un seul), stratgique (au moins 2) et sociale (un grand nombre). Chacun est formalis par des thories distinctes : la thorie des jeux, de la dcision et du march. Rationalit paramtrique Selon la thorie de la dcision (Savage, 1954), la dcision rationnelle est celle qui maximise lesprance dutilit21 subjective attendue. Un agent rationnel a des prfrences entre certaines possibilits daction, prfrences qui doivent satisfaire un ensemble de conditions. Par exemple, lensemble des choix possibles doit tre partiellement ordonn par la relation binaire de prfrence faible22, p. Cette relation est rflexive, (A p B) antisymtrique (si A p B et B p A, alors A=B)) et transitive (si A p B et B p C, alors si A p C). Il faut bien sr que chaque option soit comparable 2 2. cela, il faut ajouter le principe de la chose sre ou encore axiome de substitution : A est prfr strictement B (A p B) si et seulement si,
Dans la psychologie hdoniste de Bentham et de Mill, lutilit tait un talon de mesure du bonheur global de lindividu, qui subsume en une dimension les varits de plaisirs et de douleurs. Lutilit est alors une valeur objective et thoriquement mesurable, ce que les conomistes appellent lutilit cardinale. la suite de Pareto (Pareto, [1909]1966), lconomie construit lutilit comme une relation formelle plutt que causale. Selon la thorie de lutilit ordinale , la dcision conomique peut tre construite sans hypothses psychologiques sur lintensit ou le contenu des sensations ou perceptions. En effet, plutt que de supposer que toutes les choix de lagent peuvent tre ordonns en fonction de leur propension objective maximiser le bien-tre de lagent, la thorie porte plutt sur larrangement prfrentiel de lagent. Cf (Savage, 1954).
21 22
La prfrence est dite faible car elle permet que deux options soient galement dsirables.
31
advenant un vnement E, A est prfr B, et si E n'est pas le cas, A est prfr B. Lorsquil est sr quun vnement E adviendra peu importe le choix, E ne doit pas modifier lutilit des choix possibles23. Selon le thorme de reprsentation de Savage, si les prfrences dun agent se conforment aux axiomes de la thorie, on peut alors rationaliser les prfrences de l'agent selon le principe de maximisation de lutilit espre : un agent prfre A B si et seulement si l'esprance d'utilit de A est suprieure B, l'esprance d'utilit tant un produit de la probabilit et de l'utilit de la consquence de chaque acte possible. Dcider rationnellement signifie slectionner une action en raison dune prfrence pour la consquence compare de cette action. On dit alors de cette option quelle domine les autres. Par exemple : !S!o!i!t! !la!c!t!i!o!n! A! !q!u!i! !p!e!u!t! !a!v!o!i!r! !O! !c!o!m!m!e! !c!o!n!s!!q!u!e!n!c!e! : !S!o!i!t! !U!(!A!)! !:! !lu!t!i!l!i!t!! subjective !d!e! !A! !S!o!i!t! !P!(!C1!,!A!)! !:! !l!a! !p!r!o!b!a!b!i!l!i!t! subjective !d!e! ! C1! !s!i! !A! !est effectue !Alors U!(!A!)! !x! ! P!(!C1!,! A!) = l!e!s!p!!r!a!n!c!e! !d!utilit subjective! !a!t!t!e!n!d!u!e! !d!e! !A!.
! S!o!i!t! !la!c!t!i!o!n! B! !q!u!i! !p!e!u!t! !a!v!o!i!r! ! C2! !c!o!m!m!e! !c!o!n!s!!q!u!e!n!c!e!, U(B) et ! ! P!(!C2!,! B!)! : A p B [!U!(!A!)! !x! P!(!C1!,! !A!)! !]! ! ![!U!(!B!)! !x! P!(!C2!,! B!)!] ! Une dcision rationnelle sera donc une dcision dominante : celle qui est prfre toutes les autres, mais pour laquelle aucune autre option est prfre. Rationalit stratgique Lorsquun agent est dans une situation de dcision plusieurs, il se peut que lutilit dune dcision soit fonction de la dcision des autres agents. Laction rationnelle est alors dcrite par la thorie des jeux (TDJ ciaprs), qui sappliquent aux situations o des agents maximisateurs dutilit ont des intrts conflictuels24. Un jeu est constitu dun ensemble dau moins 2 joueurs paramtriquement rationnels, qui doivent choisir
23
Axiome crucial pour la cohrence interne de la thorie : voir Machina (1982). (Dutta, 1999; Giraud, 2000; Von Neumann & Morgenstern, 1953[1944]: 10).
24
32
entre diffrentes stratgies25; lutilit, pour le joueur, de chaque stratgie dpend de la structure du jeu (rgles, paiements, possibilit dactions) et de la stratgie de lautre joueur. La dcision stratgique est donc une dcision qui tient compte dun autre dcideur. Dans son acceptation standard, la rationalit stratgique demande que les agents possdent des connaissances communes26 : une connaissance P est dite commune si et seulement si chacun sait que P, chacun sait que chacun sait que P, et ainsi de suite rcursivement ad infinitum . Les rgles du jeu, sa structure est les paiements sont des connaissances communes, de mme que les postulats de rationalit des joueurs. Ces derniers sont de deux types : les postulats quant au comportement rationnel des joueurs (il prfrent les stratgies dont le paiement est suprieur et sont indiffrents entre des statgies paiement gal) et quant aux anticipations rationnelles (chaque joueur va anticiper que les autres joueurs agissent aussi en accord avec leur propres intrt). Une situation de thorie des jeux est donc une situation de rationalit stratgique. Un agent stratgiquement rationnel opte pour les meilleures stratgies : parmi les fonctions qui apparient lensemble des tats possibles du jeu lensemble des actions effectuables par lagent, celles qui garantissent la maximisation de lutilit tant donn un comportement maximisateur chez dautres agents. Pour dduire la ou les solution(s) dun jeu, il faut gnrer lespace des diffrentes paires de stratgies possibles pour les n joueurs selon les rgles du jeu et assigner chaque n -tuple de stratgies une valeur. Le premier theorme de Nash, gnralisant le thorme Minimax de von Neumann aux jeux somme non-nulle27, stipule que tout jeu n joueurs pouvant utiliser un nombre fini de stratgies pures aura au moins un quilibre (un n-tuple dtats do aucun des joueurs naura intrt dvier) (Nash, 1950:49). Il y aura donc toujours au moins une solution rationnelle o les deux parties ne peuvent avoir mieux dans un jeu o leurs
Une stratgie est une fonction qui apparie lensemble des tats possibles du jeu lensemble des actions effectuables par lagent. Une stratgie pure (ex : jouer A) est le choix dune action pour toute situation; une stratgie mixte consiste varier probabilistiquement lutilisation de stratgies pures (ex : jouer A une fois sur 3, et B le reste du temps).
25
Concept introduit par (D. K. Lewis, 1969). Il faut mentionner que les connaissances communes ne sont pas des axiomes de la thorie mais plutt une composante de son interprtation standard.
26
Dans un jeu somme nulle, lavantage dun joueur est ncessairement au dsavantage de lautre, alors que dans un jeu somme non nulle ce rapport est possible mais non ncessaire. Le thorme Minimax de von Neuman garantit que pour tout jeu somme nulle et deux joueurs qui ont fait leurs choix dans des ensembles finis de stratgies pures, il y aura au moins un quilibre en stratgies mixtes; le thorme de Nash tend ce rsultat tout jeu n joueurs somme non nulle et ayant un nombre fini de stratgies pures.
27
33
intrts sont conflictuels. Par exemple, pour un jeu o les joueurs A et B ont le choix entre les stratgies D ou N, selon les paiements suivants (on aura reconnu ici le dilemme du prisonnier28):
A B D N D (2,2) (0,4) N (4,0) (3,3)
La solution est la paire de stratgie (D,D) : la stratgie N peut tre intressante pour un joueur, mais celui-ci court le risque que son adversaire, ayant choisi D, sen tire bon compte et le laisse dans une situation pire. La solution optimale est donc de jouer D, quoi quil advienne. La paire de stratgie (D,D) est lquilibre de Nash du jeu. Lessence de la rationalit stratgique est le principe de slection des stratgies dominantes : lorsqu'une action, pour un agent, est d'une utilit suprieure ses autres actions pour toutes les actions possibles de son opposant, elle est dite strictement dominante. La rationalit sociale Des agents seront socialement rationnels, au sens o nous lentendons, lorsque dans les changes ayant lieux entre eux on peut reconnatre un effet de march, soit la loi de loffre et la demande. Le march est ici un type de rseau dchange plutt quune conomie de march : ce ne sont pas toutes les socits qui ont une conomie de march, mais on retrouve des marchs dans toutes les socits, que ce soit la chine maoste ou lex-URSS. (Lindblom, 2001: 4). Ds que des gens paient frquemment dautres gens pour faire quelque chose (produire un bien ou un service quelconque), ces changes constituent un march29. Un march est une structure dallocation des ressources entre diffrents agents qui merge de linteraction entre ceux-ci. Il est constitu
Dans un commissariat, on dtient deux personnes emprisonnes, suspectes d'avoir commis un crime, dans des cellules spares d'o elles ne peuvent communiquer. Chacune est interroge sparment. En l'absence de preuves, la police recherche une confession et offre chacun le march suivant: si un prisonnier dnonce l'autre et que l'autre n'avoue pas, le premier sera libr alors que le second sera emprisonn pour 10 ans; si les deux prisonniers se dnoncent mutuellement, chacun sera emprisonn pour 5 ans; si aucun des deux prisonniers n'avoue, chacun sera emprisonn pour 2 ans. Le dilemme du prisonnier est un scnario invent par le psychologue Alfred Tucker (Tucker, 1950) pour prsenter une structure de jeu conue par Melvin Dresher et Merrill Flood (Flood, 1958); voir (Poundstone, 1992). Il ne faut pas concevoir les stratgies optimales en termes de ce que des personnes relles feraient, mais uniquement du point de vue formel.
28 29
La TDJ a aussi produit de nombreuses formalisation des marchs, cf. (Giraud, 2000).
34
dchangeurs, qui sont producteurs et consommateurs (des rles quils peuvent occuper tour tour) de commodits (argent, bien matriel, service, force de travail, capital) qui peuvent tre changes. Comme chaque agent maximise son utilit, les producteurs dsirent vendre leur produit au plus haut prix, et les consommateurs dsirent lacheter au plus bas prix. Lorsque la demande excde loffre, les prix auront tendances augmenter; lorque loffre excde la demande, les prix diminueront. Walras (1870) comparait un march au commissaire-priseur dune vente lenchre: intermdiaire entre loffre et la demande, celui-ci ajuste le prix de faon satisfaire les deux parties. Un march tendrait donc normalement vers un certain tat dquilibre des prix, dit quilibre walrasien. Ce processus nest pas dirig par des organisations, firmes ou individus : ce nest que par le libre jeu de la concurrence entre les changeurs (la loi de loffre et la demande) que la valeur des biens squilibrerait delle-mme, par un processus de ttonnement walrasien. Dun point de vue global, selon la formule consacre dAdam Smith, tout se passe comme sils taient conduits par une main invisible remplir une fin qui n'entre nullement dans [leurs] intentions (Smith, 1776 IV, ii). On peut reprsenter loffre et la demande pour une commodit comme deux courbes, la premire ascendante et la seconde descendante. Lorsque la courbe descendante de la demande et la courbe ascendante de loffre se croise, un prix dquilibre est dtermin. Il ny a pas alors doffre ou de demande excdentaires: si les producteurs et les consommateurs sont des agents rationnels, ni lun ni lautre nont intrt changer le prix demand ou offert. Cet quilibre gnral est un optimum de Pareto30. Une structure dallocation des ressources est dite pareto-optimale sil ny a aucune autre structure qui procure chaque individu un niveau de satisfaction au moins quivalent et qui laugmente pour certains; on ne peut augmenter la satisfaction de certains individus sans en pnaliser dautres. Prenons le cas du dilemme du prisonnier : si les deux joueurs jouent N (ne pas inculper lautre), toute tentative damliorer son sort (choisir D, dnoncer) se solderait par un tort inflig lautre. Les thormes de Arrow et Debreu (Arrow & Debreu, 1954) ont dmontr quune conomie dchange, sous certaines conditions, pouvait avoir un quilibre pareto-optimal. En situation de concurrence pure et
Il a cependant certaines situations qui peuvent tre des optimums de Pareto sans pour autant tre souhaitable : une situation o un dictateur possde toutes les richesses est pareto-optimale, car on ne pourrait enrichir un individu sans en appauvrir un autre (le dictateur). Dans bien des cas, il est prfrable de parler defficacit au sens de Pareto; mais comme ce concept a servi de repre dans les formulations de justice sociale, on peut ignorer les situations dviantes .
30
35
parfaite31 entre des agents rationnels au sens de Savage, une conomie dchange possde au moins un quilibre. De la sorte, les agents socialement ( transactionnellement pourrions-nous dire) rationnels sont des agents qui coordonnent leurs maximisation de lutilit de faon ce que les changes puissent satisfaire les deux parties sans quaucun ne puisse se tourner vers un autre change qui soit plus profitable pour une partie sans pnaliser dautres agents. La rationalit conomique, synthse Nous pouvons donc synthtiser le concept de rationalit conomique. Il se dcline en trois varits: paramtrique : la slection de dcisions dominantes stratgique : la slection de stratgies dominantes sociale: lchange de commodits en fonction de loffre et la demande
On peut rsumer la rationalit conomique en disant quelle consiste avoir des prfrences. Ces prfrence peuvent sexprimer dans laction individuelle (la rationalit paramtrique ), dans linteraction stratgique (la rationalit stratgique) et dans des rseaux dchanges (la rationalit sociale). Chaque ordre de rationalit est formalis par une thorie diffrente, savoir la thorie de la dcision, des jeux et du march. Cette notion de rationalit a certes le dfaut de ne pas recouvrir exactement ce que le sens commun entend par rationnel, mais ce dfaut est largement compens par la prcision et lexactitude que nous fournit ce concept. Dans ce qui suit, il est est propos de rduire la question de la rationalit animale la question de ltendue de la rationalit conomique dans la nature : quelles sont les espces qui peuvent tre dites maximisatrices dutilit ?
EN RSUM. La philosophie, les sciences en gnral et lconomie en particulier ont diffrents concepts de rationalit qui peuvent tre regroups dans une typologie globale pourvu quon limine certaines confusions, et quon distingue clairement la rationalit pratique de la
Atomicit du march , homognit des biens, information parfaite, libre entre dans le march et mobilit des facteurs de production .
31
36
rationalit thorique. Les concepts peuvent tre reprsents par une typologie comme celle-ci, o les concepts confus, non pertinents ou non tudis ici sont ombrags:
Figure 1-4 Typologie des concepts de rationalit
1.3
LA RATIONALIT CONOMIQUE COMME DOMAINE DANALYSE APPROPRI Dans ce qui suit, moins dindication contraire, le terme rationalit signifiera rationalit pratique ou encore rationalit conomique, Erationalit, telle quelle est formalise par les thories prsentes dans la dernire section. Nous restreindrons la question de la rationalit animale la question de la rationalit conomique animale, une restriction pertinente pour les raisons suivantes. 1.3.1 PERTINENCE CONCEPTUELLE Comme il a t affirm plus haut, nous ne rejettons pas doffice quil puisse y avoir une forme de rationalit thorique minimale, la rationalit cognitive, qui puisse sappliquer aux animaux, mais consacrons plutt le prsent travail la rationalit du comportement et de laction et son articulation avec les mcanismes de prise de dcisions. Une des avantages, du point de vue conceptuel, choisir un des sous-concepts de rationalit (PP, B et E) est que chacun deux est plus homogne que la catgorie AGENT RATIONNEL. En effet, les trois concepts de
37
rationalit identifis par Kacelnik constituent un ensemble htrogne, o on peut difficilement projeter les proprits dun des concepts aux autres. Un agent peut trs bien maximiser son aptitude sans pour autant chaque moment maximiser son utilit ou la cohrence logique de ses croyances. Il peut maximiser son aptitude inclusive en aidant un proche parent mme si cela ne lui apparat pas utile. Ou encore, il peut tre adaptatif ou utile dagir en vertu de croyances fausses dans certains contextes (croire quil y a un danger alors quil ny en a pas); il peut tre adaptatif de transmettre un maximum de gnes, mais excessivement coteux en terme deffort, donc dsavantageux du point de vue de lutilit (comparer une reproduction moindre, mais moins coteuse). De mme, avoir des croyances vraies et cohrentes peut, dans certaines situations, tre tellement difficile (valuer une par une la validit dune croyance, puis la cohrence de cette croyance avec chacune des autres) et coteux quil peut savrer dsavantageux du point de vue de lutilit et laptitude. Comme ultimement la question de la rationalit animale demande une possible rduction des espces naturelles, ce projet peut difficilement succder si on ne choisit pas un de ces concepts. La seule proprit que ces concepts partagent est dtre des concepts valuatifs, une proprit trop peu informative, car ils la partagent aussi avec des concepts moraux ou esthtiques. Les agents B-rationnel, E-rationnel et PP-rationnel ont des airs de famille , mais rien de central ne les unit, rien qui ne permette des inductions significatives dun type dagent lautre. Il est donc prfrable, lorsquon parle de rationalit, de sparer la question, et de considrer uniquement les classes homognes dagents rationnels, non pas par soucis de simplification, mais pour avoir en main une catgorie dont on peut rechercher adquatement lextension. Dans le cas prsent, restreindre lanalyse aux agents E-rationnels nous vite de regrouper artificiellement des classes htrognes. Il ne sagit pas bien sr de la seule catgorie possible, mais cest celle-ci qui sera analyse. 1.3.2 PERTINENCE PISTMOLOGIQUE pistmologiquement, il y a de nombreuses raisons pour tudier la rationalit conomique et sa possible extension dans le monde animal. Tout dabord, la rationalit conomique est notre meilleure thorie de la rationalit pratique. Les concepts et thories conomiques de la rationalit ont permis la formalisation du concept de rationalit et ont donn ses lettres de noblesse lconomie; le signe dune science mature est incontestablement la mathmatisation et la formalisation de ces principes et thories. En cela, la mathmatisation de lconomie a t aussi importante que celle de la physique ou de la biologie. Pour tenter dtendre le concept un autre domaine, il faut une thorie acheve et des concepts prcis, ce que lconomie possde. preuve, ce sont ces mmes modles de rationalit qui ont t utiliss par la psychologie de la dcision, lconomie exprimentale et maintenant les neurosciences de la dcision (ou
38
neuroconomie) dans une perspective prdictive et descriptive. De plus, dans les sciences sociales intresses par un agent r a t i o n n e l (anthropologie, politique, droit), cest encore ces modles quon rfre. Ensuite, on ne peut manquer de noter la quantit de concepts, de thories et de mthodes computationnelles qui transitent entre la biologie et lconomique depuis 30 ans. Il a fallu que la thorie de l'volution et l'conomie atteignent un certain degr de maturit32 avant de pouvoir tablir un dialogue interdisciplinaire fructueux (Hammerstein, 1998:3), qui se manifeste aujourdhui dans lcologie du comportement ou encore la thorie volutionniste des jeux33. Ce rapprochement est une consquence logique de certaines prmisses que partagent les deux sciences : Raret : Lindividu conomique/biologique recherche des ressources limites. Comptition : Les individus sont en comptition pour lobtention des ressources limites. Maximisation : Lindividu est reprsent comme maximisant une valeur (utilit/aptitude) dans lobtention des ressources. mergence c o l l e c t i v e : Les processus populationnels (march/volution) ne sont pas dirigs par des agents, mais rsultent de linteraction comptitive entre eux.
Il a fallu cependant que les biologistes mettent au jour les mcanismes de l'volution et que les conomistes dveloppement les bases mathmatiques de la thorie conomique pour que les deux sciences se retrouvent. Il nest pas question ici que dun simple ressemblance superficielle, mais de lutilisation des mmes modles mathmatiques dans la description du comportement, en particulier de la thorie de loptimisation et la thorie des jeux. Cette dernire, par exemple, a t premirement loutil dconomistes; elle a ensuite t utilise pour modliser lvolution du comportement animal, en lui donnant une dimension temporelle, et cette modlisation a par la suite permis la modlisation dinteractions dynamiques entre agents conomiques. Pour que les mmes modles transitent dune discipline lautre, il fallait quils servent les mmes besoin prdictifs ou explicatifs. Ce qui est comprhensible, tant donn que tous les deux tudient des agents optimisateurs.
Tout comme la biologie, lconomie est devenue une science accomplie au cours du XXe sicle, le premier prix Nobel dconomie datant de 1969.
32 33
(Maynard Smith, 1982).
39
Lutilisation conjointe des mmes mthodes computationnelles (computational templates) est un trait marquant de lvolution rcente des sciences (Humphreys, 1995). Ainsi la macroconomie, la mtorologie et la physique des particules, des sciences qui de prime abord tudient des systmes radicalement diffrents, utilisent des simulations semblables, car elles analysent des systmes extrmement complexes et imprvisibles; de mme pour la physique des fluides et lurbanisme, qui tudient des systmes topologiquement semblables, savoir des rseaux de flux. De la sorte, au-del des diffrences apparentes entre les systmes tudis, les simulations informatiques regroupent des entits selon des critres dorganisation ou de complexit, fournissant ainsi la connaissance scientifique dautres classes dentits dans lesquelles les proprits dun systme peuvent tre utilise pour faire des prdictions sur les proprits dun autre. Dans cette nouvelle faon de regrouper les domaines de recherches, la microconomie, lcologie, la robotique, lintelligence artificielle (IA) et la vie artificielle (VA) partagent les mmes mthodes computationnelles, soit les simulations base dagents (appeles aussi modlisations base dindividus ). Pour toutes les raisons mentionnes, lagent rationnel qui nous intressera sera lagent rationnel de lconomie, et cest la contrepartie biologique de ce concept qui sera recherche. Il existe toutefois de nombreux problmes quant la possibilit mme de chercher dans le monde biologique ce qui appartient au monde conomique. Pour rsumer par une mtaphore, rpondre la question de la rationalit animale quivaut dcouper une toffe biologique laide de ciseaux philosophiques; le problme est quon ne sait pas doffice quel patron suivre pour le dcoupage. Le prochain chapitre discute de cette question: doit-on considrer le concept dAGENT RATIONNEL comme une espce naturelle dont on peut isoler ltendue seulement en recherchant les proprits empiriques ?
EN RSUM : Si on circonscrit la rationalit pratique la rationalit conomique, la maximisation de lutilit, on obtient un domaine danalyse qui nexclut pas doffice que des animaux soient rationnels en ce sens, pas plus quil ne le stipule.
40
LA NATURE DE LAGENT RATIONNEL CONOMIQUE
Le prsent travail entend inscrire la rationalit conomique dans le monde vivant pour pouvoir ainsi mesurer ltendue des agents rationnels dans lontologie de la biologie. Cela implique de considrer dans quelle mesure les agents rationnels sont des espces naturelles, ce qui ne va pas de soi, tant donn que les thories des agents rationnels ne sont pas traditionnellement considres comme des thories rfrent des classes dentits. Pour ce faire, nous distinguerons 2 types despces : les espces naturelles, qui se subdivisent en espces nomothtiques et historiques, et les espces normatives. Une conception communment rpandue affirme que les agents rationnels sont des espces normatives, et quil ne peuvent tre des espces naturelles : appelons cette conception normativisme . Nous suggrerons que si les agents rationnels ne sont pas des espces nomothtiques, ce que reconnat le normativisme, ils ne sont pas non plus des espces normatives. La question de la normativit ne sera pas vacue mais plutt rinterprte autrement au prochain chapitre. 2.1 LES ESPCES DESPCES
2.1.1 LES ESPCES NATURELLES NOMOTHTIQUES Nous avons prsent au premier chapitre le concept despces naturelles, soit les catgories dentits qui sont, comme EAU ou OR , regroupes selon des proprits objectives et des stuctures sous-jacentes, qui permettent des infrences scientifiquement pertinentes (induction, prdiction) et des explications. Les espces naturelles sont des concepts sortaux, qui regroupent des entits entre elles; ROUGE, par exemple nest pas considr comme sortal car il ne dsigne pas une classe mais des proprits. Elles ont t diffrencies des espces nominales, comme JADE (ou encore NON - CHAT , VLEUE, CHIEN-OU- TOILE ) qui sont en fait des regroupements fonds sur des dfinitions ou des critres artificiels.
41
Dfinition 1.
Espce naturelle (gnrique) : Une classe C d'entits est une espce naturelle si et seulement si il existe un ensemble important de proprits P scientifiquement pertinente telles que C est la classe maximale dont les membres tendent partager P en vertu dune structure sous-jacente identife par une discipline scientifique.34
Leau ou lor sont des espces naturelles par excellence. Elles ont toutes les proprits voulue de ce type dentits : elles identifient une structure sous-jacente, sont projectibles au sens de Goodman, figurent dans des explications scientifiques, etc. Les espces naturelles de la physique ou de la chimie ont un grand potentiel inductif en vertu du fait quils partagent une mme microstructure intrinsque : comme tout chantillon deau est constitu de molcules comportant deux atomes dhydrogne et un doxygne, et comme les autres proprits (masse molculaire, densit, viscosit, etc.) en drivent, tout chantillon deau partagera les mmes proprits. Selon une certaine conception des espces naturelles35, une espce est naturelle si et seulement si sa nature, son comportement, ses proprits sont explicits par des lois de la nature. Rgle gnrale (mais la question ne fait pas consensus), on considre comme une loi de la nature les noncs qui sont, en sciences, des vrits factuelles (et non logiques), vraies en tout temps et en tout lieu et exprimes par des gnralisations conditionnelles (universelles ou statistiques)36. Lnonc dune loi de la nature affirme que SI certaines conditions sont ralises, ALORS dautres s'ensuivront. Les objets, vnements, proprits ou processus auxquels la loi sappliquera seront alors des espces naturelles. Si une loi stipule que les lectrons ont une charge lectrique ngative de! -!1!.!6! x! !1!0-1!9! !Co!u!l!o!m!b!s!, alors les lectrons et les charges ngatives sont des espces naturelles. Les lois de la nature seraient des descriptions des proprits essentielles des espces naturelles (les quations de Maxwell, par exemple, dcrivent les proprits des champs lectromagntiques) ou bien des descriptions drives de cette nature. Les quarks, les lectrons, les atomes, les molcules sont des espces naturelles parce quils obissent des rgularits tels que les lois dOhm, de Coulomb, de Gay-Lussac, etc. Mme les lois les plus fondamentales (les lois de la conservation, la relativit,
34
Je reprend en partie la dfinition de (Machery, 2005). (Bigelow et al., 1992; Collier, 1996; de Sousa, 1984; Ellis, 2001) de mme que (Millikan, 2000) . voir (Kistler, 1999) et (Mittelstaedt & Weingartner, 2005).
35
36
42
etc.) concernent la nature des espces naturelles, lunivers tant lui aussi une espce naturelle (Bigelow et al, 317). Il faut noter que dans certaines disciplines, comme en biologie, on dispose rarement de lois, bien que des gnralisations empiriques fassent office de lois (noncs conditionnels, factuels, etc.). Des principes quasinomiques (lawlike) comme le principe du sex-ratio de (Fisher, 1930), en gntique des populations, nest pas une loi stricto sensu, mais affirme que si une population satisfait certaines conditions, alors son sex-ratio sera de 1 :1. Ce principe quasi-nomiques participe lexplicitation de la nature despces naturelles (les populations, les sexes biologiques) de la mme manire que E=mc2 participe lexplicitation la nature de lnergie. De la sorte, les espces naturelles sont les valeurs des variables lies des noncs de lois de la nature ou de principes quasi-nomiques. Nous appellerons nomothtiques ce genre despces naturelles car leur nature ou interactions sont dcrites et dcouvertes par des sciences ou domaines de recherches nomothtiques37, c.a.d. qui recherchent des principes gnraux, lois de la nature ou autres.
Dfinition 2.
Espce naturelle nomothtique: Une classe C d'entits est une espce naturelle nomothtique si et seulement si il existe un ensemble important de proprits P scientifiquement pertinentes telles que C est la classe maximale dont les membres tendent partager P en vertu dune structure sous-jacente dont une loi de la nature ou un principe quasi-nomique (lawlike ) identife par une discipline scientifique participe son explicitation.
Dans une recherche nomothtique, la connaissance de lespce naturelle et des lois ou principes qui le dcrivent est le but de la recherche. 2.1.2 LES ESPCES NATURELLES HISTORIQUES Les espces naturelles nomothtiques ont toutes quelque chose en commun : le support inductif quelles procurent dpend de proprits ou de dispositions universellement partages par les membres de la classe. Elles sont de plus des espces anhistoriques ou ternelles (Millikan, 2005), car rien dans leurs proprits nest dtermine par leur histoire, mais seulement par leur structure sous-jacente (telle que les lois ou
(Sober, 2000: 15) distingue les disciplines ou recherches nomothtiques et historiques; nous reprenons la mme distinction en lappliquant toutefois aux entits plutt quaux recherches, tant donn quune mme recherche ou discipline peut tre la fois nomothtique ou historique.
37
43
principes qui les dcrivent)38. Les lois qui les dcrivent ne spcifient pas o ni quand le phnomne adviendra, mais ce qui arrivera si le phnomne advient. Selon les dfinitions utilises plus haut, il ny a pas de doutes que les lectrons ou leau soient des espces naturelles; la physique et la chimie abondent en espces nomothtiques. Cependant, ce ne sont pas toutes les sciences, ni toutes les recherches dans une discipline, qui tentent dexpliciter la nature despces nomothtiques car ce ne sont pas toutes les sciences, ni toutes les recherches dans une discipline, qui recherchent des lois de la nature ou des principes quasi-nomiques. Dans plusieurs cas, ce qui est recherch est une connaissance propos de particuliers ou de classes de particuliers historiques. La connaissance des espces naturelles nomothtiques nest pas alors un but, mais un moyen. Le sismologue qui tudie la zone de fracture de Tjrnes en Islande (Riedel et al., 2005, par exemple) ne recherche pas une loi de la nature ni mme un principe gnral du mouvement des plaques, mais utilise ces connaissances (avec dautres type connaissances qui ne sont pas ncessairement nomothtiques) afin de mieux connatre les proprits de cette zone en particulier. Prcisons que la distinction nomothtique/historique nest pas une distinction entre des sciences naturelles vs humaines, dures vs molles , strictes vs spciales (Fodor, 1974) : une science comme lastrophysique sintresse autant la constante de Hubble qui dcrit la dynamique dloignement des galaxies qu une galaxie en particulier (Andromde). De mme, en cologie (Mikkelson, 2003), les recherches se divisent entre des projets nomothtiques et historiques. On peut donc distinguer39 les espces nomothtiques des espces qui, suivant lusage, sont dites historiques40. Les espces historiques qui concernent particulirement la problmatique de la naturalisation de la
Ajoutons cependant deux bmols : premirement, selon linterprtation standard de la mcanique quantique, les proprits des particules lmentaires sont probabilistes : elles nont donc pas toutes les mmes proprits, mais elles ont la mme probabilit davoir une mme proprit. Deuximement, selon la thorie du Big Bang, les particules constituantes de lunivers ont pu voluer : il y a aujourdhui une abondance d'lectrons, de protons et de neutrons, alors quaux dbut de lunivers on retrouverait plutt une soupe de quarks et de gluons. Donc les espces ternelles ne sont pas indpendantes dune certaine volution cosmologique.
38
Nous ne prtendons pas ici que cette taxonomie est exhaustive ou finale, ni quelle reprsente adquatement tout ce qui peut exister : il sagit ici de philosophie des sciences et non de mtaphysique, le but de la prsente recherche est une clarification pour la premire discipline, non pour la seconde.
39 40
(Boyd, 1999a; Griffiths, 1999; LaPorte, 2004; Mikkelson, 2003; Millikan, 2005).
44
rationalit sont celles de la biologie, savoir les lignes41 animales et vgtales. Ce sont des catgories homognes qui supportent des inductions en vertu de la possession dun ensemble de proprits scientifiquement pertinentes. Si on sait quun cactus Ferocactus pilosus peut suporter au plus un froid de 4C, alors, ceteris paribus, on sait aussi quun autre cactus de la mme ligne tolrera le froid jusqu cette temprature. Il y a donc une forme de projectibilit possible hors des espces nomothtiques, bien que celle-ci ne soit pas aussi infaillible et universelle, principalement parce que si lextension dune catgorie nomothtique peut tre dfinie clairement, il nen va pas ainsi pour les espces biologiques. Ainsi lhydrogne et le deutrium ne sont diffrents, relativement leur structure atomique, que par un neutron, bien quils constituent deux espces diffrentes. Il ny a aucun cas problmatique : un atome est soit de lhydrogne, soit du deutrium, soit dune autre espce. En revanche, les espces biologiques ne sont pas discrtes dans le temps et lespace. Il ny a pas de moment dtermin partir duquel une espce A est devenue une espce B, seulement une suite continue de formes dans laquelle on peut isoler deux tats suffisament diffrents pour quon parle dune nouvelle espce. La continuit spatiale est moins courante mais pose autant de dfis toute conception essentialiste des espces. Pour certaines populations appelles espces-anneaux (ring-species), par exemple, on observe des airs de familles dun genre particulier: la population A de la rgion 1 peut saccoupler avec la population B de la rgion voisine 2, qui elle-mme peut saccoupler avec la population C de la rgion voisine (de B) 3, etc, jusqu une population Z, de la rgion n, voisine de A, qui ne peut saccoupler avec elle. Il nest pas vident que chaque population soit une espce ni que toutes ces populations soient une espce42. Autre problme, si on essaie didentifier des proprits essentielles ou fondamentales dune espce quelconque, il est possible que seulement certains membres les possdent. Un goland mutant qui il manquerait une aile est encore un goland, un fourmilier Myrmecophaga tridactyla qui changerait sa dite est encore un Myrmecophaga tridactyla. Les traits ou caractres varient lintrieur dune espce et les proprits dune espce se retrouveront chez dautres: un gne, un membre ou un organe
Comme natural kind a t traduit par espces naturelles, il peut y avoir une confusion entre les espces comme kind et les espces comme species . Nous utiliserons le terme ligne ou espce biologique pour parler des species (les souris, les criquets, etc) et espce naturelle biologique pour parler des kinds biologiques.
41 42
(Maynard Smith, 1993: chapitre 13).
45
nappartiennent pas une seule espce43. Toute tentative de rduire une espce un type abstrait ou des proprits essentielles sest rvl un chec. Il ny a donc aucune proprit essentielle des organismes qui en font des lapins, des souris ou des sauterelles. Une classification par des proprits essentielles est orthogonale lontologie de la biologie. La biologie est passe dun mode de pense typologique un mode de pense populationnel (Mayr, 1959). Un animal ou une plante appartient une espce non pas selon son adquation un type abstrait ou un ensemble de proprits essentielles, mais selon sa gnalogie et son appartenance une population issue de la mme gnalogie44. Pour qualifier de manire gnrale les espces naturelles historiques, la philosophie des sciences contemporaine a souvent recours la dfinition de Boyd (1991, 1999) : une espce naturelle historiques est un agrgat homostatique de proprits (homoestatic property cluster, AHP ci-aprs). Les AHP comportent deux caractristiques : 1) ce sont des espces naturelles (des agrgats de proprits co-occurentes qui supportent linduction en spcifiant des structures sous-jacentes) et 2) ces espces sont unies par des structures sous-jacentes dun type particulier, savoir des processus45 causaux qui font en sorte que ces proprits tendent survenir chez les membres de la calsse (1999, 70). Les AHP ne sont pas (ou du moins pas ncessairement) des espces nomothtiques car ils ne sont pas explicits par des lois de la nature. Lunit et lhomognit dune ligne ne sont pas explicits par des conditions ncessaires et suffisantes ou des lois de la nature, mais par des processus (la reproduction, les programmes dveloppementaux, la slection naturelle, les mutations, la niche cologique, etc.) qui expliquent la persistence et lidentit qualitative46 de lespce. Prenons par exemple le concept intuitif, prdarwinien, de POISSON* : celui-ci regroupe les diffrentes lignes qui sont
Principalement parce quun trait identifi par la biologie est une homologie, savoir un trait dont on peut retracer, en thorie ou en pratique la phylognie. Nous renvoyons le lecteur au chapitre 4 pour une laboration de ce point.
43
(Ghiselin, 1974; Griffiths, 1999; Hull, 1978) voir les essais dans (Wilson, 1999) pour une dfense et une critique. Notons aussi, pour viter toute confusion, que lorsque des biologistes et philosophes de la biologie affirment que des lignes ne sont pas des espces naturelles, ils impliquent par l quelles ne sont pas des espces nomothtiques; la plupart reconnaissent que ce sont des espces historiques.
44
Boyd parle de mcanismes causaux; nous prfrerons ici le terme processus (une squence dvnement ayant un ordre interne et une direction temporelle), plus gnral (un mcanisme est un processus causal), et rserverons le termes mcanismes pour des analyses proprement parler mcanistique (voir chapitre 3, ainsi que (Bechtel et Richardson, 1993) et (Emmet, 1998).
45
On distingue usuellement lidentit numrique (A et B sont identiques en tout point, et donc A=B) de lidentit qualitative (deux jumeaux sont qualitativement identique parce quils possdent plusieurs qualits en commun, mais son numriquement distincts).
46
46
encore aujourdhui appeles poissons 47 en plus des baleines et des dauphins, classes aujourdhui comme des mammifres. Comme JADE, au vu de nos connaissances actuelles, cette catgorie est en fait constitue de deux espces naturelles plutt quune seule. Pour diffrencier la jadite de la nphrite et liminer JADE des nomenclatures chimiques, on fait appel leur structure molculaire. Pour diffrencier les poissons des mammifres et liminer lancien concept POISSON *, on doit plutt reconstruire une histoire volutionniste qui montre la spciation des diffrentes lignes, leur adaptation analogues mais spares ainsi que les diffrences dveloppementales (les uns ont des branchies, les autres des poumons, etc.). En bref, la slection naturelle, les interactions cologiques et le dveloppement sont des processus causaux qui, chez les ctacs et les poissons, maintiennent deux aggrgats de proprits qui supportent deux classes distinctes dinductions homognes48. Espce naturelle historique: Une classe C d'entits est une espce naturelle historique si et seulement si il existe un ensemble important de proprits P scientifiquement pertinentes telles que C est la classe maximale dont les membres tendent partager P en vertu de procesus causaux
Dfinition 3.
De la sorte, pour dcrire adquatement la nature dune espce historique, on ne peut faire appel, comme pour les espces nomothtiques, uniquement des lois de la nature, fut-elle ceteris paribus. 2.1.3 LES ESPCES NORMATIVES Dans la littrature portant sur la question des normes, de la normativit et de leur lien avec le naturalisme49, la question de la normativit est aborde gnralement par sa modalit smantique, savoir les diffrentes significations de normes , des infrences auxquelles on souscrit dans un discours normatif, celles quelles autorisent, etc. La question de la normativit sera ici aborde plutt dans
Prcisons tout de mme que poisson nest pas un terme qui cadre exactement avec les taxonomies zoologiques (il sagit dun clade paraphyltique) mais nous ignorerons ces dtails pour linstant.
47
Nous avons restreint lexample aux espces biologiques parce que nous traiterons delles dans ce travail; on peut cependant voir dautres entits, mme sociales, comme des espces historiques, comme les langages. Voir (Hull, 2002) sur la mthode comparative en linguistique et en biologie.
48
(Brandom, 2000; Dancy, 2000; Gert, 2004; Kripke, 1982; Pacherie, 2002; Papineau, 2003; Pettit, 2002; Walsh, 2001).
49
47
une modalit ontologique, savoir les catgories ou espces que dterminent un concept normatif. viter le sophisme naturalisme Cette faon de faire, au premier abord, semble tre une forme de ce que, la suite de Moore (1903), la philosophie analytique a appel le sophisme naturaliste. Or on peut traiter de question ontologique sans pour autant avoir se dfendre de cette accusation ni la remettre en question. Le sophisme naturalisme consiste, par exemple, dans le cas du bien, driver la nature du bien de la nature des choses (comportements, attitudes) dont on dit quelles sont thiquement bien50. Largument a par la suite t gnralis comme tant le problme de Hume : comment driver doit de est . Comment dduire dun nonc factuel tel il est le cas que les humains raisonnent ou agissent de telle faon un nonc normatif comme les humains doivent raisonner ou agir de telle faon ? En logique modale, par exemple, il est impossible de driver P de P ( moins que P soit un thorme mathmatique). Selon les thoriciens de la normativit, les noncs normatifs sont des noncs sur des valeurs (althiques, thiques, esthtiques), sur ce qui doit tre le cas, sur ce que des agents doivent faire, et ces noncs ne peuvent tre rduits ou tre dduits dnoncs sur des faits biologiques, psychologiques ou sociaux. La normativit, selon McDowell, concerne des explications dans lesquelles les choses sont rendues intelligibles en se rvlant tre, au moins approximativement, telles quelles doivent rationnellement tre (McDowell, 1986: 389, nous soulignons) Une norme peut tre dfinie de faon gnrale comme un standard qui formule une conduite adopter dans le comportement, le langage ou le raisonnement. Elle ne rfre pas des objets, vnements ou proprits : la norme avion est un mot masculin ne rfre pas aux expressions verbales ou crites du mot avion (ni aux avions dailleurs). Une norme est un nonc intensionnel tout comme un fou doit se dplacer en diagonale , la somme de deux entiers est un entier , ou de P et P Q, dduire Q . On peut identifier deux positions gnrales quant lontologie des normes, lexpressivisme (ou non-cognitivisme) et le ralisme. Selon la
Le sophisme consistait selon Moore tenter de dfinir bien comme on tente de dfinir cheval en numrant les proprits de lobjet dfinir; or le bien est un concept qui ne peut tre analys en proprits plus fondamentales. Dire par exemple que x est bien = x est plaisant quivaut supposer que la question est-ce que le plaisir est bien? a dj une rponse dfinitive. Or on peut toujours dbattre de la question savoir si le plaisir est bien, ce qui montrerait par l quon ne peut dfinir une proprit non-naturelle par une proprit naturelle.
50
48
conception expressiviste51, lorsquun agent affirme que x est N (N tant tout terme normatif : bien, vrai, justifi), il naffirme pas quune proprit relle est instancie, mais exprime son assentiment une norme; selon la conception raliste52, les normes sont des faits dun type spcial, non naturel, propos dun agent rationnel idal, ou encore des lois de ltrevrai . Une divergence quant lontologie des normes nimplique pas une divergence lgard des entits normes. Le raliste et lexpressiviste lgard des normes peuvent saccorder sur un point : une fois quon a dtermin quoi la norme sapplique, ce quon value avec elle (des gestes, des paroles, des raisonnements), on peut, en principe, distinguer ceux qui satisfont la norme et ceux qui ny satisfont pas. Les normes peuvent servir de rgle de catgorisation pour sparer le bon grain de livraie et ainsi crer des classes nominales. Une norme dinfrence, le modus tollens par exemple, nous permet de classer certains raisonnement comme valides, dautres non; demander si une infrence en particulier se conforme cette rgle est distinct de se demander pourquoi et comment le modus tollens est une norme, (cette question peut tre dlgue la philosophie de la logique). De mme, les thories de la connaissance, en pistmologie normative, divisent les croyances entre croyances vraies justifies dune part, et croyances fausses ou non justifies53, dautres part. Ce qui est propos ici nest donc pas de rduire les concepts normatifs des concepts naturels ou dargumenter leffet que les normes peuvent tre rduites des faits et les espces non-naturelles aux espces naturelles, mais plutt de considrer que les normes peuvent tre des prdicats sortaux qui permettent de crer des catgories dune nature particulire, savoir des espces normatives, comme ERREURS DE RAISONNEMENT, PARALOGISME, CROYANCE FAUSSE mais aussi IMPOLITESSE ou MAUVAIS EMPLOY . Les limites de ces catgories peuvent tre labiles, incertaines et partiellement consensuelles, mais elles runissent diffrentes faons dagir bien, de mal infrer ou de se tromper. Il ny a pas, comme dans les espces naturelles, une supposition leffet que la nature soit dcoupe ses articulations. Une norme est considre adquate lorsquelle satisfait des rquisits dun autre ordre (formel, pistmologique, mtaphysique, juridique, etc.).
51
Voir (Brandom, 1994, 2000; Gibbard, 1990) . Voir (Engel, 1989; Frege, 1971; Ogien, 1999; Wedgwood, paratre)
52
Dans la conception usuelle, une connaissance doit satisfaire aux deux critre (vrit et justification) alors quun manquement un des deux est suffisant pour considrer quune croyance nest pas une connaissance.
53
49
Le sophisme naturaliste consistait dduire les proprits normatives de proprits descriptives, comme dire quune conclusion est valide si elle est le produit de tel mcanisme mental ou neuronal ou quune croyance est justifi parce quune majorit de gens ladopte. Ce qui est propos ici est plutt de faire du normativisme et du naturalisme deux faons de partitionner lameublement du monde qui ne sont pas ncessairement exclusives. Espces naturelles et normatives On peut appeler les classes dentits qui seront dtermines par des concepts normatifs des espces normatives 54. Ces entits sont principalement humaines : une norme sapplique des tre humains, leurs comportements, penses, assertions ou raisonnements, alors quune espce naturelle peut tre humaine ou non. Espce normative: Une classe C d'entits est une espce normative si et seulement si il existe une norme N qui spcifie les attitudes, proprits, tats ou dispositions que doivent avoir des sujets ou conduites humain(e)s valu(e)s par N.
Dfinition 4.
Les espces normatives sont difficilement naturelles : bien sr, elles ne se laissent pas dcrire uniquement par des lois de la nature, mais en plus, supposer quon puisse identifier un ensemble de proprits que les membres de cette classe tendent possder et des processus causaux qui font que les membres tendent les possder, il y aurait toujours un lment valuatif qui ne serait pas captur par une liste des proprits intrinsques et des processus causaux. Llment valuatif peut tre caractris commme un ensemble de proprits externes lentit value, mais propre un valuateur, rel ou idal. La catgorie F A U T E S DO R T H O G R A P H E , par exemple, comprend tous les cas o le mot sympathique est crit sympatique . Tout ce que ces fautes ont en commun, cest dtre des violations des rgles dorthographes. Les espces normatives se distinguent aussi des espces naturelles par leur robustesse. Alors quil y a toujours place la rvision des connaissances concernant les espces naturelles, les espces normatives se caractrisent par une insensibilit aux diffrences entre la norme et le
Ce concept est survenu dans de rcentes discussions du naturalisme et du ralisme moral cf (R. Brown et al., 1999: 25; Gibbard, 2003; Griffiths, 2004; Root, 2000; Scanlon, 1998: 12) voir aussi une discussion sur les espces morales (une varit despces normatives) (Kim, 1997; SayreMcCord, 1997a, 1997b; Sosa, 1997), ainsi que (Hacking, 1992) et (Ereshefsky, 2004) sur les espces humaines .
54
50
comportement de lentit laquelle on lapplique55. Si quelquun ne suit pas les rgles dun jeu, la loi ou une rgle dinfrence logique, on ne modifie pas la norme. On jugera plutt que la personne est fautive, et que cest elle qui doit modifier son comportement ou son raisonnement. Rien nempche toutefois que des espces normatives partagent certaines proprits avec les espces naturelles, notamment lhistoricit et le potentiel inductif. Ainsi, une catgorie ABUS L'GARD D'UN ENFANT, dans les annes 60, navait pas la mme rfrence quaujourdhui (Hacking, 1992). Il demeure que, malgr son volution, la catgorie a toujours t constitue de comportements valus comme tant rprhensibles. De mme, rien nempche a priori quune espce normative puissent se rvler tre une espce naturelle, ou quune espce normative soit tudie comme telle. SOCIOPATHE est par exemple une espce normative (un individu est considr ainsi parce quil ne se conforme pas certaines rgles sociales et juridiques); il y a pourtant des connaissances acqurir en tudiant les sociopathes et leur traits de personnalit56.
EN RSUM : Une espce (kind ) est une classe dentits dnote par un prdicat sortal. Une espce est naturelle si ses membres comportent plusieurs proprits de surfaces projectibles qui sexpliquent par une structure sous-jacente. Elle peuvent tre explicites soit par des lois ou principes gnraux quasi-nomiques ( lawlike ), soit par des processus causaux qui expliquent la co-occurrence des proprits de surface. Dans le premier cas, lespce naturelle est nomothtique , dans le second cas, historique . Une espce peut aussi tre normative : une norme (thique, pistmique ou autre) spcifie les attitudes, proprits, tats ou dispositions que doivent avoir des sujets humains dans leurs actions ou pense; on peut distinguer alors la classe des comportements ou sujets qui se conforment la norme et ceux qui ne sy conforment pas.
2.2
DE QUELLE ESPCE EST LAGENT RATIONNEL ?
Nous avons pos plus haut comme conditions quune thorie naturalise de la rationalit doit pouvoir identifier les espces naturelles dont elle parle, sil y en a, ou bien abandonner le concept pour de nouveaux concepts qui cadreront mieux avec des espces naturelles. Une troisime possibilit thorique est que la thorie en question ne traite pas despce naturelle, mais despces normatives, des catgories dfinies par des normes.
55
Cf. (Dumouchel, 2004: 482). Voir (Mealey, 1995) ce sujet.
56
51
Sil savre que les agents rationnel sont une espce naturelle, on doit pouvoir diffrencier les proprits de surfaces de la structure sousjacent. cet effet, nous introduirons la distinction entre la comptence et la performance rationnelle. Les agents rationnels sont ceux dont les actions sexpliqueront par une comptence rationnelle (2.2.1). Une premire possibilit serait de traiter lagent rationnel comme une espce nomothtique (2.2.2) Or essayer de prdire et dexpliquer le comportement rationnel rencontre de nombreux problmes quon ne peut justifier comme on peut le faire pour expliquer la diffrence entre, par exemple, les gaz idaux et les gaz rels. On peut alors considrer que cette divergence nest pas tonnante parce quune thorie de la rationalit est une thorie normative, et quune norme na pas tre confirm par des faits empiriques, (2.2.4), mais la conception normative rencontre dautres difficults sur le plan thorique (2.2.5). Sans rejeter la pertinence de la conception normative de la rationalit pour un ensemble de pratiques pistmiques, un agent rationnel peut tre considr comme une espce naturelle historique, un objet de science, ce qui sera dvelopp dans la section 2.3.
2.2.1 LA COMPTENCE ET LA PERFORMANCE RATIONNELLE Une thorie selon laquelle les agents rationnels sont des espces naturelles doit donc spcifier quelles sont les proprits pertinentes et quelle est la structure sous-jacente. Comme le type de rationalit tudi ici est celui de laction, les proprits de surfaces de cette catgorie, si elle existe, concerneront le comportement et la prise de dcision, ce quon peut appeler les performances des agents. Performer une action rationnelle nest toutefois pas un gage de rationalit, tout comme la production dune phrase par une machine ou un animal nest pas une assurance que lanimal ou la machine soit un tre linguistique. Il faut montrer que la performance est sous-tendue par une comptence. La rationalit des agents tient leur capacit gnrer des actions qui peuvent, mais ne sont pas ncessairement toujours, rationnelles57. Lagentivit rationnelle est de lordre de la disposition ou de la propension, ce quon pourrait appeler la comptence rationnelle 58. Une comptence est une disposition
57 Cest ce que Donald Davidson appelle le paradoxe de lirrationalit : lirrationalit est un chec
au domicile de la raison elle-mme (D. Davidson, 1991).

58 Notons, la diffrence de (E. Stein, 1996) et (Samuels & Stich, 2004; Samuels et al., 2002), que
la comptence rationnelle qui nous intresse ici nest pas la comptence rflchir, mais agir de faon rationnelle.
52
produire des actions rationnelles, en dehors des diverses erreurs de performances. Comme la comptence grammaticale (Chomsky, 1965), la comptence rationnelle peut faillir lors de diffrentes performances, mais quune personne fasse une faute de grammaire nimplique pas quelle na pas de comptence grammaticale; de mme, poser une action irrationnelle nentraine pas que lagent ne soit pas rationnel. linverse, un agent sans comptence rationnelle ne peut pas poser daction rationnelle ou irrationnelles. La comptence rationnelle a un rle particulirement important pour lextension de la catgorie des agents rationnels : elle constitue la structure sous-jacente qui unit cette catgorie. Si les agents rationnels constituent une espce naturelle, cest parce quils ont cette comptence (tout comme les individus linguistiques possdent tous une comptence linguistique et constituent ainsi une espce naturelle). La distinction comptence/performance permet aussi de diffrencier labsence de rationalit de lirrationalit. Les raisons pour lesquelles un agent est rationnel ou non (non-rationnel) diffrent des raisons pour lesquelles une action est rationnelle ou non (irrationnelle) : dans le second cas, labsence de rationalit est un fait des performances les actions et non de la comptence. De la sorte, une thorie naturalise de lagent rationnel est une thorie de la comptence; une thorie des actions rationnelles est une thorie des performances. La-rationalit rfre aux agents qui nont pas de comptence rationnelle, lirrationalit aux actions des agents qui ne satisfont pas des critres de rationalit. 2.2.2 LAGENT RATIONNEL COMME ESPCE NOMOTHTIQUE Une science de la rationalit La possibilit dune science de la rationalit, dune physique ou dune mcanique de lesprit, est une proccupation philosophique au moins depuis Hume. Dans lEnqute sur lentendement humain (Hume, [1748] 1983), Hume envisageait lapplication de la mthode newtonienne59
Dans les Prinicipa Mathematica (1686), Newton formulait les lois de la mcanique et de la gravitation des corps, unifiant ainsi le mouvement des astres, celui des corps terrestre et le magntisme, et retrouvait mme par l les lois de Kepler. Son explication unifie des forces dattraction entre les corps se rduisait en une simple axiomatique o on spcifie le comportement de corps lmentaires et les lois qui rgissent ces corps, seuls ou en interactions. Jusqu Newton, la physique tait une science mtaphysique, immature, spculative, qualitative et non prdictive. Avec son traitement quantitatif, la prdictivit tait alors facilite par la mathmatisation : ainsi Halley prdit-il le passage dune comte (qui porte dsormais son nom) grce aux travaux de Newton. Outre sa mathmatisation, cest aussi la simplicit et la gnralit (3 lois qui dcrivent le mouvement de lensemble des corps) des lois de Newton qui en firent la pierre dassise de la science contemporaine.
59
53
ltude de lesprit humain, cest--dire la recherche des mobiles et les principes secrets qui mettent en mouvement les oprations de l'esprit humain. (Enqute, I). Newton avait dfinit la science mathmatise et abstraite du mouvement et des forces comme une mcanique rationnelle, (au sens o elle tait produite par la raison), et la physique netwonienne devenait un nouveau standard de rigueur et de scientificit. Adam Smith, David Hume, Jeremy Bentham ont plus ou moins explicitement cherch lever la science de lesprit et du social au niveau de la physique newtonienne, idal qui ne fut atteint quavec Pareto et sa formalisation des prfrences. Dautres viendront, sa suite, formaliser la rationalit paramtrique, stratgique et sociale60. La thorie de la science conomique, disait Pareto, acqurait ainsi la rigueur de la mcanique rationnelle (Pareto, [1909]1966). Lanalogie nest videmment pas fortuite : comme les masses et les corps chez Newton, les dcisions, utilits et prfrences reoivent leurs lettres de noblesse par la formalisation et labstraction. Par la suite, les thories conomiques de la rationalit (thorie de la dcision, des jeux, ou du march) ont t prsentes comme tant des tentatives de dcrire de faon scientifique la nature de cet agent61, soit un agent dont les actions maximisent son utilit subjective lors de dcisions, interactions stratgiques et changes. Selon cette conception nomothtique de lagent rationnel62, ces thories sont analogues la physique newtonienne, la seule diffrence quon les tient pour des principes quasi-nomique plutt que des lois strictes: Conception nomothtique de lagent rationnel . Les thories de la rationalit sont des abstractions prdictives et explicatives quasi-nomiques (law-like) des dcisions des agents rationnels. Les agents rationnels peuvent alors tre considrs comme des espces naturelles en ce quils satisfont la dfinition (voir dfinition 2 plus haut) dune espce naturelle nomothtique. Une thorie de la rationalit est une thorie des principes qui gouvernent le comportement maximisateur dutilit. Les proprits de surfaces des membres de la catgorie sont les diffrentes performances comportementales et dcisionnelles; la structure sous-jacente nest pas une structure molculaire, mais une comptence se conformer aux prceptes des thories de la dcision. Dans les termes de la dfinition employe plus
(Arrow & Debreu, 1954; de Finetti, 1937; Ramsey, 1926; Savage, 1954; Von Neumann & Morgenstern, 1953[1944])
60 61
Cf. (Dopfer, 1986).
(D. Davidson et al., 1957; Friedman, 1953; Friedman & Savage, 1948; Hempel, [1961]2001; Pareto, [1909]1966; Ramsey, 1926; P. A. Samuelson, 1947; Von Neumann & Morgenstern, 1953[1944]).
62
54
haut, la classe C des agents rationnels est une espce naturelle parce quil existe un ensemble de proprits P scientifiquement pertinentes, savoir leur comportement et prises de dcisions qui se conforment aux axiomes de Savage, von Neumann-Morgenstern et Arrow-Debreu, telle que C est la classe maximale dont les membres tendent partager P en vertu dune structure sous-jacente. La structure en question est un ensemble de dispositions comportementales, savoir la disposition se conformer ces thories.
Des agents nomothtiques ? A priori , il peut sembler impensable quun agent rationnel conomique soit quelque chose dassez simple et prvisible pour se laisser dcrire par des lois du choix rationnel. Comment supposer quun agent calcule vritablement les probabilits et utilits de chaque possibilit daction ? Deux types de problmes se posent : 1) on suppose que les agents ont connaissance des thories et sy conforment; 2) on suppose que lagent rationnel est un parfait calculateur omniscient. Concernant 1), la conception nomothtique rtorque que cette pratique qui parat dconcertante est courante dans dautres sciences nomothtiques. On ne prsuppose pas que les corps newtoniens connaissent les lois de la nature et pourtant la thorie les reprsente comme des maximisateurs de vitesse (Samuelson, 1947 :23). On ne prsuppose pas non plus que des amas de bulles de savon, dont lorganisation interne minimise les surfaces de contact, rsolvent le problme de Plateau (un problme doptimisation63). Dans les deux cas, cependant, on prdit trs bien le comportement des corps et des bulles de savon en supposant quils suivent ces principes. De mme, comme Friedman et Savage (1948: 298) le soulignent, on pourrait faire des prdictions quant au coup que jouera un joueur professionnel de billard en calculant avec des formules mathmatiques les diffrentes trajectoires possibles et en valuant celles qui seraient les plus profitables en termes de points et de positions. Il y a, selon eux, de bonnes prdictions possibles lorsquon fait lhypothse que le joueur se comporte comme si il connaissait les formules, pouvait estimer les angles et ensuite calculer les trajectoires. Mais il nest pas ncessaire de croire que le joueur connat rellement ces formules ou mme les mathmatiques. Alchian (Alchian, 1950) et Friedman (Friedman, 1953) justifient cette approximation par un argument volutionniste : la longue, les forces du march
63
Calculer la surface minimale sous-tendue par une ou plusieurs courbe(s) ferme(s) dans l'espace.
55
slectionnent les firmes et individus rationnels, ce qui fonde lhypothse selon laquelle les marchs sont peupls dagent rationnels. Le mme argument instrumentaliste peut tre appliqu au second problme. Comme la physique newtonienne, ces thories ne sont pas des descriptions du comportement des agents rels, mais dagents idaux. La thorie des gaz idaux ou des lentilles parfaites sont des thories qui font abstraction des imperfections propres aux contreparties relles des entits thoriques sans que leur caractre approximatif soit un problme pour la prdiction ou lexplication64. De la sorte, ces thories de la rationalit sont substantives plutt que procdurales (H.A. Simon, 1976) : elles ne spcifient pas comment un agent prend une dcision, mais pourquoi (en loccurrence, pour maximiser son utilit subjective). Lconomiste construit un modle mathmatique de la prise de dcision (ou de linteraction stratgique, ou du march), un modle sans frictions , dans lequel on ne tient pas compte des erreurs et des limitations (de calcul, de temps, dinformations) des agents. Si les agents idaux du modle satisfont aux axiomes des thories, les thormes de Savage, Nash et Arrow-Debreu garantissent lexistence de fonction dutilit et dquilibre. Lexplication de laction rationnelle peut alors tre une explication scientifique en bonne et due forme. Schma DN et schma R Supposer que les agents sont parfaitement rationnels (ce que lconomie appelle le postulat de rationalit65) nest donc pas un problme pour lconomie no-classique. Il semblerait qua priori, rien ne soppose ce que lagent conomique soit une espce naturelle nomothtique. Cela signifie entre autres que le schma explicatif des thories conomiques de la rationalit est une varit du schma explicatif des sciences de la nature. Ainsi Hempel (Hempel, [1961]2001) par exemple, avance quil est possible dexpliquer laction rationnelle de la mme faon quon explique le comportement des atomes ou des gaz : par la subsomption de laction sous une loi de couverture laquelle on ajoute les conditions de laction. Dans le schma nomologico-dductif (ND), on explique un vnement en en faisant la conclusion dun raisonnement dans lequel la description de lvnement est un cas particulier de lefficacit causale dune loi :
Cf Ramsey (1926 :173), par exemple, dit de son axiomatisation des probabilits qu'elle n'est qu'une approximation utile, un systme artificiel de psychologie semblable la mcanique newtonienne .
64
Plus prcisment, il sagit du postulat fort de rationalit, savoir que les agents sont dcrits pas les thories de la dcision, des jeux ou du march; un postulat faible suppose uniquement que les agents ne sont pas stupides (Lagueux, 2004: 31).
65
56
!!(!x!)! !{!P!(!x!)! !Q!(!x!)!}! !P!(a ! !)! ! ! ! !P!(a ! !)! !Q!(!a!)! ! !Q!(!a!)! ! ! !
loi condition initiale !instantiation de la loi d!e!s!c!r!i!p!t!i!o!n! de lvnement !
Dans son application au comportement humain, la loi devient en fait un nonc quasi-nomique de la thorie de la dcision qui spcifie ce quun agent rationnel doit faire dans la situation o il se trouve. La loi , une gnralisation empirique selon Hempel, stipule que, dans une certaine condition C1!, un agent rationnel a effectue une action A1. La condition C!1 est une description complte des croyances, dsirs, buts, normes, et paramtres environnementaux de lagent. la diffrence des explications dans les autres sciences, Hempel ajoute un postulat de rationalit, savoir la disposition de lagent se comporter selon les standards de la thorie de la dcision (lesquels ne sont pas des normes, pour Hempel, mais des descriptions gnrales de la psychologie des agents). Le schma R est aux sciences du comportement ce que le schma ND est aux science de la nature : !(!x!)! !{!(!R!(x)! &! !C1!(!x!)) !A!1!(!x!)!}! !R!(a ! )! ! ! ! !C1!(!a) ! ! !A!1!(!a!)! ! ! ! !principe quasi-nomique postulat de rationalit condition initiale d!e!s!c!r!i!p!t!i!o!n! de lvnement
On pourrait en thorie prdire et expliquer (le modle ND les tient pour symtriques) le comportement en postulant un agent consciemment rationnel , qui doit rsoudre un problme dont on connat les solutions possibles, leurs probabilits et utilits de leur consquences : il est alors possible [d]expliquer - ou [de] prdire - qu'il trouvera la solution, ou l'ensemble de solutions, qui est thoriquement correct(e) (Hempel, 1965:324). Rien nempche alors de gnraliser le schma explicatif et lappliquer la thorie des jeux et du march, et prdire que ce feront les agents rationnels.
2.2.3 PROBLMES POUR LA CONCEPTION NOMOTHTIQUE

Le dfaut commun aux systmes que les philosophes ont employs pour expliquer les actions de lesprit, cest quils supposent une subtilit et un raffinement de pense qui excde non seulement la capacit des simples animaux, mais aussi celle des enfants et des gens ordinaires de notre propre espce - Hume (Hume, [1739] 1946)
En thorie, considrer lagent rationnel comme une espce nomothtique serait une idalisation qui servirait la prdiction et lexplication du comportement des agents et qui pistmiquement joue le mme rle que les entits idalises en science. Les imperfections des agents seraient plutt secondaires. On peut mme argumenter que les
57
limites dapplication de la thorie (elle ne sappliquerait qu des agents bien informs, dans certaines conditions optimales dveil et dattention) nest pas non plus un problme. Tout comme la mcanique newtonienne, elle sapplique un certain niveau de description : si les lois de Newton dcrivent bien le comportement dobjets moyens des vitesses infrieures celle de la lumire, les particules lmentaires ou lunivers entier sont mieux dcrits respectivement par la mcanique quantique et la relativit gnrale. La conception nomothtique peut donc saffranchir dune complte adquation au comportement rel des agents. On ne sait toutefois pas jusquo on peut tolrer une divergence entre la thorie et le comportement des agents. Si ces paramtres sont bien dfinis en science (on sait par exemple que la loi des gaz idaux est plus approprie pour les gaz monoatomiques), la question de ladquation en conomie et en psychologie pose problme. En effet, si la conception nomothtique dfend lutilisation des thories de la rationalit par un argumentaire instrumentaliste, alors cest par ce mme argumentaire quon peut la critiquer : (Friedman, 1953) soutient que le ralisme des hypothses est secondaire, la valeur de lconomie se rsumant ses prdictions. Or 50 ans plus tard, les critiques de la science conomique rpondent que, justement, sa prdictivit est pratiquement nulle, ce qui est comprhensible tant donn que lconomie ne traite pas despces naturelles; lhomo economicus est virtuel 66. En effet, depuis les premires expriences dconomie empirique67, on observe des dviations marques entre lhomo economicus et lhomo sapiens dans les dcisions, interactions stratgiques et changes. Dcisions En thorie de la dcision, plusieurs tests consistent demander aux sujets de choisir entre diffrentes possibilits dactions, en les informant des probabilits et utilits de chaque choix. Par exemple, dans le problme dit de la maladie asiatique (Tversky & Kahneman, 1981) on demande aux sujets de choisir entre deux solutions pour une pidmie dune maladie inconnue : une qui sauverait, avec certitude, 200 personnes. une qui aurait 1 chance sur 3 de sauver 600 personnes et 2 sur 3 de ne sauver personne.
66
(Hausman, 1992), (Dupre, 1993), (Rosenberg, 1992), (Pettit, 2002) (Allais, 1953; Ellsberg, 1961; Markowitz, 1952). cf la revue de (A. E. Roth, 1993).
67
58
La majorit (72%) choisit la premire solution, la moins risque bien ququivalente en terme dutilit subjective (1 x 200 = 1/3 x 600). Lorsquon pose la question en termes de vies perdues plutt que sauves, les rponses sont diffrentes : une solution qui causerait coup sr la mort de 400 personnes . une solution qui aurait 1 chance sur 3 de ne causer aucune mort et 2 chances sur 3 causer la mort de 600 personnes.
Dans ce contexte, la majorit (78%) des sujets choisissent de prendre le risque (la second option). Les agents sont averses au risque en situation de gain, et enclins au risque en situation de perte, ce qui se rflte aussi dans leur fonction dutilit : Tversky et Kahneman en concluent que le cadrage , la faon dont ont prsente un problme, biaise la faon dont ont le rsoud. Si on possde 100 euros, la perte de 20 euros est considr comme tant de plus grande magnitude quun gain de 20 euros lorsquon possde dj 80 euros. De mme, les agents dmontrent un effet de possession (endowment effect) (Thaler, 1980): un agent demande un plus grand prix pour abandonner un bien quil possde quil ne paierait pour lacqurir. Les recherches ont montr que laxiome dindpendance est systmatiquement viol,68 les prfrences sont souvent intransitives69, les agents sont averses au risque70 et lambigut71 ce qui leur fait choisir des options que ne prdit pas la thorie. Il est impossible de rsumer ici lnorme littrature sur le sujet; rsumons seulement en disant quau plan strictement prdicitf, la thorie de la dcision sest avr un chec. Stratgies La thorie des jeux semble avoir subi la mme infortune. Le dilemme du prisonnier, lexemple classique des manuels de thorie des
(Allais, 1953; Slovic & Tversky, 1974); des ngociants (traders) professionnels violent laxiome dindpendance bien quils performent lgrement mieux que la majorit des sujets (List & Haigh, 2005).
68
(May, 1954; Tversky, 1969) qui plus est, elle souffrent souvent dun renversement (Tversky et al., 1990).
69
(Tversky & Kahneman, 1981) Laversion au risque a t observe dans diffrentes sphres de lactivit conomique, entre autres chez des investisseurs (Odean, 1998) ou des consomateurs (Genesove & Mayer, 2001). Si chez des consommateurs qui ne sont pas habitus aux marchs on retrouve effectivement laversion au risque, celle-ci tend disparatre chez ceux qui sont expriments (List, 2004).
70 71
(Ellsberg, 1961; Kahneman & Tversky, 2000).
59
jeux, prdit que des agents rationnels vont prfrer se dnoncer. Or 50 annes dexpriences montrent quon observe la coopration la moiti du temps72. Plusieurs jeux dits de confiance (le Dictateur, lUltimatum, lInvestissement, le Centipde, etc.) ont aussi dmontr des prfrences que ne prdisent pas la thorie. Dans un jeu comme lultimatum (Gth et al. , 1982), un premier agent A doit proposer une fraction f >0, de son choix, dun montant m dargent un autre agent B. Si B accepte, B reoit f, et A empoche m-f. Si B refuse, personne ne touche un sou. La thorie des jeux prdit que, en bons maximisateurs dutilit, les agents devraient se comporter comme suit : A devrait devrait proposer la plus petite fraction possible, et B accepter nimporte quel montant. Or dans les faits, les agents A proposent des offres reprsentant en moyenne 20 50% du butin, et les agents B refusent les offres injustes , infrieures 50% de f. Le rsultat est robuste peu importe les montants dargent, la culture, le degr danonymat, lexprience, etc.73 Les seuls cas o les agents se comportent, dans des jeux de confiance, conformment la thorie sont des cas o B (mais non A) est un ordinateur (McCabe et al., 2001) ou lorsque A et B sont des groupes qui prennent des dcisions collectives (Bornstein et al., 2004). En tant que thorie prdictive, la thorie des jeux ne semble pas avoir russi. Goeree et Holt, par exemple, montrent comme de simples changements dans la structure de paiement font que les joueurs dvient de la norme, alors que sans changement ils sy conforment (Goeree & Holt, 2001). Il y a, bien sr des situations qui peuvent tre exprimentalement prdites par la thorie des jeux, mais son tendue semble limite : ce nest que sous certaines conditions dfinies quon peut esprer obtenir un succs prdictif74. changes La thorie de lquilibre gnral, ou du march, a aussi t soumise au tribunal de lexprience. Des expriences sur le terrain ont document les diffrences entre la thorie du march et les march rels, comme pour le march du poisson Marseille (Kirman & Vignes, 1990), le march de lart (Moureau, 2000) ou les marchs de change (Tordjman, 2004). En
72
(Ledyard, 1995; Sally, 1995). (Camerer & Thaler, 1995; Henrich et al., 2004; Oosterbeek et al., 2004; L. Samuelson, 2005). (Binmore, 1999; Binmore et al., 1985).
73
74
60
laboratoire, Vernon Smith et ses collaborateurs75 ont tudi le comportement dchangeurs en diffrentes situations de marchs. Il ressort de ces tudes que des quilibres de march peuvent exister, mais lorsque cest le cas, les comportements des agents ne se conforment pas aux prdictions de la thorie classique. Sans avoir connaissance des quilibres o de lensemble des prix, comme le suppose la thorie classique, les sujets disposant dinformation limite convergent rapidement vers loptimum global (V. L. Smith, 2002). Lorsque, au contraire, ils ont une information complte sur loffre et la demande, leur performance est moins leve (V. L. Smith, 1991b: 103-105). Une des grandes dcouvertes de ce domaine de lconomie exprimentale est que les institutions76 comptent pour beaucoup dans latteinte de lquilibre. Selon la thorie classique, peu importe la structure de march, lquilibre finira par tre atteint. Or Plott et Smith (Plott & Smith, 1978) ainsi que plusieurs autres tudes ont montr que selon le type denchre77 (ascendante, descendante, etc.), latteinte de lquilibre peut varier en vitesse, compltude, oscillation et stabilit. Les expriences avec les enchres doubles continues, particulirement analogues aux marchs rels, ont montr que linteraction du comportement indivuel et des structures institutionnelles contribuent ensemble lmergence dquilibres. Les tudes sur le terrain complte cette analyse et montre comment les rseaux sociaux, lapprentissage, les habitudes et le nonanonymat participe lquilibre de loffre et de la demande plutt quen mergeant dune collection individus goistes et omniscients. Questions dattitudes Comme thories prdictives du comportement individuel78 des agents, les thories de la rationalit nont pas rencontr le succs prdictif
(Plott, 1986, 2001; Plott & Smith, 1978; V. L. Smith, 1965, 1986, 1990, 1991b, 1991c, 2002, 2003) voir aussi (Frankel & Froot, 1987) pour un test de lhypothse de rationalit dans les marchs, (Bronfman et al., 1996), (V. L. Smith, 1965)sur le ttonnement walrasien, (List, 2004) sur une comparaison entre la thorie des prospects de Tversky-Kahneman et la thorie noclassique.
75
En conomie, une institution est une instance de coordination : normes, coutumes, conventions, habitudes, groupes formels ou informels, marchs, tats, firmes.
76
Une enchre est un mcanisme de dclaration de concurrence pour une commodit que l'on se propose de fournir et qui doit tre meilleure (ou gale au minimum pour la premire) que la prcdente avec un incrment minimum. Lorsquune enchre est double (les deux parties tant en concurrence), elle correspond alors une structure de march, ce qui permet ltude des marchs en laboratoire avec un nombre minimal dindividus.
77
Collectivement, comme il a t montr, les agents se coordonnent et arrivent des quilibres de march en laboratoire, bien quils ne soient pas individuellement rationnels. Nous ne traiterons pas de la question de lefficacit des marchs dans les conomie politiques, cette question pouvant
78
61
escompt. Ces dviations sont, selon Tversky et Kahneman trop rpandues pour tre ignores, trop systmatiques pour tre cartes comme des erreurs alatoires et trop fondamentales pour tre accomodes par une relaxation des axiomes (Tversky & Kahneman, 1986: 252)79. Deux postures pistmiques sont alors possibles. On peut dire que ces thories nont tout simplement pas t prdictives mme en tenant compte de leur caractre approximatif, et donc que dautres thories nomothtiques doivent tre dveloppes afin de mieux dcrire les agents rationnels rels. Il serait encore possible de faire de lagent rationnel une espce naturelle. Une autre option consiste dire que ces thories sont en fait des normes, quelles ne visent pas prdire le comportement mais plutt dfinir ce quest un agent rationnel idal pour pouvoir ensuite interprter et valuer le comportement des agents selon leur cart la norme. Lagent rationnel est alors une espce normative et donc lirrationalit des agents rels nest pas un problme. La seconde option rencontre aussi certains problmes, qui seront valus en premier. 2.2.4 LAGENT RATIONNEL COMME ESPCE NORMATIVE Normativisme et rationalit Selon la conception normativiste de lagent rationnel80, les concepts et thories de la rationalit sont des normes pistmiques et pratiques dutilisation des concepts de croyances, dsirs, action et rationalit, et par l des analyses de ces concepts. Cette analyse indique clairement le statut pistmologique de cette notion: le principe de rationalit 81 nest pas une hypothse empirique, mais un postulat normatif qui permet de faire des hypothses empiriques. Ltude de la rationalit est celle dun ensemble consistant de normes, et non une tude empirique (1951: 13)82.
difficilement tre traite sans tomber dans un dbat politique ou idologique. Voir cependant (Stiglitz, 2002) pour une critique de la thorie no-classique des marchs dans son application. Voir aussi (Gigerenzer, 2000; Gigerenzer & Selten, 2001; Gigerenzer et al., 1999; Kahneman et al., 1982; Kahneman & Tversky, 1979, 2000; H.A. Simon, 1978, 1982, 1986; Tversky & Kahneman, 1981; Tversky & Kahneman, 1986) et (L. Samuelson, 2005; Shafir & LeBoeuf, 2002) pour un sommaire des recherches.
79
Par exemple, (Brandom, 1994; D. Davidson, 1991, 1993a, 1993b, 2004; McDowell, 1994; Millar, 2004; Velleman, 1989, 2000) en philosophie; (Korsgaard & O'Neill, 1996) en philosophie morale; (Luce & Raiffa, 1957) en conomie; (Jeffrey, [1965]1990) en thorie de la dcision. Voir aussi les essais dans (Dancy, 2000).
80
Cette notion survient en sciences sociales (Popper, 1967), en conomie (Machlup, 1955), en psychologie (J. R. Anderson, 1983b) et en intelligence artificielle (Newell, 1990).
81
Lide quune thorie de la rationalit est une thorie normative est ancre dans la pratique philosophique et conomique au point o, lorsque certaines expriences ont montr que les agents ne se comportaient pas comme la thorie le prdisait, on parlait de paradoxes plutt que de
82
62
On peut distinguer deux types de normativisme : Le normativisme modr : les thories de la rationalit sont des thories normatives, qui dcrivent ce quun agent idal devrait faire. Le normativisme fort, ou interprtivisme : la rationalit est une norme dinterprtation du comportement, qui permet la comprhension dautrui; les thories de la rationalit pratique y jouent un rle priphrique.
Dans le premier cas, la rationalit est une norme du comportement ou de laction, et dans le second cas une norme dinterprtation du comportement83. La version forte est essentiellement celle de Davidson (et ceux qui se rclament de lui), alors que la version modre se retrouve chez diffrents philosophes et conomistes. La version modre est celle quon emploie gnralement pour justifier la validit des thories de la dcision, des jeux, ou du march en dpit des divergences entre la thorie et le comportement des agents rels. Tout comme la grammaire est constitue de normes linguistiques, les thories de la rationalit sont constitues de normes de dcision qui peuvent recommander certains cours daction. Ce nest pas que, selon des tests, 99% des gens optent pour un choix X, ou quune autorit quelconque vous sanctionnera si vous vous en abstenez; mais que si une personne ne choisit pas X dans une situation ou la thorie de la dcision le recommande, elle commet une erreur. De mme, si une personne se trompe en multipliant 234 par 92, ce nest pas larithmtique qui est en faute, mais la personne. Cette dernire devrait trouver 21 528. Lconomie thorique nest pas alors une science susceptible dentretenir des propositions falsifiables, mais de dcrire comment les agents conomiques se comporteraient sils taient des individus compltement rationnels, capable de prvoir tout ce qui peut arriver, valuer et choisir de faon optimale parmi les diffrents cours dactions (Kreps, 1990: 745). La validit des thories nest en aucun sens sensible ladquation dun postulat de rationalit, et elles deviennent alors des exercices axiomatiques.84
rfutation empiriques ou de contre-exemples, marquant par l le caractre logique, formel et normatif de ces thories. Sil y a une distinction entre ces deux conceptions, elles ne sont toutefois pas compltement impermables, et nombre de philosophes ont soutenu des points de vue qui tiennent la fois de la version faible et de la version modre.
83
84 Voir (Vanberg, 2004: 8-9) Binmore (1994: 150)
63
Normativit et interprtation Pour Davidson, toutefois, laspect normatif des thories de la rationalit ne se rvlent pas (ou du moins pas uniquement) dans les thories de la dcision, des jeux ou du march. Les normes constitutives de rationalit ne sont pas codifiables (Engel, 2002): il ny a pas de liste des principes de base de la rationalit (Davidson, 2004 :196). Les principes de la rationalit ne dcrivent pas un ensemble de rgles explicitables qui permettraient dcrire un brviaire de laction (ou de la pense) rationnelle. Bien quelles soient codifies par diffrentes thories normatives de linfrence et de la dcision (logique, thorie bayesienne du choix rationnel, thorie des jeux), il ny a pas de principes universels qui nous permettent de rpondre univoquement des question comme que croire ? , quelle croyance rviser ? ou que faire ? dans un contexte particulier, ou encore des principes qui nous permettent dinterprter univoquement le comportement (linguistique ou autre) dune personne. Un agent qui agit ou qui interprte a toujours le choix entre rviser une croyance locale ou une thorie gnrale, de sorte que la bonne croyance ou la bonne action nest pas quelque chose qui puisse tre dduit des modles thoriques. Ltude des agents rationnels en laboratoire peut toujours tre rationalise. Supposons quon offre le choix suivant aux sujets (paradoxe dAllais) : Loterie A : 10% de chance de gagner 100 000 $ Loterie A* : 10% de chance de gagner 500 000 $, 89% de gagner 100 000 $ et 1% de ne rien gagner
Pour la majorit des gens, le choix naturel est A. Selon la thorie de lutilit subjective, cependant, A* est le choix rationnel. En effet, si lon considre lutilit subjective comme le produit de la probabilit et de lutilit (et en considrant que lutilit subjective de largent est proportionnelle la quantit, cest--dire quune forte somme est plus dsirable quune somme infrieure) la comparaison entre les loteries va comme suit : A : 1,0 x 100 000 = 100 000 A* : (0,10 x 500 000) + (0,89 x 100 000) + (0,01 x 0) = 50 000 + 89 000 + 0 = 139 000
En terme de stricte utilit subjective, le meilleur choix serait A*. Mais les tudes montrent que lon prfre systmatiquement un tiens deux tu lauras peut-tre . Choisir A consiste donc choisir loption qui ne maximise pas lutilit par peur du risque : laversion au risque peut tre irrationnelle selon la thorie de lutilit subjective. Mais si on considre que labsence de risque, dans loption A, a lui-mme une valeur utilitaire mais non montaire, et que le risque dans loption A* diminue sa
64
valeur utilitaire, on peut trs bien dire que lagent qui choisit A maximise son utilit et choisit loption la plus rationnelle pour lui. Ce nest donc pas tant dans sa conformit la thorie de la dcision que dans la possibilit de linterprter comme un agent rationnel dot de croyances cohrentes que sa rationalit se rvle. Comme le contenu des croyances et dsirs de lagent est spcif par son rle dans un ensemble de croyances et de dsirs, (rle qui peut tre constamment rvalu), le holisme des penses rend caduque toute tentative dexpliciter les normes dinterprtations du comportement. Ne demeurent alors que des principes gnraux et constitutifs , comme le principe de charit : considrer que la plupart de ces croyances sont vraies, que lagent est rationnel, quil matrise les rudiments de la logique et de la thorie de la dcision85. Les thories de la rationalit ne sont alors que des explicitations de connaissances darrire-plan qui nous servent interprter le comportement plutt qu le produire, et les normes sont des attitudes a priori par lesquelles linterprtation du comportement des agents a un sens. Comme il ny pas de lois strictes de laction rationnelle et comme laction, selon Davidson, ne peut tre explique par la subsomption sous une loi de couverture comme dans le modle ND (ou sa variante, le schma R), toute thorie de la rationalit est une thorie normative et hermneutique et toute explication daction est particulire. Lexplication particulariste Une explication particulire, ou particulariste , explique un vnement seulement par les proprits intrinsques ou dispositionnelles des entits impliques dans la cause et leffet, sans faire appel des connaissances gnrales sur le type ou lespce dentit implique. Soit lvnement suivant86: un cube de sucre fond dans un caf chaud. Une explication de type DN expliquerait cet vnement ainsi (en simplifiant, bien sr) : (1) (2) (3) (4) (5) Toute chose soluble fond dans un liquide dune certaine espce Tout caf chaud est un liquide de cette espce Ce cube est fait de sucre Ce cube est plong dans le caf :. ce cube fond
Dennett aussi se dfend de codifier prcisment la rationalit, et sen tient des spcifications gnrales : elle est une norme, intimement lie lidal de rationalit, auquel on a recours comme une seconde nature (Ibid.); cest une sorte de bon sens (Ibid. 129) qui nous indique quoi se fier (Dennett [1978]1981).
85 86
daprs Davidson, 1993, chap. 14 .
65
1 et 2 sont des principes quasi-nomiques, qui font office de lois de couverture, 3 et 4 sont les conditions initiales, et 5 est lvnement expliqu. Or on peut trs bien expliquer pourquoi ce cube fond en disant simplement : 1* Ce cube tait soluble 2* Toute chose soluble se dissoud dans le caf 3* Ce cube tait dans le caf 4* :. ce cube fond Cette explication ne nous dit rien sur lensemble de lespce sucre, bien quelle nous en dise long sur ce cube ; les explications daction, selon Davidson sont plutt de ce type (1993 :363). On nexpliquerait pas une action rationnelle par une loi de couverture qui dcrirait les proprits de lespce humaine entire (ce que le postulat de rationalit ou la thorie de la dcision, selon Hempel, serait mme de faire) mais simplement en explicitant les croyances et dsirs qui motivent laction. Expliquer que Pierre sest achet une automobile en faisant intervenir un complexe de croyances et de dsirs est une explication o laction de Pierre est place dans lespace logique des raisons 87 plutt que sous une loi de couverture. Lexplication concerne Pierre et son action ce moment, plutt que lespce humaine, ou les achats dautomobile en gnral. Exit lide dune science descriptive de la rationalit. Normativit et espce normatives Quon souscrive au normativisme dans sa forme modre (les thories de la rationalit comme normes daction) ou la version plus radicale de Davidson (les thories de la rationalit comme normes dinteprtation), tout normativiste reconnat quil existe des entits qui peuvent tre value par ces normes, cest--dire les agents et actions rationnel(le)s, et parmi elles, une classe qui regroupe celles qui satisfont ces normes et une autre qui regroupe celles qui ny satisfont pas. La comptence rationnelle des agents est alors un postulat normatif, et les performances des agents sont rationnelles ou non en vertu de leur conformit aux standards daction ou dinterprtation. De la sorte, la catgorie AGENT RATIONNEL est une espce normative : Conception normativiste de lagent rationnel. Les thories de la rationalit sont des normes daction (normativisme modr) ou dinterprtation (normativisme
(Sellars, [1956]1997: 76): lorsquon rationalise une action ou une pense, plutt qune description empirique, cest une justification de celle-ci quon produit (ce que Sellars appelle placer dans lespace logique des raisons . Voir aussi (Brandom, 1994, 2000; McDowell, 1994).
87
66
fort, ou interptivisme) de laction qui spcifient les attitudes, proprits, tats ou dispositions que doivent avoir des sujets humains valus par les normes. Si tout cela est juste, et que le concept de rationalit a une dimension irrductiblement normative, presciptive ou valuative (Kim, 1988), alors il nest pas possible de dcrire les agents rationnels en faisant appel un vocabulaire descriptif; dire que telle ou telle proprit psychologique ou biologique de lagent fait quun agent est rationnel est une erreur de catgorie, car ce qui fait quun agent est rationnel ou non est sa conformit un ensemble de standards normatifs ou encore la possibilit de linterprter. 2.2.5 PROBLMES AVEC LA CONCEPTION NORMATIVISTE Nous avons distingu plus haut deux formes de normativismes. La version forte du normativisme, linterprtivisme, sera critique au chapitre 4. La prsente section traite du normativisme modr. La rationalit normative est-elle tractable et calculable ? Si les thories de la rationalit sont des normes, des obligations, qui ne sont soumises qu des diktats logiques, alors la premire rgle de toute logique dontique est que, tout comme la modalit ncessaire implique la modalit possible, devoir implique pouvoir : si un agent doit faire A, il doit aussi tre capable de faire A. Une prescription correspond une opportunit et une capacit (Vranas, 2006, venir) pondre par une valeur. On ne peut dire quun agent doit faire A sil nest pas dans une situation o il pourrait effectuer A ni si, dans une situation adquate, il est physiquement ou mentalement impossible deffectuer A. On sait par exemple que les sujets ont dans une large mesure tendance dvier systmatiquement des canons de la rationalit pratique. On sattend par exemple dun agent rationnel idal ce que ses croyances soient au moins consistantes, cest--dire transitives et non circulaires. Si lagent prfre A B et B C, il ne peut prfrer C A, car il faut alors lui attribuer la croyance je prfre A C (prfrer A B et B C implique prfrer A C) et la croyance je prfre C A , ce que la thorie ou le principe de charit interdit. En vertu des proprits de compltude, de comparabilit et dordre large (rflexivit, antisymtrie et transitivit) requises par la thorie, lensemble des croyances et dsirs dun agent rationnel doit tre cohrent. Lintransitivit des prfrences souvent t
67
constate,88 mme chez des joueurs de casino, qui sont en gnral habitus raisonner en termes de paris et de lotteries (Lichtenstein & Slovic, 1973). Que les humains ne soit pas des dcideurs, stratges et changeurs optimaux nest pas un problme pour la conception normativiste. Le normativiste peut rpondre que ces thories traitent en fait dun agent idal. L o le bt blesse, cest lorsque quon essaie de donner un sens plus prcis et non trivial agent idal . Si un agent idal prend des dcisions en fonction de la probabilit et de lutilit, cet agent traite de linformation. Cet agent, sans frictions, ne doit pas tre limit par ses capacits traiter de linformation : le stockage, lutilisation, la consultation ou la transformation dinformation doit tre illimite et parfaite. Le systme de traitement de linformation le plus parfait ce titre est une machine de Turing universelle, un automate abstrait capable dimplmenter toute fonction calculable. Tout ce quun agent idal peut calculer, une machine de Turing le calculera; si on refuse dinterprter lagent idal en terme de calculabilit, alors il faut aussi refuser dinterprter lagent idal comme un systme de traitement de linformation. Un canal dinformation est en effet formellement quivalent une machine de Turing (Bohan Broderick, 2004) : sans calculabilit, pas de traitement de linformation, et sans traitement de linformation, le concept dagent idal maximisateur dutilit perd sa substance. Il faut donc traduire ces thories en algorithmes que devrait suivre cet agent idal. Si en effet, un agent rationnel idal maximise son utilit comme lentendent les thories, cet agent rationnel suit certaines procdures par lesquelles il ordonne ses prfrences, les value, et slectionne les plus aptes maximiser son utilit; cet agent rationnel idal peut alors tre conu comme une machine de Turing universelle. Or les tentatives de traduire les thories de la dcision, des jeux ou du march en procdures calculables montrent que ces thories font du comportement rationnel quelque chose de non-calculable ou sinon dintractable. On sait par exemple que les restrictions qu'imposent, dune part le comportement rationnel au sens de la thorie de dcision et, dautre part, la calculabilit, sont des ensembles de restrictions dont linconsistance a t dmontre: aucune machine de Turing ne peut tre un agent rationnel en ce sens (Kramer, 1967: 49). Si on laisse de cot la dmonstration dimpossibilit de Kramer et quon essaie quand mme de donner une interprtation de la maximisation dutilitit en termes algorithmiques, force est de constater que la simple tape qui consiste ordonner ses prfrences sans incohrence logique peut devenir ardue. supposer
88
(May, 1954; Tversky, 1969; Tversky et al., 1990).
68
quun ordinateur vrifie la consistance dun ensemble de 138 propositions logiquement indpendantes (donc une liste de 2138 lignes), en prenant chaque tape de calcul le temps que prend la lumire pour passer au travers dun proton, il lui faudrait fonctionner pendant 20 milliards dannes, soit plus que lge estim de lunivers (Cherniak, 1986: 93-94 & 143, n. 113). Le problme est toutefois plus profond que la quantit norme de temps ncessaire laccomplissement de la tche; il sagit dun problme concernant la classe de complexit computationnelle du problme et sa faisabilit. Vrifier lentire cohrence dun ensemble de prfrences quivaut implmenter un algorithme dit de force brute qui va explorer chacune des possibilits pour ne retenir que les bonnes. Le test de cohrence devrait donc consister en trois tapes (Thagard & Verbeurgt, 1998) : Gnrer toutes les faons de diviser lensemble entre lments accepts (cohrents) et rejets. valuer la russite de chacune des solutions. Choisir la meilleure. Linformatique thorique value la complexit des problmes selon le rapport entre la taille de lentre (input) et le temps ncessaire lexcution dun algorithme qui rsoud le problme (Papadimitriou, 1994). Si le problme est rsoluble par une machine de Turing dterministe en temps polynomial (lorsque le temps de rsolution est calcul par une fonction polynomiale de la taille de lentre), le problme appartient la classe P et est dit tractable. On considre en gnral que les problmes de cette classe sont ceux qui peuvent tre raliss par des ordinateurs qui sont plus limits quune machine de Turing mais moins quun humain en terme de capacits computationnelles - en un temps raisonnable (Levesque, 1988); les problmes P, dans une grande mesure, dfinissent la faisabilit dune solution et la possibilit physique dimplmenter un algorithme (Marion, 2006, paratre). Dautres problmes appartiennent la classe NP89, cest--dire pouvant tre rsolu par une machine dterministe mais en temps non polynomial (par exemple, en temps exponentiel). Les problmes NP ne peuvent qutre vrifis (on peut dmontrer quune solution au problme est rellement une solution) en temps polynomial, mais non rsolus. Parmi ceux-ci, la classe des problmes dits NP-complets est consitue de
Il ny a pas de preuve dfinitive que PNP, bien que ce soit la conception commune en informatique (le Clay Mathematics Institute of Cambridge offre un prix de 1 million $ qui pourra le dterminer) et que la cryptographie contemporaine repose sur cette hypothse.
89
69
problmes intractables. Le problme du voyageur de commerce90, par exemple (pour un nombre n de points, trouver le chemin le plus court qui passe par tous les points et qui revient au point de dpart) est NPcomplet91. Or Thagard et Verbeurgt (1998) ont dmontr que le problme de maximisation de la cohrence est NP-complet et donc ne connat pas de solution en temps polynomial par un algorithme dterministe. Il est donc intractable. De nombreuses dmonstrations, en thorie de la complexit computationnelle et en thorie algorithmique des jeux convergent vers le mme rsultat : la thorie conomique no-classique est remplie de problmes NP-complets (Norman, 1994). En thorie des jeux, le seul rquisit de connaissances communes implique quun agent idal doit avoir une capacit de calcul potentiellement infinie. En effet, la notion de connaissance commune suppose que chacun sait que P, chacun sait que chacun sait que P, et ainsi de suite rcursivement linfini. Comme la structure de paiement et la rationalit des joueurs sont des connaissances communes, un agent rationnel devrait donc, avant de poser le moindre geste, passer par un nombre infini dtape de calculs : le joueur A anticipe ce que B fera en anticipant ce que B pense que A anticipera de B, etc., ad infinitum. Les connaissances communes demandent limpossible aux agents rationnels. On peut videmment rpliquer que la connaissance commune est le fait dune chane dimplication plutt que des tapes de raisonnement; mais si la connaissance commune est ncessaire pour la rationalit des agents, il faut bien que ceux-ci, dune faon ou une autre, puissent effectuer ce raisonnement. On sait depuis Rabin que pour plusieurs jeux, information complte, somme nulle et deux joueurs, pour lesquels on peut prouver quil existe une stratgie gagnante, dterminer quel joueur a une stratgie gagnante est un problme indcidable; les stratgies sont non calculables92
Le traveling salesman problem. Voir (Lawler, 1985) pour une prsentation de la thorie et des applications.
90
Prenons par exemple le parcours dUlysse dans lOdysse, o le personnage doit passer par 16 villes mditranennes. Si lon veut une solution optimale, un algorithme dit de force brute pourrait gnrer toutes les possibilits de trajets qui respecte lnonc du problme, valuer la longueur de chacun, et slectionner le plus court. Grtschel & Padberg (1993) ont calcul lensemble des trajets possibles - Ulysse aurait pu passer par 653 837 184 000 chemins diffrents et ont dcouvert le plus court. Si la capacit de calcul et de mmoire dUlysse quivalait celle des 4 ordinateurs de Grtschel & Padberg, il lui aurait fallu prs de 4 jours pour arriver la solution. Cet faon de faire, bien que fiable elle garantit la solution optimale nest pas souhaitable pour un systme de contrle. La complexit de certains problmes fait que leurs solutions exige trop de temps de calcul pour obtenir une solution optimale.
91
Cf (Jones, 1982) pour un rsultat semblable, pour des jeux plus simples que ceux de Rabin. (Canning, 1992) montrent que des quilibres de Nash sont possibles seulement en restreignant la
92
70
(Rabin, 1957: 148). En thorie, un des joueurs peut toujours gagner, mais en pratique, on ne peut lui fournir des instructions effectives (calculables) quant ce quil devrait faire pour gagner. Le rsultat se gnralise pour une population : si une population de machines de Turing joue au dilemme du prisonnier spatial (chaque agent est en comptition avec ses voisins, et adopte la stratgie dun comptiteur si celle-ci se rvle suprieure) et implmente un ensemble fini de stratgies, savoir sil existe un algorithme qui, tant donn une configuration de stratgies, pourrait prouver si cette configuration mnera ou non la conqute dune stratgie en particulier (si tous les joueurs adopteront cette stratgie) est indcidable (Grim, 1997). Donc une machine de Turing naurait aucun moyen de calculer sa stratgie optimale. La thorie de lquilibre gnral souffre des mmes problmes. On sait que daprs la dmonstration dArrow-Debreu, au moins un quilibre comptitif peut exister dans lconomie de march concurrence parfaite. Encore ici, la preuve est non-constructive : on sait que les quilibres existent, mais on ignore les techniques pour les dterminer. Du point de vue des procdures, ces thormes ne sont pertinents que pour tester la consistance logique des modles (Scarf & Hansen, 1973: 20). Or encore une fois, on peut prouver que les quilibres comptitifs ne sont pas calculables (Richter & Wong, 1999); aucun algorithme ne peut dterminer si un systme conomique se dirige vers lquilibre (Vela Velupillai, 2002). Les thories considres aujourdhui comme normatives sont essentiellement issues de thormes dexistence (on prouve quil existe une fonction dutilit, un quilibre de Nash ou un optimum de Pareto); or prouver quun quilibre peut exister nimplique pas quil existe une procdure effective pour latteindre, et la plupart des thories formelles ne spcifient pas les procdures possibles (Velupillai 2000, 181).93. Si le choix rationnel est une rsolution de problme, on doit pouvoir donner la solution sous formes dalgorithmes. Si un phnomne na pas t reconstruit, il na pas t expliqu (Joshua, 1999: 43). Les paradoxes de la rationalit Mme comme standard normatif (au sens du normativisme modr), les thories classiques sont problmatiques ds quon tente de les interprter comme des algorithmes. Nous avons mentionn ici seulement
rationalit des joueurs. Voir aussi (Binmore, 1987/88) pour limportance de traiter les joueurs comme des machines de Turing. (Aumann, 1997) rsument de nombreux problmes ce sujet. Voir aussi (A. A. Lewis, 1985, 1992a; Rustem & Velupillai, 1990; Velupillai, 2000) } et les essais dans (Velupillai, 2005) ainsi que (Marion, 2006, paratre).
93
71
les problmes relis leur tractabilit et calculabilit, mais une plthore de problmes dcoulent uniquement de ce qui peut tre dduit de ces thories. Pour plusieurs problmes de dcision ou de jeux, il est parfois prfrable dtre moins rationnel (dvier de la norme) pour mieux maximiser son utilit, ce que (Parfit, 1984) a appel le caractre autorfutant(self-defeating) des thories de lutilit. Prenons par exemple la tragdie des communes (Hardin, 1968). Dans une communaut pastorale, des fermiers ont un pturage en commun. Comme chaque fermier maximise son utilit, il amne une bte au pturage. Bien nourrir son btail augmente la productivit, ce qui fait en sorte que le choix rationnel, pour chaque fermier, est dy placer un maximum de btail. Or plus il y a de btail, moins il y a de ressources. Il faudrait donc diminuer la quantit de btail dans le pturage, ce qui signifie que pour maximiser son utilit, le fermier doit minimiser le nombre de tte de btail, alors quil doit pourtant maximiser ce nombre. La tragdie des communes est en fait un dilemme du prisonnier plusieurs joueurs : il est toujours plus profitable, individuellement, de se comporter de faon goste, mme si collectivement, cette stratgie nest pas optimale, car la thorie prescrit, pour un dilemme du prisonnier rpt n coups (n tant fini et connu des deux joueurs), la dnonciation chaque coup. En effet, en suivant le raisonnement par induction en amont (backward induction), cette stratgie en fait la seule issue rationnelle du jeu (Luce & Raiffa, 1957: 97-102). En raisonnant partir du dernier coup (le ne coup), peu importe ce qui est arriv lors des n-1 coups passs, celui-ci est un DP un coup : la solution rationnelle est donc la dnonciation. Il ny a pas dautres coups futurs o lautre joueur pourrait se venger, alors il vaut mieux jouer le coup dominant. Sachant que le ne coup sera une dnonciation, chaque joueur na aucune raison de cooprer au (n-1)e coup, tant donn quil nanticipe pas de coopration future. On peut alors poursuivre le raisonnement au (n-2)e, (n-3)e (etc.) jusquau premier coup. Donc personne ne cooprera. Ce rsultat viole pourtant lintuition commune : pourquoi ne pas cooprer, au moins au dbut, sachant que ce serait plus profitable ? Mme Luce et Raiffa (ibid., 100) reconnaissent quils ne suivraient pas cette stratgie. Des problmes surviennent aussi lorsquun jeu comporte plusieurs quilibres de Nash. Soit deux personnes A et B qui se croisent dans un corridor, chacune pouvant passer gauche ou droite (G ou D)94. Il y a quatre situations possibles (GG, GD, DG, DD); deux dentre elles ne sont pas dsirables, soit les collisions qui surviennent si chacun fait le mme choix que lautre (GG, DD). Cette situation comporte deux quilibres de
Dans le mme ordre dide le jeu de la guerre des sexes et de la poule mouille connaissent aussi de multiples quilibres.
94
72
Nash (GD, DG), aucun des deux ntant plus avantageux que lautre. Sans autres indications, lagent est dans la limpossibilit de choisir. Pourtant lexprience nous montre que les collisions dans les corridors sont lexception plutt que la rgle. Dans certains cas, il est impratif de tenir compte de la rationalit imparfaite des autres agents pour prendre des bonnes dcisions, car si on ne fait que suivre les thories normatives, on en arrive une moins bonne dcision. Prenons par exemple un type de jeu appel p-concours de beaut 95 (PCB). Dans le PCB, N (>1) joueurs doivent dterminer un nombre n rel dans un intervalle [a,b]. La moyenne des nombres choisis par les joueurs est calcule et dtermine le(s) gagnant(s) ainsi : celui ou ceux dont le choix n est le plus prs dune fraction p de la moyenne gagne(nt) le prix. Le seul quilibre de Nash, en prsuposant la connaissance commune de la rationalit et pour p<1, est la borne infrieure a. Si lintervalle est [0,100] et p=2/3, lquilibre de Nash est 0 : Si le joueur est rationnel, il ne choisira aucun nombre plus grand que 66,6 (100 x 2/3); tout nombre plus grand que 66 est une stratgie domine, car aucun deux ne peut tre les deux tiers de nimporte quelle moyenne conjecture. Sil croit que les autres joueurs sont rationnels, ils choisira aucun nombre plus grand que 44.4 (66 x 2/3) Sil croit que les autres joueurs rationnels croient que tous les joueurs sont rationnels, il ne choisira pas un nombre plus grand que 29, 6 (44.3 x 2/3) etc.
Il ne restera alors que 0. Tout joueur rationnel devrait donc slectionner cette stratgie dominante. Or plusieurs tudes ont tudi cette situation stratgique, autant en laboratoire, en classe, avec des experts que par des concours effectus par des journaux (Bosch-Domnech et al., 2002); en moyenne, les participants choissent un nombre 20, le nombre gagnant tant 13. La parfaite rationalit exigerait que lagent effectue toutes les tapes de calcul ncessaires pour en arriver la solution finale; or il semble que les sujets effectuent au maximun 3 tapes et que des
Le raisonnement des changeurs sur les marchs financiers sont compars par (Keynes, [1936]1988) aux concours de beaut de lpoque en ce quil font appel au raisonnement spculaire, o lon doit attribuer aux autres des intentions sur les ntres, et ce, rcursivement : les participants ont choisir les six plus jolis visages parmi une centaine de photographies, le prix tant attribu celui dont les prfrences s'approchent le plus de la slection moyenne opre par l'ensemble des concurrents. () Il ne s'agit pas pour chacun de choisir les visages qui, autant qu'il peut en juger, sont rellement les plus jolis ni mme ceux que l'opinion moyenne considrera rellement comme tels. Au troisime degr o nous sommes dj rendus, on emploie ses facults dcouvrir l'ide que l'opinion moyenne se fera l'avance de son propre jugement. Et il y a des personnes, croyons-nous, qui vont jusqu'au quatrime ou au cinquime degr ou plus loin encore. (chapitre XI).
95
73
modles qui prdisent que les sujets passeront en moyenne par 1.5 tapes de calculs sont plus prcis (Kovalchik et al., 2005: 88). Il est donc rationnel de ne pas tenir les autres pour rationnel. Question : si un concours dans Le Monde offre 1 millions deuros celui qui sera le plus prs de la bonne rponse, quelle est la meilleure stratgie ? Si on tient les autres concurrents pour parfaitements rationnels, 0 est la meilleure rponse; si on les tient pour des agents rationnels mais de faon limite, mieux vaux parier sur 13 ( moins bien sr que tous les concurrents aient lu les rsultats des tudes sur les PCB). Repenser la rationalit Mme au plan normatif, une stricte obdiance la thorie de la rationalit ne garantit pas un rsultat optimal. Mme une machine de Turing, dont la mmoire serait infinie, ne pourrait rsoudre certains problmes, parce quils sont incalculables ou indcidables. Sils sont calculables, beaucoup dentre eux seront intractables. Mme lorsquils sont tractables, beaucoup dentre eux mnent des consquences irrationnelles : les agents choisissent, sils suivent la thorie, des options qui ne maximisent pas leur utilit individuelle. Finalement, mme sils ne sont pas auto-rfutants, plusieurs problmes de dcision entranent des paradoxes : non pas de rels paradoxes logiques (comme le paradoxe du menteur), mais plutt des rsultats contre-intuitifs. Des paradoxes montrent quaucune menace est crdible, la confiance, le commerce et la promesse sont impossibles, des agents ne peuvent convenir du fait quil ne conviennent pas, etc96. Que ces thories mnent des paradoxes nest pas en soi une raison suffisante pour les rejeter. Les paradoxes sont nombreux en sciences et en mathmatiques, et servent souvent le dveloppement de nouvelles recherches: la thorie des types et la thorie de la preuve ont t labores afin de faire face des paradoxes logiques qui menaaient les fondations des mathmatiques ou des intutions profondes (Quine, [1966]1976) . De mme, de nombreux amendements ont t apports aux thorie de la rationalit : des varits dquilibres de Nash ont t dcouvertes, des contraintes de temps ou de calcul ajoutes, des axiomes ont t relaxs, laversion au risque fait maintenant partie de la thorie de la dcision, par exemple. Cela dit, plus les thories sont amendes, plus elles deviennent des descriptions crdibles de lagent rationnel, ce qui tend faire de lagent rationnel une catgorie hybride, mi-normative mi-descriptive, et donc qui tend aussi affaiblir le point de vue strictement normativiste.
96
(Aumann & Sorin, 1989; Dupuy, 1999; Sugden, 1985, 1991).
74
Notons que les paradoxes ne sont pas que le fait de la conception normative des agents rationnels; on trouve des paradoxes descriptifs dans les expriences. Si lon suit le raisonnement de Tversky et Kahneman et plus gnralement des psychologues qui ont analys toutes les dviations des sujets relativement aux thories du choix rationnel, alors on devrait sattendre ce que, en situation dconomie de march, latteinte de lquilibre soit impossible. En effet, lexistence dquilibres efficaces au sens de Pareto suppose la rationalit parfaite des agents et linformation complte. Or lorsque quon leur demande deffectuer des transactions dans un march recr en laboratoire, les changes convergent vers lquilibre de loffre et la demande (V. L. Smith, 1991c),un quilibre pourtant driv de lhypothse de rationalit des agents. Sans vacuer lide que de nombreuses activits humaines demandent des catgories normatives (lducation, la politique, la loi, etc.), on peut alors justifier, par les problmes rencontrs par les approches nomothtiques et strictement normative, une approche naturaliste de lagent rationnel, qui fait de la classe des agents rationnels comme une espce naturelle historique.
EN RSUM : La conception nomothtique de lagent rationnel russi difficilement rendre compte du comportement des agents rels. Une conception normative, elle, nest pas restreinte tre plus raliste, mais entranent quand mme de nombreux problmes, dont celui de supposer une rationalit qui nest pas calculable
2.3
LAGENT RATIONNEL COMME ESPCE HISTORIQUE
(...) la possibilit de construire une thorie mathmatique ou de simuler un systme ne dpend pas dune microthorie adquate des lois naturelles qui gouvernent les composantes du systme. Une telle thorie peut en fait tre tout simplement non pertinente. - (H. A. Simon, [1960] 1996: 19)
Lagent rationnel est difficilement conu comme une espce nomothtique, tant donn ses imperfections et sa labilit. Il semble difficilement capturable par des lois universelles ou des principes quasinomiques. Comme espce normative, lagent rationnel apparat comme une chimre : un agent dont les dcisions ne sont pas calculables ou tractables, un maximisateur dutilit qui au final aurait mieux fait dtre moins rationnel ou encore se voit dans lincapacit daccomplir des tches qui semblent la porte de tous, comme la coordination, la coopration, la menace ou la confiance. Demeure alors loption interprtiviste, celle du normativisme fort, ou loption naturaliste-historique. Nous repoussons la
75
discussion de linterprtivisme au chapitre 4, et proposerons ici de faire de la catgorie AGENT RATIONNEL une espce historique.
2.3.1 ERGODICIT ET TEMPORALIT

les quations de lchange ont un caractre non pas dynamique, mais statique; elles expriment une position dquilibre, mais elles ne nous fournissent aucun renseignement sur la voie par laquelle ce point dquilibre a t atteint (...) la direction que suit le systme pour arriver la position dquilibre, ne rentre pas dans la sphre de la science (..) Les forces en jeu dans le systme, si lon peut ainsi parler, tant donnes, la position dquilibre vers laquelle tend tout le systme se trouve par l mme dtermin () (Edgeworth, 1891: 12-15)
Les espces historiques, comme les lignes animales et vgtales, sont des catgories dentits prdictives et projectibles en vertu de processus causaux qui font en sorte quun agrgat de proprits que les membres de la classe tendent possder. Ce ne sont donc pas des lois de la nature qui supportent linduction, mais des processus causaux. Il est propre un procesus causal (raction, mcanisme, etc.), de se dployer dans le temps : cest en vertu de lhistoire des lignes que les populations daujourdhui sont considres comme des espces naturelles, histoire dans laquelle des processus slectionnistes, dveloppementaux, ou cologiques, ont maintenu et maintiennent lunit des lignes. Lessence des espces historiques, si lon peut parler ainsi, est le temps. Si on prend les thories de la dcision, des jeux ou du march au pied de la lettre, comme des normes comportementales ou comme des principes quasi-nomiques, sans prcision des procdures quimplmentent les agents, on vacue la temporalit. Les mathmatiques de la rationalit no-classique sont, comme les lois de Newton, des principes gnraux intemporels (voir la citation dEdgeworth plus haut): les thormes de Savage, Nash et Arrow-Debreu affirment tous lexistence dun quilibre. Lagent individuel satisfera ses dsirs, les joueurs opterons pour une stratgie dominante et les changeurs conviendront dun prix : lagentivit rationnelle mnerait dans chaque cas un quilibre. Outre les problmes de calculabilit ou de complexit computationnelle, un thorme qui affirme lexistence dun quilibre fait aussi abstraction de la trajectoire particulire des agents dans leur atteinte de lquilibre. Autrement dit, on considre quun processus rationnel (slection dune dcision, stratgie ou chance) est un processus ergodique . Or cette hypothse nest pas souhaitable pour traiter des systmes tels que des agents rationnels, aussi proposons-nous den faire un autre type de systme. 2.3.2 LES SYSTMES DYNAMIQUES
76
Un systme ergodique est un type de systme dynamique,97 cest-dire un ensemble de N variables en volution. On peut dcrire de faon gnrale un systme dynamique N dimensions ainsi: dx/dt = F(X;t) [quation 1]
o X (x1, x2, xN) est le vecteur reprsentant ltat du systme et t, le temps. Ltat du systme nimporte quel moment correspond un point unique dans un espace N dimensions. Pour chaque intervalle de temps, chacune des variables peut changer; aprs cet intervalle ltat du systme est reprsent par un autre point. Si lon trace une ligne qui relie chacun de ses points conscutifs, on obtient alors la trajectoire du systme dans son espace dtats. Les gaz idaux, par exemple, sont reprsents comme des systmes dynamiques 6N dimensions : chacune des N molcules de gaz ont trois dimensions de positions (les coordonnes euclidiennes classiques) et trois dimensions de momentum (son mouvement sur chacune des dimensions euclidiennes). Un systme ergodique, tant donn une dure infinie, finira par explorer l'ensemble des tats de son espace d'tats. Lhypothse dquiprobabilit de Maxwell et Boltzmann spcifie que pour un macrotat D dun volume de gaz (ltat de lensemble des molcules) chacun des micro-tats d (tat de chacune des molcules individuelles) est quiprobable. Comme tous les n micro-tats d sont quiprobables, si on sait que le gas est dans un macro-tat D t, la probabilit quil soit dans ltat di est de 1/n. Chaque particule du systme physique est soumise aux mmes lois et chaque tat est quiprobable. De la sorte, la dynamique temporelle dun systme ergodique est indpendante du chemin (pathindependent): peu importe la trajectoire, tout tat peut tre atteint. Appliqu aux agents conomiques, cela signifie que si on dfini ltat des agents comme un ensemble de N variables, un espace N dimensions reprsentera lensemble des tats possibles quils peuvent occuper. Les thormes dexistences assurent que les agents finiront par voluer vers un tat dquilibre : la dcision qui maximise lutilit, la stratgie dominante ou le prix optimal, peu importe les conditions initiales, ltat actuel, la dure ou le chemin parcouru. Cela nest possible que si le systme est ergodique.
Voir (Kauffman, 1993, 1995) pour une prsentation dtaille et accessible de la thorie des systmes dynamiques (connues aussi sous le terme plus sensationaliste de thorie du chaos ), et (Birkhoff, 1927) pour un expos, classique, plus en profondeur; les essais dans (Port & Van Gelder, 1995) appliquent la thorie aux sciences cognitives, une entreprise discute dans (Clark, 1997).
97
77
2.3.3 LES SYSTMES NON-ERGODIQUES Un systme non-ergodique, en revanche, mme avec une infinit de temps, ne pourra pas passer par tous les tats. Soit une urne dans laquelle se trouve une balle blanche (B) et une balle noire (N); une balle est pige au hasard, et selon la couleur de la balle pige, on doit en remettre une autre dans lurne98. Ltat du sytme (le contenu de lurne) aprs x tapes dpend des conditions initiales et du chemin parcouru, savoir les tapes par lesquelles le systme est pass. On ne peut faire de prdiction, a priori, sur ltat du systme aprs x tapes tant quon ne connait pas les conditions initiales, le chemin parcouru et ltat actuel. On voit aussi que les tats ne sont pas quiprobable : la configuration 1N-2B est moins probable que 2N-2B. Si aprs deux tapes, le systme est dans ltat 1N-3B, il ne pourra jamais, par la suite, repasser par cet tat ou atteindre ltat 2N-2B.
Figure 2-1 Urne de Polya
De plus, ltat du systme aprs x tapes, mesur par le ratio N/B, bien quil sera situ quelque part dans lintervalle [0, 1], peut prendre nimporte laquelle de ces valeurs. La dynamique temporelle dun systme nonergodique est dite dpendante du chemin (path-dependent) : les tats atteignables sont fonction de la trajectoire du systme. Les systmes nonergodiques sont courants en biologie : gnome, cellules, organismes ou co-systmes sont des systmes thermodynamiquement ouverts dont la trajectoire, contrairement un amas de gaz, ne passent pas par tous les points de lespace dtats. Le dveloppement ontogntique est un phnomne dpendant au chemin bien connu : dans le dveloppement dun insecte par exemple, la veination (le dveloppement des veines) sur les ailes nest possible quune fois laile dveloppe; il est impossible pour linsecte de se dvelopper autrement en vertu du contrle quexercent les gnes sur le dveloppement (ce nest pas le cas toutefois pour tous les traits). Dans tous ces exemples, lexpliquation de la nature dun systme
98
Ce processus est connu sous le nomdurne de Polya.
78
demande quon spcifie les mcanismes responsables de la canalisation du systme vers un attracteur : les interactions pistatiques dans les rseaux de gnes, les excitations et inhibitions neuronales dans les rseaux de neurones, les relations cologiques entre individus et populations dans les cosystmes. De mme, le fonctionnement dun organisme biologique passe par la description des mcanismes et des rgulations luvre; ils contraignent ces systmes privilgier davantage certains types dtats que dautres. Les besoins physiologiques en sont un exemple. La non-quiprobabilit des tats dun systme non-ergodique sexplique par la prsence, dans on espace dtat, dattracteurs. Un attracteur est un tat ou un ensemble dtats99 vers lequel des trajectoires convergent. Lespace dtats peut ainsi tre divis en bassins dattractions, soit les ensembles de trajectoires qui tendent vers le mme attracteur. Un rseau de neurones artificiel capable deffectuer une catgorisation par prototypes divise son espace dtats en bassin dattraction qui mnent vers les diffrents prototypes, lesquels font office dattrateurs100; de mme, lontognse des cellules est soumise une dynamique o les type de cellules (pidermiques, neuronale, etc) sont des attracteurs diffrents. 2.3.4
SYSTMES DYNAMIQUES ET RATIONALIT: SYNTHSE
Le point de vue volutionniste () ne laisse aucune place pour la formulation de lois naturelles en termes de normalit dfinitive, que ce soit en conomie ou dans quelque domaine de recherche. - (Veblen, 1898: 392)
Nous avons distingu les systmes ergodiques (SE) et nonergodiques (SNE) de faon gnrale: les premiers couvrent leur espaces dtats, les seconds sont contraints par leur dynamique dattracteurs. Prcisons leurs particularits sur diffrents plans pertinents pour lexplication scientifique : Statistique : Si on chantillonne des squences de succession dtats dun SE, la moyenne des donnes accumules converge vers la moyenne de lensemble : les probabilits de transition sont fixes ou cycliques. Pour Les SNE, une moyenne statistique de donnes
Outre des points, les attracteurs vers lesquels convergent les trajectoires peuvent tre des boucles dtats, des tores, des varits ou des attracteurs dits tranges : deux trajectoires diffrentes qui passent par deux points de lattracteurs, proches lun de lautre, resteront sur lattracteur mais sloigneront lune de lautre. la diffrence des attracteur cycliques, ces attracteurs montrent une sensitivit aux conditions initiales (le fameux effet papillon) : une petite diffrence dans les conditions initiales peut engendrer, long terme, une grande diffrence dans ltat du systme.
99
Voir les rseaux de neurones artificiels de Laakso et Cotrell, qui apprennent des catgories similaires malgr le nombre diffrents dunits cachs (Laakso & Cottrell, 2000).
100
79
dobservation ne garantit pas une induction fonde : les probabilits de transition sont variables. Ontologique : les SE sont un type despce nomothtique, alors que les SNE un type despce historique. Une classe de SE est homogne quant lespace dtats et la trajectoire: avoir le mme espace dtats signifie passer par les mmes tats. Une classe de SNE peut tre homogne relativement lespace dtats, cela nempche pas que les trajectoires peuvent varier. Les espces historiques sont moins projectibles que les espces nomothtiques, mais ils le sont suffisamment lorsquon tient compte de leur trajectoire individuelle. pistmologique : les SE sont particulirement prvisibles, tant donn que leur trajectoire mne forcment des quilibres. Les SNE sont moins prvisibles moins quon connaisse leur trajectoire particulire ou les processus causaux qui les dterminent. pistmique : on peut expliquer le comportement dun SE en dcrivant son espace dtats et les lois qui gouvernent chacun de ces composants; pour expliquer le comportement dun SNE, il faut ajouter aussi les mcanismes du systme qui le canalisent vers certains bassins dattraction.
Ainsi, les lois de Newton indiquent comment une molcule de gaz se comporte et on peut ainsi, grce aux techniques de la mcanique statistique et aux lois des gaz idaux, infrer le comportement global du sytme. En revanche, pour dcrire, prdire et expliquer le comportement dun SNE aussi simple quune cellule, il est ncessaire de faire rfrence son organisation interne. Si les agents rationnels sont modliss comme des systmes ergodiques, qui finissent tt ou tard par atteindre un quilibre, alors on peut faire abstraction des mcanismes de dcision, dinteraction ou dchange et effectuer de bonnes prdictions dans lensemble. Or nous avons vu que cette faon de faire nest pas prdictivement adquate et quen plus elle est sujette de nombreuses preuves dindcidabilit et de thormes dimpossibilit. Il est donc prfrable de considrer, normativement et descriptivement, les agents rationnels comme une classe particulire despces naturelles historiques, savoir des systmes nonergodiques, et donc de dcrire les agents rationnels par leur mcanismes. Normativement, si on veut pouvoir appliquer des normes aux agents rationnels, on ne peut le faire sans tenir compte de son type de dynamique (consquemment au principe de doit implique peut ). Si aucun agent rationnel, mme idalis ne peut suivre ces normes, alors ces normes sont non-avenues. Il faut plutt penser des normes pour un systme contraint par sa dpendance au chemin.
80
Descriptivement, en considrant quun agent rationnel est une espce naturelle historique, en considrant quil est issu dune trajectoire particulire, il faut aussi le classer comme un systme non-ergodique. Les agents rationnels conomiques, comme ceux qui peuplent les conomies humaines, sont des systmes biologiques qui guident leur comportement laide de leurs cerveaux. Si on veut expliquer ou prdire leur comportement, il faut une connaissance prcise de leur nature de systmes biologiques : les agents rationnels ont des cerveaux et des corps, construits lors de lontognse par linteraction entre le matriel gntique et lenvironnement et modifi (dans le cas du cerveau) par lapprentissage. supposer quon rejette la pertinence de la dynamique volutionniste et de la dynamique dapprentissage, et quon prfre opter pour une thorie abstraite de lagent rationnel o seule ses tendances et mcanismes sont dcrits, la pertinence des systmes non-ergodiques demeure, car ils permettent de penser lagent conomique dans sa dimension temporelle. Mme en faisant abstraction de lvolution darwinienne, lconomie demeure une science volutionniste, et comme toute science volutionniste, elle est une thorie des processus de dcisions, un point que lconomiste Thorstein Veblen avait autrefois soulev101. La rationalit conomique est donc un processus, et les agents conomiques des entits, fondamentalement non-ergodiques et dpendant(e)s au chemin. Dcrire les agents rationnels et leur comportements quivaut dcrire des mcanismes . Il faut donc les considrer comme des espces naturelles historiques. Conception historique de lagent rationnel. Les thories de la rationalit explicitent des mcanismes de dcision, statgie et change quimplmente des systme non-ergodiques dans leur propension canaliser le systme vers certains attracteurs. Le prochain chapitre met en application la conception historique.
EN RSUM : On peut chapper aux problmes inhrents aux conceptions nomothtiques et normativiste en proposant que lagent rationnel soit une espce naturelle historique.
101
(Veblen, 1898: 375); voir aussi (Veblen, 1899)
81
LINGNIRIE DE LA DCISION
On ne peut dire quelquun, de quelque manire, commnt il doit penser, pas plus que comment il doit respirer ou comment son sang doit circuler. Mais les diffrentes faons par lesquelles nous pensons peuvent tre dcrites de faon gnrale. Certaines de ces faons sont meilleures que dautres; les raisons pour lesquelles elles sont meilleures peuvent tre dtermines (Dewey 1933: 3)
Lide selon laquelle lagent rationnel conomique est une espce nomothtique a t rejete parce que les tentatives qui ont t en ce sens se sont avres infructueuses. Lide selon laquelle cet agent est une espce normative a aussi t abandonne en raison des complications (paradoxes, indcidabilit, impossibilits) quelle entrane. Le trait commun des deux conceptions est de considrer que dans une thorie de la rationalit figurent des systmes ergodiques. Un dbut de solution consiste donc catgoriser les agents rationnels parmi les systmes non-ergodiques, ce qui en fait des espces naturelles historiques au sens prsent plus haut. Sous lappelation de rationalit limite , de nombreuses recherches ont tent de dcrire avec plus de ralisme la nature des agents rationnels, en identifiant entre autres les mcanismes de dcisions. Ces thories se prsentent comme une alternative descriptiviste aux thories classiques et adoptent, comme le normativisme, un principe de sparation, savoir que les projets normatifs et descriptifs sont inconciliables. Ce principe, toutefois, nous oblige soit considrer la rationalit comme tant ou bien un concept dnu dune dimension valuative, ou bien un ensemble de normes (3.1 ). Contre cette dichotomie, on peut toutefois soutenir quune thorie de la rationalit nest ni strictement normative, ni strictement descriptive, mais appartient un autre type de connaissances, que nous nommerons ingnirique 102 (3.2 ). laide de ce type de connaissances, un modle gnral de lagent et de la comptence rationnelle sera dcrit (3.3)
Nous nous permettons dintroduire ce nologisme pour utiliser un mot qui dfinit le type de connaissances de lingnirie, le terme ingnirique ne figurant pas dans les dictionnaires francophones.
102
82
3.1
LA RATIONALIT LIMITE : COMPATIBLE
AVEC LES NORMES
3.1.1 DES AGENTS PLUS RALISTES Dans leurs grandes lignes, les ides avances ici sinscrivent dans le cadre thorique avanc par les thoriciens de la rationalit limite 103 : une thorie de la rationalit est une mise au jour des mcanismes et processus psychologiques qui supportent les patrons de dcisions observs. Selon eux, dcrire des agents imparfaits laide dune thorie dun agent idal serait en fait une erreur. Le temps, lattention, la mmoire et le raisonnement sont des ressources limites. Les agents rationnels, remarquent Simon, ne sont pas parfaitement rationnels. La dcision est une rsolution de problme dans un contexte o la complexit des informations dpasse celle des capacits computationnelles des agents, aussi leur solution doivent-elles tre simple et parcimonieuse. Lespace des solutions alternatives tant rarement pr-spcifi, lagent doit gnrer chacune de ces possibilits. La recherche dune solution adquate ne peut tre faite qu'une par une et donc la recherche est squentielle. tant donn leurs limites intrinsques, les agents ne recherchent pas une solution parfaite, mais une solution qui atteigne un niveau de satisfaction ( satisficing ) adquat (les niveaux d'aspiration). Il est ncessaire de rechercher une meilleure solution seulement lorsque les objectifs satisfaisant ne sont pas atteints. Comme lagent nest pas omniscient, ses niveaux d'aspiration et stratgies de recherche sont drivs de l'adaptation ou de l'apprentissage. Il faut donc remplacer le modle de lagent idal par un autre modle, compatible avec les capacits daccs linformation et de calculs que possdent les organismes dans les environnements quils habitent. (H.A. Simon, 1978) . Ce qui est recherch, cest une hypothse pour expliquer le comportement, et non un principe moral par lequel on peut juger le comportement , pour reprendre lexpression de (Markowitz, 1952: 158, n11). La thorie de la rationalit doit donc tre fonde sur des bases empiriques: des sondages, des tudes de cas, des expriences en laboratoires et simulations informatiques doivent tre les outils des thoriciens de la rationalit limite. Tversky et Kahneman ont pris Simon au pied de la lettre, et leurs nombreuses expriences ont tent dexpliciter les heuristiques et biais
Voir, en philosophie : (Cherniak, 1986; Stich, 1990, 1996), en psychologie : (Gigerenzer, 2000; Gigerenzer & Selten, 2001; Gigerenzer et al., 1999; Kahneman et al., 1982; Kahneman & Tversky, 1979, 2000; H.A. Simon, 1978, 1982, 1986; Tversky & Kahneman, 1981; Tversky & Kahneman, 1986), en thorie des jeux : (Hofbauer & Sigmund, 1998), en conomie : (Aumann, 1997; Camerer, 2003; Camerer et al., 2003; Henrich et al., 2004; Thaler, 1991)
103
83
luvre dans la cognition humaine, expliquant ainsi les erreurs communes de raisonnement et de dcision. Leur thorie des prospects (Kahneman & Tversky, 1979) fournit une alternative descriptivement valide des modes naturels de dcisions, utilise avec succs en conomie (Camerer, 2000). La thorie dcrit les phases du raisonnement conomique : les heuristiques utilises pour reprsenter une situation selon une certaine perspective (gains, pertes, risque), celles qui valuent chacune des possibilits, de mme que les biais qui surviennent chaque tape (fonction de poids de probabilit, fonction dutilit non linaire, aversion au risque, etc.). Dans la foule, Gigerenzer et ses collgues ont poursuivi le travail en faisant intervenir le rle de lenvironnement et de la slection naturelle dans lexplication de la rationalit relle ou cologique . Ils ont aussi eu recours des simulations informatiques pour montrer le bien-fond des mcanismes quils postulent. La rationalit cologique est en fait une bote outils adaptative, un ensemble dheuristique rapides et frugales , adaptes lenvironnement. Par exemple, si on demande quelqu'un qui connat peu l'Allemagne quelle est la plus grande ville: Munich ou Dortmund ?, la majorit des gens rpondent, correctement, Munich. Les agents suivent en fait une heuristique trs simple: pour une valeur valuer, si un objet est reconnu et l'autre non, alors infrer que l'objet reconnu a une plus grande valeur (Gigerenzer et al., 1999: 41) Il s'avre que cette heuristique fonctionne dans certains contextes, parce que nous avons connaissance des grandes villes plus que des petites. C'est en cela que l'heuristique, loin des canons de la rationalit classique, est cologique : elle table sur des rgularits, savoir la corrlation entre les villes dont on entend parler et la taille de ces villes. Les capacits limites des agents ne les rendraient pas foncirement irrationnels lorsquon tient compte de lenvironnement de la dcision, ce que les psychologues volutionnistes ont amplement dvelopp (Cosmides & Tooby, 1996) 104. Dans tous les cas, que le verre soit moiti plein ou moiti vide, on sentend pour dire quil ne lest qu moiti: la rationalit est faite de limites et de compromis. Comme nous le verrons plus loin, certains problmes surviennent avec cette conception de la rationalit qui rejette tout appel des normes de rationalit dans lexplication, la dfinition ou la prdiction du comportement rationnel. Nommons cette conception descriptiviste .
Lexemple classique est bien sr la dtection de tricheurs : si des sujets doivent rsoudre un problme o il doivent appliquer la rgle du modus tollens, le contexte dans lequel est pose la question influence grandement la qualit des rponses. Ds que le problme est formul dans un contexte social, les rsultats frisent la perfection, alors que tout autre contexte, abstrait ou concret, les checs sont lgions.
104
84
3.1.2 LE PRINCIPE DE SPARATION Pour le normativiste, cela signifie quen fait on vient de changer de sujet : comme une thorie de la rationalit est pour lui une thorie des normes de rationalit, une thorie uniquement descriptive est simplement un exercice de psychologie. Une thorie du choix rationnel spcifie ce que les chose doivent tre, plutt que ce quelles sont en gnral, ce qui semble incompatible avec le naturalisme, qui veut que les agents rationnel fassent partie de la nature, et quen cela on ne devrait pas faire appel dautres entites que celles des sciences de la nature. Or, comme le remarque (Montminy, 2003: 411), rsumant la problmatique :
Lorsquune raction chimique nest pas conforme au modle propos par un chimiste, nous ne sommes pas tents de dire que les molcules ont fait une erreur et auraient d se comporter autrement. Mais lorsque notre objet dtude est ltre humain, nous nous sentons autoriss (dans certains contextes) dire que tel ou tel usage dun mot, ou tel ou tel raisonnement, est fautif.
Si lon ne fait que dcrire le comportement des sujets, dans quelle mesure peut-on dire deux quils sont rationnels ? Est-ce que chacun est rationnel sa manire, et ne commet jamais de fautes ? On retrouve les mmes problmes que ceux que Frege soulignait lgard du psychologisme : sil ny a pas de normes qui dfinit la signification, alors on pourrait dire mon thorme de Pythagore ou ton thorme de Pythagore et non plus le thorme de Pythagore (Frege, 1971: 183). Cette critique, Tversky et Kahneman lacceptent : le rve dune thorie qui soit valide empiriquement et thoriquement est irralisable (1986: 272). Le normatif et le descriptif sont tout simplement deux projets diffrents. L-dessus, normativistes et descriptivistes saccordent : les premiers parce quune norme, nappartenant pas aux domaines des faits, na pas tre sensible eux, et les seconds parce que les normes sont de toutes faons impossibles suivre. Le concept de rationalit semble divis : chacun des camps repousse lautre et les projets normatifs et descriptifs ont leur propre agenda. Appelons cela le principe de sparation. Le corrolaire de ce principe, accept par les deux camps, est que le projet de naturalisation de la rationalit est en proie au dilemme suivant : (i) ou bien la rationalit comporte des normes mais celles-ci ne peuvent tre naturalises, les normes ntant pas de lordre des faits naturels, (ii) ou bien la rationalit ne comporte pas de normes et tout ce qui peut tre naturalis est de nature descriptive. Or, une thorie de la rationalit doit pouvoir au moins distinguer les comportements rationnels des comportements irrationnels; tre capable dvaluer quune dcision ou une
85
stratgie est meilleure quune autre, faute de quoi une thorie de la rationalit se confond avec la psychologie. Il importe ici dapporter certaines prcisions qui peuvent clairer le dbat. 3.1.3 OBLIGATION OU DESCRIPTION ? VERS UNE TROISIME VOIE Un nonc comme : (1) Un agent rationnel dans un dilemme du prisonnier classique ( un coup, sans interactions entre joueurs), doit choisir la dnonciation appartient une classe dnoncs normatifs comme : (2) dans une situation C1, un agent rationnel (R) doit effectuer laction A1 quont peut formaliser ainsi : (3) !(!x!)! !{!(!R!(x)! &! !C1!(!x!)) !A!1!(!x!)!}!
Or (3) nest pas une loi de la nature ni une rgularit empirique parce quun oprateur propositionnel105 modal (dontique en fait) intervient et parce quil spcifie comment les comportements ou raisonnements doivent tre selon ce que prescrit ou proscrit la norme. Ce qui doit tre le cas nest pas alors valu par des faits naturels, mais par les valeurs de ceux qui promulguent la norme. Les noncs de la thorie de la dcision, des jeux, ou du march sont alors des obligations, comme la loi lest pour tout citoyen dun pays106. Pour le normativiste, (1) et (2) sinteprtent comme (3) et accuse le naturaliste de soutenir que (1) sinteprte comme la premire proposition du schma R de Hempel (voir chapitre prcdent), qui considre que les noncs sur les agents rationnels, la rationalit et les actions
105
Voir (Wedgwood, 2006) sur linterprtation de doit comme un oprateur propositionnel.
La normativit des lois, selon Hart, tient ce qu'elle sont des obligations, soit (i) renforces par des pressions s'y conformer, (ii) tenues pour importante dans la vie sociale ou dans certains aspects importants de celle-ci, et (iii) possiblement en conflit avec des intrts ou buts. Les thorie de la rationalit, dans la conception normativiste, satisfont (ii): l'conomie, la politique et la gestion tiennent pour importantes la rationalit de l'action et la maximisation de l'utilit individuelle, collective ou celle d'une entreprise et (iii), comme les agents ne sont pas parfaitement rationnels, il peu y avoir (et comme il a t montr, il y a) des divergences entre les normes de rationalit et les buts des agents. La condition (i) est plus difficilement satisfaite, moins qu'on considre qu'un agent qui ne maximise pas son utilit soit renforc le faire par les consquences dsagrables de ces actes, lesquelles incluent les ractions d'autres agents dans l'environnement, qui par exemple rprouvent ou n'arrive pas comprendre le sens de son action. Il n'y a videmment pas de Ministre du Choix Rationnel. Cf (Hart, [1961]1994: 85-88).
106
86
rationnelles sont couchs uniquement en termes descriptifs (les rendant ainsi comparables aux noncs des sciences de la nature, savoir entirement extensionnels : (4) !(!x!)! !{!(!R!(x)! &! !C1!(!x!)) !A!1!(!x!)!}! R!(!a)! ! C1!(!a) :. A!1!(!a!)! ! Les noncs de la thorie de la dcision, des jeux, ou du march sont alors des descriptions des agents rationnels. Donc la question est : les normes de rationalit sont-elles des noncs comme (3) ou (4) ? Sont-elles des lois au sens lgal (obligation), ou au sens scientifique (rgularit universelle) ? Nous avons montr plus haut les problmes quentranent des schmas comme (4): ou bien les agents ne se conforment pas la thorie, ou bien les thories doivent tre amendes pour tre plus ralistes et inclure ainsi les comportements irrationnels (nintgrant plus de dimension rationnelle proprement parler), sans compter que cet nonc retire toute normativit une affirmation sur laction rationnelle, alors que des schmas normatifs comme (3) sont ou bien innaccessibles toute machine de Turing ou bien intractables. Les argumentaires divergeant des descriptivistes et des normativiste font en sorte que les thories de la rationalit sont dune part, dchires entre le statut de normes et le statut de descriptions et, dautre part, difficilement conciliables avec des projets normatifs et descriptifs crdibles qui sappliquent des systmes idaliss comme des machines de Turing. Or il existe une autre interprtation dnonc comme (1) et (2), qui leur ajoute une prcision nglige ou implicite : Un agent rationnel dans un dilemme du prisonnier classique ( un coup, sans interactions entre joueurs), doit choisir la dnonciation sil dsire maximiser son utilit moindre risque dans une situation C1, un agent rationnel (R) doit effectuer laction A1 sil dsire maximiser son utilit selon un ensemble de contraintes D ! ! !
Rien en effet, ne force quiconque infrer !A!1!(!x!)! ou !A!1!(!x!) de !(!x!)! !{!(!R!(x)! &! !C1!(!x!))} : un agent rationnel, pleinement inform et illimit dans ces capacits de calcul peut trs bien faire le pari que lautre agent trouvera aussi dsirable que lui lissue du jeu qui assure un paiement lgrement infrieur individuellement mais globalement plus lev. La transition de lantcdent au consquent suppose quen plus, cet agent veut maximiser son utilit sans prendre le risque que lautre agent fasse en sorte de lui
87
infliger un sort plus coteux107. De mme, on peut trs bien prfrer une lotterie peu risque et peu payante une lotterie trs risque et trs payante selon quon dsire scuriser un gain ou tenter sa chance. De la sorte, le statut des noncs de la thorie de la dcision, des jeux, ou du march ne se limite pas ces deux possibilits, soit i) tre des descriptions gnrales de faits naturels ou bien ii) tre des obligations. Une troisime position est non seulement possible, mais en plus compatible avec une grande quantit dusage qui est fait de ces thorie de la rationalit : ces thories sont des outils, des instruments, des artefacts et des technologies de la dcision. En ce sens, le vocabulaire modal employ peut tre dit normatif, mais uniquement en un sens conditionnel et non absolu . Luce et Raiffa (Luce & Raiffa, 1957: 63) prsentaient ainsi la fonction normative de la thorie des jeux:
La thorie des jeux nest pas descriptive, mais plutt (conditionnellement) normative. Elle ne spcifie pas comment les gens se comportent ni comment il doivent se comporter en un sens absolu, mais comment il doivent se comporter sils dsirent atteindre certains buts.
Lorsquon dit que la rationalit est un concept normatif , on peut signifier deux choses108, selon ce quon entend par normes de rationalit . Elles peuvent tre comprises en un sens non-instrumental, un doit absolu, substantif, qui nest pas instrumental dans latteinte dun objectif, quivalent tu ne tueras point . Elles peuvent aussi tre interprtes en un sens instrumental, comme des prescriptions pour une action oriente vers un objectif. La force modale est alors drive uniquement des conditions de satisfaction de laction : dans un dilemme du prisonnier classique, si on veut maximiser son utilit au moindre risque, alors on doit choisir la dnonciation. Il faut donc distinguer devoir de devoir-pour . Notre argumentaire ne vise pas rduire toute forme de normativit de la normativit instrumentale : une rationalit substantive est prsente et souhaitable dans de nombreux aspects de la vie sociale, aussi ne la constestons-nous pas. Il vise plutt rejeter la ncessit dun principe de sparation et lgitimer une conception de la rationalit (conomique, rappelons-le) selon laquelle les agents rationnels sont des espces naturelles historiques sans pour autant devoir argumenter leffet
Cest en substance ce que la tortue dit Achilles (Carroll, 1895) propos de la logique : elle ne peut vous forcer accepter une conclusion. En revanche elle peut justifier votre acceptation.
107
Il y a bien sr au moins une autre signification, savoir que les normes de rationalit sont des normes a priori dinterprtation; comme il a t mentionn, cette question sera aborde au prochain chapitre.
108
88
quun concept naturaliste de rationalit vacue toute dimension normative. Lconomie dite normative 109, par exemple, nest pas une branche de lconomie qui promeut des rgles de laction juste, mais plutt une activit qui tente de dterminer les meilleures mesures politiques adopter afin de maximiser ou de minimiser certaines variables conomiques : PIB, inflation, chmage, etc. De mme, de nombreuses firmes de recherches oprationnelles ou danalyse de la dcision tentent de dterminer comment des entreprises ou des gouvernements doivent agir pour atteindre leurs buts. De la sorte, le naturaliste qui dfend le caractre valuatif de la rationalit peut tout simplement rejeter les termes du dilemme que les descriptivistes comme les critiques du naturalisme lui somment de rgler et soutenir que ltude de la rationalit peut tre naturalise sans pour autant changer de sujet.
EN RSUM : si lon considre que la normativit de la rationalit conomique est de type instrumentale, il ny a plus de conflit entre une position normativisite et une descriptivites
3.2
LA CONCEPTION INGNIRIQUE DE LA RATIONALIT
Une thorie de la rationalit conomique, au sens qui intresse la prsente recherche, est une connaissance qui nest ni uniquement normative ni uniquement descriptive. Il ne sagit pas que de produire uniquement des axiomatisations ou des modles psychologiques, mais aussi un autre genre de connaissances qui, bien quil partagent certaines proprits avec les projets normatifs et descriptifs, qui ne se rduit ni lun ni lautre : des connaissances techniques, cest--dire des connaissances qui ne sont ni des sciences de la nature ni des exercices mathmatiques bien quelles utilisent ces dernires. Ces connaissances relvent de lingnirie. 3.2.1 DE LA CONNAISSANCE INGNIRIQUE Lingnirie est souvent conue soit comme de la science applique, soit comme un ensemble de capacits techniques qui se qualifient difficilement comme de la connaissance . Il est courant de distinguer lingnirie de la science en reprenant les catgories de (Ryle, 1949), savoir-faire (knowing-how) et savoir-que (knowing-that), parfois aussi reformules comme connaissances procdurales et dclaratives, et dassimiler lingnirie au savoir-faire, la science au savoir propositionnel. Bien que pratiques, ces distinctions refltent plus les usages diffrents du mot connaissance que les diffrences entre ces deux types dactivits. Les psychologues de la mmoire utilisent certes cette distinction pour
109
(Gwartney et al., 2006: 27; Krugman, 2004: 35)
89
diffrencier des systmes de mmoire selon leur degr daccessibilit consciente ou leur type de reprsentation implique, mais une distinction cognitive ou linguistique nest pas une distinction entre des disciplines. Le savoir ingnirique porte sur tous les domaines de lactivit humaine, du design arospatial au gnie gntique en passant par la robotique industrielle, et ces connaissances ne sont pas que tacites et implicites, comme lattestent les manuels et publications ingniriques. La diffrence ne rside donc pas dans le format des connaissances, mais dans lusage. La philosophie de la technologie et de lingnirie,110 malheureusement rarement consulte par les pistmologues, considre plutt que lingnirie, bien quelle applique des connaissances scientifiques dans un but pratique et quelle fasse lemploi de capacits techniques et tacites, constitue un domaine de connaissances au sens propre, qui se distingue des sciences naturelles ou sociales. Lingnirie consiste concevoir et construire des artefacts destins modifier l'environnement physique ou social afin de satisfaire certains besoins ou dsirs (Vincenti, 1990: 6). Elle se distingue de la connaissance scientifique au sens o on lentend usuellement par son emploi de concepts pragmatiques et orients vers un but; alors que le scientifique dcrit ce qui est le cas, lingnieur dcrit ce qui pourrait tre le cas, ce qui, parmi ces possibilits et selon les objectifs devrait tre le cas ainsi que ce qui peut faire en sorte que ce qui doit tre soit (Auyang, 2004: chapitre5). Lorsque des ingnieurs participent la construction de ponts, de voies ferres, de gratte-ciels, de fuses ou de systmes informatises, des contraintes valuatives psent sur le droulement du projet : il y a de bonnes conceptions (de ponts, de voies ferres, etc.), et des mauvaises. Celles-ci se distinguent de celles-l en ce quelles atteignent leur objectif : le pont normativement correct nest pas un pont qui correspond un modle idalis du pont, mais celui qui assure le transport des vhicules tout en satisfaisant des contraintes de simplicit de construction, durabilit, cot, etc. laide de gomtrie, de physique des matriaux, de mtorologie et dconomie, on peut concevoir un pont qui satisfera aux standards proposs (spcifis par le cahier des charges). Au final, on obtient une description charge de termes valuatifs ou modaux ( devoir , bon , impossible ). De mme, pour quune fuse chappe la gravitation terrestre, son acclration doit atteindre un certain niveau; pour quun pont rsiste au passage des automobiles, il doit pouvoir supporter une certain poids et des vibrations.
Voir (Auyang, 2004; Vincenti, 1990) pour des tudes philosophique de lingnirie; (Kroes, 1998) sur la philosophie de la technologie; (Layton, 1974) sur la connaissance scientifique et technologique, (Koen, 2003) sur la mthodologie ingnirique, et lanthologie de (Scharff & Dusek, 2003).
110
90
La normativit introduite est instrumentale (relie un but), a posteriori , conditionnelle et limite (elle ne porte que sur un domaine restreint); plutt que dtre value par leur adquation thorique, cest leur valeur pragmatique que les connaissances seront juges. La connaissance technologique, en particulier lingnirie, est essentiellement prescriptive (Kroes, 1998), compose de procdures ou de rgles qui dcrivent des actions qui doivent tre performes pour atteindre des buts pratiques. Des critres comme lefficacit, le cot, la scurit ou lutilit propres la connaissance technique plus que scientifique, plutt lgifre par des critres comme la vrit, ladquation empirique, la prdictivit et la capacit explicative. Si leurs projets sont diffrents, science et technologie sont toutefois dans une relation dquilibre rflchi (Goodman, 1984[1954]) : la science se sert de la technologie pour la recherche (mesure, analyse, etc.) tout comme la technologie se sert de la science pour le dveloppement (conception, construction, modlisation). Les liens entre la normativit et lingnirie ont t en premier lieu soulign par Quine, en pistmologie. Contre lobjection normativiste au naturalisme, Quine affirmait quune pistmologie naturalise ntait pas incompatible avec des normes et des prescriptions :
[L]'pistmologie normative est une branche de l'ingnirie. Elle est une technologie de la recherche de la vrit ou, en termes plus prudents pistmologiquement, de la prdiction. Comme toute technologie, elle use librement de toute dcouverte scientifique qui convienne son but.[...] Il n'est pas question ici de valeur ultime, [mais] d'efficacit pour une fin ultrieure, la vrit ou la prdiction. Le normatif, comme ailleurs en ingnirie, devient descriptif lorsque le paramtre terminal est exprim (Quine, 1986: 664-665).
Nous reprendrons notre compte le credo naturaliste quinien en lappliquant la rationalit conomique. Nous proposons une conception ingnirique de la rationalit. On peut le dcomposer en 3 thses : (1) La rationalit normative est une branche de l'ingnirie. La rationalit de laction est une sorte de contrle, au sens de la thorie du contrle111 telle quelle est utilis en ingnirie industrielle112,
voir (Glad & Ljung, 2000; F. L. Lewis, 1992b) pour une prsentation dtaille; (Proust, 2005) pour son application la thorie de laction.
111
Prcisons tout de suite : la thorie du contrle provient des rflexions des cybernticiens (Ashby, 1952), mais en son tat actuel elle nest pas une thorie du Grand Tout comme le voulait la cyberntique (lhomme, lanimal, la machine, la socit), mais un ensemble de technologies utilises dans lindustrie.
112
91
car la thorie du contrle spcifie comment un systme doit rgler son comportement partir de linformation dont il dispose afin datteindre son objectif tout en satisfaisant certains critres. Plus prcisment, la dfinition de la rationalit appartient la recherche sur le contrle dit intelligent (Antsaklis, 1994; Saridis, 1985), un domaine de recherche la croise de lingnirie, la recherche oprationnelle et lintelligence artificielle. Dfinir lagent rationnel seffectuera lintrieur des concepts offerts par la thorie du contrle (en ingnirie), la thorie des agents (en intelligence artificielle), et la thorie de loptimisation (en recherche oprationnelle). Les normes auxquelles font face ces systmes de contrle sont en fait des contraintes : ils doivent atteindre leur but, conserver le systme dans un certain tat, minimiser lnergie dpense, effectuer des calculs en temps raisonnable, pour satisfaire certains critres. Lapproche ingnirique offre lavantage de travailler avec des contraintes endognes la formulation des problmes de dcision rationnelle : plutt que de reprsenter un agent rationnel idal, sans frictions , il faut tenir compte des diffrentes limites et contraintes inhrentes aux agents. (2) Elle est une technologie de la recherche de l'utilit Assurer le contrle dun systme est une faon de rsoudre un problme doptimisation, cest--dire un problme o il faut dterminer ou approximer la meilleure solution, tant donne une fonction dite objectif, qui doit tre maximise, minimise ou stabilise. De la sorte, construire une thorie de la rationalit consiste construire un modle dun systme optimisateur, qui doit maximiser son utilit compte tenu des contraintes. En particulier, le traitement algorithmique du contrle empche de formuler des modles non calculables ou intractables. (3) Comme toute technologie, elle use librement de toute dcouverte scientifique qui convienne son but En ingnirie du contrle comme en intelligence artificielle, de nombreuses architectures de contrle recrutent des connaissances dautres domaines: biologie (adaptation, volution, algorithme gntique), neuroscience (rseaux de neurones), psychologie (apprentissage, modles internes, planification, mmoire), sciences sociales (contrle multiagents), thorie de la dcision, voire mme philosophie (logique floue, connaissances). Pour des tres vivants, lcologie du comportement, lconomie exprimentale et volutionniste, les neurosciences et la psychologie de la dcision, la gntique des populations, la thorie des jeux et la robotique pourront tre des sources de contraintes pour les modles de rationalit. Au niveau thorique, cette conception de la rationalit conomique permet dviter les cueils des conceptions uniquement normativistes et uniquement descriptivistes, et donne un sens non-trivial lide,
92
gnralement accepte par les conomistes et philosophes, selon laquelle le concept de rationalit a, comme Janus, un visage deux faces (Bermdez, 2000: 744), proprit quil partage avec de nombreuses connaissances ingniriques. Les thories de la dcision, des jeux ou du march entretiennent les mmes relations avec les thories normatives, dun cot, et les sciences descriptives, de lautre, que le gnie chimique entretient avec la chimie thorique, dune part, et la chimie analytique ( de laboratoire ), dautre part113. Les recherches thoriques informent lingnirie de ses modles abstraits, mais celle-ci est libre de les adapter ses besoins; les recherches analytiques114 informent lingnirie de la nature des particuliers dcrits par les modles abstraits. 3.2.2 EXPLICATION
ET MODLE MCANISTE
La conception ingnrique de la rationalit ne requiert pas quune thorie de lagent rationnel soit couche dans un vocabulaire nomothtique ni uniquement descriptif. La comptence rationnelle nest pas dcrite par des principes quasi-nomiques mais par des processus causaux, en loccurrence des mcanismes causaux. Lexplication ingnirique demande donc un certains type dexplication quelle partage avec de nombreuses sciences : lexplication par des modles mcanistes. La dcomposition mcaniste Un mcanisme115 est une collection dentits et doprations (ou activits) organise de faon produire des changements rguliers dans une squence temporelle, laquelle peut tre dcompose en conditions initiales (les paramtres qui permettrons le droulement de lactivit), intermdiaire (les chanes causales : cycles, embranchement, rseau) et terminales (production, limination, quilibre). Soit une entit X 1 qui performe une activit 1; X1 fait 1 , est un phnomne observ dont on cherche dcrire les proprits constitutives, contextuelles et tiologique. Dans lexplication constitutive, un explanandum de type X 1 fait 1 , un phnomne dont on cherche comprendre la nature (comment X1 fait 1 ?), est appari un explanans de type P1, P2, P3...Pn performent
113
Lexemple est de (A. E. Roth, 1991a).
La chimie analytique est ltude de la structure et des proprits des atomes et molcules; par extension, toute science descriptive, concerne par lanalyse la structure et les proprits objectives des entits physique, biologique, sociales.
114
Voir (Bechtel & Richardson, 1993; Craver, 2001; Machamer et al., 2000; Von Eckardt & Poland, 2004) pour la littrature sur la notion de mcanisme et son rle en science, ainsi que (Salmon, 1984, 1998) sur lexplication causale en gnral.
115
93
1, 2, 3... n , ce qui permet X 1 de faire 1 . On explique ainsi que le pancras (X 1) rgule la glycmie ( 1) en montrant que les cellules alpha des lots de langerhans (P1) produisent de linsuline (1), et les cellules beta (P2) produisent le glucagon ( 2), etc., selon une certaine squence causale, menant de consitions initales des conditions terminale. Une description plus fine pourra ensuite montrer par quels mcanismes les cellules produisent lhormone. Il peut bien sr y avoir une multitude de niveaux et une multitude de sous-lments chaque niveau. Il est noter que lexplication constitutive nest pas une redescription dun mme systme un niveau infrieur, mais une dcomposition mrologique dun systme en sous-systmes. X1 fait 1 , peut aussi figurer dans une explication contextuelle, savoir linteraction des X 1, X2, X3...Xn qui performent 1, 2, 3... n de sorte quun systme qui les englobent, S1, performe une activit 1. Ainsi, que le pancras rgule la glycmie figure dans lexplication mcanique du systme digestif en montrant son interaction avec lestomac, le foie, le duodnum, etc. On ne sintresse plus alors aux constituants de X, mais son interaction avec dautres entits116.
Figure 3-1 Dcomposition mcaniste, d'aprs Craver (2001)
Les explications constitutives et contextuelles expliquent comment une entit ou une activit sinsre dans un rseau causal; les premires montrent comment X1 fait 1 grce aux activits des parties P1, P2, P3...Pn;
Pour simplifier, nous avons suppos ici quune entit ne performait quune opration, mais il est videmment possible quelle puisse en performer plusieurs au sein du systme.
116
94
lexplication passe dun niveau suprieur un niveau infrieur. Les secondes montrent comment X1 interagit avec dautres entits X2, X3...Xn. et comment conjointement les X participent ce que S1 fasse 1 ; lexplication est la fois horizontale (interaction entre entits) et ascendante (passe dun niveau infrieur un niveau suprieur). Une troisime faon dexpliquer comment des entits et activits sinsrent dans lordre causal est par leur histoire. Une explication tiologique identifie une squence causale qui mne la performance actuelle de 1 par X1. Des explications adaptationnistes sont des exemples typiques dexplications tiologiques, mais elles ne sont pas les seules. Le dveloppement, la biographie individuelle, lapprentissage et des phnomnes sociaux peuvent figurer dans des explications tiologiques. Elles ne dcrivent pas comment X1 fait 1 , ni comment X 1 interargit avec dautres entits ou comment il participe ce quun systme englobant performe une activit un autre niveau; ltiologie dun phnomne se termine l o les explications constitutives et contextuelles commences (bien quelle puisse les informer). Ainsi si on veut fournir une explication tiologique de la rgulation de la glycmie ( 1) par le pancras (X 1), on lexplique la fois par le dveloppement (des gnes contrlent la division cellulaire et la morphologie) et par lvolution (la rgulation de la glycmie par le pancras est un trait quon retrouve dans les organismes actuels parce que leurs anctres le possdaient). Notons quune explication tiologique est seulement une explication rtrograde (backward-looking) : elle peut tre une explication adaptationniste par laquelle on montre que la prsence actuelle dun trait est due son adaptativit antrieure, mais comme nous le verrons ces explications sont plus rares en biologie et plus coteuse pistmiquement. Donc une explication tiologique peut retracer uniquement la trajectoire dun mcanisme. La science base de modles Une explication mcaniste est foncirement diffrente dune explication nomologico-dductive, mais fournit quand mme une explication scientfique sans faire intervenir de lois. Plutt quune idalisation comme les lois newtoniennes, un modle postule plutt des abstractions117. Dans une explication ND, on explique un phnomne empirique en montrant comment il s'insre dans une connexion (nexus) nomique (Hempel 1965:488). Lexplication requiert alors quon fasse intervenir des
Une idalisation est une reprsentation dune entit idale qui na pas de contrepartie empirique; une abstraction est une simplification dune entit existante (Cartwright, 1989). Alors que dans le premier cas on dcrit des relations formelles entre des fictions, dans le second on dcrit des relations entre des entits tenues pour relles (1991: 52).
117
95
lois de la nature et des espces nomothques. Or cette vision de la recherche scientifique dcrit mal plusieurs domaines : a. Les sciences o les lois de la nature sont plutt auxiliaires dans lexplication : la biologie ou la gologie, par exemple, fournissent des explications scientifiques et produisent des prdictions empiriques. Bien quelles sappliquent des domaines plus limits que les sciences nomothtiques, lexplication dun tremblement de terre ou dune mutation est une explication scientifique. b. La pratique relle de sciences nomothtiques : mme si elle expliquent des phnomnes laide de lois de la nature, la physique et la chimie ont recours des simulations informatiques afin de trouver des solutions numriques (des approximations) lorsque des solutions analytiques sont impossibles, particulirement lorsque des systmes non-linaires sont tudis. La simulation fait office de loi de la nature en ce quelle subsume le phnomne observ, mais celui-ci nest pas expliqu principalement par des lois. c. Lingnirie : les connaissances utilises pour des explications de phnomnes (mauvais rendement dune machine, dbit trop faible dune pompe, etc.) font appel au fonctionnement ou au design des artefacts. la suite de Salmon, la philosophie des sciences contemporaine reconnat que dans plusieurs cas, expliquer un phnomne consiste montrer comment il sinsre dans une connexion causale plutt que nomique (Salmon, 1984: 9 &19). En biologie, en conomie ou en psychologie, lexplication causale procde par la formulation de modles mcanistes plutt que par une dduction nomologique. Un modle scientifique118 est une reprsentation simplifie et hypothtique dun systme trop complexe pour tre tudi directement. Avec les instruments de mesures, expriences, thories et donne, les modles font partie de la bote outils pistmiques du scientifique.
Notons que modle ne rfre pas ici la conception smantique (Suppe, 1974) des thories scientifiques, qui tentait de remplacer la conception syntaxique-axiomatique des thories par une conception smantique. Cette dernire recherche une caractrisation gnrale des thories scientifiques plutt quune caractrisation raliste de la pratique actuelle de la science.
118
96
Selon les thoriciens de la science base de modles119, les modles ont un rle de mdiateurs (Morgan & Morrison, 1999) entre les thories et les donnes. Les thories fournissent des principes ou rgles pour formuler des modles simplifis de phnomnes afin de les tudier. En biologie, la slection naturelle, par exemple, nest pas une loi de la nature, mais un principe gnral; partir de lui, on peut construire des modles de dynamique ou de gntique des populations, qui serviront la prdiction ou lexplication. Les modles sont des outils plutt que des descriptions universelles comme les lois de la nature et peuvent tre adapts aux besoins de la recherche. Si on veut tudier le mouvement brownien de molcules deau, le modle reprsente une collection de molcules; si on veut plutt tudier un flux deau dans un tuyau, le meilleur modle reprsente leau comme un fluide continu. Dans tous les cas, le modle mcanique ou non fournit une explication dun phnomne en le subsumant sous une reprsentation gnrale, mais non universelle. On peut expliquer le fonctionnement dun organe en particulier laide dun modle gnral de lorgane. Le modle peut avoir plusieurs formats : dans le cas dun organe ce peut tre une reprsentation graphique, mais un modle scientifique peut aussi tre une simplification linguistique (une analogie), une reprsentation mathmatique qui rduit les paramtres ou dimension du systme tudi, une miniature de loriginal (comme pour les tests en soufflerie) ou encore un programme informatique. Dans tous les cas, le modle est ltalon de mesure et le moteur dinfrence de la thorie. Les modles, selon Hempel (Hempel, 1965: 441), ne pouvaient servir quen contexte de dcouverte, afin de guider heuristiquement la recherche, car un modle nexplique rien en lui-mme . Pourtant, force est de constater particulirement depuis lintroduction de mthodes informatiques que la science et lingnirie ont constamment recours des modlisations en contexte de dcouverte et de justification. Les lois de Newton ou lquation de Schrdinger ne sappliquent pratiquement jamais directement aux systmes tudis, mais plutt par lintermdiaire de modles numriques (Humphreys, 1995: 65). De mme, lconomie est plus adquatement comprise comme une science qui formule des modles plus que des lois de la nature (Gibbard & Varian, 1978: 676; Rubinstein, 1995).
voir (Cartwright, 1989, 1999; Giere, 1999, 2004; Godfrey-Smith; Humphreys, 1995, 2004; Wimsatt, 1987) de mme que les essais dans (Morgan & Morrison, 1999). La question nest pas aborde quen philosophie : voir (Rumble et al., 2001) en chimie et (Wymore, 1993) en ingnirie.
119
97
Les modles computationnels Les modles algorithmiques ou computationnels sont particulirement pertinents pour les thoriciens de la rationalit. En effet, un algorithme est un mcanisme (on peut le dcomposer en routines, sous-routines), et ces modles sont soumis des contraintes de tractabilit. Traiter lagent comme un programme ou une collection de programmes a lavantage den donner une reprsentation qui saccorde avec le schma dexplication des systmes non-ergodiques tout en restreignant lespace dhypothses et en intgrant des limites de temps ou dtape de calculs. Pour dissiper une mauvaise interprtation, prcisons que de comprendre lagent comme un mcanisme algorithmique nquivaut pas ce qui a t appel le fonctionalisme (ou aussi computationalisme) 120 : dans sa conception classique, le fonctionalisme rduit la cognition un seul niveau dorganisation (le logiciel ), lequel est ralis dans le matriel, soit le cerveau, et justifie cette rduction par une analogie simpliste avec lordinateur. Or premirement un ordinateur est, comme le cerveau, une organisation hirarchique qui peut tre dcompos en plusieurs niveau de traitement de linformation : systme d'exploitation, systme essentiel (shell), assembleur, langage-machine, application. Il ny a pas quun niveau structure et un niveau fonctionnel, mais une hirarchie dans laquelle chaque fonction compose une structure de niveau suprieur; de mme, le cerveau est une hirarchie de mcanismes : molcules, neurones, rseaux, cartes, circuits121. Les modles mcanistes refltent plus cette hirarchie que le fonctionalisme classique. Ensuite, le fonctionalisme a faussement rduite le calcul la reprsentation : pas de calcul (computation) sans reprsentation (Fodor, 1981[2004]: 180). Or les calculs quimplmentent les ordinateurs sont essentiellement des instructions dont la smantique nest pas dtermine par leur rfrence des tats de choses externes mais par leur rle dans lexcution de programmes. Un systme aussi peu cognitif que le noyeau dune cellule peut tre modlis comme un programme dordinateur, sans quon doive considrer que les procdures par lesquelles les protines sont gnres aient des tats mentaux. La place de lagent rationnel en science Considrer que le rel locus de la reprsentation de lagent rationnel est un modle plutt quune thorie idalise permet de modrer le
120
Par exemple (Fodor, 1975; Marr, 1982; Pylyshyn, 1984). (Churchland & Sejnowski, 1992; Hardcastle, 1996: 79-84).
121
98
scepticisme lgard des thories formelles classiques. Elles ne sont pas (ou du moins pas uniquement) des normes ou des descriptions idalises, mais plutt des principes gnraux qui permettent de construire des modles de lagent rationnel. Elles fournissent un cadre partir duquel on peut dcrire le comportement rationnel. Grce aux axiomatisations de von Neumann-Morgenstern, Savage, Arrow-Debreu, on possde des concepts clairs de ce quest une dcision, lutilit, la probabilit, lincertitude, le risque, la stratgie, lquilibre, la prfrence, les optimums. De la sorte, ces thories ne sont jamais compares directement avec le rel, et constituent plutt un guide mthodologique pour ltude des agents rationnels. On peut considrer que ce que les tudes de Tversky et Kahneman montrent prcisment, cest quun modle de lagent rationnel daprs lequel les raisonnements de cet agent sont identiques des drivations des axiomes de la thorie de la dcision est un modle aussi peu performant quune simulation mtorologique qui manque systmatiquement de prdire la temprature pour le lendemain. Si la simulation choue, le mtorologiste reverra le modle informatique plutt que la mcanique des fluides. Dans toutes discussion sur lagent rationnel conomique, il faut donc prciser quel corps de connaissance on fait rfrence; un agent rationnel est un concept utilis dans trois types gnrique de connaissances. i) ii) iii) Les principes gnraux : Thories formelles de la rationalit et de la calculabilit, connaissances technologiques et rquisits conceptuels Les modles mcanistes de lagent rationnel et son environnement physique et social Les tudes descriptives du comportement, du fonctionnement des agents rationnels rels
Les principes (1) permettent de construire des modles (2), lesquels sont valus selon les recherches descriptives (3). Dans cette image scientifique, les fonctions dutilit, quilibres de Nash ou lois de loffre et la demande ne sont pas des lois de la nature ou des descriptions dagents idaux, mais des principes pour construire des modles dagents rationnels. Ces modles peuvent tre utiliss des fins normatives ou descriptives, car le caractre normatif ne provient pas des modles ou des thories, mais des hypothses auxiliaires et des usages pistmiques qui en sont faits. Dans ce qui suit, conformment la perspective ingnirique du prsent travail, nous nous intresseront principalement aux modles.
99
3.2.3 CRITIQUE ET DFENSE DE LAPPROCHE INGNIRIQUE Plusieurs critiques ont t formules lgard de lanalogie entre normativit et ingnirie122. On lui reproche premirement de ntre quune analogie plutt quune relle avanc thorique. Les analogies peuvent tre utiles pour conceptualiser un problme, mais elles ne nous disent pas comment on doit comprendre croyance vraie justifie ou infrence irrationnelle en ne faisant intervenir que des entits naturelles. Le second problme relve de la rduction, propose par Quine, de la normativit ladquation des moyens pour les fins, bref de rduire une normativit substantive une normativit instrumentale. La vrit, par exemple, peutelle tre une valeur seulement dans la perspective o des thories vraies nous sont utiles? Il est pourtant louable de rechercher des thories vraies uniquement pour lhonneur du genre humain, ou encore pour leur potentiel explicatif. La vrit peut tre une fin en soi, sans tre soumise des impratifs pratiques, individuels ou sociaux. Lpistmologie naturalise de Quine nlimine pas la possibilit que les fins normatives tiennent leur valeurs de considrations autres que naturalistes ou empiriques (Pacherie, 2002). Un troisime problme vient de la justification volutionniste de la normativit, qui fait partie du programme de naturalisation de Quine. Celui-ci doit expliquer do les thories normatives tiennent leur validit si elles ne sont pas des normes nonnaturelles. La rponse classique de Quine est un appel lvolution : les individus irrationnels ont tout simplement moins de chances de se reproduire, donc les normes de rationalit sont valides parce quelles ont pu participer ladaptation de nos anctres. Or Stich critique ce genre dapproche en montrant que des mcanismes irrationnels, extrmement averse au risque, sont plus adaptatifs que des mcanismes pleinement rationnels. Finalement, un quatrime problme survient si on assimile la normativit lingnirie : le naturaliste doit expliquer comment dcrire dans son vocabulaire les contraintes normatives qui sappliquent aux agents. Ceux-ci, lorsquils sont dans lerreur, ont des reprsentations fausses. Or faux , comme vrai ou bien est un terme normatif qui ne se rduit aucun tat du cerveau ou de la constitution de lindividu. Il est donc difficile dexpliquer en termes naturaliste comment un agent est dans lerreur, mais aussi comment il peut aussi reconnatre quil est dans lerreur, autrement dit, tre surpris. Nous traiterons ici de chacun de ces quatre problmes.
Et plus gnralement sur la naturalisation et la normativit; voir les discussions dans (Kornblith, 1994).
122
100
Lanalogie Soulignons premirement que lide dune conception ingnirique des normes napparat que dans deux brefs passages de luvre de Quine123 et donc son potentiel argumentatif est limit. Ce sont aux tenants de cette conception de la justifier, et non aux crits de Quine. Ensuite, comme toute analogie, son principal dfaut est den tre une, cest dire dtre une identit partielle. Une analogie est une infrence qui va dun domaine-source un domaine-cible, en appliquant une structure de relation entre deux items-sources deux items-cibles. Elle ne survient pas en contexte de justification, mais de dcouverte. Ainsi, avec de nombreux exemples tir de lhistoire des sciences, Holyoak et Thagard ont montr que la dcouverte scientifique passe essentiellement par un raisonnement analogique (Holyoak & Thagard, 1995)124. Le raisonnement dductif survient une fois que cette phase de dcouverte et de conjectures est passe et une fois que ltendue de lanalogie a t empiriquement valide. Vu le caractre bref et analogique des exposs de Quine ce sujet, il nest pas surprenant que cette conception comporte des zones grises. La rduction de la normativit ladquation moyens/fins La conception ingnirique de la rationalit dfendue ici concerne une partie seulement des recherches qui touchent la rationalit. Nous ne prtendons pas montrer que tout concept normatif ou toute thorie de la rationalit se rduit des connaissances ingniriques : notre proposition est beaucoup plus modeste : nous proposons de considrer uniquement la rationalit conomique, telle que le premier chapitre la dfinit, travers ses modles de dcision, de jeux, et dchanges, comme une connaissance ingnirique, qui peut tre utilise pour des projets thoriques ou pratiques divers (philosophie, conomie, intelligence artificielle). De la sorte, il nest pas propos de rduire des prdicats comme vrai des prdicats comme technologie de prdiction efficace, ni de considrer que des valeurs comme le bien ou le vrai se rduisent ladquation moyens/fins. En revanche, des prdicats comme utile peuvent tre traduits par technologie daction efficace . Lobjection, en pistmologie, visait les valeurs telles que la vrit et la prdiction, en suggrant quelles pourraient tre en fait justifies par des raisons
123
(Quine, 1986: 665, 1990: 19)
Les tudes ltudes in vivo de groupes de recherche scientifique, par Dunbar et ses collaborateurs, montrent aussi son usage en science (Dunbar & Blanchette, 2001).
124
101
thoriques plutt quempiriques; dans le domaine de la rationalit conomique, la principale valeur est lutilit. Or loptimisation de lutilit a une justification naturaliste simple et directe : un agent qui nest pas dispos, au moins sur lensemble de son existence, maximiser son utilit individuelle diminue ses chances de survie et de reproduction. Dans une mme population, des agents diposs la maximisation de leur utilit, qui tendront satisfaire leurs besoins, auront plus de chances de transmettre leurs gnes. Lagent qui ne peut satisfaire de simples besoins comme la nutrition perd rapidement lopportunit de perptrer son espce. Sil dispose dune stratgie efficace, celle-ci peut devenir un avantage volutif. Les agents disposs acqurir cet avantage volutif verront leurs gnes multiplis dans le pool gntique. Si la maximisation est un trait sous contrle gntique, il procure ipso facto un avantage volutionniste; si ce trait est plutt sous le contrle de lenvironnement, la slection naturelle peut, la longue et par l'effet Baldwin125, favoriser les gnotypes qui prdisposent leurs porteurs maximiser leur utilit. Si des individus ont des prdispositions gntiques acqurir plus rapidement ou moindre cot cette capacit, la topographie du paysage adaptatif est alors modifie par leur avantage, ce qui tendra favoriser la slection de ces gnotypes. Sur largument pragmatiste de Stich Il est noter que largument ici concerne la rationalit de laction et non celle des croyances et donc nest pas menac par les critiques classiques des tentatives de naturaliser des normes de croyances ou dinfrences. Des philosophes ont souvent tent de justifier ces normes par des raisons volutionnistes. Largument classique va comme suit : la slection naturelle garantit que les organismes seront capables dinduire correctement (Quine), que leurs croyances seront vraies, (Dennett) et quils matrisent les bases de la logique (Fodor). On le sait, Stich (1990 : 60) rplique que cette thse est fausse car lvolution nest pas un concepteur dagents optimaux, mais un bricoleur qui construit des systmes suffisament efficaces pour la survie. La slection naturelle ne favorise pas des architectures qui maximisent les croyances vraies et les infrences logiquement valides, mais des architectures qui maximisent le succs reproductif. De la sorte, mieux vaut tre sauf que dsol : un dispositif irrationnel, comme un mcanisme de dtections des prdateurs qui se dclenche pour rien 9 fois sur 10, peut aussi avoir t favoris par la slection : il vaut mieux tre en vie et croire erronment quun prdateur est aux alentours, que de croire quaucun prdateur nest prsent et dtre afflig par sa dcouverte. Autrement dit, comme les faux positifs sont moins dangereux que les faux ngatifs, un mcanisme daversion au
Voir (Hinton & Nowlan, 1987; Maynard Smith, 1987; Weber & Depew, 2003) pour une prsentation et une dicussion.
125
102
risque, beaucoup plus simple que la logique ou la thorie bayesienne, est plus efficace volutionnairement. Largument est problmatique pour qui veut traiter la rationalit thorique et lpistmologie normative comme des produits de lvolution biologique, sans tenir compte de lvolution sociale et des pratiques valuative qui laccompagnent. Il montre que cette forme de rationalisme volutionniste suppose quil est ncessairement adaptatif dtre dou en logique et que lvolution aurait slectionn des architectures cognitives adaptes cet effet. Largument de Stich sattaque cette justification volutionniste des normes de rationalit thorique; comme nous lavons soulign au premier chapitre, la rationalit conomique ne se confond pas avec la rationalit des croyances, et donc son argument ne sapplique pas. On peut toutefois essayer de reproduire largumentation pour la rationalit conomique, et voir si il est plus adaptatif de maximiser son utilit. Nous reviendrons au chapitre 5 sur une rponse plus labore cette question, car elle dpend de ce que la maximisation de lutilit veut dire dans un contexte dvolution des espces. Si elle quivaut un algorithme de force brute qui value toutes les possibilits et leur utilit subjective, alors clairement elle nest pas adaptative. Cette conception de la maximisation ayant t passablement critique ici, ce nest pas elle que nous rfrerons, mais plutt une conception de la maximisation de lutilit comme contrle adaptatif, ce qui sera abord plus loin. Pour linstant, on peut reprendre lexemple de Stich appliqu la rationalit conomique et montrer quen fait ce mcanisme daversion au risque est une procdure rationnelle pour un agent situ dans un environnement risqu et quil peut se justifier par lvolution. Il est parfaitement rationnel (conomiquement parlant), dtre averse au risque dans un environnement risqu, car un agent averse au risque maximise mieux son utilit quun agent enclin au risque, les prdateurs ayant plus de chances de consommer les seconds que les premiers. En maximisant son utilit, il sassure des meilleures chances de survie et de reproduction, ce qui maximise son aptitude (fitness ). Ce sont plutt les cratures qui se trompent chroniquement dans leurs dcisions qui ont une tendance pathtique mais admirable mourir avant de se reproduire (Quine, 1969: 66). La possibilit de lerreur et de la reconnaissance de lerreur Le normativiste, mme sil accepte lide que dans un domaine restreint, savoir les thories conomiques de la rationalit, on puisse traiter les noncs normatifs comme des noncs ingniriques plutt que scientifiques, peut encore objecter que ce ne sont pas que les thories qui sont soumises des contraintes normatives, mais aussi les agents. En effet, on doit pouvoir dire dun agent rationnel quil est possible quil soit dans lerreur. Un agent est dans lerreur dune premire manire, si par exemple il ne se conforme pas des normes de rationalit. Pour la rationalit
103
pratique, cela peut consister tenir pour vraie une croyance malgr une vidence contraire, ou encore commettre un sophisme comme la ngation de lantcdent; pour la rationalit pratique cela pourrait consister choisir systmatiquement une stratgie domine. Le caractre erron est alors driv dune comparaison entre le comportement (ou le raisonnement) et la thorie normative qui fait office dtalon de mesure. En considrant ces thories comme des connaissances ingniriques, la conception avance ici intgre cette dimension valuative : elle permet de dire dun agent qui, dsirant maximiser son utilit en prenant un minimum de risque aurait choisi de cooprer dans un dilemme du prisonnier classique, quil est dans lerreur. Compte tenu de la situation, si tel est son dsir, alors il doit choisir la dnonciation. Un agent peut aussi tre dans lerreur lorsque ses tats mentaux sont valus en fonction de son adquation non pas aux thories normatives, mais selon des tats de choses extrieures lui. Croire que le bruit quon entend est celui dune moto, alors que cest en fait un marteaupiqueur, est une autre faon dtre dans lerreur. Or si on dit que sa croyance est errone, cest quune croyance sert normalement reprsenter des tats de choses. Pour le normativiste, les croyances doivent tre smantiquement valuables. Le contenu dune croyance est ltat de choses qui le rend vrai, ce quoi il correspond. Toute notion de contenu, affirme Peacocke,
comportera (...) une distinction entre le correct et l'incorrect. Cette proprit d'tre correct dpend de la faon dont le monde est. C'est une proprit normative: nous tendons vers cette rectitude en formant des croyances (Peacocke, 1992)
Un agent rationnel devrait aussi pouvoir tre surpris. La surprise requiert que lagent soit conscient du contraste entre ce quil tenait pour vrai et ce qui est vrai : la dtection de ce contraste signifie quon distingue le vrai du faux (D. Davidson, 1991: 73). Transpos au domaine de la rationalit conomique, largument normativiste affirme quun agent rationnel est un agent qui peut, ou dont on peut dire quil peut, prendre de mauvaises dcisions. Les dcisions seront mauvaises si elles ne russissent pas atteindre leur objectif, si elle ne correspondent pas aux tats de choses quelle devait faire advenir. Lagent qui, dans un dilemme du prisonnier voulait maximiser son utilit en prenant un minimum de risque et qui aurait choisi de cooprer est dans lerreur en ce quil na pas pris la dcision qui lui garantirait son objectif particulier. Si cet agent est rationnel, il doit tre surpris du contraste entre le rsultat escompt et le rsultat actuel. Si cela est vrai, le naturaliste est encore de retour la case dpart : si la nature des tats mentaux est dtermine par ce quils doivent reprsenter ou faire advenir, alors une description de ces tats doit rflter
104
llment normatif. Or on peut argumenter quon nest pas tenu de considrer que la possibilit de lerreur implique que les tats mentaux sont de nature normative. Lorsquun panneau routier126 est orient vers Marseille alors quil porte lindication Paris 200 km , lindication quil donne est errone, fausse. Or le fait que lindication soit fausse ne fait pas rfrence quelque norme que ce soit. Cest un fait objectif que la flche du panneau ne pointe pas vers Paris. On na pas faire intervenir de normes ou de considrations sur ce qui doit tre le cas, ce quest la fonction propre du panneau, ce pour quoi il est conu, pour dire que lindication errone: elle lest parce quelle pointe vers Marseille plutt que Paris. De mme, quune croyance soit fausse signifie quelle ne reprsente pas adquatement ce quelle reprsente. Cest encore ici un fait objectif a propos de la relation entre la croyance et des tats de choses. Largument nest certes pas dfinitif : il faut encore montrer quon peut exprimer le concept derreur dans une conception ingnirique, et expliquer en quel sens un agent peut tre surpris, cest--dire constater son erreur, dtecter un contraste entre ce quil tenait pour vrai et ce qui est le cas. La prochaine section intgrera cette question dans un modle ingnirique de la comptence rationnelle.
EN RSUM : Comme la conception normativiste, la conception ingnirique de la rationalit conomique satisfait certains rquisits conceptuels leffet quune thorie de la rationalit doit comporter des termes valuatifs, la diffrence que ces normes sont connues a posteriori. Comme la conception descriptiviste, elle traite des agents rels et de leurs contraintes (elle en fait des proprits endognes de la dcision rationnelle), sauf quelle nabandonne pas lide quon puisse poursuivre de faon conjointe les projets normatifs et descriptifs. Au contraire, elle renforce le lien qui les unit.
3.3
MODLES DE LA COMPTENCE RATIONNELLE
Contre le principe de sparation avanc par les normativistes commes les descriptivistes, la conception ingnirique de la rationalit conomique affirme que les thories de la dcision, des jeux ou de march doivent tre comprises comme des connaissance technologiques, des normes conditionnelles et des prescriptions a posteriori et dpendantes du contexte : tant donn telle situation, pour atteindre B, on doit faire A si on veut le faire tout en satisfaisant certains critres. Nous avons jusquici surtout parl du statut des thories de la rationalit conomique en gnral et de leurs prsupposs ontologiques, et soutenu quon peut dfinir les thories de la rationalit comme des connaissances qui portent sur des
126
Lexemple est de Dretske (Dretske, 2001).
105
espces naturelles historiques. Nous traiterons ici plus spcifiquement de lagent conomique. Il a t propos que le concept AGENT CONOMIQUE rfre une certaine classe naturelle de systmes dynamiques : des sytmes nonergordiques biologiques. La catgorie englobe videmment tous le vivant, aussi nest-elle pas assez prcise, il faut encore la dlimiter. En tant quespce naturelle historique (agrgat homostatique de proprits), les contours de cette catgorie doivent tre dfinis par lexplicitation de processus causaux qui font en sorte que les agents possdent les proprits de surface. cette fin, nous avons propos plus haut un cadre gnral pour traiter de cette question, savoir la distinction comptence/performance rationnelle. Considrons que les actions des agents rationnels, leurs performances, constituent leur proprits de surfaces, celle qui tendent co-occurer chez ces agents. La comptence rationnelle, cest--dire lensemble des capacits ou dispositions produire des actions rationnelles, est constitue de processus causaux qui font que ces actions surviennent. Nous proposons de considrer quun agent conomique est un systme, une architecture de contrle dote dune comptence rationnelle, que nous nommerons plus simplement architecture de contrle rationnelle, abbrvie ACR ci-aprs. Une ACR est un agent minimalement rationnel127 : il sagit dune abstraction (dont la partie II tentera dlucider lextension) des comptences minimalement requises pour satisfaire certaines conditions qui en font un agent conomiquement rationnel. La question laquelle cette entrerprise tente de rpondre nest donc pas quentendons nous par rationnel , mais quelles sont les capacits requises pour tre une ACR. Pour ce faire, nous utiliserons une heuristique souvent employe en philosophie le design de crature . (Grice, [1975]1991), par exemple, se propose de construire, en imagination, une crature qui servirait de modles pour les cratures actuelles, quil nomme pirot 128.
L'ide gnrale est de dvelopper squentiellement la thorie psychologique de diffrents types de pirots , et comparer ce qu'on gnre ainsi avec les concepts psychologiques qu'on
Nous poursuivons ici la rflexion de (Dretske, 2006) sur la rationalit minimale , cest--dire les comptences minimales quun agent doit possder pour tre rationnel.
127
Calembour de Grice : lexpression vient de la phrase les pirots karulizent latiquement utilise par Carnap pour montrer quune expression satisfaisant la structure Non+Verbe+Adverbe pouvait tre incomprhensible (Rudolf Carnap, 1937: 2).
128
106
applique des cratures actuelles similaires, et lorsque des inadquation apparaissent, (...) tendre ou amender la construction
Comme Grice, (Velleman, 2000) ou (Bratman, 2000), nous construirons en imagination un pirot rationnel, laide de la thorie du contrle et de concept apparents. Nous dcrirons les mcanismes ncessaires pour quun pirot soit conomiquement rationnel. Le pirot ne sera toutefois pas un homo oeconomicus une machine de Savage pourrions nous dire car celui-ci nest pas un tre tractable; ni une machine de Turing, car ce modle, bien que restreint aux fonctions rcursives, nest pas sujet des normes de tractabilit; ni un ordinateur tel quon le connat, la machine de von Neumann, car bien que limite la classe des fonctions tractables, elle ne souffre pas des contraintes de temps rel que posent le contrle du corps dans un environnement incertain. Suivant une recommandation de Carnap, nous considrerons un robot comme le prototype de lagent rationnel :
Penser au design un robot nous aidera trouver des rgles de rationalit. Une fois trouve, ces rgles peuvent tre applique () dans la construction dun robot (R. Carnap, 1962: 309).
Carnap prcise galement que ces rgles de rationalit doivent aussi sappliquer aux agents rationnels dans leurs efforts pour prendre des dcisions aussi rationnelles que leur capacits limites leur permet. Une machine de Carnap , la diffrence des autres machines, est en contact matriel et informationnel avec son environnement. Lagent rationnel, si on le conoit comme un type de robot, est un agent matriel situ dans le temps et lespace, sujet toutes les contraintes que subissent les systmes physiques, dont lentropie. De plus, conformment aux arguments sur la rationalit limite, lenvironnement o il est situ est complexe et incertain, ses capacits maximiser son utilit sont limites, tout comme les diffrentes ressources externes qui lui permettront de la maximiser. Il sagira plus loin de dterminer, dans larbre de la vie , les branches qui sont constitues de populations dagents rationnels, ce qui demande trois tapes : 1) Dcrire la nature des ACR 2) Dterminer dans quelle mesure et quelles conditions un agent biologique est une ACR 3) Spcifier ltendue des ACR biologiques
107
Le chapitre suivant traite de la seconde tape; le chapitre 5 est consacr la troisime, alors que le reste du chapitre est ddi lexposition et la dfense de la premire tape. 3.3.1 LE CONTRLE EMBARQU
Le pirot de degr zro est une architecture de contrle tout court129. Elle comprend deux sous-systmes, un contrleur et un contrl (appels aussi rgulateur et usine). Le systme contrl est un systme dynamique (voir chapitre 2) : dx/dt = F(X;;t) [quation 2]
auquel on a ajout une variable , soit lensemble de ses paramtres. Contrler un systme dynamique demande de rsoudre le problme auquel tout systme de contrle doit faire face, que lingnirie du contrle dfinit ainsi :
La mise jour en-ligne des variables manipules afin de satisfaire des critre de performances multiples et changeants dans un contexte dvolution des caractristiques de lusine [le contrl] (Garcia et al., 1989: 336)
Le contrle seffectue par des boucles de contrle, des cycles de mesure (entre dinformation), rgulation (application dune rgle de contrle) et commande (la sortie dinformation). La rgulation seffectue par un algorithme, ou un ensemble dalgorithmes, qui prennent les mesures pour entre et les commandes pour sorties. Dans les cas les plus simples, par exemple le systme minimal de contrle la figure 3-2, on peut reprsenter la rgulation comme un rgle SI-ALORS : SI la variable xi dpasse une valeur P*, ALORS augmenter la valeur xi de 1. La valeur P* est la valeur de consigne (set point), sous, , ou au-dessus de laquelle une variable doit se trouver. Dans lexemple, une mesure indique que la valeur de la variable x 1 est a . Supposons que a soit plus lev que P* : le contrleur incrmente (++) de 1 la valeur de la variable x1.
voir (Antsaklis, 1994; Glad & Ljung, 2000; Holland, 1992; Saridis, 1985) sur la thorie du contrle, particulirement le contrle dit intelligent.
129
108
Figure 3-2 Architecture minimale de contrle
Par des boucles de rtroaction (feedback)130, le systme encode le rsultat de son action et ajuste la dynamique du systme en fonction des paramtres et de la mesure. La rtroaction maintient certaines variables lintrieur de certaines limites; par exemple, si un thermostat dtecte une diffrence entre la temprature mesure dans une pice et la valeur de consigne P*, une commande est envoye pour augmenter ou diminuer lmission de chaleur. Ainsi la rgulation corrige lerreur (la divergence entre les valeurs dsires/actuelles). Les systmes peuvent rguler aussi par des boucles de commande prdictive131 (feedforward). Dans ce cas, la rtroaction modifie le systme avant que ne survienne lerreur, car un processus interne agit comme un prdicteur derreur. Par exemple, un thermostat dot dun themomtre lextrieur de la maison pourrait dtecter une baisse de temprature externe et, en prvision de cette baisse, augmenter lmission de chaleur. La rgulation, plutt que dtre un contrle de lerreur (la divergence entre les valeurs), est alors une anticipation de lerreur. La prdiction est avantageuse pour le systme en ce quelle lui permet danticiper des perturbations et vite que celles-ci soient incontrlables. Comme toute prdiction ne peut tre parfaite (elle dpend de la prdictibilit du phnomne, de la qualit de linformation
Nous utilisons ici les traductions de termes anglais tels que spcifi par le Grand Dictionnaire Terminologique de lOffice Qubcois de la Langue Franaise (http://www.granddictionnaire.com).
130 131
(Richalet et al., 2005).
109
sur le phnomne et de la capacit prdictive du systme), la rtroaction et la commande prdictive doivent travailler de concert. Les contrleurs embarqus Supposons quun dispositif informatique reli au systme nerveux dun individu russisse lui faire effectuer une action qui semblerait parfaitement rationnelle de lextrieur; lindividu dans cette situation ne possderait pas pleinement une comptence rationnelle, car le contrle de son action serait en partie extrieure. Il serait manipul par le dispositif. Une premire condition de la rationalit est lautonomie, qui demande la possession dun contrleur endogne. Lagent rationnel est celui dont la cause qui fait mouvoir ses organes rside en lui et qui a en lui-mme les principe de ses actes 132. Le contrleur dun agent rationne est bord du contrl. Ces architectures de contrles dites intgres ou embarques (embedded)133, sont radicalement diffrentes des non embarques. En ingnirie du contrle, les systmes embarqus sont des systmes dont l'intgration du matriel et du logiciel est fortement couple (Li & Yao, 2003: 5). Les vhicules robotiss envoys sur Mars par exemple doivent avoir un contrleur embarqu, car le temps que mettraient les signaux envoys par la NASA atteindre le vhicule et celui que prendraient les signaux de rtroaction pour atteindre la Terre seraient trop longs pour ragir de faon efficace134. Lembarquement du contrle impose dimportantes contraintes de temps. La rgulation doit tre effectue en temps rel, cest--dire que les temps de raction et dopration doivent tre infrieurs un dlai; la rgulation doit tre constante et ininterrompue; finalement, la validit et la pertinence dune opration de calcul dpend du dlai ncessaire son excution. Outre des contraintes temporelles, le systme doit aussi respecter des contraintes de viabilit : il doit ragir avant de devenir instable et incontrlable; il volue dans un environnement non dterministe qui peut lcarter tout moment dun tat viable; le systme est critique , au sens o un mauvais fonctionnement ou un dlai trop long dopration peut avoir des consquences nfastes (le pilote
132
Aristote, thique Nicomaque, III, i.
voir (Pasetti, 2002) pour un prsentation; lautorit dfinitive en la matire est (Zurawski, 2005).
133
Lexemple est de (Dennett, 1984). Le premier systme embarqu articifiel a t le systme de guidage de la fuse Appollo. Ces contrleurs sont aujourdhui partout : transport, quipement mdical, tlcommunications, etc.
134
110
automatique dun avion qui entrane un crasement par exemple); de plus, le systme doit tre fiable. 3.3.2 LE CONTRLE
OPTIMISATEUR
Pour tre un systme de contrle embarqu, un agent doit possder un dispositif structurellement et fonctionnellement distinct dautres organes dont la fonction est la rgulation du contrl par la transformation de signaux dentre en signaux de sortie. Cette condition nest toutefois pas suffisante : supposons un dispositif informatique reli au systme nerveux dun individu russissait stimuler, sans quil en soit inform, son systme nerveux afin quil prouve un dsir irrprsible de boire un verre deau et que par la suite il satisfasse son dsir. Cet agent ne serait pas non plus autonome, car la motivation serait aussi extrieure. Il serait alors manipul (cognitivement plutt que physiquement). Lautonomie demande donc aussi une motivation endogne lagent. Les conceptions de la motivation tombent gnralement sous deux catgories : les conceptions dites humiennes 135, et des conceptions normativistes (Brandom, 1994; McDowell, 1994). La conception humienne fait du dsir le premier moteur de laction, ce que Lewis rsume en ces termes :
[] nous sommes pousss [moved ] entirement par le dsir; nous sommes disposs faire ce qui servira nos dsirs (). Sil ny avait aucun dsir servir, nous ne serions jamais pousss faire faire quelque chose plutt quune autre. Tout ce qui arriverait serait entirement non motiv. (D. K. Lewis, 1988: 323)
Pour les normativistes, en revanche, une action rationnelle ne peut sexpliquer par des raisons internes lagent; il doit y avoir des normes, des rquisits ou des rgles de nature sociale qui motivent le comportement. Si par exemple un employ de banque met une cravate pour son travail, son action sexplique par des normes institutionnelles (Brandom, 1994: 90); les normes peuvent aussi tre prudentielles, ou inconditionnelles. Parler du dsir ou de la motivation dun agent quivaut exprimer les normes qui guident son comportement. Comme nous traitons ici des agents conomiques, qui maximisent leur utilit et que leur autonomie est un rquisit pour que ces agents
Dont la thorie de la motivation sapparente Hume (sans pour autant suivre Hume la lettre) : (Bratman, 1987; D. K. Lewis, 1988; Mele, 1992), etc. cf (Pettit, 1987) et (M. Smith, 1987) pour des discussions.
135
111
soient dits rationnels, on peut argumenter quune ACR est un systme humien. En effet, si une ACR est minimalement rationnelle, autonome et maximise son utilit, alors ce qui motive son action est un tat interne du systme : une norme peut rationaliser laction dune ACR qui volue dans une population, mais ces raisons nont pas alors de force causale ( moins dinfluencer les motivations, auquel cas on revient une conception humienne de la motivation). Or une motivation qui na aucune force causale ne peut pousser un agent faire quoi que ce soit. Si on fait intervenir un lment externe dans lexplication, celui-ci doit avoir avant tout un impact causal sur les capteurs et le contrleur du systme. Si cela est juste, alors on peut traduire tre motiv par maximiser son utilit , ce qui, en thorie du contrle quivaut implmenter des schmes de contrle optimal136. Le contrle optimal consiste, pour un systme, trouver un rglage des paramtres qui soit optimal tant donne une fonction dite objectif; cette fonction doit tre maximise, minimise ou stabilise, selon la nature du problme; sa variable indpendante est un tat du systme et sa variable dpendante est une valeur accorde cette solution; toutes les solutions sont apparies une mme devise (currency), qui permet la comparaison et lvaluation des diffrentes solutions. Outre une fonction objectif, un problme doptimisation comporte un ensemble de variables dont la manipulation permet doptimiser la fonction. Finalement, un problme doptimisation comporte toujours un ensemble de contraintes qui restreignent les variables lintrieur de certaines valeurs (certains bassins dattraction ne peuvent tre atteints par le systme selon ses contraintes). On peut le reprsenter de faon simplife ainsi : TANT DONN : Une devise R Des variables x1, x2, x3, xn X Une fonction objectif f : X R Un ensemble de contraintes C R
TROUVER : x X tel que f(x) max xC Le type doptimisation qui dcrit le mieux un agent rationnel est une optimisation multi-objectifs (ou multi-critres), o la solution est un
136
Voir (Boy & Vandenberghe, 2004).
112
vecteur dominant137 plutt quun scalaire. Un tel systme peut optimiser plusieurs fonctions la fois, ce qui fait que plusieurs vecteurs seront adquats (Collette & Siarry, 2003: chapitre 1). Comme une ACR, devant plusieurs prospects galement utiles doit faire un choix, lune des contraintes C est la slection dun des vecteurs. Le problme devient alors un problme de maximisation de lutilit multi-attributs138 : TANT DONN : Une devise R n fonction objectifs o1, o2, o3, on N vecteurs x1, x2, x3, xN X Une fonctionnelle139 dutilit f : X R Un ensemble de contraintes C R TROUVER : x X tel que f(x) max [o1(x), o2(x),...on(x)] C Tel que ok(x) est le degr de satisfaction du k-ime objectif par une solution x. Les fonction objectifs o1, o2, o3, on peuvent tre le cot, le risque, la satisfaction court-terme, ou encore des fonctions dutilit spcifiques un domaine particulier, agrge dans une fonction dutilit globale alors que le vecteur reprsente ltat du systme. De la sorte, une ACR est un systme qui implmente des algorithmes capables de rsoudre un problme doptimisation multi-objectifs et squentiel140. Si on modlise la comptence rationnelle comme la rsolution dun problme doptimisation multi-objectifs, alors le processus doptimisation est une description de la trajectoire du systme dans un espace dtats o seules les dimensions valuatives sont reprsentes (ltat chaque instant dun systme dynamique est un vecteur). Parmi les diffrentes solutions adquates, la rationalit limite du sytme, la trajectoire particulire du systme et ses contraintes de temps rel feront en sorte que le vecteur slectionn ne sera pas ncessairement celui qui aura la valeur la plus leve.
Un vecteur x domine un vecteur x' ssi (1) x est au moins aussi bon que x' pour toutes les fonctions objectifs et (2) x est strictement meilleur que x' pour au moins un objectif.
137 138
Voir (Roe et al., 2001) pour un modle plus complexe. Une fonction de fonction.
139
La programmation dynamique est une des techniques qui peut tre utilise pour driver une procdure optimale de contrle dun systme dynamique dans un problme squentiel doptimisation multi-objectifs (Bellman, 2003 [1957]).
140
113
Cette dfinition laisse penser que la rationalit serait dfinie de faon substantive, que lutilit serait une valeur absolue. Or optimiser lutilit est une proprit qui survient sur une ou des procdures. Il faut diffrencier la fonction, la solution et la procdure. La fonction optimiser est max(x ); la solution est la valeur x qui satisfera la fonction, et la procdure est lensemble des oprations effectues pour rsoudre le problme. Nous pouvons alors proposer une premire proprit des ACR : C1 : Une ACR est un contrleur embarqu qui optimise une fonction dutilit multi-attributs 3.3.3 LE CONTRLE ADAPTATIF Pour des systmes de contrle robustes , les paramtres sont des valeurs constantes dans le temps qui dtermine la trajectoire du systme contrl. Ce type de contrle peut savrer efficace dans un environnement informationnellement transparent, mais risque de savrer problmatique dans un environnement informationnellement translucide (Sterelny, 2003b). Un environnement est transparent lorsque des indices (d'un danger, d'une ressource, etc.) sont fiables et identifiables sans trop de cot nergtique. Si un indice A est statistiquement corrl avec une proprit B, la dtection de A est une prdiction de B. Si la corrlation est constante, lextraction dinformation sur B est alors peu coteuse quant aux ressources de temps, d'nergie et de calcul et la prdiction est fiable. L'environnement est dit translucide lorsque les indices sont moins fiables, plus coteux, ou les deux. Des phnomnes non-linaires, imprvisibles ou la prsence dautres agents peuvent dgrader l'environnement informationnel. Comme la corrlation entre un indice et ce qu'il indique est brouille, le contrle prdictif est moins fiable. Lagent est alors sujet deux types derreurs : les faux positifs ou les faux ngatifs. Dtection du signal et flexibilit Soit larchitecture de contrle prsente plus haut, situe dans un environnement bruit o elle rencontre souvent un signal xi, et dont les capteurs peuvent apparier une valeur dans lintervalle [0,1] la valeur de xi; lorsque la valeur de xi > P*, le systme a dtect que xi > P*, ce qui ne garantit videmment pas que xi soit effectivement suprieur P*. Il rencontre ainsi un problme rcurrent en ingnirie, celui de dtection du signal : distinguer les contextes o un signal comme xi > P* est un vrai positif (xi est rellement suprieur P* ) et lorsque que ce signal est en fait un faux positif (xi est en fait gal ou infrieur P* mais dtect comme tant suprieur); il doit de plus distinguer si une absence de signal est un vrai ngatif (il ny a que du bruit)) ou un faux ngatif (il y a un signal mais
114
celui-ci nest pas dtect). Le problme peut tre reprsent comme une matrice de dcision, o une rponse positive ou ngative est apparie un stimuli. Les vrais positifs et vrais ngatifs correspondent au fonctionnement optimal du systme.
Rponse Positive : xi > P* xi < P* stimuli xi > P* Vrai positif (vp) Faux ngatif (fp) Faux positif (fp) Ngative : xi < P* Vrai ngatif (vn)
On peut reprsenter la distribution probabiliste des rponses positives en prsence de bruit et celles des rponses positives en prsence de signal et de bruit comme deux courbes gaussiennes, la courbe des signaux bruits tant plus prs 0 que de 1 (on suppose que le systme a moins tendance produire une rponse positive lorsque le signal est un bruit). Selon la thorie de la dtection du signal141, ces deux courbes se recouvrent toujours en partie, aussi y a-t-il toujours une probabilit non nulle quune rponse positive survienne lorsquil y a un bruit.
Figure 3-3 Distributions probabilistes
Le systme doit donc avoir un critre de dcision et statuer partir de quel seuil il dtectera une rponse positive. Un critre libral comme C1 activera une rponse positive au moindre stimuli, augmentant la probabilit de faux positifs, alors quun critre conservateur comme C2 augmentera la probabilit de faux ngatifs. Un systme de contrle robuste, dont le critre serait fixe, serait insensible la variabilit du cot de lerreur. Or selon lenvironnement, un faux positif peut tre plus coteux quun faux ngatif : dans lidentification
Cf. (Wickens, 2002) pour une introduction; (Godfrey-Smith, 1996; Proust, 2006) pour des applications philosophique.
141
115
du danger, un faux ngatif est plus coteux (mieux vaut tre sauf que dsol), alors que dans la recherche de ressources nergtiques, un faux positif peut tre plus coteux (mieux vaut tre repu que spuiser rechercher) (Proust, 2006). Contrle et adaptation Un paramtre de contrle robuste peut savrer efficace dans un environnement transparent, mais si la configuration de lenvironnement change, le systme risque alors dtre dirig vers un attracteur qui ne le lui est pas avantageux. Or un des traits typiques des agents rationnels est un certain degr de flexibilit : ils doivent pouvoir ragir de faon adaptative aux fluctuations de leur environnement plutt que de rpondre de faon strotype. Cest en partie par leur flexibilit quils se distinguent des non rationnels. Descartes, par exemple, refusait de considrer comme rationnel tout tre qui naurait pas assez de divers (..) pour [le] faire agir en toutes les occurrences de la vie de mme faon que notre raison nous fait agir 142. Un systme de contrle capable de modifier ses paramtres (de dtection ou autre) en fonction de son environnement implmente un contrle dit adaptatif. Un systme sadapte lorsque ses valeurs paramtriques font en sorte que lespace dtats du systme est dot dattracteurs avantageux pour lui143; le systme est alors dans son domaine de viabilit (cf (Aubin, 1991)), cest--dire un sous-ensemble de son espace dtats o les variables du systme sont confines certaines valeurs afin dassurer le bon fonctionnement du systme (le taux de glucose dans le sang pour un organisme vivant, la temprature dun moteur). Le contrle adaptatif suit une dynamique dajustement des paramtres : d/dt = (P*-P) [quation 3]
o d est la variation des paramtres, P* est la valeur de consigne, P la valeur mesure et le paramtre de ladaptivit du contrle (plus ou moins robuste). Si les variables sont restreintes lintrieur des valeurslimites, le systme ne doit rien changer144. Si les variables dpassent les valeurs-limites, alors il lui faut effectuer un changement de paramtres, ce qui pourrait entraner le systme dans un nouveau bassin dattraction.
142
(Descartes, [1637] 1991: Discours, Ve partie). cf (Ashby, 1952: chapitre 5; Kauffman, 1993: chapitre 5) . Ce que Aubin appelle le principe dinertie (Aubin, 1991)).
143
144
116
Contrle adaptatif et apprentissage Une ACR, pour voluer dans un environnement translucide doit donc sadapter, en ajustant par exemple son critre de dtection du signal. Or pour ajuster ce critre de faon efficace, il lui faut de linformation : le cot des faux positifs et des faux ngatifs, par exemple, ou encore le degr de superposition des deux distributions de probabilits. Comme une ACR n'est pas un agent parfait et omniscient, elle doit explorer lenvironnement pour extraire de l'information fiable et exploiter cette information pour la survie. Ce qui entrane un dilemme courant en apprentissage automatis, en robotique ou en conomie, le dilemme ou compromis exploration/exploitation : on ne peut explorer (/exploiter) tout le temps, on ne peut arrter lexploration, mais on doit toujours la rduire. Ainsi un robot, qui est dans une location inconnue dun environnement inconnu doit la fois se situer dans cet environnement et se constuire une reprsentation spatiale de lenvironnement 145: il lui faut arbitrer entre lacquisition dinformation pour la construction de la carte (exploration) et lutilisation de cette information pour se situer (exploitation). Un agent conomique dans une conomie dchange fait face au mme problme : se renseigner sur chacune des commodits (explorer) vs acheter une commodit (explorer). Les systmes dans cette situation font face une incertitude, dite de second degr: dans une incertitude de premier degr, on connat les lois de probabilits dun vnement (par exemple la probabilit de faux positifs), et donc bien quil y ait incertitude, celle-ci nest pas totale, au sens o on possde quand mme une connaissance probabiliste, et donc de linformation; dans une incertitude de second degr, on ignore compltement les distributions de probabilits146. Comme lincertitude est totale, linformation est nulle, et il faut donc avoir recours de lacquisition dinformation. Dans une situation dincertitude de second degr, la solution rside dans lapprentissage, par lequel lagent passe dune incertidude de second degr un incertitude de premier degr. Ce problme peut tre ramen un problme gnrique, celui dit du bandit K bras . Soit une machine sous K bras, et un joueur ne possdant quun nombre limit N de pices de monnaies. Le joueur na accs aux taux de paiement et la
Problme connu sous le nom de localisation et cartographie simultane (simultaneous localisation and map building (SLAM)) cf (Feder et al., 1999) .
145
En conomie, depuis Knight (Knight, 1921), on distingue le risque de lincertitude en ce que dans les situations de dcisions sous risque, le dcideur peut assigner une valeur probabiliste aux actes possibles; dans la dcision sous incertitude de second degr on ne peut mme pas assigner une telle valeur. Aubin diffrencie les deux par stochastique et tychastique (Aubin, 1991).
146
117
variance des bras quen les estimant partir de ces essai. Le but nest pas seulement destimer quel bras est le plus payant, mais de maximiser le paiement tout en amassant de linformation par lessai de chaque bras. Le joueur peut tre victime de faux ngatifs (une squence peu payante dun bras payant) ou des faux positifs (une squence payante dun bras moins payant). Comment obtenir le meilleur rendement ? Il est propre ce type de problme de ne pas possder de solution optimale a priori : le paiement chaque coup compte dans lvaluation finale de la performance, de sorte que le meilleur coup t dpend du chemin parcouru avant t. Le joueur doit essayer chaque bras, tout en arbitrant lexploration et lexploitation et en cherchant maximiser son revenu. Pour solutionner ce problme, lorsque K=2, lallocation optimale de coups au meilleur bras observ doit tre une fonction exponentielle du nombre de coups allou au bras le moins payant (Holland, 1992: 5.1,10.2). Pour une solution gnrale au problme, peu importe le nombre de bras, la solution optimale est la mme : augmenter le poids des options qui se seront rvles les plus utiles (augmenter la probabilit de choisir ces options) lors de l'exploration et exploiter ces options en proportion de leur poids (ou indice de Gittins, (Gittins, 1989)). Rgle gnrale, les solutions seront plutt satisfaisantes , au sens de Simon, que rellement optimales : ds quon introduit un cot, pour passer dun bras lautre, Banks et Sundaram ont dmontr que lapprentissage par renforcement ne pouvait converger vers une solution optimale (Banks & Sundaram, 1994). Il y a donc possibilit davoir une solution correcte au problme, sans pour autant affirmer quelle sera parfaite. La rsolution par indices valuatifs de la performance appartient une classe de processus dapprentissage dit par rcompense ou par renforcement . La terminologie nest pas heureuse, car elle porte avec elle une connotation des grands jours du behaviorisme et de lassociationisme classique : lide selon laquelle les ides complexes sont construites partir de sensations lmentaires (J. R. Anderson & Bower, 1980: 10), et le contrle du comportement nest effectu quen fonction des renforcements passs. Selon ce modle, que Dennett a appel le modle ABC (Associationiste, Behavioriste, Connexioniste, (Dennett, 1993)), les organismes skinneriens , limits dans leur adaptation ne pouvoir que coordonner leur rponses aux stimulis, souffriraient dune incapacit fondamentale prdire. Dennett distinguent ces organismes des popperiens (Dennett, 1995: 374-376), capables de procder par essai-et-erreur mental : plutt que de performer un comportement pour, aprs coup, constater son effet, ces derniers anticipent ou imaginent les comportements avant la performance afin de slectionner ceux qui seront produits. Or ces organismes dlibratifs ne sont pas sans rappeler lhomo oeconomicus, qui value la probabilit et lutilit de chaque action, et les lacunes de cette image intellectualiste de la dcision posent moults problmes (dont il a t question plus haut), sans compter quelle postule
118
une forme de dualisme entre des organismes uniquement ractifs et dautres qui ont la capacit de pr-slectionner leurs actions. Or si les organismes ractifs figurent dans les thories de Pavlov, Watson ou Skinner, lapprentissage par renforcement tel quon le connat aujourdhui est beaucoup plus sophistiqu que les modles habituels147. Lapprentissage par renforcement contemporain ne se dfinit pas par la caractrisation de ces mthodes dapprentissage, mais par les problmes dapprentissage tudis. Le problme est celui dun agent qui doit atteindre un ou des buts en acqurant de linformation sur un environnement incertain (Sutton & Barto, 1998: 4). Formellement, il sagit de loptimsation du contrle dun processus de dcision markovien : chaque instant lagent doit apparier un tat de son environnement avec une action en fonction dune matrice de probabilit de transition. Ltat peru peut tre une information de bas niveau (une configuration dexcitation de ses capteurs) ou de plus haut niveau (une carte de son environnement). De la sorte, ce type dapprentissage nest pas confondre avec lapprentissage classique par renforcement, bien quil partage le caractre valuatif de la rtroaction. Lorsque lagent choisit une action, il ne fait pas que ragir son environnement, mais opte pour loption dont la rcompense prdite est la plus leve. Or si la rcompense est traditionnellement une notion comportementale, la prdiction est une notion computationnelle (Quartz, 2003: 196). Aussi le terme rcompense semble fondamentalement inadquat. Nous parlerons plutt de rtroaction valuative148. (Selon la terminologie utilise plus haut, la rtroaction valuative est une procdure pour optimiser une fonction dutilit). Les organismes dots de capacits prdictives minimales ne sont ni skinneriens ni popperiens , mais reprsentent un intermdiaire entre les deux, qui guident leur dcision laide de rtroactions valuatives, qui nest pas ncessairement le produit dun raisonnement ou dun processus mental de haut niveau.
La deuxime condition pour tre une ACR est donc :
147 (Kaelbling et al., 1996; Sutton & Barto, 1981, 1998)
Dans lapprentisage par rcompense, la rtroaction est essentiellement valuative : elle signale la qualit de laction, mais ne spcifie pas si cette action est la meilleure ou la pire possible. Dans dautres formes dapprentissage supervis ou hebbien par exemple une rtroaction purement instructive informe le systme de laction poser indpendement de laction courante. Les deux se compltent, mais un apprentissage par renforcement fait plutt appel la premire.
148
119
C2: Une ACR est un systme de contrle adaptatif, capable de modifier ses paramtres par lapprentissage. 3.3.4 CONTRLE ET DYNAMIQUE DE POPULATION Lapprentissage base de rtroaction valuative, russissent rsoudre le problme de la slection de laction dans un environnement informationnellement translucide. Or si, dans cet environnement, le contrleur dispose dune capacit globale dapprentissage, un algorithme gnraliste, son contrle ne sera pas mme dtre efficace. Voyons comment. Un premier problme que pose ces environnements est la spcificit au domaine. En effet, dans toute lhistoire de vie de lACR, on peut parier coup sr quelle aura plusieurs dcisions prendre et plusieurs types de problmes rsoudre. Son existence risque plutt de ressembler une panoplie de versions du bandit k-bras : la valeur de k peut changer, le paiement survient longtemps aprs lessai, lacquisition dinformation est complexe149, certains aspects de lenvironnement fluctuent plus que dautres, etc. Lapprentissage dune rgle peut navoir quun domaine limit dapplication. De la sorte, un algorithme doptimisation sera plus efficace sil est spcialis que sil est gnraliste, ce que dmontre une srie de thormes en ingnirie de loptimisation nomms No free lunchs (NFL)150 (D. H. Wolpert & Macready, 1997). Selon le thorme NFL, pour lensemble des espaces de problmes, aucun algorithme ne performera mieux quun autre lorsquon calcule la moyenne des performances pour tous ces espaces. Autrement dit, pour nimporte quel algorithme A et B, par exemple un algorithme alatoire et un algorithme de monte de gradient, qui seraient tests sur lensemble des domaines dapplications possibles et pour lesquels on disposerait dune fonction dvaluation de la performance, lorsquon ferait la moyenne des performances de A et celle de B, ces valeurs seraient identiques. Do lide quil ny a rien de gratuit : aucun algorithme ne pourrait tre plus efficace quun autre dans lensemble des problmes possibles, aussi une optimisation efficace doit tre taille sur mesure pour un domaine en particulier; inversement, sans un certain de degr de biais ou de spcialisation, un algorithme ne savrera pas efficace pour un domaine en particulier.
Problme connu en apprentissage automatis sous le nom de problme de lassignement du crdit : lorsquun stimuli a une valence positive, quelle action de lagent doit-on assigner le crdit ? celle quil performe maintenant, ou une autre prcdente ?
149
De lexpression There is no such thing as a free lunch (il ny pas de dner gratuit), popularise en conomie par Friedman : tout ce qui est gratuit implique un cot pour quelquun dautre.
150
120
Les thormes NFL salignent ainsi sur un consensus auquel la recherche sur lapprentissage automatis est arrive : si vous ne savez pas vraiment par o commencer, ne vous attendez pas apprendre beaucoup rapidement (Lenat & Feigenbaum, 1988: 295); ou encore, comme le dit Minsky: on ne peut apprendre quelque chose sur X si on nest pas dj en mesure de se reprsenter X dune quelconque manire (Minsky, 2000: 72). De la sorte, une ACR qui volue dans un environnement incertain ne peut tout apprendre partir de rien, et doit possder de linformation particulire pour chaque type de problme rencontr, ce quon peut rsumer par la formule biais et modules 151. Les roboticiens (Dorigo & Colombetti, 1998; Mataric, 1997) modularisent ainsi les systmes de contrle des robots autonomes, sparant le contrle du comportement en diffrents sous-systmes, chacun possdant un ensemble de connaissances implicites sur un domaine (la marche, la vision, les congnres etc.) ainsi que des biais dapprentissage qui renforceront seulement certains modules plutt que le contrleur au complet. Simon argumentait aussi leffet que les systmes complexes, des molcules aux organisation, sont gnralement quasi-dcomposables : pour les dcrire, on peut isoler des modules, cest--dire des sous-systmes dans lesquels linteraction est forte, et entre lesquels linteraction est plus faible. (H. A. Simon, [1960] 1996) Une ACR, en tant quelle nest pas omnisciente et omnipotente, doit donc avoir certains biais dapprentissage et des comptences modulaires avant dentreprendre dacqurir de linformation. Sa conception mme doit comporter ce type dinformation. Comme une ACR ne peut se construire entirement par elle-mme, elle doit tre construite par quelque chose dautre pour tre prpare ngocier avec son environnement. Or ce quelque chose dautre doit lui aussi tre construit, ce qui semble impliquer une rgression linfinie. On peut toutefois sortir de cette rgression linfinie et postuler quil est inhrent aux agents rationnels dtre issus dun processus doptimisation populationnel. En sinsipirant du processus darwinien de slection naturelle, les chercheurs en Vie Artificielle arrivent dvelopper des architectures de contrle adaptes un environnement en particulier laide dalgorithmes gntiques152. partir dune population dagents
Fodor (Fodor, 1983) et les psychologues volutionnistes postulent aussi que larchitecture volue du cerveau est spcifique au domaine et modulaire pour des raisons adaptatives (Barkow et al., 1992; Tooby & Cosmides, 2005).
151 152
Voir (Langton, 1995) et (Holland, 1992).
121
htrognes capable de se reproduire, un algorithme gntique slectionne ceux qui auront le mieux perform dans un environnement au cours de leur existence; chaque gnration, les systmes les plus performants se reproduisent entre eux, ce qui la longue gnre des architectures plus efficaces et plus adaptes leur environnement. On peut alors observer quelles architectures seront favorises. Nolfi par exemple, simula lvolution dune population darchitectures de contrle (Nolfi, 1997). Les diffrentes architectures taient des rseaux de neurones artificiels reliant des senseurs aux effecteurs dun robot miniature. Cinq types de rseaux furent utiliss : un rseau de neurones standard (feedforward) un rseau units caches un rseau architecture rcurrente un rseau architecture modulaire pr-spcifie un rseau architecture modulaire mergente : larchitecture, le nombre de modules disponibles et leurs interactions est pr-spcifi, alors que le choix du nombre de module, de leur combinaisons et de leur poids respectif est laiss au systme. la suite des simulations gntiques sur ordinateur, les rseaux de neurones sont chargs dans des robots autonomes mobiles. Les robots utiliss pour les simulations devaient prendre certains objets et les dposer hors dune zone dlimite, disposaient de modules de perception (relis des capteurs infra-rouge) et daction (relis une pince et des roues). Larchitecture modulaire mergente (A.M.E.) sest rvle comme tant de loin plus efficace que les autres architectures, modulaires ou non. Alors que 7 robots sur 10 russissent la tche avec succs dans le cas de lA.M.E., seulement 1 ou 2 ont russi dans les autres cas. Bien que sommaires, des expriences de ce type de mme que la ncessit dune configuration antrieure lapprentissage, suggrent le passage dune conception typologique une conception populationnelle, linstar de celle que Mayr (Mayr, 1959) constatait avec larrive du darwinisme en biologie. Plutt que de considrer quun agent rationnel est un individu dfini par sa ressemblance avec un type idalis, il faudrait plutt le considrer comme le produit dune optimisation stochastique et combinatoire lchelle dune population. Des patrons de comportements se multiplient dans une population et sont slectionns par reproduction ou par les agents. La perspective populationnelle nest pas ncesserairement oppose aux thories classiques de la rationalit du moins en thorie de jeux. Nash, dans sa dmonstration de lexistence dun quilibre dans tous jeu fini non-
122
coopratif, avait soulign que son thorme pouvait tre compatible avec deux interprtations : lune rationaliste , savoir des joueurs pleinement rationnels et informs, et lautre, dite d'action de masse , o les stratgies sont distribues dans une population statistique:
dans cette interprtation, les solutions n'ont pas de grandes significations. Il n'est pas ncessaire que les participants aient une connaissance complte de la structure totale du jeu, ou la capacit et l'inclination avoir recours un processus complexe de raisonnement. Les participants sont toutefois supposs accumuler de l'information empirique sur les avantages relatifs des diverses stratgies pures leur disposition" (...) on ne peut s'attendre, bien sr, qu' des quilibres approximatifs, tant donn que l'information, son utilisation et la stabilit des frquences moyennes seront imparfaites (Nash, 1950: 22-23)
Ce que la thorie des jeux volutionniste (Maynard Smith, 1982) a mis en application. Lavantage de la seconde interprtation est de ne pas souffrir des problmes de tractabilit qui affectent la premire : les agents imparfaits doivent acqurir de linformation sur leur environnement afin de slectionner des stratgies plutt que de les dduire a priori. Nous proposons de faire de cette dynamique de population lune des conditions de possibilit des ACR. Une ACR ne pouvant se construire elle-mme, elle doit tre construite par quelque chose dautre, et la meilleure thorie que nous avons ce sujet est une dynamique de population : si certains biais et modules font partie de la conception dune ACR, sa prsence est incomprhensible sans un processus doptimisation. Dune part, les architectures de contrle de type tabula rasa nont jamais pu produire de robots autonomes, et dautre part des architectures entirement conues selon la perspective dun concepteur se sont rvles moins adaptives et limites certains environnement pr-spcifs (Brooks, 1991b). Dans les jeux dits volutionnistes, o les joueurs interagissent plusieurs reprises entre eux et o un algorithme slectionne les stratgies efficaces, il faut sattendre trouver dans une population une distribution de stratgies sans quelles soient toutes optimales. En revanche, lvolution dagents moins rationnels permet lmergence de phnomnes comme la coopration, sous certaines conditions seulement . Les simulations dAxelrod et Hamilton (Axelrod & Hamilton, 1981) on montr que, dans une population diposant dun ensemble htrogne de stratgies qui joue un dilemme du prisonnier rpt et qu chaque gnration les stratgies les plus efficaces se reproduisent, aprs quelques gnrations on observe une stratgie cooprative. La stratgie DONNANT-DONNANT (Tit-for-tat) ou loi du talion , qui consiste cooprer doffice puis, aligner son comportement sur celui de lautre joueur (cooprer avec les cooprateurs, dnoncer avec les dnonciateurs) envahit rapidement la population. En
123
revanche, si de nouvelles stratgies peuvent se dvelopper une stratgie plus efficace envahit la population, dite PAVLOV : je-gagne-je-continue/jeperd-je-change-de-stratgie. Elle consiste rpter l'action qui, lors de la dernire rencontre, s'est avre la plus utile ou sinon changer de tactique. La stratgie est capable de corriger ses erreurs mais aussi d'exploiter les cooprateurs inconditionnels. PAVLOV vite ainsi, dans une population, que des cooprateurs inconditionnels puissent envahissent la population, ce qui aurait laiss la porte ouverte des tricheurs qui les exploiteraient. De la sorte, elle sest rvle tre plus robuste que la stragie DONNANT-DONNANT (M. Nowak & Sigmund, 1993). Encore l, mme P AVLOV peut se faire envahir par dautres stratgies : on sait, daprs les thormes de tous le monde (Folk Theorems)153 quil peut y avoir une multitude dquilibres accessibles aux joueurs en interaction continue, mais ce seront des quilibres temporaires. En effet, dans un dilemme du prisonnier rpt indfiniment, aucune stratgie nest volutionnairement stable154 (Lorberbaum, 1994) : aucune nest labris dun mutant qui viendrait envahir les stratgies lquilibre. De la sorte, pour comprendre ltat actuel dune population, il faut comprendre son volution particulire : si une certaine stratgie est lquilibre, ce peut tre un effet de la dpendance du chemin plutt quune tendance necessaire atteindre des tats optimaux. Prenons le jeu de lUltimatum.155 Dans une perspective populationnelle, pour un butin de 5 units, on peut imaginer une distribution gale de diffrentes stratgies <12.5, 12.5, 12.5, 12.5, 12.5, 12.5, 12.5, 12.5>( Figure 3-5). GAMESMAN suit les prescriptions de la thorie des jeux (offrir 1 sil est le premier joueur, tout accepter sil est second), MAD DOG offre le minimum et naccepte que le minimum, F A I R M A N offre 5 et naccepte que 5, etc. Dans cette population, si chaque stratgie est galement reprsente dans la population initale, la dynamique de rplication fait en sorte que la population value vers un tat o GAMESMAN domine (87%), bien quune stratgie comme MAD DOG survit dans 13 % des cas (Skyrms, 1996: chapitre 2):
Des thormes dmontrs paralllement par plusieurs chercheurs dans la communaut de la thorie des jeux.
153
X est une stratgie volutionnairement stable si et seulement si (1) l'utilit de X contre X est plus leve ou quivalente toute autre stratgie Y que celle de toute autre Y contre X, et (2) si l'utilit de X contre X est quivalent celle de Y contre X, alors l'utilit de X contre Y sera plus leve que celle de Y contre Y.
154
Rappelons les rgles (voir chapitre 2) : A doit proposer B une fraction f >0, son choix, dun montant m dargent B. Si B accepte, B reoit f, et A empoche m-f. Si B refuse, A et B n'ont rien. La thorie des jeux prdit que A devrait proposer la plus petite fraction possible, et B accepter nimporte quel montant.
155
124
Figure 3-4 Distribution gale de stratgies
Si en revanche, la population initiale connat une autre distribution de stratgies <32, 2, 10, 2, 10, 2, 40, 2> (figure 3-6), la dynamique de rplication volue vers une distribution o FAIRMAN reprsente 56,5% de la population et EASY RIDER (offre le maximum et accepte tout) 43,5. G AMESMAN qui reprsentait pourtant 32% de la population initale a t limin, alors que EASY RIDER qui ne composait quun dixime de la population compose maintenant prs de la demie. Donc dans cette population en particulier, comme dans toute espce historique, lexplication des proprits de surfaces fait appel la trajectoire particulire et aux mcanismes des agents.
Figure 3-5 Distribution variable de stratgies
Aussi, conclut (Skyrms, 2000: 273), une dynamique de rplication ne garantit pas llimination des stratgies faiblement domines (stratgiement irrationnelles) ni llimination de celles qui ne satisfont pas
125
les canons de la rationalit paramtrique (paramtriquement irrationnelles). Des dynamiques de populations comme la thorie des jeux volutionnistes diposent dune certaine souplesse dans leur interprtation, en ce quelles peuvent traiter de lhtrognit des individus comme celle des comportements156. La diversit des stratgies peut tre le fait de diffrents individus qui, consquemment diffrentes trajectoires dveloppementales ou dapprentissage, disposent chacun dune stratgie diffrente; ou encore elles peuvent tre considres comme lensemble des stratgies quun agent utilise selon une certaine probabilit : jouer FAIRMAN dans 20% des cas, MAD DOG dans 40% des cas, etc. Finalement, la thorie peut aussi sappliquer aux jeux contre la nature : plutt que de reprsenter lenvironnement comme tant connu de lagent, on peut faire de celui-ci un joueur dont les stratgies consistent faire advenir certaines situations selon des lois de probabilit inconnues des vrais joueurs. Lincertitude radicale est alors enchsse dans la thorie de la rationalit. Si une dynamique de population sociale ou gntique - explique en partie pourquoi les agents ne sont pas pleinement rationnels, elle explique aussi les paradoxes descriptifs dont il a t question plus haut: comment se fait-il que des agents supposment irrationnels, qui dvient systmatiquement des canons de la thorie de la dcision russissent atteindre des quilibres optimaux de marchs qui sont pourtant dduits du postulat de rationalit parfaite ? Pour comprendre cela, il nous faut, ajoute lauteur de ces expriences une aide non biaise par des batailles avec des hommes de pailles (V. L. Smith, 1991c: 894). Encore ici, des simulations informatiques de dynamiques populationnelles pointent vers une solution. Des simulations de marchs lectroniques o des changeurs sont des programmes qui implmentent des rgles extrmement simples comme ne pas faire doffre qui entrane une perte immdiate, sinon offrir montrent que ces marchs sont aussi efficaces, en termes dallocation des ressources, que lorsque des humains remplacent ces zero-intelligence traders 157. Les explications rationnelles fonctionnement mieux lorsque lenvironnement est comptif ou contraignant, ce qui explique pourquoi les thories des partis politiques et des firmes sont plus prdictives que la thorie du vote et du consommateurs (Satz & Ferejohn, 1994).
156
Voir (Bergstrom & Godfrey-Smith, 1998) pour une tude approfondie de ces questions. (Farmer et al., 2005; Gode & Sunder, 1993)
157
126
Ce nest donc pas tant lintelligence des agents individuels qui permet latteinte de loptimum global, mais le jeu complexe de lvolution, de lapprentissage et de linteraction sociale mdie par des institutions (Clark, 1997: ch.9). La courbe descendante de la demande et la courbe ascendante de loffre, dans les marchs, est pleinement compatible avec des comportement irrationnels comme lavait soulign il y a longtemps Becker (1962: 8). Nous proposons ainsi une troisime proprit des ACR : C3: Une ACR situe dans une dynamique de population On pourrait proposer plusieurs objections quant la pertinence de la thorie de loptimisation en psychologie, en conomie et en biologie; si en effet, la rationalit est limite, comment parler encore doptimisation ? La question de loptimisation en biologie sera traite au chapitre 5; la compatibilit de loptimisation et de la rationalit limite en pyschologie en conomie sera dfendue dans la prochaine section. 3.3.5 RATIONALIT LIMITE ET OPTIMISATION : CONFLIT ?
L'optimisation concerne les contraintes et les compromis, non la "perfection" Seger et Strubblefied, in (Rose & Lauder, 1996: 94)
Prcisons tout dabord que optimiser une fonction est une proprit comme postuler un emploi : le simple fait de raliser la proprit nimplique pas que les conditions de succs du prdicat qui la dcrit sont de facto satisfaite. Donc loptimisation nest pas loptimalit; un systme de contrle optimisateur implmente des procdures qui tendent tre plus satisfaisante quune procdure alatoire et qui font en sorte que le systme est dirig vers des attracteurs qui le conservent dans son domaine de viabilit. Les thories de la rationalit limite prtendent se librer du dogme de loptimisation; le prdicat quon pourrait nommer Lrationnel (tre rationnel de faon limite) naurait aucune dimension optimisatrice. Ainsi Todd et Gigerenzer affirment que la rationalit limite nest pas de loptimisation limite ni de lirrationalit , mais plutt une thorie des procdures que lesprit utilise pour prendre avantage de la structure dinformation de lenvironnement afin den arriver des dcisions raisonnables (Todd & Gigerenzer, 2000: 739) . Selten affirme que la dcision L-rationnelle implique ncessairement des procdures non optimisantes , car les procdures tudies sont automatises et ne proviennent pas de la dlibration consciente (Selten, 2001: 16). Ainsi, traiter la rationalit limite comme une forme doptimisation sous contraintes verserait dans le parodoxe selon lequel des agents cognitivement limits seraient capables dvaluer les cots de traitement
127
dinformation que requiert la prise de dcision. Comme le dit Selten (ibid., 16), cela quivaudrait concevoir un ordinateur qui pourrait tre utilis pour dterminer sa propre conception; l'activit d'optimisation, dit-il, ne peut optimiser sa propre procdure . Il y a pourtant l une confusion dans la signification de la rationalit limite. On peut dfinir 3 faons158 dtre L-rationnel: Par conception : le systme est dj construit pour pour trouver une solution optimale tant donn des ressources limites. Par adaptation: l'agent est quip d'un mcanisme qui ajuste son comportement en rponse aux ressources disponibles pour optimiser la qualit de ses dcisions. Par dlibration : l'agent raisonne explicitement sur les limites de ses ressources afin de trouver une solution optimale. Les critiques de la rationalit limite comme optimisation sous contraintes atteignent donc uniquement la troisime faon dtre Lrationnel : un agent qui dlibre quant aux cots de lvaluation de ses actions possibles, qui dlibre aussi sur du cot de cette dlibration, etc, est une sorte homo oeconomicus pris dans une rgression linfini. Les 2 premiers types de rationalit limite, elles, ne supposent pas que lagent value les cots, mais que des dispositions et mcanismes limitent lexploration de solutions possibles sans lintervention dactivits de haut niveau. Pour rpondre au prtendu paradoxe, on peut trs bien supposer que le prototype de lordinateur (dans lexemple de Selten) a t raffin au cours de lvolution du march des technologies et quil est maintenant construit pour tre optimal sous certaines contraintes; ou encore, quil est assez complexe pour tre sensible son environnement et ajuster son traitement de linformation en vertu des ressources externes, et disposer de critres de rapidit dans la gnration et la slection de dcision. Ainsi, on peut tre L-rationnel et optimisateur lorsquun flot dinformation entre lagent et lenvironnement de mme que les capacits de lagent le rendent capable de sajuster dynamiquement aux conditions de la dcision. Si le temps presse, lagent valorise les solutions rapides; si linformation est incomplte, lagent trouve une solution adquate et la rvise si de linformation supplmentaire sajoute; si lagent a dj
158
Nous nous inspirons ici de (S. Russell & Wefald, 1991).
128
expriment une solution semblable, il utilise une solution semblable, etc. Cette optimisation adaptative est donc bel et bien de loptimisation car elle modlise un agent en recherche de meilleures solutions (ce qui nimplique par que la solution soit parfaite) selon ses capacits. Lapprentissage est une composante essentielle de cette forme de rationalit. De la sorte, il ny a rien de contraire lesprit de loptimisation que de se fixer une rgle comme: acheter la premire voiture rouge dcapotable de moins de X euros trouve en moins dune semaine dans un concessionnaire local . De mme, lorsque Gigerenzer et ses collgues vantent les mrites de leurs heuristiques aprs les avoir simules informatiquement, compare avec dautres heuristiques et montr quelles performent mieux en contexte cologique, il y a bien l un critre doptimalit. Les travaux rcents de (Kahneman, 1994) sur les types dutilit (lutilit hdonique, lutilit des thories standards, lutilit remmore, etc.) sont une confirmation quune optimisation multiobjectifs est une voie prometteuse pour des descriptions plus ralistes. Au final, la rationalit limite est un plaidoyer pour le passage dun consquentialisme159 des actes (choisir des actes en fonction de lutilit totale des consquences des actes) un consquentialisme des rgles (choisir des actes en fonction de lutilit totale des consquences des rgles : rapidit, complexit, etc.). 3.3.6 LE CONTRLE BASE DE SIMULATIONS Un autre pr-requis de la rationalit minimale est laction, au sens plus strict que les philosophes lui ont donn. Une action se distingue dun comportement tout court160 en ce que dans la premire, contrairement au second, on peut isoler certaines causes dites mentales. Le mentalisme ici ne renvoie pas uniquement la conscience, mais plus gnralement la reprsentation161. On distingue habituellement la reprsentation de
Selon la conception consquentialiste, laction rationnelle est le produit dun agent qui slectionne une action en fonction de ses consquences anticipes. Le consquentialisme admet lexistence de valeurs qui ne soient pas morales ou dfinies par des considrations morales (Darwall, 2003: introduction); une action est justifie par ses consquences, lesquelles sont values selon le rapport cots-bnfices, et la rationalit pratique de lagent tient sa capacit raisonner sur les moyens en fonctions des fins. Lagent rationnel cherche donc, pour une action, choisir celle qui maximise son bien et minimise son mal.
159
Un comportement est un ensemble de mouvements et de ractions psychomotrices observables qui ont un effet causal sur lenvironnement (Benoit & Robert, 2003).
160
Voir lintroduction et les premiers chapitre de (Proust, 1997). Comme Proust le souligne, beaucoup de philosophe ont confondu avoir une perspective sur le monde et tre conscient . Une reprsentation, en ce quelle a un sens et une rfrence, fournit son possesseur une perspective sans quelle soit ncessairement consciente.
161
129
lindication (ou dtection)162. Les deux appartiennent une classe de processus informationnels sensibles des cibles , des entits ou activits sur lesquels elles peuvent donner de linformation au systme dot dindicateurs ou de reprsentations. Les indicateurs informent de la prsence de leur cible alors que les reprsentations ninforment pas de la prsence moins dtre couple avec des indicateurs mais de la structure de celle-ci (Cummins & Poirier, 2004: 24). Ainsi un dtecteur de mtal indique quune certaine quantit de mtal est dans son champ de sensibilit mais ninforme pas le systme auquel il est rattach de la structure du mtal. Une reprsentation , elle, doit reflter en plus la structure de lentit mtallique, comme une image aux rayons X qui renvoie la silhouette dun objet mtallique. On peut dfinir la reprsentationcognitive , propre un agent, comme tant un tat interne de lagent qui lui permet dagir en linformant sur la structure dentits ou dactivits situe dans, ou lextrieur , lagent. Une reprsentation est dote dun contenu smantique qui peut avoir un rle causal efficace dans laction de lagent. Le contenu smantique, le mode de prsentation dune chose, intervient lorsque lagent peut utiliser linformation propos de cette chose pour une infrence ou une action. Si un agent a des reprsentations 1) leffet que x est F, 2) leffet que si x est F, alors il peut performer laction A. Sil est motiv pour obtenir A et sil performe effectivement A, sa performance sexplique la fois par le fait que Fx, mais aussi par sa prise en considration de Fx : sil est le cas que Fx, mais que lagent a une reprsentation de x comme tant G, et que lagent croit que Gx implique que A ne soit pas possible, alors le mode de prsentation (F ou G) fait partie des constituants causaux de son action. Aussi, en plus dtre cause par des reprsentations, laction dun systme minimalement rationnel doit-elle en plus, ajoute Dretske (2006) expliquer laction. En effet, cest une chose, pour une action, que dtre cause par un vnement qui a un certain contenu, et dtre explique par le fait que cet vnement a un certain contenu. Le problme avec la formulation de Dretske est quelle impose un critre relationnel : la proprit dtre explique ou expliquable suppose quun autre agent puisse, en thorie ou en pratique, construire un argument dont les prmisses sont les reprsentations causalement efficaces et la conclusion, laction. En bout de ligne, il sagit dun critre interprtiviste. Or un modle causal et mcanique ne devrait pas faire intervenir des proprits relationnelles telles que tre expliquables par un autre agent . Pour cette raison et plusieurs autres (exposes au chapitre suivant), nous explorerons une autre voie.
162
(Dretske, 1981, 1995; Proust, 2003; Sterelny, 2001), par exemple.
130
Les attitudes propositionnelles La thorie causale de laction163 postule habituellement que ces reprsentations, qui sont la fois des causes et des raisons, sont des attitudes propositionnelles (AP). Une AP est relation intentionnelle entre un agent et une proposition. Elle est compose dune certaine disposition pistmique de lagent lgard dune proposition et la proposition en question. Ces dispositions tombent sous deux catgories : des dispositions tenir une proposition (ou un nonc) pour vrai (dans le cas des croyances) et tenir pour souhaitable la vrit de la proposition ou nonc (dans le cas des dsirs). Ces reprsentations doxastiques et volitives articulent donc un agent Ai, un prdicat (croire que, dsirer que, souhaiter que, esprer que, etc.) et un contenu propositionnel Fx. La forme gnrale des AP est donc : (A iFx). Ces reprsentations tombent sous deux types : des reprsentations doxastique (croyances) et des reprsentations volitives (dsirs), quon distingue classiquement par leur direction dajustement : du monde vers la cognition pour les croyances, et de la cognition vers le monde pour les dsirs. Une des particularits des AP est de ne pas passer le test de linstersubstituabilit salva veritatae : supposer a=b, et que ( A iFa) il ne sensuit pas ncessairement ( A iFb) est vrai. On peut entretenir la croyance que Paris est une belle ville sans entretenir celle leffet que Paris est la capitale de la France (si on ne le sait pas) mme si Paris est la capitale de la France. Ainsi, Fa et Fb peuvent avoir la mme rfrence (Paris) mais une signification diffrente et des agents peuvent avoir des penses extensionellement identiques mais intensionellement diffrentes. Les attitudes propositionnelles sont smantiquement valuables, mais leur intensionalit rend leurs conditions de vrit difficiles spcifier; on ne peut faire appel lextension. Lintensionalit des attributions dattitudes propositionnelles est la marque linguistique de lintentionalit des tats mentaux164. Les AP, dans la thorie causale standard, ont un rle important dans les actions paramtriquement, stratgiquement et socialement rationnelles. Au niveau paramtrique, elles sont tenues pour les causes de
La thorie causale de l'action est sans doute un des modles de rationalit pratique les plus courant. Voir (D. Davidson, 1993a, 1993b; Goldman, 1970; Searle, 1983) pour les classiques; une version rvise, depuis les annes 80 insiste plus sur le rle de lagent, la planification, les intentions, (comme catgorie mentale irrductible des complexes de croyances et dsirs) : (Bratman, 1987; Velleman, 1989, 2000).
163
Aussi plusieurs logiciens ont-ils dvelopp une logique intensionnelle des croyances partir de la logique modale, o les oprateurs modaux et sont interprts comme croire que et tre compatible avec les croyances .
164
131
laction; au niveau stratgique, elle interviennent dans lattribution de rationalit un autre agent (A croit que B dsire x) : elles rfrent dautres AP. Finalement, au niveau social, elles interviennent dans la lchange : les croyances socialement partages sont des conditions des changes linguistiques et conomiques. Distinguons les attitudes propositionnelles des croyances et dsirs, les deux expressions ntant pas parfaitement synonymes. En effet, les croyances et les dsirs sont des concepts psychologiques trs gnraux, quon peut rsumer par leur direction dajustement (voir plus haut). Dire que les croyances et les dsirs sont des AP est une thse philosophique en soi plus quune dfinition. Ce propositionalisme est depuis Russell ce quon pourrait appeler un des dogmes du rationalisme (B. Russell, [1918] 1985: 92). Non pas quil soit impos par la force, mais lassimilation des croyances et les dsirs aux AP est quelque chose qui nest jamais remis en question. Le corrolaire du propositionalisme est quun agent na de croyances et de dsirs que sil peut entretenir une relation avec une proposition (ou un nonc), ce qui implique que le langage est une condition ncessaire la rationalit. Sil est indniable que les AP soient des croyances et des dsirs, il est moins certains que les AP constituent lensemble des reprsentations causalement efficaces qui guident laction rationnelle. En effet, dautres types de reprsentations utilises en ingnirie du contrle et en robotique ont des directions dajustement et des rles causaux bien quil ne puisse tre qualifi dAP. Proposition vs simulations Newell (Newell, 1990) identifie deux classes gnriques de reprsentations : les propositions et les modles (pour viter une confusion avec les modles scientifiques , nous parlerons de modles cognitifs). La proposition est un mode de prsentation de linformation extrmement riche en expression (les mathmatiques et la logique peuvent tre exprimes par ce mode) et en tendue : le symbole VHICULE(x) rfre lensemble des vhicules et rassemble en une seule catgorie des objets aussi divers que les bateaux, les navettes spatiales et les ascenseurs. Les reprsentations propositionnelles sont formes par un assemblage de symboles discrets et arbitraires (qui nont pas de similarit avec leur rfrent) selon des rgles de composition. Elles impliquent des quantificateurs et des connecteurs logiques afin de driver une reprsentation dune autre reprsentation, de mme que des contraintes de gnralit (Evans, 1982) . Les composantes des reprsentations propositionnelles doivent pouvoir tre gnrativement recombines pour dautres usages. De la sorte, un agent se reprsentant F(a ) doit tre capable de, o tre dispos , gnrer lensemble des propositions o F(x) et a figurent : [F(a ), F(b ), F(c)], [G(a ), G(b ), G(c)]. Finalement, les
132
reprsentations propositionnelles rfrent en vertu de leur conditions de vrit : la rfrence est ce qui rend vrai la proposition. Les modles cognitifs, eux, sont des reprsentations simplifies dentits externes au contrleur. Pour se construire un modle dune entit E, le contrleur doit avoir de linformation sur les variables de E mesurables, les valeurs de ces variables, l'volution de ces variables et la structure de E (Zeigler et al., 2000). Un systme 1 modlise lvolution dun systme 2 lorsque certaines variables et relations du systme 1 sont couples avec certaines variables et relations du systme 2; ainsi le modle traque lvolution du systme 2. Le modle rfre E selon un principe de correspondance structurelle: chaque partie du modle correspond un aspect de E (pourvu que le modle soit adquat). Ainsi, un robot peut, lors de lexploration de son environnement, synthtiser une reprsentation spatiale de la gomtrie et la topologie de lenvironnement, puis, lorsquil doit choisir un trajet, consulter la carte reconstruite (L. A. Stein, 1994): si un obstacle se prsente dans le trajet anticip, le robot reconfigure sa trajectoire. Inversement, dans une proposition comme !(!x !)! !{!(!F!(x )! ! !G(!x !)) H!(x ! !)!}! les symboles , , , ne rfrent pas des proprits ou des entits. Les modles selon Newell se distinguent des propositions par leur tendue et par leur traitement moins coteux de linformation (Newell, 1990: 390). En effet, un modle reprsente plus difficilement des concepts abstraits comme la ngation, la disjonction ou des conditionnels et ne prsentent que certaines dimensions de lentit reprsente, alors que le pouvoir expressif des propositions est virtuellement illimit. La reprsentation par modles ne suppose ni une infinit de recombinaisons ni une contrainte de gnralit : un modle est une reprsentation synthtique construite partir du flot dinformations des capteurs, des biais dapprentissage et de linformation contenu dans les modules. Lorsquun modle de E est construit, il peut ensuite tre simul : les variables du modle sont apparies une variable temporelle et, selon linformation disponible, le modle peut calculer un tat futur de E. Malgr leur manque dexhaustivit, les architectures de contrle base de modles dmontrent une grande efficacit dans le contrle en temps rel, et ce en ingnirie industrielle et en robotique. Ces architectures se sont rvles particulirement efficaces en vertu de leur capacit anticiper les perturbations et recalibrer lvolution du systme en temps rel. Les architectures de contrles behavioristes , purement ractives, se sont rvles moins performantes pour des contextes nonlinaires. Le contrle par commande PID (Proportionnelle, Intgrale, Drive), qui rgulent des systmes automatiss sans utiliser de modles du contrl, dinformation initiale ou de spcificit au domaine, se rvle
133
trs sensibles aux perturbations ou aux changements de paramtres et limit des contextes linaires (Henson, 1998). Des industries o lerreur est trs coteuse (militaires) ou celles o la marge derreur est trs limite (ptrochimiques165) ont besoin de systmes prcis, stables et capables de tolrer le bruit ou lincertitude, aussi ont-elle opt pour un contrle base de modles (Richalet et al., 2005: ch. 1), lequel demande de linformation initale et ne peut, comme le PID, oprer un contrle tout-usage. Plutt que de suivre un schma ractif (action effet), le contrle base de modles suit un schma prdictif ou projectif (effet dsir action appliquer). De mme, Brooks (Brooks, 1991b) et des roboticiens sa suite ont propos de concevoir des architectures de contrle robotique uniquement ractives, composes dun ensemble de modules comportementaux. Encore l, les agents articiels sont plus aptes naviguer leur environnement lorsquon ajoute une dynamique de modlisation interne modularise (Mataric, 2001)166. Le contrle base de modles savre un bon compromis entre un contrle purement ractif, qui ne ragit quune fois la perturbation dtecte, et un contrle base de connaissances propositionnelles. Les premiers nont pas de capacits prdictives, alors que les seconds doivent encoder linformation dans un format propositionnel, gnrer des infrences quant aux actions appropries puis recoder linformation pour implmenter le contrle. Ces dernires sont plus efficaces dans un contexte dterministe et limit. Contre le propositionalisme, nous proposons de considrer quune certaine classe darchitectures de contrle peuvent tre considres rationnelles. Si on distingue ces reprsentations principalement par leur direction dajustement, la thorie du contrle propose deux types de modles qui, conjointement, peuvent assurer un contrle rationnel : les modles inverses et les modles directs (forward). Dans une architecture de contrle base de modles inverses et directs167, la rgulation est supporte par deux types de simulation :
Le prix de vente du ptrole et de ses drivs tant trs bas, le cot de lextraction et du transport tant levs, lindustrie ptrochimique est soumise des contraintes de rendement trs fortes.
165
Voir aussi le thorme de (Conant & Ashby, 1970) : le meilleur rgulateur dun systme est un modle du rgulateur.
166
(Narendra & Balakrishnan, 1997) en ingnirie du control; (Yu et al., 2005) en contrle automatis; (M. Johnson & Demiris, 2005)et (Ganghua & Scassellati, 2004) en robotique; (P. R. Davidson & Wolpert, 2004; Kawato & Wolpert, 1998; Tin & Poon, 2005; D. M. Wolpert & Kawato, 1998; D. M. Wolpert et al., 1998) pour lapplication au comportement moteur humain (abord aussi au chapitre 5).
167
134
1. Inverse : partir des prfrences (la valeur de consigne) du systme et de ltat actuel du systme, le modle calcule une commande future optimale. 2. Directe : partir dune copie de la commande actuelle et de ltat du systme actuel, le modle calcule ltat futur du systme.
Figure 3-6 Contrle base de modles
De la sorte, un modle inverse a une direction dajustement qui va du contrleur vers le contrl, alors que le modle direct a une direction dajustement qui va du contrl vers le contrleur. La double direction de lajustement nest pas une reformulation de la psychologie intuitive, mais plutt un constat sur la nature du contrle situ : pour agir de faon flexible, il faut pouvoir manipuler des signaux dentre et des signaux de sortie; une capacit anticiper ces signaux selon un critre de probabilit ou dutilit (ou autre) constitue un raffinement du traitement lmentaire de linformation. Une ACR dispose alors dun guidage reprsentationnel du comportement. Modliser ses tats et ceux de lenvironnement permet de prdire lvolution de ces tats et dagir en fonction de ses prdictions. Le systme peut ainsi ajuster ses paramtres de faon ce que sa trajectoire volue vers des tats viables non pas uniquement en ragissant son environnement, mais en anticipant ltat futur de lenvironnement et en imposant ses prfrences dans lenvironnement. Il y a alors un sens dire que le systme commet une erreur : son modle direct reprsente incorrectement un tat futur ou encore la commande du modle inverse nest pas mme de faire en sorte que les prfrences du systmes soient satisfaites. Les modles inverses et directs font partie des causes de laction dun agent, mais aussi de ses raisons : si lagent effectue une action, cest
135
que ses modles directs et inverses linforment de la possibilit, lutilit, le risque ou dautres paramtres de laction. Cest ce qui fait de son action une action autonome et motive. Un agent minimalement rationnel se distingue donc dautres agents par le caractre valuatif de ses reprsentations : son environnement lui apparat comme travers des reprsentations que des philosophes appellent dpendantes la rponse (response-dependent)168. Une reprsentation dpend de la rponse lorsque son extension est en partie dtermine par son effet sur un agent. Une musique insupportable est dfinie ainsi parce quelle provoque un certain effet chez lagent qui la considre comme telle. De mme, une possibilit daction apparat utile ou improbable lorsquelle engendre une reprsentation cet effet chez lagent. Prcisons que cela ne signifie pas (du moins pour nous) que les proprits objectives sont trangres la rponses : au contraire, la dynamique de population, de dveloppement et dapprentissage des agents aura plutt tendance ajuster la rponse des situations qui la dclenchent de faon approrie faute de quoi, dautres agents mieux adapts envahiront la population. Dans un contexte comptitif, les agents moins aptes se reprsenter comme utile (/probable/facile) ce qui est rellement utile (/probable/facile) seront dsavantags. Larchitecture prsente ici est videmment trs simple. Elle intgre pourtant le fonctionnement de systmes de contrle qui ont fait leur preuve dans plusieurs industries et en robotique autonome : lutilisation de modles dynamiques qui simulent des tats futurs du systme et de lenvironnement afin doptimiser le contrle dans un contexte incertain. Les systmes experts, en revanche, se sont avrs tre des outils forts utiles, mais nont jamais donn lieu des agents artificiels autonomes169. Une ACR relle sera bien sr plus complexe : elle aura une multitude de modles inverses et directs, certains plus robustes, dautres plus flexibles, et ces modles intgreront linformation en provenance de plusieurs modalit sensorielles. Comme plusieurs lont soulign,170 la possibilit de lerreur comme de lobjectivit surviennent lorsque les entits de lenvironnement sont traques par plusieurs modalits. Nous pouvons ainsi formuler une troisime condition pour tre une architecture de contrle rationnelle : C3: Une ACR guide son comportement laide de deux classes gnriques de modles, caractriss par leur direction
168(Johnston, 169
1989; Pettit, 1991) .
Cf (Clark, 1997: chapitre 1). (Hurley, 2003; Proust, 1997, 2006; Sterelny, 2001)
170
136
dajustement : des modles directs (du control vers le contrleur) et inverses (du contrleur vers le contrl)
3.4
SYNTHSE. LAGENT RATIONNEL, ARCHITECTURE
DE CONTRLE
Lintelligence artificielle, dfinit usuellement un agent par les critres suivant171 : Pro-activit (prendre linitiative de performer une tche lorsque requis) Autonomie (modifier ses oprations sans interventions externes) Ractivit (interagir avec lenvironnement) Sociabilit (interaction ou ngociation avec dautres agents) Daprs le modle prsent ici, une ACR est dote de ces critres minimaux : loptimisation de sa performance et son contact continu avec lenvironnement (incluant la dynamique de population) font delle un agent situ, qui cherche maximiser, la hauteur de ses capacits, une fonction dutilit. Pour tre un agent rationnel, il lui faut toutefois intgrer les fonctionalits suivantes : C1. tre un contrleur embarqu qui optimise une fonction dutilit multi-attributs C2. tre un systme de contrle adaptatif, capable dapprendre C3 tre situ dans une dynamique de population C4 Guider son comportement laide de modles directs et inverses Ce chapitre se proposait de fournir un modle crdible de la rationalit conomique, qui satisfasse certains rquisits conceptuels, dont celui de la normativit, afin de pouvoir justifier lemploi de termes comme rationnel et dcision . Conformment aux relations thoriques
Daprs (Floridi, 1999; Weiss, 1999; Woodridge & Jennings, 1995). Le concept D AGENT en IA regroupe la plupart du temps les agents logiciels comme les robots autonomes; nous ne traiterons ici que des seconds.
171
137
dfinies plus haut entre les diffrentes approches de la rationalit conomique, lagent rationnel prsent ici est un modle mcaniste, et non une thorie qui postule des lois universelles ou des principes quasinomiques. Le modle occupe un rle de mdiateur entre dune part, des principes gnraux (thorie de la complexit computationnelle, dynamique des populations, thories conomiques de la rationalit, ingnirie du contrle) et, dautre part, des sciences descriptives (psychologie, biologie, conomie exprimentale). En tant que connaissance ingnirique, il ne sagit pas dune connaissance normative au sens strict, mais une connaissance faillible qui intgre une normativit conditionnelle et instrumentale. On peut considrer le modle comme un ciseau inginrique tenue par une main conomique : le modle est loutil qui permet la main daccomplir sa tche. Il lui reste maintenant utiliser ce ciseau et dcouper, dans ltoffe de la biologie, une portion qui contiendra des agents rationnels de faon ce quon puisse distinguer une espce naturelle, sil y en a une. Le prochain chapitre soutient quon peut effectuer ce dcoupage et spcifie comment, alors que le dernier suggre que les contours de la catgorie AGENT CONOMIQUE correspondra, dans une grande mesure, aux contours de la catgorie VERTBRS. Il sagira donc dinscrire les catgories de lconomie dans celles de la biologie. Lontologie de lconomie, au premier abord, constitue une catgorie htroclite du point de vue de la biologie. En effet, les agents conomiques qui voluent dans les conomies actuelles ne sont pas que des tres humains : on retrouve des industries, des mnages des gouvernements, des administrations, des institutions publiques ou prives, des firmes dinvestissement, etc. Une corporation est, lgalement, une personne morale, autorise faire des achats et vendre des biens, et conomiquement, un agent : elle achte et vend, prend des dcisions par son conseil dadministration, etc. Il y a certes une diffrence entre les individus et les groupes, mais cette distinction demeure fonctionnelle :
La distinction entre un individu et un groupe nest pas de type biologique-social, mais simplement fonctionnelle. Tout dcideur un seul tre humain ou une organisation qui peut tre conu comme ayant des intrts unitaires motivant ses dcisions peut tre trait comme des individus dans la thorie (Luce & Raiffa, 1957: 13)
Ainsi, lconomie nest pas en soi une science de ltre humain (Ross, 1999), mais une science des agents rationnels. Lconomie nest pas non plus une science de largent ou de la finance (que seuls les humains possdent), mais une science des valeurs, des dcisions, de lallocation des ressources, des prfrences, stratgies et changes. Selon la dfinition classique, lconomie est la science qui tudie les relations entre des fins et des moyens limits (scarce) qui peuvent avoir des usages alternatifs
138
(Robbins, 1932: 13); une autre dfinition tire dun manuel dconomie la dfinit comme ltude de lemploi que font les individus et socits des ressources limites (scarce) que la nature est les gnrations passes ont fournis (Case & Fair, 1992: 5). Les principes de base de lconomie , selon (Krugman, 2004) concernent les individus dans leur prises de dcisions individuelles et interactives. Toute lconomie repose sur lide quil y a des individus qui prennent des dcisions seul ou avec dautres.
139
DE LA PSYCHOLOGIE ORDINAIRE LA BIOLOGIE
COMPARATIVE
Il n'y a point d'art qui apprenne dcouvrir sur le visage les inclinations de lesprit
- Macbeth, Acte I Scne IV

Voil en gros, les consquences auxquelles on aboutit ncessairement quand on divise nimporte quoi daprs une diffrence unique. Il faut essayer, au contraire, de prendre les animaux genre par genre, () sans recours la dichotomie - Aristote, Parties des animaux, livre I, 643b9)
La question de la rationalit animale, dans un cadre naturaliste, demande quon value la possibilit denchsser la catgorie des agents rationnels dans les catgories de la biologie. Cette question a toutefois souvent t traite dun angle plus pistmologique quontologique, savoir selon notre capacit interprter, rationaliser laction. Pour plusieurs philosophes, la suite de Davidson, lagent rationnel est celui dont on peut interprter laction en le comparant un idal constitutif de rationalit . Certains vont en dduire que seul lhomme est rationalisable, dautres quil est possible que des animaux le soient aussi si on amende cet idal. La question devient alors analogue au test de Turing (Turing, 1950): attribuer de la rationalit qui nous fais croire quil est rationnel. Nous avons soulign au dernier chapitre la ncessit de passer dune conception typologique une conception populationnelle des agents rationnels. Le prsent chapitre poursuit dans cette voie, en suggrant que cette transition doit tre accompagne dune autre, o la question de la rationalit et de sa possible extension dautres espces que la ntre soit vue comme une question de biologie comparative plutt quune question dinterprtation dautrui. Nous reconstruirons premirement largument interprtiviste et soulignerons les dfauts de sa mthodologie (section 4.1), savoir une gnralisation de notre thorie de lesprit intuitive (folkpsychology). Son principal dfaut est dutiliser une mthode analogique ou homoplasique (similarit de fonction) qui, dans un cadre biologique, ne nous fournit pas de connaissances sur des espces naturelles (4.2). Il sera suggr dabandonner linterprtivisme pour une tude plus approfondie des principes de la biologie comparative. Dans ce domaine et dans plusieurs autres, les espces naturelles autres que les lignes biologiques
140
sont des homologies, soit des traits unis par une relation dascendance commune. La notion dhomologie nest pas fondamentalement fonctionnelle (encore moins tlologique), mais comme nous aurons besoins de notions fonctionnelles, nous laborerons un prototype dexplications des traits fonctionnels (4.3). En bref, il est propos de renverser lordre de lexplication : commencer par les units danalyse, puis isoler parmi elles celles qui sous-tendent une fonction, plutt que de postuler une fonction et de rechercher ensuite son substrat.
4.1
LINTERPRTIVISME ET SA MTHODE
Dans le prsent chapitre, ce nest pas tant les thses que la mthode utilise par Davidson et plusieurs autres qui sera critique. En effet, comme on le verra plus loin, mme pour des philosophes plus enclins reconnatre une continuit entre lanimal et lhumain du point de vue de la rationalit, on retrouve souvent la mme mthode: dterminer si lagent peut tre interprt selon nos catgories psychologiques intuitives. 4.1.1 DAVIDSON : LA RATIONALIT COMME INTERPRTATION Pour Davidson, la rationalit est relie de faon inhrente au langage. Son argument dcoule dune conception interprtiviste de la rationalit, quon peut rsumer ainsi : (1) tre un animal rationnel, cest prcisment avoir des attitudes propositionnelles (Davidson, 1991: 63). (2) Les attitudes propositionnelles sont toujours organises logiquement et systmatiquement (3) Comme nous jugeons nos attitudes propositionnelles (comme tant vraies ou fausses), nous possdons les concepts de croyance, signification et vrit. (4) Ces concepts figurent dans une thorie implicite, lidal constitutif de rationalit , par laquelle nous rationalisons laction des autres. (5) Pour possder les concepts mentionns en (3) et rationaliser laction au sens de (4), une crature doit possder un langage. (1) Largument de Davidson pour (1) tient ce que lorsquon dcrit le comportement dune personne en terme de croyances et dsirs, on montre la rationalit de laction la lumire du contenu de la croyance et de lobjet du dsir (D. Davidson, 1993b: 234) . La structure des croyances, des dsirs et de laction de Pierre, relativement son envie de pommes, montrent que Pierre est rationnel par la cohrence logique de ses raisons. Il est donc impossible dattribuer dans un premier temps des croyances et des dsirs quelque crature pour
141
ensuite, aprs coup, ajouter cela que cette crature est rationnelle tout en faisant de cette dernire affirmation une proposition rellement informative. (2) Si on souscrit (1), on souscrit (2) : avoir une attitude propositionnelle, cest en avoir une panoplie : pour individuer une croyance, linterprte doit la localiser dans un rseau de croyances et de dsirs associs. Si un agent possde le concept CHNE, et que ce concept spcifie quun chne est un arbre, alors un agent qui croit quil est prs dun chne doit aussi pouvoir se faire crditer la croyance quil est prs dun arbre. Parmi les concepts quun agent rationnellement interprtable, donc dot dattitudes propositionnelles, doit possder, figure le concept de CROYANCE, do (3). (3) Le concept de CROYANCE est une condition ncessaire la possession de croyances : croire que P nimplique pas uniquement croire que P, mais croire quon croit P. On croit que lon croit que P lorsquil y a possibilit de surprise, laquelle suppose un contraste entre ce quon tenait pour vrai et ce qui est vrai, ce qui signifie quon distingue le vrai du faux. (4) Ces concepts sont prsents aussi dans ce que Davidson nomme lidal constitutif de rationalit (1993: 222), luvre dans les attributions dattitudes propositionnelles qui surviennent par exemple dans le dialogue. Cet idal est une condition de possibilit des attributions de croyances et de dsirs172. Par exemple, si quelquun tire sur une corde par ses deux bouts(D. Davidson, 1993b: 234) , une explication de cette action qui ne prsuppose pas la rationalit de lagent pourrait tre quil se bat contre lui-mme. Il y aurait toujours moyen den faire une description rationnelle mais il faudrait ajouter plusieurs hypothses auxiliaires, alors que si on prsuppose la cohrence des dsirs, croyances et actions, lhypothse quil cherche briser la corde est plus naturelle. On peut, grce cet idal constitutif, essayer de prdire et expliquer le comportement des autres agents rationnels mais, plus profondment, linterprtabilit du comportement sur fond didal de rationalit est la marque du mental (Kim 1996 : 324). Cest en considrant des agents sous cet aspect quon en fait des agents dots de mental, dattitudes propositionnelles.
172
La rationalit [] est une condition pour avoir des penses (Davidson, 2004 : 197).
142
(5) Davidson soutient que pour quune action soit interprte la lumire de lidal constitutif de rationalit, lagent doit agir en fonction dattitudes propositionnelles; or la possession de croyances prsuppose plusieurs croyances, dont celles o figurent le concept de CROYANCE, daprs (3). cela Davidson ajoute que le concept de CROYANCE, lui, prsuppose la capacit linguistique. En effet, si lon dfinit la croyance comme une reprsentation susceptible dvaluation smantique (qui peut tre vraie ou fausse), les organismes qui entretiennent des croyances ont lide dune ralit objective et indpendante et sont capables de distinguer lobjectif du subjectif. Or cette distinction nest garantie, selon Davidson, que par la matrise du langage. Alors quun organisme non linguistique peut au mieux apprendre et gnraliser, rien dans la modification de son comportement ne permet de conclure une distinction objectif/subjectif. On pourrait conclure quil sagit dune raction diffrencie des classes de stimuli, sans plus. Les cratures linguistiques (lhumain), elles, doivent, pour communiquer, tre capables de penser que lautre communicant a aussi le concept dun monde extrieur et objectif. De plus, sans langage, les liens dimplication ou dincompatibilit logique entre les croyances nont pas de sens, car il faut encore possder ces concepts logiques pour dtecter ces relations. La possession du langage serait une norme constitutive de lutilisation du concept de RATIONALIT, selon Davidson : la rationalit est un trait social; seuls les communicateurs la possdent conclut-il la fin de son essai Animaux rationnels (1991 : 75). 4.1.2 PSYCHOLOGIE ORDINAIRE ET INTERPRTATION DE LANIMAL Dans la conception de Davidson on peut distinguer dans les thses (1)-(5) sur la rationalit une mthode pour catgoriser les agents rationnels. La mthode en question comporte essentiellement trois tapes : 1. Dfinition. partir dune analyse smantique des concepts de rationalit, croyance, dsir, action, etc., produire une dfinition de la rationalit qui spcifie les diffrents traits, caractres ou comptences T que possdent les agents rationnels 2. Interprtation. Dterminer si X est rationnel en dterminant si X est rationnellement interprtable selon les concepts dfinis en (a) 3. Attribution. Si X savre rationnel au sens de b), attribuer les traits T X
143
Dans son principe gnral, elle consiste dfinir un concept puis spcifier ses critres dapplication. Il y a cependant plusieurs faons de spcifier une dfinition et des critres; celle quemploie Davidson est de type interprtative. Cette faon de faire est relativement courante dans les discussions sur la rationalit animale173. Elle consiste faire de la question de la rationalit animale une tentative dinterprtation du comportement animal, laquelle utilise les concepts drivs de notre psychologie ordinaire ( folk-psychology ). Distinguons trois acceptations de psychologie ordinaire 174: i. Une thorie implicite du sens commun qui se rvle dans le discours quotidien sur laction et la pense ii. Une thorie de lesprit reprsente dans lesprit humain, qui fait partie de la psychologie humaine au mme titre que les facults linguistiques iii. Une capacit simuler les tats mentaux dautrui afin de leur attribuer ces tats. Les acceptations qui nous intressent ici sont les deux premires car elles font de la psychologie ordinaire une thorie sociale ou individuelle. De toute vidence, la mthode de Davidson consiste rendre explicite les infrences que lgitimise cette thorie : en dfinissant les liens logiques qui unissent CROYANCE, DSIR, ACTION, etc., on met au jour la structure de la psychologie intuitive, lapplicabilit de laquelle devient un critre de rationalit. Comme le langage figure, pour Davidson, parmi les conditions dapplicabilit de la thorie, la catgorie des agents rationnels fera partie de, ou sera quivalente , celle des agents linguitsiques. Le mme raisonnement a par la suite t tendu aux animaux : si tre rationnel, cest tre rationnellement inteprtable, y a-t-il un sens selon lequel des animaux sont rationnellement interprtables ? On peut relaxer certaines contraintes (la possession du langage par exemple) et essayer de donner un sens aux actions animales comme on en donne aux actions humaines, afin de voir sils sont capables davoir des croyances et des dsirs, des tats conscients175, des capacits conceptuelles, infrentielles ou
Voir par exemple (Bennett, 1971; Bermdez, 2003; Dennett, 1995, 2003; Hurley, 2003) de mme que les essais de Millikan et Allen dans (Hurley & Nudds, 2006).
173 174
Cf (Stich & Nichols, 1992).
Dans un registre semblabe, (Nagel, 1974) argumente que nous ne pouvons savoir ce que cela fait ( what its like to be) une chauve-souris, et donc la comprhension de cette espce nous sera toujours opaque.
175
144
communicationnelles quivalentes ou semblables aux ntres. Comprendre lesprit animal devient alors un projet qui succdera que si on peut se mettre dans la peau de lanimal en question pour deviner ce quil pense. Daniel Dennett a ainsi propos un concept semblable de rationalit, qui prolonge la rflexion de Davidson, dans un cadre naturaliste. La notion de rationalit, selon lui, sarticule dans le cadre de stratgies prdictives; nous avons intuitivement des attitudes, points de vue ou des postures ( stances ) lgard de certains types de systmes avec lesquels nous pouvons interagir. Que ce soit une pomme qui tombe dun arbre, un logiciel dchecs ou un vendeur daspirateurs, ds que nous entrons en contact avec ces objets ou agents nous avons une certaine tendance gnrer des prdictions quant lvolution de lobjet ou de lagent (le systme ). La pomme, sil ny a pas de vent, tombera en ligne droite vers le sol; le logiciel prendra une pice de notre jeu si elle peut le faire sans se mettre en danger, et le vendeur daspirateurs nous vantera les mrites de son produit et nous suggrera den acheter un. Nous effectuons des types distincts de prdictions selon que le systme est analys du point de vue physique, du point de vue du plan (design ), ou du point de vue intentionnel. Dans un premier cas (un objet qui tombe), nos prsuppositions se limitent la physique; dans le second cas, nos prsuppositions attribuent au systme des fonctions (les algorithmes dun ordinateur, ou les fonctions biologiques des organes); dans le dernier cas, nous prsupposons la rationalit de lagent, savoir que le systme en question est dot de croyances et de dsirs. Les actions du systme peuvent tre la fois expliques comme laccomplissement de ses dsirs relativement ses croyances mais aussi, en thorie, prdites partir des croyances et dsirs. Dennett donne lexemple du pluvier et de son comportement de tromperie ; lorsque celui-ci dtecte un prdateur, il se comporte comme si son aile tait brise, et feint dtre bless. La tromperie est elle une relle tromperie intentionnelle, qui rvle la rationalit de lagent, ou un simple rflexe ? Pour ce faire (Dennett, 1987: 258) propose dinterprter le comportement du pluvier en lui attributant un soliloque :
[un prdateur] pourrait tre distrait par son dsir de m'attraper et de me manger, mais seulement s'il pensait qu'il y a une chance raisonnable qu'il me mange; il contracterait juste cette croyance si je lui donnais des raisons de croire que je ne peux plus voler; je pourrais faire cela en feignant d'avoir une aile brise.
Si on peut utiliser avec succs la posture intentionnelle, si on montre que lanimal est sensible un ensemble complexe de conditions environnementales ainsi que le prsuppose le soliloque, on peut dire que, comme lagent rationnel de la thorie des jeux, il attribue des croyances et
145
des dsirs (de premier ou second ordre) dautres agents afin de rgler son comportement. Si des tests montrent que son contrle cognitif ragit des patrons environnementaux plus simples, il faut alors rvaluer sa rationalit la baisse. Cette procdure est la mme, selon Dennett, que nous utilisons entre nous: on suppose les agents informs et capables dinfrences logiques, on prdit leur comportement, et on rvalue cette idal de rationalit la baisse sil y a lieu. Plus rcemment, Susan Hurley (2003) a dfendu une stratgie interprtive pour tudier la possibilit dune rationalit animale, selon laquelle lagentivit rationnelle dpend dune caractrisation de lanimal au niveau personnel (distinct du niveau subpersonnel) : si on peut lui attribuer des capacits qui font office de raisons dagir (des perceptions et des intentions motrices), que celles-ci satisfont aux rquisits holistes ( savoir quelles peuvent tre combines et recombines) et normatifs (les raisons dagir peuvent faire que lagent commet des erreurs), alors on peut considrer que lanimal est rationnel. De mme, Bermdez (2003) propose une classification des types de rationalit selon leur complexit et leur adquation la psychologie ordinaire (manipulation de croyances, dsirs, etc.). Toutes ces stratgies explicatives sont en fait des gnralisations de la conception de Davidson :
Si nous ne parvenons pas trouver le moyen dinterprter les paroles et autres comportements dun tre comme rvlant un ensemble de croyances pour une bonne part cohrentes et vraies selon nos propres normes, nous navons aucune raison de considrer que cet tre est rationnel, quil a des croyances, ou quil dit quoi que ce soit. (D. Davidson, 1993b: 203-204)
Comme le soulignerons la prochaines section, la stratgie interprtative fait face un problme : elle est en fait un raisonnement bas sur lindividuation analogique ou homoplasique des traits, ce qui en plus dtre en contradiction avec la cladistique et la biologie volutionniste, risque de crer des classes non naturelles. 4.1.3 INTERPRTER POUR CATGORISER Selon linterprtivisme, interprter le comportement de X signifie quon lui attribue certains traits ou caractres T quon tient pour rationnel. Si on peut interprter X, alors X possde T. Le critre pistmologique pour tre un agent rationnel est linterprtabilit; il est assorti dun critre ontologique, soit la possession de T. Rejetons tout de suite le critre pistmologique : catgoriser quelque chose comme appartenant une classe biologique en vertu des proprits relationnelles de lentit en question est un non-sens scientifique. La science recherche des catgorisations objectives, fondes sur les proprits causales ou nomologiques quont les entits
146
indpendament de notre attitude face elles : on ne catgorise pas les lments chimiques selon leur aptitudes tancher notre soif, par exemple. Il reste alors linteprtiviste son critre ontologique, par exemple, avoir une thorie de lesprit : le prdicat tre un agent rationnel sappliquera tous les animaux qui en seront dots. Dterminer, dans le monde vivant, qui sont les agents rationnels demande quon isole certains traits, ou caractres176, quune espce possde et qui font que cette espce est constitue dagents rationnels. Pour ce faire, on se demande si un autre animal, par exemple le chimpanz, a lui aussi une thorie de lesprit (Premack & Woodruff, 1978). Supposons que le chimpanz ait russit tous les tests ncessaires et que les primatologues soient conduits lui attribuer une thorie de lesprit177 : il serait alors justifi de dire que le trait avoir une thorie de lesprit est instanci chez le chimpanz et lhumain, et donc on considrerait que la prsence de ce trait, quon tient pour un critre de rationalit, justifie le fait quon considre le chimpanz comme un agent rationnel. Cest donc par une analogie quon justifierait lextension de la classe des agents rationnels aux chimpanzs, un raisonnement rcurrent depuis Hume :
Nous sommes conscients que nous-mmes, en adaptant des moyens aux fins, nous sommes guids par la raison et lintention () Quand donc nous voyons dautres cratures (...), accomplir de semblables actions et les diriger vers des fins semblables, tous nos principes de raisonnement et de probabilit nous portent avec une force invincible croire lexistence dune cause semblable (Trait de la nature humaine, I, III, XVI)
Largument, dans sa forme, na pas tellement chang de Hume Dennett. Cette faon de procder est toutefois problmatique non pas dans les conclusions quon en tire, mais dans la mthode utilise pour individuer un trait dans une perspective comparative. Linterprtivisme souscrit en effet une rgle de catgorisation et dindividuation des traits
Un trait ou caractre est une partie dun animal ou un processus ayant lieu en lanimal : un organe, un os, un rflexe, un systme de rgulation, un mcanisme immunitaire, etc., sont des traits identifiables (Wagner, 2001). Les individus biologiques sont des collections de traits. Nous utiliserons uniquement le terme trait.
176
Dans les faits, les primatologues reconnaissent des comptences mtacognitives aux primates, mais pas de thorie de lesprit (Proust, 2003).
177
147
selon leur fonction, une faon de faire qui bien quelle soit populaire chez les philosophes178, ne trouve que peu dcho en biologie. 4.1.4 DE LINTERPRTATION LA BIOLOGIE COMPARATIVE Selon linterprtivisme, si les animaux peuvent tre interprts, cest que, comme nous, ils possdent un trait ou une collection de traits T qui en font des agents rationnels. La catgorie AGENTS RATIONNELS est alors rduite la catgorie AGENTS DOTS DE CAPACITS QUI LES REND INTERPRTABLES, la capacit variant selon la thorie de la rationalit. Cela quivaut regrouper des traits selon une identit de fonction : le trait T1 chez lhumain et T2 chez le chimpanz (ou tout autre animal) sont identiques parce quils ont la mme fonction, savoir attribuer des croyances et des dsirs autrui. Le trait en question ne peut qutre individu par sa fonction, car ce nest pas un trait anatomique, physiologique ou comportemental auquel on fait rfrence lorsquon identifie les traits qui font quun animal est rationnel. La fonction en question peut tre conue comme la fonction adaptative ou son rle causal (les deux principales familles de thories des fonctions biologiques), ladoption dune conception ou de lautre na pas dimpact ce moment de largumentation : Effet slectionn: F est la fonction du trait T ssi F est un effet de T qui a t slectionn parce quil tait bnfique179 pour les organismes dot de T. (ex : la fonction des mains est la prhension parce que la prhension a t un avantage slectif des organismes dots de mains). Rle causal : F est la fonction du trait T ssi F est un des effets causalement efficace de T pour les organismes dots de T (ex : la fonction de la main est la prhension car les organismes dots de mains sont capables de prhension). En anatomie comparative et en cladistique,180 un regroupement de traits par des critres didentit de fonction est une analogie ou homoplasie181 :
178
Par exemple (Millikan, 1984; Neander, 2002) et les essais dans (Allen et al., 1998).
On peut ajouter cette clause : qui tait bnfique dans lhistoire rcente de C; cf Godfrey-Smith, in Allen et al., 1998.
179
La cladistique est la classification en graphe acyclique du vivant en fonction de lhistoire phylogntique (Lecointre & Le Guyader, 2001); un clade, ou taxon monophyltique, est un groupe dorganismes qui inclut le dernier anctre commun de tous les membres du groupe ainsi que les descendants de cet anctre commun.
180
148
Homoplasie =df les traits A et B des espces X et Y sont homoplasiques ssi A et B ont la mme fonction F.
Le problme nest pas avec le raisonnement analogique en soi, mais avec le raisonnement analogique en biologie. En spcifiant un critre qui individue un trait, on dtermine par le fait mme une catgorie de traits ou dorganismes dots de ce trait. Lorsquon individue le trait avoir des ailes par la fonction se propulser de faon autonome dans un milieu arien, on cre une catgorie parmi laquelle on compte entre autres : des ailes dinsectes, de chauves-souris, doiseaux (si on limine pingouins et autruches), et de ptrodactyles (si on inclut les espces teintes). Avonsnous isol une espce naturelle ? Non, parce que lindividualisation du trait a t effectue par homoplasie. La catgorie isole est un ensemble htroclite danimaux, dont la ressemblance se limite la capacit voler. On pourra difficilement transposer les connaissances propos des drosophiles aux albatros182. Ce nest pas parce que deux animaux ont la mme capacit quon pourra isoler une structure ou un mcanisme sousjacent qui soit pertinent. Ainsi les ailes d'oiseaux ont une surface portante grce des plumes et des doigts fusionns, alors que les ailes de chauvessouris ont une surface portante grce une peau tendue entre des doigts individuels allongs. On ne peut donc pas faire des prdictions ontologiquement fondes quant aux organismes si on individue le trait que par sa fonction adaptative. Le dfaut dune catgorie comme ANIMAL DOT DAILES, tout comme AGENTS DOTS DE CAPACITS QUI LES REND INTERPRTABLES, est davoir un mauvais critre pour regrouper des entits, fondes sur une mauvaise approche de lontologie biologique. La prochaine section proposera une autre mthode pour catgoriser et individuer des traits.
EN RSUM : La mthode interprtiviste, lorsquon tente de ltendre aux animaux, regroupe des espces selon des critres homoplasiques, ce qui risque de crer des catgories artificielles.
Cf (Hall, 1994). Lanalogie est une forme dhomoplasie, soit des identits de fonctions, mais le concept danalogie ajoute cette identite une proprit adaptative, alors que lhomoplasie se limite lidentit.
181 182
Il y en aura toutefois : des question darodynamique par exemple.
149
4.2
HOMOLOGIE ET CATGORIES BIOLOGIQUES
4.2.1 L HOMOLOGIE EN BIOLOGIE COMPARATIVE La biologie volutionniste et la cladistique, depuis les travaux fondateurs de Hennig classent les espces par ascendance commune, plutt que par une hirarchie linnenne des espces, groupes, genres, etc (Hennig, 1966). Lanalyse cladistique suppose quon puisse analyser un organisme comme un ensemble de traits, et que les liens gnalogiques entre ces traits permettent de reconstruire la phylognie des espces qui portent ces traits. Lorsquun trait est individu, son individuation est en fait une hypothse leffet quil soit une homologie. Dans son acceptation classique, lhomologie est lidentit de traits dus une ascendance commune : Homologie =df les traits A et B des espces X et Y sont homologues ssi X et Y sont des descendants de lespce , le dernier anctre commun de X et Y dot de T, la forme ancestrale de A et B
Ce concept taxique (fond sur les taxonomies) dhomologie tend maintenant tre complt (ou pour certains, remplac) par un concept dveloppemental dhomologie183 : Homologiedev =df les traits A et B des espces X et Y sont homologues ssi A et B sont des instances du mme phnomne dveloppemental au mme niveau danalyse.
Par phnomne dveloppemental, il faut entendre la maturation ou encore la trajectoire dveloppementale dun trait dtermine par les mmes contraintes dveloppementales184. Le code gntique, la morphologie, lenvironnement et dautres facteurs constituent des contraintes dveloppementales qui contribuent ensemble la construction du trait. Cette dfinition de lhomologie (qui est en fait un critre plus quune relle dfinition) accomode le fait que si des organismes donnent naissance des organismes, des membres ou structures physiologiques ne donnent pas naissance dautres membres ou structures physiologiques.
(Hall, 1994; Ingo, 2003; Laubichler, 2000; Wagner, 1989, 2001). Plusieurs sentendent aussi pour dire que le concept dhomologie peut varier selon les disciplines.
183
Une contrainte dveloppementale est un biais dans la production de variantes phnotypiques ou des limitations de la variabilit phnotypique cause par la structure, le caractre, la composition ou la dynamique du systme dveloppemental (Maynard Smith et al., 1985: 266).
184
150
Une aile doiseaux nest pas lanctre dune autre aile doiseau, mais le mcanisme dveloppemental qui rgule la construction ontogntique de laile au cours de la vie de lorganisme, lui, est hritable. Les niveaux danalyse sont les niveaux dorganisation des organismes : squences dADN, cellules, gnes, processus dveloppementaux, structures anatomiques ou physiologiques ainsi que comportements sont diffrents niveaux dorganisation des tres vivants entre lesquels il nexiste pas ncessairement de correspondance 1 :1. Un membre peut tre produit par diffrents processus dveloppementaux, une mme squence dADN peut coder diffrentes protines, etc. Plusieurs cas de dissociation entre des homologies gntiques et morphologiques sont connues (Wray & Abouheif, 1998). La relation dhomologie peut ainsi avoir lieu diffrents niveaux dorganisation sans quune homologie un niveau implique une homologie dautre niveaux185. Des caractristiques fonctionnelles peuvent figurer dans la description du trait (biomcanique des membres, fonctionnement des organes, circuits dinflux nerveux, etc), mais les fonctions en question ne sont pas des fonctions adaptatives, mais des descriptions mcaniques et causales (sur lesquelles nous reviendrons plus loin) : les activits des entits en question. Ainsi, parmi les critres standards186 utiliss pour identifier un trait dont on recherche la ligne, aucun ne spcifie la fonction adaptative du trait : la topologie des connections entre le trait et les autres qui lentourent lorigine embryologique du trait la prsence de formes transitoires du trait chez les individus adultes des espces tudies la communaut de contraintes dveloppementales
4.2.2 LA RECONSTRUCTION
CLADISTIQUE
Le cladiste fait donc dans un premier temps lhypothse quun trait est une homologie, tente de reconstruire larborescence phylogntique de ces traits, et ajuste son hypothse sur le caractre homologique ou non du trait de mme que sur son tendue dans larbre. Soit par exemple 5 espces
Voir (Pritz, 2005; Wray & Abouheif, 1998) pour une revue de ces questions de niveaux dorganisation
185 186
cf (Amundson, 2000)
151
(Alpha, Beta, Gamma, Delta, Epsilon), quon identifie par 10 traits qui peuvent avoir deux tats (0 ou 1).
Traits Espces Alpha Beta Gamma Delta Epsilon 1 1 1 1 1 1 2 0 0 0 0 0 3 1 1 1 1 1 4 0 1 0 1 1 5 1 0 1 0 0 6 0 1 0 1 1 7 1 0 0 0 0 8 0 1 1 0 0 9 1 0 0 0 0 10 0 1 1 1 0
Figure 4-1 Matrice de traits
Linfrence cladistique est, mathmatiquement, une transformation dune matrice (figure 4-1) en un graphe (le cladogramme, figure 4-2), selon une contrainte de parsimonie, savoir la minimisation des transformations volutives. Des algorithmes tentent de trouver larbre le plus simple qui recre la phylognie des organismes. Pour les 5 espces, une solution possible est larbre suivant, ou chaque feuille est une espce, et chaque nud une transformation volutive187:
Figure 4-2 Cladogramme
Les 5 espces constituent un clade, soit un taxon constitu dun anctre commun et tous ses descendants. De la sorte, un cladogramme permet disoler diffrentes entits, qui pourront intervenir dans des gnralisations, prdictions, inductions ou des explications scientifiques. Les entits les plus gnrales sont les taxas, savoir les groupes taxonomiques constitus dun anctre commun et de tous ses descendants. Dans le cladogramme ci-dessus, les espces Epsilon, Delta et Beta constituent un taxon monophyltique : le cladogramme est complet et elles sont issues dun anctre commun. Le groupe constitu des espces Epsilon
Le cladogramme a t gnr avec le module Package), v3.6.

187
DOLMOVE
du logiciel PHYLIP, (PHYLogeny Inference
152
et Delta, lui, est paraphyltique : ils sont issus dun anctre commun mais le cladogramme est incomplet. Si on groupait ensemble seulement les espces Delta et Alpha on aurait alors un taxon polyphyltique, soit un cladogramme incomplet qui ne contient pas leur dernier anctre commun. Les animaux endothermes ( sang chaud ) sont un exemple de taxon polyphyltique, compos des mammifres et des oiseaux, une catgorie qui ne reflte aucune taxonomie cladistique. Quest-ce quun trait dans cette taxonomie ? Le trait est une unit danalyse partage par diffrents taxa, qui permettra des gnralisations seulement sil est la fois partag (tous les organismes le possdent) et driv (le dernier anctre commun le possdait), cest--dire sil est une synapomorphie. Un trait pertinent pour la biologie comparative nest donc pas primitivement fonctionnel ou homoplasique, mais homologique188 :
L'homologie est le concept central de la biologie comparative et de la systmatique. En comparant et contrastant la morphologie et l'anatomie des organismes, nous divisons nos observations en traits ou tats de caractre comme des caractristiques reconnaissables de l'organisme entier. Les caractres et tats de caractres ne portent aucune information phylogntique moins qu'on reconnaisse leur existence dans d'autres organismes en les nommant (...) (Kitching, 1998 :26).
Les homologies sont des hirarchies de classes dquivalence189. Ainsi, laile du moineau X et du moineau Y sont homologues, car elles sont toutes deux des ailes de moineau, issues dun anctre commun; laile du moineau et celle du flamand rose sont homologues en ce quelles sont des ailes doiseau; laile de loiseau et la patte avant du lzard sont homologues en ce quelles sont toutes deux des membres antrieurs de ttrapode; etc (voir fig. 4-3). A et B ne sont homologues que sous un aspect. En remontant larbre de bas en haut, chaque niveau dhomologie on retrouve une classe dquivalence de plus en plus large, un anctre commun de plus en plus ancien, et une ressemblance de plus en plus abstraite entre les membres de la classe, mais la relation demeure, formellement, une relation didentit190 dont les biologistes tentent
188 Voir par exemple (Briggs & Crowther, 2001: 512; Ingo, 2003; Kitching et al., 1998: 26; Ridley,
1989, 2004: 430; Wagner, 1989; Wenzel, 1992: 378) Voir aussi (Griffiths, 2006, sous presse) pour une revue de la question dun point de vue philosophique, et Matthen (2000).
189
(Griffiths, 2006, sous presse; Hall, 1994; V. L. Roth, 1991b).
Neander (Neander, 2002) laisse entendre que les relations dhomologie sont des relation de similarit et donc quelles admettent des degrs, ce qui est faux. Voir par exemple (Hall 1994) ou nimporte quel manuel de biologie.
190
153
dexpliciter les fondements gntiques et dveloppementaux. Chaque classe (aile de moineau, aile doiseau, membres antrieur de ttrapode) est unie par la relation dascendance commune.
Figure 4-3 Cladogramme de traits
Si les ailes de moineau et de flamand rose sont des homologues en vertu de leur ascendance commune, les ailes des chauves-souris et des oiseaux sont des homoplasies, car bien quelles aient des fonctions similaires, ces traits ne proviennent pas du dernier anctre commun : le dernier anctre commun aux mammifres et aux oiseaux, un reptile vivant il y a 310 millions dannes (Porcelli, 2005) navait pas dailes, donc ces traits ne sont pas homologues. Il y a bien sr une homologie entre elles parce quelles sont toutes deux des membres postrieurs de ttrapode, mais cette identit nest pas fonctionnelle ou adaptative. Homologie et analogie sont deux procdures quon peut utiliser pour identifier des traits, mais la seconde uniquement identifie des espces naturelles du point de vue de la biologie191. La prochaine section montrera comment les homologies sont des espces naturelles pour la biologie.
Limportance dune connaissance adquate des homologies (ou dabsence dhomologie) entre espces est particulirement importante dans les exprimentations avec les animaux : pour affirmer
191
154
4.2.3 DES HOMOLOGIES COMME ESPCES NATURELLES Comme nous lavons soulign, lindividuation des traits en biologie comparative ne procde pas par la mise au jour de la fonction adaptive, mais plutt en identifiant lascendance commune ou les mcanismes de dveloppement communs (lhomologie), une pratique courante de la biologie192 qui na t que trop peu note par les philosophes de la biologie ou de lesprit.193 Ainsi, aile est une catgorie fonctionnelle, mais membre pentadactyle194 ne lest pas (nous verrons que lanalyse fonctionnelle est pertinente, mme si elle nest pas la premire mthode de classification). La catgorie fonctionnelle des ailes, identife comme organes dont la fonction est le vol, est la biologie ce que le jade est la gologie: une catgorie htrogne qui ne supporte pas dinductions sur la nature du trait, car elle regroupe des organes non homologues et exclus des organes homologues (les ailes des autruches ne servent pas voler mais sont pourtant des ailes). Dans le mme ordre dide, si par exemple on dfinit une main comme un organe dont la fonction est la prhension , la queue ou le corps dun python sont alors des mains , parce quon peut dire que la prhension est une de leur fonction195. Encore l, la similarit de fonction sera peu informative sur la catgorie quelle individue.196 Inversement, des traits homologiques ne garantissent pas une identit de fonctions, particulirement pour des traits qui ont diverg depuis longtemps. Le mme membre pentadactyle peut avoir diffrentes fonctions : la prhension, la marche, la course, le vole, la nage, etc. (voir figure 4-4, tir de Roberts, 1986 :570)
quun mdicament, test sur des souris, aura un effet bnfique sur lhumain, il faut pouvoir justifier cette infrence par des connaissances comparatives sur des organes ou membres des deux espces, ce qui demande une connaissance des homologies (Hau & Van Hoosier, 2003). Lhomologie est une unit danalyse en palontologie (Thomason, 1995: chapitre 1), botanique (Cronk et al., 2002: chapitre 3 et 4), thologie (Lorenz, 1992[1973]), biologie comparative (Hall, 1994), neurobiologie comparative (Nieuwenhuys et al., 1998: 279-280), cladistique (Kitching et al., 1998: 26), systmatique (Scotland et al., 2000), biologie du dveloppement (Gilbert, 2006: 15), biologie molculaire (Alberts, 2002: 25) et en recherche biomdicale et pharmacologique utilisant des modles animaux (Hau & Van Hoosier, 2003: 5-6). Cf aussi (Abouheif et al., 1997).
192
lexception de (Amundson & Lauder, 1994; Griffiths, 1994, 2006, sous presse; Matthen, 2000).
193
5 doigts/orteilles, une main , un membre infrieur dot de deux os et un membre suprieur dot dun seul os.
194 195
Lexemple est de Matthen, 2000.
Voir (Griffiths, 1997, 2006, sous presse; Matthen, 2000) pour les problmes des dfinitions tlofonctionnelles en biologie.
196
155
Figure 4-4 Varits de fonctions des membres pentadactyles
Aussi identifier des traits, ou mme gnralement des catgories biologiques 197 uniquement par leurs fonctions, de faon homoplasique, ne nous donne donc que des essences nominales. En revanche, des traits ou catgories dfinies par lascendance commune, mme sils ne partagent pas la mme fonction, sont assez homognes pour supporter les inductions : on peut sattendre trouver par exemple la mme ossature chez le pingouin et le flamand rose. Dans certains cas, on peut aussi, grce aux dveloppements de la gntique molculaire et la biologie dveloppementale, isoler des contraintes dveloppementales ou des structures molculaire homologues. Le meilleur exemple est sans doute les gnes hox, responsables de la segmentation du corps des animaux selon un axe antrieur/postrieur.198 Ces gnes sont des homologues partags par une grande partie des animaux; les interactions entres ces gnes et dautres gnes, elles, ne le sont pas, ce qui explique la grande diversit des plans corporels malgr lhomologie de ces gnes. La relation entre le gnotype et le phnotype tant passablement complexe, il est plutt rare voire impossible didentifier un seul gne ou un un seul ensemble de gnes
197
(Millikan 1984; Neander 2002). Voir (Gilbert, 2006; Hall, 1994) pour plus de dtails.
198
156
un trait en particulier : les gnes peuvent tre homologues entre eux, sans que les structures anatomiques le soient. Il est alors justifi de dire que lhomogntit des homologies en font, avec les lignes, les espces naturelles de la biologie199: chaque classe dquivalence est assez homogne pour tre considre comme une espce naturelle, et lorquon possde des connaissances sur un membre de la classe, on peut gnraliser lensemble de la classe. Ce sont aussi des agrgats homostatiques de proprits (AHP) : les homologies se maintiennent travers les gnrations par la slection naturelle, la reproduction et le dveloppement. La raison principale pour prfrer lanalyse homologique (outre ladhrence lontologie de la biologie comparative) est la profondeur des similarits entre les membres de la classe. Plus on analyse les ressemblances de surface entre des membres de classes uniquement unis par une relation homoplasique, moins on trouve de principes sous-jacents. linverse, plus on analyse les ressemblances de surfaces entre des homologues, plus on dcouvre des principes unificateurs qui concourrent faire avancer le savoir. De plus, le concept dhomologie est relativement indpendant de la conception thorique de lvolution et de ladaptation : sa formulation est sensiblement la mme depuis Owen200, et fut accepte en biologie avant LOrigine des espces. Darwin a vu dans la slection naturelle une faon dexpliquer lhomologie. Pour reprendre une boutade de Griffiths (REF), Richard Dawkins et Benedict XVI nont sans doutes pas la mme opinion sur la fonction propre de la sexualit, mais les deux seront daccord sur le design des parties gnitales.
EN RSUM : Les traits des organismes vivants ne sont pas individus selon lidentit de fonction adaptative (homoplasie), mais par une ascendance commune (homologie). Les homologies sont, avec les lignes biologiques, les espces naturelles de la biologie.
(Brigandt, 2002; Griffiths, 1994, 2006, sous presse; Rieppel, 2005a, 2005b; Wagner, 1996, 2001) .
199
Linventeur du concept biologique dhomologie : ( le mme organe chez diffrents animaux quelque soit [under every variety] la varit de forme et de fonction (Owen, 1843: 379)).
200
157
4.3
HOMOLOGIE, MCANISMES
ET ADAPTATION
Darwin rduit la cause finale, en biologie, la cause efficiente travers sa thorie de la slection naturelle. (Quine, 1990: 75)
La mthode inteprtiviste a t critique et rejete parce quelle repose sur une mthode dindividuation des traits qui risque de produire des catgories dhomoplasie, lesquelles ne sont pas, en biologie, des espces naturelles. Le prsent travail cherche ancrer la rationalit conomique dans la biologie en utilisant les espces naturelles de cette discipline, savoir les homologies. Il faudra pourtant avoir recours des catgories qui soient la fois des homologies et des traits fonctionnels : si lagent rationnel maximise son utilit, et que cette maximisation de lutilit nest pas quun artefact de linterprtation mais une relle comptence de lagent, il doit possder certains traits dont la fonction est de participer la maximisation de lutilit. Il faut alors une dfinition dun trait fonctionnel qui sinsre dans les catgories dfinies par homologie. Si les homologies ne sont pas dfinies par leurs proprits fonctionnelles, cela nempche pas quelles puissent avoir des proprits fonctionnelles. Il est vident que le langage fonctionnel nest pas vacu de la biologie comparative : la fonction de la mchoire est de mastiquer, la fonction de lestomac est la digestion chimique, etc. Beaucoup de systmes mtaboliques et rgulatoires sont dcrits en terme de fonctions. Le langage fonctionnel ne fait toutefois pas rfrence la fonction adaptative ou la fonction propre (Millikan, 1984) du trait, mais son rle causal201. De la sorte, la caractrisation dune fonction nest quune autre faon de caractriser une homologie : les caractristiques fonctionnelles dun muscle ne sont pas plus des noncs portant sur la fonction adaptative du trait que lest une description du diamtre dun os. De mme, il ny a pas de tlologie ou de normativit dans la description de la fonction du cur ou des reins : lanatomiste nest pas somm daffirmer que le cur doit faire circuler le sang, que ce trait est une adaptation ou un avantage volutif, mais uniquement que le trait identifi comme tant un cur, chez tous les organismes qui en sont dots, fait circuler le sang, ceteris paribus. On peut donc parler de la fonction dun trait sans pour autant sengager envers une hypotse adaptative. La fonction est la description de
201
voir aussi (Proust, 2003, 2006)
158
lactivit dun mcanisme, et cest ce mcanisme au sens dfini plus haut qui peut avoir une fonction adaptative. Il importe donc de distinguer un trait comme lunit danalyse cladistique, le mcanisme du trait, sil en a un, et la fonction adaptative du mcanisme.
4.3.1 LEXPLICATION HOMOLOGIQUE-MCANISTE-ADAPTATIVE Nous avons dit plus haut quune explication mcaniste est une caractrisation mrologique des rles causaux ou activits que performent des entits. Lexplication dun mcanisme M peut tre constitutive (comment M figurent dans un mcanisme de plus haut niveau), contextuelle (les relations entre M et dautres entits/activits de mme niveaux) ou tiologique (la squence dvnements passs qui mne M). Une explication adaptationniste ajoute ltiologie une hypothse quant lavantage volutif que procure le trait sur le plan de la survie et de la reproduction. Les mcanismes sont monnaie courante en biologie202 : le fonctionnement des cellules, des organes, des membres ou des processus physiologiques (digestion, transpiration, etc.) sont souvent expliqus par les conditions qui dclenchent le mcanisme, ses activits et les parties qui le composent. De la sorte, une hypothse adaptative ne devrait tre formule que comme tant une caractristique dune homologie mcanique. Ainsi, si on veut dfinir le trait avoir une main par sa fonction adaptative, il faut suivre une mthode qui comporte un lment homologique, un lment mcaniste, et un lment adaptatif: Avoir une main =df avoir un membre antrieur pentadactyle (homologie), dont le rle causal est la prhension (mcanisme), qui a t favorise par la slection naturelle pour une fonction adaptative XYZ (adaptation).
la diffrence dune caractrisation purement adaptative, cette caractrisation nincluera que des membres dune classe homologue. Il est aussi possible que cette catgorie exclut des homologues : si, dans la ligne des organismes pentadactyles, certains descendants de ceux qui sont dots de mains nutilisent plus leur membres antrieurs pour la prhension, la prcdente dfinition excluera ces membres (appelons-les des schmains ) de la classe homologique. Il est toutefois prfrable dexclure les schmains de la catgorie des mains que dinclure la queue du
202
Cf (Bechtel & Abrahamsen, 2005) pour de nombreux exemples.
159
python dans cette mme catgorie, car la catgorie sera plus homogne et demeurera une espce naturelle. Lindividuation homologique-mcaniste-adaptative (HMA)203 dun trait est une partition dune espce naturelle qui hrite des proprits de la catgorie. Cette faon de faire garantit que, une fois le critre adaptatif appliqu, la catgorie est encore une espce naturelle : on partitionne un taxon monophyltique pour en isoler un taxon paraphyltique (les homoplasies, elles, peuvent tre polyphyltiques). Circonscrire, dans la catgorie des membres pentadactyles ceux qui servent la prhension est identique isoler, dans lespce naturelle EAU, les chantillons qui sont 100C . Cette partition de lespce naturelle demeure une espce naturelle et devient encore plus homogne car certaines inductions sont possibles propos de leau 100C alors quelles ne le sont pas pour de leau des tempratures infrieure : on peut prdire que tout chantillon deau cette temprature (et pression identique) svaporera. Si on dispose de suffisament dinformations sur le rle cologique de T, on peut alors tenter une hypothse adaptative, qui mentionnerait leffet de T qui aurait t slectionn. Les hypothses adaptives sont toutefois plus exigeantes pistmiquement que les hypothses dhomologie et de rle causal (Brandon, 1990: chapitre 5). Il faut par exemple disposer dinformations sur la co-volution entre le trait et la niche cologique, montrer que le trait a un effet bnfique pour lorganisme dans son environnement, et isoler ce pourquoi le trait est une adaptation : un rflexe vomitif a-t-il pour fonction dliminer certaines toxines ABC en particulier ou ragit-il tout produit dangereux dans lestomac ? Il faut ajouter plus dinformation pour dcrire la fonction adaptative que pour dcrire son rle causal, savoir la mcanique des contractions abdominales et le vomissement qui en rsulte. Elles fournissent toutefois une description plus complte du trait en question. 4.3.2 DES HOMOLOGIE COGNITIVES Les exemples dhomologies discuts jusquici sont des homologies anatomiques ou morphologiques, car elles comptent parmi les plus consensuelles. Avec lavanc des neurosciences, de lthologie et de la psychologie compare, il est maintenant possible de saventurer identifier des homologies comportementales204 et cognitives, faire des
Ce que (Griffiths, 1994) appelle des explications adaptives-historiques , et Matthen (2000) des dfinitions mixtes .
203
(de Queiroz & Wimberger, 1993; Wenzel, 1992) par exemple. Les homologies comportementales sont toutefois trs restreintes, et ne sappliquent qu des espces apparentes, comme les diffrentes configurations de toiles chez des araignes.
204
160
sciences du comportement ou de la cognition compares, comme on fait de lanatomie compare205. La cognition, au sens large, est un contrle intelligent du comportement en fonction dun mode de prsentation de linformation (de reprsentations ), contrle ralis chez les organismes vivants par un systme nerveux. Un exemple relativement achev dhomologies cognitives est celui des motions206. On peut montrer que certaines motions de bases, les programmes daffects (la peur, la rage, etc.), en raison de leur profil comportemental, cognitif et phylogntique, sont des espces naturelles homologiques. Bien que la peur chez le chimpanz et la peur chez l'humain peuvent avoir diffrentes fonctions adaptatives, tant donn les diffrentes significations que peut avoir le danger pour les humains et les chimpanzs (dtecter un agresseur vs dtecter un prdateur arien vs, par exemple), les procdures de traitement de l'information relatives au danger sont semblables, de mme que les structures neurales qui implmentent ces procdures (Griffiths, 1997: 14-17, 241-247). Si les programmes daffects sont des espces naturelles, la catgorie vernaculaire des motions, elle, ne lest pas : elle englobe autant les programmes daffects que des motions plus complexes et sociales, comme la jalousie ou le dgot: ces dernires ne sont identifiables que par leur substrat neuronal ou leur phylognies, mais aussi par des conditions relatives leur fonction sociale. Il faut donc sparer ces prfrences sociales des programmes daffects207. La mthode homologique-mcaniste-adaptative prsente plus haut peut donc tre adapte au domaine de la cognition. Au premier abord, il semble y avoir une circularit dans la dfinition des traits cognitifs, car ceux-ci sont typiquement dcrits, en neuropsychologie, par un vocabulaire fonctionnel : la fonction dun neurotransmetteur, dune aire, dun type de cellules, dun circuit neuronal, dun hmisphre, etc. Par exemple, la fonction de ces fibres nerveuses [les commissures entre les hmisphres] est de passer de l'information d'un hmisphre crbral l'autre (Andrewes, 2001: 276); la fonction du rflexe d'orientation est d'amener la cible dans le champs de la fovea (le centre) de l'oeil pour permettre l'analyse de la cible (Ibid., 155). Ces catgories, bien que fonctionnelles, demeurent des catgories uniquement descriptives et causales car elles ne font pas rfrence la fonction adaptative. De la sorte, lactivit cognitive telle que dcrite par les neurosciences cognitives ou la neuropsychologie
Lorenz soulignait que la contribution principale de lthologie est que le comportement, comme la morphologie, peuvent tre tudis de faon comparative. Cf (Lorenz, 1992[1973])
205 206
(Damasio, 2003; Griffiths, 1997; LeDoux, 1996; Panksepp, 1998) La question est aborde dans (Griffiths, 2004).
207
161
fournit une explication mcaniste des capacits des systmes nerveux. Par exemple, la carte fonctionnelle de la vision tablie par (Van Essen et al., 1992) explicite le fonctionnement de la capacit quont les primates traiter de linformation visuelle en spcifiant chacun des sous-systmes impliqus. Chaque sous-systme identifi peut lui aussi tre dcompos. On peut alors dire que la comptence visuelle des primates a t en partie explique car on a alors une dcomposition mcaniste de la capacit gnrale traiter de linformation visuelle, qui sous-tend les diffrentes performances de laptitude visuelle. Un exemple assez complet de dcomposition mcaniste en neuroscience est la mmoire spatiale : les connaissances ne sont pas aussi prcises chaque niveau, ni le passage de lun lautre, mais les recherches actuelles donnent une bonne explication mcaniste en 4 niveaux (daprs (Craver, 2002), qui spcifie les entits et activits impliques (chaque niveau est identifi par un couple entit-activit) : au niveau organismique-comportemental, on observe par exemple des souris qui naviguent dans un labyrinthe afin de trouver de la nourriture et qui manifestent une capacit retrouver leur chemin; les souris manifestent une navigation intelligente. au niveau hippocampique-computationnel , on observe le traitement de linformation, lapprentissage, la connectivit de lhippocampe. au niveau synaptique-lectrique, on observe la potentiation long-terme et les configurations neuronales, synaptiques, dendritiques. au niveau molculaire-kintique, on obvserve des activits comme le liage, lattraction ou la phosphorisation par des rcepteurs NMDA, AMPA, etc.
162
Figure 4-5 Dcomposition mcaniste de la mmoire spatiale (Craver 2002)
La dcomposition mcaniste identifie les entits et leurs oprations chaque niveau; on peut par la suite homologiser les traits un niveau en particulier et se demander pour chaque niveau jusquo, dans la phylognie, se retrouve une entit qui performe une opration. Si on choisit le niveau neuronal-hippocampique, on peut fournir une explication tiologique avec des donnes sur le clade mammifre208 (la trajectoire volutionniste) et sur la neurognse (trajectoire dveloppementale). Ce nest quune fois quun trait X 1 est homologis quon peut poser la question de la fonction adaptative de 1 (la peur, la vision ou la mmoire spatiale) pour les membres du clade pour qui 1 est une capacit. Si on dispose dassez dinformation sur lcologie du clade, on pourra alors le partitionner si ncessaire et faire des inductions quant la fonction adaptative de 1 dune des espce du clade une autre. De la sorte, une explication HMA complte consisterait rsoudre le problme suivant :
208
Lhippocampe est prsente chez tous les mammifres (Squire, 1992) .
163
TANT DONNN : un mcanisme M : X1 fait TROUVER : 1) La description dune entit X1 et de ses activits 1 2 3 n.
2) Lidentification du niveau de description de M: gntique, anatomique, comportemental, etc. 3) Lexplication contextuelle de M : comment M interagit avec dautres mcanismes de mme niveau. 4) Lexplication constitutive : la dcomposition mcaniste de M en sous-lments . 5) Lidentification des homologies impliques.
6) Si ncessaire, ritrer (1)-(5) pour les diffrents niveaux dexplication 7) Lexplication tiologique : prciser la filiation des traits identifs et si possible, produire :
8) Une explication adaptationniste : prciser en quoi les traits identifis confrent leur porteur un avantage en terme de survie et reproduction
Le prochain chapitre bauchera une explication de ce genre pour la dcision rationnelle et ses sous-genres. Bien sr, lexplication complte reste venir, mais nos connaissances actuelles nous permettent den esquisser une pour la rationalit animale. 4.3.3 DE LINTERPRTATION LARCHITECTURE
Consquement au schma explicatif prsent ici, on peut affirmer quune stratgie qui serait apte nous fournir une connaissance sur la nature des agents rationnels devrait, idalement, essayer didentifier les structures sous-jacentes responsables des proprits de surfaces (les dcisions) plutt que de tenter de classer le monde biologique en animaux rationnels et non-rationnels sur la base de dfinitions nominales. Cette faon de procder ayant fait le succs des autres domaines du savoir, la philosophie de la rationalit ne peut quen bnficier : si on identifie leau
164
par une structure sous-jacente, pourquoi la rationalit, que plusieurs ont propos de naturaliser, ne serait-elle pas aussi explique par une telle structure ? La mthode propose ici est de type architecturale. Pour les tenants de cette mthode209, le point de dpart est le vivant et son volution plutt que lhumain. On recherche alors les conditions dmergences (pressions slectives, contraintes dveloppementales et morphologiques) des comportements et les processus participant la comptence rationnelle, ainsi que des faits propos des structures neuronales et cognitives qui rendent ces comportements possibles210. Les proprits des agents rationnels ne sont pas conues comme tant relationnelles, mais intrinsques211. Ce quon cherche comprendre,
ce nest pas comment la projection de la rationalit humaine nous aide reconstruire ce que que cela fait [what it is like] dtre un agent non-humain. Il sagit plutt [de comprendre] jusquo dans la phylognie le concept de rationalit peut tre adquatement appliqu (Proust, 2006 op.cit.)
Le prochain chapitre avance lhypothse quon peut appliquer adquatement le concept de rationalit conomique aux vertbrs.
EN RSUM : Pour identifier des traits spcifiques aux agents rationnels, il faut dcomposer les processus qui sous-tendent la comptence rationnelle par une analyse mcaniste plutt que par une analyse tlologique.
209
(Godfrey-Smith, 1996, 2003; Proust, 1997, 2003, 2006; Sterelny, 2001, 2003a, 2003b).
Des faits de cblages (neuronaux) et connections (entre le monde et les organismes qui ont volu (Godfrey-Smith 2003).
210
La conception architecturale dcoule en partie de ladoption dune conception raliste du mental plutt que nominaliste (la conception interprtive, elle, est nominaliste).
211
165
LA RATIONALIT VERTBRE
Nous devons faire une distinction entre les actions des animaux qui sont dune nature vulgaire et semblent tre au niveau de leurs capacits courantes et les cas plus extraordinaires de sagacit quils rvlent parfois pour leur propre conservation et la propagation de leur espce - Hume, Trait, I, xvi
Dans ce chapitre, nous prsenterons lhypothse selon laquelle on peut dfinir une classe naturelle dagents dots dune comptence rationnelle et que cette classe quivaut, dans une mesure scientifiquement pertinente, au clade vertbr. On peut dans un premier temps montrer, grce aux recherches en cologie du comportement, que les proprits de surface des agents rationnels, savoir la prise de dcisions rationnelles, surviennent au moins dans tout ce clade. Nous argumenterons aussi leffet que bien quon puisse dcrire ces comportements en termes de maximisation de laptitude, il serait plus exact de parler dune maximisation de lutilit. Ces performances rationnelles, elles, peuvent tre expliques par une comptence rationnelle, savoir la possession dune architecture de contrle adaptative base de modles. La dcomposition mcaniste de cette comptence fait intervenir des entits homologiques dans tous le clade vertbrs, ce qui justifie la gnralisation de la comptence tout le clade. Nous contrasterons dans un premier temps les deux positions quant la rationalit animale, savoir celle qui considre que seuls lhumain est rationnel, et celle qui considre que les animaux aussi le sont (5.1). La section 5.2 argumentera leffet quon est justifier de dire que les comportements animaux satisfont certains critre pour tre des performances conomiquement rationnelles, alors que la section 5.3 proposera certaines structures aptes sous-tendre cette comptence. 5.1 HUME ET MLLER
la suite des chapitres prcdents, on peut retraduire la question les animaux sont-ils rationnels ? en termes naturalistes: quels clades sont constitus dindividus dots dune architecture de contrle rationnelle ? .
166
La rponse philosophique traditionnelle est daffirmer soit quon peut montrer, en vertu des capacits humaines uniques, que seul lhomme est rationnel, ou encore rtorquer que, par dfinition, la rationalit est ce qui nous distingue de toutes les autres espces. On peut qualifier la premire rplique dexceptionaliste (lhomme est une exception dans la nature) et la seconde dexemptionaliste (lhomme est exempt par dfinition de cette comparaison)212. La seconde se prsente comme un truisme ou un nonc analytique. Bennett par exemple, affirme demble quun foss spare les tre rationnels (nous) et les animaux non-humains, puis poursuit en dcrivant la nature de ceux qui se trouvent du cot rationnel (Bennett, 1971). Ou encore, Aristote, bauchant une classification du vivant, tenait la rationalit pour une proprit essentielle de lhumain. La premire conception peut tre une thse empirique : elle affirme que la catgorie des individus dots dune comptence rationnelle est coextensive avec Homo Sapiens, moins de considrer que tout le clade Homo (le clade de rang suprieur qui inclut des espces fossiles comme neanderthalis et erectus) est le seul rcipiendaire du titre. La conception exemptionaliste est problmatique non pas quant son contenu, mais sa forme : elle refuse demble de traiter cette question comme une question de fait, et la considre plutt comme une question de dfinition. Les arguments par les dfinitions analytiques tant plutt suspects213, il est prfrable de considrer plutt largument exceptionaliste, qui affirme quelque chose propos de nous et des animaux, ce qui peut se traduire en questions de faits et tre dcidable par dautres critres que nos intuitions linguistiques. Largument exceptionaliste standard stipule que certaines capacits telles que passer des conventions, suivre des rgles, effectuer des affirmations quantifies universellement, interprter autrui, etc., dfinissent la nature de la rationalit et que ces capacits dpendent de la matrise du langage, et donc seuls les tres rationnels sont des tres linguistiques. Appelons cette thse le Principe de Mller 214. Autrement dit, selon ce principe, seul un tre linguistique peut, proprement parler, prendre des dcisions rationnelles. Supposons que du
Selon les termes employs en sociologie environnementale et en cologie humaine (Dunlap & Catton, 1979). Voir aussi (Damieson, 1998).
212 213
Voir (Quine, [1951] 1980) par exemple.
En lhonneur du linguiste, philologue et philosophe Max Mller (Mller, 1887) dont la page-titre de son ouvrage The Science of Thought portait laphorisme suivant : No language without reason. No reason without language (la position de Mller suscita de nombreux dbats dans le monde anglo-saxon cette poque).
214
167
langage la rationalit, la conclusion soit bonne, que plusieurs des comportements humains soient des dcisions, stricto sensu. La question de la rationalit animale dpend alors de deux questions : 1. les animaux possdent-ils un langage ? 2. la rationalit est-elle possible sans le langage ? Considrerons que la rponse la premire question est ngative. Nous ne dvelopperons pas un argument pour cela, mais statuerons que le langage est une comptence propre lhumain. Il y a certes de la communication dans le monde animal : les animaux laissent des indices et des traces, mettent des signaux qui sont sources dinformation pour leur congnres, mais il ne possdent pas de systmes sociaux de reprsentations symboliques structures215. On peut distinguer (Hauser et al., 2002) la facult du langage en un sens large (FLSL) et en un sens troit (FLSE). Au sens large, la facult du langage comprend des capacits sensori-motrices pour laudition et lexpression, un systme de reprsentation conceptuelles et une facult du langage au sens troit (FLSE). Cette dernire est un systme rcursif qui peut gnrer une infinit discrte de squences syntaxiques et les apparier aux capacits sensori-motrices et aux reprsentation conceptuelles. Si lon peut retrouver des formes de la FLSL chez certains animaux, la FLSE est typiquement humaine. Que ce soit comme facult de manipuler des signes, comme extension de la pense ou comme mdium de communication, le langage demande certaines prdispositions mentales, comme des attentes quant aux intentions du locuteur quon ne retrouve pas chez lanimal, dont les formes connues de communication fonctionnent en un mode plus direct dexpression (Hauser, 1996). Nous dbattrons en revanche de la deuxime question. Son issue est cruciale pour la question plus gnrale de la rationalit animale. La philosophie du langage et de lesprit saccordent gnralement pour rpondre par la ngative. Les tres linguistitiques et les agents rationnels sont alors des catgories co-extensives. Les animaux non humains (ciaprs, animaux tout court) ne sont pas considrs comme des agents rationnels parce quils ne possdent pas de langage. On peut rappeler toutefois que dautres philosophes, moins nombreux, se sont aventurs endosser une thse continuiste et ont affirm que des animaux non humains aussi sont rationnels216. Certains
215
voir Proust (2003) pour une prsentation dtaille de cette question.
Voir (Floridi, 1997; Fontenay, 1998; Labarrire, 2000; Sorabji, 1996) pour lhistoire de ces questions et (Proust, 1997, 2003) pour un traitement moderne de la question de lintelligence animale.
216
168
ont parl de lintelligence des btes, sans se commettre parler de rationalit. Hume est sans doute celui qui a affirm avec le plus de vhmence que les animaux sont rationnels dans des chapitres, relativement identiques, au titre non quivoque : La raison des animaux 217. Un des principaux arguments de Hume est celui de lapprentissage et de linfrence. Hume affirme premirement que les animaux, comme nous, sont capables dapprendre que par exemple, une cause X sera suivie dun effet Y. Une preuve cet effet, selon Hume, est lexprience acquise par les animaux, comme le cheval qui sait quelle hauteur sauter, ou encore le chien qui apprend quun geste signifie une punition physique. Ensuite, comme les animaux sont capables dapprendre, ils peuvent utiliser cette exprience : lorsque X survient, lanimal infre que Y suivra. Croire que X entrane Y provient seulement de lexprience perceptive de leur conscution et de linfrence qui porte lesprit de la cause leffet. On pourrait rpliquer que cela est ingnieux, mais rien qui ne soit rellement rationnel. Or justement, rplique Hume, la pense n'est rien d'autre qu'une espce d'instinct ou de pouvoir mcanique qui agit en nous notre insu (Enqute). La rationalit est le produit de mcanismes non dlibratifs. Lhomme et lanimal partagent cette mme capacit inductive quils mettent en application lorsquils infrent du peru au non-peru. Hume termine largument en affirmant que cette capacit est un principe de la nature et [qu] elle tire toute sa force de cette origine (Trait). Largument de lapprentissage et de linfrence (Hume considre que la croyance, limagination et linfrence sont des oprations mentales identiques) est au final justifi par un argument sur les dispositions naturelles des tre vivants. Le problme avec des positions continuistes comme celle de Hume et exceptionalistes comme celle de Mller est quon tombe vite dans un dbat de sourds. Les premiers parlent de la rationalit comme une capacit sensorimotrice et adaptative, alors que les seconds en font une capacit linguistique articuler des raisons . Il est plus probable quen fait, chacun parle dun sujet diffrent, et que lusage souvent mal dfini des termes rationnel, rationalit, entranent des confusions. Pour viter ce genre dincomprhensions, nous reprendrons ici les catgories dfinies au premier chapitre pour distinguer deux concepts de rationalit: la rationalit conomique, savoir la capacit maximiser son utilit par des dcisions, interactions ou changes, et la rationalit thorique, la capacit maximiser la vrit par le raisonnement, la mise jour des croyances, etc. Pour viter les incomprhensions, considrons que largument exceptionaliste dfinit trs bien ce quest un tre thoriquement rationnel,
Enqute sur l'entendement humain (Hume, [1748] 1983: ch. 9) Trait de la nature humaine (Hume, [1739] 1946: Livre I, partie III, section 16). Les deux chapitres ont le mme titre. Voir (Beauchamp, 1999) pour une discussion sur Hume.
217
169
et en cela la question de la rationalit thorique animale est dote de peu dintrt. La question de la rationalit conomique animale, en revanche, est philosophiquement (et scientiquement) plus intressante. Dans son ensemble, largument de Hume sur lapprentissage, linfrence et la nature correspond largument qui est propos ici : tant donn les rquisits pour tre un agent conomiquement rationnel, certains animaux, comme nous, sont dots de larchitecture de contrle ncessaire cet effet. Notre argument consistera montrer quune large classe despces vertbres sont dotes des proprits prsentes comme tant propres aux architectures de contrles rationnelles. Il ne sagit donc pas daffirmer quil ny a pas de diffrences entre notre espce et les autres, ni de montrer que nous somme peine plus rationnels . Le modle prsent ici est celui dun agent conomique minimalement rationnel, qui prtend dlimiter une espce naturelles historique assez homogne pour rassembler un agrgat de proprits qui tendent tre partages par les membres de cette classe. De la sorte, en reconnaissant lunit de cette classe, on en fait une catgorie apte supporter un ensemble de prdictions, dinductions et de gnralisations. Le seul continuisme qui est support ici concerne lconomie, et non la logique. Rien dans ce qui est prsent ne justifie une rduction de la cognition humaine une forme plus simple. Au contraire, la cognition humaine apparat encore plus riche lorsquon est en mesure deffectuer des comparaisons claires.
EN RSUM : la question de la rationalit animale est plus pertinente si on vacue la question du langage.
5.2
ANIMALIS ECONOMICUS. ANIMAUX
LES
PERFORMANCES RATIONNELLES DES
Un argument rcurrent en philosophie nie la possibilit que des animaux effectuent des dcisions rationnelles car, la diffrence de lhumain, leur comportement est une raction adaptative aux contingences de lenvironnement, alors que lhumain peut anticiper les consquences de ses actes. Davidson (D. Davidson, 1991) par exemple, reconnat que des animaux peuvent apprendre des ractions diffrencies des classes de stimuli, ou ragir des nouveaux stimuli de faon similaire aux stimuli antrieurs, sans plus; ils ne peuvent avoir une reprsentation du contraste entre une anticipation et la ralit. Dans le mme ordre dides, Gert (Gert, 2004: 216-217) voque limpossibilit des animaux faire des erreurs, faire des choix qui pourront tre valus comme tant rationnels ou irrationnels, bons ou mauvais , ainsi que nous le faisons quotidiennement lorsque nous valuons nos choix et ceux des autres; les
170
animaux nauraient pas la capacit danticiper des choix. Searle (Searle, 2001) distingue les dcisions humaines des dcisions animales en ce que les premires peuvent tre le rsultat de choix entre des fins conflictuelles ou incompatibles. Ces propos ont deux consquences empiriques propos de la comptence rationnelle: 1) les animaux nauraient pas la capacit prendre des dcisions de faon flexible et prdictive et 2) notre capacit prendre ces dcisions relvent de capacits ou de mcanismes dont nous sommes les seuls hritiers. Or on peut montrer que, comme thses empiriques, ces deux prsuppositions exceptionalistes sont difficilement acceptables. Tout dabord, en un sens non trivial, des animaux maximisent leur utilit, (section 5.2.1-3) et cette maximisation de lutilit ne se rduit pas une maximisation de laptitude; nous prsenterons plus loin une analyse de la similarit et la distinction entre ces deux concepts (5.2.4). Dans la section 5.3 . nous suggrerons que cette comptence rationnelle relve de mcanismes et de structures qui ne sont pas uniques notre espce.
5.2.1 UN ANIMAL PEUT-IL PRENDRE DES DCISIONS ? La capacit prendre des dcisions, affirme lexceptionaliste, est humaine. Certes les animaux non-humains agissent , mais comme ils nont pas de langage, ils ne peuvent avoir dattitudes propositionnelles; il leur est donc impossible dtre rationnels. Leur comportement peut sexpliquer par des patrons de comportements inns, du conditionnement et de lhabituation, des mcanismes qui ne sont indpendants de la possession du langage. Lexceptionaliste peut ajouter aussi dautres critres, comme la capacit justifier ou expliciter les raisons de son action; la capacit attribuer des attitudes propositionnelles dautres agents, etc, mais la structure de largument reste la mme. On peut par exemple court-circuiter lide dune rationalit animale en faisant intervenir un argument relativement simple : les animaux ne prennent pas de dcisions, ne font pas de choix, ils agissent seulement par la disposition de leurs organes (Descartes, Discours de la mthode, V). Largument classique va comme suit218 : (1) On ne peut choisir C si on est dtermin ne faire quune seule chose219.
218
Thomas dAquin offre un argument semblable, (voir la Somme, II, I, 1)(D'Aquin, [1273] 1984). Notons que cette distinction est au cur de la logique de laction de (Belnap et al., 2001).
219
171
(2)
Pour choisir C, il faut satisfaire ses dsirs par un discernement des moyens, soit les options possibles (C, C, C, etc.). Un animal semble prfrer C C parce que son instinct le dtermine prfrer C. Donc, un animal ne choisit pas C, mais suit le cours de ses instincts.
(3) (4)
Aussi, lorquun animal est attir par quelque chose, il sy porte sans avoir choisir, la manire du feu qui, sans faire aucun choix, monte et ne descend pas (D'Aquin, [1273] 1984: II, I, 13, 12). Comme un automate qui effectue toujours la mme action lorsque stimul, les comportements animaux ne sexpliqueraient que par des instincts, des rflexes ou en termes contemporains, par des gnrateurs centraux de p a t r o n s (central pattern generator , GCP) fonctionnant mme en labsence dentres sensorielles. Un GCP est un circuit neuronal qui produit des commandes motrices pour des mouvements rythmiques comme la locomotion, qui peut fonctionner mme lorquil est isol des appareils sensoriels et moteurs (Grillner & Wallen, 1985). Sans tomber dans un dbat sur le libre-arbitre, on peut affirmer que les animaux, mme trs simples, sont aptes prendre des dcisions tout court (nous traiterons plus loin des dcisions rationnelles). En effet, un animal, en tant que systme non-ergodique, est capable de diriger sa dynamique despace dtats vers des attracteurs qui lui sont avantageux, savoir son bassin de viabilit. On peut par exemple construire un espace dtats pour la navigation dun animal simple 220 comme le homard Homanus Americanus.221 On peut construire un espace dtats de lorganisme pour 3 variables vitales : temprature, oxygne et salinit. Si une trajectoire le mne dans un tat A o la salinit est trop faible, le taux doxygne et la temprature trop leve, un mcanisme de contrle ayant mesur (ou prvu une future mesure de) cet tat, une commande doit tre envoye pour replacer la trajectoire dans la zone viable. En revanche, sil est en un tat comme B, rien ne loblige modifier son tat. La femelle serpent qui choisit de saccoupler avec le mle vainqueur dun combat (Shine et al., 1981) plutt quavec son adversaire rvle une prfrence pour ce mle en particulier, pour les mles qui auront dfait les
Il faut rappeler que tous les organismes vivants sont aussi volus (Lecointre & Le Guyader, 2001).
220 221
Lexemple est adapt de (McFarland & Houston, 1981: 217)
172
autres prtendants ou encore pour les mles qui mettent des signaux coteux222 : peu importe linterprtation que le biologiste lui donnera, le comportement sera tenu pour tre le symptme de prfrences.
Figure 5-1 Espace dtats de la navigation chez le homard Homanus Americanus
5.2.2 DES ANIMAUX MAXIMISATEURS DUTILIT On peut admettre que des animaux prennent des dcisions, mais ces dcisions, pour tre rationnelles, doivent littralement maximiser une fonction dutilit : autrement dit, la description de lanimal comme maximisateur ne doit pas tre un artefact de linterprtation du comportement, mais une proprit relle du comportement et des mcanismes qui en sont responsables. La maximisation de lutilit est une des hypothses de base de lcologie comportementale223 (ou volutionniste), la branche de la biologie qui tudie le comportement adaptatif des animaux. Suite aux pressions volutionnistes, la slection naturelle cre les individus qui tendent tre performants dans la survie et la reproduction : performant dans la recherche de nourriture, de partenaires, dans lvitement de prdateurs, la slection dhabitat, etc, en bref, de meilleurs dcideurs. Les fondateurs de lcologie du comportement, MacArthur et Pianka (MacArthur & Pianka, 1966), proposaient dtudier la recherche de
Dans plusieurs cas, mettre un signal coteux est gage dhonntet : lanimal manifeste sa force ou ses capacits en mettant un signal quun autre, moins dou, ne pourrait mettre (Zahavi & Zahavi, 1997).
222
(Alcock, 1989; Krebs, 1991; Krebs & Davies, 1993, 1997; McFarland, 1999; Pianka, 2000; Stephens & Krebs, 1986).
223
173
ressources nutritives, ou fourragement (foraging) par les animaux en se demandant :

dans quelles zones une espce se nourrirait et quels items formeraient sa dite si lespce agissait de faon entirement conomique ( the most economic fashion ) (MacArthur & Pianka, 1966: 603)
Ainsi, les animaux sont modliss comme tant des fourrageurs optimaux (Stephens & Krebs, 1986). laide de la thorie de loptimisation et des connaissances sur lcologie dune espce, on essaie didentifier les objectifs et contraintes de lanimal dans sa qute de nourriture. On en dduit un modle algorithmique, soit un ensemble de rgles de dcisions qui maximiseraient lefficacit de lanimal dans sa tche. Ces rgles permettent alors de prdire le comportement, lequel peut valider ou invalider la rgle postule. La thorie articule donc, dans le mme esprit que le modle ingnirique prsent plus haut, des principes gnraux, des modles mcanistes de lagent et son environnement ainsi que des tudes descriptives : la dcision optimale nest pas celle qui se conforme directement aux axiomes des thories de la rationalit, mais celle qui se conforme un modle computationnel driv dun ensemble de connaissances sur lcologie de lanimal et sa constitution physique. Un modle de fourragement incorpore donc des agents, leurs choix possibles, la devise maximiser, la plupart du temps le gain calorique et un ensemble de contraintes intrinsques ou extrinsques lagent. Les dcisions tudies sont gnralement le choix dune zone de fourragement (patch), le choix dune proie ou le temps optimal allou lexploration dune zone. Ainsi on ne suppose pas que lanimal ragit de faon automatique des stimulis qui indiqueraient la prsence de nourriture, mais plutt quil prend une squence de dcisions afin de rsoudre un problme doptimisation conomique. Lanimal la recherche de nutriments doit maximiser le nombre de calories ingres, compte tenu de celles quil dpense rechercher et capturer sa proie; ce problme sajoutent aussi la frquence de rencontre de la proie, le temps consacr la recherche et les calories que peuvent lui apporter sa proie. Aussi pour prdire le choix dune proie, on reprsente par exemple les variables suivantes : (1) (2) (3) (4) (5) (6) P: Probabilit d'attaque de la proie : frquence de rencontre de la proie E: l'nergie nette acquise avec la proie A : temps moyen de l'attaque r: nergie dpense chercher Tr: temps de la recherche
174
(7)
R: taux de rendement nergtique
Pour chaque type de proie i accessibles lanimal, on calcule esprance d'nergie attendue : Pi x i x E i De laquelle on soustrait le cot de l'attaque : Pi x i x Ai
On peut alors mettre en quation le taux de rendement nergtique pour les diffrents types de proie et, partir de ces quations et laide de techniques comme la programmation dynamique, on drive des algorithmes quun fourrageur optimal devrait implmenter pour optimiser la fonction objectif (lequel sert ensuite la prdiction du comportement) :
Figure 5-2 Algorithme simplifi de fourragement, daprs (McFarland, 1999)
Le problme nest pas trivial, car le fourragement dun territoire est formellement analogue au problme du voyageur de commerce (D. J. Anderson, 1983a). Dans ce problme224 , un voyageur de commerce doit parcourir un nombre dtermin de villes; tant donn que lentreprise qui lembauche lui donne un budget rduit pour payer ses dplacements, comment peut-il passer par chacune des villes et revenir son point de dpart en faisant le moins de kilomtrage possible et en ne passant quune fois par chacune des villes ? Il y a plusieurs solutions possibles, mais
224
Voir chapitre 2, section 2.2.5.
175
certaines seront plus coteuses que dautres car plus longues. Or ce problme est NP-complet. Les animaux, pour un fourragement optimal, doivent tre en mesure de ngocier un problme de cette complexit. On a pu montrer que des rats et des singes225 peuvent rsoudre le problme lorsquon construit artificiellement une situation qui exige la rsolution du problme. De mme lallocation optimale de lchantillonage entre deux sources incertaines de nourriture, quivalente au problme du bandit kbras est rsolue par des msanges lorsquon leur prsente deux sources de nourriture variables (Krebs et al., 1978). Face des problmes conomiques complexes, les animaux dmontrent la posession de procdures simples et efficaces, tel point que les algorithmes dvelopps en cologie du comportement ont pu tre utilis en intelligence artificielle pour trouver des solutions simples au voyageur de commerce (Linhares, 1998). De faon gnrale, toutefois, ce sont les performances des fourrageurs en milieu naturel qui dmontrent les vertus prdictives et explicatives de lhypothse maximisatrice226. Elle prdit par exemple larbitrage entre la dfense du territoire et le fourragement chez des tourneaux (Kacelnik et al., 1981) et larbitrage entre le chant et le fourragement chez les msanges charbonnires (Thomas, 1999), explique les diffrences comportementales entre le fourragement chez des oiseaux vivant dans le dsert (risque de prdation plus lev et difficults daccs aux ressources) et les oiseaux urbains (Shochat et al., 2004), la modulation, chez les rats, du temps allou lingestion de nourriture en fonction de la luminosit et de leur visibilit (ils mangeront plus vite dans un environnement lumineux o ils peuvent tre facilement visibles) (Whishaw et al., 1992) ou encore pourquoi des oiseaux hutrier prfrent des hutres coquilles brunes plutt que noires, alors que les deux sont identiques en nergie et en paisseur : les brunes contiennent moins dhumidit, et donc en les slectionnant les hutriers maximisent leur gain dnergie long-terme (lhumidit fait en sorte que les hutres occupent plus de place dans lestomac de loiseau) (Nagarajan et al., 2002). Dans leur mta-analyse, Sih et Christensen (Sih & Christensen, 2001) ont revu 134 tudes (en laboratoire et en contexte naturel, exprimentales ou observationnelles) de fourragement, et en concluent que, bien que le succs prdictif ne soit pas parfait, la thorie est efficace selon le type de proie que recherche le fourrageur. Lorsque la proie est en
Voir (Bures et al., 1992) et (Cramer & Gallistel, 1997; Gallistel & Cramer, 1996). Le problme a aussi t soumis sous forme perceptive des humains (MacGregor & Ormerod, 1996; Van Rooij et al., 2003).
225
Voir (Kamil et al., 1987; Kamil et al., 1981; Krebs & Davies, 1997; Stephens & Krebs, 1986) ou la revue Behavioural Ecology (Oxford University Press).
226
176
mouvement, la prdictivit chute 37%; en revanche, lorsque la proie (la proie peut tre une plante, des graines, du miel, etc.) est immobile, prs de 74% des tudes russisent prdire le comportement. On peut cependant expliquer cette diffrence importante par lordre de rationalit impliqu: lorque la proie est mobile, lindividu est en situation de dcision stratgique plutt que paramtrique, et donc la thorie des jeux227 est plus approprie que la thorie du fourragement optimale, qui est en fait une thorie de la dcision squentielle. 5.2.3 RATIONALIT STRATGIQUE ET SOCIALE ANIMALE Le succs dun prdateur la recherche de proies mobiles ne dpend donc pas que de ses dcisions, mais aussi de celles de sa proie. De mme, lorsque le fourrageur est la recherche dune proie, il peut lui aussi tre la proie dun autre fourrageur. Les fourrageurs sensibles aux prdateurs doivent donc adapter leur stratgie en fonction du risque, ce qui devrait affecter les variables de dcisions. Par exemple, pour les gerboises G. allenbyi et G. pyramidum, le clair de lune est un indice de la prsence de chouettes prdatrices (Kotler, 1997). Les gerboises doivent effectuer des compromis entre le fourragement, lvitement de prdateur, linspection de prdateur, la fuite, leffort reproductif ou la cueillette dinformation. Kotler a montr que le comportement de fourragement des gerboises sadapte au risque de prdation : plus la luminosit lunaire est intense, plus le fourragement est limit et discret. En revanche, si la quantit de nourriture est augmente (par les exprimentateurs) dans lenvironnement, les gerboises rechercheront plus de nourriture, en explorant moins longtemps des zones plus riches en nourriture. Des interaction stratgiques surviennent aussi entre les membres dune mme espce. Une autre mta-analyse (Gurevitch et al., 2000) confirme que, chez les vertbrs, la comptition intraspcifique est un dterminant du fourragement au moins, sinon plus, important que la prdation : toutes les tudes constatent que la comptition pour laccs aux ressources est tempre par la prsence de prdateurs, alors quelle augmente en leur absence. Aussi les contextes interactifs relvent-t-ils de la rationalit stratgique et de la thorie des jeux, qui a t principalement applique au fourragement social (Hansen, 1986) et aux relations prdateurs-proies (Lima, 2002)228. Un modle de Vickery et al. (Vickery et al., 1991) prdit que la cooccurrence de trois stratgies de fourragement en contexte social, PRODUCTEUR (qui amasse des nutriments) CHAPARDEUR (qui vole le butin
227
Voir (Dugatkin & Reeve, 1998; Giraldeau & Caraco, 2000). Voir aussi (Roughgarden et al., 2006) pour la slection de partenaire sexuels.
228
177
du premier) et OPPORTUNISTE (producteur et chapardeur en alternance) survient rarement (seulement dans le cas peu probable ou la perte que l'opportuniste encourrait en cherchant est exactement quivalente son gain s'il chapardait ses conspcifiques) bien que des distributions de paires de stratgies sont possibles : elles constituent des stratgies volutionnairement stables (SES). La proportion de zones partages par les chapardeurs, la taille du groupe et le degr de compatibilit entre l'activit chapardeuse et productive (par exemple s'il est facile pour l'animal de performer les deux activits) dterminent la rpartition des stratgies dans une population, ce qui a t par la suite confirm entre autres chez des oiseaux (Conchura punctulata, ou capucins damiers) (Mottley & Giraldeau, 2000). Tel que prdit par le modle, les capucins rduisent lutilisation de la stratgie PRODUCTEUR lorsque le cot du fourragement individuel augmente. La rationalit sociale trouve aussi son application en cologie du comportement, en particulier dans la thorie des marchs biologiques229. videmment, les marchs animaux nont pas de monnaies symboliques et conventionnelles230, mais de nombreuses interactions entre animaux instituent des structures dchanges. Ds quune population dchangeurs est en mesure de fournir des commodits en vue dun profit mutuel, la comptition pour lobtention de la commodit cre une surenchre. Les animaux qui maximisent leur utilit recherchent et slectionnent des partenaires selon le principe de loffre et la demande, qui sapplique dans des domaines aussi varis que le mutualisme interspcifique231, la slection sexuelle ou la coopration intraspcifique. Pour les babouins Papio cynocephalus ursinus, pouvoir samuser avec des nourrissons constitue une commodit : les adultes cherchent y avoir accs en changeant la compagnie des jeunes en change dpouillage. Plus les enfants sont rares, plus les femelles doivent pouiller pour y avoir accs (Henzi & Barrett, 2002) et inversement. De mme, la femelle de la souris Apodemus sylvaticus change du toilettage contre de linformation sur sa fertilit : plus une femelle souris est disponible pour la reproduction, plus elle exige de toilettage en change (Stopka & Macdonald, 1999). Finalement, dans le domaine de la coopration intraspcifique, les
229
(No & Hammerstein, 1995; No et al., 2001).
Des reconstitutions en laboratoire montrent que des singes capucins (K. Chen et al., 2006) lorsquils apprennent utiliser une monnaie de singe , changent celle-ci contre de la nourriture en montrant des prfrences cohrentes, de mme quune aversion aux pertes. Ce contexte nest toutefois pas cologiquement valide, tant donn que les primates nont pas de systme montaire, mais montre quand mme que lacquisition de comptence changer ne requiert pas la passation de conventions verbalisables.
230 231
Voir (Schwartz & Hoeksema, 1998).
178
poissons Hipposcarus harid et les poissons-nettoyeurs Labroides dimidiatus instituent un march du nettoyage : les clients utilisent les services des nettoyeurs pour se faire enlever des parasites qui les importunent, alors que les nettoyeurs, loccasion, trichent et se nourrissent des tissus sains des clients. Comme les nettoyeurs offre un service qui ne peut tre trouv ailleurs, ces derniers bnficient dun certain avantage conomique. Un client na pas le choix dtre exploit ou non, alors que le nettoyeur choisit de cooprer ou non. Les clients, des prdateurs qui pourraient manger les nettoyeurs, sabstiennent de le faire dans la grande majorit des cas, tant donn lavantage rciproque. Bshary et Schaffer ont aussi observ que les nettoyeurs soignent plus les clients de passage que les rguliers et comptitionnent entre eux pour les clients occasionnels, plus faciles exploiter (Bshary & Schaffer, 2002). Lcologie du comportement abonde dtudes qui, plutt que de considrer les animaux non humains uniquement comme des units monadiques dune population, en font des agents qui prennent des dcisions, interagissent et ngocient, en prdisant et expliquant leur comportement avec les mmes outils thoriques que la microconomie232, mme si, comme le disait Adam Smith,
On n'a jamais vu de chien faire, de propos dlibr, l'change d'un os avec un autre chien. On n'a jamais vu d'animal chercher faire entendre un autre, par sa voix ou ses gestes : ceci est moi, cela est vous ; je vous donnerai l'un pour l'autre (A. Smith, [1776]1991: I, ii, 30).
On pourrait bien sr reformuler chacune de ces expriences, et mettre les mots dcision ou change entre guillemets pour signifier que lemploi du terme est uniquement instrumental, que ce ne sont que des faons de parler et quau fond il ny pas vraiment de dcisions et dchanges, mais plutt des comportement instinctifs prservs par la slection naturelle. Si tel est le cas, il faudra alors mettre des guillemets lorsquon parlera de ltre humain : lcologie du comportement humain, appliquant la mme logique conomique et biologique, en arrive des prdictions aussi robustes que lcologie du comportement animal nonhumain233. On modlise les agents comme des fourrageurs optimaux sous
Notons toutefois que dans chaque ordre de rationalit, les modles ont du accomoder la rationalit limite des animaux : les effets de cadrages et daversion au risque (Marsh & Kacelnik, 2002), la possibilit dattracteurs cahotiques dans des jeux, limitant la possiblit de SES (M. A. Nowak & Sigmund, 2004) et les marchs biologiques ne se vident pas, il demeure toujours un excdant doffre ou de demande (Hammerstein & Hagen, 2005). Ces rvisions nont toutefois jamais mis en danger les hypothses de bases de lcologie du comportement (le niveau des principes gnraux), mais plutt la reprsentation des agents (le niveau des modles).
232 233
(E. A. Smith, 1991a; Winterhalder & Smith, 2000).
179
leffet dune multitude de contraintes, on identifie les ressources disponibles dans lenvironnement dune collectivit, et on gnre un modle qui prdit lallocation optimale de ressources dans la collecte de nourriture. Les modles sont bien sr plus complexes en ce quils intgrent des paramtres sociaux comme les coutumes, la technologie ou les structures conomiques locales, mais dans lensemble, lcologie du comportement humain sest rvle plus prdictive que la microconomie classique. En incluant l'anciennet du lieu d'tablissement, la distance parcourir et la technologie utilise par 3 tribus damazonie, un modle de fourragement optimal (Hames & Vickers, 1982) prdit la diffrence dans le style de fourragement. Dautres modles incorporent des relations sociales comme le partage de nourriture (Kaplan et al., 1984) ou encore la division du travail entre hommes et femmes (Jochim, 1988), les cultures agricoles jusqu la recherche dinformation sur internet (Pirolli & Card, 1999), o la denre recherche est de linformation. Une critique pertinente survient toutefois. Lcologie du comportement considre gnralement que les animaux quelle tudie maximisent leur aptitudes plutt que leur utilit. Or bien que lemploi dun terme ou de lautre ne soit pas problmatique pour lcologiste, il peut ltre dun point de vue gnral, car les implications ne sont identiques. En caractrisant bien lun et lautre, toutefois, ont voit quil est plus juste de parler de maximisation de lutilit, au moins dans certains cas.
5.2.4 UTILIT VS APTITUDE Lvolution darwinienne est un processus doptimisation stochastique et combinatoire lchelle dune population. Lorsque la population comporte les proprits suivantes : reproduction, hrdit et variation, leffet conjoint des mutations, des recombinaisons (crossover), des drives gntiques et de la slection naturelle fait en sorte que, la longue, dans un environnement o une population en croissance exponentielle ayant accs des ressources qui ne suivent quune expansion algbrique,234 les gnotypes ayant hrit de variations avantageuses (plus aptes procurer des ressources pour survivre et transmettre leur gnes) verront leur nombre crotre dans la population. Lvolution est un algorithme doptimisation qui gnre diffrents gnotypes qui doivent passer le test de la survie et de la reproduction; laptitude reprsente la propension dun gne se rpandre dans une population, laquelle est mesure par la progniture moyenne dun individu dot du gne,
234
Les taux de croisssances ne sont pas des mesures exactes, mais des approximations pratiques.
180
relativement la progniture moyenne de la population (Ridley, 2004: 74) ; elle est donc la fonction objectif de lvolution235. En gnral, les cologistes du comportement tiennent pour acquis le caractre maximisateur des organismes individuels, de mme que lexplication volutionniste de lhypothse de maximisation. Ces thses doivent toutefois tre justifies, moins quon considre que lhypothse selon laquelle les produits de lvolution soient des agents optimisateurs est une thse a priori ou analytique, comme ont pu lavancs Dennett ou Popper. Or on peut montrer que la slection naturelle fait en sorte que les organismes soient des maximisateurs daptitude. Dans une srie de travaux formels, Grafen236 dmontre quon peut driver le principe de maximisation individuelle de la valeur daptitude (inclusive237 ou non) de la gntique des populations. Toute population soumise au rgime de slection contiendra des lments maximisateurs. De la sorte, lhypothse maximisatrice nest pas un postulat a priori. Maximiser son aptitude nest toutefois pas identique maximiser son utilit. Si lutilit et la valeur daptitude sont des analogues formels (chacune est un critre synthtique doptimisation), elles diffrent sous plusieurs aspects : (i) Toute forme de vie, plante, animal ou microbe agit de sorte maximiser son aptitude en recherchant assurer sa survie et sa reproduction. Or un animal peut en effet maximiser son utilit sans maximiser son aptitude si par exemple il dveloppe un got prononc pour des situations dangereuses.
Bien sr, affimer que lvolution est procesus doptimisation a eu de nombreuses critiques (Gould & Lewontin, 1979). On reproche souvent ladaptationnisme une vision Panglossienne de lvolution, laquelle ferait en sorte que tout soit pour le mieux dans le meilleur des mondes. La critique de Gould et Lewontin vise les adaptationnistes qui font de lvolution un agent optimisateur (Ibid. 581). Or cette fausse reprsentation vacue la possibilit que cette optimisation soit en fait dpendante du chemin, distribue dans la population, et que son caractre stochastique et combinatoire explique trs bien pourquoi plusieurs proprits des organismes vivants ne sont pas optimaux. Tout comme une automobile qui ne fonctionne pas plein rendement est encore une automobile, un processus doptimisation qui ne produit pas des solutions optimales ou parfaites est encore un processus doptimisation.
235 236
(Grafen, 1999, 2002, 2006) ainsi que (Cooper, 2001).
La valeur daptitude inclusive (inclusive fitness) est maximise lorsquun individu alloue de lnergie, du temps ou du risque pour prserver ses descendants ou sa parentle : ce faisant, il participe la reproduction de ses gnes, car sa parentle est dote en partie des mmes gnes que lui. En aidant un congnre, lindividu maximise donc sa propre valeur daptitude et prserve ses gnes.
237
181
(ii)
La maximisation de laptitude peut tre effectue grce des mcanismes qui ne doivent rien lapprentissage ou la dtection de lincertitude, deux des conditions de la maximisation de lutilit telle que dfinie plus haut. Lagent qui maximise son utilit ne va pas systmatiquement voir ses gnes se multiplier dans la population, alors que, par dfinition, ce sera le cas pour laptitude. Dans la maximisation de lutilit, la devise commune doit tre endogne lagent : certains dispositifs internes doivent valuer lutilit relative dun comportement, alors que la maximisation de laptitude na pas tre value par lagent. Chacune est une fonction objectif de problmes diffrentes chelle de temps et despace : laptitude est une optimisation distribue dans une population qui se dploie tout au cours de la vie des individus, alors que lutilit concerne les dcisions ou des squences de dcisions en temps rel.
(iii)
(iv)
(v)
En vertu des distinctions prsentes ici entre aptitude et utilit, nous utiliserons plutt le concept dutilit pour parler du comportement maximisateur en cologie du comportement. Lorsquun cologiste tudie les stratgies dune espce pour amasser le plus de calories dans un laps de temps optimal, on peut dire que les membres de lespces agissent en faveur de leur survie et reproduction; cependant, il serait plus juste de considrer que lanimal affam cherche en premier lieu maximiser son utilit car il guide son comportement de faon satisfaire des besoins. La fonction objectif dterminante dans son processus doptimisation est une fonction individuelle. Traduire laptitude en utilit nest pas un problme pour lcologie du comportement, tant donn que ces termes appartiennent plus linterprtation des modles cologiques quaux modles eux-mmes, aussi lemploi du vocabulaire conomique ne change rien la validit de ces recherches. Notons de plus que la thorie cologique fait un usage explicite des thories et mthodes de lconomie. McFarland (McFarland, 1999) toutefois, parle plutt dune fonction de cot plutt que dune fonction daptitude : maximiser le rendement nergtique est effectivement une prise de dcision squentielle qui sapparente plus au calcul conomique quau calcul de la survie et la reproduction. Aptitude et utilit ne sont pas indpendantes lune de lautre, bien quelles puissent ltre : un animal qui maximise sa fonction dutilit aura plus de chance de transmettre ces gnes quun conspcifique nonoptimisateur, qui doit pourtant tre conu comme un maximisateur daptitude, tant donne que ce prdicat sapplique toutes les formes de
182
vie. Pour dfinir le lien entre les deux, on peut considrer que la maximisation de lutilit est une forme de maximisation de laptitude qui aurait t dlgue aux individus. On peut parler alors de lutilit comme une valeur daptitude subjective. Par subjectif, il faut comprendre non pas que laptitude est ressentie ou perue consciemment, ni que le bagage gntique naura aucune influence, mais simplement le fait que lanimal a la capacit dtre inform des propensions quauront, selon sa perspective, certaines entits, rgularits ou proprits de son environnement lui tre utile, ce qui au final participe son aptitude. Prenons le cas de la nourriture, abord plus haut : se nourrir participe la survie et la reproduction de lindividu. Les denres quun animal peut trouver ne sont pas galement comestibles ni galement nourrissantes. Pour se nourrir de faon optimale, il doit pouvoir choisir les ressources qui maximisent le nombre de calories. Avoir des prfrences pour un certain type de nourriture (riche en protines ou en sucre par exemple) lui donne une longeur davance sur ses rivaux, tout comme tre attir par de potentiels partenaires sexuels. Si des mcanismes lui font prfrer une ressource A, trs nutritive, une ressources B, moins nutritive, alors quun autre individu est indiffrent entre les deux, le premier individu courre la chance davoir une descendance plus nombreuse que le second car il y a plus de chances quil dveloppe une attirance pour A. Or si lanimal est efficace dans sa recherche de nourriture, la cause proximale nest pas la maximisation de laptitude, mais des mcanismes neuronaux qui dirigent son comportement en fonction de linformation disponible. Pour dpartager ce qui relve de lutilit et de laptitude tout en expliquant la connexion entre les deux, on peut considrer la maximisation de laptitude comme une proprit multiplement ralisable, dont une des bases de survenance est la maximisation de lutilit (un organisme vivant comme une plante peut la raliser autrement). Un organisme, comme entit capable dagir, maximise son aptitude par des statgies dhistoires de vie et maximise son utilit par son comportement. Une stratgie dhistoire de vie238 (cf. SHV ci-aprs), est un ensemble de traits (morphologique, physiologiques, comportemental) dots dune propension rsoudre un compromis optimal dallocation des ressources entre la survie, la croissance et la reproduction239. Par exemple,
238
Voir (Stearns, 1992; Yampolsky, 2001).
Fait noter, les expressions dcision et stratgies sont utilises, ici comme en cologie du comportement, comme des raccourcis pour parler des diffrentes opportunits dhistoire de vie possibles quune espce peut explorer au cours de lvolution en temps cologique. Les plantes et les arbres aussi ont des SHV. Lcologie du comportement ne requiert pas que les organismes soit conscients des raisons ultimes de leur trait. Si un bb coucou pouvait dire pourquoi il jette les ufs
239
183
les populations de poissons Poecilia reticulata observes par Reznick (Reznick et al., 1997) atteignent la maturit sexuelle plus rapidement lorsqu'ils vivent dans un environnement o les prdateurs sont nombreux, et moins rapidement lorsqu'ils sont moins nombreux. En transposant des poissons d'un milieu l'autre, on observe une adaptation en quelque annes seulement: les poissons qui passent d'un environnement riche en prdateurs un environnement pauvre en prdateurs tendent atteindre la maturit sexuelle plus tardivement, et vice-versa. L'levage artificiel a rvl que ces adaptations ont une base gntique, les individus dveloppant les traits mme en l'absence de prdateurs. Un gnotype qui ferait en sorte que lindividu biologique mette toute son nergie uniquement dans la recherche de nourriture ou uniquement dans la reproduction risque long terme de steindre; il lui faut donc arbitrer entre les diffrents impratifs. Comme la slection naturelle ne peut optimiser toutes les SHV (en raison des contraintes physiques, temporelles ou dveloppementales), certaines seront slectionnes dans lvolution (Yampolsky, 2001). Les SHV sont ainsi la source de lhtrognit du vivant (Venter et al., 2003: 83). Les SHV, comme lvolution, fonctionnent par contraintes et consquences : loptimisation est limite aux variations gnotypiques qui sont accessibles par la mutation, et retient les gnotypes qui ont les meilleures valeurs. On peut reprsenter les diffrentes SHV possibles pour une espce par les branches dun arbre de dcision et la dynamique de la population comme un flux le long de ces branches. Soit une espce qui ne comporte que deux variations pour une SHV, A et B. Pour les deux SHV diffrentes qui sexpriment dans un mme environnement, on peut construire un arbre des rsultats : chaque branche reprsente la SHV, et les deux sexpriment dans un environnement o la probabilit dune situation P1 est de 75% et P2, 25% (la densit de prdateurs par exemple).
de son hte hors du nid, il ne dirait certainement pas quil veut propager ses gnes ! (Alcock, 1989: 513).
184
Figure 5-3 Stratgies d'histoires de vies
Chaque combinaison de situations et de SHV peut tre avantageuse ou non pour lorganisme : si on leur attribue une certaine valeur (v1.v4), alors <v1 + v2> reprsente laptitude de la SHV A, et <v3+ v4> celle de B. Si A est un avantage volutif, cette SHV aura une plus grande valeur daptitude et donc se rpandra dans la population. Avoir une SHV A ou B, comme lge de la maturit sexuelle, est un paramtre sur lequel les organismes individuels nont pas de contrle direct: la fonction qui est optimise est laptitude, et cette fonction est relative une population. La slection peut alors oprer sur une SHV qui se rvlera moins adaptative (fig. 5.4, en gris ). Une SHV ne dispense toutefois pas lindividu davoir prendre des dcisions, en un sens non mtaphorique cette fois-ci : si par exemple la SHV reproductive qui a t retenue dans lvolution de lespce est davoir une descendance peu nombreuse mais dans laquelle les parents investissent une quantit dnergie et dattention considrable, il faut encore, pour un individu en particulier, choisir lautre individu avec lequel saccoupler. On peut alors ritrer lopration de disjonction de larbre (fig. 5.4) jusqu arriver un point o les valeurs (v1.v4) sont les valeurs dutilit du comportement individuel. Elles dcoulent de, et participent , la maximisation de laptitude, mais ne sont pas identiques et doivent tre diffrencies240 .
Figure 5-4 SHV et comportement
Larbre des SHV se subdivise en arbre de dcision. Alors que les SHV maximisent laptitude objective, la mesure quun biologiste parfaitement inform pourrait mesurer, la prise de dcision individuelle la
Voir (Cooper, 2001) pour une dmonstration formelle de la drivation de la thorie de lutilit de la thorie des SHV, et de la drivation de celle-ci de la biologie des populations.
240
185
maximise par procuration, et de faon faillible. Les individus qui prennent des dcision maximisent une fonction objectif individuelle, lutilit. On est donc en droit de parler dune maximisation de lutilit qui ne se rduit pas la maximisation de laptitude.
EN RSUM : Lcologie du comportement montre quon peut dcrire le comportement des animaux comme tant des agents paramtriquement, stratgiquement et socialement rationnels. La maximisation de lutilit, bien quelle participe la maximisation de laptitude, ne sy rduit cependant pas.
5.3
LA COMPTENCE RATIONNELLE ANIMALE
Lcologie du comportement dcrit les performances rationnelles des animaux, et montre quune description des animaux comme des agents conomiquement rationnels est prdictivement adquate. Cette description correspond la premire tape de la dcomposition mcaniste avance au prcdent chapitre. Sil y a une relle unit chez les animaux rationnels, on doit pouvoir identifier la structure sous-jacente, savoir la comptence rationnelle. Rappelons quun agent rationnel est une architecture de contrle dote de ces caractristiques : C1. tre un contrleur embarqu qui optimise une fonction dutilit multi-attributs. C2. tre un systme de contrle adaptatif capable dapprendre. C3. tre situ dans une dynamique de population. C4. Guider son comportement laide de modles directs et inverses. Ces proprits, ainsi que laffirment les prochaines sections, sont toutes ralises chez les vertbrs. 5.3.1 LES CONTRLEURS EMBARQUS Pour tre un systme de contrle, lanimal doit pouvoir interagir avec son environnement : capter des signaux externes par ses capteurs et se mouvoir par ses effecteurs. En raison de leur diffrenciation cellulaire et de leur htrotrophie, les mtazoaire, mme chez les formes de vies plus simples, ont dvelopp des capacits sensorimotrices ralises par des capteurs et des effecteurs. Mme la bactrie E. Coli peut dtecter la
186
prsence de nutriments et sorienter vers eux afin de se nourrir (Koshland, 1977). Les animaux sont des systmes de contrle, mais ne sont pas tous des contrleurs embarqus. En effet, des organismes comme E. Coli se dplacent dans leur environnement par des modifications de la membrane cellulaire (Vaknin & Berg, 2006). Le contrle est distribu dans le corps et nest donc pas sous lemprise dun contrleur distinct dun contrl. Pour tre un systme de contrle embarqu, un animal doit possder un organe structurellement et fonctionnellement distinct dautres organes dont la fonction est la rgulation du corps par la transformation de signaux dentre en signaux de sortie. Aussi tre un systme de contrle embarqu signifie, pour les mtazoaires, possder un systme nerveux central : le systme nerveux central (le contrleur) envoie et reois des signaux du corps (le systme contrl) par le biais du systme nerveux priphrique. Deux seuls clades parmi les mtazoaires sont reconnus pour tre dots dun systme nerveux central: les prostrotomiens (mollusques, arthropodes et annelids) et les deutrostomiens (chords, chinodermes) (Neilsen, 2001), les deux grandes divisions des bilatriens; appelons-les contrleurs neuronaux. Les contrleurs neuronaux constituent un taxon monophyltique (aucune espce descendant des bilatriens na perdu son systme nerveux central au cours de lvolution):
Figure 5-5 Cladogramme des organismes dots d'un systme nerveux central
Les systmes nerveux centraux procurent un avantage volutif leurs porteurs : plutt que dencoder gntiquement lensemble des boucles de contrles ncessaires la survie, les gnes produisent dans lontognie des cellules nerveuses qui pourront apprendre ou dvelopper les boucles qui maintiendront lorganisme viable. Le pari des gnes est que la machinerie neuronale veillera laptitude du vhicule des gnes les propager; en spcifiant la construction du corps et du systme nerveux, les gnes exercent le pouvoir ultime sur le comportement. Toutefois, les
187
dcisions instantanes [ moment-to-moment ] sur ce quil faut faire maintenant sont prises par le systme nerveux (Dawkins, 1976: 59). Les contraintes de temps et de viabilit propre aux contrleurs embarqus sappliquent aux animaux dot dun contrleur neuronal. Que ce soit les prdateurs, le comportement aggressif des autres animaux (conspcifiques ou non), les parasites, les infections virales et bactriennes ou les toxines, la vie animale est une gestion de dangers comme une acquisition de ressources qui demandent un contrle fiable et critique, en temps rel. La validit et la pertinence de la prise de dcision dpendent grandement de la rapidit dexcution : un mcanisme de dcision rapide, mme sil est parfois fautif, est mieux quun mcanisme toujours correct mais lent. Les impratifs de la slection naturelle, soit la survie et la reproduction, obligent les systmes demeurer dans leurs bassin de viabilit; lorsque le systme approche du bord du bassin, son systme nerveux peut rtablir la situation. On peut faire lhypothse raisonnable quune des fonctions du systme nerveux est de maintenir le corps viable, ce qui permet ultimement la survie et la reproduction. La dtection dun taux de glucose sanguin trop bas ou dune salinit environnante trop leve, ou tout autre perturbation de lquilibre homostatique dtect par le contrleur neuronal sera rquilibr, faute de quoi la mort sensuit. Les animaux dots dun systme nerveux central ont la capacit de prendre linitiative de performer une tche lorsque requise, comme lorsquils font face un danger. Les contrleurs neuronaux ont d dvelopper des adaptations morphologiques, physiologiques, des stratgies dhistoire de vie ou des adaptations comportementales pour sengager dans une activit. On retrouve ainsi chez une grande partie des contrleurs neuronaux un spectre de rponses au stress du danger : hypervigileance, fuite, combat et effroi (freeze, flight, fight, fright; cf (Gray, 1988)241. Chaque option est une initiative manifestant lautonomie de lagent et dont lissue peut avoir des consquences heureuses ou non pour la survie du systme. Les contrleurs neuronaux ont aussi la capacit de modifier leurs oprations ou den initier de nouvelles. Ils peuvent par exemple engager un combat puis se rsigner la fuite lorsquun autre ennemi intervient. Ou encore, comme les crabes Pagurus bernhardus (Briffa & Elwood, 2005), il peut abandonner une attaque dun conspcifique lorsquils lui manque certains mtabolites, prdisant une dfaite. mesure que les connaissances progressent sur la neurobiologie du comportement animal, il est de plus en plus difficile de rduire le comportement animal des instincts ou rflexes primaires, pr-cbls. Mme les sangsues mdicale
241
La simple dichotomie fuite ou combat (flight of fight) est aujourdhui obsolte.
188
( Hirudo medicinalis ) prennent des dcisions de faon non machinales : des stimuli identiques dclenchent diffrents patrons de locomotion, (nager ou ramper) de faon non dterministe, selon le plan daction ou le contexte242. De mme, les cellules de Mauthner, des interneurones responsables des mouvements de fuites chez certains poissons et amphibiens, sont sensibles un ensemble de paramtres. De lextrieur, on ne peroit quun mouvement subit de fuite, mais ces neurones induisent un comportement de fuite seulement lorsquelle intgrent des signaux concernant un danger proximal. Ces neurones rgissent la dcision de fuite ou dimmobilisation, le moment de la fuite, supervisent la capture dune proie, recalibrent la trajectoire dattaque en comparant des signaux dentre avec un tat de rfrence et inhibent des actions lorsque ncessaire (Korn & Faber, 2005). On peut donc parler en un sens non-mtaphorique de contrle et de dcision chez tous les animaux dots de systmes nerveux central, car ils exhibent des prfrences pour certains tats. On peut parler de prfrences ds que le mcanisme responsable du comportement nest pas un rflexe pr-cbl ou un gnrateur central de patrons (central pattern generator) fonctionnant mme en labsence dentre sensorielle. Le contrle embarqu est bien sr insuffisant : il faut encore que le contrle maximise lutilit et puisse reconfigurer ses paramtres de contrle afin dassurer un contrle adapatif. La prochaine section prsentera lhypothse selon laquelle la maximisation de lutilit, son contrle et son apprentissage relvent de mcanismes plus primaires que la dlibration consciente, et sont raliss par des structures prsentes chez tous les vertbrs. 5.3.2 CONTRLE ADAPTATIF ET APPRENTISSAGE motivit et contrle Considrant ce qui est aujourdhui connu sur le fonctionnement des motions243, ces dernires peuvent tre juste titre considr comme des mcanismes affectifs de contrle de laction. Autrefois conues comme des tendances ou des instincts qui dsorganisent lactivit cognitive, ou encore comme des reprsentations uniquement cognitives pour certains philosophes, il serait plus juste aujourdhui de considrer les motions comme des dispositifs pour dtecter et ragir la valeur adaptative des actions que lorganisme entreprend et des situations auxquelles il est
242
Briggman (2005) et ses collgues ont isol le neurone responsable de lactivation du patron. Voir (Damasio, 1999, 2003; Dolan, 2002; Griffiths, 1997; LeDoux, 1996; Panksepp, 1998)
243
189
confront. Ces dispositifs sont des mcanismes cognitifs tendus ou distribus (Clark, 1997) par excellence : des tats physiologiques (endocrines, organes, rythme cardiaque), neuronaux (mission de neurotransmetteurs, modulation de la connectivit), posturaux, faciaux, des comportements (courir, figer) ou des tats cognitifs (attention slective, motivation, rappel mnmonique) rpondent lentre dinformation. Certaines boucles de contrles sont automatiques (les programmes daffects ), dautres peuvent tre inhibes ou amplifies. Panskepp (Panksepp, 1998), identifie 4 systmes affectifs fondamentaux : RECHERCHE, PANIQUE, RAGE et PEUR (p. 53 et sq). Chacun ragit diffrement aux stimulis et provoque des comportements diffrents : le programme PEUR peut, en biaisant lattention sur une partie du champs visuel o se trouve un prdateur, par exemple, initier une raction affective qui dclenchera une fuite rapide; le programme RAGE peut initier plutt un combat ou une attaque; PANIQUE peut figer lorganisme, le rendant ainsi moins facilement identifiable par le prdateur, etc. Dans tous les cas, ces programmes servent la survie en ajoutant une valeur aux entres et aux sorties dinformation. Ces programmes sont des motions dites de bases; ils fonctionnent de faons relativement automatique, rapides, dclenchent des ractions strotypes et ne sont pas sous le contrle de lagent bien quils participent la rgulation de son comportement. Chez des systmes nerveux plus complexes, certaines motions, comme la jalousie, sont moins automatiques (elles peuvent tre inhibes voire contrles), peuvent se dvelopper sur un plus grand laps de temps et dclenchent des ractions moins strotypes; elles sont cognitivement pntrables. Seules les premires peuvent toutefois tre classe comme des espces naturelles, car elle sont assez rigides (crisp ) pour tre identifies par des homologies (Griffiths, 1997). Dopamine et contrle Les neurosciences du comportement reconnaissent que pour la slection de laction et la maximisation de lutilit, une foule de zones et de processus sont sollicits. On peut cependant identifier certains composants actifs dans la dcision maximisatrice dutilit. De nombreux travaux montrent que parmis ceux-ci, les systmes dopaminergiques sont particulirement efficace pour guider le comportement et pour lapprentissage base de rtroaction valuative.244
Cf (Callier et al., 2003; B. L. Lewis & O'Donnell, 2000; Nieoullon, 2002; Schultz, 2001; Schultz & Dickinson, 2000; Williams & Goldman-Rakic, 1995).
244
190
Lvaluation de lutilit est effectue, dans le cerveau vertbr245, en grande partie par les neurones dopaminergiques des rgions msencphaliques, la rgion du cerveau reliant le tronc crbral l'encphale. La dopamine agit comme un neurotransmetteur, mais aussi et surtout comme un neuromodulateur : elle ne fait pas quactiver des neurones-cible, mais vient aussi moduler la rponse de ces neurones. Deux structures msencphaliques, la substance noire (SN) et laire tegmentale ventrale (ATV), sont impliques principalement dans trois voies dopaminergiques (cf. figure 5-6) : La voie voie mso-limbique, qui relie lATV au noyeau accumbens (NA), La voie nigro-strie qui relie la SN au striatum La voie mso-corticale qui relie lATV aux lobes frontaux
Chacune de ces voies remplie certaines fonctions cruciales pour la maximisation de lutilit. La mso-limbique est implique dans la mmoire et la motivation des comportements. Lhyperactivit de ces neurones est corrle avec les symptmes schizophrniques dit positifs (hallucinations et illusions). La voie nigro-strie elle, module le contrle moteur; la privation de dopamine dans cette rgions entrane les pathologies typiques de la maladie de Parkinson comme labsence de coordination motrice, ou incapacit produire correctement le mouvement volontaire. Un dficit de dopamine dans cette voie entrane aussi des symptmes schizophrniques dits ngatifs (rduction de la motivation et de la coordination). La voie mso-corticale est sans doute la plus importante pour le contrle de laction rationnelle. Les neurones de lATV viennent moduler entre autres les lobes frontaux impliqus dans la mmoire de travail. Linjection dun antagoniste (qui inhibe laction de la dopamine) diminue la perfomance dans des tches oculomotrices sous contrle cognitif, savoir lorsquune saccade doit tre effectue non pas en raction un stimulus, mais selon une instruction mmorise au pralable (Sawaguchi & Goldman-Rakic, 1994). Les projections dopaminergique contraignent lactivation neuronale lors de performance de tches laide de la mmoire de travail (Williams & Goldman-Rakic, 1995) en maintenant la dpolarisation des neurones du cortex prfrontal (B. L. Lewis & O'Donnell, 2000), ce qui permet de focuser lattention du systme sur des dimensions pertinentes de lenvironnement (Durstewitz & Seamans, 2002). On sait aussi que lactivation de cette voie dopaminergique est corrle avec lattention et la prsence de stimuli non conditionns (Horvitz et al., 1997) mais qui
245
(Callier et al., 2003; Le Crom et al., 2003).
191
dnotent une saillance informationnelle dans lenvironnement de lanimal. Montague et al comparent son rle celui dun portier : les neurones dopaminergiques filtrent linformation qui doit tre signale en mmoire de travail, et ne laissent passer que celle qui reprsente un intrt pour le systme. Les reprsentations en mmoire de travail peuvent alors tre mises jour, modifie ou tre utilise pour le contrle du comportement (Montague et al., 2004). Outre ses projections dans les lobes frontaux, celles avec le nucleus accumbens sont aussi des lments essentiels pour le comportement orient et la rponse aux stimulis motivants (Yun et al., 2004).
Figure 5-6 Voies dopaminergiques (copyleft : www.lecerveau.mcgill.ca)
Ensemble, ces voies dirigent le maintient de buts en mmoire de travail, lintgration, linformation sur les prdicteurs dutilit dtecte, la modulation de lapprentissage, la dtection des erreurs de prdictions et le contrle moteur. On observe ainsi une activation de ces neurones lors de stimuli relis aux rcompenses (Schultz & Dickinson, 2000) : des stimuli lis aux rcompenses de faon primaire (jus, nourriture), des stimuli auditifs et visuels qui indiquent la possibilit de rcompenses, des stimuli semblables aux rcompenses, ou encore des stimuli qui licitent des ractions dorientation et des comportements dapproches, comme des stimuli qui recrutent lattention, (nouveaux ou particulirement intenses), potentiellement lis des rcompenses (la saillance motivationnelle). Globalement, les neurones dopaminergiques dmontrent une sensibilit aux qualits valuatives de lenvironnement. Ils tiquettent les stimuli environnementaux dune valeur apptive, prdisent les rcompenses et signalent des vnements motivants et importants
192
(alertes). En plus dun rle valuatif, les recherches de Berridge et de ses collgues montrent que les systmes dopaminergiques sont en grande partie responsables de la motivation246. Lactivit de ces neurones est ncessaire pour que des indices relis des rcompenses acquirent une signification et une saillance motivante. Des souris gntiquement modifies, qui possdent des rcepteurs dopaminergiques mais nen produisent pas, sont hypoactives et hypophagiques: la dtection de nourriture de motive pas lingestion. Lorsquon administre un produit qui, une fois mtabolis, est converti en dopamine, les souris deviennent alors hyperactives et hyperphagiques et dveloppent des strotypies (Pecina et al. , 2003; Robinson et al., 2005). On sait aussi que ces systmes de motivation participent au contrle de lanimal en tant dissocis de laffect hdonique. Des rats hypodopaminergiques ont une raction orofaciale au sucrose diffrente de la quinine, dmontrant un affect hdonique pour le premier mais non par le second247 (Berridge & Robinson, 1998). Ils nauront toutefois aucune motivation ingrer du sucrose ou tout autre nourriture auquel lanimal est sensible normalement. En situation de fourragement, ces animaux hypo- ou hyperdopaminergiques auraient peine recueillir des les ressources nergtiques ncessaires : les uns par manque de motivation, les autres par manque de concentration. Lorsquun antagoniste de la dopamine est inject dans le nucleus accumbes, des rats se sont montrs incapables dexplorer un environnement la recherche de nourriture (Floresco et al., 1996). Si lenvironnement est dj connu, en revanche, il sont capables de rutiliser de linformation dj acquise son sujet et de retrouver des sources de nutriments; de la sorte, les systmes dopaminergiques ninterviennent dans le fourragement que lorsquil y a ambiguit quant localisation de la nourriture, bref lorsquune dcision simpose. On sait aussi que laction de drogues psychomotrices telles que la cocane recrutent les neurones dopaminergiques de lATV (Kauer, 2004); lincapacit inhiber un comportement de consommation de drogue dcoule de la surabondance de transmission dopaminergique (van Gaalen et al.), cre par ces substances, qui biaisent le systme motivationnel. La dpendance ces drogues peut tre forte au point ou le sujet prouve une envie de consommer mme sil nen retire aucun plaisir. Ces recherches suggrent que la motivation de lanimal nest pas en premier lieu la recherche dun stimulus affectivement agrable, mais de ressources externes (alimentation, reproduction, etc.) dont il a besoin. De la sorte, les
246
cf (Berridge, 2003, 2004; Berridge & Robinson, 1998; Pecina et al., 2003).
Le mme phnomne a t constat chez des humains, par exemple des fumeurs qui on administre un antagoniste de la dopamine prouvent le mme plaisir sans avoir de dsir de fumer (Berridge & Robinson, 2003).
247
193
systmes dopaminergiques sont plutt des systmes pour vouloir que pour aimer. Ce sont donc les mmes systmes qui sont impliqus dans lattention et lintention, deux composantes de laction rationnelle : alors que lATV propulse le systme vers des attracteurs qui lui sont avantageux, elle sactive aussi dans la sollicitation de lattention, en recrutant lactivit des lobes frontaux pour le contrle cognitif. On sait quils ont aussi un rle important pour lapprentissage : des patients souffrant de Parkinson, dont lactivit dopaminergique est diminue, (Frank et al., 2004), sont moins sensibles aux rtroactions positives mais plus sensible aux rtroaction ngatives. Ces tudes et une simulation neuronale effectue par Frank et al, qui rplique les rsultats obtenus chez les sujets Parkinson, suggrent que le cerveau peut apprendre faire les bons choix et viter les mauvais de faon implicite et que les systmes dopaminergiques y contribuent massivement, du moins pour la slection des actions propres maximiser lutilit. Les recherches en neuroconomie suggrent aussi que la prise de dcision rationnelle, soit lvaluation de lutilit, du risque, de lincertitude et de la probabilit des possibilits daction, fait appel en grande partie ces systmes248. Dopamine et apprentissage DT On a souvent observ que les neurones dopaminergique ne rpondent pas directement la prsence de rcompense, mais uniquement lorsquune diffrence est constate entre un tat attendu et ltat occurent. De faon simplifie, si S(x) est la valeur de la rcompense attendue, P(x) la valeur de la rcompense occurente, et E(x) le signal derreur, les neurones dopaminergiques suivent une rgle de ce type : S(1) P (0) = E(1) S(1) P (1) = E(0) S(0) P (1) = -E(1) Les enregistrement dactivits de neurones individuels (Schultz et al., 1997) montrent que les neurones dopaminergiques envoient un signal derreur seulement lorsque la diffrence entre S(x) et P(x) est non-nulle analogue celui des algorithmes DT (diffrence temporelle), un type
248
(Bayer & Glimcher, 2005; Berridge, 2003; McClure et al., 2004)
194
dapprentissage non-supervis qui opre partir des erreurs de prdiction249.
Figure 5-7 Activits de neurones dopaminergiques, daprs (Schultz et al., 1997)
Autrement dit, si les neurones sont surpris (une rcompense survient alors quelle ntait pas attendue), ou si ils sont dus (la rcompense attendue ne sest pas prsente), les neurones renvoient un signal derreur. La rponse dopaminergique fonctionne comme un prdicteur dutilit250. Les signaux intgrent aussi deux paramtres statistiques de la rcompense, soit la probabilit et lincertitude. Dans une tude de Fiorillo et al. (Fiorillo et al., 2003), des singes devaient associer des stimuli visuels avec une rcompense, laquelle survient, selon une probabilit variable, aprs les stimuli visuels. Quand la probabilit de rcompense diminue, on observe un activit phasique, abrupte, au moment de la rception de la rcompense. Lorsquon augmente lincertitude (une probabilit de 50% que le stimulus soit suivi dune rcompense), leurs neurones dopamingergique dmontrent une activation tonique, continue, qui
(Egelman et al., 1998; Kaelbling et al., 1996; Montague et al., 1996; Suri & Schultz, 2001; Sutton & Barto, 1987; Worgotter & Porr, 2005)
249
(Bayer & Glimcher, 2005; Montague et al., 2004; Schultz, 1999, 2001; Schultz et al., 1997; Schultz & Dickinson, 2000; Suri & Schultz, 2001; Tobler et al., 2005; Waelti et al., 2001).
250
195
apparat juste avant lmission de rcompense, au moment de la prsentation du stimulus visuel. La modlisation computationnelle du rle des systmes dopaminergiques montre que ceux-ci sont bien dcrits par des algorithmes dapprentissage DT. les algorithmes DT, utiliss dans des rseaux de neurones artificiel ou en robotique autonome, apprennent et contrlent un systme en effectuant de faon constante des prdictions quant lutilit attendue, et rajustent cette prdiction lorsque que le signal ne correspond pas la prdiction. force de corriger ses erreurs de prdiction, le systme apprend des rgles (policies) de contrle pour latteinte de ses buts. Toute sa capacit dapprentissage et de contrle reposent donc sur la possibilit quil soit dans lerreur et quil reconnaisse son erreur, quil soit surprit. En cela, il satisfait un des rquisits de rationalit de Davidson (chapitre 3). Ces modles dapprentissage , en plus dtre biologiquement plausibles, sont tractables, obligs dacqurir de linformation pour prendre des dcisions, et ncessairement situs dans des environnements incertains avec lesquels ils sont en contact continu251. On a par exemple soumis des sujets humains une simple tche de dcision sous incertitude radicale, identique un bandit 2 bras : ils devaient choisir entre deux options A et B (deux icnes affichs sur un cran dordinateur) sans savoir la probabilit de paiement de chaque option. chaque coup, lordinateur les informait de leur gain total. Le mme problme a t prsent un rseau de neurones articifiels munis dun algorithme dapprentissage DT, et les humains comme le rseau ont produit les mmes rsultats (Egelman et al., 1998). La performance de singes dans des tches similaires peut aussi tre prdite par un modle DT (Glimcher et al., 2005). Des modles DT qui rpliquent lactivit des systmes dopaminergiques ont montr leur capacit dapprentissage dans des tches dapprentissage spatial par rcompense avec dlai (Suri & Schultz, 1999)252, le contrle de la navigation dans un robot autonome (PerezUribe, 2001). Ils ne sont pas capables de battre des matres dchecs, mais sont capables datteindre un niveau de grand matre au backgammon (Tesauro, 1995), un jeu qui incorpore, comme plusieurs situations relles,
Rappelons-le, lapprentissage par renforcement est une rsolution de problme pour un agent qui doit dcouvrir la structure de paiement de son environnement.
251
Cest--dire lorsque la rcompense survient aprs un certain dlai, des tches de contrle cognitifs typiquement attribues aux lobes frontaux.
252
196
une grande part dincertitude (le jeu dchecs, lui, est un jeu information complte). Il ressort de toutes ces tudes que les systmes dopaminergiques ne sont pas des systmes perceptifs ou moteurs, mais plutt des contrleurs du comportement, de la cognition, de lapprentissage et de lattention qui manipulent les paramtres de rseaux neuronaux impliqus dans ces fonctions (Nieoullon, 2002). Ces systmes signalent la prsence dentits ou de proprits pertinentes pour lanimal, le motivent latteindre et lui permettent de conduire un apprentissage efficace en contexte dincertitude253. Lactivit dopaminergique, rsume Self, est la fois luf et la poule , la fois la cause et leffet de la motivation (Self, 2003). Une architecture de contrle dote de ces capacits peut dcouvrir delle-mme ce qui, dans son environnement, est apte satisfaire ses besoins. Cette plasticit dans le comportement est plus efficace, en contexte incertain, quun systme pr-cabl qui spcifierait dj les ressources recueillir. La gntique peut toujours pr-spcifier les mcanismes de renforcement, mais la trajectoire datteinte des satisfecits est laisse au dveloppement et lapprentissage, la flexibilit de ces phnomnes tant alors en mesure dextraire de linformation et des mesures valuatives dans un environnement o les prdicteurs dutilit sont complexes ou labiles. Le systme est alors apte, en intgrant linformation sur lutilit, la probabilit et lincertitude, de guider son comportement maximisateur pour la recherche de nutriments, ce qui correspond deux des exigences nonces plus haut : la maximisation dune fonction dutilit multi-attributs par un contrleur embarqu (condition C1) dot de capacit adaptative dapprentissage (condition C2). La condition C4 exige quant elle la possession de modles cognitifs dans le contrle de laction, ce dont traite la prochaine section. 5.3.3 LE CONTRLE BASE DE MODLES Les systmes dopaminergiques des vertbrs sous-tendent donc la maximisation de lutilit, lapprentissage par rtroaction valuative et le contrle adaptatif. On saisit limportance de ces systmes lorsquon compare le fonctionnement normal du cerveau avec les pathologies relies aux systme dopaminergique. un extrme, o le niveau de dopamine est trop lev, on rencontre des pathologies o le contrle est trop concentr (comportement obsessif-compulsif, dpendance, autisme, strotypie);
Sattoh et al. montrent que les neurones dopaminergique codent effectivement pour la motivation et la consquences des actions (Satoh et al., 2003). Voir aussi (La Cerra & Bingham, 1998) pour un modle synthtique.
253
197
un autre extrme, associ au manque de dopamine, le contrle devient trop diffus (Parkingson, trouble de lattention, aboulisme) (Hills, 2006). Le contrle de lattention et de la cognition demande donc une juste balance, un quilibre entre ces deux extrmes. Ce contrle est toutefois plus efficace lorsquil peut utiliser de linformation reprsente. Comment un contrleur embarqu comme le cerveau peut-il utiliser des modles directs et inverses ? Il est impratif de dfinir ce quest une reprsentation cognitive. Une reprsentation est une structure neuronale, qui tient lieu de, ou donne de linformation sur, une entit E. Lingnirie des rseaux de neurones (Eliasmith & Anderson, 2003) dfinit une structure neuronale comme un complexe <neurones, connexions, patrons dactivations>, soit un ensemble de neurones, leur connexions et lensemble des patrons dactivits tel que dtermins par les activit des neurones auxquels ils sont relis; si une telle structure, par son activit, permet lorganisme dtre inform des variables de E, les valeurs de ces variables, l'volution de ces variables et la structure de E (la relation entre les variables), alors la structure neuronale est une reprsentation cognitive. On peut ainsi reprsenter un rseau de neurones simples (figure 58), comme tant compos de neurones dentre, des neurones de sortie et d interneurones (ou units caches ) comme un systme de contrle du corps, en interaction avec lenvironnement. Un contrle non reprsentationnel peut tre assur par ce genre darchitecture, pourvu que linteraction entre le systme et lenvironnement soit constante (Brooks, 1999). Dans ces architectures, le systme consulte constamment lenvironnement pour le contrle du comportement. Une architecture de contrle rationnelle, elle, consulte aussi des modles internes, soit des structures neuronales qui reprsente E et utilise linformation propos de cette structure pour guider son interaction avec E (figure 5-9).
198
Figure 5-8 Rseau de neurones, d'aprs(Rumelhart et al., 1986))
Figure 5-9 Rseau de neurons dot d'un modle interne (Rumelhart et al., 1986)
199
Pour agir dans son environnement, un systme doit avoir au moins une reprsentation de son corps et de son espace (et ses composantes), afin de naviguer le premier dans le deuxime en fonction de la structure de paiement de lenvironnement (que son systme dopaminergique lui indiquera). Les modles du corps qui interviennent dans le contrle moteurs sont appel mulateurs , et les modles de lespace ou de ses composantes simulateurs254. Les premiers sont principalement localis dans le cervelet et le cortex moteur255. Les recherches sur le contrle moteur montrent que le cervelet guide laction par lintgration de signaux proprioceptifs des rcepteurs cutans et musculaires en modles internes et directs. En effet, un contrle qui attendrait la rtroaction proprioceptive pour ragir ou recalibrer un geste serait trop lente : alors que celle-ci peut prendre de 200 500 miliseconde, le contrle moteur peut recalibrer un geste volontaire en moins de 70 miliseconde (van der Meulen et al., 1990). Dans lapprentissage du contrle, le cervelet dveloppe des modles internes, qui sont par la suite utiliss dans laction intentionnelle. Des modles inverses spcfient la commande motrice implmenter et envoie une copie de cette commande un modle direct, qui calcul leffet de cette commande motrice. Le cervelet compare les signaux de sortie des deux types de modles et peut contrler laction avec cette rtroaction interne, sans attendre une rtroaction externe. Dautres mulateurs ont t aussi identifis dans le traitement de linformation motive, ce que Damasio a appel des marqueurs somatiques 256, des marques affectives qui accompagnent des reprsentations dtats corporels (le serrement de l'estomac ou l'lvation du rythme cardiaque) et qui, intgrs par les lobes frontaux, signalent l'utilit de certaines entits ou situations. Ces marqueurs, actives dans la prise de dcision modulent, par le truchement des zones ventromdiales frontales connectes avec l'amygdale et l'hypothalamus, le comportement par l'induction d'un biais dans la slection ou l'valuation d'un comportement ou encore l'inhibition d'une rponse apprise. En l'absence de signaux motifs, le processus dcisionnel est accabl par une surcharge
Un mulateur prend comme entre lactivit dun systme en opration, mule son activit et envoie le produit de ce calcul au systme en question; un simulateur reproduit lactivit complte dun systme sans quil y ait ncessairement de connexions avec lui. Ainsi, un logiciel qui mulerait le vol dun avion serait reli un avion en vol, prendrait comme entre toutes les informations captes (altitudes, vitesse, plan de vol) calculerait la prochaine action poser; un simulateur de vol reproduirait au complet lactivit dun avion sans y tre connect.
254
(H. Chen et al., 2005; P. R. Davidson & Wolpert, 2004; Imamizu et al., 2000; Ito, 2000; Kawato et al., 2003; Kawato & Wolpert, 1998; Schweighofer et al., 1998; Shadmehr, 2004; Tin & Poon, 2005; D. M. Wolpert et al., 1998)
255
(Bechara & Damasio, 2005a; Bechara & Damasio, 2005b; Damasio, 1994, 1999, 2003; Damasio et al., 1996)
256
200
dinformation insignifiante: incapables d'utiliser l'information des marqueurs somatiques pour soupeser intuitivement la valeur de possibilits d'action ou de se reprsenter des buts comme tant dsirables, des sujets crbro-lss peinent prendre de simples dcisions. Un systme qui naurait que des reprsentations motrices et motives pourrait ainsi naviguer un environnement de faon relativement fluide, effectuant ainsi ce que les marins appellent une navigation lestim (dead reckoning)(Gallistel, 1990). Le contrle dun bateau par navigation lestim est ralise par lintgration de signaux sur des tats internes comme le tachymtre, la montre, ou la boussole, lorsque lenvironnement est inconu (le premier voyage de Colomb en Amrique) ou imperceptible (en prsence de brouillard). Dans le pilotage , en revanche, la navigation utilise de linformation sur des objets distaux (les toiles, le soleil, le littoral). De la sorte, pour pouvoir naviguer son environnement en maximisant son utilit avec succs, il lui faut un autre type de reprsentations, savoir des reprsentations des entits distales qui sont pour lui motivantes. On la vu, les systmes dopaminergiques de mme que les marqueurs somatiques sont capables dorienter le comportement maximisateurs en recrutant lattention et la motivation de lorganisme. Pour une action rationnelle, le systme doit consulter des simulateurs, qui lui donneront de linformation sur des entits externes. Tversky et Kahneman avait dj soulign que, dans biens des cas, des prises de dcision ne seffectuent pas par un raisonnement, mais par une simulation dune situation, qui permet ainsi de se reprsenter lutilit dune action (Kahneman et al., 1982). Ce type de simulateur, toutefois est une comptence de plus haut niveau, qui implique la capacit imaginer volontairement et consciemment une situation autre. Des thories plus rcente de la simulation257 indiquent plutt que la simulation est en fait un des modes de traitement de linformation fondamental du cerveau, par lequel celui-ci ractive des structures neuronales qui avaient dj servie dans une situation semblables. Des objets, des proprits, des lieux qui voquent certaines activits neuronales vont par la suite voquer ces mmes structures ou des structures similaires. La thorie des symboles perceptuels de Barsalou (1999) stipule que la perception et la cognition recrutent les mmes ressources neuronale, un fait reconnu par les neurosciences cognitive (Grzes & Decety, 2001). Les reprsentations smantiques ne sont pas primitivement linguistiques ou amodales, mais plutt des
(Barsalou, 1999, 2003; Chaminade et al., 2001; Decety & Grezes, 2006; Decety & Ingvar, 1990; M. Roth et al., 1996; Ruby & Decety, 2001).
257
201
enregistrement de l'activation neurale qui survient pendant la perception (Barsalou, 1999 : 583), que ce soit de lextro- ou de la proprioception. Aprs lexprience perceptuelle, le cerveau enregistre des aspects sensorimoteurs de l'exprience et les intgre dans les structures (frames ) multimodales. Seulement quelques aspects sont enregistrs: lattention slective filtre les aspects enregistrs (par exemple, mouvements, sommets, bords, couleurs, relations spatiales, chaleur, etc...) qui sont enccods en mmoire long-terme et rappel en mmoire de travail lorsque ncessaire. Par consquent, seulement des reprsentations schmatiques sont disponibles pour le traitement. Chaque structure est non seulement un agrgat de proprits perceptives, mais galement un simulateur qui, aprs la perception ou le rappel mnmonique, peut produire des simulations dobjets ou dvnements. Ces simulateurs interviennent dans la catgorisation et la prvision: par exemple, une fois que l'objet peru est class comme tant X, la simulation des proprits schmatiques de X permet au systme de prvoir le comportement de X, ou son propre comportement envers X. Beaucoup de simulations peuvent tre produites simultanment, et elles peuvent tre combines dans des simulations complexes. Les simulateurs sont en quelques sortes des prototypes dynamiques. Par analogie avec les marqueurs somatiques, on pourrait parler de marqueurs cognitifs : le cervau retient les proprits sensorimotrices dentit et les ractivent en contexte daction. On sait, de plus, que non seulement ces aires sont mobilises lors de la catgorisation mais aussi que si elles sont endommags, la catgorisation ne peut tre effectue avec autant d'acuit. Barsalou prtend ainsi pouvoir expliquer lensemble de la cognition humaine. Nous ne discuterons pas de son adquation ce sujet, mais plutt du fait que son modle est adquat pour dcrire la cognition animale, tant donn quil ne fait pas du langage une condition ncessaire. Barsalou signale explicitement que ces simulateurs ne dependent pas dune capacit linguistique, et quedes animaux258 (ainsi que les enfants pr-linguistiques) peuvent entretenir ce type de reprsentation:
Puisque beaucoup d'animaux ont l'attention, la mmoire de travail, et la mmoire long terme, ils peuvent aisment extraire analytiquement des lments de perception, les intgrer dans la mmoire long terme pour former des simulateurs, et construire des simulations spcifiques en mmoire de travail. (Barsalou, 1999: 606)
Dans quelle mesure peut-on considrer effectivement que des animaux possde ce genre de dispositifs reprsentationnels ? La question a suscit beaucoup de dbat en philosophie de lesprit, mais encore ici, la
258
Voir aussi (Barsalou, 2005).
202
robotique peut nous clairer ce sujet. supposer que le contrle du comportement chez les vertbrs se passe de reprsentations, une architecture robotique simple, mimant le comportement navigateur dun vertbr, devrait pouvoir tre efficace dans son environnement. Or si de telles architectures on pu fonctionner en robotique (Brooks, 1991a, 1991b), elle sont limites des contextes dterministes et absents dincertitude, ce qui, tant donn la mobilit des vertbr et leur appareils sensoriels complexes, ne sapplique pas. En revanche, les architectures base de modles (voir chapitre 3) se sont rvles beaucoup plus efficaces. Toto, un robot de Lynn Stein (L. A. Stein, 1994) peut naviguer lestim dans son environnement laide de signaux qui lui proviennent de sondes ultrasoniques, dtecter des murs, des couloirs et d'autres obstacles, mais ne pourra jamais traquer des invariants qui lui sont extrieurs : un mur nest pas un particulier matriel, mais une sorte daffordance gibsonnienne qui lui indique de ne pas sen approcher; le dtour dun corridor lui indique quil faut tourner droite, etc. Il est en revanche incapable de se promener dans un environnement quil na jamais connu, et en cela chouerait dans des tches de navigations que des rats de laboratoire font quotidiennement. Si toutefois, on lui ajoute une capacit simulatoire par laquelle il peut ractiver de faon autonome ltat de ses capteurs et de ses effecteurs et se construire une carte de son territoire, il est alors mme de prdire des trajectoires et de guider son comportement en consultant ses simulateurs avant dattendre une rtroaction externe. De la sorte, la reprsentation de lespace est une forme de simulation de lespace. Un animal rationnel doit tre capable dentretenir ce genre de simulations afin de maximiser son utilit, entre autre pour le fourragement car elles permettent le stockage et le dcodage de l'information sur l'emplacement et les attributs d'un phnomne, dans son environnement spatial. Les reprsenations spatiales sont des formes de modles directs. Ses modles inverses, lui, peuvent provenir de la sollicitation des lobes frontaux par les systmes dopaminergiques : lorsque un stimuli se prsente comme tant potentiellement motivant, lattention est alors dirige vers la source du stimuli, et lanimal est alors en mesure de ragir. Si de la nourriture est reprsente comme tant une source potentiel de rcompense, alors la motivation pour la nourriture est ce que Schroeder appelle un dsir intrinsque : la reprsentation perceptuelle ou cognitive dune entit comme tant une source de rcompense (Schroeder, 2004: 131), ce qui fait dfaut par exemple aux souris hypodopaminergiques. Comme nous le verrons plus loin, les systmes dopaminergiques comme les systmes dorientation sont homologues dans tout le clade vertbr.
203
5.3.4 LE CONTRLE DANS UNE DYNAMIQUE DE POPULATION
Lhistoire des espces est une co-volution. Tout type danimal doit, dune faon ou dune autre, interagir avec dautres, conspcifiques ou non. Des nuages de sauterelles aux couples, en passant par les colonies, bandes, essaims, familles et lignes, des liens de natures sociales tissent la toile des cosystmes. La vie en colonie et en socit sont les 2 dernires transitions majeures dans lvolution des espces (Maynard Smith & Szathmry, 1997). Ce ne sont pas tous les animaux qui sont de nature sociale ou eusociale; mais de faon plus gnrale, les animaux ont a interagir entre eux au moins pour la reproduction. En outre, les soins parentaux, la recherche de nourriture, la migration, laggrgation, la protection, les hirarchies et la territorialit forcent les animaux communiquer, cooprer ou comptitioner. De la sorte, lenvironnement de lanimal nest que rarement dterministe, tant donn la quantit dagents qui le peuple. Laccessibilit aux ressources tant limite, la prsence de plusieurs comptiteurs amne la slection naturelle a favoriser des systmes plus plastiques par le dveloppement, en particulier des systmes capables dapprendre, lapprentissage tant une forme sophistique de plasticit phnotypique259. Si les ressources sont limites alors que la population se reproduit dans un environnement incertain, la dynamique de population induit des pressions pour lapprentissage par renforcement, ce qui dirige les systmes vers certains patrons de dcision. Lapprentissage doit toutefois rsoudre des problmes computationnellement complexes dans un environnement incertain, et cette complexit induit, la longue, certains biais. Des simulations260 indiquent par exemple que dans un environnement incertain, des agents capables dapprentissage par rtroaction valuative, soumis une dynamique de populations, dvelopperont deux tendances irrationnelles au sens de Savage mais optimale si on considre que le problme rsoudre est analogue au bandit k-bras: une aversion au risque (le paradoxe dAllais) et un appariement des probabilits, savoir la tendance
(Boyd & Richerson, 1985: 6; DeWitt & Scheiner, 2004: 3; Dukas, 1998: chapitre 4, 2004; M. H. Johnson, 2005: chapitre 1; Maynard Smith, 1993: 36; Oyama, [1985]2000; West-Eberhard, 2003: chapitre 18) et les essais dans (Bolhuis & Hogan, 1999; Oyama et al., 2001).
259 260
(George, 1997) et (Niv et al., 2001).
204
apparier les probabilits de slection dune option avec la probabilit observe261. Si par exemple on constate quune option A offre un profit 7 fois sur 10, et quune autre B loffre 3 fois sur 10, les sujets auront une nette tendance slectionner A dans 70% des cas et B dans 30%, alors que la stratgie optimale consisterait choisir A dans 100% des cas.262 En contexte dincertitude il peut tre rationnel dtre averse au risque on ne sait pas combien il en cotera de se tromper et il est rationnel dapparier les probabilits pour rsoudre un problme o on ne sait pas encore quelles sont les lois des probabilits. La plasticit nest toutefois pas complte : lapprentissage est en gnral, spcifique au domaine263. Les animaux dmontrent des biais dapprentissage dans les domaines pertinents pour leur survie : la reconnaissance de conspcifiques, la dtection de stimuli prdicteur dutilit ou encore laversion au danger. De la sorte, les sytmes nerveux ont, en gnral, volu vers des architectures de contrle modulaires. Du systme nerveux de labeille (Menzel & Giurfa, 2001) jusquau cerveau vertbr, le contrle du comportement dpend dune certaine compartementalisation (Redies & Puelles, 2001) qui safffine lors du dveloppement. Cette dynamique de population qui, ainsi que le suggrait le chapitre 3, induit des architectures de contrles modulaires, est imbriqu dans une dynamique de population plus grande chelle, soit lvolution des espces, et linteraction entre les deux est trs fortes. On a ainsi pu dire que lvolution tait constitue dacteurs gnalogiques dans des rles cologiques, (Hull, 1987) ou encore une pice de thtre volutionniste dans un dcor cologique (Hutchinson, 1965). Lhistoire de cette dynamique peut tre partiellement reconstruite grce la cladistique (voir chapitre 4), et cest par ces reconstructions que des homologies peuvent tre identifies. On sait par exemple que le plan du cerveau vertbr est relativement uniforme et que tous les cerveaux actuels sont des homologues (Nieuwenhuys et al., 1998), composs des mme trois segments, savoir le prosencephale, le msencphale, et le rhombencphale.
Voir (Vulkan, 2000) sur lappariement de probabilit, et (Allais, 1953) ainsi que le chapitre 2 sur le paradoxe dAllais.
261 262
Car [(70% x 0,7) + (30% x 0,3)] = 0,58, alors que [(100% x 0,7) + (0% x 0,3) ]= 0,70 (Gallistel, 1998; Gallistel & Gibbon, 2000)
263
205
Figure 5-10 Cerveau vertbr gnrique (Shimizu, 2004)
Outre cette similarit de structure, des homologies mcaniques peuvent aussi tre identifies dans tous le clade et parmi elles, on retrouve entre autres les structures qui sous-tendent la comptence rationnelle. Premirement, les programmes daffects sont des homologies identifiables dans tous le clade vertbr : les structures limbiques responsables des marqueurs somatiques proviennent toutes du mme plan264. De mme, la cognition spatiale est un autre homologue265. On a longtemps pens que seuls les mammifres et les oiseaux disposaient de reprsentations spatiales, alors que les recherches indiquent que les poissons et les reptiles possdent les mmes mcanismes d'orientation vestibulaires, les systmes neuronaux d'intgration des signaux (le tectum) ou encore les mcanismes d'orientation du tronc crbral. Finalement, les systmes dopaminergiques sont prsents chez tous les vertbrs266. Des tudes cladistiques plus fines ont permis de rvler la phylognie des diffrents types de rcepteurs dopaminergiques (fig. 5-11). On assiste toutefois, avec les vertbrs, une duplication de ces rcepteurs, qui seraient due la demande accrue de traitement de l'information et de neuromodulation quexigent des processus comme la motivation, l'motion, la planification et la mmoire (Kapsimali et al., 2003: 33).
264
(Damasio, 1994; Griffiths, 1997) (Rodriguez et al., 2002; Salas et al., 2003) . (Callier et al., 2003; Le Crom et al., 2003)
265
266
206
Figure 5-11 Phylognie des rcepteurs de dopamine, (Le Crom et al., 2003)
5.4
SYNTHSE
Dans ce chapitre, la possibilit dune rationalit minimale animale a t esquisse. Les performances rationnelles, savoir le comportement maximisateur, se rvlent en particulier dans ltude du fourragement : les animaux doivent rsoudre des problmes dune grande complexit quun mode daction automatique ne pourrait satisfaire. Il exige au contraire un subtil calcul de lutilit, et les mcanismes susceptibles de raliser ce calcul, les mcanismes de la comptence rationnelle, ont t prsents. Il a aussi t suggr que ce calcul doit tre compris littralement comme un cacul de lutilit et non un calcul de laptitude, les deux notions devant tre diffrencies. Consquemment notre analyse des proprits des architectures de contrle minimalement rationnelle, on peut conclure que le clade vertbr possde la comptence ncessaire pour tre conomiquement rationnel. De la sorte, si cette analyse est juste, lespce AGENT RATIONNEL est une espce naturelle, et elle peut sanalyser en composante qui sont aussi des espces naturelles : le clade vertbr et ses sous-clades, de mme que les mcanismes neuronaux qui supportent les performances rationnelles. Pour reprendre le patron dexplication homologique-mcaniste, on peut donc dcomposer mcaniquement la rationalit vertbre en diffrent niveaux dexplications; lexplication totale est bien sr un tat futur de la science, mais nos connaissances actuelles nous permettent une brve synthse (nous en resterons aux systmes dopaminergiques pour le niveau synaptique-lectrique).
207
au niveau organismique-comportemental, on observe des animaux qui maximisent une fonction dutilit dans lexploration de leur environnement la recherche de nourriture. au niveau computationnel-crbral, on observe lactivit des systmes dopaminergiques, les algorithmes DT quils implmentent, la connectivit entre les aires crbrales (striatum, ATV, prfrontal). au niveau synaptique-lectrique, on observe lmission de dopamine par les neurones dopaminergiques, la rception par les diffrents types des rcepteurs, la potentiation long-terme des lobes frontaux, etc.
Figure 5-12 Mcanismes de lagentivit rationnelle
Il sagit cependant de lexplication constitutive . Une explication contextuelle spcifie lcologie de lanimal en question : sa dite, ses prdateurs naturels, son milieu physique et sa stratgie dhistoire de vie. Lexplication tiologique , elle, spcifie en premier lieu la trajectoire volutionniste : avec le cladogramme des vertbrs, on peut reprer lvolution du clade et ses principaux embranchements, de mme que celui de certains traits, comme les sytmes dopaminergiques (voir figure 5-11). Une explication tiologique spcifie aussi la trajectoire dveloppementale. Pour les neurones dopaminergique msencphaliques, on sait par exemple que la morphognse est cause en partie par des protines de la famille
208
GDNF (glial cell derived neurotrophic factor, (Zihlmann et al., 2005)). Peut-on fournir une explication adaptationniste ? Difficilement. On peut supposer que la capacit maximiser lutilit a t slectionn par la dynamique de population, et quelle est une adaptation la prise de dcision. Cette explication, toutefois ne nous apprend rien, car tous les animaux doivent prendre des dcisions, et donc lnonc adaptationniste, dans ce cas-ci seulement, devient une tautologie : tous les animaux ont, grosso modo, des dcisions semblables prendre, celles qutudie lcologie du comportement : quand explorer, o explorer, quoi manger, etc. Le problme de la prise de dcision est si profond quil se confond avec le problme de la survie. De la sorte, largument prsent ici tend suggrer que la perspective de Hume tait la bonne, mais uniquement pour la rationalit conomique : la capacit apprendre et prdire, comme le ralise les systmes dopaminergiques et leur analogues computationnels, se retrouve chez les vertbrs. Cette constation nest pas anodine, car elle permet de justifier non seulement lutilisation du concept de rationalit en biologie animale, mais aussi de supporter des inductions dans ltude du comportement conomique, par exemple laversion au risque. Cest toutefois une chose que de pouvoir maximiser son utilit, et une autre dy rflchir consciemment et de pouvoir en discuter. Le langage apparat donc comme un outil sophistiqu pour maximiser son utilit plutt que comme la source de la dcision conomique. Entre autres, la comptence linguistique peut participer la comptence rationnelle en ce quelle permet une planification plus subtile de laction. On sait par exemple que les zones du cerveau principalement impliques dans le traitement et la production du langage (aires de Wernicke et Broca) ont des homologues chez les primates : elles interviennent dans la planification de laction267. Laction contrle par des reprsentations seffectue partir dun ensemble dlment discrets, les gestes simples (pointer du doigt, ouvrir la main, lever le bras, etc), et selon des rgles de combinaisons (contraintes par les degrs de libert des membres), par lesquelles on produit une squence adapte un contexte et un but (cueillir une pomme en haut dun arbre); cette comptence gnrative est virtuellement sans limites (il y a une infinit de composition de gestes possibles). De mme, comme laction, le langage est constitu dun ensemble dlments discrets (vocabulaire) combins gnrativement selon des rgles de combinaisons (syntaxe) pour produire une squence linguistique adapte un contexte et un but (smantique)268. Les
267
(Paillard, 2000)
Voir aussi (Feldman & Narayanan, 2004) : des rseaux de neurones artificiels entrans apprendre des squences motrices gnralisent lapprentissage au domaine linguistique.
268
209
structures homologues auraient t recrutes, chez lhumain, pour la production du langage, la diffrence que les humains ont dvelopp des cortex prmoteurs hypertrophis compars ceux des primates : alors que les aires prmotrices ont le mme volume que le cortex moteur primaire chez les primates, elles sont six fois plus importantes chez lhomme. On peut spculer que notre capacit planifer des actes, les dcomposer en sous-actes et reprsenter les futurs possibles peut tre due lorigine motrice de nos aire linguistiques, et que cette comptence ajoute une couche logicielle dans larchitecture computationnelle de notre cerveau.
210
CONCLUSION. LCONOMIE DE LA NATURE.
Mon analyse est-elle vraie ? Ce serait une mauvaise question poser. Est-elle utile dans linvestigation scientifique () ? Je lespre, ce serait la bonne question poser. Les analyses conceptuelles en science ne sont jamais vraies ou fausses. Ce sont des tentatives dtablir des conventions conventions qui gouvernent la faon dont on pense et analyse les phnomnes naturels. - (Brandon, 2005) tous les tres organiss luttent pour s'emparer des places vacantes dans l'conomie de la nature - Darwin
Lobjet de cette thse tait linscription de la rationalit dans le monde vivant, ses limites et ses dterminants. Plutt que de restreindre la question de lintelligence, de lesprit ou de la pense animale, en bref, de la rationalit thorique et cognitive, une analyse des diffrents concepts de rationalit suggre quune rponse non triviale et accessible la question les animaux sont-ils rationnels peut avoir recours une tude de la rationalit pratique, plus particulirement de la rationalit conomique. Rpondre cette question, dans un cadre naturaliste, signifie quon dtermine en premier lieu si la catgorie ltude est une espce naturelle, et (si elle en a une) quon identifie son extension ou encore la nature de ses composantes. Pour ce faire, il a t suggr davoir recours en premier lieu aux thories de la rationalit conomique, pour voir dans quelle mesure celles-ci sont aptes nous enseigner sur la nature de cette espce, et sil sagit dune espce naturelle. Lconomie dispose en effet dun ensemble de concepts prcis et de thories qui formalisent le concept dAGENT RATIONNEL . On peut alors distinguer dune part, la comptence rationnelle, et dautre part la performance rationnelle : la premire dfinit ce quest un agent rationnel, ce quil doit possder comme comptence, la seconde dfinit la structure de ses actions. Si les agents rationnels constituent une espce naturelle, alors la comptence naturelle dfinit la structure sous-jacente qui unit la catgorie, tandis que les performances rationnelles sont expliques par la structure en question.
211
Le statut de ce concept, on la vu, oscille entre celui dune espce nomothtique, une entit dfinie par des lois de la nature, et celui dune espce normative, une entit dfinie par des critres valuatif humains. Les nombreux checs de la premire conception semble justifier la seconde, mais le normativisme fait aussi face de nombreux problmes. Le normativisme modr, qui considre que les thories de la dcision, des jeux ou du march constituent des normes daction, rencontre des problmes de calculabilit et de tractabilit : pour certaines de ces thories, aucune machine de Turing, un automate abstrait qui nest pourtant pas limit en mmoire, en temps ou en nergie, ne pourrait arriver prendre une dcision rationnelle ou atteindre un quilibre de Nash ou de march. Nous avons plutt propos que lagent rationnel soit une espce naturelle historique, dcrite non pas par des lois de la nature, mais par ses mcanismes internes et ses trajectoires particulires, ce qui implique entre autre quune thorie de lagent rationel doit tre formule par des algorithmes plutt que par des axiomatiques. Face au normativisme, une autre rplique est possible : selon le descriptivisme (les thories de la rationalit limite et cologique), il ny a aucune problme ce que les agents ne se comportent pas comme les thories formelles le prdisent, car le descriptivisme ne requiert pas que lagent se conforme des critres de rationalit : ltude de la rationalit devient en fait une question de psychologie empirique. On peut toutefois accuser celui-ci davoir chang de sujet : sil ny a plus de distinction entre une action rationnelle et irrationnelle, dans quelle mesure sagit-il de rationalit ? Face ces problmes, nous avons suggr, suivant Quine, quune thorie de la rationalit nest pas une thorie normative au sens strict, ni une thorie descriptive scientifique, mais quelle appartient plutt un troisime type de connaissances, savoir les connaissances ingniriques. Une connaissance ingnirique ne se veut pas une connaissance rgle par des impratifs comme la vrit ou le bien, mais plutt par des contraintes et des objectifs pragmatiques. Elle admet donc en son sein des verbes comme devoir , mais qui sont toujours suivis de pour . Une thorie de lagent rationnel dcrit donc ce quil devrait faire si il poursuit tel ou tel but, et si il est dans telle ou telle situation. Cette normativit instrumentale ninterdit pas alors de traiter des agents rationnels comme des espces naturelles tout en employant les concepts de rationalit classique. De la sorte, lexplication approprie de la comptence rationnelle est une explication qui passe par un modle mcaniste, plutt que par des lois de la nature. Dans une explication par modles, en effet, les lois ou principes sont des prescriptions mthodologiques pour construire des modles scientifiques, et ce sont ces modles qui sont confronts aux agents rels plutt que des principes comme lquilibre de Nash ou la
212
slection de la stratgie dominante. Nous avons ainsi prsent un modle de la comptence rationnelle, inspir de la thorie du contrle. Suivant divers arguments et constats en intelligence artificielle, nous avons dfini la comptence rationnelle commme tant la capacit, pour un contrleur embarqu, maximiser une fonction dutilit multi-attributs selon un schme de contrle adaptatif, ce qui implique entre autre la capacit dapprendre et le guidage du comportement laide de modles inverses et directs. Nous avons aussi suggr quune thorie de la comptence rationnelle doit, linstar de la biologie, passer dune conception typologique une conception populationnelle, et considrer quun agent rationnel est toujours insr dans une dynamique de population, dans laquelle diffrentes stratgies et diffrents profils seront distribus. Il y a cependant toujours la possibilit de soutenir un argument interprtiviste, une forme de normativisme fort, leffet que la rationalit des agents est dtermine non pas par des thories normatives, mais par nos a priori normatifs, notre capacit interprter et attribuer de la rationalit. En tentant dinterprter les animaux, on pourrait alors dterminer ceux qui sont rationnels, ou quel degr ils le sont, en fonction de notre succs les interprter selon nos attitudes et concepts ordinaires de rationalit. Cette faon de faire est toutefois problmatique, car elle requiert que nous classions les animaux selon une proprit relationnelle, savoir leffet quils ont sur nos attitudes interprtatives, et ensuite que ce classement soit effectu selon un critre de similarit de fonction : tous les animaux qui dmontrent un comportement rationnel sont regroups en une mme catgorie. Or la biologie comparative ne lentendrait certainement pas ainsi. Une classification, en cladistique, est toujours effectue en identifiant des espces naturelles : soit des lignes, soit des homologies. Dterminer o sarrte lextension de la catgorie AGENT RATIONNEL signifie quon doit expliciter le(s) clade(s) compos(s) dagents rationnels et montrer quelles structures sous-jacentes les unis. cet effet, nous avons suggr de considrer que le clade vertbr constitue une espce naturelle apte constituer lextension du concept AGENT RATIONNEL, car on y retrouve la fois les proprits de surfaces et les structures sousjacentes typiques des agents rationnels. Lcologie du comportement dcrit des animaux comme des maximisateurs dutilit paramtriquement, stratgiquement et socialement rationnels. Contre un critique qui ny verrait quune maximisation de laptitude (fitness) nous avons propos une distinction entre les deux concepts, qui justifie lemploi du vocabulaire conomique en biologie. Une tentative de rduction de la comptence rationnelle certaines dispositions neuronales prsentes chez tous les vertbrs a t prsente, en particulier les systmes dopaminergiques, qui se sont rvls tre des lments-cl de la maximisation de lutilit, tout en implmentant des processus computationnels aptes dcrire le comportement et la motivation dagents rationnels.
213
Il ressort de cette recherche, si elle est juste, que ce quon appelle un agent conomiquement rationnel est une espce naturelle historique qui se rduit au clade des vertbrs. On pourrait bien sr tenter de voir dans quelle mesure le concept stend dautres clades, car il ne serait pas tonnant de constater que ces proprits soient partages par dautres clades, une espce naturelle ntant pas dtermine par des conditions ncessaires et suffisantes, mais plutt par des aggrgats de proprits cooccurentes. Cependant, en maintenant lextension au clade vertbr, on dispose alors dune capacit inductive scientifiquement intressante, qui permet de supporter des infrences dune espce lautre en vertu de la relative homognit du cerveau vertbr. Cette pratique tant dj courante en neuroconomie, il est alors impratif dassurer les hypothses qui fondent ce genre dinduction. Des neuroscientifiques, comme des thoriciens des jeux et des conomistes269 ont explicitement souhait lunification des sciences du comportement et de la dcision. On constate en effet que la thorie des jeux volutionnistes (Hofbauer & Sigmund, 1998), les neurosciences de la dcision (Glimcher, 2003), ou lconomie computationnelle base dagents (Tesfatsion & Judd, 2006) analysent tous un agent rationnel abstrait, sans tre idalis ou parfait, en utilisant des ressources conceptuelles communes. La rationalit napparat pas comme une science autonome, mais un domaine denqute commun des sciences descriptives (biologie, psychologie, sciences cognitives), constructives (intelligence et vie artificielle,), hybrides (conomie), formelles (thorie de la dcision, des jeux, du march, thorie du contrle), de mme qu la philosophie de lesprit, des sciences et de linformation. Le prsent travail se veut une contribution philosophique cette thorie unifie du comportement (Gintis 2000), en identifiant la nature de cet agent et les mcanismes neuronaux qui sous-tendent sa comptence rationnelle. Au-del de ltude dhypothses scientifiques, ce travail suggre aussi dabandonner une perspective traditionnelle, celle de la Scala Naturae, cette ide selon laquelle on peut ordonner le monde vivant sur une chelle qui va du plus simple au plus complexe. Cette conception perdure malheureusement en philosophie et parfois en psychologie comparative270, et il est temps de suggrer une autre avenue. Le principal dfaut de cette faon de faire nest pas quelle fasse de notre espce la plus complexe, mais plutt quelle utilise une rgle de catgorisation qui na pas lieu dtre en biologie. Le monde vivant est organis, certes mais cette organisation ressemble plus un arbre qu une chelle. Tous les tres
269
(Berthoz, 2003: 40-41; Gintis, 2000: 240, 2006, venir). Voir la critique de Campbell et Hodos (Campbell & Hodos, 1991; Hodos & Campbell, 1969).
270
214
vivants appartiennent une population, et ces populations sont classes selon des relations dascendance commune. Conformment lide dune conception populationnelle de la rationalit, nous proposons en terminant de ressuciter une ide qui traverse les travaux de Darwin, savoir celle dune conomie de la nature : un monde vivant compos dagents conomiques en interactions qui se diffrencient par leur rles conomiques plutt que par leur place sur une chelle. On le sait, le principe de slection naturelle et la thorie de lvolution des espces de Darwin comportent deux sources conomiques : tout dabord, lide de Malthus (Malthus, [1798]1992) selon laquelle une population crot de faon gomtrique, alors que ses ressources, elles, croissent de faon arithmtique. Aprs quelques temps, certains individus nauront pas de descendance en raison du manque de ressource. Ensuite, la main invisible dAdam Smith : (A. Smith, [1776]1991): lquilibre global dune population et la diversification des fonctions (la division du travail par exemple) nest pas le produit dune instance centrale de commande ou de lintention de chacun deux, mais le produit de lactivit dune multitude dagents. Transpos au monde biologique, o les ressources sont limites et les populations survivent et se diversifient sans planification concerte, ces principes donne une image du monde vivant comme celui dune conomie de la nature, lexpression quemploie courament Darwin dans LOrigine des espces. Cest donc parce quil y a de la raret quon observe de la comptition dans le monde naturel, et cette comptition avantagera ceux qui auront dvelopp des traits morphologiques, comportementaux ou physiologiques qui les rendent plus aptes survivre et se reproduire afin de poursuivre leur rle conomique. Lconomie de la nature est un phnomme pour lequel Darwin propose une explication, soit la lutte universelle pour l'existence et la slection naturelle qui sensuit. La thorie de lvolution explique comment peut se constituer cette conomie, mais non sa structure. Darwin avait toutefois mis au jour un nouveau champs de connaissances explorer, soit les relations quentretiennent entre eux et avec leur environnement les tres vivants, ce qui est aujourdhui le domaine de lcologie. Ernst Haeckel, fondateur de cette science, la dfinissait comme le corps de connaissances concernant lconomie de la nature lensemble des relations de lanimal avec son environnement organique et inorganique 271. Jusquau dbut du XXe sicle, ce qui aujourdhui sappelle lconomie portait encore le nom dconomie politique, savoir la
Dans Morphology of Organisms (1866). Cette citation se retrouve dans lintroduction de plusieurs manuels dcologie conteporains (Dodson, 1998: 2).
271
215
production, la distribution et la consommation de la richesse , et lconomie tout court dsignait de faon gnrale larrangement ordonn dun corps organis 272 : lconomie politique tait lconomie du corps social. Nous nous proposons de restaurer cette conception de lconomie comme une science gnrale, o on peut isoler une conomie naturelle et une conomie politique. Les individus tudis sont trs diffrents, car la monnaie ou la bourse sont des institutions humaines, mais les individus dune conomie politique et naturelle partage un principe fondamental, savoir la maximisation de lutilit, et il y a donc, un niveau dabstraction suprieur, des concepts et des thories qui runissent ces individus, ainsi que le dmontre lcologie du comportement et les neurosciences de la dcision. La diffrence entre les entits tudies nest pas un problme en soi : la zoologie et la botanique273 tudient des formes de vies trs diffrentes, mais font toutes deux parties de la biologie car elles tudient des organismes vivants, issu dune histoire volutionniste. Cette conception na pas que des consquences thoriques. Dun point de vue politique, si lconomie humaine est une des conomies de la nature, quelle soit la plus complexe ne lautorise pas pour autant causer les dommages quon connat aux conomies animales, comme par exemple : prs de la moiti de la surface de la terre transforme par l'action humaine; la concentration de dioxide de carbone dans l'atmosphre augmente de 30% depuis le dbut de la rvolution industrielle; nous produisons plus d'azote que toute les sources naturelles peuvent conjointement en produire; la moitie de l'eau frache de surface est l'usage de l'humanit, prs d'une espce d'oiseau sur quatre est menace d'extinction (Vitousek et al., 1997). Ces dommages sont habituellement traits comme tant ce que les conomistes appellent des externalits , cest dire des cots qui affectent une tierce partie, externe un march ou une transaction274. Lutilit de cette tierce partie est augmente ou diminue sans que cette variation soit rflte dans les prix du march. Or dans une perspective ou les conomies et les cologies se confondent, plutt quune externalit, notre action nfaste sur les autres formes de vies tient plutt du dommage conomique : nous rduisons de faon significative la capacit de populations mtazoaires, incluant la ntre, mener bien leur activit conomique. Nos actions doivent tre alors juges thiquement et conomiquement, et nous ne pouvons
272
Entre conomie de l Encyclopdie Britannica de 1911, volume 8, page 910. Lexemple est de Ghiselin (Ghiselin, 1978), qui soutient la mme thse unificatrice. Une externalit peut aussi tre positive.
273
274
216
considrer la vie animale uniquement comme une tierce partie externe nos marchs. Toutes les conomies de la nature sont relies, et nous nous comportons comme si la ntre tait dans un dilemme du prisionnier, o il est plus avantageux pour chaque agent de ne pas cooprer, mme si collectivement nous en profitons moins. Les expriences ont montr que les agents individuels ont tendance cooprer dans ces jeux, mais la logique des organisations ne reflte pas celle des individus : les derniers, mais non les premires, peuvent avoir des motions sociales ou de lempathie pour lautre. De la sorte, dans ce dilemme du prisonnier contre la nature, nos organisations prives et publiques tendent prfrer la dfection, au dtriment de lordre cologique. Si nous ne tolrons pas les dommages conomiques entre les conomies humaines, nous ne devrions pas les tolrer entre les conomies de la nature, et rechercher un optimum de Pareto cologique plutt quun quilibre de Nash Il reste alors souhaiter, pour les raisons thoriques et pratiques avances ici, quun jour des Manuels dconomie Comparative trouvent leur chemins dans nos librairies.
217
INDEX
algorithmes DT, 207 apprentissage, 60, 80, 82, 91, 94, 116, 117, 118, 119, 120, 121, 125, 126, 128, 132, 135, 161, 168, 169, 181, 188, 189, 191, 193, 195, 196, 199, 203 aptitude (fitness), 27, 28, 37, 38, 102, 161, 165, 170, 179, 180, 181, 182, 184, 185, 186, 206, 212 architecture de contrle, 105, 107, 113, 133, 135, 136, 165, 169, 185, 196, 197 attitudes propositionnelles, 19, 26, 130, 131, 140, 141, 142, 170 cladistique, 23, 145, 147, 149, 150, 151, 152, 154, 158, 204, 212 comptence rationnelle, ii, 14, 51, 52, 65, 92, 104, 105, 109, 112, 164, 165, 166, 170, 185, 205, 206, 208, 210, 211, 212, 213 connaissance ingnirique, 88, 100, 137, 211 contrle adaptatif, ii, 14, 102, 113, 115, 119, 136, 185, 196, 212 contrle embarqu, 107, 109, 110, 186, 188 croyances, 12, 19, 20, 24, 25, 26, 28, 37, 48, 56, 61, 64, 65, 66, 101, 102, 103, 130, 131, 140, 141, 142, 143, 144, 145, 147, 168 Davidson, Donald, 17, 19, 51, 62, 63, 64, 65, 139, 140, 141, 142, 143, 144, 145, 195 Dennett, Daniel, 64, 101, 117, 144, 145, 146, 180 dsirs, 24, 26, 56, 61, 64, 65, 66, 75, 89, 110, 130, 131, 140, 141, 143, 144, 145, 147, 171 dopamine: dopaminergique, 190, 192, 196, 197, 206, 207 Dretske, Fred, 104, 129 cologie du comportement, 14, 38, 91, 165, 172, 175, 177, 178, 179, 182, 185, 208, 212, 215 motions, 18, 22, 160, 188, 189 espce naturelle, 13, 14, 19, 20, 21, 22, 23, 41, 42, 44, 45, 46, 49, 50, 52, 53, 55, 61, 74, 105, 137, 148, 156, 159 espces historiques, 43, 46, 75, 79 espces naturelles, 20 espces nomothtiques, 13, 40, 43, 44, 45, 46, 79 espces normatives, 40, 46, 48, 49, 50 explication adaptationniste, 94, 158, 163, 208 Griffiths, Paul, 22, 156 homologie, 45, 140, 149, 150, 152, 153, 154, 155, 156, 157, 158, 159, 160 Hume, David, 47, 146 indpendane au chemin, 76 ingnirie, 81, 88, 89, 90, 91, 92, 95, 96, 99, 107, 109, 113, 119, 131, 132, 133, 137, 197 interprtivisme, 14, 62, 66, 75, 139, 140, 145, 146, 147 mcanisme, 14, 45, 49, 60, 75, 92, 94, 97, 101, 102, 127, 146, 148, 150, 158, 163, 171, 187, 188 modle inverse, 134, 135 modle mcaniste, ii, 14, 92, 137, 211 modle scientifique, 95, 96 modles cognitifs, 131, 132, 196 modles directs, 133, 135, 136, 185, 197, 202 modles inverses, 133, 134, 135, 199, 202, 212 neuroconomie, 38, 193, 213 normativisme, 40, 49, 62, 65, 66, 70, 74, 81, 211, 212 normativit, 40, 46, 47, 85, 86, 87, 88, 90, 99, 100, 136, 157, 211 optimisation: optimalit, 38, 54, 91, 101, 111, 112, 119, 120, 121, 122, 126, 127, 128, 136, 173, 179, 180, 181, 183 performance rationnelle, 51, 105, 210 population, dynamique de, 119, 122, 125, 126, 135, 136, 185, 203, 204, 208, 212 propositions, 24, 62, 68, 131, 132 Proust, Jolle, ii, iii, 19, 128, 164, 167 rationalit animale, ii, 12, 13, 16, 17, 18, 23, 35, 36, 37, 39, 139, 143, 145, 163, 165, 167, 169, 170 rationalit cognitive, 26, 36 rationalit cologique, iii, 83 rationalit conomique, 28, 30, 35, 36, 37, 39, 40, 80, 88, 90, 91, 100, 101, 102, 103, 104, 136, 157, 168 rationalit limite, 24, 81, 82, 106, 112, 126, 127, 128, 178 rationalit paramtrique, 30, 35, 53, 125 rationalit sociale, 33, 35, 177
218
rationalit stratgique, 31, 32, 33, 35, 176 renforcement, 117, 118, 195, 196, 203 reprsentation cognitive, 129, 197 rle causal, 129, 147, 157, 158, 159 systme dynamique, 76, 107, 112 systme ergodique, 76 systme non-ergodique, 77, 78, 80, 171 thorie de la dcision, 10, 28, 30, 35, 53, 56, 57, 58, 61, 62, 64, 65, 73, 85, 86, 87, 91, 98, 125, 176, 213
thorie des jeux, iii, 30, 31, 32, 38, 56, 58, 59, 63, 69, 82, 87, 91, 122, 123, 125, 144, 176, 213 thorie des jeux volutionnistes, 213 thorie du contrle, 90, 106, 107, 111, 133, 212, 213 urne de Polya, 77 utilit, maximisation de l', 27, 28, 31, 32, 35, 39, 102, 112, 157, 165, 170, 172, 179, 181, 182, 185, 188, 189, 190, 196, 212, 215 vertbr, 14, 165, 190, 202, 204, 205, 206, 212, 213
219
BIBLIOGRAPHIE
Rfrences Abouheif, E., Akam, M., Dickinson, W. J., Holland, P. W. H., Meyer, A., Patel, N. H., et al. (1997). Homology and developmental genes. Trends in Genetics, 13(11), 432. Alberts, B. (2002). Molecular biology of the cell (4th ed.). New York: Garland Science. Alchian, A. A. (1950). Uncertainty, evolution, and economic theory. The Journal of Political Economy, 58(3), 211-221. Alcock, J. (1989). Animal behavior: An evolutionary approach (4th ed.). Sunderland, Mass: Sinauer Associates. Allais, M. (1953). Le comportement de l'homme rationnel devant le risque: Critique des postulats et axiomes de l'cole amricaine. Econometrica, 21(4), 503-546. Allen, C., Bekoff, M., & Lauder, G. V. (1998). Nature's purposes: Analyses of function and design in biology. Cambridge, Mass.: The MIT Press. Amundson, R. (2000). Homology and homoplasy: A philosophical perspective. In Encyclopedia of life sciences. Chichester: John Wiley & Sons. Amundson, R., & Lauder, G. V. (1994). Function without purpose: The uses of causal role function in evolutionary biology. Biology and Philosophy, 9(4), 443-470. Anderson, D. J. (1983a). Optimal foraging and the traveling salesman. Theoretical Population Biology, 24(2), 145. Anderson, J. R. (1983b). The architecture of cognition. Cambridge, Mass.: Harvard University Press. Anderson, J. R., & Bower, G. H. (1980). Human associative memory: A brief edition. Hillsdale, N.J.: L. Erlbaum Associates. Andrewes, D. G. (2001). Neuropsychology: From theory to practice. Philadelphia, Pa.: Psychology Press. Antsaklis, P. J. (1994). Defining intelligent control. Report of the task force on intelligent control. IEEE Control Systems Magazine, June 1994, 4-66. Arrow, K. J., & Debreu, G. (1954). Existence of an equilibrium for a competitive economy. Econometrica, 22, 265-290. Ashby, W. (1952). Design for a brain. New York: Wiley. Aubin, J. P. (1991). Viability theory: Birkhuser. Aumann, R. J. (1997). Rationality and bounded rationality. Games and Economic Behavior, 21(1-2), 2. Aumann, R. J., & Sorin, S. (1989). Cooperation and bounded recall. Games and Economic Behavior, 1(1), 5. Auyang, S. Y. (2004). Engineering: An endless frontier. Cambridge, MA: Harvard University Press. Axelrod, R., & Hamilton, W. D. (1981). The evolution of coperation. Science, 211, 1390-1396. Banks, J. S., & Sundaram, R. K. (1994). Switching costs and the gittins index. Econometrica: Journal of the Econometric Society, 62(3), 687-694.
220
Barkow, J. H., Cosmides, L., & Tooby, J. (1992). The adapted mind: Evolutionary psychology and the generation of culture. New York: Oxford University Press. Barsalou, L. W. (1999). Perceptual symbol systems. Behav Brain Sci, 22(4), 577609; discussion 610-560. Barsalou, L. W. (2003). Abstraction in perceptual symbol systems. Philos Trans R Soc Lond B Biol Sci, 358(1435), 1177-1187. Barsalou, L. W. (2005). Continuity of the conceptual system across species. Trends Cogn Sci, 9(7), 309-311. Bayer, H. M., & Glimcher, P. W. (2005). Midbrain dopamine neurons encode a quantitative reward prediction error signal. Neuron, 47(1), 129. Beauchamp, T. L. (1999). Hume on the nonhuman animal. The Journal of Medicine and Philosophy, 24(4), 322-335. Bechara, A., & Damasio, A. (2005a). The somatic marker hypothesis: A neural theory of economic decision. Games and Economic Behavior, In Press, Corrected Proof. Bechara, A., & Damasio, A. R. (2005b). The somatic marker hypothesis: A neural theory of economic decision. Games and Economic Behavior, 52(2), 336. Bechtel, W., & Abrahamsen, A. (2005). Explanation: A mechanist alternative. Studies in History and Philosophy of Biological and Biomedical Sciences, 36, 421-441. Bechtel, W., & Richardson, R. C. (1993). Discovering complexity: Decomposition and localization as strategies in scientific research. Princeton, NJ: Princeton University Press. Becker, G. S. (1962). Irrational behavior and economic theory. Journal of Political Economy, LXX, 1-13. Bellman, R. E. (2003 [1957]). Dynamic programming (Dover ed.). Mineola, N.Y.: Dover Publications. Belnap, N. D., Perloff, M., & Xu, M. (2001). Facing the future: Agents and choices in our indeterminist world. Oxford [England]; New York: Oxford University Press. Bennett, J. F. (1971). Rationality. An essay towards an analysis. London: Routledge and Kegan Paul. Benoit, M., & Robert, P. H. (2003). Behavior, neural basis of. In Encyclopedia of the neurological sciences (pp. 364). New York: Elsevier Ltd. Beran, M. J., Smith, J. D., Redford, J. S., & Washburn, D. A. (2006). Rhesus macaques (macaca mulatta) monitor uncertainty during numerosity judgments. J Exp Psychol Anim Behav Process, 32(2), 111-119. Bergstrom, C. T., & Godfrey-Smith, P. (1998). On the evolution of behavioral heterogeneity in individuals and populations. Biology and Philosophy, 13(2), 205. Bermdez, J. L. (2000). Rationality, logic and fast and frugal heuristics: Review of gigerenzer et al. Behavioral and Brain Sciences, 23, 744-745. Bermdez, J. L. (2003). Thinking without words. Oxford; New York: Oxford University Press. Berridge, K. C. (2003). Irrational pursuits: Hyper-incentives from a visceral brain. In I. Brocas & J. Carrillo (Eds.), The psychology of economic decisions (pp. 17-40). Oxford: Oxford University Press. Berridge, K. C. (2004). Motivation concepts in behavioral neuroscience. Physiol Behav, 81(2), 179-209.
221
Berridge, K. C., & Robinson, T. E. (1998). What is the role of dopamine in reward: Hedonic impact, reward learning, or incentive salience? Brain Res Brain Res Rev, 28(3), 309-369. Berridge, K. C., & Robinson, T. E. (2003). Parsing reward. Trends Neurosci, 26(9), 507-513. Berthoz, A. (2003). La dcision. Paris: Odile Jacob. Bigelow, J., Ellis, B., & Lierse, C. (1992). The world as one of a kind: Natural necessity and laws of nature. The British Journal for the Philosophy of Science, 43(3), 371-388. Binmore, K. (1987/88). Modeling rational players. Economics and Philosophy, 3,4, 179-214 & 179-155. Binmore, K. (1994). Rationality in the centipede. In R. Fagin (Ed.), Theoretical aspects of reasoning about knowledge: Proceedings of the 5th conference (tark 1994) (pp. 150-159). San Francisco, CA: Kaufmann. Binmore, K. (1999). Why experiment in economics? Economic Journal, 109(453, Features), F16-F24. Binmore, K., Shaked, A., & Sutton, J. (1985). Testing noncooperative bargaining theory: A preliminary study. The American Economic Review, 75(5), 1178-1180. Birkhoff, G. D. (1927). Dynamical systems. New York: American mathematical society. Bohan Broderick, P. (2004). On communication and computation. Minds and Machines, 14(1), 1. Bolhuis, J. J., & Hogan, J. A. (Eds.). (1999). The development of animal behavior: A reader. Oxford: Blackwell. Bornstein, G., Kugler, T., & Ziegelmeyer, A. (2004). Individual and group decisions in the centipede game: Are groups more "rational" players? Journal of Experimental Social Psychology, 40, 599-605. Bosch-Domnech, A., Montalvo, J. G., Nagel, R., & Satorra, A. (2002). One, two, (three), infinity.: Newspaper and lab beauty-contest experiments. American Economic Review, 92(5), 1687-1701. Boy, S., & Vandenberghe, L. (2004). Convex optimization. Cambridge: Cambridge University Press. Boyd, R. (1991). Realism, anti-foundationalism and the enthusiasm for natural kinds. Philosophical Studies, 61(1 - 2), 127. Boyd, R. (1999a). Homeostasis, species, and higher taxa. In R. Wilson (Ed.), Species: New interdisciplinary essays (pp. 141-185). Cambridge: MIT Press. Boyd, R. (1999b). Kinds, complexity and multiple realization. Philosophical Studies, 95(1 - 2), 67. Boyd, R., & Richerson, P. J. (1985). Culture and the evolutionary process. Chicago: University of Chicago Press. Brandom, R. (1994). Making it explicit: Reasoning, representing, and discursive commitment. Cambridge, Mass.: Harvard University Press. Brandom, R. (2000). Articulating reasons: An introduction to inferentialism. Cambridge, Mass.; London: Harvard University Press. Brandon, R. N. (1990). Adaptation and environment. Princeton: Princeton University Press. Brandon, R. N. (2005). Evolutionary modules: Conceptual analyses and empirical hypotheses. In W. Callebaut & D. Rasskin-Gutman (Eds.), Modularity:
222
Understanding the development and evolution of natural complex systems (pp. 51-61). Cambridge, Mass.: MIT Press. Bratman, M. E. (1987). Intention, plans, and practical reason. Cambridge, MA: Cambridge University Press. Bratman, M. E. (2000). Valuing and the will. Philosophical Perspectives: Action and Freedom, 14, 249-265. Briffa, M., & Elwood, R. W. (2005). Rapid change in energy status in fighting animals: Causes and effects of strategic decisions. Animal Behaviour, 70(1), 119. Brigandt, I. (2002). Homology and the origin of correspondence. Biology and Philosophy, 17(3), 389. Briggman, K. L., Abarbanel, H. D. I., & Kristan, W. B., Jr. (2005). Optical imaging of neuronal populations during decision-making. Science, 307(5711), 896901. Briggs, D. E. G., & Crowther, P. R. (2001). Palaeobiology ii. Osney Mead, Oxford; Malden, MA: Blackwell Science. Bronfman, C., McCabe, K., Porter, D., Rassenti, S., & Smith, V. L. (1996). An experimental examination of the walrasian tatonnement mechanism. The Rand Journal of Economics, 27(4), 681-699. Brooks, R. A. (1991a). Intelligence without reason. MIT AI Lab Memo No. 1293. Brooks, R. A. (1991b). Intelligence without representation. Artificial Intelligence Journal, 47, 139-159. Brooks, R. A. (1999). Cambrian intelligence: The early history of the new ai. Cambridge, Mass.: MIT Press. Brown, H. I. (1995). Rationality. In T. Honderich (Ed.), The oxford companion to philosophy (pp. 744-745). Oxford: Oxford University Press. Brown, R., Murphy, D., Stich, S., Dryden, D., Redding, P., MacNaughton, N., et al. (1999). Eliminating emotions? (review symposium on what emotions really are: The problem of psychological categories by paul e. Griffiths). Metascience, 8(1), 5-62. Bshary, R., & Schaffer, D. (2002). Choosy reef fish select cleaner fish that provide high-quality service. Animal Behaviour, 63(3), 557. Bures, J., Buresova, O., & Nerad, L. (1992). Can rats solve a simple version of the traveling salesman problem? Behav Brain Res, 52(2), 133-142. Callier, S., Snapyan, M., Le Crom, S., Prou, D., Vincent, J. D., & Vernier, P. (2003). Evolution and cell biology of dopamine receptors in vertebrates. Biol Cell, 95(7), 489-502. Camerer, C. (2000). Prospect theory in the wild. In D. Kahneman & A. Tversky (Eds.), Choice, values, and frames (pp. 288-300). New York: Cambridge University Press. Camerer, C. (2003). Behavioral game theory: Experiments in strategic interaction. Princeton: Princeton University Press. Camerer, C., Loewenstein, G., & Rabin, M. (2003). Advances in behavioral economics. Princeton: Princeton University Press. Camerer, C., & Thaler, R. H. (1995). Anomalies: Ultimatums, dictators and manners. The Journal of Economic Perspectives, 9(2), 209-219. Campbell, C. B., & Hodos, W. (1991). The scala naturae revisited: Evolutionary scales and anagenesis in comparative psychology. J Comp Psychol, 105(3), 211-221. Canning, D. (1992). Rationality, computability, and nash equilibrium. Econometrica: Journal of the Econometric Society, 60(4), 877-888.
223
Carnap, R. (1937). The logical syntax of language. London: K. Paul, Trench, Trubner & co., ltd. Carnap, R. (1962). The aim of inductive logic. In E. Nagel, P. Suppes & A. Tarski (Eds.), Logic, methodology and philosophy of science. Proceedings of the 1960 international congress (pp. 303-318). Stanford: Stanford University Press. Carroll, L. (1895). What the tortoise said to achilles. Mind, 4(14), 278-280. Cartwright, N. (1989). Nature's capacities and their measurement. Oxford: Oxford University Press. Cartwright, N. (1999). The dappled world: A study of the boundaries of science. Cambridge, UK New York, NY: Cambridge University Press. Case, K., & Fair, R. (1992). Principles of economics (2d ed.). Englewood Cliffs, NJ: Prentice Hall. Chaminade, T., Meary, D., Orliaguet, J. P., & Decety, J. (2001). Is perceptual anticipation a motor simulation? A pet study. Neuroreport, 12(17), 36693674. Chen, H., Hua, S. E., Smith, M. A., Lenz, F. A., & Shadmehr, R. (2005). Effects of human cerebellar thalamus disruption on adaptive control of reaching. Cereb Cortex. Chen, K., Lakshminarayanan, V., & Santo, L. (2006). The evolution of our preferences: Evidence from capuchin-monkey trading behavior. Journal of Political Economy. Cherniak, C. (1986). Minimal rationality. Cambridge, Mass.: MIT Press. Chomsky, N. (1965). Aspects of the theory of syntax. Cambridge, MA: MIT Press. Churchland, P. S., & Sejnowski, T. J. (1992). The computational brain. Cambridge, Mass.: MIT Press. Clark, A. (1997). Being there: Putting brain, body, and world together again. Cambridge, Mass.: MIT Press. Collette, Y., & Siarry, P. (2003). Multiobjective optimization: Principles and case studies. Berlin; New York: Springer. Collier, J. (1996). On the necessity of natural kinds. In P. Riggs (Ed.), Natural kinds, laws of nature, and scientific methodology (pp. 1-10). Dordrecht: Kluwer. Conant, R. C., & Ashby, W. R. (1970). Every good regulator of a system must be a model of that system. International Journal of Systems Science, 1(2), 8997. Cooper, W. S. (2001). The evolution of reason: Logic as a branch of biology. Cambridge, UK; New York: Cambridge University Press. Cosmides, L., & Tooby, J. (1996). Are humans good intuitive statisticians after all? Rethinking some conclusions from the literature on judgment under uncertainty. Cognition, 58(1), 1-73. Cramer, A. E., & Gallistel, C. R. (1997). Vervet monkeys as travelling salesmen. Nature, 387(6632), 464. Craver, C. F. (2001). Role functions, mechanisms, and hierarchy. Philosophy of Science, 68, 53-74. Craver, C. F. (2002). Interlevel experiments and multilevel mechanisms in the neuroscience of memory. Philosophy of Science, 69, S83S97. Cronk, Q. C. B., Bateman, R. M., & Hawkins, J. A. (2002). Developmental genetics and plant evolution. London; New York: Taylor & Francis.
224
Cummins, R., & Poirier, P. (2004). Representation and indication. In H. Clapin, P. J. Staines & P. Slezak (Eds.), Representation in mind: New approaches to mental representation (pp. 21-40). Amsterdam; Boston: Elsevier. D'Aquin, S. T. ([1273] 1984). Somme thologique. Paris: Cerf. Damasio, A. R. (1994). Descartes' error: Emotion, reason, and the human brain. New York: Putnam. Damasio, A. R. (1999). The feeling of what happens: Body and emotion in the making of consciousness (1st ed.). New York; London: Harcourt Brace. Damasio, A. R. (2003). Looking for spinoza: Joy, sorrow, and the feeling brain (1st ed.). Orlando, Fla.; London: Harcourt. Damasio, A. R., Everitt, B. J., & Bishop, D. (1996). The somatic marker hypothesis and the possible functions of the prefrontal cortex and discussion. Philosophical Transactions: Biological Sciences, 351(1346, Executive and Cognitive Functions of the Prefrontal Cortex), 1413-1420. Damieson, D. (1998). Animal language and thought. In E. Craig (Ed.), Routledge encyclopedia of philosophy. London: Routledge, http://www.rep.routledge.com/article/U003SECT1. Dancy, J. (Ed.). (2000). Normativity. Oxford, UK; Malden, Mass.: Blackwell Publishers. Darwall, S. L. (2003). Consequentialism. Malden, MA: Blackwell Pub. Darwin, C. (2004[1871]). Descent of man and selection in relation to sex. New York: Barnes & Noble Books. Davidson, D. (1991). Paradoxes de l'irrationalit. Combas: ditions de l'clat. Davidson, D. (1993a). Actions et vnements. Paris: Presses universitaires de France. Davidson, D. (1993b). Enqutes sur la vrit et l'interprtation. Nmes: ditions Jacqueline Chambon. Davidson, D. (2004). Problems of rationality. Oxford: Oxford University Press. Davidson, D., Suppes, P., & Siegel, S. (1957). Decision making: An experimental approach. Stanford: Stanford University Press. Davidson, P. R., & Wolpert, D. M. (2004). Internal models underlying grasp can be additively combined. Exp Brain Res, 155(3), 334-340. Dawkins, R. (1976). The selfish gene. New York: Oxford University Press. de Finetti, B. (1937). La prvision: Ses lois logiques, ses sources subjectives. Annales de l'Institut Henri Poincar, 7. de Queiroz, A., & Wimberger, P. H. (1993). The usefulness of behavior for phylogeny estimation: Levels of homoplasy in behavioral and morphological characters. Evolution, 47(1), 46-60. de Sousa, R. (1984). The natural shiftiness of natural kinds. Canadian Journal of Philosophy, 14, 561-580. Decety, J., & Grezes, J. (2006). The power of simulation: Imagining one's own and other's behavior. Brain Res, 1079(1), 4-14. Decety, J., & Ingvar, D. H. (1990). Brain structures participating in mental simulation of motor behavior: A neuropsychological interpretation. Acta Psychol (Amst), 73(1), 13-34. Dennett, D. C. (1984). Elbow room: The varieties of free will worth wanting. Cambridge, MA: MIT Press. Dennett, D. C. (1987). The intentional stance. Cambridge, Mass.: MIT Press. Dennett, D. C. (1993). Learning and labeling. Mind and Language, 8(4), 540547.
225
Dennett, D. C. (1995). Darwin's dangerous idea: Evolution and the meanings of life. New York: Simon & Schuster. Dennett, D. C. (2003). Freedom evolves. London: A. Lane. Descartes, R. ([1637] 1991). Discours de la mthode; suivi de la dioptrique. Paris: Gallimard. DeWitt, T. J., & Scheiner, S. M. (2004). Phenotypic plasticity: Functional and conceptual approaches. Oxford; New York: Oxford University Press. Dodson, S. I. (1998). Ecology. New York: Oxford University Press. Dolan, R. J. (2002). Emotion, cognition, and behavior. Science %R 10.1126/science.1076358, 298(5596), 1191-1194. Dopfer, K. (1986). Causality and consciousness in economics: Concepts of change in orthodox and heterodox economics. Journal of economic issues, 20, 509-523. Dorigo, M., & Colombetti, M. (1998). Robot shaping: An experiment in behavior engineering. Cambridge, Mass.: MIT Press. Doyle, D. (1992). The roles of rationality in reasoning. Computational Intelligence, 8(2), 376-409. Dretske, F. I. (1981). Knowledge & the flow of information. Cambridge, Mass.: MIT Press. Dretske, F. I. (1988). Explaining behavior: Reasons in a world of causes. Cambridge, Mass.: MIT Press. Dretske, F. I. (1995). Naturalizing the mind. Cambridge, Mass.: MIT Press. Dretske, F. I. (2001). Norms, history, and the mental. In D. M. Walsh (Ed.), Evolution, naturalism and mind (pp. 87-104). Cambridge: Cambridge University Press. Dretske, F. I. (2006). Minimal rationality. In S. Hurley & M. Nudds (Eds.), Rational animals? Oxford: Oxford University Press. Dugatkin, L. A., & Reeve, H. K. (1998). Game theory & animal behavior. New York; Oxford: Oxford University Press. Dukas, R. (1998). Cognitive ecology: The evolutionary ecology of information processing and decision making. Chicago: University of Chicago Press. Dukas, R. (2004). Evolutionary biology of animal cognition. Annual Review of Ecology, Evolution, and Systematics, 35(1), 347-374. Dumouchel, P. (2004). Y a-t-il des sentiments moraux? Dialogue, 43(3), 471-489. Dunbar, K., & Blanchette, I. (2001). The in vivo/in vitro approach to cognition: The case of analogy. Trends in Cognitive Sciences, 5(8), 334. Dunlap, R. E., & Catton, W. R., Jr. (1979). Environmental sociology. Annual Review of Sociology, 5, 243-273. Dupre, J. (1993). Could there be a science of economics? Midwest Studies in Philosophy, 18, 363-378. Dupuy, J. P. (1999). Rational choice theory. In R. Wilson & F. Keil (Eds.), Mit encyclopedia of the cognitive sciences (mitecs) (pp. 694-696). Durstewitz, D., & Seamans, J. K. (2002). The computational role of dopamine d1 receptors in working memory. Neural Netw, 15(4-6), 561-572. Dutta, P. K. (1999). Strategies and games: Theory and practice. Cambridge, Mass.: MIT Press. Edgeworth, F. Y. (1891). La thorie mathmatique de l'offre et de la demande et le cot de production. Revue d'conomie politique, 5(1), 10-28. Egelman, D. M., Person, C., & Montague, P. R. (1998). A computational role for dopamine delivery in human decision-making. J Cogn Neurosci, 10(5), 623-630.
226
Eliasmith, C., & Anderson, C. H. (2003). Neural engineering: Computation, representation, and dynamics in neurobiological systems. Cambridge, Mass.: MIT Press. Ellis, B. D. (2001). Scientific essentialism. Cambridge; New York: Cambridge University Press. Ellsberg, D. (1961). Risk, ambiguity, and the savage axioms. Quarterly Journal of Economics, 75, 643-669. Emmet, D. (1998). Processes. In E. Craig (Ed.), Routledge encyclopedia of philosophy. London: Routledge. Engel, P. (1989). La norme du vrai: Philosophie de la logique. Paris: Gallimard. Ereshefsky, M. (2004). Bridging the gap between human kinds and biological kinds. Philosophy of Science, 71, 912921. Evans, G. (1982). The varieties of reference. Oxford: Oxford University Press. Falk, R. (2000). The gene: A concept in tension. In P. Beurton, R. Falk & H.-J. Rheinberger (Eds.), The concept of the gene in development and evolution. Cambridge: Cambridge University Press. Farmer, J. D., Patelli, P., & Zovko, II. (2005). The predictive power of zero intelligence in financial markets. Proc Natl Acad Sci U S A, 102(6), 22542259. Feder, H. J. S., Leonard, J. J., & Smith, C. M. (1999). Adaptive mobile robot navigation and mapping. The International Journal of Robotics Research %R 10.1177/02783649922066484, 18(7), 650-668. Feldman, J., & Narayanan, S. (2004). Embodied meaning in a neural theory of language. Brain and Language, 89(2), 385. Fiorillo, C. D., Tobler, P. N., & Schultz, W. (2003). Discrete coding of reward probability and uncertainty by dopamine neurons. Science, 299(5614), 1898-1902. Fisher, R. A. (1930). The genetical theory of natural selection. Oxford: The Clarendon press. Flood, M. A. (1958). Some experimental games. Management Science, 5, 5-26. Floresco, S. B., Seamans, J. K., & Phillips, A. G. (1996). A selective role for dopamine in the nucleus accumbens of the rat in random foraging but not delayed spatial win-shift-based foraging. Behav Brain Res, 80(1-2), 161168. Floridi, L. (1997). Scepticism, animal rationality and the fortune of chrysippus' dog. Archiv fr Geschichte der Philosophie, 79, 27-57. Floridi, L. (1999). Philosophy and computing: An introduction. London; New York: Routledge. Fodor, J. A. (1974). Special sciences (or: The disunity of science as a working hypothesis). Synthese, 28(2), 97. Fodor, J. A. (1975). The language of thought. New York: Crowell. Fodor, J. A. (1981[2004]). The mind-body problem. In J. Heil (Ed.), Philosophy of mind: A guide and anthology (pp. 168-182). Oxford: Oxford University Press. Fodor, J. A. (1983). The modularity of mind: An essay on faculty psychology. Cambridge, Mass.: MIT Press. Fontenay, E. d. (1998). Le silence des btes: La philosophie l'preuve de l'animalit. Paris: Fayard. Frank, M. J., Seeberger, L. C., & O'Reilly, R. C. (2004). By carrot or by stick: Cognitive reinforcement learning in parkinsonism. Science %R 10.1126/science.1102941, 306(5703), 1940-1943.
227
Frankel, J. A., & Froot, K. A. (1987). Using survey data to test standard propositions regarding exchange rate expectations. American Economic Review, 77(1), 133-153. Frege, G. (1971). Ecrits logiques et philosophiques. Paris: Editions du Seuil. Friedman, M. (1953). Essays in positive economics. Chicago: University of Chicago Press. Friedman, M., & Savage, L. J. (1948). The utility analysis of choices involving risk. Journal of Political. Economy, 56, 279-304. Gallistel, C. R. (1990). The organization of learning. Cambridge: MIT Press. Gallistel, C. R. (1998). The modular structure of learning. In M. Gazzaniga & J. S. Altman (Eds.), Brain and mind: Evolutionary perspectives (pp. 56-68). Strasbourg: Human Frontiers Science Program. Gallistel, C. R., & Cramer, A. E. (1996). Computations on metric maps in mammals: Getting oriented and choosing a multi-destination route. J Exp Biol, 199(Pt 1), 211-217. Gallistel, C. R., & Gibbon, J. (2000). Time, rate, and conditioning. Psychol Rev, 107(2), 289-344. Ganghua, S., & Scassellati, B. (2004). Reaching through learned forward model. Garcia, C. E., Prett, D. M., & Morari, M. (1989). Model predictive control: Theory and practice--a survey. Automatica, 25(3), 335. Genesove, D., & Mayer, C. (2001). Loss aversion and seller behavior: Evidence from the housing market. The Quarterly Journal of Economics, 116(4), 1233- 1260. George, G. S. (1997). The emergence of risk aversion. Complexity, 2(4), 31-39. Gert, J. (2004). Brute rationality. Normativity and human action. Cambridge: Cambridge University Press. Ghiselin, M. T. (1974). A radical solution to the species problem. Systematic Zoology, 23, 536-544. Ghiselin, M. T. (1978). The economy of the body. The America Economic Review, 68 (2), 233-237. Gibbard, A. (1990). Wise choices, apt feelings: A theory of normative judgment. Cambridge, Mass.: Harvard University Press. Gibbard, A. (2003). Thinking how to live. Cambridge, Mass.: Harvard University Press. Gibbard, A., & Varian, H. R. (1978). Economic models. The Journal of Philosophy, 75(11), 664-677. Giere, R. N. (1999). Science without laws. Chicago: University of Chicago Press. Giere, R. N. (2004). How models are used to represent reality. Philosophy of Science, 71(5), 742-752. Gigerenzer, G. (2000). Adaptive thinking: Rationality in the real world. New York: Oxford University Press. Gigerenzer, G., & Selten, R. (2001). Bounded rationality: The adaptive toolbox. Cambridge, Mass.: MIT Press. Gigerenzer, G., Todd, P. M., & Group, A. R. (1999). Simple heuristics that make us smart. New York: Oxford University Press. Gilbert, S. F. (2006). Developmental biology (8th ed.). Sunderland, Mass.: Sinauer Associates, Inc. Publishers. Gintis, H. (2000). Game theory evolving: A problem-centered introduction to modeling strategic behavior. Princeton, N.J.: Princeton University Press. Gintis, H. (2006, venir). The unification of the behavioral sciences. Behavioral and Brain Sciences.
228
Giraldeau, L.-A., & Caraco, T. (2000). Social foraging theory. Princeton, N.J.: Princeton University Press. Giraud, G. (2000). La thorie des jeux. Paris: Flammarion. Gittins, J. C. (1989). Multi-armed bandit allocation indices. New York: Wiley. Glad, T., & Ljung, L. (2000). Control theory: Multivariable and nonlinear methods. London; New York: Taylor & Francis. Glimcher, P. W. (2003). Decisions, uncertainty, and the brain: The science of neuroeconomics. Cambridge, Mass.; London: MIT Press. Glimcher, P. W., Dorris, M. C., & Bayer, H. M. (2005). Physiological utility theory and the neuroeconomics of choice. Games and Economic Behavior, 52(2), 213. Gode, D. K., & Sunder, S. (1993). Allocative efficiency of markets with zerointelligence traders: Market as a partial substitute for individual rationality. Journal of Political Economy, 101, 119-137. Godfrey-Smith, P. (1996). Complexity and the function of mind in nature. Cambridge; New York: Cambridge University Press. Godfrey-Smith, P. (2003). Folk psychology under stress: Comments on susan hurley's 'animal action in the space of reasons'. Mind & Language, 18(3), 266-272. Godfrey-Smith, P. (2005). Folk psychology as a model. Philosophers' Imprint, 5(6). Goeree, J., & Holt, C. (2001). Ten little treasures of game theory and ten intuitive contradictions. American Economic Review, 91(5), 1402-1422. Goldman, A. I. (1970). A theory of human action. Englewood Cliffs, N.J.: Prentice-Hall. Goldman, A. I. (1999). Knowledge in a social world. Oxford: Oxford University Press. Goodman, N. (1984[1954]). Faits, fictions et prdictions. Paris: Minuit. Gould, S. J., & Lewontin, R. C. (1979). The spandrels of san marco and the panglossian paradigm: A critique of the adaptationist programme. Proc R Soc Lond B Biol Sci., 205(1161), 581-598. Grafen, A. (1999). Formal darwinism, the individual-as-maximising-agent analogy, and bet-hedging. Proc. Roy. Soc. Ser. B, 266, 799803. Grafen, A. (2002). A first formal link between the price equation and an optimization program. Journal of Theoretical Biology, 217(1), 75. Grafen, A. (2006). Optimization of inclusive fitness. J Theor Biol, 238(3), 541563. Gray, J. A. (1988). The psychology of fear and stress. Cambridge: Cambridge University Press. Grice, H. P. ([1975]1991). Method in philosophical psychology (from the banal to the bizarre). In The conception of value (pp. 121-162). Oxford: Oxford University Press. Griffiths, P. E. (1994). Cladistic classification & functional explanation. Philosophy of Science, 61(2), 206-227. Griffiths, P. E. (1997). What emotions really are: The problem of psychological categories. Chicago, Ill.: University of Chicago Press. Griffiths, P. E. (1999). Squaring the circle: Natural kinds with historical essences. In R. Wilson (Ed.), Species: New interdisciplinary studies. Cambridge, MA: MIT Press. Griffiths, P. E. (2004). Emotions as natural and normative kinds. Philosophy of Science, 71, 901911.
229
Griffiths, P. E. (2006, sous presse). Function, homology and character individuation. Philosophy of Science. Grillner, S., & Wallen, P. (1985). Central pattern generators for locomotion, with special reference to vertebrates. Annu Rev Neurosci, 8, 233-261. Grim, P. (1997). The undecidability of the spatialized prisoner's dilemma. Theory and Decision, 42(1), 53. Grzes, J., & Decety, J. (2001). Functional anatomy of execution, mental simulation, observation and verb generation of actions: A meta-analysis. Human Brain Mapping, 12, 1-19. Grtschel, M., & Padberg, M. (1993). Ulysses 2000: In search of optimal solutions to hard combinatorial problems (Technical Report): New York University Stern School of Business. Gurevitch, J., Morrison, J. A., & Hedges, L. V. (2000). The interaction between competition and predation: A meta-analysis of field experiments. Am Nat, 155(4), 435-453. Gwartney, J. D., Stroup, R., MacPherson, D., & Sobel, R. S. (2006). Economics, private and public choice (11th ed.). Cincinnati, Ohio: South-Western College Pub. Gth, W., Schmittberger, R., & Schwarze, B. (1982). An experimental analysis of ultimatum bargaining. Journal of Economic Behavior and Organization, 3(4), 367-388. Hacking, I. (1991). A tradition of natural kinds. Philosophical Studies, 61, 109126. Hacking, I. (1992). World-making by kind-making: Child abuse for example. In M. Douglas & D. Hull (Eds.), How classification works: Nelson goodman among the social sciences (pp. 180-238). Edinburgh: Edinburgh University Press. Hall, B. K. (Ed.). (1994). Homology: The hierarchical basis of comparative biology. San Diego: Academic Press. Hames, R. B., & Vickers, W. T. (1982). Optimal diet breadth theory as a model to explain variability in amazonian hunting. American Ethnologist, 9(2, Economic and Ecological Processes in Society and Culture), 358-378. Hammerstein, P., & Hagen, E. H. (2005). The second wave of evolutionary economics in biology. Trends in Ecology & Evolution, 20(11), 604. Hansen, A. J. (1986). Fighting behavior in bald eagles: A test of game theory. Ecology, 67(3), 787-797. Hardcastle, V. G. (1996). How to build a theory in cognitive science. Albany: State University of New York Press. Hardin, G. (1968). The tragedy of the commons. Science, 162(3859), 1243-1248. Harman, G. (1999). Reasoning, meaning, and mind. Oxford: Oxford University Press. Hart, H. L. A. ([1961]1994). The concept of law (2nd ed.). Oxford: Oxford University Press. Hau, J., & Van Hoosier, G. L. (2003). Handbook of laboratory animal science (2nd ed.). Boca Raton, Fla.: CRC Press. Hauser, M. D. (1996). The evolution of communication. Cambridge, Mass.: MIT Press. Hauser, M. D., Chomsky, N., & Fitch, W. T. (2002). The faculty of language: What is it, who has it, and how did it evolve? Science, 298(5598), 1569-1579.
230
Hausman, D. M. (1992). The inexact and separate science of economics. Cambridge; New York: Cambridge University Press. Hempel, C. G. (1965). Aspects of scientific explanation, and other essays in the philosophy of science. New York: Free Press. Hempel, C. G. ([1961]2001). Rational action. In J. H. Fetzer (Ed.), The philosophy of carl g. Hempel: Studies in science, explanation, and rationality (pp. 311-328). Oxford: Oxford University Press. Hennig, W. (1966). Phylogenetic systematics. Urbana, IL: University of Illinois Press. Henrich, J., Boyd, R., Bowles, S., Camerer, C., E., F., & Gintis, H. (2004). Foundations of human sociality: Economic experiments and ethnographic evidence from fifteen small-scale societies: Oxford University Press. Henson, M. A. (1998). Nonlinear model predictive control: Current status and future directions. Computers & Chemical Engineering, 23(2), 187. Henzi, S. P., & Barrett, L. (2002). Infants as a commodity in a baboon market. Animal Behaviour, 63(5), 915. Hills, T. T. (2006). Animal foraging and the evolution of goal-directed cognition. Cognitive Science: A Multidisciplinary Journal, 30(1), 3-41. Hinton, G., & Nowlan, S. (1987). How learning can guide evolution. Complex Systems, 1, 495-502. Hodos, W., & Campbell, C. B. (1969). Scala naturae: Why there is no theory in comparative psychology. Psychol. Rev, 76, 337350. Hofbauer, J., & Sigmund, K. (1998). Evolutionary games and population dynamics. Cambridge; New York, NY: Cambridge University Press. Holland, J. H. (1992). Adaptation in natural and artificial systems: An introductory analysis with applications to biology, control, and artificial intelligence (1st MIT Press ed.). Cambridge, Mass.: MIT Press. Holyoak, K. J., & Thagard, P. (1995). Mental leaps: Analogy in creative thought. Cambridge, Mass.: MIT Press. Horvitz, J. C., Stewart, T., & Jacobs, B. L. (1997). Burst activity of ventral tegmental dopamine neurons is elicited by sensory stimuli in the awake cat. Brain Res, 759(2), 251-258. Hull, D. L. (1978). A matter of individuality. Philosophy of Science, 45, 335-360. Hull, D. L. (1987). Genealogical actors in ecological roles. Biology and Philosophy, 2, 168-183. Hull, D. L. (2002). Species, languages and the comparative method. Selection, 3, 17-28. Hume, D. ([1739] 1946). Trait de la nature humaine; essai pour introduire la mthode exprimentale dans les sujets moraux (A. Leroy, Trans.). Paris: Montaigne. Hume, D. ([1748] 1983). Enqute sur l'entendement humain (M. Beyssade, Trans.). Paris: Flammarion. Humphreys, P. (1995). Computational science and scientific method. Minds and Machines, 5(4), 499. Humphreys, P. (2004). Extending ourselves: Computational science, empiricism, and scientific method. New York: Oxford University Press. Hurley, S. (2003). Animal action in the space of reasons. Mind and Language, 18(3), 231-257. Hurley, S., & Nudds, M. (2006). Rational animals? Oxford: Oxford University Press.
231
Hutchinson, G. E. (1965). The ecological theater and the evolutionary play: Yale University Press. Imamizu, H., Miyauchi, S., Tamada, T., Sasaki, Y., Takino, R., Putz, B., et al. (2000). Human cerebellar activity reflecting an acquired internal model of a new tool. Nature, 403(6766), 192-195. Ingo, B. (2003). Homology in comparative, molecular, and evolutionary developmental biology: The radiation of a concept. Journal of Experimental Zoology Part B: Molecular and Developmental Evolution, 299B(1), 9-17. Ito, M. (2000). Mechanisms of motor learning in the cerebellum. Brain Res, 886(1-2), 237-245. Jackson, F. (1998). From metaphysics to ethics: A defence of conceptual analysis. Oxford: Oxford University Press. Jeffrey, R. C. ([1965]1990). The logic of decision (2nd ed.). Chicago: University of Chicago Press. Jochim, M. A. (1988). Optimal foraging and the division of labor. American Anthropologist, 90(1), 130-136. Johnson, M., & Demiris, Y. (2005). Perceptual perspective taking and action recognition. International Journal of Advanced Robotic Systems, 2(4), 301-308. Johnson, M. H. (2005). Developmental cognitive neuroscience (2nd ed.). Malden, MA: Blackwell. Johnston, M. (1989). Dispositional theories of value. Proceedings of the Aristotelian Society, supp. 63, 139-174. Jones, J. P. (1982). Some undecidable determined games. International Journal of Game Theory, 11(2), 63. Joshua, M. E. (1999). Agent-based computational models and generative social science. Complexity, 4(5), 41-60. Kacelnik, A., Houston, A. I., & Krebs, J. R. (1981). Optimal foraging and territorial defence in the great tit (parus major). Behavioral Ecology and Sociobiology, 8(1), 35. Kaelbling, L. P., Littman, M. L., & Moore, A. W. (1996). Reinforcement learning: A survey. Journal of Artificial Intelligence Research, 4, 237-285. Kagel, J. H., Battalio, R. C., & Green, L. (1995). Economic choice theory: An experimental analysis of animal behavior. Cambridge [England]; New York: Cambridge University Press. Kahneman, D. (1994). New challenges to the rationality assumption. Journal of Institutional and Theoretical Economics, 150, 18-36. Kahneman, D., Slovic, P., & Tversky, A. (Eds.). (1982). Judgment under uncertainty: Heuristics and biases. Cambridge; New York: Cambridge University Press. Kahneman, D., & Tversky, A. (1979). Prospect theory: An analysis of decision under risk. Econometrica, 47, 263-291. Kahneman, D., & Tversky, A. (2000). Choices, values, and frames. Cambridge, UK: Cambridge University Press. Kamil, A. C., Krebs, J. R., & Pulliam, H. R. (1987). Foraging behavior. New York: Plenum Press. Kamil, A. C., Sargent, T. D., & Animal Behavior Society. (1981). Foraging behavior: Ecological, ethological, and psychological approaches. New York: Garland STPM Press.
232
Kaplan, H., Hill, K., Hawkes, K., & Hurtado, A. (1984). Food sharing among ache hunter-gatherers of eastern paraguay. Current Anthropology, 25(1), 113115. Kapsimali, M., Le Crom, S., & Vernier, P. (2003). A natural history of vertebrate dopamine receptors. In A. Sidhu, M. Laruelle & P. Vernier (Eds.), Dopamine receptors and transporters: Function, imaging, and clinical implication (2nd ed., pp. xviii, 741, [748] of plates). New York: M. Dekker. Kauer, J. A. (2004). Learning mechanisms in addiction: Synaptic plasticity in the ventral tegmental area as a result of exposure to drugs of abuse. Annual Review of Physiology, 66(1), 447-475. Kauffman, S. A. (1993). The origins of order: Self organization and selection in evolution. New York: Oxford University Press. Kauffman, S. A. (1995). At home in the universe: The search for laws of selforganization and complexity. New York: Oxford University Press. Kawato, M., Kuroda, T., Imamizu, H., Nakano, E., Miyauchi, S., & Yoshioka, T. (2003). Internal forward models in the cerebellum: Fmri study on grip force and load force coupling. Prog Brain Res, 142, 171-188. Kawato, M., & Wolpert, D. M. (1998). Internal models for motor control. Novartis Found Symp, 218, 291-304; discussion 304-297. Keynes, J. M. ([1936]1988). Thorie gnrale de l'emploi, de l'intrt et de la monnaie. Paris: Payot. Kim, J. (1988). What is naturalized epistemology? In J. E. Tomberlin (Ed.), Philosophical perspectives (Vol. 2, pp. 381-406). Asascadero, CA: Ridgeview Publishing Co. Kim, J. (1997). Moral kinds and natural kinds: What's the difference: For a naturalist? Philosophical Issues, 8(Truth), 293-301. Kirman, A. P., & Vignes, A. (1990). Price dispersion: Theoretical coordination and empirical evidence from the marseilles fish market. In K. J. Arrow (Ed.), Issues in contemporary economics: Macmillan. Kistler, M. (1999). Causalit et lois de la nature. Paris: Librairie philosophique J. Vrin. Kitching, I. J., Forey, P. L., Humphries, C. J., & Williams, D. M. (1998). Cladistics: The theory and practice of parsimony analysis (2nd ed.). Oxford; New York: Oxford University Press. Knight, F. (1921). Risk, uncertainty, and profit. New York: Houghton-Mifflin. Koen, B. V. (2003). Discussion of the method: Conducting the engineer's approach to problem solving. New York: Oxford University Press. Korn, H., & Faber, D. S. (2005). The mauthner cell half a century later: A neurobiological model for decision-making? Neuron, 47(1), 13. Kornblith, H. (1994). Naturalizing epistemology (2nd ed.). Cambridge, Mass.: MIT Press. Kornblith, H. (2002). Knowledge and its place in nature. Oxford: Oxford University Press. Korsgaard, C. M., & O'Neill, O. (1996). The sources of normativity. Cambridge; New York: Cambridge University Press. Koshland, D. E., Jr. (1977). A response regulator model in a simple sensory system. Science, 196(4294), 1055-1063. Kotler, B. (1997). Patch use by gerbils in a risky environment: Manipulating food and safety to test four models. Oikos, 78(2), 274-282. Kovalchik, S., Camerer, C. F., Grether, D. M., Plott, C. R., & Allman, J. M. (2005). Aging and decision making: A comparison between neurologically healthy
233
elderly and young individuals. Journal of Economic Behavior & Organization, 58(1), 79. Kramer, G. (1967). An impossibility result in the theory of decision making. In J. Bernd (Ed.), Mathematical applications in political science, part iii (pp. 3951). Charlottesville: University Press of Virginia. Krebs, J. R. (1991). Behavioural ecology (3rd ed.). England: Blackwell Scientific. Krebs, J. R., & Davies, N. B. (1993). An introduction to behavioural ecology (3rd ed.). Oxford [England]; Cambridge, MA: Blackwell Scientific Publications. Krebs, J. R., & Davies, N. B. (1997). Behavioural ecology: An evolutionary approach (4th ed.). Oxford, England; Malden, MA: Blackwell Science. Krebs, J. R., Kacelnik, A., & Taylor, P. (1978). Tests of optimal sampling by foraging great tits. Nature, 275, 27-31. Kreps, D. M. (1990). A course in microeconomic theory. Princeton, N.J.: Princeton University Press. Kripke, S. (1972). Naming and necessity. Cambridge, MA: Harvard University Press. Kripke, S. (1982). Wittgenstein on rules and private language: An elementary exposition. Cambridge, Mass.: Harvard University Press. Kroes, P. (1998). Technology, philosophy of. In E. Craig (Ed.), Routledge encyclopedia of philosophy, http://www.Rep.Routledge.Com/article/q103sect3. London: Routledge. Krugman, P. (2004). Microeconomics. New York: Worth Publishers. La Cerra, P., & Bingham, R. (1998). The adaptive nature of the human neurocognitive architecture: An alternative model. PNAS, 95(19), 1129011294. Laakso, A., & Cottrell, G. W. (2000). Content and cluster analysis: Assessing representational similarity in neural systems. Philosophical Psychology, 13(1), 47-76. Labarrire, J. L. (2000). Raison humaine et intelligence animale dans la philosophie grecque. Terrain, 34(http://terrain.revues.org/document996.html). Lagueux, M. (2004). The forgotten role of the rationality principle in economics. Journal of Economic Methodology, 11, 31 51. Langton, C. G. (1995). Artificial life: An overview. Cambridge, Mass.: MIT Press. LaPorte, J. (2004). Natural kinds and conceptual change. Cambridge, U.K.; New York: Cambridge University Press. Laubichler, M. D. (2000). Homology in development and the development of the homology concept. Integr. Comp. Biol. %R 10.1093/icb/40.5.777, 40(5), 777-788. Lawler, E. L. (1985). The traveling salesman problem: A guided tour of combinatorial optimization. Chichester [West Sussex]; New York: Wiley. Layton, E. T., Jr. (1974). Technology as knowledge. Technology & Culture, 15(1), 31-41. Le Crom, S. p., Kapsimali, M., Barme, P.-O., & Vernier, P. (2003). Dopamine receptors for every species: Gene duplications and functional diversification in craniates. Journal of Structural and Functional Genomics, 3(1 - 4), 161. Lecointre, G., & Le Guyader, H. (2001). Classification phylogntique du vivant (2. ed.). Paris: Belin. LeDoux, J. E. (1996). The emotional brain: The mysterious underpinnings of emotional life. New York: Simon & Schuster.
234
Ledyard, J. O. (1995). Public goods: A survey of experimental research. In J. H. Kagel & A. E. Roth (Eds.), Handbook of experimental economics (pp. 111194): Princeton University Press. Lenat, D. B., & Feigenbaum, E. A. (1988). On the thresholds of knowledge. Levesque, H. J. (1988). Logic and the complexity of reasoning. Journal of Philosophical Logic, 17, 355-389. Lewis, A. A. (1985). On effectively computable realizations of choice functions: Dedicated to professors kenneth j. Arrow and anil nerode. Mathematical Social Sciences, 10(1), 43. Lewis, A. A. (1992a). On turing degrees of walrasian models and a general impossibility result in the theory of decision-making. Mathematical Social Sciences, 24(2-3), 141. Lewis, B. L., & O'Donnell, P. (2000). Ventral tegmental area afferents to the prefrontal cortex maintain membrane potential 'up' states in pyramidal neurons via d1 dopamine receptors. Cereb. Cortex %R 10.1093/cercor/10.12.1168, 10(12), 1168-1175. Lewis, D. K. (1969). Convention: A philosophical study. Cambridge, Mass.: Harvard University Press. Lewis, D. K. (1988). Desire as belief. Mind, 97(387), 323-332. Lewis, F. L. (1992b). Applied optimal control & estimation: Digital design & implementation. Englewood Cliffs, N.J.: Prentice Hall. Li, Q., & Yao, C. (2003). Real-time concepts for embedded systems. San Francisco, CA: CMP Books. Lichtenstein, S., & Slovic, P. (1973). Response-induced reversals of preference in gambling: An extended replication in las vegas. Journal of Experimental Psychology, 101, 16-20. Lima, S. L. (2002). Putting predators back into behavioral predator-prey interactions. Trends in Ecology & Evolution, 17(2), 70. Lindblom, C. E. (2001). The market system: What it is, how it works, and what to make of it. New Haven: Yale University Press. Linhares, A. (1998). State-space search strategies gleaned from animal behavior: A traveling salesman experiment. Biological Cybernetics, 78(3), 167. List, J. A. (2004). Neoclassical theory versus prospect theory:Evidence from the marketplace. Econometrica, 72(2), 615-625. List, J. A., & Haigh, M. S. (2005). A simple test of expected utility theory using professional traders. Proc Natl Acad Sci U S A, 102(3), 945-948. Locke, J. ([1689]2001). Essai sur l'entendement humain (J.-M. Vienne, Trans.). Paris: J. Vrin. Lorberbaum, J. (1994). No strategy is evolutionarily stable in the repeated prisoner's dilemma. Journal of Theoretical Biology, 168(2), 117. Lorenz, K. (1992[1973]). Analogy as a source of knowledge (nobel lecture, december 12, 1973). In J. Lindsten (Ed.), Nobel lectures, physiology or medicine 1971-1980 (pp. 97-107). Singapore: World Scientific Publishing Co. Luce, R. D., & Raiffa, H. (1957). Games and decisions: Introduction and critical survey. New York: Wiley. MacArthur, R. H., & Pianka, E. R. (1966). On optimal use of a patchy environment. American Naturalist(100), 603-609. MacGregor, J. N., & Ormerod, T. (1996). Human performance on the traveling salesman problem. Percept Psychophys, 58(4), 527-539.
235
Machamer, P., Darden, L., & Craver, C. F. (2000). Thinking about mechanisms. Philosophy of Science, 67, 1-24. Machery, E. (2005). Concepts are not a natural kind. Philosophy of Science, 72, 444467. Machina, M. J. (1982). "expected utility" analysis without the independence axiom. Econometrica, 50(2), 277-324. Machlup, F. (1955). The problem of verification in economics. The Southern Economic Journal, 22(1-21). Malthus, T. R. ([1798]1992). Essai sur le principe de population. Paris: GFFlammarion. Marion, M. (2006, paratre). Rationality from a logical point of view. In D. Fisette & D. Vanderveken (Eds.), Action, dcision et attitudes. Markowitz, H. (1952). The utility of wealth. Journal of Political Economy, 60, 151-158. Marr, D. (1982). Vision: A computational investigation into the human representation and processing of visual information. San Francisco: W.H. Freeman. Marschak, J. (1951). Why 'should' statisticians and businessmen maximize 'moral expectation'? Paper presented at the Second Berkeley Symposium on Mathematical Statistics and Probability, Cowles Foundation Paper 53. Marsh, B., & Kacelnik, A. (2002). Framing effects and risky decisions in starlings. Proc Natl Acad Sci U S A, 99(5), 3352-3355. Mataric, M. J. (1997). Reinforcement learning in the multi-robot domain. Autonomous Robots, 4(1), 73. Mataric, M. J. (2001). Learning in behavior-based multi-robot systems: Policies, models, and other agents. Cognitive Systems Research, 2(1), 81-93. Matthen, M. (2000). What is a hand? What is a mind? Revue Internationale de Philosophie, 214, 653-673. May, K. O. (1954). Intransitivity, utility and the aggregation of preference patterns. Econometrica, 22, 113. Maynard Smith, J. (1982). Evolution and the theory of games. Cambridge; New York: Cambridge University Press. Maynard Smith, J. (1987). Natural selection: When learning guides evolution. Nature, 329, 761-762. Maynard Smith, J. (1993). The theory of evolution (Canto ed.). Cambridge [England]; New York: Cambridge University Press. Maynard Smith, J., Burian, R., Kauffman, S., Alberch, P., Campbell, J., Goodwin, B., et al. (1985). Developmental constraints and evolution: A perspective from the mountain lake conference on development and evolution. The Quarterly Review of Biology, 60(3), 265-287. Maynard Smith, J., & Szathmry, E. (1997). The major transitions in evolution. Oxford; New York: Oxford University Press. Mayr, E. (1959). Darwin and the evolutionary theory in biology. In Evolution and anthropology: A centennial appraisal (pp. 409412). Washington, D.C.: Anthropological Society of Washington. McCabe, K., Houser, D., Ryan, L., Smith, V., & Trouard, T. (2001). A functional imaging study of cooperation in two-person reciprocal exchange. PNAS, 98(20), 11832-11835. McClure, S. M., Laibson, D. I., Loewenstein, G., & Cohen, J. D. (2004). Separate neural systems value immediate and delayed monetary rewards. Science, 306(5695), 503-507.
236
McDowell, J. (1986). Functionalism and anomalous monism. In E. LePore & B. McLaughlin (Eds.), Actions and events: Essays on the philosophy of donald davidson. Oxford: Blacwkell. McDowell, J. (1994). Mind and world. Cambridge, Mass.: Harvard University Press. McFarland, D. (1999). Animal behaviour: Psychobiology, ethology, and evolution (3rd ed.). Harlow, Essex, England & New York: Wiley. McFarland, D., & Houston, A. (1981). Quantitative ethology: The state space approach. Boston: Pitman Advanced Pub. Program. Mealey, L. (1995). The sociobiology of psychopathy: An integrated model. Behavioral and Brain Sciences, 18, 523-599. Medin, D. L., & Atran, S. (1999). Folkbiology. Cambridge, Mass.: MIT Press. Mele, A. R. (1992). Springs of action. Oxford: Oxford University Press. Menzel, R., & Giurfa, M. (2001). Cognitive architecture of a mini-brain: The honeybee. Trends Cogn Sci, 5(2), 62-71. Mikkelson, G. M. (2003). Ecological kinds and ecological laws. Philosophy of Science, 70, 13901400. Mill, J. S. (1848). A system of logic, ratiocinative and inductive; being a connected view of the principles of evidence and the methods of scientific investigation. New-York: Harper & Brothers. Millar, A. (2004). Understanding people: Normativity and rationalizing explanation. Oxford: Oxford University Press. Millikan, R. G. (1984). Language, thought, and other biological categories: New foundations for realism. Cambridge, Mass.: MIT Press. Millikan, R. G. (2000). On clear and confused ideas: An essay about substance concepts. Cambridge England; New York: Cambridge University Press. Millikan, R. G. (2005). Language: A biological model. Oxford: Oxford University Press. Minsky, M. (2000). Commonsense-based interfaces. Communications of the ACM, 43(8), 66-73. Mittelstaedt, P., & Weingartner, P. (2005). Laws of nature (1st ed.). Berlin; New York, NY: Springer. Montague, P. R., Dayan, P., & Sejnowski, T. J. (1996). A framework for mesencephalic dopamine systems based on predictive hebbian learning. J. Neurosci., 16(5), 1936-1947. Montague, P. R., Hyman, S. E., & Cohen, J. D. (2004). Computational roles for dopamine in behavioural control. Nature, 431(7010), 760. Montminy, M. (2003). propos dune objection contre le naturalisme modr. Philosophiques, 30, 411-415. Moore, G. E. (1903). Principia ethica. Cambridge: Cambridge University press. Morgan, M. S., & Morrison, M. (1999). Models as mediators: Perspectives on natural and social sciences. Cambridge; New York: Cambridge University Press. Mottley, K., & Giraldeau, L. A. (2000). Experimental evidence that group foragers can converge on predicted producer-scrounger equilibria. Anim Behav, 60(3), 341-350. Moureau, N. (2000). Analyse conomique de la valeur des biens d'art. Paris: Economica. Mller, F. M. (1887). The science of thought. London: Longmans Green & co.
237
Nagarajan, R., Goss-Custard, J. D., & Lea, S. E. (2002). Oystercatchers use colour preference to achieve longer-term optimality. Proc Biol Sci, 269(1490), 523-528. Nagel, T. (1974). What is it like to be a bat? Philosophical Review, 83, 435-450. Narendra, K. S., & Balakrishnan, J. (1997). Adaptive control using multiple models. Automatic Control, IEEE Transactions on, 42(2), 171. Nash, J. F. (1950). Non-cooperative games (thse doctorale). Princeton University, Princeton. Neander, K. (2002). Types of traits: Function, structure and homology in the classification of traits. In A. Ariew, R. Cummins & M. Perlman (Eds.), Functions: New essays in the philosophy of biology and psychology. Oxford: Oxford University Press. Neilsen, C. (2001). Animal evolution. Oxford: Oxford Univ. Press. Newell, A. (1990). Unified theories of cognition. Cambridge, Mass.: Harvard University Press. Nieoullon, A. (2002). Dopamine and the regulation of cognition and attention. Progress in Neurobiology, 67(1), 53. Nieuwenhuys, R., Donkelaar, H. J. t., & Nicholson, C. (1998). The central nervous system of vertebrates. Berlin; New York: Springer. Niv, Y., Joel, D., Meilijson, I., & Ruppin, E. (2001). Evolution of reinforcement learning in uncertain environments: Emergence of risk-aversion and matching. Nolfi, S. (1997). Using emergent modularity to develop control system for mobile robots. Adaptive Behavior, 5, 343-364. Norman, A. L. (1994). Computability, complexity and economics. Computational Economics, 7(1), 1. Nowak, M., & Sigmund, K. (1993). A strategy of win-stay, lose-shift that outperforms tit-for-tat in the prisoner's dilemma game. Nature, 364(6432), 56-58. Nowak, M. A., & Sigmund, K. (2004). Evolutionary dynamics of biological games. Science %R 10.1126/science.1093411, 303(5659), 793-799. No, R., & Hammerstein, P. (1995). Biological markets. 10(8), 336. No, R., Hooff, J. A. R. A. M. v., & Hammerstein, P. (2001). Economics in nature: Social dilemmas, mate choice, and biological markets. Cambridge, UK: New York, NY Cambridge University Press. Nussbaum, M. C. (1990). Love's knowledge: Essays on philosophy and literature. New York: Oxford University Press. Odean, T. (1998). Are investors reluctant to realize their losses? The Journal of Finance, 53(5), 1775-1798. Ogien, R. (1999). Le ralisme moral. Paris: Presses universitaires de France. Oosterbeek, H., S., R., & van de Kuilen, G. (2004). Differences in ultimatum game experiments: Evidence from a meta-analysis. Experimental Economics, 7, 171-188. Owen, R. (1843). Lectures on the comparative anatomy and physiology of the invertebrate animals, delivered at the royal college of surgeons, in 1843. London: Longman, Brown, Green, and Longmans. Oyama, S. ([1985]2000). The ontogeny of information: Developmental systems and evolution (2nd ed.). [Durham, N.C.]: Duke University Press. Oyama, S., Griffiths, P. E., & Gray, R. D. (2001). Cycles of contingency: Developmental systems and evolution. Cambridge, Mass.: MIT Press.
238
Pacherie, E. (2002). Naturalistic epistemologies and normativity. Croatian Journal of Philosophy, 2(6), 299-317. Paillard, J. (2000). The neurobiological roots of rational thinking. In H. Cruse, H. Ritter & J. Dean (Eds.), Prerational intelligence. Adaptive behavior and intelligent systems without symbols and logic, vol i (pp. 343-355). Dordrecht: Klver Academic Press. Panksepp, J. (1998). Affective neuroscience: The foundations of human and animal emotions. New York: Oxford University Press. Papadimitriou, C. (1994). Computational complexity.: Addison-Wesley. Papineau, D. (2003). The roots of reason: Philosophical essays on rationality, evolution, and probability. Oxford: Oxford University Press. Pareto, V. ([1909]1966). Manuel d'conomie politique (2e d.-- ed.). Genve: Librairie Droz. Parfit, D. (1984). Reasons and persons. Oxford: Clarendon Press. Pasetti, A. (2002). Software frameworks and embedded control systems. Unpublished Thesis doctoral - Universit_t Konstanz 2001, Springer, Berlin; New York. Peacocke, C. (1992). A study of concepts. Cambridge, Mass.: MIT Press. Pearl, J. (1988). Probabilistic reasoning in intelligent systems: Networks of plausible inference. San Mateo, Calif.: Morgan Kaufmann Publishers. Pecina, S., Cagniard, B., Berridge, K. C., Aldridge, J. W., & Zhuang, X. (2003). Hyperdopaminergic mutant mice have higher "wanting" but not "liking" for sweet rewards. J Neurosci, 23(28), 9395-9402. Peirce, C. S. (1877). The fixation of belief. Popular Science Monthly, 12, 1-15. Perez-Uribe, A. (2001). Using a time-delay actor-critic neural architecture with dopamine-like reinforcement signal for learning in autonomous robots. Pettit, P. (1987). Humeans, anti-humeans, and motivation. Mind, XCVI(384), 530-533. Pettit, P. (1991). Realism and response-dependence. Mind, 100(4, Mind and Content), 587-626. Pettit, P. (2002). Rules, reasons, and norms. Oxford: Oxford University Press. Pianka, E. R. (2000). Evolutionary ecology (6th ed.). San Francisco, Calif.: Benjamin Cummings. Pirolli, P., & Card, S. (1999). Information foraging. Psychological Review, 106(4), 643. Plott, C. R. (1986). Rational choice in experimental markets. Journal of Business, 59(4, Part 2: The Behavioral Foundations of Economic Theory), S301S327. Plott, C. R. (2001). Collected papers on the experimental foundations of economics and political science. Cheltenham, UK; Northampton, MA USA: Edward Elgar. Plott, C. R., & Smith, V. L. (1978). An experimental examination of two exchange institutions. The Review of Economic Studies, 45(1), 133-153. Popper, K. R. (1967). La rationalit et le statut du principe de rationalit. In E. M. Claassen (Ed.), Les fondements philosophiques des systmes economiques. Paris: Payot. Porcelli, S. A. (2005). Bird genes give new insights into the origins of lipid antigen presentation. PNAS %R 10.1073/pnas.0503313102, 102(24), 8399-8400. Port, R. F., & Van Gelder, T. (1995). Mind as motion: Explorations in the dynamics of cognition. Cambridge, Mass.: MIT Press.
239
Poundstone, W. (1992). Prisoner's dilemma (1st ed.). New York: Doubleday. Premack, D., & Woodruff, G. (1978). Does the chimpanzee have a theory of mind? Behavioural and Brain Sciences, 1, 515-526. Pritz, M. B. (2005). Comparisons and homology in adult and developing vertebrate central nervous systems. Brain Behav Evol, 66(4), 222-233. Proust, J. (1997). Comment l'esprit vient aux btes. Essai sur la reprsentation. Paris: Gallimard. Proust, J. (2003). Les animaux pensent-ils? Paris: Bayard. Proust, J. (2005). Nature de la volont. Paris: Gallimard. Proust, J. (2006). Metacognition and animal rationality. In S. Hurley & M. Nudds (Eds.), Rational animals. Oxford: Oxford University Press. Putnam, H. (1975). The meaning of meaning. In K. Gunderson (Ed.), Language, mind and knowledge. Minneapolis: University of Minnesota Press. Pylyshyn, Z. W. (1984). Computation and cognition: Toward a foundation for cognitive science. Cambridge, Mass.: MIT Press. Quartz, S. R. (2003). Toward a developmental evolutionary psychology: Genes, development, and the evolution of the human cognitive architecture. In S. J. Scher & F. Rauscher (Eds.), Evolutionary psychology: Alternative approaches (pp. 185-210). Boston: Kluwer Academic Publishers. Quine, W. V. O. (1969). Ontological relativity, and other essays. New York: Columbia University Press. Quine, W. V. O. (1986). Reply to morton white. In L. E. Hahn & P. A. Schilpp (Eds.), The philosophy of w. V. Quine (pp. 663-665). La Salle: Open Court. Quine, W. V. O. (1990). Pursuit of truth. Cambridge, Mass.: Harvard University Press. Quine, W. V. O. ([1951] 1980). Les deux dogmes de l'empirisme. In P. Jacob (Ed.), De vienne cambridge (pp. 87-112). Paris: Gallimard. Quine, W. V. O. ([1966]1976). The ways of paradox, and other essays. New York: Random. Rabin, M. (1957). Effective computability of winning strategies. In Contributions to the theory of games iii (annals of mathematical studies 39) (pp. 147157). Ramsey, F. P. (1926). Truth and probability. In R. B. Braithwaite (Ed.), The foundations of mathematics and other logical essays, (pp. 156-198). New York, London: Kegan, Paul, Trench, Trubner & Co, Harcourt, Brace and Compan. Redies, R., & Puelles, L. (2001). Modularity in vertebrate brain development and evolution. BioEssays, 23(12), 1100-1111. Reznick, D. N., Shaw, F. H., Rodd, F. H., & Shaw, R. G. (1997). Evaluation of the rate of evolution in natural populations of guppies (poecilia reticulata). Science, 275(5308), 1934-1937. Richalet, J., Lavielle, G., & Mallet, J. (2005). La commande prdictive - mise en oeuvre et applications industrielles. Paris: Eyrolles. Richter, M. K., & Wong, K.-C. (1999). Non-computability of competitive equilibrium. Economic Theory, 14(1), 1. Ridley, M. (1989). The cladistic solution to the species problem. Biology and Philosophy, 4, 1-16. Ridley, M. (2004). Evolution (3rd ed.). Malden, MA: Blackwell Pub. Riedel, C., Tryggvason, A., Dahm, T., Stefanson, R., Bdvarson, R., & Gudmundsson, G. (2005). The seismic velocity structure north of iceland
240
from joint inversion of local earthquake data. Journal of Seismology, 9(4), 383. Rieppel, O. (2005a). Monophyly, paraphyly, and natural kinds. Biology and Philosophy, 20(2 - 3), 465. Rieppel, O. (2005b). Modules, kinds, and homology. J Exp Zool: Mol Dev Evol, 304B, 1827. Riggs, P. (1996). Natural kinds, laws of nature, and scientific reasoning. Dordrecht: Kluwer. Robbins, L. (1932). An essay on the nature and signifiance of economic science. London: Macmillan. Robinson, S., Sandstrom, S. M., Denenberg, V. H., & Palmiter, R. D. (2005). Distinguishing whether dopamine regulates liking, wanting, and/or learning about rewards. Behavioral Neuroscience, 119(1), 5. Rodriguez, F., Lopez, J. C., Vargas, J. P., Gomez, Y., Broglio, C., & Salas, C. (2002). Conservation of spatial memory function in the pallial forebrain of reptiles and ray-finned fishes. J Neurosci, 22(7), 2894-2903. Roe, R. M., Busemeyer, J. R., & Townsend, J. T. (2001). Multialternative decision field theory: A dynamic connectionist model of decision making. Psychol Rev, 108(2), 370-392. Root, M. (2000). How we divide the world. Philosophy of Science, 67(Supplement. Proceedings of the 1998 Biennial Meetings of the Philosophy of Science Association. Part II: Symposia Papers), S628-S639. Rose, M. R., & Lauder, G. V. (1996). Adaptation. San Diego: Academic Press. Rosenberg, A. (1992). Economics: Mathematical politics or science of diminishing returns? Chicago: University of Chicago Press. Ross, D. (1999). What people want: The concept of utility from bentham to game theory. Cape Town: University of Cape Town Press. Roth, A. E. (1991a). Game theory as a part of empirical economics. Economic Journal, 101, 107-114. Roth, A. E. (1993). On the early history of experimental economics. Journal of the History of Economic Thought, 15, 184-209. Roth, M., Decety, J., Raybaudi, M., Massarelli, R., Delon-Martin, C., Segebarth, C., et al. (1996). Possible involvement of primary motor cortex in mentally simulated movement: A functional magnetic resonance imaging study. Neuroreport, 7(7), 1280-1284. Roth, V. L. (1991b). Homology and hierarchies: Problems solved and unresolved. Journal of Evolutionary Biology, 4(2), 167-194. Roughgarden, J., Oishi, M., & Akcay, E. (2006). Reproductive social behavior: Cooperative games to replace sexual selection. Science %R 10.1126/science.1110105, 311(5763), 965-969. Rubinstein, A. (1995). John nash: The master of economic modelling. Scandinavian Journal of Economics, 97(1), 913. Ruby, P., & Decety, J. (2001). Effect of subjective perspective taking during simulation of action: A pet investigation of agency. Nat Neurosci, 4(5), 546-550. Rumble, J., Jr, Y. Lee, A., Blakeslee, D., & Young, S. (2001). Reliable solubility data in the age of computerized chemistry. Why, how, and when? Pure and Applied Chemistry, 73(5), 825-829. Rumelhart, D. E., McClelland, J. L., & University of California San Diego. PDP Research Group. (1986). Parallel distributed processing: Explorations in the microstructure of cognition. Cambridge, Mass.: MIT Press.
241
Russell, B. ([1918] 1985). The philosophy of logical atomism (Pears, D.F. ed.). LaSalle, Ill.: Open Court. Russell, S., & Wefald, E. (1991). Do the right thing: Studies in limited rationality. Cambridge, MA: MIT Press. Rustem, B., & Velupillai, K. (1990). Rationality, computability, and complexity. Journal of Economic Dynamics and Control, 14(2), 419. Ryle, G. (1949). The concept of mind. S.l.: Penguin Books. Salas, C., Broglio, C., & Rodriguez, F. (2003). Evolution of forebrain and spatial cognition in vertebrates: Conservation across diversity. Brain Behav Evol, 62(2), 72-82. Sally, D. (1995). Conversations and cooperation in social dilemmas: A metaanalysis of experiments from 1958 to 1992. Rationality and Society, 7, 58 92. Salmon, W. C. (1984). Scientific explanation and the causal structure of the world. Princeton, N.J.: Princeton University Press. Salmon, W. C. (1998). Causality and explanation. New York: Oxford University Press. Samuels, R., & Stich, S. (2004). Rationality and psychology. In A. Mele & P. Rawling (Eds.), The oxford handbook of rationality (pp. 279-300). Oxford: Oxford Reference Library. Samuels, R., Stich, S., & Faucher, L. (2002). Reasoning and rationality. In I. Niiniluoto, M. Sintonen & J. Wolenski (Eds.), Handbook of epistemology (pp. 1-50). Dordrecht: Kluwer. Samuelson, L. (2005). Economic theory and experimental economics. Journal of Economic Literature, 43, 65-107. Samuelson, P. A. (1947). Foundations of economic analysis. Cambridge: Harvard University Press. Saridis, G. N. (1985). Foundations of the theory of intelligent controls. In G. Saridis & A. Meystel (Eds.), Proc. Of the ieee workshop on intelligent control, (pp. 23- 28). New-York: Troy. Satoh, T., Nakai, S., Sato, T., & Kimura, M. (2003). Correlated coding of motivation and outcome of decision by dopamine neurons. J. Neurosci., 23(30), 9913-9923. Satz, D., & Ferejohn, J. (1994). Rational choice and social theory. The Journal of Philosophy, 91(2), 71-87. Savage, L. J. (1954). The foundations of statistics. New York: Wiley. Sawaguchi, T., & Goldman-Rakic, P. S. (1994). The role of d1-dopamine receptor in working memory: Local injections of dopamine antagonists into the prefrontal cortex of rhesus monkeys performing an oculomotor delayedresponse task. J Neurophysiol, 71(2), 515-528. Sayre-McCord, G. (1997a). Different kinds of kind terms: A reply to sosa and kim. Philosophical Issues, 8(Truth), 313-323. Sayre-McCord, G. (1997b). 'good' on twin earth. Philosophical Issues, 8(Truth), 267-292. Scanlon, T. (1998). What we owe to each other. Cambridge, Mass.: Belknap Press of Harvard University Press. Scarf, H. E., & Hansen, T. (1973). The computation of economic equilibria. New Haven: Yale University Press. Scharff, R. C., & Dusek, V. (2003). Philosophy of technology: The technological condition: An anthology. Malden, MA: Blackwell Publishers.
242
Schick, F. (1991). Understanding action: An essay on reasons. Cambridge; New York: Cambridge University Press. Schroeder, T. (2004). Three faces of desire. Oxford; New York: Oxford University Press. Schuck-Paim, C., Pompilio, L., & Kacelnik, A. (2004). State-dependent decisions cause apparent violations of rationality in animal choice. PLoS Biology, 2(12), e402. Schultz, W. (1999). The reward signal of midbrain dopamine neurons. News Physiol Sci, 14(6), 249-255. Schultz, W. (2001). Reward signaling by dopamine neurons. Neuroscientist, 7(4), 293-302. Schultz, W., Dayan, P., & Montague, P. R. (1997). A neural substrate of prediction and reward. Science, 275(5306), 1593-1599. Schultz, W., & Dickinson, A. (2000). Neuronal coding of prediction errors. Annu Rev Neurosci, 23, 473-500. Schwartz, M. W., & Hoeksema, J. D. (1998). Specialization and resource trade: Biological markets as a model of mutualisms. Ecology, 79(3), 1029-1038. Schweighofer, N., Arbib, M. A., & Kawato, M. (1998). Role of the cerebellum in reaching movements in humans. I. Distributed inverse dynamics control. Eur J Neurosci, 10(1), 86-94. Scotland, R. W., Pennington, T., & Systematics Association. (2000). Homology and systematics: Coding characters for phylogenetic analysis. London; New York: Taylor & Francis. Searle, J. (1983). Intentionality. Cambridge: Cambridge University Press. Searle, J. (2001). Rationality in action. Cambridge, Mass.: MIT Press. Self, D. (2003). Neurobiology: Dopamine as chicken and egg. Nature, 422(6932), 573-574. Sellars, W. (1963). Science, perception, and reality. New York: Humanities Press. Sellars, W. ([1956]1997). Empiricism and the philosophy of mind. Cambridge, Mass.: Harvard University Press. Selten, R. (2001). What is bounded rationality? In G. Gigerenzer & R. Selten (Eds.), Bounded rationality: The adaptive toolbox (pp. 13-36). MIT Press: Cambridge, MA. Shadmehr, R. (2004). Generalization as a behavioral window to the neural mechanisms of learning internal models. Human Movement Science, 23(5), 543. Shafir, E., & LeBoeuf, R. A. (2002). Rationality. Annual Review of Psychology, 53(1), 491-517. Shimizu, T. (2004). Comparative cognition and neuroscience: Misconceptions about brain evolution. Japanese Psychological Research, 46(3), 246-254. Shine, R., Grigg, G., Shine, T. G., & Harlow, P. (1981). Mating and male combat in australian blacksnakes, pseudechis porphyriacus. Journal of Herpetology, 15(1), 101-107. Shochat, E., Lerman, S. B., Katti, M., & Lewis, D. B. (2004). Linking optimal foraging behavior to bird community structure in an urban-desert landscape: Field experiments with artificial food patches. Am Nat, 164(2), 232-243. Sih, A., & Christensen, B. (2001). Optimal diet theory: When does it work, and when and why does it fail? Animal Behaviour, 61(2), 379.
243
Simon, H. A. (1976). From substantive to procedural rationality. In S. J. Latsis (Ed.), Method and appraisal in economics (pp. 129-148). London: Cambridge University Press. Simon, H. A. (1978). Rationality as process and as product of thought. American Economic Review, 68(2), 1-16. Simon, H. A. (1982). Models of bounded rationality. Cambridge, Mass.: MIT Press. Simon, H. A. (1986). Rationality in psychology and economics. The Journal of Business, 59(4), S209-S224. Simon, H. A. ([1960] 1996). The sciences of the artificial (3rd ed.). Cambridge, Mass.: MIT Press. Skyrms, B. (1996). Evolution of the social contract. Cambridge; New York: Cambridge University Press. Skyrms, B. (2000). Game theory, rationality and evolution of the social contract. In L. D. Katz (Ed.), Evolutionary origins of morality. Thorverton: Imprint Academic. Slovic, P., & Tversky, A. (1974). Who accepts savages axiom? Behavioral Science, 19, 368- 373. Smith, A. ([1776]1991). Recherches sur la nature et les causes de la richesse des nations. Paris: Flammarion. Smith, E. A. (1991a). Inujjuamiut foraging strategies: Evolutionary ecology of an arctic hunting economy. New York: A. de Gruyter. Smith, J. D., Shields, W. E., & Washburn, D. A. (2003). The comparative psychology of uncertainty monitoring and metacognition. Behav Brain Sci, 26(3), 317-339; discussion 340-373. Smith, M. (1987). The humean theory of motivation. Mind, 96(381), 36-61. Smith, V. L. (1965). Experimental auction markets and the walrasian hypothesis. The Journal of Political Economy, 387-393. Smith, V. L. (1986). Experimental methods in the political economy of exchange. Science, 234(4773), 167-173. Smith, V. L. (1990). Experimental economics. Aldershot, Hants, England: Gower Pub. Co. Smith, V. L. (1991b). Papers in experimental economics. Cambridge [England]; New York: Cambridge University Press. Smith, V. L. (1991c). Rational choice: The contrast between economics and psychology. Journal of Political Economy, 99(4), 877-897. Smith, V. L. (2002). Markets, institutions and experiments. In L. Nadel (Ed.), Encyclopedia of cognitive science: Nature Publishing Group. Smith, V. L. (2003). Constructivist and ecological rationality in economics. American Economic Review, 93(3), 465-508. Sober, E. (2000). Philosophy of biology (2nd ed.). Boulder, Colo.: Westview Press. Sorabji, R. (1996). Rationality. In M. Frede & G. Striker (Eds.), Rationality in greek thought. (pp. 311-334). New York: Clarendon Press. Sosa, E. (1997). Water, drink, and "moral kinds". Philosophical Issues, 8(Truth), 303-312. Sperber, D., & Wilson, D. (1989). La pertinence: Communication et cognition. Paris: ditions de Minuit. Sperber, D., & Wilson, D. (2004). Relevance theory. In G. Ward & L. Horn (Eds.), Handbook of pragmatics (pp. 607-632). Oxford: Blackwell.
244
Squire, L. R. (1992). Memory and the hippocampus: A synthesis from findings with rats, monkeys, and humans. Psychol Rev, 99(2), 195-231. Stearns, S. C. (1992). The evolution of life history. Oxford: Oxford University Press. Stein, E. (1996). Without good reason: The rationality debate in philosophy and cognitive science. Oxford: Oxford University Press. Stein, L. A. (1994). Imagination and situated cognition. Journal of Experimental and Theoretical Artificial Intelligence, 6, 393--407. Stephens, D. W., & Krebs, J. R. (1986). Foraging theory. Princeton, N.J.: Princeton University Press. Sterelny, K. (2001). The evolution of agency and other essays. Cambridge, UK; New York: Cambridge University Press. Sterelny, K. (2003a). Charting control space: Comments on susan hurley's 'animal action in the space of reasons'. Mind & Language, 18(3), 257-266. Sterelny, K. (2003b). Thought in a hostile world: The evolution of human cognition. Malden, MA; Oxford: Blackwell Pub. Stich, S. (1990). The fragmentation of reason: Preface to a pragmatic theory of cognitive evaluation. Cambridge, Mass.: MIT Press. Stich, S. (1996). Deconstructing the mind. New York: Oxford University Press. Stich, S., & Nichols, S. (1992). Folk psychology: Simulation or tacit theory? Mind and Language, 7, 35-71. Stiglitz, J. E. (2002). Globalization and its discontents (1st ed.). New York: W. W. Norton. Stopka, P., & Macdonald, D. W. (1999). The market effect in the wood mouse, apodemus sylvaticus: Selling information on reproductive status. Ethology, 105, 969-982. Sugden, R. (1985). Why be consistent? A critical analysis of consistency requirements in choice theory. Economica, 52(206), 167-183. Sugden, R. (1991). Rational choice: A survey of contributions from economics and philosophy. The Economic Journal, 101(407), 751-785. Suppe, F. (1974). The structure of scientific theories. Urbana: University of Illinois Press. Suri, R. E., & Schultz, W. (1999). A neural network model with dopamine-like reinforcement signal that learns a spatial delayed response task. Neuroscience, 91(3), 871. Suri, R. E., & Schultz, W. (2001). Temporal difference model reproduces anticipatory neural activity. Neural Comput, 13(4), 841-862. Sutton, R. S., & Barto, A. G. (1981). Toward a modern theory of adaptive networks: Expectation and prediction. Psychol Rev, 88(2), 135-170. Sutton, R. S., & Barto, A. G. (1987). A temporal-difference model of classical conditioning. Paper presented at the Ninth Annual Conference of the Cognitive Science Society. Sutton, R. S., & Barto, A. G. (1998). Reinforcement learning: An introduction. Cambridge, Mass.: MIT Press. Tesauro, G. (1995). Temporal difference learning and td gammon. Communications of the ACM, 38, 58-68. Tesfatsion, L., & Judd, K. L. (2006). Handbook of computational economics, vol. 2: Agent-based computational economics. Amsterdam: NorthHolland/Elsevier. Thagard, P., & Verbeurgt, K. (1998). Coherence as constraint satisfaction. Cognitive Science, 22, 1-24.
245
Thaler, R. H. (1980). Toward a positive theory of consumer choice. Journal of Economic Behavior & Organization, 1(1), 39-60. Thaler, R. H. (1991). Quasi rational economics. New York: Russell Sage Foundation. Thomas, R. J. (1999). Two tests of a stochastic dynamic programming model of daily singing routines in birds. Anim Behav, 57(2), 277-284. Thomason, J. (1995). Functional morphology in vertebrate paleontology. Cambridge; New York, NY, USA: Cambridge University Press. Tin, C., & Poon, C.-S. (2005). Internal models in sensorimotor integration: Perspectives from adaptive control theory. Journal of Neural Engineering(3), S147. Tobler, P., Fiorillo, C., & Schultz, W. (2005). Adaptive coding of reward value by dopamine neurons. Science, 307(5715), 1645. Todd, P. M., & Gigerenzer, G. (2000). Prcis of simple heuristics that make us smart. Behavioral and Brain Sciences, 23, 727780. Tooby, J., & Cosmides, L. (2005). Conceptual foundations of evolutionary psychology. In D. M. Buss (Ed.), The handbook of evolutionary psychology (pp. 5-67). Hoboken, NJ: Wiley. Tordjman, H. (2004). How to study markets? An institutionalist point of view. Revue d'conomie Industrielle, 107, 19-36. Tucker, A. W. (1950). On jargon: The prisoner's dilemma. UMAP Journal, 1, 101. Turing, A. M. (1950). Computing machinery and intelligence. Mind, 49, 433-460. Tversky, A. (1969). Intransitivity of preferences. Psychological Review, 76, 31-48. Tversky, A., & Kahneman, D. (1981). The framing of decisions and psychology of choice. Science, 211, 453-458. Tversky, A., & Kahneman, D. (1986). Rational choice and the framing of decisions. The Journal of Business, 59(4), S251-S278. Tversky, A., Slovic, P., & Kahneman, D. (1990). The causes of preference reversal. The American Economic Review, 80(1), 204-217. Vaknin, A., & Berg, H. C. (2006). Osmotic stress mechanically perturbs chemoreceptors in escherichia coli. PNAS %R 10.1073/pnas.0510047103, 103(3), 592-596. van der Meulen, J. H., Gooskens, R. H., Denier van der Gon, J. J., Gielen, C. C., & Wilhelm, K. (1990). Mechanisms underlying accuracy in fast goal-directed arm movements in man. J Mot Behav, 22(1), 67-84. Van Essen, D. C., Anderson, C. H., & Felleman, D. J. (1992). Information processing in the primate visual system: An integrated systems perspective. Science, 255(5043), 419-423. van Gaalen, M. M., van Koten, R., Schoffelmeer, A. N. M., & Vanderschuren, L. J. M. J. Critical involvement of dopaminergic neurotransmission in impulsive decision making. Biological Psychiatry, In Press, Corrected Proof. Van Rooij, I., Stege, U., & Schactman, A. (2003). Convex hull and tour crossings in the euclidean traveling salesperson problem: Implications for human performance studies. Mem Cognit, 31(2), 215-220. Vanberg, V. J. (2004). The rationality postulate in economics: Its ambiguity, its deficiency and its evolutionary alternative. Journal of Economic Methodology, 11(1), 1 - 29. Veblen, T. (1898). Why is economics not an evolutionary science? The Quarterly Journal of Economics, 12(4), 373-397.
246
Veblen, T. (1899). The preconceptions of economic science. The Quarterly Journal of Economics, 13(2), 121-150. Vela Velupillai, K. (2002). Effectivity and constructivity in economic theory. Journal of Economic Behavior & Organization, 49(3), 307. Velleman, J. D. (1989). Practical reflection. Princeton, N.J.: Princeton University Press. Velleman, J. D. (2000). The possibility of practical reason. Oxford: Oxford University Press. Velupillai, K. (2000). Computable economics: The arne ryde memorial lectures. New York: Oxford University Press. Velupillai, K. (2005). Computability, complexity and constructivity in economic analysis. Oxford; Malden, MA: Blackwell Pub. Venter, F. J., Scholes, R. J., & Eckhardt, H. C. (2003). The abiotic template and its associated vegetation pattern. In J. T. du Toit, K. H. Rogers & H. C. Biggs (Eds.), The kruger experience: Ecology and management of savanna heterogeneity. Washington DC: Island Press. Vickery, W. L., Giraldeau, L.-A., Templeton, J. J., Kramer, D. L., & Chapman, C. A. (1991). Producers, scroungers, and group foraging. American Naturalist, 137(6), 847-863. Vincenti, W. G. (1990). What engineers know and how they know it: Analytical studies from aeronautical history. Baltimore: Johns Hopkins University Press. Vitousek, P. M., Mooney, H. A., Lubchenco, J., & Melillo, J. M. (1997). Human domination of earth's ecosystems. Science %R 10.1126/science.277.5325.494, 277(5325), 494-499. Von Eckardt, B., & Poland, J. S. (2004). Mechanism and explanation in cognitive neuroscience. Philosophy of Science, 71, 972-984. Von Neumann, J., & Morgenstern, O. (1953[1944]). Theory of games and economic behavior (3d ed.). Princeton: Princeton University Press. Vranas, P. B. M. (2006, venir). I ought, therefore i can. Vulkan, N. (2000). An economist's perspective on probability matching. Journal of Economic Surveys, 14(1), 101-118. Waelti, P., Dickinson, A., & Schultz, W. (2001). Dopamine responses comply with basic assumptions of formal learning theory. Nature, 412(6842), 43. Wagner, G. P. (1989). The biological homology concept. Annual Review of Ecology and Systematics, 20(1), 51-69. Wagner, G. P. (1996). Homologues, natural kinds and the evolution of modularity. American Zoologist, 36, 36-43. Wagner, G. P. (Ed.). (2001). The character concept in evolutionary biology. San Diego: Academic Press. Walsh, D. M. (Ed.). (2001). Naturalism, evolution and mind. Cambridge; New York: Cambridge University Press. Weber, B., & Depew, D. (Eds.). (2003). Evolution and learning: The baldwin effect reconsidered. Cambridge, Mass: MIT Press. Wedgwood, R. (2006). The meaning of 'ought'. In R. Shafer-Landau (Ed.), Oxford studies in metaethics. New York: Oxford University Press. Wedgwood, R. ( paratre). The nature of normativity. Oxford: Oxford University Press. Weiss, G. (1999). Multiagent systems: A modern approach to distributed artificial intelligence. Cambridge, Mass.: MIT Press.
247
Wenzel, J. W. (1992). Behavioral homology and phylogeny. Annual Review of Ecology and Systematics, 23(1), 361-381. West-Eberhard, M. J. (2003). Developmental plasticity and evolution. Oxford; New York: Oxford University Press. Whewell, W. ([1860] 1971). On the philosophy of discovery. New York: Burt Franklin. Whishaw, I. Q., Dringenberg, H. C., & Comery, T. A. (1992). Rats (rattus norvegicus) modulate eating speed and vigilance to optimize food consumption: Effects of cover, circadian rhythm, food deprivation, and individual differences. J Comp Psychol, 106(4), 411-419. Wickens, T. D. (2002). Elementary signal detection theory. Oxford; New York: Oxford University Press. Williams, G. V., & Goldman-Rakic, P. S. (1995). Modulation of memory fields by dopamine dl receptors in prefrontal cortex. Nature, 376(6541), 572. Wilson, R. A. (1999). Species: New interdisciplinary essays. Cambridge, Mass.: MIT Press. Wimsatt, W. C. (1987). False models as a means to truer theories. In M. Nitecki & A. Hoffmann (Eds.), Neutral models in biology (pp. 23-55). Oxford: Oxford University Press. Winterhalder, B., & Smith, E. A. (2000). Analyzing adaptive strategies: Human behavioral ecology at twenty-five. Evolutionary Anthropology: Issues, News, and Reviews, 9(2), 51-72. Wolpert, D. H., & Macready, W. G. (1997). No free lunch theorems for optimization. Evolutionary Computation, IEEE Transactions on, 1(1), 67. Wolpert, D. M., & Kawato, M. (1998). Multiple paired forward and inverse models for motor control. Neural Networks, 11(7-8), 1317. Wolpert, D. M., Miall, R. C., & Kawato, M. (1998). Internal models in the cerebellum. Trends in Cognitive Sciences, 2(9), 338. Woodridge, M., & Jennings, N. R. (1995). Intelligent agents: Theory and practice. Knowledge Engineering Review, 10(2). Worgotter, F., & Porr, B. (2005). Temporal sequence learning, prediction, and control: A review of different models and their relation to biological mechanisms. Neural Comp., 17(2), 245-319. Wray, G. A., & Abouheif, E. (1998). When is homology not homology? Current Opinion in Genetics & Development, 8, 675680. Wymore, A. W. (1993). Model-based systems engineering: An introduction to the mathematical theory of discrete systems and to the tricotyledon theory of system design. Boca Raton: CRC Press. Yampolsky, L. Y. (2001). Life history theory [doi:10.1038/npg.Els.0003219]. In Encyclopedia of life sciences. Chichester: John Wiley & Sons, Ltd http://www.els.net/. Yu, C., Zhu, J., & Sun, Z. (2005). Adaptive neural network internal model control for tilt rotor aircraft platform. Yun, I. A., Wakabayashi, K. T., Fields, H. L., & Nicola, S. M. (2004). The ventral tegmental area is required for the behavioral and nucleus accumbens neuronal firing responses to incentive cues. J. Neurosci. %R 10.1523/JNEUROSCI.5282-03.2004, 24(12), 2923-2933. Zahavi, A., & Zahavi, A. (1997). The handicap principle: A missing piece of darwin's puzzle. New York: Oxford University Press.
248
Zeigler, B. P., Praehofer, H., & Kim, T. G. (2000). Theory of modeling and simulation: Integrating discrete event and continuous complex dynamic systems (2nd ed.). San Diego: Academic Press. Zihlmann, K. B., Ducray, A. D., Schaller, B., Huber, A. W., Krebs, S. H., Andres, R. H., et al. (2005). The gdnf family members neurturin, artemin and persephin promote the morphological differentiation of cultured ventral mesencephalic dopaminergic neurons. Brain Res Bull, 68(1-2), 42-53. Zurawski, R. (2005). Embedded systems handbook. Boca Raton, Fla.: Taylor & Francis.

Dauphins Et Rationalite

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Dauphins Et Rationalite

Transféré par

Droits d'auteur :

Formats disponibles

COLE DES HAUTES TUDES EN SCIENCES SOCIALES COLE DOCTORALE CERVEAU, COGNITION

LES ANIMAUX SONT-ILS RATIONNELS ?

Doctorat nouveau rgime Philosophie

Thse dirige par: Jolle PROUST, EHESS, Institut Jean-Nicod

Aurlie, ltre rationnel par excellence

TABLES DES MATIRES

Rationalit stratgique et sociale animale........................ 176 Utilit vs Aptitude ................................................................ 179

INDEX .............................................................................................................. 217 BIBLIOGRAPHIE ............................................................................................... 219

LISTE DES FIGURES

(Glimcher et al., 2005; Kagel et al., 1995; Schuck-Paim et al., 2004)

Nous renvoyon le lecteur au chapitre 4 pour une prsentation du concept de clade.

QUELLE RATIONALIT POUR LES ANIMAUX ?

LA NATURALISATION DUNE QUESTION

(Kripke, 1972; Putnam, 1975)

Figure 1-1 Procdure de naturalisation

1.2.1 CLASSIFICATION PHILOSOPHIQUE

DES CONCEPTS DE RATIONALIT

Voir par exemple (Proust, 1997, 2003, 2006).

cf. (Grafen 1999)

Figure 1-2 Concepts philosophiques et scientifiques de rationalit

Figure 1-3 Le diamand de Nixon

Figure 1-4 Typologie des concepts de rationalit

(Maynard Smith, 1982).

LA NATURE DE LAGENT RATIONNEL CONOMIQUE

(Maynard Smith, 1993: chapitre 13).

DE QUELLE ESPCE EST LAGENT RATIONNEL ?

Cf. (Dumouchel, 2004: 482). Voir (Mealey, 1995) ce sujet.

au domicile de la raison elle-mme (D. Davidson, 1991).

Cf. (Dopfer, 1986).

!!(!x!)! !{!P!(!x!)! !Q!(!x!)!}! !P!(a ! !)! ! ! ! !P!(a ! !)! !Q!(!a!)! ! !Q!(!a!)! ! ! !

loi condition initiale !instantiation de la loi d!e!s!c!r!i!p!t!i!o!n! de lvnement !

2.2.3 PROBLMES POUR LA CONCEPTION NOMOTHTIQUE

(Ellsberg, 1961; Kahneman & Tversky, 2000).

84 Voir (Vanberg, 2004: 8-9) Binmore (1994: 150)

daprs Davidson, 1993, chap. 14 .

(May, 1954; Tversky, 1969; Tversky et al., 1990).

(Aumann & Sorin, 1989; Dupuy, 1999; Sugden, 1985, 1991).

LAGENT RATIONNEL COMME ESPCE HISTORIQUE

2.3.1 ERGODICIT ET TEMPORALIT

Figure 2-1 Urne de Polya

Ce processus est connu sous le nomdurne de Polya.

(Veblen, 1898: 375); voir aussi (Veblen, 1899)

LA RATIONALIT LIMITE : COMPATIBLE

AVEC LES NORMES

Voir (Wedgwood, 2006) sur linterprtation de doit comme un oprateur propositionnel.

LA CONCEPTION INGNIRIQUE DE LA RATIONALIT

(Gwartney et al., 2006: 27; Krugman, 2004: 35)

Lexemple est de (A. E. Roth, 1991a).

Figure 3-1 Dcomposition mcaniste, d'aprs Craver (2001)

(Quine, 1986: 665, 1990: 19)

MODLES DE LA COMPTENCE RATIONNELLE

Lexemple est de Dretske (Dretske, 2001).

Figure 3-2 Architecture minimale de contrle

(Richalet et al., 2005).

Aristote, thique Nicomaque, III, i.

Voir (Boy & Vandenberghe, 2004).

Figure 3-3 Distributions probabilistes

La deuxime condition pour tre une ACR est donc :

147 (Kaelbling et al., 1996; Sutton & Barto, 1981, 1998)

Voir (Langton, 1995) et (Holland, 1992).

Figure 3-4 Distribution gale de stratgies

Figure 3-5 Distribution variable de stratgies

Nous nous inspirons ici de (S. Russell & Wefald, 1991).