Vous êtes sur la page 1sur 20

Classications, histoire et problmes formels Daniel Parrochia (Universit Jean Moulin - Lyon III) On appelle classication l'opration consistant

ventiler une multiplicit phnomnale en diffrents groupes ou classes (hirarchises ou non, nettes ou oues, empitantes ou pas) permettant de rassembler des individus en sous-ensembles moins nombreux qu'eux. C'est aussi et surtout le rsultat d'une telle opration. Celle-ci, depuis qu'elle existe, soulve des difcults et n'a cess de rencontrer des objections. Avant d'essayer de la dcrire et d'en raconter l'histoire, donnons d'abord la parole aux opposants.

1. Classer est-il possible? Les objections de principe. Rappelons que la philosophie, entreprise pourtant systmatique, et qui, on a pu le montrer, n'a cess d'user de structures classicatoires1 , compte aussi les plus grands opposants l'entreprise taxinomique. En voici quelques exemples : a) Parmi les rticents, il faudrait dj nommer Socrate, prsent par Platon comme atopos, ce qui veut dire trange, bizarre, mais signie mot mot, sans lieu, sans site, c'est--dire inclassable, situation dont il tirait d'ailleurs parti pour dbusquer les sophistes et exercer en toutes circonstances, sa libert de jugement et la forme de pense critique qui l'a rendu si clbre. b) Au XVIIIe sicle, Diderot, pourtant l'origine de L'Encyclopdie, a lanc, dans le Supplment au voyage de Bougainville, une violente tirade anti-taxinomique : Mez-vous de celui qui veut mettre de l'ordre. Ordonner, c'est toujours se rendre le matre des autres en les gnant2. Certes, les ordonnancements ne sont pas toujours neutres, et l'opration qui consiste ranger, ventiler, distribuer ou hirarchiser peut avoir des consquences philosophiques, morales et politiques. Nanmoins, on ne doit pas confondre l'outil et ses usages. c) Plus prs de nous, on observera que la plupart des philosophies contemporaines ont cru bon de faire l'loge de la diffrence, d'une diffrence absolue, d'une diffrence sans concept, au point de faire apparatre l'entreprise taxinomique comme une maniaquerie passagre, et l'ordre, la limite, comme parfaitement contingent. M. Foucault, dans son clbre ouvrage Les Mots et les Choses livre-culte de toute

une gnration , a suggr que l'histoire n'tait qu'une succession d'ordres arbitraires (pistm) spars par des failles trahissant des phnomnes de subreption violente. D'o la rfrence initiale de cet auteur la clbre classication chinoise voque par Borgs, et qui aurait divis les animaux en : a) appartenant l'empereur ; b) embaums ; c) apprivoiss; d) cochons de lait ; e) sirnes ; f) fabuleux ; g) chiens en libert ; h) inclus dans la prsente classication; i) qui s'agitent comme des fous ; j) innombrables; k) dessins avec un pinceau trs n en poil de chameau ; l) et cetera ; m) qui viennent de casser la cruche ; n) qui de loin semblent des mouches3 . M. Foucault en tire videmment de quoi mettre en cause la pertinence de toute espce de rangement : Dans l'merveillement de cette taxinomie, crit-il, ce qu'on rejoint d'un bond, ce qui, la faveur de l'apologue, nous est indiqu comme lecharme exotique d'une autre pense, c'est la limite de la ntre : l'impossibilit nue de penser cela 4. Mais il ne s'agit gure, en fait, des limites de notre pense : ce que remet en cause le texte de Borgs, ce n'est ni plus ni moins que la possibilit de classer, c'est--dire, la limite de penser. On aura not, en effet, les diffrentes mises en cause de cette possibilit : 1) Les classes s'intersectent ; 2) Certaines d'entre elles sont indnissables, soit parce que la multiplicit qu'elles sont censes contenir est mal dnie (et cetera ou encore innombrables), soit parce qu'elle est fonction du temps, et donc en perptuelle modication (qui viennent de casser la cruche) ; 3) Une classe au moins (la classe des animaux inclus dans la prsente classication) rend paradoxale5, donc la limite impossible, toute l'opration taxinomique. C'est donc d'une mise en cause profonde de la notion d'ordre qu'il s'agit. D'ailleurs, pour M. Foucault, les ordres et les classications sont des structures de surface qui s'ancrent dans un sol aux stratications complexes qui, lui seul, mrite d'tre fouill : d'o l'ide d'une archologie du savoir, qui se substituerait l'histoire, interrogeant moins ce qui est (les grands vnements bruyants) que ce qui se rvle dans ce qui est de mouvements plus profonds, plus opaques, plus sourds. Comme dans la gologie moderne, l'ordre apparent des surfaces n'existerait donc, pour Foucault, que sur fond d'une sorte de drive des continents qui causerait, ici et l, de faon assez immotive, des fractures et des failles dont nous tentons de fournir, bien en vain, des explications rationnelles. d) Mais nous n'en avons pas ni avec les antitaxinomistes. L'crivain Georges Perec, a pu livrer l'observation suivante : les verbes franais traduisant

l'action de classer sont innombrables : cataloguer, classier, dcouper, numrer; grouper, hirarchiser, lister, numroter, ordonnancer, ordonner, ranger, regrouper, rpartir. Et encore : caractriser, dnir, discriminer, distinguer, distribuer, marquer, opposer, etc6. Face cette prolifration, on peut craindre d'emble que le spcialiste des classications ne doive d'abord s'attacher organiser son propre vocabulaire. D'o le verdict nalement ngatif de Prec, qui villipende les encyclopdistes de tout bord : Tellement tentant de vouloir distribuer le monde entier selon un code unique, une loi universelle rgirait l'ensemble des phnomnes : deux hmisphres, cinq continents, masculin et fminin, animal et vgtal, singulier et pluriel, droite ou gauche, quatre saisons, cinq sens, six voyelles, sept jours, douze mois, vingt-six lettres. Malheureusement, a ne marche pas, a n'a mme jamais commenc marcher, a ne marchera jamais...7. Pourtant, malgr le talent des auteurs que nous venons de citer, et dont les remarques peuvent tre, parfois, salutaires, nous ne cderons pas un pouce au lobby anticlassicatoire. Si classer, en effet, n'est une opration ni neutre, ni totalement autonome, et certainement pas exempte de toute dtermination extrieure, nous nous garderons pourtant d'en faire un exercice arbitraire ou gratuit. De nombreux bnces, en effet, accompagnent l'entreprise taxinomique : 1 Il s'agit de substituer un ordre rationnel et rgulier des multiplicits empiriques chaotiques et enchevtres; 2 On rduit par l la dimension des ensembles : une fois constitues des classes d'quivalence, il suft, en effet, de travailler sur les classes et non plus sur les lments. Le domaine en est donc d'autant simpli. 3 L'opration taxinomique s'accompagne donc d'une double conomie : d'une part, la diminutioncompression des donnes de dpart ralise un allgement, qui soulage l'esprit ; d'autre part, une plusvalue intellectuelle corrlative est ralise : on comprend mieux ce qui se reprsente clairement. D'o la formule frappante (quoique paradoxale) de F. Dagognet : Moins est plus8 . 2. La formation du concept de classication. Brve histoire des problmes taxinomiques Si on laisse de ct la prhistoire et les premiers rangements des socits dites primitives, o les ethnologues ont rvl l'importance des taxinomies, sans qu'on sache si, rellement, ces modles sont

conscients dans ces socits9 , nous distinguerions volontiers quatre poques dans le devenir des problmes taxinomiques : de Platon et Aristote aux grands taxinomistes du XVIIIe sicle, on examinera d'abord les premires classications qui sont des classications hirarchiques et gnralement monocritres. Dans le courant du XVIIIe sicle, on voit apparatre des classications hirachiques qui sont la fois multicritres (un domaine peut tre multiplement co-divis) et virtuellement innies. C'est seulement partir de la n du XVIIIe et du dbut du XIXe, avec les tableaux chimiques (de Lavoisier, puis Mendeleiev) qu'on dcouvre ce qu'on pourrait appeler des classications combinatoires ou des ordres multiples croiss. Enn, dans le courant du XXe sicle et la priode contemporaine, la taxinomie trouve la fois des modles algbriques rigoureux (ordres partiels, treillis) et devient numrique. Bientt elle s'automatisera et s'informatisera (analyse factorielles et multifactorielles), se nuanant dans le mme temps de toutes les manires possibles (classications empitantes, oues, arbres hybrides dont les objets ne sont pas tous situs aux extrmits, etc.). C'est d'abord cet immense mouvement que nous voudrions rapporter ici.

2.1. L'antiquit : classications hirarchiques et processus dichotomiques Une tendance typique de lesprit grec, crivait l'historien R. Joly, est de vouloir rduire une ralit complexe et multiple quelques catgories qui satisfassent la raison, tant par leur nombre restreint que par le sens clair et prcis qui sattache chacune delles10 . Ainsi, Platon (427-347) classe toute espce de choses : les genres de vie, la forme des constitutions, les plaisirs et les arts, les occupations et les mtiers, les modes de connaissance et de nonconnaissance, les positions philosophiques, etc. Les classications platoniciennes sont typiquement hirarchiques, trs souvent dichotomiques et, presque toujours fondes sur un seul critre. Ainsi, dans le Gorgias (465 c), Platon divise l'ensemble des pratiques en pratiques concernant le corps et pratiques concernant l'me, puis subdivise chaque groupe en deux sousclasses : gymnastique et mdecine du ct du corps, lgislation et justice du ct de l'me. Le mme schma est ensuite utilis pour parler des contrefaons de ces arts, tels que le sophiste les pratique. Semblablement, en Rpublique (510 a), l'ensemble de la ralit est

divise en lieu visible et lieu invisible, chaque catgories tant aussi subdivise en deux : les images ou simulacres et les choses ou vivants rels, du ct du lieu visible; les objets mathmatiques et les Ides, du ct du lieu invisible. On dclerait, dans les Dialogues, de nombreuses classications de ce genre, parfois moins symtriques, parfois plus profondes (comportant un plus grand nombre de niveaux). Platon est donc tout fait conscient de l'existence de ces classications, dont il nonce d'ailleurs les rgles auxquelles elles doivent obir : 1 Comme il l'crit dans le Politique (262 a), il convient d'oprer des partages symtriques, an d'avoir des classes quilibres : ainsi, si on classe les peuples, il conviendra d'viter d'opposer les Grecs aux autres, car l'une des classes sera plthorique et l'autre n'aura qu'un lment11. 2 Comme un bon cuisinier (Phdre), il faudra galement choisir les bonnes articulations : si on coupe parmi les nombres, cela n'a pas de sens d'opposer le dix millime aux 9999 premiers. En revanche, les oppositions pair/impair ou premier/non premier recouvriront, elles, une ralit objective. Il y a donc des classes plus stables que d'autres : c'est elles qu'il convient de construire. 3 Enn, on vitera, d'une manire gnrale, les dterminables ngatifs (opposer non-A A) : comme il est impossible que le non-tre ait des espces, ce genre de dcoupage bloque les dterminations ultrieures. Platon, hlas, n'a pas toujours observ ces sages prceptes et sa mthode a d ainsi subir les foudres d'Aristote. Aristote (384-322) a men une svre critique de la mthode platonicienne dans divers textes que l'on peut regrouper ainsi12 : 1 Dans les Analytiques premiers (1,31) la mthode platonicienne de division/classication est qualie de syllogisme impuissant : l'ide est qu'une classication (ou une srie de divisions successives) n'a pas de valeur dmonstrative. Pourquoi? 2 L'explication est donne dans un autre texte (Analytiques seconds, II,5), o Aristote suggre les raisons suivantes : a) Quand on dtermine une classe l'aide d'une srie d'attributs ou de prdicats successifs, le passage d'un prdicat un autre est contingent ( chaque nouvel attribut, on est en droit de se demander pourquoi celuici et pas un autre); b) Inversement, si, en bout de course, on essaie de reconstituer la classe de dpart, on peut alors trs bien

n'avoir, en fait, qu'une rhapsodie de prdicats ou d'attributs successifs l'aide desquels on ne parviendra jamais effectuer une vritable synthse. 3 Dans un troisime texte (Partie des Animaux, 642a-643b) quatre autres reproches sont mens l'encontre de Platon : a) Les diffrences introduites par dichotomies peuvent tre purement ngatives (et donc ne pas dnir un tre rel) ; b) Si les divisions sont binaires, il faut alors prsupposer que le nombre des espces primitives est ncessairement une puissance de 2 (hypothse lourde et peu plausible); c) Dans une division, une diffrence peut se trouver appartenir des espces primitives distinctes (par exemple, bipdie peut valoir pour certains animaux comme pour l'homme. Mais, selon Aristote, il ne peut s'agir de la mme bipdie); d) Enn, la division platonicienne mlange des perspectives extensionnelles et intensionnelles. Elle identiera ainsi le triangle (qui est un genre) l'une de ses proprits (galit de la somme de ses angles 2D). Aristote entend donc rationaliser l'art de diviser et de classer. Dans les Topiques (I, chap. 1), il introduit les dnitions des notions de genre, d'espce, de proprit, et toute une thorie des prdicables fondamentaux (ce qu'on peut dire en gnral d'une chose) qui sera dveloppe ultrieurement par Porphyre et Boce. Cette thorie repose sur l'opposition de l'essence et de l'accident. L'essence tant l'ensemble des caractres qui dnissent une chose (une substance - upokeimenon) et l'accident ce dont la prsence ou l'absence ne modie pas l'essence, on peut, partir de l, organiser les prdicables fondamentaux en un tableau caractristique : un prdicable est soit essentiel, soit accidentel; s'il est essentiel, soit il dcoule de l'essence, soit il la constitue; mais soit il la constitue alors totalement (et c'est une espce), soit il la constitue partiellement; dans ce dernier cas, il est soit un genre (partie commune plusieurs espces), soit une diffrence spcique (partie spciale telle ou telle espce). Il dcoule de l que les genres et les espces forment une hirarchie dont les termes suprieurs sont attribuables ceux qui leur sont infrieurs, et l'on va ainsi des genres suprmes aux espces ultimes ou inmes (species inmae). L'individu est le sujet ultime

de toute attribution : toutes les notions suprieures peuvent lui tre attribues mais lui-mme n'est pas un universel, par consquent il n'est pas un prdicable, et n'est donc pas objet de science. Dans le prolongement de ces rexions, la tradition aristotlicienne sera amene prciser la hirarchie des genres et des espces : les genres subordonns jouent le rle d'espces vis vis des genres suprieurs et les espces d'un genre donn jouent le rle de genres vis vis des espces infrieures. Les termes de suprme, d'intermdiaire et d'inme en viennent ainsi s'appliquer aussi bien aux espces qu'aux genres. Le clbre arbre de Porphyre (234-305) illustre cette subordination des genres et des espces :

Le conceptualisme (Ablard, XIIe s; Ockham, XIVe s) : les genres existent comme des prdicats de sujets qui eux sont rels. Le ralisme (platonicien) : les genres existent en soi dans un monde intelligible distinct du sensible. Le ralisme (aristotlicien) : les genres ne sont pas spars des choses singulires et sensibles. Ils n'existent qu'incarns. La doctrine de l'Ecole (varit de ralisme aristotlicien). Le Moyen-Age et la Renaissance connatront aussi de grands encyclopdistes et de grands dfenseurs des classications, notamment le clbre chancelier Francis Bacon (1561-1626) qui est l'origine de classications encyclopdiques qui inspireront les encyclopdistes et grands bibliothcaires du XIXe. Mais la logique des classications (qui reste la logique aristotlicienne) ne connatra pratiquement aucun dveloppement nouveau jusqu'au XVIIIeme sicle. A cette poque, le philosophe E. Kant (1724-1804) rsume dans sa Logique (1800), l'essentiel des acquis des sicles prcdents en prcisant les dnitions d'un certain nombre de termes et d'oprations qui relvent de la thorie des classications telle que l'utilisent empiriquement les naturalistes de l'poque : citons par exemple Tournefort (1656-1708), Linn (1707-1778), De Jussieu (A.-L.) (1748-1836), Desfontaines (1750-1833) ou Cuvier (1769-1832) 14.

Substance immatrielle matrielle (incorporelle) (corporelle) inanime anime (non-vivant) (vivant) insensible sensible non raisonnable (animal) raisonnable (homme)

A la suite de cette entreprise de systmatisation, le Moyen-ge verra se dvelopper la fameuse querelle des universaux, d'ailleurs ne dans un clbre texte de Porphyre, tir de son Commentaire sur les Catgories d'Aristote : En ce qui concerne les genres et les espces : subsistent-ils en eux-mmes ou ne sont-ils contenus que dans les pures conceptions intellectuelles, sont-ils des substances corporelles ou incorporelles; sont-ils spars enn des choses sensibles ou y sont-ils impliqus, y trouvant leur consistance? Je me garderai de le prciser; c'est un problme trs difcile ncessitant des recherches approfondies13 . Cinq rponses diffrentes seront apportes cette question, qu'on peut brivement rsumer comme suit: - Le nominalisme (Roscelin, XIe s) : les universaux sont des mots. Rien n'y correspond dans la nature qui ne connat que le singulier.

2.2. Des classications multicritres et virtuellement innies La Logique de Kant (au 110) fait apparatre la notion de division logique d'un concept, dnie de la faon suivante : La dtermination dun concept au point de vue de tout le possible compris sous lui, dans la mesure o ce possible est oppos un autre, cest--dire en diffre, sappelle la division logique du concept. Le concept suprieur se nomme le concept divis (divisum) et les concepts infrieurs les membres de la division (membra dividentia)15. D'aprs Kant, la division logique doit obir aux rgles suivantes:

1) Les membres de la divisions sexcluent entre eux; 2) Ils relvent dun concept suprieur et leur runion redonne la sphre du concept divis; 3) Chaque membre d'une division peut tre luimme divis (division des membres de la division = subdivision) Par les deux premires rgles, Kant semble anticiper le concept mathmatique de partition. Mais la troisime prouve qu'il n'a pas le concept de chane de partitions, telle que la mathmatique des ordres a pu l'laborer aprs Birkhoff, puisqu'il ne conoit pas que des subdivisions de mme niveau forment en fait une unique partition. Ces divisions kantiennes prennent la forme suivante : 1) Pour Kant, toute division est soit dichotomique, soit polytomique, mais seules les dichotomies sont des divisions rellement logiques et par consquent susceptibles de senseigner dans le cadre de la science du raisonnement. En effet, la dichotomie est la seule division proprement analytique et qui nexige rien dautre pour tre effectue que le principe de non-contradiction, aucune connaissance du contenu du concept diviser ne lui tant en fait ncessaire. A linverse, la polytomie requiert lexprience sensible telle que nos sens nous la communiquent (c'est--dire, en langage kantien, l'intuition) : soit une intuition du temps ou de l'espace indpendante de l'exprience (intuition a priori), comme en mathmatiques (par exemple, la division des sections coniques16; soit une intuition empirique, comme dans la description de la nature17. 2) On remarquera encore que la division dun concept, pour Kant, nest pas univoque. Pour un mme terme, il peut exister une multiplicit de divisions diffrentes, que le philosophe nomme co-divisions et qui renvoient des points de vue diffrents sur le concept en question. Apparemment, ces co-divisions ne sont pas elles-mmes hirarchises et peuvent tre subdivises galement de manire trs diffrente. 3 Les subdivisions comme les co-divisions peuvent aller l'inni.

A) la subdivision, crit Kant, peut tre indniment poursuivie18 . Elle ne peut tre dclare nie que comparativement ou relativement. Dans la srie des espces et des genres, il ny a pas de concept dernier (conceptum inmum) ou despce dernire, sous laquelle aucune autre ne serait plus contenue, car un tel concept est impossible dterminer. Car, bien que nous ayons en fait un concept que nous appliquons immdiatement aux individus, il peut encore y avoir relativement ce concept des diffrences spciques que nous ne remarquons pas ou dont nous ne tenons pas compte. Cest seulement comparativement et pour lusage quil y a des concepts derniers qui ne prennent cette signication que pour ainsi dire par convention, dans la mesure o lon saccorde pour ne pas descendre plus bas19. On notera, l encore, que Kant rencontre ici un problme que le classicateur moderne reposera : comment dnir une classication dans des domaines o les individus sont difciles isoler 20? Peut-on dnir rigoureusement des classications innies et quels sont leurs rapports entre elles (Shelah, Girard)? B) Les divisions kantiennes sont encore virtuellement innies dune autre manire: non plus en hauteur, si l'on peut dire, mais en largeur. Selon Kant, en effet: La co-division galement va linni, spcialement dans les concepts de lexprience, car qui peut puiser toutes les relations des concepts?21 A tout concept pourrait donc tre en principe associ une innit darbres innis. Le philosophe ne parat pas stre pos la question de savoir quel pouvait tre le rapport entre deux et a fortiori une innit de divisions conceptuelles menant paralllement linni. C'est probablement de cette ide de codivisions associe des variations de point de vue que surgit un type de classication plus complexe que la classication hirarchique arborescente et qui est la classication combinatoire ou l'ordre multiple crois.

2.3. Les classications combinatoires ou ordres multiples croiss

Ce type de classication rsulte, soit du croisement de deux (ou plusieurs) divisions, soit du croisement de deux (ou plusieurs) hirarchies de divisions. Dans une telle structure, comme l'crit G.-G. Granger, Les lments sont distribus selon deux ou plusieurs dimensions donnant lieu une table de multiplication22 . Ce ne sont pas alors les lments eux-mmes qui sont rpartis en classes, mais deux (ou plusieurs) composantes distingues de ces lments23. Pour Granger, ce processus renvoie au plan cartsien et au principe fondamentalement ordinal qui a prsid son invention. Le plan cartsien rsulte en effet d'une volont d'ordonner une certaine distribution de points dans lespace en ordonnant les points dans chaque range et les ranges les unes par rapport aux autres. Les classications des lments chimiques de Lavoisier, puis de Mendeleiev, constituent des exemples typiques de ce genre de classication 24. Mais, la classication des mthodes25 , dans la logique de Kant, en donne galement un autre exemple. Le philosophe, en effet, rpartit les mthodes en une srie de dichotomies parallles : scientiques ou populaires, systmatiques ou fragmentaires, analytiques ou synthtiques, syllogistiques ou tabulaires, acroamatiques (i.e. procdant par enseignement) ou rotmatiques (procdant par questions). Ces co-divisions parallles aboutissent videmment la constitution de partitions croises. On peut faire, propos de ce type de classications, les remarques suivantes : 1 Ce type de rangement, qui suppose... un degr dabstraction suprieur celui de la classication linnenne26 , nest, lorsquil se rduit un tableau numrique, pas trs parlant. Il appartiendra alors aux mthodes modernes de lanalyse factorielle des correspondances de donner des reprsentations gomtriques de tels tableaux. La transposition des modles de la mcanique du solide en statistique permettra notamment de considrer ces tableaux comme des nuages de points pesants dont on s'efforcera de calculer les directions d'allongement en les projetant dans diffrents plans selon des axes privilgis. Lobjet complexe et irreprsentable est alors comme photographi sous plusieurs angles et sa forme gnrale dment mise en carte selon ses prols majeurs. On pourra alors ventuellement, lanalyse faite, construire sur ces rsultats une vritable classication hirarchique, dautant plus proche de la ralit quelle articulera les oppositions essentielles que lanalyse factorielle aura dgage 27.

Faute de possder ces mthodes, Kant, dans tout son systme, en est rduit juxtaposer les classications linnennes traditionnelles, proches des dichotomies platoniciennes et des hirarchies scolastiques, et les tableaux entres multiples, dun style plus combinatoire, le problme du lien existant entre les uns et les autres n'tant mme pas pos. 2 Mais nous nous permettrons encore une seconde remarque au sujet de ces classications combinatoires : la vertu des ordres multiples est de prciser la position de ce qui est class l'intersection d'une ligne et d'une colonne et au croisement de plusieurs sries de dterminations28 . Considrons l'exemple suivant, tir de la classication de Mendeleiev :

VI Soufre (32) As (75) Se Tellure (125)


On voit que la masse atomique du Slnium peut aisment tre calcule partir de celles qui l'entourent, dont elle est, trs exactement, la moyenne : m = 78 = (32 + 125 + 75 + 80)/4. L'un des avantages est, en cas d'absence (case vide), de pouvoir prciser ce qui n'est pas l par ce qui l'entoure. Ainsi, la classication de Mendeleiev permettra-t-elle de prvoir l'existence d'lments qu'on ne trouve pas dans la Nature, avant mme qu'ils soient synthtiss en laboratoire 29: Dcidant d'appeler ces lments inconnus par le nom de l'lment qui prcde, auquel on ajoutera le prxe ka, Mendeleiev fait la dmonstration suivante : l'lment occupant IV et qui vient aprs IV-3 occup par le silicium, sera appel kasilicium Es et ses proprits seront anticipes partir des proprits de Si, Sn, Zn et As. Son poids atomique doit se rapprocher de 72, son oxyde suprieur la composition EsO2 et l'oxyde infrieur EsO, la forme la plus ordinaire de ses combinaisons sera EsX4... On tirera de cet exemple deux conclusions, d'ailleurs corrles : a) Le tableau est cratif. On ne classe plus seulement pour retrouver mais pour inventer : la vertu comparative (et combinatoire) l'emporte sur le simple

Br (80)

recensement du dj l; b) La temporalit (et, en particulier, l'avenir) est inscrit dans le tableau (qui n'est plus simplement rfrentiel). Les transuraniens, dcouverts par Seaborg et ses collaborateurs depuis 1940 par exemple, s'inscriront tout naturellement dans le tableau, en analogie avec les lanthanides, rsolvant la controverse leve propos de la quatrime priode longue de la classication de Mendeleiev30 . Concluons avec F. Dagognet qu'une petite rvolution, ici, a eu lieu. Avec Mendleiev, la classication ne cherche plus regrouper ou condenser le savoir: elle l'lve et le thorise. Avant le Tableau, on classait ce qu'on connaissait. Dsormais, c'est la classication (et non pas un classement) qui nous donne des connaissances nouvelles31 .

3. Les classications documentaires Bien entendu, on aimerait faire pour tout espce de documents, ce que les scientiques, ici ou l, ont russi. Quoi de plus normal, par exemple, que de vouloir classer les contes, les rcits fantastiques32 , les positions philosophiques, de proche en proche, l'ensemble du savoir, les livres en gnral? On peut reculer devant une telle ambition, qu'on jugera dmesure. Pourtant, on ne saurait nier que cette entreprise bibliothconomique de concentrationrcapitulation est dj dans la Nature, qui est ellemme sa propre mmoire (sdiments, mines), au point, qu'on a pu prsenter la dmarche encyclopdique comme une sorte de paysage et de panorama. Paul Claudel, dans sa Philosophie du livre, rapprochait la bibliothque et la mine de charbon, toutes deux pleines de fossiles, d'empreintes et de conjectures. Diderot, dans le fameux article encyclopdie de son clbre dictionnaire encyclopdique, rapporte qu'un Dictionnaire universel des Sciences et des Arts n'est qu'une immense campagne couvertes de plaines, de rochers, d'eaux, de forts et d'animaux. De mme a-t-on pu crire que les voyages de Jules Verne sont autant des parcours dans les taxinomies et dans l'arbre du savoir que dans l'espace. Mais, quelle que soit la pertinence de ces rapprochements, on notera qu'une organisation systmatique des connaissances humaines s'est avre rapidement inontournable : partir du XIXe sicle, en particulier, le rythme des dcouvertes s'acclrant et amenant une prolifration considrable des documents, la ncessit, de plus en plus, se fait jour de devoir s'orienter dans les multiplicits culturelles, tout comme

on s'tait jadis orient dans les multiplicit naturelles. Tout le monde comprend que la vritable innovation suppose d'abord la connaissance de ce qui est, que refaire du rvolu est un gaspillage injustiable et que les taxinomies, l encore pour des raisons conomiques, ont un rle irremplaable jouer. Les grandes classications bibliothconomiques qui naissent cette poque, bien que l'ide en soit bien plus ancienne33, obissent ces ncessits34. Sur le plan de la mthode, les classicateurs du XIXe ont d'abord cherch s'inspirer des grands taxinomistes de l'antiquit et du XVIIIe sicle et ont donc construits des classications monocritres. Diffrents principes ont t utiliss pour ranger le savoir. Citons notamment le principe des divisions parallles, qui fait que chaque sujet est dissqu selon un ordre et une rgularit approximativement suivis partout, dans la subdivision des classes diffrentes; ou encore, le principe des divisions par transfert, qui consiste prescrire de diviser le domaine y comme le domaine x. Mais des problmes concrets, tout de suite, se prolent : combien de classes, par exemple, faudra-t-il retenir au dpart? Puisque, par ailleurs, le savoir ne cesse de progresser, comment permettre l'indexation incessante d'lments nouveaux sans avoir bouleverser, chaque fois, la topologie de la classication? Les rponses ces questions vont se concrtiser travers diffrentes tentatives que nous ne pouvons ici malheureusement que trs rapidement voquer.

3.1.La classication dcimale DEWEY Le choix d'une division dcimale, apparemment arbitraire permettra Melvil Dewey (1876) d'introduire, chaque nouvelle dition de sa classication, des notions nouvelles (il lui sufra, pour cela, d'ajouter un chiffre l'indice correspondant la notion la plus gnrale laquelle on peut les rattacher). D'o une adaptabilit, en principe, indnie de la classication par prolifration des subdivisions internes. Cette classication a, en outre, l'avantage d'tre parfaitement progressive et rgulire. Elle part de dix classes fondamentales correspondant dix domaines de savoir (hritage de William Torrey Harris, autre bibliothcaire amricain 35) : 000 - Gnralits, 100 - Philosophie, 200 - Religion, 300 - Sciences sociales,

400 - Langage, 500 - Sciences pures, 600 - Techniques, 700 - Arts, 800 - Littrature, 900 - Gographie et Histoire gnrales. Puis chaque classe comporte dix divisions au plus, divises de faon identique (100, 110, 120..., 190; 200, 210, 220,...,290; ...) et chaque division dix subdivisions : 110, 111, 112,..., 119. L'dition de 1876 comprenait ainsi mille indices principaux de trois chiffres, mais dj, l'dition de 1885 tait sept fois plus importante que la premire et l'augmentation rapide du savoir et des techniques au XXe sicle amena l'dition actuelle faire apparatre plus de 20.000 indices (sans compter les nouvelles possibilits de construction autorises par les tables auxiliaires) 36. 3.2. La Classication dcimale Universelle (C.D.U.) C'est partir du procd invent par Dewey que les Belges Paul Otlet et Henri de la Fontaine, qui avaient entrepris, l'Institut international de bibliographie de Bruxelles la tche ambitieuse de constituer un rpertoire sur ches de tous les livres connus depuis les dbut de l'imprimerie, laborrent la CDU (1895), version moderne de la classication Dewey. C'est que la mthode de Dewey n'tait pas sans inconvnient. Le risque principal de la division dcimale tait en effet de conduire un relatif miettement du savoir qui faisait inluctablement voluer la classication vers le simple inventaire ou la nomenclature. Le risque tait d'autant plus grand que, priodiquement, on le sait, le savoir a tendance se regrouper ou se refondre selon de nouvelles lignes directrices. Bacon avait remarqu, jadis, que les sciences s'abrgent en s'augmentant et Kant lui-mme avait not qu'avec le dveloppement de l'histoire naturelle, de la mathmatique, etc., de nouvelles mthodes seraient dcouvertes, propres condenser le savoir antrieur et rendre superus quantits de livres37 . Il faut donc partir la recherche d'algorithmes propres regrouper des sujets transversaux et compenser l'excs de partitionnement introduit par la dcimalisation. Le principal intrt de la CDU, initialement, est probablement l. Classication encyclopdique et documentaire, la CDU a, comme la Dewey, une

ambition d'universalit, et comme elle, est divise en dix classes fondamentales. Mais elle amne en plus la possibilit de fabriquer des indices composs en liant des indices principaux, soit par un signe d'extension, la barre oblique (/), soit par un signe de relation, les deux points (:). La CDU permet ainsi une meilleure indexation des ouvrages complexes ou interdisciplinaires. Le sens du signe d'extension (/) plac entre deux indices est que le document index contient toutes les notions comprises entre eux (par exemple, on notera 5/6 un livre portant la fois sur les sciences et les techniques). Les deux points (:), quant eux, expriment essentiellement un rapport entre deux notions, et autorisent ainsi des doubles indexations utiles au lecteur : (par exemple, un livre traitant des relations entre la philosophie et la religion donnera lieu deux ches du catalogue systmatique, en philosophie (1 : 2) et en religion (2 : 1). Certains lments seront donc situs des endroits diffrents cette redondance ayant un sens pragmatique, celui de faciliter la recherche du lecteur potentiel. Notons encore, comme dans la Dewey, la prsence de tables auxiliaires de subdivisions communes : le lieu (introduit par une parenthse), le temps (introduit par des guillemets), la forme, entre parenthses et prcde d'un zro (02 09). Des divisions analytiques, n'affectant qu'une classe et ne pouvant tre utilises ailleurs, complteront la panoplie. Toutefois, malgr ces amnagements, il faut reconnatre que la CDU reste une hirarchie extrmement ramie aux indices lourds, souvent conduite traiter de sujets voisins en des lieux trs diffrents. De tendance numrative, comme toute classication dcimale, elle n'chappe donc pas, malgr ses amliorations successives, la nomenclature.

3.3. Coup d'il sur les autres classications Cette dviation se manifesterait encore dans la classication de la Library of Congress (1901), ou dans la Bibliographic Classication de Henry Evelyn Bliss (1910). Y remdier ncessitera de vritables innovations conceptuelles, comme par exemple, celle qu'apportera la classication colon, ou classication facettes38, du bibliothcaire indien Ranganathan. C'est en effet avec Shiyali Ramamrita Ranganathan et sa Colon Classication (CC) qu'on voit apparatre, semble-t-il, pour la premire fois en bibliothconomie, une classication vritablement multicritre. Commence en 1924 et publie dans sa premire dition Madras en 1933, la CC, quoique hirarchique, propose en effet une analyse pluridimensionnelle des sujets selon diffrentes facettes. En langage kantien, cela signie tout simplement que Ranganathan admet des co-divisions d'un mme sujet. En outre, cette classication mnage plusieurs types de relations transversales, distinctes selon qu'elles s'appliquent des classes principales diffrentes (phase relations) ou l'intrieur d'une mme classe (intra-facet-relations). Curieusement, et malgr sa nouveaut, la CC n'a pas vraiment convaincu la communaut bibliothconomique. Tout en notant sa souplesse, Eric de Grolier39, l'un des spcialistes de ce domaine, observe en elle de grandes lacunes, un langage classicatoire pauvre et parfois dcient, laissant tout le moins beaucoup de place l'initiative du classicateur, enn, des choix assez injustis au niveau des catgories fondamentales comme de leurs spcications. Finalement, on devra convenir que la dmarche classicatrice en bibliothconomie a t fortement remise en question au XXe sicle par le dveloppement prolifrant de la connaissance : 1 L'afux de documents interdit une topologie rigide pour les rangements. Mais il est difcile de trouver des modles vraiment heuristiques qui autorisent une topologie qui change sans cesse40 . Les rexions les plus convaincantes sur la question ont t menes ce sujet par des mathmaticiens bibliothcaires autour de structures particulires : arbres 3-2, par exemple de Hopcroft, pour l'indexation de donnes alatoires (revues, etc.)41. 2 Les rordonnancements successifs du savoir (regroupements, refontes ou refondations existent autant sinon plus que les rafnements et la ramication

des domaines) ncessitant des langages documentaires relationnels appropris et des systmes de gestion de bases de donnes puissants. Les vieilles classications du XIXe clatent sous la pression du nombre de documents et la puissance des systmes de recherche automatiss. Nanmoins, la question se pose toujours de savoir quels sont les meilleurs rangements. Et ceci renvoie au problme du fondement formel des classications.

4. La mathmatique des classications Mathmatiquement, la thorie des classications relve de domaines multiples : thorie des ordres partiels, thorie des relations (graphes), statistique applique (analyse des donnes et des correspondances, classication automatique), thorie des formes quadratiques et logique mathmatique. La thorie des formes quadratiques remonte Gauss (1803), les travaux sur les arbres aux chimistes Kkul et Frankland ainsi qu' l'algbriste anglais Cayley (XIXe), la thorie des ordres partiels G. Birkhoff (1951), la statistique applique Qutelet, Galton et Pearson. Le problme pistmologique majeur ici est, bien sr, de comprendre quels sont les liens qu'on peut tablir entre les diffrentes approches et entre les diffrentes structures proposes : comment dnir une classication au plan formel? Pour rpondre cette question, il nous faut dire quelques mots des diffrentes disciplines mathmatiques mentionnes plus haut et qui concourent aujourd'hui prciser la notion de classication.

4.1. L'analyse des donnes : brve histoire Selon J.-P. Benzcri42 , l'analyse des donnes, qui tire son inspiration de la lointaine histoire du calcul des probabilits repose en fait sur des mthodes qui se sont progressivement dveloppes depuis la n du XIXe et dans le courant du XXe sicle. On peut d'abord voquer les premires recherches biomtriques de Qutelet (1846) : ce statisticien sociologue mesure les tailles, poids, etc. des populations d'objets ou d'tres et constate que la loi normale offre une description acceptable de la dispersion des mesures. Il en dduit des application en astronomie et en sociologie (la clbre thorie de l'homme moyen);

En second lieu, il faut mentionner l'cole biomtrique de Galton (1877), premire tude multidimensionnelle qui permet d'tudier conjointement la variation de deux mesures (taille du pre et du ls, par exemple, ou encore, longueur du bras et longueur de la jambe d'un mme homme, etc.). Galton dcouvre ainsi empiriquement la fonction densit et les courbes de niveau (ellipses concentriques) de cette fonction. Une troisime tape intervient avec K. Pearson partir des annes 1920. K. Pearson (1857-1936), travaille d'abord avec le biologiste R. Weldon (1860-1906) sur les races de crevettes et de crabes, dont il mesure les organes, carapaces, etc., dans diffrents milieux dans le but de vrier la thorie darwinienne de l'volution. Grce l'tude des coefcients de corrlation entre des mesures prises chez les parents et chez les enfants, il arrive notamment montrer qu'une part constante de la variance de la gnration des enfants et hrite des gnrations antrieures successives (Loi de l'hrdit ancestrale). On notera que Pearson est l'origine de dcouvertes statistiques importantes comme l'expression de la densit de la loi normale multidimensionnelle la plus gnrale en fonction des variances des composantes, ou encore, comme l'preuve du 2 qui permet d'apprcier si une loi de probabilit empirique F, dtermine sur un chantillon d'effectif k, diffre signicativement d'une loi de probabilit modle P. Comme l'a bien not J.-P. Benzcri, les travaux de Pearson auront des consquences philosophiques importantes, notamment en ce qui concerne la notion de causalit 43 : 1) Pearson voit clairement que la relation la plus gnrale que rvle l'observation des phnomnes naturels est la contingence, ou encore, ce qu'on peut appeler la co-occurrence ; 2) Il en rsulte que, tant donn les deux dimensions I et J d'un tableau rectangulaire, on ne peut pas plus dire que le fait i I cause le fait j J que l'inverse. 3) Si l'ide d'une causalit doit subsister, elle ne peut tre autre, pour Pearson, que la limite conceptuelle de la corrlation quand la bande centrale du tableau de contingence devient si mince qu'elle tend tre semblable une courbe. 4) Selon Pearson, la causalit n'est donc pas dans la Nature. Elle est introduite par la perception humaine, et ne correspond en fait qu' ce qu'on doit interprter comme une conomie de pense, une routine de perceptions moyenne et approximative44 . Une quatrime tape du dveloppement de l'analyse des donnes pourrait tre reprsente par R. A. Fisher

(1890-1962), professeur de gntique (et non de mathmatique, contrairement ce qu'on croit parfois) mais pre de l'introduction de la gomtrie multidimensionnelle en statistique. Fisher travaille au dpart sur la statistique de petits chantillons et calcule des distributions exactes de coefcients de corrlation par des mthodes gomtriques. C'est ainsi qu'il invente, pour l'estimation de la variance d'une loi normale d'aprs un petit chantillon, un critre nomm critre du maximum de vraisemblance qui rend maximum le produit des densits et qu'il identie une sorte de projection orthogonale. Il est galement l'origine de l'analyse de la variance, c'est--dire de la dcomposition de la variance conue comme l'inertie d'un nuage de points. En ce sens, Fisher est le premier utiliser des thormes de mcanique du point (comme le thorme de Huygens) en statistique. Il est donc le promoteur de l'exportation du modle mcanique en statistique. On notera qu'il est aussi l'inventeur de l'analyse discriminante, qui dcoule, d'ailleurs, de la dcomposition de la variance et qui permet de sparer des formes les unes des autres. Enn Fisher est le promoteur d'une mthode plutt inductive en sciences, qui prconise que la recherche se fasse selon deux tapes : la premire, qui consiste recueillir systmatiquement des donnes et dresser un plan d'exprience. La seconde, qui confronte ces donnes une hypothse et labore un test probabiliste. On discernerait facilement, avec l'cole psychomtrique amricaine, l'analyse factorielle et multifactorielle (Spearman, Thurstone, Burt, Hotelling, Torgerson et Guttman), une cinquime tape dans le dveloppement de l'Analyse des donnes. Comme le remarque J.-P. Benzcri, qui nous empruntons toutes ces informations, c'est vers la n du XIXe sicle et le dbut XXe sicle que la psychomtrie devient une science part entire. A cette poque, on travaille beaucoup sur les tests d'intelligence (Binet, Q.I., etc.) et on est amen distinguer dans la mesure d'un test, diffrents facteurs : on opposera notamment l'aptitude polyvalente du sujet (facteur gnral), et une aptitude particulire l'activit mesure (facteur spcique). Toute preuve peut alors tre dcompose selon une formule o intervient ces deux facteurs. Ds lors, la mthodologie se prcise. En 1931, Thurstone (sur l'instigation d'un astronome, W. Bartky) a l'ide d'appliquer cette analyse factorielle la mthode des moindres carrs. En 1933, Hotelling proposa de rechercher des vecteurs propres par itration et orthogonalisation. Il est ainsi l'origine de la notion de composantes principales. Puis, en 1941, c'est

Guttman qui crit les formules les plus gnrales de l'analyse des donnes. Malheureusement, faute de moyens de calculs adquats, il doit se contenter de reprsentations ad hoc et relativement plus pauvres (scalogrammes, simplexes, etc...). C'est l'ensemble de ces rsultats qui expliquent l'mergence de l'cole franaise et le livre-phare de 1973 qui fait connatre un public plus vaste des mthodes qui s'appliquent dj l'poque en sciences humaines et vont conqurir rapidement d'autres champs45 .

4.2. Dveloppement du concept mathmatique de classication: la taxinomie numrique Si la taxinomie fait effectivement partie de l'analyse des donnes au point qu'un des deux tomes du livre de J.-P. Benzcri de 1973 lui est entirement consacr, c'est en fait un courant diffrent de celui que nous venons de rapporter qui est l'origine de la mathmatisation des concepts de classe et de classication. Au dpart, notons-le, le concept de classe est assez vague. Qui dit classication dit classe, bien entendu, mais l'ide d'une bonne classication, d'une vraie classication prsupposait, depuis les travaux des botanistes et des zoologistes du XVIIIe, l'ide de classe naturelle la base. Or ce concept de classe naturelle, si l'on y rchit, est assez discutable : que signie-t-il, en ralit? Doit-on comprendre que les classes en question seraient ou devraient tre conformes la Nature, ce qui aurait tendance suggrer que la Nature est elle-mme classicatrice et que nos ordres recoupent en fait un Ordre Naturel intrinsque? Doit-on aller jusqu' penser que la rfrence la Nature renvoie une essence intemporelle, de sorte que les classes naturelles seraient en fait des classes essentielles, autant dire des sortes d'ides platoniciennes ou l'analogue de vritables modles des tres? Mais les dterminations extrinsques qui ont pes sur la raison classicatrice46, tout comme la continuit naturelle et les diffrents obstacles qui, d'une faon gnrale, compliquent la saisie des classes prouvent que ces soi-disant essences sont surtout le rsultat d'une construction humaine. De plus, sur un plan pratique, la question se pose de savoir comment dnir concrtement une classe naturelle. De ce point de vue, l'histoire tait riche d'enseignements puisque Vicq d'Azyr, ds 1792, avait soulign l'insufsance des classes monothtiques dans les sciences de la Nature. On pouvait donc penser qu'a

fortiori, les sciences de l'homme, aux prises avec des enchevtrements de faits autrement complexes, auraient plutt utiliser des classes polythtiques. Ce concept de classe polythtique fut rigoureusement labor par Beckner en 1959 avec le sens suivant : une classe sera dite polythtique si chaque lment de cette classe possde une proportion importante mais non spcie d'attributs, et rciproquement, si chaque attribut est possd par une proportion importante (mais non ncessairement la totalit) des lments de la classe. Ds 1937, Gilmour suivait une dmarche dj prconise par Adanson (1757), un des grands naturalistes du XVIIIe, mais qui n'avait pu tre pratique de fait, tant donn la complexit des calculs : procder sans a priori, runir toutes les ressemblances et rapprocher les objets uniquement en fonction d'elles. Il est vident qu'une telle mthode ne peut s'appliquer sans qu'on ait dni de faon prcise une mesure de ces ressemblances. C'est ce que vont faire, en 1963, Sokal et Sneath, qui, les premiers, jetteront les bases d'une taxinomie numrique en introduisant prcisment, dans leur grand livre Principles of numerical taxonomy, des indices ou mesures de ressemblance entre les objets classer. Ds lors, il devenait manifeste que la dmarche du classicateur supposait diffrentes tapes et plusieurs choix successifs : celui d'un indice de distance ou d'une mesure de similarit et celui d'un algorithme de regroupement. Longtemps, ces choix restrent plus ou moins intuitifs, c'est--dire plus ou moins justis ou ambigus. En 1970, cependant, I.C. Lerman introduisit dans l'histoire de la thorie des classications au moins deux grandes nouveauts : 1 Il caractrisa pour la premire fois de faon formelle le problme gnral de la construction d'une classication, tel qu'il est aujourdui peru par le classicateur moderne : tant donn une information de base qu'on identie une donne brute et qui est une structure pauvre de type , le problme du classicateur est d'essayer d'amliorer cette information, c'est--dire de substituer la structure pauvre de dpart une structure plus riche qu'on notera et qui peut tre une partition, un treillis, une chane, etc. La solution de ce problme consiste injecter la classe forme par l'ensemble des structures de type dans la classe forme par l'ensemble des structures de type , avec un certain critre (prordre dni sur partir d'une distance ventuellement d'une mtrique dnie sur ) et qui spcie que sera prfrable ' si, en un sens prciser, est plus prs de la structure

que '47. On remarquera qu'une telle dnition suppose videmment qu'on puisse produire sufsamment de structures pour tablir les comparaisons ncessaires. Et elle serait videmment impensable sans le recours l'informatique. C'est le caractre automatique de la production des structures de type qui permet de multiplier les lments de comparaison, et qui est l'origine de l'augmentation des possibilits d'adquation entre le modle et l'objet. On remarquera cependant que la dnition du critre (ce qui fait qu'on va prfrer une structure une structure ') reste certainement une entreprise dlicate et o la connaissance du domaine continue intervenir. 2 Le second lment important sur lequel il est permis d'insister est la question de la variabilit de l'indice de similarit et de la stabilit de la classication. Face la multiplicit des choix possibles (d'indices de distances comme d'algorithmes48 ), et tant donn la facilit de production des hirarchies indices par l'informatique, la question pouvait se poser de savoir comment s'assurer de la stabilit des classications produites. I.C. Lerman est, l encore, l'origine d'un rsultat remarquable : dans le cas o la donne est une prordonnance et o le nombre d'attributs de chaque objet est invariable, alors la prordonnance est la mme quel que soit l'indice choisi. Plus gnralement encore, elle varie peu si le nombre d'attributs de chaque objets varie peu 49. On a donc, dans certains cas, des garanties de stabilit de la classication quand le domaine, videmment, se conforme ces hypothses. Depuis une quinzaine d'annes, des progrs ont t encore raliss qui permettent, dans certains cas, de rduire encore le rle de l'intuition et l'arbitraire des choix possibles : ainsi, I.C. Lerman, dans des articles rcents, a-t-il non seulement cherch assainir les fondements de l'analyse des donnes au regard de la statistique50, mais il a, pour l'algorithme de la vraisemblance du lien, russi lever une grande indtermination sur le choix de l'indice de ressemblance entre objets51 . Dans le cas de variables qualitatives, il a encore russi rduire considrablement l'arbitraire du choix de l'expression formelle d'un coefcient d'association en le localisant au niveau du choix de l'indice brut, c'est--dire l o il est plus facilement paramtrable 52. Quelles que soient, par consquent, les difcults rencontres, des amliorations certaines se sont faites dans le domaine de la taxinomie numrique, qui rduisent de plus en plus la latitude des dcisions du classicateur, fortient les mthodes mises au point et contribuent abiliser la discipline de l'analyse des donnes. Il reste que, sur le

plan philosophique, l'ide gnrale de classication reste encore largement opaque, tant donn la multiplicit des modles travers lesquelles elle se prsente. 5. La voie logico-algbrique : de la multiplicit des reprsentations taxinomiques l'unit formelle de la notion de classication Une classication peut prendre aujourd'hui des allures trs diffrentes. En ce qui concerne les reprsentations arborescentes, les modles correspondants peuvent tre des hirarchies indices (Lerman 1970, Benzcri 1973), des arbres phylogntiques des naturalistes (Barthlemy-Gunoche 1988), des arbres artes values (arbres additifs de Henley 1969, Tversky, Abdi, Barthlemy, Luong 1984), ou encore des arbres de longueur minimum (comme les arbres de Steiner)53. On notera que les reprsentations arborescentes ont t gnralises au cas o les objets ne sont pas tous ncessairement situs aux extrmits de l'arbre (hybrid trees de Carroll et Chang 1973), ou encore, au cas de groupes empitants constitus sur la base d'une dcomposition additive (Shepard et Arabie 1979) 54. Dans le cas de reprsentations tabulaires (formelles ou oues), on rencontre dans la littrature des partitions croises (Lerman 1981), et des croisements de classications oues55 (Lerman 1981). Les reprsentations de classication dans le plan factoriel font galement apparatre des ellipsodes d'inertie, qui constituent, pour reprendre une expression de M. Jambu, de srieuses aides l'interprtation56 . Construite partir de procds trs diffrents, une classication peut donc se manifester sous des formes extrmement diverses. Si l'on est sufsamment souple sur le vocabulaire, elle peut tre, par hypothse, un treillis, un demi-treillis, une chane, une ultramtrique, une analyse factorielle, une loi statistique, etc. Comment trouver l'unit (s'il y en a une) qui se cache sous ces diffrentes structures? Y a-t-il des correspondances entre ces diffrentes formes ou ces diffrentes prsentations de classications? On sait que, prendre le problme par un biais purement formel (ou logico-algbrique), quelques traductions algbriques locales ont pu tre construites. Ainsi, il existe une quivalence entre classication hirarchique et analyse factorielle. Michel Gondran 57 a mis en vidence des isomorphies entre les notions d'arbre de longueur minimum, d'ultramtrique sous-

dominante, de matrice de similarit et d'arbre de classication. Il a, de plus, prouv que la structure algbrique de l'ensemble des classications hirarchiques sur un ensemble tait le semi anneau {R+ }, avec x +y = min (x,y) et x * y = max (x,y). M. Gondran et M. Minoux ont montr conjointement qu'une classication pouvait tre galement assimile la minimisation d'une fonction quadratique sous certaines contraintes, ou encore la coloration des sommets d'un graphe pour un seuil de proximit donn58. On sait encore que les classications arborescentes peuvent tre reprsentes comme des produits non associatifs, sur lesquels on a quelques rsultats locaux (problme de Wedderburn-Etherington des parenthsages non commutatifs, ou encore, problme de Schrder des parenthsages gnraliss)59. On peut encore utiliser, dans les reprsentations arborescentes, la notation polonaise, ou la notation polonaise inverse60 , avec l'espoir de dcouvrir une algbre sufsamment puissante pour s'adapter une relation de classication dnie de faon sufsamment gnrale. Mais une telle approche du problme fait surgir des questions trs difcile : comment dnir, au plan le plus gnral, c'est--dire sur des ensembles nis ou innis, une relation de comparabilit 61? Existe-t-il des classications complmentaires, une classication neutre, une structure gnrale de l'ensemble des classications possibles sur un ensemble? Pourrait-on construire une thorie gnrale des classications comme on a construit une thorie des ensembles, en identiant les axiomes sur lesquels elle doit reposer?62

quivalence les repres associs aux diffrents classicateurs. Cette voie ne pourrait videmment tre praticable que s'il existe, dans le domaine de l'information, une sorte d'extremum comparable la vitesse de la lumire63 . Elle poursuivrait la transposition des outils de la mcanique classique la statistique esquisse par l'analyse des donnes en rendant possible l'utilisation de la mcanique relativiste64. Il reste que, dans cette voie, l'indice de distance utilis (par exemple, la distance de l'information sous une forme quadratique) restera toujours justier. 2) Une autre voie consisterait projeter toute classication dans un espace commun homogne. Si l'on admet, par exemple, que toute classication peut en principe trouver une reprsentation dans un espace d'axes factoriels, on peut traduire toute classication par un ensemble d'ellipsodes dinertie sortie aujourdhui tout fait banale et pour laquelle on dispose dalgorithmes efcaces65 :

Conclusion : la question du fondement d'une thorie des classications Pour autant qu'un pistmologue puisse intervenir dans un dbat aussi lev et aussi technique que celui du fondement mathmatique d'une thorie gnrale des classications, nous serions tents de dire que la question peut tre vue de plusieurs manires : 1) Le fondement de toute classication pourrait tre conu comme une forme invariante qui maintient constantes entre elles les diffrentes composantes d'une information. De mme que dans l'espace physique, la forme de Lorentz est l'invariant qui met en quivalence tous les repres associs aux observateurs, on pourrait concevoir, dans un espace informationnel n dimensions, une forme quadratique mettant en

On notera que les classes s'intersectent car la mtrique la plus gnrale qu'on puisse choisir amne travailler avec des pseudo-boules66 . On aboutit ainsi cette structure empitante du type ensemble des sousensembles ouverts d'un espace topologique, qui ne donne malheureusement aucun rafnement. Il est remarquable que l'tude de l'univers au moyen de mthodes locales comme l'analyse par ondelettes rvle, pour la rpartition des groupements de galaxies et des vides, une structure du mme type (voir l'analyse d'une plaque de Schmidt de six degrs par six degrs,

l'extrmit Est du superamas de Coma, effectue par E. Slzak et ses collaborateurs)67. 3) Il nous semble que, dans son sens purement mathmatique, le problme du fondement des classications rejoint des questions de logique pure lis la thorie des modles et la question de la comparabilit des hirarchies transnies68 , questions qui dpassent de beaucoup nos comptences. Il demeure que le problme des classications est indniablement li la construction du continu pour une raison trs simple : d'aprs Bourbaki 69, l'ensemble P(E) des partitions d'un ensemble inni E est quipotent l'ensemble P(E) de ses parties. Par consquent, d'aprs l'hypothse du continu, si Card E =

restreindrait les possibilits illimites de prdication ou de dnition de relations permises par la thorie des ensembles aux seules classes obissant des contraintes logico-mathmatiques permettant d'engendrer du continu partir du discret. D'o le schma suivant, qu'a bien voulu nous communiquer M. P. Neuville :
THEORIE GENERALE DES CLASSIFICATIONS

o , Card P(E) = Card P(E) = 2o = 1 . Et d'aprs l'hypothse du continu gnralise, si Card E = , Card P(E) = Card P(E) = 2 = . Comme, pour
+1

Monde rel

Monde sensible

Classifications Classifications perceptuelles physiques

Card E > 3, le cardinal de l'ensemble C(E) des classications est ncessairement suprieur ou gal au cardinal de l'ensemble P(E) des partitions, et strictement infrieur celui de l'ensemble des parties de l'ensemble des partitions, il est, en l'absence de cardinal intermdiaire, ncessairement gal celui de l'ensemble des partitions. En consquence, l'ensemble des classications d'un ensemble inni fournit une construction du continu, et mme du continu gnralis. S'il tait alors possible d'esquisser un lien entre cette problmatique fondationnelle purement mathmatique et la question plus concrte des classications empiriques, nous pourrions tenter de l'exprimer de la faon suivante : Dans les sciences humaines et dans nombre de sciences exprimentales comme, par exemple, les diffrents domaines de la biologie, les classicateurs construisent des classications sur la base d'indices de distance et de mesures de similarit qui restent, pour une part, lis la perception qu'ils prennent du domaine empirique classer. Dans le domaine de la physique, les classications qu'on dcouvre (classication des vnements dans la thorie de la relativit, classication des particules en physique quantique...) reposent en gnral sur des contraintes lies l'espace-temps (symtries et brisures de symtries) dont la nature ne parat pas lie aux points de vue ou aux degrs d'information des observateurs mais leurs transformations invariantes. Enn, le problme classicatoire dans sa puret logico-mathmatique nous semble impliquer l'exitence d'une thorie gnrale des classications qui

Construction du Continu

Notes
1

Cf. Parrochia [1993]. Voir Diderot [1951], p. 999. Foucault [1966], p. 7. Ibid. C'est nous qui soulignons.

2 3 4 5

Un tel paradoxe pourrait d'ailleurs tre formalis et compar d'autres : paradoxes d'Epimnide, de Frege ou de Russell, etc.
6 7

Prec [1985], p. 15

Ibid., p. 155. On lira aussi le commentaire de Dagognet [1990], p. 112-113. Cf. Dagognet [1984]. Nous avons nanmoins discut cette formule, qui admet des limites, en deux endroits. Cf. Parrochia, [1996] et Parrochia [1998].
8

Voir, par exemple, Durkheim, et Mauss, in Mauss [1971], p. 162-230. Cf. Lvi-Strauss [1962]. Notons toutefois que les thses de l'cole franaise, au sujet de l'existence de ces classications primitives, qui pourraient n'tre qu'une projection de nos catgories sur des penses orales qui n'ont rien voir avec elles, ont t contestes par Goody [1979], p. 131-132 notamment.
9 10 11

Le premier tableau de Mendeleiev date de 1869. L'ka-aluminium, baptis Gallium en l'honneur de son inventeur (franais) Lecoq de Boisbaudran, fut dcouvert en 1875; l'kabore ou scandium (car extrait par le scandinave Nilson), apparat en 1879; enn, le germanium (dcouvert par l'allemand Winkler de Fribourg) fut isol en 1885.
29 30 31 32

Cf. Cooper [1967], p. 82. Dagognet [1969], p. 121.

Joly [1956], p. 7.

Notons que des classicateurs d'aujourd'hui ne diraient pas forcment autre chose : Cf. ChandonPinson [1981], p. 4. Nous avons dj comment ces textes dans Parrochia [1991].
12 13 14

Notons que telle tait bien l'ambition qui se dgageait des travaux de Propp [1969], et Todorov [1975]. Elle remonte au XVIIe sicle Naud. Sur et auteur, cf. Damien [1995].
33 34 35 36 37 38 39 40

Cit par Chnique [1975], p. 81.

Voir aussi Parrochia [1997], pp. 81-92. Bethery [1982], p. 20. Ibid., p. 20-29. Kant [1970], p. 47. cf. Vickery [1963]. De Grolier [1962], p. 47-60.

F. Dagognet, rappelons-le, a consacr un ouvrage l'tude de la formations de ces classications botaniques et zoologiques. Cf. Dagognet [1970]. Voir galement notre rsum-commentaire dans Parrochia [1991], p. 147 sq.
15 16 17 18 19 20 21 22 23 24 25 26 27

Kant [1970], p. 156-157. Kant [1968], p. 463. Kant [1970], p. 158. Ibid. Ibid., p. 107. Cf. L'exemple des coraux, donn par Apostel [1963]. Kant [1970], p. 158. Granger [1967], p. 133. Ibid. Cf. L-dessus, Dagognet [1969], p. 32 et p. 128. Kant [1970], p. 160. G.-G. Granger [1967], ibid.

cf. Hillman [1965], pp. 177-209. Hillmann utilise des algbres de Heyting-Brouwer et leurs treillis distributifs libres associs pour modliser des collections nonstatiques. Ce modle donne la forme gnrale de la topologie, mais non les voisinages et les distances sont concrtements construits, ce qui suppose qu'on ait une technique bien prcise et d'une toute autre sorte pour xer des relations pertinentes. Voir la discussion de cette communication pp. 214-218. Larson et Walden [1979], p. 127-136. Dans cet article, inspir par les travaux d'Hopcroft, les auteurs calculent les transformations et les cots de transformations de certains arbres 3-2, sous les contraintes cres par l'ajot d'une ou de plusieurs cls supplmentaires sur des racines ou des feuilles, ce qui amne modier parfois considrablement la structure de l'arbre. Des formules gnrales sont donnes qui permettent de prdire les structures et les cots pour des transformations donnes.
41 42 43 44

J.-P. Benzcri, on le sait, fut l'introducteur, en France, de telles mthodes. Cf. Benzcri [1973]. Nous reviendrons plus loin sur l'histoire de ces mthodes.
28

Cf. Benzcri [1982]. Ibid., p. 46.

Dagognet [1969], p. 103-104 et p. 150-151.

Pearson [1911], tr. fr. L. March, cit par Benzcri [1982], ibid.

Voir les applications la linguistique, dans Benzcri [1981].


45

66 67

Benzcri [1973], tome 1, p. 193-194.

On sait que l'Ordre Naturel, chez Linn, est l'image de la socit fodale, comme le disent explicitement des textes sans quivoque : cf. Linn [1972], p. 104-108.
46 47 48 49 50 51 52 53

Cf. Gouguenheim [1990], p. 24-25; cf. L'analyse par ondelettes, Pour la Science, septembre 1987. Un nombre important de travaux devrait tre mentionns ici. Contentons-nous de citer ceux de
68

Lerman [1970], [1981]. Voir, par exemple, Roux [1985]. Lerman, [1981]p. 85. Lerman [1986], p. 238-252. Lerman [1987], p. 39-60. Lerman [1992], p. 33-52.

Shelah [1978] et Girard [1987].


69

Bourbaki [1970], E III. 87.

Sur toutes ces reprsentations, cf. Barthlemy et Gunoche [1988], p. 13 sq.


54 55

cf. Chandon et Pinson [1981], p.219.

La notion de classication oue qu'utilise I.C. Lerman ne doit rien L.A. Zadeh qui, dans le cadre de la thorie des sous-ensembles ous, a dni un formalisme particulier pour reprsenter des relations de similarit et des ordres ous. Cf. Zadeh [1970]; cf. Kaufmann [1975].
56 57

Jambu [1978], tome 1, p. 284, tome 2, p. 205.

Gondran [1976], 22-23, p. 181-189. Cf. Jambu [1978], tome 1, p. 115-118.


58 59 60 61

Gondran et Minoux [1979], p.360 et p. 372-373. cf. Comtet [1970], p. 67-71. Gondran et Minoux [1979], p. 114.

C'est ce qu'avait commenc de faire le mathmaticien G. Kurepa dans sa thse o il dnit de telles relations sur des arbres innis. Cf. Kurepa [1935], p. 1-138. Le logicien L. Apostel a pos, nagure, de telles questions : cf. Apostel [1963].
62

Cela supposerait, par exemple, qu'il existe une limite la quantit d'information traitable dans une certaine unit de temps.
63

La dmarche a t esquisse par Jumarie [1990] et nous l'avons reprise et dveloppe dans Parrochia [1994].
64 65

Jambu [1978], tome 2, p. 206 sq.

17

BIBLIOGRAPHIE Aho, A.V., Hopcroft, J.E, Ulmann, J.D., Data Structures and algorithms, Reading (Mass.), Addison-Wesley Publishing Company, 1983. Apostel, L., Le problme formel des classications empiriques, in La Classication dans les Sciences, Gembloux, Duculot, 1963. Aristote, Premiers Analytiques, I, 31; Seconds Analytiques, II, 5 et 13; pour la critique de la mthode de division, cf.Les Parties des Animaux, 642a-643b. Auray, J.P., Duru, G., Zighed, A., Analyse des donnes multidimensionnelles, Lyon, Editions A. Lacassagne, 1990. Barthlemy, J.-P., A. Gunoche, Les arbres et les reprsentations des proximits, Paris, Masson, 1988. Benzcri, J.-P., et collaborateurs, Lanalyse des donnes, 1 ; La taxinomie, 2 Correspondances, Paris, Dunod, 1973. Benzcri, J.-P. et coll., Pratique de l'analyse des donnes, Dunod, 1981. Benzcri, J.-P., Histoire et prhistoire de l'Analyse des Donnes, Paris, Dunod, 1982 Bthery, A., Abrg de la classication dcimale de Dewey, Paris, Cercle de la librairie, 1982. Birkhoff, G. Lattice theory, A.M.S., 1967. Bourbaki, N. Thorie des ensembles, Paris, Hermann, 1959. Chandon, J.-L, S. Pinson, Analyse typologique, Paris, Masson, 1980. Chnique, F., Elments de logique classique, Paris, Dunod, 1975. Claudel, P. : La philosophie du livre, Maestricht, Stols, 1926. Clavier, H. : Grille et prol encyclopdiques, Paris, Hermann, 1942. Comtet, L., Analyse combinatoire, Paris, P.U.F., 1970. Conway, J.H., Sloane, N.J.A., Sphere Packings, Lattices and Groups, New York, Berlin, Springer-Verlag, 1988. Cooper, D.G., La classication priodique des lments chimiques, Paris, Dunod, 1967. Dagognet, F., Tableaux et langages de la chimie, Paris, Seuil, 1969. Dagognet, F., Le catalogue de la vie, Paris, P.U.F., 1970. Dagognet, F. : Le Nombre et le lieu, Paris, Vrin, 1984.

18

Dagognet, F., Corps rchis, Paris, O. Jacob, 1990. Dahlberg, I. : "Classication theory, yesterday and today", International Classication 3 (1976), n2, pp. 85-90. Damien, R., Bibliothque et Etat, naissance d'une raison politique dans la France du XVIIe sicle, Paris, PUF, 1995. De Grolier, E. : Etude sur les catgories gnrales applicables aux classications documentaires, Unesco, 1962. Diderot, D., uvres, Paris, Gallimard, 1951. Dobrowolski, Z. : Etude sur la construction des systmes de classication, Paris, Gauthier-Villars, 1964. Durkheim E., et Mauss, M., De quelques formes primitives de classication, in Mauss, M., Sociologie, Paris, Minuit, 1968; collection Point, 1971, p. 162-230. Foucault, M., Les Mots et les Choses, Paris, Gallimard, 1966. Gandillac, M. de : "Encyclopdies pr-mdivales et mdivales", in Cahiers d'histoire mondiale, 1966, IX, 3, pp. 8-42. Gilson, E. : Index scolastico-cartsien, Paris, Vrin, 1966. Essais de

Girard, J.-Y. Proof Theory and logical Complexity (tome 1), Naples, Bibliopolis, 1987. Gondran, M., La structure algbrique des classications hirarchiques, Annales de lInsee, 1976, 22-23. Gondran, M., Minoux, M., Graphes et algorithmes, Paris, Eyrolles, 1979. Goody, J., La Raison graphique, tr. fr. Paris, Minuit, 1979. Gouguenheim, L., La structure de l'univers, analyse par ondelettes et rpartition des galaxies, Pour la Science, octobre 1990 Granger, G.-G., La thorie aristotlicienne de la science, Paris, Aubier-Montaigne, 1976. Granger, G.-G., Pense formelle et sciences de lhomme, Paris, Aubier-Montaigne, 1967. Gusdorf, G. : Les Principes de la Pense au sicle des Lumires, Paris, Payot, 1971. Hillman, D.J., Mathematical classication technics for non-static document collections, with particular reference to the problem of revelance, in Classication Research, Elsinore Conference Proceedings, Munksgaard, Copenhagen, 1965, pp. 177-209. Jambu, M., Classication automatique pour lanalyse des donnes, tome 2, logiciels, Paris, Dunod, 1983. Joly, R., Le thme philosophiques des genres de vie dans lantiquit classique, Bruxelles, 1956.

19

Jumarie, G, Relative information, Springer Verlag, 1990. Kant, Critique de la Raison Pure, tr. fr. Trmesaygues-Pacaud, Paris, P.U.F., 7e ed., 1968. Kant, Logique, tr. fr. Paris, Vrin, 1970. Kaufmann, A., Introduction la thorie des sous-ensembles ous, tome 3, Application la classication et la reconnaissance des formes, aux automates et aux choix des critres, Paris, Masson, 1975. Krastner M., Espaces ultramtriques et ultramatrodes, Sminaire, Facult des Sciences de Paris, 1953-1954. Kurepa, G., Ensembles ordonns et ramis, thse, Paris, 1935; Public. math. de lUniversit de Belgrade, 4, 1935. Larson, J.A., Walden, W.E., Comparing insertion shemes used to update 3-2 trees, Information Systems, vol.4, 1979, p. 127-136. Lerman, I.C., Les bases de la classication automatique, Paris, Gauthier-Villars, 1970. Lerman, I.C., Classication et analyse ordinale des donnes, Paris, Dunod, 1981. Lerman, I.C., Rle de l'infrence statistique dans une approche de l'analyse classicatoire des donnes, Journal de la socit de statistique de Paris, n4, 4e trimestre 1986, p. 238-252. Lerman, I.C., Construction d'un indice de similarit entre objets dcrits par des variables d'un type quelconque. Application au problme du consensus en classication, Revue de statistique applique, 1987, XXXV (2), p. 39-60. Lerman, I.C., Conception et analyse de la forme limite d'une famille de coefcients staitstiques d'association entre variables relationnelles, 1re partie, Mathmatiques, informatique et sciences humaines, 30e anne, n118, 1992, p. 33-52. Lvi-Strauss, C., La pense sauvage, Paris, Plon, 1962. Linn, C, La Police de la Nature (1760), in L'Equilibre de la Nature, tr. fr., Paris, Vrin, 1972. Maniez, J. : Les langages documentaires et classicatoires : conception, construction et uti- lisation dans les systmes documentaires, Paris, Les ditions d'organisation, 1987. OMeara, O.T., Introduction to quadratic forms, Berlin, Springer Verlag, 1973.

Parrochia, D. Un modle formel des processus dichotomiques platoniciens, Revue de Mtaphysique et de morale, 1986, n3. Parrochia, D., Mathmatiques & existence, Seyssel, Champ Vallon, 1991. Parrochia, D., La Raison systmatique, Paris, Vrin, 1993. Parrochia, D., Cosmologie de l'Information, Paris, Herms, 1994.

20

Parrochia, D., Algorithmics and the limits of complexity, Science in Context, 9, 1 (1996), p. 39-56. Parrochia, D., Bibliothque et structuration du savoir, Revue Le Tlmaque, n9, fvrier 1997. Parrochia, D., Classication et complexit dans l'uvre de F. Dagognet, paratre in F. Dagognet, philosophe et mdecin, sous la dir. de R. Damien, Paris, Les Empcheurs de penser en rond, 1998. Pearson, K., The grammar of science, London 1911. Prec, G., Penser/Classer, Paris, Hachette, 1985 Pierce, R.S., Classication problems, Mathematical System theory, vol. 4, n1, Mars 1970, pp. 65-80. Platon, Oeuvres Compltes, Paris, Gallimard, 1951. Propp, V., Morphologie du conte, tr. fr. Point-Seuil, 1969. Rasiowa, H., An algebrac approach to non-classical logics, Amsterdam, North Holland, 1974. Rescher, N. : Cognitive systematization, Oxford, Basil Blackwell, 1979. Riordan, J., Introduction to combinatorial analysis, New York, Wiley, 1958. Roux, M., Algorithmes de classication, Paris, Masson, 1985. S. Shelah, Classication Theory, and the number of non-isomorphic models, North Holland, 1978. Taffarelli, J.-L. : Les systmes de classication des ouvrages encyclopdique, thse de 3me cycle, Lyon, 1980. Todorov, T., Tableau de la littrature fantastique, Paris, Seuil, 1975. Totok, W. : "The ordering of knowledge and the knowledge of ordering between Renaissance and Enlightenment" , International Classication 8 (1981), n1, pp. 1-9. Van Cutsem B. (ed.), Classication and dissimilarity analysis, Springer Verlag, 1994. Van Slype, G. : Les langages d'indexation : consception, construction et utilisation dans les systmes documentaires, Paris, Les ditions d'organisation, 1987. Vickery, R.C., La classication facettes, guide pour la construction et l'utilisation de schmas spciaux, tr. fr. Paris, Gauthier-Villars, 1963. Zadeh, L.A., Similarity relations and Fuzzy ordering, E.R.L. Report n M277, Elect. res. Lab. Univ. of Californian Berkeley, July, 1970.