Vous êtes sur la page 1sur 7

Au-del de lindo-europen

1. Les familles de langue (typologie gntique, parent) Comme on le voit, la notion de famille linguistique, le fait dapparenter des langues parfois parles des poques diffrentes, sur des territoires loignes et sans quil y ait eu contact, ces dmarches sont lobjet dassociations, de confusions, pour ne pas dire de malentendus. La terminologie narrange rien : depuis le dpart, depuis le dveloppement de ltude scientifiques du langage, mi-XIXme, ce sont les sciences naturelles, en particulier biologie, qui servent de modle. Les langues sont tudies avec outils des thories volutionnistes de Darwin, comme des espces vivantes, voire comme des individus : on parle de famille, de langue vivante, dextinction, aprs avoir maintenu les mtaphores de langue -mre, languefille, de parent etc. et cela continue dans les dveloppements actuels : cologie linguistique, langues en danger, diversit linguistique, expressions qui voquent les enjeux pesant sur le langage humain en termes qui voquent soit un patrimoine immatriel , soit des espces vivantes victimes de lactivit humaine ! Linguistique apparat dabord comme historique, avec un dveloppement fulgurant au XIXme. Conjointement grammaire compare, se met en place la typologie linguistique, cest--dire les mthodes permettant de classer les langues. Le XIXme sicle connat dj des typologies descriptives, rpartissant langues selon des critres formels : langues affixes, pronoms, particules, flexionnelles (frres Schlegel, Humboldt), etc. Ces classications descriptives impliquent dj un jugement de valeur (mpris) : langues parfaites (langues flexionnelles : le sanskrit est le type suprieur) par rapport des langues sans variation de formes plus anciennes comme le chinois perspective historique qui opposerait des stades primitifs (isolant) des niveaux plus aboutis et parfait (flexionnel). Parallle vident avec oppositions entre types de socits (industrialises vs traditionnelles par exemple), qui pose la supriorit de lEurope ou de lOccident sur le reste du monde (colonies). Etablissement de familles de langue nest quun autre type de typologie, dite gntique, puisquelle pose la parent, cest--dire lien dans lapparition et le dveloppement des systmes linguistiques en question (gntique encore mtaphore). Ces typologies senties comme permettant de confirmer la supriorit raciale (gntique) dune souche : lindoeuropen est plus dvelopp du point de vue historique plus loign dun prtendu t ype primitif. 1.1. En de ou avant : le modle roman Lindo-europen est dj un au-del, par rapport lhorizon connu depuis la Renaissance avec les langues romanes. On la vu, la famille des langues romanes est le type parfait, pour ne pas dire idal, de famille linguistique, et un des plus anciens. Outre quil confre plusieurs langues vulgaires finalement une ascendance noble : espagnol, franais, italien, portugais viennent du latin cest un type parfait car tout la famille est connue, en dautres termes, le latin prsente le type de langue-source idale : parfaitement document et ce sur pratiquement toutes les poques de son dveloppement, de manire continue. Lhumanisme se construit ainsi sur cette filiation, ces lettres de noblesse, aprs avoir tent vainement de chercher pour les langues dEurope des preuves de descendance dautres langues prestigieuses, en particulier lhbreu biblique. Comme par ailleurs on a cru jusqu la fin du XVIIIe sicle que le latin venait du grec, langue encore plus prestigieuse Le modle roman est ainsi un premier pas concret, et couronn de succs, vers la recherche de la langue parfaite . Paralllement, les langues justement dites romanes se retrouvent avantages par rapport celles qui ne sont pas affilies au latin : allemand, anglais,

Au del de lindo-europen
ALLHiS Sources perdues 20 janvier 2014 p. 2

par exemple (langues germaniques) ou langues slaves, malgr la parent sentie comme vidente depuis longtemps. La thorie indo-europenne permet en particulier aux cultures germaniques de rcuprer un statut fort, prestigieux (langues indo-germaniques), le sanskrit tant devenu le rvlateur de cette noblesse insouponne. 1.2. Les autres familles Le dveloppement de la linguistique est domin au XIXe sicle par la diachronie et les succs de la grammaire compare des langues indo-europennes. La confusion est facile entre typologie descriptive et typologie gntique. Tout cela nempche pas quassez rapidement, au XXme sicle en particulier, la linguistique dgage dautres groupes importants, notamment pour les domaines gographiquement ou historiquement voisins. Langues smitiques Ainsi, la famille des langues qualifies alors de smitiques est tabli un peu avant (1781, orientalistes allemands) lindo-europen pos par Jones (1786). Le nom mme procde dune catgorisation ethnique, puisquelle sappuie sur un personnage mythique ponyme (Sem, fils de No). Comporte larabe, lhbreu, le maltais, lamharique (thiopie, rythre, gypte, Isral, Djibouti, Ymen, Soudan), mais aussi des langues disparues : phnicien, aramen, akkadien, ougaritique La famille a ensuite t tendue sous le nom de chamito-smitique (ou hamito- sur Cham, autre fils de No) en 1860 un groupe de langues plus large comportant 4 autres branches : lgyptien ancien (+ copte), les langues berbres, les langues tchadiques (Tchad, Nigria, Cameroun, Centrafrique : haoussa), les langues couchitiques (Corne de l'Afrique, thiopie, Soudan : afar, sidamo, somali). Cette famille est dsormais plus communment appele afro-asiatique (1914, rpandu 1963 Greenberg). Langues finno-ougriennes Famille identifie partir du XIXme sicle, qui regroupent des langues parles en Scandinavie (finnois, same), au bord de la Baltique (estonien), dans lOural et jusquau fleuve Don et bien sr le hongrois. Cette famille est associe celle des langues samoydes (Russie, Finlande, Norvge, Sude : ntse, nntse), parfois sous le vocable de famille ouralienne. Langues caucasiennes : comme leur nom lindique, ensemble htrogne de 3 groupes de langues parles dans le caucase : kartvlien (gorgien, laze), abkhazo-adygien (tcherkesse), nakho-daghestanien (tchetchne), peut-tre le basque (?) Langues turques (turciques) : turc, kazath, kirghiz, ouzbek, que lon a longtemps incluses dans une famille plus vaste nomme altaque, avec les langues mongoles, toungouses (mandchou) + japonais (rgulirement !) Toujours en marque du domaine indo-europen, on pourrait citer les langues dravidiennes au sud des langues indo-europennes du subcontinent et qui ont t tudies et identifies ds le dbut du XIXe sicle (1816 puis 1856) : tlougou, tamoul, kannada, malayalam Jarrterai ici cette vocation trs rapide, en me limitant justement aux familles qui forment les limites gographiques de lindo-europen. Comme on le voit, lidentification de ces parents, dveloppe suivant des mmes mthodes comparatives analogues celles appliques pour lindo-europen, a souvent t contemporaine des dveloppements de la grammaire compare de cette dernire famille. Pour limmense majorit des 5000 langues qui sont parles dans le reste du monde, cest essentiellement depuis le XXe sicle que le travail de classification et daffiliation a t men. Cette extension qui aboutit au classement gntique de toutes les langues du monde en familles dbouche directement sur le problme du ou des niveaux suprieurs celui de la famille : superfamilles macrofamilles (macrofamilies) ou grandes familles et au del encore, de la question des relations historiques entre les familles.

Au del de lindo-europen
ALLHiS Sources perdues 20 janvier 2014 p. 3

2. Au del : un tabou ? Un examen rapide de la littrature, souvent trs circonspecte, voire franchement polmique, consacre aux niveaux suprieurs laisse vite apparatre quen un peu plus dun sicle et demi, lindo-europen se serait constitu comme un horizon indpassable. Une famille non engendre (?). Mais ne procdons pas des simplifications abusives, malgr la complexit et lenchevtrement des questions. 2.1. le nostratique Depuis le XIXe sicle, lindo-europen domine, est incontournable dans les tudes de linguistique en occident, tel point que lon peut trs bien ne jamais avoir entendu parler des entreprises visant appliquer, un niveau suprieur, un traitement comparable celui qui a permis de passer du niveau des langues romanes celui des langues indo-europennes. Cest pourtant ce qui a t envisag, ds le dbut du XXe sicle : si lindo-europen ntait quune branche dune famille encore plus importante ? La thorie la plus ancienne, mais non la seule, est connue sous le nom de famille des langues nostratiques. Prcisment, certaines des familles voisines dont nous venons de parler, pourraient tre rattaches aux langues indo-europenne. Dj, fin XIXe, proposition de regrouper indoeuropen, finno-ougrien et altaque Mais cest avec lindo-europaniste danois Holger Pedersen quen 1903 le terme de nostratique est employ pour la premire fois pour regrouper lindo-europen avec louralo-altaque (rapprochement avec le turc dont certaines units ne pouvaient pas sexpliquer selon lui par lemprunt), mais aussi les langues finno-ougriennes, samoydes, et chamito-smitiques. Les justifications sappuient ds le dpart sur des lments lexicaux, mais aussi grammaticaux (ngation, pronom interrogatif, marqueur doptatif, pron. 2Sg, causatif, numraux). La dmarche peut sembler demble europocentriste, puisque nostratique sentend comme la langue des nostrates les gens de chez nous (Cicron uerba nostratia mots de chez nous ). Cet ethnocentrisme sinscrit lui-mme dans la continuit de celui qui caractrise, pour les partisans des superfamilles, les indo-europanistes. Devant les rticences ou rsistances de la communaut scientifique, Pedersen parlait dj de la crainte de voir lindo-europen dtrn de son statut de famille isole (non engendr ?). La thorie de Pedersen disparat presque dEurope occidentale, pour renatre dans la linguistique sovitique : dbut des annes 1960, deux linguistes de Moscou, qui, sparment, sans connatre les travaux de lautre, travaillent sur les relations de lindo-europen avec dautres familles partir de la thorie nostratique : Aron Dolgopolski ( 1930-2012) et Vladislav Illitch-Svitych (1934-1966 -). Ils faisaient des regroupements de familles diffrents. Illitch-Svitych meurt prmaturment, Dolgopolski publie ses travaux avant dmigrer et de continuer luniversit de Hafa. La thorie nostratique est rpandue en dehors dURSS par un 3me collgue, Vitali Chevorochkine, qui migre aux Etats-Unis dans les annes 1970. Les travaux des sovitiques sont trs dvelopps, dune manire comparable lindoeuropen : aprs les rapprochements sur des bases lexicales et phontiques, la thorie reconstruit tous les niveaux du systme (tout le systme phontique, les rgularits, toute la grammaire, tout le lexique). On reconstruit donc une proto-langue, cest--dire le modle de langue originelle (anctre de la famille), comme cest le cas en indo-europen.
Sens ProtoNostratique Proto-IndoEuropen ProtoUralien ProtoAltaiqu e ProtoKartvelien ProtoYukaghi r Nivk h ProtoEskimo ProtoAfroAsiatiqu e

moi (NSg)

mi

H eom /eom

mi

bi

me, mi

met

ni

wi moi , mkt j [agis sur] toi

mi, -m

Au del de lindo-europen
ALLHiS Sources perdues 20 janvier 2014 p. 4

Dolgopolski et Illitch-Svitych reprennent pour cela les donnes accumules ds le dbut du XXe sicle par Alfredo Trombetti (18661929), professeur Bologne et qui dfend ds 1905 (L'unit d'origine del linguaggio) lide dune origine unique pour toutes les langues et avait dvelopp une classification universelle, thorie videmment rejete lpoque. La thorie se dveloppe toujours actuellement avec des publications douvrage ou de ressources en ligne. Depuis les Sovitiques, on est all jusqu composer des textes (posie de Illitch-Svitych) en nostratique, poussant ainsi les limites de la reconstruction dans des retranchements comparables ceux des indo-europanistes depuis la fable de Schleicher. La reconstruction ne procde ainsi plus de laccs des sources perdues, mais bascule dans le fantasme (cf. langues imaginaires, comparer avec le statut des artefacts en archologie). Language is a ford through the river of time It leads us to the dwelling of those gone ahead But he does not arrive there Who is afraid of deep water 2.2. Joseph Greenberg Trombetti est un des premiers tendre la classification (dont la mthode comparative indoeuropenne est un exemple) toutes les langues. Lide de classement gntique est indissociablement lie celle dorigine donc si lon peut classer toutes les langues, on peut essayer de regrouper les familles en superfamilles, et ainsi de suite jusqu une seule (langue mre). A la suite de Trombetti, il faut voquer le travail colossal de Joseph Greenberg, le plus grand classificateur de langues du XXe sicle. Greenberg (1915-2001) est dabord important pour la typologie des langues (regrouper les langues par types) dont il a permis le renouveau (tomb un peu dans loubli avec le dveloppement des courants de linguistique structurale en occident). Dans son ouvrage Universals of Language (1963) il tablit une srie de 45 lois permettant de prdire, daprs lexistence de certains phnomnes, limplication (quasi) obligatoire dautres traits. Par exemple : Loi 36 : si une langue a la catgorie du genre, elle a toujours la catgorie du nombre. Ex. langue dEurope : latin, allemand, russe, grec : 3 genres + 2 nombres, en revanche, chinois, japonais pas de genre pas de nombre, mais le turc a le nombre (ev vs evler ; kutu vs kutular) sans le genre Loi 34 : aucune langue na de triel si elle na pas de duel. Aucune langue na de duel si elle na pas de pluriel : Par exemple le mwotlap, langue austronsienne parle en Mlansie ou dans la langue de lle de Manam, nord-est de la Nouvelle-Guine : kaiko, kai toi ; kamru vous 2 ; kamto vous 3 ; kam, kakaming vous ) Dans le domaine de la linguistique gntique, Greenberg se rvle dabord un taxinomiste, au sens hrit de la biologie (regroupement des espces partir de lexamen de lapparence extrieure : a des cailles, pond des ufs, a des ailes, x pattes, etc.). Il change ainsi les rgles en redfinissant le pilier de la grammaire compare des langues indo-europennes : la mthode comparative qui aboutit la reconstruction. Pour lui, la reconstruction nest possible que par rapport des langues dont la parent est dj tablie. On ne peut procder aux reconstructions sur de vastes ensemble de langues, voire toutes les langues, sans savoir pralablement quelles langues comparer. On ne peut pas appliquer les rgles de rapprochements des indo-europanistes pour voir par exemple si a marche entre le

Au del de lindo-europen
ALLHiS Sources perdues 20 janvier 2014 p. 5

chinois et le franais. Il faut dabord tablir le lien de parent entre deux langues ou, plus frquemment, entre deux familles de langues, et envisager les oprations dans un autre ordre : 1) procder la comparaison multilatrale (= mass comparison) qui permet la classification, cest--dire fournit des listes de langues apparentes 2) reconstruire les formes ou structures des langues dans le cadre des relations gntiques tablies en 1) 3) tablir les correspondances rgulires pertinentes pour un niveau de parent Dans louvrage de Ruhlen, le traducteur emploie constamment le terme de classification, plutt que classement. Greenberg se fait dabord connatre pour sa classification des langues africaines, annes 1950, qui rencontre des rsistances, avant de simposer, avec 4 familles seulement de langues (Afroasiatique, Nilo-Saharien, NigerCongo, et Khosan). Il sattaque ensuite aux autres aires golinguistiques, chaque fois en proposant une nouvelle rpartition et/ou des regroupements en superfamilles : Pacifique et ocan indien (1970s), langues amrindiennes qui regroupent en une seule superfamille les 180 familles prcdemment isoles par les collgues. Enfin, avant de mourir, 1990s., Greenberg lance le chantier du groupe eurasiatique, qui concurrence la thorie nostratique encore en dveloppement (regroupements diffrents, par exemple par rapport la place des langues smitiques). Les nostraticistes ayant contre proposer dinclure un eurasiatique dans le nostratique Cette vocation rapide du travail de Greenberg est une nouvelle occasion de constater les dsaccords et surtout les rsistances, souvent violentes, qui agitent la communaut des linguistes. Greenberg ne rencontre pas pour toutes ses classifications le mme succs que pour son travail sur les langues africaines, loin de l. On lui adresse des reproches tous les niveaux, de la mthodologie (mthode personnelle, mess comparison) aux conclusions auxquelles il tait invit. Ce travail de description aveugle (on ne tient pas compte da priori culturels ou linguistiques en procdant par comparaison de formes anonymes) tend en effet vers la vieille ide dune langue universelle, lpoque o le structuralisme amricain, la grammaire gnrative en loccurrence, pousse laudace jusqu poser, de manire totalement a-historique, que toutes les langues ont fondamentalement la mme grammaire. Mais avant de gnraliser le dbat, il convient dvoquer, pour terminer, le reprsentant le plus connu (y compris en dehors des spcialistes de linguistique) de la thorie monogntique, et qui se trouve tre un tudiant, ancien collaborateur de Greenberg luimme. 2.3. Merritt Ruhlen et Lorigine des langues Merritt Ruhlen (n 1944) uvre dans le sillage de la classification de Greenberg, tous les sens du terme, puisque lhritage scientifique inclut aussi la difficile position marginale quil doit assumer au niveau mondial. Je mappuie pour cette prsentation essentiellement sur la traduction franaise (1996) de louvrage le plus connu de Merritt Ruhlen (sorte de best-seller) Lorigine des langues (On the Origin of Languages: Studies in Linguistic Taxonomy 1994). Cela ne signifie nullement que Ruhlen soit ni le premier (nous lavons aperu prcdemment) ni mme le seul envisager une origine unique pour toutes les langues du monde. Il faut en outre tenir compte du fait que cet ouvrage est une manire pour Ruhlen de sadresser directement aux noms spcialistes, dans une sorte de plaidoyer ou documentpreuve qui laisserait lhonnte homme la possibilit de se faire une ide par lui-mme, partir du matriau prsent dans le livre, mais aussi des synthses portant sur les controverses et diverses attaques dont sont lobjet les partisans de Greenberg et Ruhlen depuis plus de 40 ans. Cela rend louvrage trs accessible, souvent drle ou ironique, et trs (trop) dmonstratif ou pdagogique. Lauteur fait ainsi frquemment rfrence au tabou, voire linterdit qui touche toute entreprise visant rattacher lindo-europen un groupe plus vaste, attaquer le

Au del de lindo-europen
ALLHiS Sources perdues 20 janvier 2014 p. 6

monopole danciennet ou le statut de prototype de langue originelle qui se serait construit autour de la thorie depuis le XIXe sicle. Ruhlen fait donc de la classification massive de langues du monde entier, en sappuya nt sur un grand nombre de donnes descriptives, soit pour une famille, soit, par dfaut, pour une langue. On imagine donc que le travail est colossal, comme celui de Greenberg, do aussi la critique de survol, de simplification qui lui est adresse. Ruhlen est dabord linguiste gnrativiste (thse sur le roumain), mais aussi indo-europaniste, comme tout typologueclassificateur (collaboration avec Greenberg). Il travaille Standford. Ajoutons quil travaille aussi en anthropologie, gntique et archologie, dans le cadre de collaboration, avec le gnticien Luigi Luca Cavalli-Sforza et larchologue Colin Renfrew. Son travail de classification repose sur la synthse des donnes disponibles, ce qui loblige associer des informations de niveaux diffrents. Par exemple pour lindo-europen, videmment le meilleur exemple de reconstruction, et le plus ancien, les donnes sont facilement disponibles, depuis plus de 150 ans. On parle de protolangue ou de protoforme, qui vite de se rfrer chaque fois aux formes de langues attestes (par exemple moi Nom = *H1egm, qui, quoi = *kwi-/kwo- ; ciel diurne = *dei-, cf. Pokorny, etc.). De mme pour dautres familles (proto-smitique, protomongol, protoouralien) = Les outils disponibles pour chaque familles sont ingaux. Reconstruction aboutit des proto-formes en indo-europen, mais pas en dravidien. Mais on ne dispose pas de protoforme pour toutes les langues (on en est loin). Il faut donc complter par des formes de langues particulires. La mthode est clairement celle de la classification de Greenberg : reprer, en aveugle, les similitudes de forme (sons) et de sens entre des units de diffrentes langues, units slectionnes de la mme manire que dans la thorie indo-europen (distinction entre lexique de base et emprunt ou forme convergente, cest--dire motive comme imitative par exemple). Le contresens que lon peut faire, en tant quindo-europaniste, est justement de chercher dans cette dmarche la rigueur de la mthode comparative. Il sagit de dgager des ressemblances qui sappuient presque exclusivement sur le lexique et la phontique, pour tablir des familles. Ces familles doivent tre non pas prouves , mais simposer comme la seule explication ces similitudes. Une fois la famille tablie, la deuxime tape consiste en la reconstruction, niveau de famille par niveau de famille, comme en IE (tche qui est voque seulement dans louvrage) et ltablissement des rgles de correspondances rgulires ( lois ). (Pour Ruhlen la mthode de Greenberg ne s'oppose pas la "mthode comparative standard" type IE. Les deux se compltent.) Cela explique pourquoi dans tous les exemples donns, le matriau trait relve presque exclusivement du lexique et de la phontique (forme et sens). Trs peu de traits morphosyntaxiques sont invoqus, pour des raisons de mthodes, de mise en uvre, mais du coup cela a des consquences thoriques : si les similitudes morpholexicales sont troublantes au niveau mondial, on a limpression quil nen est rien dans le domaine syntaxico-smantique, qui est prcisment l o la grammaire de Chomsky pose luniversalit. Voyons un peu plus en dtail : les milliers de comparaisons effectues aboutissent une rduction de toutes les langues en trente-deux familles (dont lindo-europen : Ruhlen ne garde ni le nostratique, ni leurasiatique). La parent de ces 32 familles est son tour propose de manire synthtique en sappuyant sur 27 racines mondiales , cest--dire 27 notions (auxquelles sont apparies des protoformes) reprsentes dans au moins six des 32 familles (en moyenne elles sont attestes dans 12 familles). La racine la plus rpandue est linterrogatif qui ? (ku(n)-) dans 23-24 familles.

Au del de lindo-europen
ALLHiS Sources perdues 20 janvier 2014 p. 7

(118) parent certaine, mais degr de parent exact (ordre de dtachement les unes de autres) pas encore clair. En outre, si parent seule explication plausible, la linguistique ne peut expliquer / justifier la monogense arguments extralinguistiques. 162 Aujourd'hui manque un arbre phylogntique complet de l'humanit fond sur les langues: dans quel ordre les branche de l'arbre unique se sparent-elles? 163 comment expliquer que toutes les langues origine commune? 164 pas de langues primitives, plus,complexes ou plus perfectionnes. Mme aptitude au langage, une seule espce humaine. 165 Corrlation entre groupes linguistiques et biologique (groupes sanguins, protines, enzymes, frquences de gnes) concident avec groupes linguistiques "de haut niveau" (= eurasiatique, etc.) Rpartition gntique afrique = familles linguistiques de Greenberg! 169 Explication de cette corrlation = rsultat des mmes vnements (pr)historiques. Ex. Australie peuple il y a 40000 ans par pop. qui apporte patrimoine humain et langue. 170 les infos gntiques permettraient alors d'esquisser une diffrenciation pour passer d'une langue unique aux grandes familles. 178 linguistique, archologie et gntique longtemps dveloppes sparment, alors qu'ont mme but: meilleure comprhension prhistoire humaine. Depuis fin 1980, nouvelle synthse (Renfrew) opre. 2 modles: - modle africain 100000 dernires annes homo sapiens venu d'afrique remplac autres hominids - modle multirgional: populations evolu sparment partir d'homo erectus. 179 modle africain semble s'imposer. La linguistique n'est pas pertinente sur ses questions, tout au plus peut-elle suggrer origine rcente, qui expliquerait convergences constates dans les familles de langues. La thse (et louvrage) de Ruhlen a t lobjet de nombreuses critiques qui sont prsentes comme sans objet par lauteur, car elles formulent des reprochent qui ne sont pas pertinents pour la dmarche (elles fonctionnent pour la reconstruction de type IE). Exemple (p. 88) arguments contre apparentement de l'IE: au del de 6000 ans, perte de toute trace de relations antrieures (or tout ne change pas forcment, ex. nepot en roumain) les pron. m- et t- sont une preuve d'affinit avec dautres familles (finnoougrienne). Argument des IEistes: cest un emprunt ou une concidence, or probabilit infime enfin Meillet "partout pareil" (or justement non, argument fumeux sur la motivation des formes pronominales) (146) les IEistes ont des exigences difficiles satisfaire (500 mots, 100 points de grammaire), alors que ne sont pas toujours respectes pour certaines langues IE. (151) reproche adress aux IEistes qui ont besoin d'etablir des preuves, ce qui n'est pertinent qu'en mathmatique, et non dans des sciences empiriques comme la linguistique, la biologie, la physique, o on prouve moins que l'on fournit l'explication la plus vraisemblable une srie non alatoire de donnes.