de lui viennent les langues romanes modernes (français, italien, espagnol, portugais, roumain) lui-même vient d’une langue ancienne hypothétique, l’indo-européen, qui l’apparente au grec ancien, mais aussi aux langues germaniques (anglais, allemand, néerlandais, danois, norvégien, suédois, islandais), aux langues celtique (gaëlique, breton), aux langues slaves (russe, polonais, serbe, croate, bulgare), aux langues baltes (lituanien, letton), aux langues indiennes (sanscrit, hindi) et iranienne (persan), ainsi qu’au tokharien (frontière de la Chine) et au Hittite (Turquie) enfin l’étude du latin permet, par l’analyse grammaticale qu’elle nécessite, de mettre en lumière des catégories et des mécanismes linguistiques qui se retrouvent dans d’autres langues. Étudier une langue supplémentaire, c’est mieux connaître le langage (langage = faculté universelle ; langue = système de communication propre à une communauté ; parole = utilisation individuelle de ce système) Ex : japonais : Wa/Ga : nominatif Wo : accusatif Ni : datif De : ablatif instrumental, lieu de l’action Ni : locatif E : directif Kara : ablatif d’origine Verbe en finale ; beaucoup de sous-entendu ; ko-so-a-do = hic/iste/ille/qu-
2. linguistique historique : du latin au français
des règles phonétiques d’évolution propre à chaque langue : à telle époque, tous les sons dans un même environnement phonétique subissent la même évolution, sauf si d’autres phénomènes entre en jeu : analogie (ressemblance entre mots, entre paradigme, proximité sémantique), dissimilation (différencier), assimilation (simplifier la prononciation)… français : lingua/langue, aqua/eau italien : lingua, acqua espagnol : lengua, agua portugais : língua (lingwe), agua roumain : lingua / limbă ; aqua / apă
3. linguistique historique en amont : de l’indo-européen
Old Javanese+ tunggul rwa telu pat lima nem pitu uwalu
Akkadian+ ishte:n shena shalash erbe h.amish shishshu sebe sama:ne
C’est également ainsi que travaille le linguiste en linguistique historique et comparative : il va reconstruire des formes invisibles, c’est-à-dire non attestées, car purement orales et très anciennes, parfois antérieures à l’invention de l’écriture, des formes dont l’existence expliquera les similarités entre des langues aussi distantes que le bengali et l’islandais. Pour ce faire, le linguiste s’appuiera sur deux principes de base. Le premier est la régularité des changements phonétiques. Car contrairement à l’évolution du sens ou de la grammaire, l’évolution des sons obéit à une certaine régularité qui permet d’établir des correspondances fixes, des lois phonétiques. Par exemple, prenons le son [k] en indo-européen (l’astérisque devant le k signifie que c’est une forme reconstruite, hypothétique), ce k hérité deviendra très régulièrement un k en latin, noté par la lettre c, et deviendra tout aussi régulièrement un h aspiré dans les langues germaniques. C’est pourquoi on fait remonté à une racine *kerd- les mots cord-is en latin et heart en anglais (du germanique herton), qui signifient tous « cœur ». Par de multiples comparaisons de ce type, on a établi des tables de correspondances phonétiques et des lois d’évolution expliquant ces correspondances. L’autre principe de base est l’arbitraire du signe, c’est-à-dire qu’il n’y a pas de relation nécessaire entre une chose et le mot qui la désigne. Ce qui explique que le concept de cheval soit dénoté par des mots aussi différents que uma en japonais, Pferd en allemand, ou encore zaldi (saldi) en basque. Donc si un mot similaire est employé dans deux ou plusieurs langues avec approximativement le même sens, il n’y a que trois explications possibles, hormis quelques cas où l’onomatopée entre en jeu : ou bien c’est une pure coïncidence (comme l’anglais bad et le turc bad qui signifient tous les deux « mauvais ») ; ou bien il peut y avoir eu un emprunt entre langues (comme le mot football emprunté à l’anglais par la plupart des langues), ou bien, c’est le cas qui nous intéresse, on peut envisager que cette similitude est le fruit d’une origine commune, d’un ancêtre commun à ces langues.
2. La naissance d’une science du langage
Maintenant, quand s’est-on dit qu’il y avait peut-être un ancêtre commun, c’est-à-dire un ballon invisible, sur notre terrain linguistique ? Les Grecs et les Romains avaient déjà aperçu les similitudes entre leurs langues, mais ils les expliquaient par des emprunts ou par une origine grecque du latin. Au Moyen Âge, Dante avait vu la filiation latine des langues romanes. Mais les choses se précisent avec la Renaissance et le développement de l’humanisme, car les érudits manient alors plusieurs langues anciennes et modernes. La référence d’alors étant la Bible, c’est par la descendance du fils de Noé Japhet que l’on explique la parenté entre ces langues (comme on le voit sur cette petite carte qui répartit les populations en trois groupes, descendant de Sem, Cham et Japhet, les trois fils de Noé). C’est la raison pour laquelle on appelle l’arabe et l’hébreu des langues sémitiques, du nom de Sem, autre fils de Noé. C’était pratique, mais le terrain de jeu a pris de l’ampleur avec les Grandes Explorations, et dès 1583, un jésuite anglais parti aux Indes note aussi des similitudes entre des langues indiennes et le latin et le grec. Il faudra toutefois attendre le XVIIe siècle pour qu’apparaissent les premières vraies comparaisons entre langues. En 1640, le hollandais Marcus Boxhorn évoque une langue ancienne comme ancêtre commun du latin, du grec, du persan et des langues germaniques. Il considère que c’est le scythique, langue d’un peuple contemporain des Grecs anciens et qui habitait près de la mer Noire. L’hypothèse scythique sera reprise par d’autres érudits de l’époque, comme le Français Claude Saumaise qui tentera les premières reconstructions d’étymons communs. Mais cette théorie avait toutefois pour défaut de poser un ancêtre à la fois identifié a priori et surtout trop peu ancien, puisque contemporain des grecs. C’est à la fin du XVIII e siècle qu’on sortira de l’impasse. Tout commence à Calcutta. Un certain William Jones, juge anglais nommé à la cour suprême de cette ville, était convaincu qu’il fallait consulter de temps en temps les autorités juridiques hindoues. Il a donc entrepris d’apprendre le sanscrit, la langue sacrée indienne. Cette langue est un peu à l’hindouisme ce que le latin était à l’Église catholique, mais sa conservation remontait à une époque bien plus ancienne. Un grammairien nommé Panini, comme le sandwich italien, avait déjà établi une grammaire précise du sanscrit vers le IVe siècle avant notre ère. Sa description rigoureuse et systématique ne sera pas sans influencer la manière dont les linguistes vont envisager les langues indo-européennes. Dans un discours prononcé devant la Société savante de Calcutta en 1786, William Jones pose les bases de la recherche comparatiste en insistant sur les similitudes qui existent entre les racines des mots sanscrits, latins et grecs, mais aussi entre les formes grammaticales (moins sensibles à l’emprunt). Et s’il pose un ancêtre commun, il ne désigne aucune langue ancienne spécifique. Il a mis le doigt sur l’invisibilité de notre ballon de foot. Son hypothèse audacieuse a rencontré un vif intérêt en Angleterre et surtout en Allemagne. En quelques années, une nouvelle science a pris son essor. Pourquoi tant de rapidité ? Trois facteurs : d’abord la disponibilité des sources anciennes, notamment des manuscrits sanscrits qui permettait d’avoir beaucoup d’éléments de comparaison avec le grec et le latin, déjà bien connus. Pour le gotique (langue germanique), on se servait d’une traduction de la Bible datée du IVe siècle apr. J.-C.. Deuxième facteur : l’attrait pour toutes les sciences et spécialement la biologie, avec les hypothèses de Darwin qui dessinent des arbres généalogiques des espèces. Enfin, dernier facteur déterminant, le romantisme allemand. À cette époque, on se tourne vers le passé pour construire l’unité de la nation. Ce qui explique que la linguistique indo-européenne ait connu quelques récupérations nationalistes et racistes. Et on le voit dès le début, puisque l’indo-européen avait d’abord été baptisé indo- germanique en 1810, terme qui est d’ailleurs toujours utilisé en Allemagne. Les thèses racistes du XXe siècle ont cherché leur justification dans les hypothèses des linguistes, ce qui est aberrant, car une langue n’est pas liée à une population biologique unique. Hormis ces dérives qui délaissaient les faits au profit du fantasme, la linguistique historique a connu de vrais succès. Au début du XXe siècle, la famille indo-européenne s’étoffe avec la découverte et le déchiffrement du hittite en Anatolie (Turquie actuelle) et du tokharien, ou agni-kutchi, à l’extrême ouest de la Chine. Les spécificités de ces langues vont révolutionner les études indo-européennes. Le hittite surtout va permettre de confirmer l’existence d’un phonème jusqu’alors hypothétique. En se basant sur des comparaisons et des déductions, Ferdinand de Saussure avait en quelque sorte prédit l’existence et la position de ce phonème absent des langues jusqu’alors connues, mais visible en hittite. Ici, la linguistique se montrait vraiment scientifique. Cette vision plus précise du système des sons indo-européens, qui connaîtra d’autres affinements par la suite, a permis aux chercheurs des générations suivantes d’aboutir à une véritable arithmétique de la langue. On peut ainsi décrire comment une racine porteuse de sens (dans l’exemple affiché *leuk) se voit pourvue d’un ou plusieurs suffixes et, le cas échéant, de désinences pour former des noms, des verbes, des adjectifs, etc., et comment ces formes évoluent phonétiquement selon des règles strictes pour aboutir aux termes que l’on rencontre dans les langues actuelles. En résumé, les tâches que se donne la linguistique historique et comparative sont l’élaboration d’un système de correspondances phonétiques, lexicales et grammaticales à partir de formes attestées (phase inductive) ; la reconstruction des étymons expliquant et reliant ces formes attestées (phase déductive). Et le repérage d’éléments culturels communs qui peuvent servir d’indices pour identifier d’hypothétiques propagateurs de la langue mère, langue dont les formes reconstruites ne sont qu’un reflet théorique et abstrait. Cette question de l’identification reste encore très débattue.
3. Une photo de famille un peu floue
Mais on s’accorde au moins à peu près sur la répartition géographique des langues indo-européennes, qui vont constituer notre terrain de jeu. On divise ces langues en douze groupes, en fonction de leur zone d’implantation, comme l’Italie pour les langues italiques, qui sont essentiellement les langues latines. On peut aussi les présenter sous forme d’arbre généalogique si l’on considère une évolution par divergences et engendrements successifs, ce qu’on appelle en allemand la Stammbaumtheorie ; ou on peut utiliser une représentation en de zones d’influences, si l’on considère l’évolution par expansion d’innovations locales qui se croisent et se recouvrent partiellement, comme des ondes à la surface de l’eau. Ce qui relève de la Wellentheorie. Les deux modèles sont sans doute complémentaires. Sur le fameux foyer d’origine, le lieu où se trouvaient les possibles « indo-européens » avant qu’ils se séparent pour migrer vers l’Europe et l’Asie (donc avant la différenciation en divers dialectes), beaucoup d’hypothèses ont été formulées. On le voit sur cette carte qui indique les diverses zones proposées. Cette question n’a pas échappé au biais raciste qui tenait à placer l’origine des Indo-Européens, identifiés à de blonds Aryens, dans le nord de l’Allemagne. Aujourd’hui, linguistique, archéologie et même génétique coopèrent dans le but d’identifier de manière plus objective un foyer originel des propagateurs des langues indo-européennes. Deux hypothèses sont en faveur. D’une part celle qui propose, sous deux versions différentes, une origine anatolienne des indo-européens, dont les migrations correspondraient à la diffusion des techniques agricoles, à partir de 7000 av. J.-C. D’autre part, l’hypothèse dite « pontique » ou « des kourganes », [développée par l’archéologue américaine d’origine lituanienne, Marija Gimbutas], qui situe les locuteurs de l’indo-européen commun sur les rives de la moyenne Volga et de la mer Noire vers 4500 av. J.-C., là où se trouvait une population qui a laissé parmi nombre de traces archéologiques des sépultures constituées de fosses surmontées d’un petit tumulus (kourgane vient d’un mot turc signifiant tumulus). On en revient ici à la mer Noire, comme pour les Scythes de Boxhorn au xviie siècle – mais cette fois, il s’agit d’un peuple beaucoup plus ancien.