Vous êtes sur la page 1sur 12

INDO-EUROPÉEN - Encyclopédie Universalis http://www.universalis.fr/encyclopedie/C010111/INDO_EU...

langue indo européenne Rechercher

Cet article est écrit par :

Guy JUCQUOIS

Documents liés

AMUÏSSEMENT
ANATOLIENNE (PRÉHISTOIRE)
ASPECT (grammaire)
BENVENISTE (É.)
BOPP (F.)
CASTES
CHAMITO-SÉMITIQUES (LANGUES)
COURS DE LINGUISTIQUE GÉNÉRALE (F. de Saussure)
DIACHRONIE ET SYNCHRONIE
DUMÉZIL (G.)
DÉSINENCE
FAMILLE
FLEXION (grammaire)
GRAMMAIRE COMPARÉE DES LANGUES INDO-EUROPÉENNES (F. Bopp)
GRÈCE ANTIQUE - Langue et littérature
HITTITES
INDO-EUROPÉENS (archéologie)
LATINE (LANGUE)
LINGUISTIQUE
LINGUISTIQUE (notions de base)
MARATHE (LITTÉRATURE)
OCCLUSIVE (CONSONNE)
OSSÈTES (LANGUE ET LITTÉRATURE)
PALI (LANGUE ET LITTÉRATURE)
PERSE - Langues et littératures
PHILOLOGIE
PHONOLOGIE
PHONÉTIQUE
POLYTHÉISME
PROBLÈMES DE LINGUISTIQUE GÉNÉRALE II (É. Benveniste)
PRÉHISTOIRE - Alimentation
PRÉHISTOIRE - Industrie de l'os
PRÉHISTOIRE - L'homme et le feu
PRÉHISTOIRE - La taille expérimentale des roches dures
PRÉHISTOIRE - Méthodologie
ROMANES (LANGUES)
SACRÉ

1 sur 12 12/10/09 15:43


INDO-EUROPÉEN - Encyclopédie Universalis http://www.universalis.fr/encyclopedie/C010111/INDO_EU...

SANSKRITES (LANGUE ET LITTÉRATURE)


SAUSSURE (F. de)
SCANDINAVIE
SLAVES
VEDA
XINJIANG

Thèmes

Indo-européen

Bibliographie

INDO-EUROPÉEN

Sommaire
Structure : déplier - plier

Prise de vue

Premiers travaux

Les langues de départ

L e s d i f fi
ficcu l t é s d u e s a u x l a n g u e s c e l t i q u e s

Saussure et la théorie laryngaliste

Le tokharien et le hittite

Phonétique et phonologie

Principaux caractères morphologiques et syntaxiques

Nouveaux procédés d'analyse et de comparaison

Bibliographie

La plupart des langues européennes (à l'exception du basque, du hongrois, du lapon, du finnois, de


l'estonien et de quelques autres parlers locaux de la fédération de Russie), d'une part, et plusieurs langues
de l'Asie, d'autre part, présentent entre elles, tant dans leur grammaire que dans leur vocabulaire, des
correspondances systématiques et si nombreuses qu'il n'est possible de les expliquer que par une origine
commune. En d'autres termes, toutes les langues en question résultent, sans nul doute, d'évolutions,
différentes selon les lieux et les temps, d'une même langue parlée antérieurement, à une certaine époque de
la préhistoire, sur un domaine plus ou moins étendu de notre globe. Cet idiome préhistorique, qui a disparu à

2 sur 12 12/10/09 15:43


INDO-EUROPÉEN - Encyclopédie Universalis http://www.universalis.fr/encyclopedie/C010111/INDO_EU...

jamais faute d'avoir laissé des documents écrits avant de perdre son unité et son identité, mais dont on a pu
reconstituer avec assez de certitudes les principaux traits de la grammaire ainsi qu'une partie du vocabulaire,
est appelé en France habituellement l'indo-européen ou la langue indo-européenne commune, et le peuple
qui en était le porteur, les Indo-Européens. Le terme « indo-européen » est aussi utilisé pour qualifier les
langues historiques issues de cette « protolangue » (P.I.E. en anglais, c'est-à-dire Proto-Indo-European), ainsi
que, parfois, les peuples qui font usage de celles-ci, du moins aux époques anciennes. On notera que les
auteurs germanophones persistent à employer le terme indo-germanisch plutôt qu'« indo-européen ».

On peut distinguer, au sein de la « famille » linguistique indo-européenne, les groupes dialectaux suivants :
le groupe indo-iranien, ou aryen au sens propre, comprenant les diverses formes prises par la langue
indo-aryenne au cours de son évolution (védique, sanskrit classique, prakrits, pali, hindi, hindoustani, bengali,
gujarati, marathi, cinghalais, etc.), les parlers iraniens (vieux perse, avestique, mède scythique, sogdien,
pehlevi, parthe, persan, kurde, pachto, ossète, etc.), et les parlers intermédiaires des Dardes et des Kafirs de
l'Hindu Kuch ; le groupe baltique (lituanien, lette, vieux prussien) ; le groupe slave (vieux slave, russe,
polonais, tchèque, serbo-croate, bulgare, etc.) ; l'arménien ; l'albanais ; le grec ; le groupe italique,
représenté, dans l'Antiquité, par le latin, l'osque, l'ombrien et le vénète, et aujourd'hui par les langues
romanes (italien, espagnol, portugais, français, roumain) dérivées du latin ; le groupe celtique, composé du
lépontique, du celtibère et du gaulois, d'une part, et des parlers brittoniques (gallois, cornique, breton) et
gaéliques (irlandais, gaélique d'Écosse), d'autre part ; le groupe germanique, comportant les trois
subdivisions : orientale (gotique), septentrionale (islandais, norvégien, suédois, danois) et occidentale (haut-
e
allemand, bas-allemand, frison, anglais) ; le tokharien (attesté dans le Turkestan chinois entre le V et le
e
X siècle de notre ère, sous deux formes dialectales communément appelées le tokharien A et le tokharien B,
ou koutchéen) ; le groupe anatolien, comprenant outre le hittite proprement dit, ou nésite, deux autres
dialectes, le palaïte et le louvite (et sa variante le « hittite hiéroglyphique »), dont semble avoir dérivé le
lycien.

Il existait encore dans l'Antiquité plusieurs autres langues indo-européennes, éteintes depuis lors, et ne
laissant que des résidus sous forme d'un nombre restreint d'inscriptions ou de gloses d'interprétation
malaisée, de noms propres, de quelques mots isolés, etc. Ce sont : le thrace et le phrygien (que l'on
rapproche de l'arménien), le messapien (désormais mieux connu) et l'illyrien (dont les liens avec l'albanais ne
sont pas clairs), le lydien, le ligure, le sicule et quelques autres encore.

Premiers travaux
La découverte de la parenté de ces langues a été en quelque sorte une conséquence directe de la
e
rencontre, au XVI siècle, entre l'Occident et les langues de la Perse et de l'Inde. En effet, aussitôt que les
relations régulières établies entre l'Orient et l'Europe ont donné à quelques Européens l'occasion de
connaître le persan et le sanskrit, ils ont été frappés par les ressemblances que montraient celles-ci avec des
langues européennes, en particulier avec le grec, le latin et les langues germaniques. Cependant, comme on
n'avait alors encore aucune notion précise sur l'évolution des langues, il fallait en fait inventer une approche
scientifique complètement nouvelle pour expliquer ces similitudes surprenantes entre des langues, très
e
éloignées dans l'espace et dans le temps, que l'on classa dès le XVII siècle en une famille « scythique » ou
« japhétique » (en référence à la Genèse biblique).

Le mérite d'avoir synthétisé ces premières recherches et indiqué le chemin qui devait conduire à la
naissance d'une nouvelle discipline fondée sur la comparaison génétique est attribué à l'orientaliste anglais
sir William Jones (1746-1794) ; dans un discours prononcé en 1786 devant la Royal Asiatic Society de
Calcutta, il déclarait en effet : « La langue sanskrite, quelque ancienne qu'elle puisse être, est d'une
étonnante structure ; plus complète que le grec, plus riche que le latin, elle l'emporte, par son raffinement
exquis, sur l'une et l'autre de ces langues, tout en ayant avec elles, tant dans les racines des mots que dans
les formes grammaticales, une affinité trop forte pour qu'elle puisse être le produit d'un hasard ; si forte
même, en effet, qu'aucun philologue ne pourrait examiner ces langues sans acquérir la conviction qu'elles
sont en fait issues d'une source commune, laquelle, peut-être, n'existe plus. Il y a du reste une raison
similaire, quoique pas tout à fait aussi contraignante, pour supposer que le gotique et le celtique, s'ils ont
été mêlés par la suite avec un parler différent, n'en descendent pas moins en définitive de la même origine

3 sur 12 12/10/09 15:43


INDO-EUROPÉEN - Encyclopédie Universalis http://www.universalis.fr/encyclopedie/C010111/INDO_EU...

que le sanskrit ; on pourrait ajouter en outre à cette famille le vieux perse. » Deux ans auparavant, dans son
Essai sur les dieux de la Grèce, de l'Italie et de l'Inde, Jones avait déjà aussi remarqué que « lorsque des
traits de ressemblance, trop forts pour être accidentels, sont observables dans différents systèmes
polythéistes, on ne peut guère s'empêcher de penser que quelque relation ait subsisté à une époque
immémoriale entre les nations respectives qui les ont adoptés », et de conclure que « nous serons peut-être
d'accord que les Indiens, Grecs et Italiens procédèrent originellement d'un même lieu central, et que le même
peuple emporta sa religion et ses savoirs ». Mais si, dans le domaine linguistique, le bien-fondé des
remarques de Jones fut amplement et scientifiquement démontré par la « grammaire comparée »
développée par l'Allemand Franz Bopp (1791-1867) et ses successeurs (dont le Français Antoine Meillet), la
« mythologie comparée » indo-européenne fut, elle, entachée pour longtemps du discrédit que lui
apportèrent les exégèses scolaires de l'école de Friedrich Max Müller (1823-1900).

Les langues de départ


Pour l'essentiel la méthode comparative se propose de mettre en lumière les traits communs à deux ou
plusieurs langues. Lorsqu'il s'agit de caractères attribuables à une origine commune, on donne à ce genre
d'études le nom de grammaire comparée et aux langues étudiées celui de famille. C'est ainsi qu'on distingue
une famille indo-européenne, une famille sémitique, une famille finno-ougrienne, etc. On peut également par
une sorte de projection dans le passé reconstruire la protolangue, c'est-à-dire la langue, non attestée
directement par des témoignages écrits, mais dont l'existence est postulée par un ensemble de
concordances de structure dont l'importance et la précision excluent le hasard comme principe d'explication.
Dans ce cas, on parlera respectivement de proto-indo-européen, de proto-sémitique, etc., pour désigner
cette protolangue. La méthode est donc fondée sur l'existence simultanée de traits identiques ou parallèles
dans plusieurs langues ; c'est ce qu'on appelle la reconstruction externe. À l'inverse, la reconstruction
interne permet, dans une mesure limitée, de remonter d'une structure linguistique donnée à une structure
plus ancienne, par le simple examen du système d'une langue et sans recourir ni à des sources littéraires,
épigraphiques ou autres, ni à d'autres langues apparentées ou non.

La valeur probante d'une concordance dépend de la probabilité d'une explication par le hasard. Le calcul
précis de l'incidence de ce dernier facteur supposerait un long développement. En bref, il apparaît que le rôle
du hasard s'amenuise très rapidement lorsque croît le nombre de concordances. De même, lorsque ces
concordances se retrouvent dans trois langues d'une même famille linguistique, elles acquièrent beaucoup
plus de poids que si elles n'apparaissent que dans deux langues seulement. Si ces trois langues sont, de
surcroît, éloignées géographiquement, on obtient une quasi-certitude que les concordances envisagées sont
anciennes et, s'il s'agit de langues apparentées génétiquement, qu'elles peuvent être attribuées à la
protolangue.

La reconstruction de la langue-mère dépend donc exclusivement des caractères anciens conservés en


commun par deux ou plusieurs des langues-filles envisagées par la comparaison. Ce point est d'importance
dans le cas des langues indo-européennes et cela pour deux motifs : la reconstruction est liée directement
aux caractères des langues englobées au départ dans la comparaison ; les découvertes ultérieures de
langues indo-européennes inconnues jusqu'alors provoquent une remise en question de certains résultats.

Lorsque le fondateur de la grammaire comparée des langues indo-européennes, Franz Bopp, publia en
1816 son premier ouvrage de linguistique, livre qui peut être considéré comme l'acte de fondation de cette
nouvelle discipline, il fondait ses comparaisons du système de conjugaison sur cinq langues indo-européennes
appartenant à des groupes différents : le sanskrit, le grec, le latin, le persan et le gotique. Dix-sept ans plus
tard, le même auteur entreprend la publication d'une volumineuse grammaire comparée dans laquelle il utilise
en outre le lituanien, l'avestique et l'allemand. Dans la seconde édition de cet ouvrage, vers le milieu du
e
XIX siècle, la comparaison porte en plus sur le vieux slave et l'arménien, langue considérée comme une
langue iranienne par suite d'une erreur de perspective que Heinrich Hübschmann corrigea seulement en
1897. À la suite de R. Prichard et de A. Pictet, Bopp avait, dès 1838, rattaché également les langues
celtiques à la famille indo-européenne, mais les rapprochements tentés restent timides ou incertains. Les
langues celtiques, de même d'ailleurs que l'albanais, n'apparaissent que très sporadiquement dans la seconde
édition de la Grammaire comparée.

4 sur 12 12/10/09 15:43


INDO-EUROPÉEN - Encyclopédie Universalis http://www.universalis.fr/encyclopedie/C010111/INDO_EU...

En 1861, August Schleicher publia son Compendium qui comparait le sanskrit, l'avestique, le grec ancien,
l'italique (latin, osque et ombrien), le vieil irlandais, le vieux slave, le lituanien et le gotique. La mention du
celtique dans le titre de cet ouvrage correspond à une réalité : des paragraphes entiers sont consacrés au
vieil irlandais qui est traité sur le même pied que les autres langues-filles. Il en est de même dans le
e
monumental ouvrage de Karl Brugmann publié à la fin du XIX siècle et dans lequel sont incluses en outre les
données fournies par le vieux perse des inscriptions achéménides et l'albanais qui intervient pour la première
fois de façon systématique dans la comparaison.

L e s d i f fi
ficcu l t é s d u e s a u x l a n g u e s c e l t i q u e s
Le sort des langues celtiques dans les reconstructions des indo-européanistes mérite qu'on s'y arrête.
Pour des raisons historiques, les langues celtiques suscitèrent relativement peu d'intérêt au cours du
e
XIX siècle : les chercheurs qui s'y consacrèrent n'étaient guère nombreux et leur dispersion dans plusieurs
pays n'était pas faite pour favoriser les contacts. Il faut attendre 1870 pour que soit fondée à Paris par
H. Gaidoz la Revue celtique continuée aujourd'hui par les Études celtiques. Cette revue permet enfin aux
savants de rassembler en un recueil l'essentiel de leur documentation. Comparées à d'autres langues
indo-européennes attestées depuis une époque très ancienne, telles que le sanskrit védique, le latin, le grec
ancien, les langues celtiques, exception faite du gaulois, du lépontique et du celtibère, mal connus d'ailleurs,
ne sont accessibles qu'assez tardivement et manifestent une forte influence latine qui apparaît clairement
dans le lexique des langues brittoniques. Enfin, les langues celtiques montrent plusieurs particularités
linguistiques déroutantes pour le comparatiste bien que chacune d'entre elles se retrouve dans au moins une
autre langue indo-européenne.

Le celtique présente, avec les langues italiques et les langues germaniques, plusieurs éléments lexicaux et
quelques traits morphologiques en commun. On peut mentionner l'existence dans ces trois groupes de
langues d'un suffixe abstrait *-tut (i)- (par exemple dans latin iuuentus, vieil irlandais óetiu), ou la présence
en italique et en celtique du même suffixe du superlatif (latin -(i)sumus, celtique *-(i) samos), mais surtout la
même caractéristique *-i(l'astérisque indique qu'il s'agit d'une forme reconstruite non attestée
historiquement) du génitif singulier des thèmes en *-o-. Ce même élément morphologique se retrouve aussi
en messapien, avec la même fonction. Bien que son origine puisse être découverte dans la protolangue, ce
caractère constitue une originalité de ces langues indo-européennes occidentales. Dans les correspondances
lexicales, on retiendra des formes telles que latin caecus, vieil irlandais cáech, gotique haihs, « aveugle », et
latin uerus, vieil irlandais fír, vieux haut allemand war, « vrai ». Ces rapprochements, que l'on pourrait
aisément multiplier, s'expliquent par une longue période de vie côte à côte des peuples parlant des langues
celtiques, italiques et germaniques.

Les langues celtiques offrent, avec les langues indo-iraniennes, quelques traits morphologiques communs,
tels que l'existence d'un suffixe *-sr- utilisé dans la formation des formes féminines des noms de nombre
pour « trois » et « quatre » : indo-européen *tisres, *ketesres, en sanskrit tisrás, cátasras, en vieil irlandais
teoir, cetheoir, gallois teir, pedeir, ou la formation du féminin en *-ni, ainsi en sanskrit raj-ñi, vieil irlandais
rigain, « reine ». Ces caractères, et d'autres semblables, appartenant à des langues parlées sur le pourtour
du domaine indo-européen sont interprétés généralement comme étant d'anciennes tournures conservées à
la périphérie et remplacées au centre par de nouvelles expressions.

Enfin, les langues celtiques présentent quelques traits anciens, dont des parallèles se retrouvent dans
diverses autres langues indo-européennes, tels que les noms de parenté vieil irlandais : athir, « père »,
máthir, « mère », bráthir, « frère », siur, « sœur », mais surtout des mots tels que vieil irlandais dú, génitif
don, « pays », en regard du grec ancien hjyn, génitif hjonov, ou l'isoglosse vieil irlandais allas, « sueur », hittite
allaniganzi, « ils transpirent », ou, dans le domaine de la morphologie, les formes verbales en *-r et le
subjonctif en *-a-. On notera en outre la construction, fréquente en celtique et en hittite, du pronom suffixé
au verbe ou infixé entre le préverbe et le verbe, ainsi vieil irlandais n(o)-a mbeir, « il le porte ». Lorsqu'il y a
plusieurs formes atones, on peut aboutir à des chaînes d'enclitiques en tête de proposition. Ce type de
construction, sans être inconnu dans les autres langues de la famille, y est certainement moins fréquent
qu'en celtique et qu'en hittite.

Si l'on ajoute que l'évolution phonétique a souvent obscurci l'aspect extérieur des mots et que des

5 sur 12 12/10/09 15:43


INDO-EUROPÉEN - Encyclopédie Universalis http://www.universalis.fr/encyclopedie/C010111/INDO_EU...

développements morphologiques propres - surtout dans la conjugaison - ont donné au celtique une
physionomie particulière, on comprend aisément les réticences des premiers comparatistes vis-à-vis de ce
groupe de langues.

Saussure et la théorie laryngaliste


Pendant que certains chercheurs travaillaient à élargir la base des comparaisons en incluant d'autres
langues ou groupes de langues dans leurs recherches, quelques savants essayaient de coordonner les
résultats obtenus et de procéder à la reconstruction de l'indo-européen lui-même. Dans ce but, ils
disposaient des deux méthodes mentionnées plus haut : soit la reconstruction interne qui ne repose que sur
les caractères structuraux de l'indo-européen, soit la reconstruction externe qui, à ce niveau, met en cause
d'autres protolangues dont les plus utilisées furent le protosémitique et le protofinno-ougrien.

Le savant suisse Ferdinand de Saussure (1857-1913), formé partiellement en Allemagne chez les maîtres
du comparatisme, longtemps professeur à Paris, devait donner une impulsion très vigoureuse aux procédés
de reconstruction interne tout en donnant au structuralisme un magistral élan. Dans un ouvrage écrit en
1878 et publié l'année suivante sous le titre Mémoire sur le système primitif des voyelles dans les langues
indo-européennes, Saussure démontrait que les voyelles longues qui n'entraient pas dans le jeu normal des
alternances vocaliques tel qu'il sera exposé plus loin provenaient en réalité de la combinaison de la voyelle a
1
(pour nous e) ou de la voyelle a (pour nous o) avec des phonèmes amuïs appelés « coefficients
2
sonantiques ». Ces derniers éléments portaient ce nom parce qu'ils jouaient le même rôle et avaient la même
distribution que les sonantes indo-européennes. En effet, ils pouvaient figurer, comme n'importe quelle
consonne, à l'initiale ou à la finale de syllabe, mais ils étaient aussi, à l'instar des voyelles, susceptibles de
former le centre d'une syllabe. Ainsi, une racine *dhe-, « établir », n'entrant pas dans le jeu normal des
alternances, pouvait par confrontation avec une racine *bher-, « porter », être ramenée à une forme plus
ancienne *dhe + coefficient sonantique. Cette théorie, dont on verra les développements modernes, offrait
au point de vue de la reconstruction de la protolangue plusieurs avantages, dont celui de ramener à un
modèle unique et obéissant aux alternances régulières un certain nombre de racines qui semblaient y
échapper. Les thèses de Saussure permettaient, en outre, de remonter plus haut dans le temps et
d'expliquer d'une manière simple et élégante la diversité des formes reconstruites.

Malgré cela, il fallut le déchiffrement du hittite et les interprétations linguistiques qu'il suscita pour que la
théorie de Saussure soit réellement admise par un grand nombre d'indo-européanistes. Le retard des
hommes de science à accepter ces thèses est aisément compréhensible. En effet, il restait possible
d'expliquer la protolangue sans recourir nécessairement à ces reconstructions structuralistes : la différence
essentielle entre les partisans de ces théories et leurs adversaires était qu'ils se situaient à des périodes
successives de l'indo-européen.

Toutefois, certains auteurs, tels que le Danois Hermann Møller, préoccupés de trouver une origine
commune aux langues indo-européennes et chamito-sémitiques, avaient entrepris d'utiliser les « coefficients
sonantiques » saussuriens. Dans deux dictionnaires comparatifs indo-européens et sémitiques, parus
respectivement en 1909 et en 1911, Møller faisait largement usage des théories de Saussure ; c'est ainsi
que la racine *ag-, « conduire », est reconstruite en un proto-indo-européen-sémitique *H-g-, de même que
*dhe-, « établir », remonterait à *-T-Á-, ces prototypes étant inspirés des formes simples telles que *bher-,
« porter », provenant de *P-r-. L'analogie des langues sémitiques, où certains phonèmes avaient
approximativement les mêmes effets que ceux que postulait Saussure pour les coefficients sonantiques,
influença les rapprochements tentés avec ces langues, en sorte que la terminologie utilisée pour les langues
sémitiques fut transposée dans le secteur des langues indo-européennes et qu'on baptisa les coefficients
sonantiques du nom de laryngales (ou de chewa) et la théorie qui les postulait de théorie laryngaliste.

Le tokharien et le hittite
e
Les grands travaux de base étaient déjà écrits lorsque, coup sur coup, à la fin du XIX siècle et au début
e
du XX , furent découvertes, déchiffrées et interprétées deux nouvelles langues de cette famille linguistique :

6 sur 12 12/10/09 15:43


INDO-EUROPÉEN - Encyclopédie Universalis http://www.universalis.fr/encyclopedie/C010111/INDO_EU...

le tokharien et le hittite. Ces langues allaient renouveler les connaissances de la protolangue et éclairer sur
une foule de détails restés jusqu'alors dans l'ombre.

Le tokharien, la première déchiffrée de ces deux langues, est également la plus récente. Il s'agit d'une
langue indo-européenne parlée jusque dans la seconde moitié du premier millénaire après J.-C. et dont une
mission prussienne et une mission française ont retrouvé, dans le Turkestan chinois, de nombreux
documents écrits en un syllabaire d'origine indienne. Ces textes, dont beaucoup de bilingues tokhariens-
sanskrits facilitèrent le déchiffrement, sont constitués pour une bonne part de traductions de textes
religieux bouddhiques. Cette langue, parlée sous deux variétés, appelées dialecte A et dialecte B, est
aujourd'hui éteinte. Elle fut remplacée à une date inconnue par l'ouïgour, langue qui est utilisée de nos jours
encore dans cette région.

Si le caractère indo-européen du tokharien fut démontré de manière irréfutable dès 1908, il fallut
cependant attendre 1921 pour que E. Sieg et W. Siegling publient, en général sans traduction et sans
lexique, les textes en dialecte A, tandis que ce ne fut qu'en 1933 que S. Lévi édita, avec un lexique très
détaillé, les textes en dialecte B. Du point de vue de l'indo-européen, les dialectes tokhariens présentent
deux paradoxes. Tout d'abord, ils sont connus par des textes de date relativement récente, mais attestent
quelques-uns des traits les plus archaïques de l'indo-européen bien que la physionomie générale des mots ait
été profondément modifiée par la fixation d'un accent tonique sur l'avant-dernière syllabe du mot
indo-européen. En second lieu, on divisait traditionnellement les langues indo-européennes en langues
centum et langues satem, d'après la forme que prenait le mot « cent » dans les différentes langues, les
langues centum étant localisées géographiquement à l'ouest, les autres à l'est. Or les dialectes tokhariens
étaient parlés à l'extrême est du territoire indo-européen bien qu'étant une langue centum.

Une des particularités remarquables du tokharien consiste à confondre en une série de sourdes les
occlusives sourdes, sonores et sonores aspirées de l'indo-européen. Cette confusion a dû se faire au moins
en deux étapes puisque ces dialectes conservent des traces d'une distinction ancienne entre les
non-aspirées et les aspirées. Dans bien des cas, le témoignage du tokharien permet d'assurer certaines
reconstructions ou d'en proposer de nouvelles. Ainsi, on connaissait en vieux slave un suffixe -ynja, utilisé
pour la formation d'abstraits d'adjectifs, l'équivalent lituanien -une n'autorisait pas à poser la forme comme
indo-européenne, le témoignage du tokharien -une est décisif. Un autre rapprochement significatif est celui
du vieux slave reka, resti, « dire », reci, « mot », et du tokharien A rake, B reki, « mot ».

Le déchiffrement du hittite ne prit qu'une dizaine d'années grâce aux textes bilingues hittites-akkadiens.
Des archéologues allemands trouvèrent en 1906 à Bogazköy (Anatolie centrale) un grand nombre de
tablettes cunéiformes écrites en plusieurs langues dont trois sont indo-européennes, le nésite, le louvite et
le palaïte. L'immense majorité des textes hittites sont en dialecte nésite.

Les langues indo-européennes d'Anatolie ancienne offrent deux caractères apparemment contradictoires.
D'une part, elles présentent de manière vivante des traits qui, conservés ailleurs, ne le sont plus qu'à l'état
d'archaïsmes. Ainsi, la déclinaison neutre à alternance *r/*n conservée à l'état de traces dans des formes
comme latin iter, itineris « chemin », est courante en hittite et constitue une classe productive. D'autre part,
en plusieurs points de la morphologie, ces langues anatoliennes ont innové de manière importante. De même,
dans le secteur lexical, le renouvellement du stock est considérable, de très nombreux mots ayant été
empruntés directement à des langues locales non indo-européennes.

Une des conséquences les plus significatives de la découverte du hittite et de son déchiffrement demeure
l'attestation directe de certaines des laryngales, ou coefficients sonantiques supposés par Saussure.
Jusqu'alors, en effet, la théorie laryngaliste restait dans son ensemble une hypothèse, séduisante certes,
mais néanmoins une hypothèse. Or les laryngales qui avaient été supposées pour des raisons structuralistes
se retrouvaient effectivement, en certaines positions du moins, en hittite où elles étaient notées
explicitement à l'aide de signes cunéiformes empruntés à l'écriture akkadienne et dont la lecture ne faisait
aucun doute. Ainsi le hittite a conservé hanti en face du grec±anti, ou hastai- en regard du grec±osteon,
henkan en regard du gallois angeu, etc. Le hittite apporte, en outre, des indications précises sur certains
traits morphologiques ou des concordances qui faisaient encore défaut. Par exemple, le suffixe *-osti-, très
productif en slave, mais peu en germanique, qui servait à former des abstraits d'adjectifs voit son
ancienneté confirmée par l'existence du hittite -asti-. De même, le suffixe multiplicatif grec -aki(v) dont le

7 sur 12 12/10/09 15:43


INDO-EUROPÉEN - Encyclopédie Universalis http://www.universalis.fr/encyclopedie/C010111/INDO_EU...

caractère ancien est indiqué par le parallèle hittite -anki- qui exerce la même fonction, les deux formes
remontant à indo-européen *-nki-.

Depuis la découverte du hittite et du tokharien, les travaux se sont poursuivis également dans les autres
langues ou groupes de langues, dont certains avaient été négligés, ainsi des langues mal attestées telles que
le vénète (italique), l'illyrien, le phrygien, le messapien, etc. D'autre part, on a étudié systématiquement
plusieurs langues de cette famille et les résultats obtenus ne sont pas négligeables pour la connaissance de
la protolangue indo-européenne. C'est le cas pour des langues comme le sace, le sogdien, le parthe, l'ossète,
le marathi, etc. Un exemple fera comprendre la nature de cet apport. Une analyse de l'ensemble des données
poussait les chercheurs à reconnaître dans la forme indo-européenne reconstruite *-bhaghú-, « bras,
avant-bras », un thème en *-u- dérivé d'une racine verbale ancienne. Or cette racine faisait défaut jusqu'à ce
que Benveniste la découvre en ossète, langue iranienne moderne très conservatrice, où elle a pris le sens de
« étendre ». Il faut donc considérer le nom du « bras » comme signifiant au départ « l'allongé » ou
« l'étendu ».

Toutes ces recherches, toutes ces découvertes ont permis peu à peu d'élaborer une théorie d'ensemble
de la protolangue indo-européenne et d'en mettre en lumière les principales caractéristiques.

Phonétique et phonologie
La distinction devenue traditionnelle entre phonétique et phonologie autorise certains auteurs à ne plus se
préoccuper de l'aspect phonétique de la reconstruction. Ces savants estiment que seuls les caractères
phonologiques peuvent être atteints par la reconstruction et qu'il faut donc considérer les protoformes
comme des symboles algébriques dont la réalité est déterminée par la fonction.

e
Les néogrammairiens - on appelle ainsi une école de comparatistes de la fin du XIX siècle et du début du
e
XX - avaient au contraire concentré leur attention sur les évolutions phonétiques. Cela leur permit de
dresser un tableau des différents sons dont disposait l'indo-européen et des équivalences entre les diverses
langues filles.

D'après ces recherches, le système consonantique de l'indo-européen connaissait une grande variété
d'occlusives, des semi-voyelles, aussi appelées sonantes du fait qu'elles pouvaient se trouver au centre
d'une syllabe, et la sifflante s, dont existait également la variante sonore z au contact d'une occlusive
sonore.

O
Occcclluussiivveess
Les occlusives d'après leurs caractères articulatoires.
6Ko - swf

2005 Encyclopædia Universalis France S.A.

La réalité est quelque peu différente de ce tableau régulier. L'existence des occlusives non aspirées
sourdes et celle des occlusives sonores sont bien attestées par de très nombreuses correspondances. Pour
les sourdes aspirées, en revanche, on n'a que peu d'exemples à citer, et encore le caractère aspiré
n'apparaît-il que dans quelques langues seulement (sanskrit, arménien, grec et vieux slave). De plus, dans
ces langues, ces sons se rencontrent principalement dans des mots à caractère populaire ou onomatopéique.
Par ailleurs, les occlusives palatales, vélaires et labiovélaires font également difficulté. En effet, ces trois
séries distinctes ont été admises à la suite d'une simple juxtaposition des données des diverses langues
filles. En réalité, aucune langue indo-européenne ne possède simultanément les trois séries ; la seule série
qu'on retrouve partout est celle des vélaires. Dans un premier groupe de langues, les palatales se
confondent avec les vélaires, tandis que, dans un second groupe, les labiovélaires ne se distinguent pas des
vélaires. De cette répartition, plusieurs auteurs ont conclu que l'indo-européen n'a connu en réalité que deux
séries.

8 sur 12 12/10/09 15:43


INDO-EUROPÉEN - Encyclopédie Universalis http://www.universalis.fr/encyclopedie/C010111/INDO_EU...

Les sonantes comprenaient les nasales *m et *n, les liquides *l et *r et les semi-voyelles proprement dites
*y et *w. Ce qui caractérise ces sons, c'est leur particularité de pouvoir remplir toutes les fonctions des
consonnes, mais aussi toutes celles des voyelles. Au point de vue de la distribution, elles saturent donc
toutes les positions. Le rôle particulier qu'elles jouaient en indo-européen est d'ailleurs en relation avec leur
nature phonétique : leur aperture varie d'après l'environnement phonétique. Bien qu'étant sans doute
phonétiquement moins vocaliques que les nasales, les liquides et les semi-voyelles proprement dites, il faut
classer de la même manière les « laryngales", ou coefficients sonantiques saussuriens, notées d ou H. Ces
phonèmes remplissaient, en effet, les mêmes fonctions et leur distribution est identique.

Suivant la doctrine classique l'indo-européen connaissait trois voyelles : e, o, a. Cette dernière voyelle, si
elle ne provient pas d'une évolution due à une laryngale, ne se rencontre que dans des mots à caractère
familier ou technique. Les voyelles *e et *o pouvaient, dans certaines conditions morphologiques, être
0
allongées : *e et *o. Enfin, en alternance avec *e et *o existait encore une voyelle réduite notée * . Sur le
plan phonétique, on ajoutera encore la voyelle *2, alternant avec *a, *e, *o, de même que les autres sonantes
en fonction vocalique *i, *u, *l, *m, *n, *r, qui devenaient des voyelles longues lorsqu'elles étaient suivies
d'un *2 lui-même suivi d'une consonne.

Chaque mot indo-européen, enfin, à part quelques clitiques tels que certains pronoms ou des particules,
constituait une unité accentogène. L'accent, sans doute musical, était libre : il pouvait atteindre n'importe
quelle partie du mot et était susceptible de variations au cours de la flexion.

Principaux caractères morphologiques et syntaxiques


Le caractère essentiel de la morphologie consistait en un système flexionnel très riche - où les mots
étaient fléchis, à l'exception des mots-outils, invariables - et en une distinction précise entre le verbe et le
nom. Chaque mot indo-européen fléchi se composait d'au moins deux morphèmes : la racine et la désinence.
Entre ces éléments pouvaient se greffer un ou plusieurs suffixes. Chacun de ces morphèmes se présentait
sous une des formes suivantes : avec une voyelle *e, c'est-à-dire au degré plein ou normal, avec une voyelle
*o, forme appelée au degré fléchi ou sans voyelle, d'où le nom de degré zéro. On distingue en outre un degré
plein allongé (*e) et un degré fléchi allongé (*o). Ces variations vocaliques quantitatives et qualitatives
portent le nom d'alternances. Nombre de ces alternances se retrouvent dans des langues historiques, ainsi
dans le grec ancien p{ij-omai, « je crois », degré plein, pe-poij-a, au degré fléchi et±epe-pij-men au degré zéro.

La désinence, morphème terminal, était exprimée matériellement ou non ; dans ce dernier cas, on parle de
désinence zéro. C'est ce morphème qui indiquait le rôle du mot dans la proposition, bien plus que la place,
qui n'avait le plus souvent qu'une valeur stylistique, à l'exception toutefois de la position en tête de phrase
réservée à un mot accentogène et de la seconde place où se trouvaient de préférence les clitiques. Si l'on
compare l'indo-européen à des langues agglutinantes, on constate que les désinences cumulent plusieurs
fonctions, ce qui est encore le cas dans les langues de cette famille qui ont conservé un système flexionnel à
l'époque historique. Ainsi, le -ä de latin lupä indique à la fois qu'il s'agit d'un féminin, d'un singulier et d'un
nominatif-vocatif ; il en est de même pour le système verbal où *eimi signifie l'idée d'« aller », appliquée, de
manière durative et présente, à une première personne du singulier.

L'indo-européen connaissait huit cas : nominatif, vocatif, accusatif, génitif, datif, locatif, ablatif,
instrumental ; trois nombres : singulier, duel, pluriel ; et trois genres grammaticaux : neutre, masculin,
féminin, évolution d'une étape antérieure où l'animé s'opposait à l'inanimé. Le système flexionnel verbal est
aussi riche, bien que, dans les formes personnelles, il n'y ait pas de distinction de genres comme c'est le cas
par exemple en sémitique ; par contre, il comportait également trois nombres et trois personnes.
L'opposition temporelle se marquait par l'usage de désinences différenciées : pour le présent, on utilisait les
désinences primaires ; pour le passé, les désinences secondaires. Si l'action verbale s'accomplissait hors du
sujet et que ce dernier ne se sentait pas directement concerné par celle-ci, on employait l'actif, dans le cas
inverse le moyen ; c'est ce qu'on appelle la diathèse, qui était marquée explicitement par des désinences
particulières. D'autre part, le sujet parlant pouvait envisager le procès soit comme se déroulant réellement,
soit comme une réalité dont on attend ou dont on veut la réalisation, soit enfin comme une chose qui est
simplement possible même si on la souhaite. Ces trois modalités étaient exprimées de manière
morphologique, respectivement au mode indicatif, au subjonctif et à l'optatif. Enfin, il existait différents

9 sur 12 12/10/09 15:43


INDO-EUROPÉEN - Encyclopédie Universalis http://www.universalis.fr/encyclopedie/C010111/INDO_EU...

aspects - duratif, aoristique, perfectif, désidératif et causatif - marqués par des modifications
morphologiques ou par des distinctions lexicales. Ainsi, le verbe « être » était rendu par la racine *es- au
w
duratif et au perfectif, tandis qu'à l'aoriste on utilisait le thème *bhew2-. Par contre, le même thème *leik ,
w w
« laisser », servait au duratif sous la forme *léik -e-, et sous la forme *lik -é- à l'aoriste.

Les suffixes étaient très nombreux en indo-européen, et la formation des mots par dérivation un procédé
courant. Cependant l'analyse formelle et sémantique de ces morphèmes demeure une des grandes questions
laissées sans réponse. Certains suffixes, simples ou complexes, sont d'analyse relativement aisée ; par
exemple on distingue un suffixe *-men- formant des noms d'action neutres ou masculins, un suffixe *-went-
avec le sens de « pourvu de », un suffixe *-ter- ou *-tel-, d'après les langues, formant des noms d'agent, etc.
L'analyse formelle devient très facile si l'on suit Benveniste, pour qui tout suffixe se compose de la voyelle
alternante *e suivie d'un phonème consonantique, d'où il découle qu'un suffixe *-ter- doit en réalité être
analysé en suffixe *-et- au degré zéro, soit *-t-+ suffixe *-er-au degré plein, c'est-à-dire *t + *er > *-ter-.
Une telle analyse, pour séduisante qu'elle demeure, ne s'appuie néanmoins sur aucun argument sémantique
et reste donc arbitraire.

Le noyau du mot est constitué par la racine. La majorité de ces dernières sont construites sur le schéma
C e C , où C et C représentent des phonèmes consonantiques ou sonantiques. Il subsistait toutefois un
1 2 1 2
certain nombre de racines présentant deux particularités : elles échappaient au jeu normal des alternances
vocaliques et semblaient déficientes du fait de l'absence apparente d'un des deux phonèmes
consonantiques. Grâce aux hypothèses de Saussure et à la découverte du hittite, quelques auteurs, dont
É. Benveniste et J. KuryLowicz, purent proposer une théorie ramenant au même schéma ces racines qui
paraissaient s'en écarter. Ainsi la racine *ed-« manger » est reconstruite en *2 ed-, *2 od, *2 d-,
1 1 2
représentant respectivement le degré plein, le degré fléchi et le degré zéro à une époque antérieure. La
laryngale, notée conventionnellement *2 , se serait amuïe devant une voyelle et aurait modifié, le cas
1
échéant, le timbre de cette voyelle, d'où le passage de *o à *e, tandis qu'au degré zéro la même laryngale se
serait vocalisée en *e. Ces règles permettent de ramener ce type de racine au schéma classique tout en
expliquant leur structure particulière et l'absence d'alternance vocalique.

Néanmoins, ces dernières années, l'application systématique de ces règles de reconstruction


morphologique a été remise en cause. Il apparaît en effet que le recours à un seul schéma radical reconstruit
entraînerait des conséquences inadmissibles pour la protolangue, si du moins on attribue à cette dernière les
propriétés des langues attestées.

Nouveaux procédés d'analyse et de comparaison


Durant les dernières décennies se sont créées et développées de nouvelles méthodes en linguistique
comparative pour la reconstruction des protolangues. Certaines de ces recherches ont vu le jour en
linguistique générale, et plus spécialement dans la synchronie. Leur application à la diachronie a été riche de
conséquences. Parmi ces méthodes, il faut faire mention de la théorie de l'information et des théories
statistiques. D'autre part, le structuralisme, issu en partie de la linguistique comparative, a permis des
analyses très poussées principalement en phonologie diachronique où se sont distingués des savants tels
que A. Martinet. C'est en se fondant sur ce genre d'études qu'on a pu tenter d'établir une chronologie
relative des changements survenus au cours de l'évolution de l'indo-européen aux diverses langues filles. Par
ailleurs, certains linguistes ont procédé à des décomptes statistiques sur le vocabulaire des langues
indo-européennes ou sur leur morphologie. Or, dans le vocabulaire dit de base - c'est-à-dire celui qui serait
aculturel et dont l'existence ne dépendrait donc ni d'une civilisation donnée ni de circonstances
géographiques particulières -, on nota pour plusieurs langues une constante de renouvellement lexical. Cette
découverte permettait notamment, à l'instar de la datation par le carbone 14, de dater l'âge de séparation
de deux langues reconnues parentes d'après le pourcentage de lexèmes du vocabulaire de base que ces
langues auraient encore en commun. L'indo-européen, du fait de ses nombreuses langues filles attestées
bien souvent depuis longtemps, a puissamment contribué à établir une méthode dont on peut penser qu'elle
aura à son tour quelque utilité pour la connaissance de la protolangue et de la dialectologie indo-européenne.

10 sur 12 12/10/09 15:43


INDO-EUROPÉEN - Encyclopédie Universalis http://www.universalis.fr/encyclopedie/C010111/INDO_EU...

e
Depuis le début du XX siècle, le proto-indo-européen a été successivement ou simultanément comparé à
presque toutes les autres protolangues, celles de l'Ancien Monde du moins. Si l'on écarte les travaux
fantaisistes tels que ceux élaborés à partir d'une connaissance superficielle des familles étudiées, les
comparaisons les plus étayées ont été faites entre l'indo-européen et le chamito-sémitique entre l'indo-
européen et le finno-ougrien et entre l'indo-européen et le caucasique. En outre, il faut tenir compte de la
possibilité d'emprunts lexicaux d'une langue à l'autre à l'époque préhistorique et aussi de ressemblances
dues au hasard, qui peuvent s'élever à 5% environ, comme J. H. Greenberg a pu l'établir. Sur le plan
méthodologique, enfin, plus la reconstruction remonte dans le temps, plus les rapprochements doivent avoir
lieu entre des éléments de plus en plus ténus. Ces conditions augmentent fortement la probabilité de
rapprochements fortuits. Avec les méthodes actuelles et dans les meilleurs des cas, on aboutirait à des
possibilités d'apparentement, mais non à des certitudes pareilles à celles obtenues, par exemple, à l'intérieur
de la famille indo-européenne.

Parallèlement à ces travaux se développent des recherches épistémologiques sur les méthodes utilisées
en linguistique comparative. Les principales critiques que l'on peut formuler à l'endroit des protolangues
reconstruites concernent leur simplicité artificielle et l'absence de chronologie. En effet, les reconstructions
sont souvent considérées comme si elles étaient synchrones, ce qui ne correspond manifestement pas à la
réalité. Il en est de même pour certaines formes ou structures reconstruites et dont l'excessive simplicité ne
pourrait être due qu'à l'imperfection des méthodes actuelles. Les développements de la linguistique
typologique, notamment celle des universaux, ont ainsi conduit à un réexamen fondamental des
reconstructions en indo-européen, afin de mettre en conformité la protolangue postulée avec les systèmes
typologiquement probables. C'est dans le domaine de la phonologie qu'est apparue la contestation la plus
radicale, avec la théorie « glottale » proposée par les linguistes T. V. Gamkrelidzé et V. Ivanov. À la suite
d'autres chercheurs, ceux-ci ont en effet remarqué que le système des occlusives indo-européennes tel
qu'on le reconstruisait classiquement manquait de vraisemblance du fait de la quasi-absence de la labiale
sonore non aspirée *b. Ils ont proposé de le remplacer par un système constitué de trois séries, l'une
marquée par le trait « glottalisation » (p´), t´, k´ ; une autre par le trait « sonorité », avec allophones
h h h
« aspirés » ou « non aspirés » : b /b, d /d, g /g ; et une troisième par le trait « non-sonorité », avec la même
h h h
allophonie : p /p, t /t, k /k. Cette réécriture aboutit à des révisions importantes, telles que la reformulation
des lois phonétiques de base ou que la « désanskritisation » du modèle indo-européen (puisque les systèmes
les plus conservateurs seraient dans ce cas ceux des langues germaniques, anatoliennes et arméniennes),
qui peut ainsi être rapproché du caucasique. Les mêmes auteurs ont également proposé une théorie
syntaxique originale, et typologiquement fondée, sur la structure « active » de la protolangue
indo-européenne.

S'ils ne font pas l'unanimité parmi les comparatistes, ces travaux sont révélateurs des profondes
mutations que les développements de la linguistique synchronique ont apportées à la vénérable « grammaire
comparée » ; et l'on peut se demander si l'on verra un jour la conclusion de la synthèse entamée par
J. KuryLowicz en 1968, tant les conséquences des recherches nouvelles en phonologie (notamment pour les
implications étymologiques et morphologiques de la théorie laryngaliste), morphologie et syntaxe de l'indo-
européen, en accroissant moins la masse des données comparées que les possibilités de traitement de
celles-ci, semblent rendre actuellement difficile tout consensus explicatif.

Les recherches « annexes » se sont en tout cas multipliées, d'une part, dans le domaine de la
reconstruction culturelle - métrique et poétique, idéologie, mythes, institutions, dont l'analyse profite des
apports du structuralisme ainsi que, pour les premières, de la théorie formulaire, et, pour les secondes, de
l'anthropologie -, d'autre part, dans celui de l'histoire même des études indo-européennes, que ce soit dans
une perspective exclusivement linguistique ou dans une perspective davantage sensible aux aspects
sociologiques.

Auteur : Guy JUCQUOIS

© 2009, Encyclopædia Universalis France S.A. Tous droits de


propriété industrielle et intellectuelle réservés.

11 sur 12 12/10/09 15:43


INDO-EUROPÉEN - Encyclopédie Universalis http://www.universalis.fr/encyclopedie/C010111/INDO_EU...

Consulter les articles d'Encyclopædia Universalis : A B C D E F G H I J K L M N O P Q R S T U V W X Y Z


Consulter les articles d'Encyclopædia Britannica.
Crédits

12 sur 12 12/10/09 15:43

Vous aimerez peut-être aussi