Vous êtes sur la page 1sur 9

Leçon 6 : Les familles de langues

Il paraît difficile d’arrêter le classement des langues par familles. Des propositions nouvelles,
notamment celles des macro-familles permettant de réunir toutes les langues du monde,
comme celles que nous avons examinées avec prudence dans la leçon 4, sont encore objet de
virulents débats. Certaines langues résistent à toute classification : nous avons en Europe un
exemple bien connu : le basque, ou euskara.
Parfois, des territoires réduits offrent le spectacle de véritables mosaïques de langues
généalogiquement très différentes (ex. langues papoues de Nouvelle-Guinée).
La famille indo-européenne, la mieux étudiée, est en même temps le plus représentée ,la
moitié de la population mondiale parle une langue indo-européenne, et elle réunit au total
près de 200 langues.

Dans cette leçon, nous aborderons, dans un premier temps, deux thèmes :

 L’histoire du classement généalogique


 Le classement des langues dans l’état actuel des connaissances.

Dans un deuxième temps, nous aborderons la famille indo-européenne, du point de vue


historique et géographique.

Les premiers classements

L’idée que les langues ne proviennent pas de nulle part et que certaines d’entre elles
présentent des similitudes et même dériveraient d’un ancêtre commun (par exemple, le
français ou l’espagnol du latin) a fait son chemin depuis le XVIIIème siècle.
L’événement le plus important pour la généalogie des langues a été, au XIXème siècle, la
découverte de la parenté entre le sanscrit et certaines langues européennes (latin, grec). Cette
hypothèse, largement confirmée depuis, a contribué à la naissance du premier phylum
linguistique clairement établi : la famille indo-européenne.
Avant cette date, des rapprochements entre certaines langues avaient déjà été proposés :
durant l’Antiquité, entre le grec et le latin (que l’on sait désormais effectivement appartenir à
la famille indo-européenne), dès le Xème siècle pour l’arabe et l’hébreu, pour les langues
romanes, encore appelées « latines », au XIVème (lorsque Dante a réuni les langues de Si,
d’Oïl et d’Oc dans un même groupe).
La concrétisation de ces réflexions a été, comme nous l’avons dit, la parenté reconnue du
sanscrit avec le grec, le latin, les langues celtiques, les langues germaniques et le persan,
énoncée de manière mémorable par W. Jones, en 1787 :

« La langue sanscrite, quelle que soit son antiquité, est d'une structure admirable, plus parfaite que le grec,
plus riche que le latin et plus raffinée que l'un et l'autre; on lui reconnaît pourtant plus d'affinité avec ces deux
langues, dans les racines des verbes et dans les formes grammaticales, qu'on ne pourrait l'attendre du hasard.
Cette affinité est telle, en effet, qu'un philologue ne pourrait examiner ces trois langues sans croire qu'elles sont
sorties d'une source commune, qui peut-être n'existe plus. Il y a une raison semblable, mais qui n'est pas tout à
fait aussi victorieuse, pour supposer que le gothique et le celtique, bien qu'amalgamés avec un idiome très
différent, ont eu la même origine que le sanscrit; et l'on pourrait ajouter le persan à cette famille [...] » (W.
Jones, cité d'après B. Sergent, Les Indo-Européens, Payot, 1995).

Cette hypothèse de W. Jones suggère que les similitudes entre les langues doivent être
observées de façon minutieuse, au-delà d’une simple concordance lexicale : « on lui reconnaît
pourtant plus d'affinité avec ces deux langues, dans les racines des verbes et dans les formes grammaticales,
qu'on ne pourrait l'attendre du hasard ». C’est l’étiolement de cette rigueur méthodologique,
attentive aussi bien aux racines (le lexique) qu’aux morphèmes (la flexion, la dérivation) qui
a été souvent reproché aux « unificateurs » travaillant sur les macro-familles, comme M.
Ruhlen. Or, tout le programme de recherches de cette nouvelle discipline qui naît au XIXème
siècle, la grammaire comparée, est fondé sur une étude systématique des correspondances
grammaticales. Voici, à titre d’exemple, des similitudes dans les formes du verbe être
observées par l’un des premiers comparatistes de l’époque, F. Bopp :

Cependant, la plus grande contribution des comparatistes a été la théorie des lois phonétiques,
qui sera portée à ses ultimes conséquences par les élèves ou les épigones des premiers
comparatistes, avec le mouvement des « néogrammairiens », qui émergera dans le dernier
tiers du XIXème siècle (Brugmann, Leskien, Osthoff, etc.). Selon
cette théorie, lorsqu’un changement phonétique se produit au sein d’un paradigme dans une
langue, il tend à gagner l’ensemble des mots concernés. Par exemple, si une consonne dure
vélaire comme /k/ (ou occlusive vélaire sourde) se palatalise devant /i/, le changement
gagnera tous les mots de la langue qui contiennent la syllabe /ki/. On sait que
cette doctrine doit être relativisée, car il faut compter avec des mots d’emprunts ou des
formations analogiques, qui enfreignent cette règle. Par exemple, alors qu’en français
moderne, les occlusives vélaires latines /k, g/ se sont palatalisées devant toutes les voyelles
antérieures mais aussi devant /a/, donnant chat, chambre, jambe à partir de CATTUS,
CAMERA, GAMBA, etc., la crevette (ou « petite chèvre », en termes de motivation
sémantique) ne se dit pas chevrette (comme dans nombre de dialectes d’oïl occidentaux),
mais conserve l’occlusive vélaire sourde maintenue dans le dialecte normand, où les étymons
latins vus précédemment ont donné cat, cambre et gambe. Or, crevette dans le lexique
français est, de toute évidence, un emprunt au dialecte normand.

L’observation des lois phonétiques, qui restent un grand acquis du comparatisme, pourvu
qu’on ne les utilise pas de manière mécanique, permet de tirer des conclusions, en les
validant, sur la parenté des langues. La grammaire comparée a contribué à la naissance de la
linguistique historique dont la principale préoccupation est précisément l’histoire des langues,
qui suppose également le travail de comparaison entre les phénomènes observables dans les
langues anciennes et modernes et la reconstruction des protolangues. En
effet, l’idée sous- jacente à la généalogie des langues est que les langues, comme les humains,
connaissent des filiations : Elles ont des mères et des sœurs, pour utiliser une métaphore
généalogique. Le français a pour sœur, par exemple, la langue espagnole, pour mère le latin,
pour grand-mère une hypothétique langue italo-celtique, comme bisaïeule le proto-indo-
européen occidental (groupe centum), comme trisaïeule le proto-indo-européen à proprement
parler et ... si l’on suit J.H. Greenberg et M. Ruhlen, un ancêtre eurasiatique comme lointain
parent dont le souvenir se perd dans la nuit des temps, et pour lequel les ramifications
généalogiques deviennent incertaines. Si l’on opte pour une démarche minimaliste,
extrêmement prudente, on dira qu’au- delà du latin, langue-mère abondamment attestée sans
guère d’équivoque, il est dangereux de s’aventurer, d’autant plus que l’on peut difficilement
imaginer une stabilité phonétique et sémantique sur une période de plusieurs milliers
d’années. On conclura donc que les
protolangues, par définition reconstruites à partir d’attestations et d’indices les plus divers
(épigraphie, comparaison interdialectale, emprunts, onomastique, etc.), n’ont pas de valeur
historique, en tant qu’entités réelles, mais ont avant tout une valeur heuristique : ce sont des
construits qui aident le linguiste à comprendre les mécanismes de diversification des
systèmes linguistiques observables dans des espaces géographiques et temporels délimités par
un ensemble d’affinités structurales, rien de plus. Or, c’est déjà beaucoup, et à ce titre, le
comparatisme classique reste l’un des piliers de la linguistique moderne.

Les grandes familles de langues

La diversité des langues du monde se laisse difficilement réduire à un nombre limité de


familles. Cependant, si l’on laisse de côté les théories de macro-regroupement, on peut isoler
au moins une quinzaine de familles pour lesquelles un relatif consensus a été obtenu (et qui
sont loin de réunir toutes les langues du monde) :

 la famille indo-européenne
 la famille ouralienne
 la famille altaïque
 la famille dravidienne
 la famille kartvélienne
 la famille sino-tibétaine
 la famille austro-asiatique
 la famille eskimo-aléoute
 la famille tchouktche-kamtchadale
 la famille afro-asiatique (autrefois appelée chamito-sémitique)
 la famille niger-congo(-kordofanien)
 la famille nilo-saharienne
 la famille khoïsane.

Voyons à présent quelles sont les principales langues qui font partie de ces différentes
familles :
Ce classement réducteur, s’il a l’avantage d’être acceptable pour la majorité des linguistes, a
le défaut de laisser de côté un grand nombre de langues : langues des Amériques (plusieurs
dizaines de familles différentes pour les uns, trois seulement pour J.H. Greenberg.
L’amérinde, le na-déné et l’eskimo-aléoute), le basque, même le japonais et le coréen réputés
comme difficilement classables. Il laisse de côté également de nombreuses langues
austronésiennes, parfois réunies avec le sino-tibétain et l’austro-asiatique dans une macro-
famille.
On peut remarquer également que les familles sont de taille très inégale : d’une seule langue
(c’est le cas avec les isolats comme la langue burushaski au Pakistan), à plusieurs centaines
de langues (comme dans la grande famille austronésienne).
En fonction de documents disponibles, l’existence ou non de l’écriture, ces classements sont
plus sûrs pour certaines familles, plus discutables pour d’autres. Il arrive également que la
génétique soit appelée à la rescousse pour infirmer ou confirmer les résultats des classements
linguistiques. Il semblerait que la génétique soit en mesure de confirmer la théorie de
l’existence d’une macro-famille eurasiatique (dont l’existence est contestée par beaucoup de
linguistiques par ailleurs), alors que dans d’autres cas, elle donne des résultats pour le moins
étonnants : le tchétchène et l’ingouche dans le Caucase sont deux langues très proches, or, les
deux populations sont génétiquement très différentes ; les Arméniens et les Azéris,
génétiquement très semblables, parlent des langues appartenant à deux familles différentes
(famille indo-européenne et famille altaïque). Une fois
de plus, même si les recherches dans ce domaine sont aussi intéressantes que passionnantes,
on voit que les conclusions sur les corrélations génétiques et linguistiques doivent être prises
avec la plus grande prudence, car celles-ci peuvent s’avérer vraies dans certains cas, fausses
dans d’autres.

L’indo-européen

La famille indo-européenne peut encore être appelée la famille indo-hittite. Ce terme a été
conçu pour tenir compte d'un groupe dont la découverte récente, au début du XXème siècle, a
permis de confirmer ou d'infirmer en fait, de vérifier des hypothèses sur le prototype
linguistique que les fondateurs de la grammaire comparée au début du XIXème siècle avaient
baptisé l’indo-européen. C'est donc un terme de linguiste très spécialisé. Nous nous
contenterons du terme plus familier d’indo-européen.
Pour certains chercheurs, c’est la seule famille linguistique qui ne pose pas de problèmes
généalogiques, pour au moins deux raisons: les documents anciens sont disponibles
(évidemment, pas pour une hypothétique langue-mère, on la situe à une époque, 4000 ans
environ avant J-C., et qui ne connait pas l’écriture), le territoire géographique est facilement
délimitable, mais le foyer d’origine a été très discuté.
L'extension géographique des langues et des groupes de langues de la famille indo-
européenne déborde très largement le cadre de l'Europe et de l'Inde, comme le montre le
groupe persan au Moyen-Orient, et le tokharien du Turkestan chinois, en Asie.
L'extension des langues indo-européennes couvre en effet l’Europe péri-atlantique, centrale et
orientale, le nord de la Méditerranée et les Balkans, le Caucase sud (arménien) pour la
branche occidentale, le Moyen- Orient (Iran, Afghanistan, Pakistan et une grande partie du
bassin indien) pour la branche orientale, comme le montre la carte suivante (sur laquelle on
remarquera l’absence de l’arménien, des anciennes langues anatoliennes comme le hittite et
du tokharien, dans les groupes énumérés, mais qui a l’avantage de montrer, de façon claire,
l’étendue du territoire indo- européen) :

Parmi les langues indo-européennes figure aussi une grande « voyageuse » : le romani des
Gitans d'Europe, avec de nombreux dialectes, étant donné la dispersion et la mobilité des
locuteurs.
La famille indo-européenne couvre la plus grande partie du vieux continent. Deux exceptions
importantes sont à souligner dans le paysage linguistique européen : les langues finno-
ougriennes (langues fenniques au nord de l’Europe, le hongrois en Europe Centrale), et le
basque ou euskara en tant qu’isolat sans parenté proche avec aucune autre langue connue
(malgré les tentatives discutables de rapprochement avec la famille caucasienne ou encore
ouralienne). À cela s’ajoutent certaines langues minoritaires, comme le gagaouze en
Moldavie, le karaïm en Lituanie ou le turc, si l’on considère que la Turquie fait partie de
l’Europe géographiquement parlant.
On illustre généralement la classification des langues indo-européennes sous forme d’un
arbre. Présenter les langues du monde sous forme d’arborescence relève de la méthode
traditionnelle (le Stammbaum d’August Schleicher). Cette représentation, évolutionniste, a
pour principal défaut de ne pas mettre suffisamment l’accent sur le contact et sur les
changements typologiques forts, qui causent un décalage entre les filiations et les types.
L’exemple le plus connu est celui de l’anglais et de sa transformation lors de la période
anglo-normande, période durant laquelle une langue germanique qui ressemblait à bien des
égards aux dialectes bas- allemands de l’époque a considérablement rapproché son lexique et
sa grammaire d’une langue romane émergente, le français, à travers la variété anglo-
normande. Il en va de même dans le monde roman, où le roumain a vu son fond lexical
s’enrichir de façon considérable avec les emprunts slaves.
Le Stammbaum donne donc un aperçu de la filiation, en dépit des modulations typologiques
ultérieures. La représentation sous forme d’arbre généalogique cependant pose problème, car
dans la réalité, une langue ne « naît » pas d'une autre ou d'un dialecte. Une langue n’émerge
pas non plus seulement en raison de facteurs de diffusion et d'isolement des populations qui
parlent une langue d'origine, comme le suggèrent les branches orphelines. Bien au contraire,
l’un des principaux facteurs de changement est le contact linguistique, basé sur les échanges
ou phénomènes d’interdépendances entre communautés linguistiques. Les hypothétiques
Indo-Européens ne sont pas arrivés dans une Europe vide, et encore moins dans un Moyen-
Orient désert : le Proche-Orient est en effet l’une des plus anciennes régions de peuplement
de l'humanité et, en particulier, de développement de l’agriculture.

Voici un arbre généalogique possible des langues indo-européennes :

Cette disposition de l'arbre est très ethnocentrique : le groupe indo-persan réunit plus de dix
langues modernes du Moyen-Orient et de l'Inde nord et centrale pour le seul groupe indo-
arien : romani d'Europe, kashmiri, penjabi/punjabi, hindi, nepali, assamese, bengali, oriya,
gujrati, marathi, cinghalais.
Mais il n'y a pas de bons arbres : les distances linguistiques sont variables entre les familles et
les langues, et il faut toujours compter avec de nombreux isolats (grec, albanais, arménien),
eux-mêmes discutables car certaines langues isolées dans le phylum peuvent avoir des
réseaux dialectaux anciens ou modernes très diversifiés, comme le montre la branche du grec
dans l’arbre ci-dessous. En outre, de nombreuses langues ont disparu (osque, ombrien de la
famille italique), ainsi que des groupes entiers, anciens et fortement différenciés, comme le
groupe anatolien (palaique, hittite, luvien, lydien, carien, lycien).

Voici à présent, un tableau réunissant les principales langues indo-européennes :


Qu’en est-il d’une protolangue indo-européenne ? Il n'y a sans doute jamais eu de
protolangue indo-européenne, du moins en tant que norme homogène attribuable à une
communauté historique, ni même en tant que langue unifiée. Partout où les vestiges
archéologiques attestent la présence de la culture des « kourganes » (tumulus funéraires),
typique – selon l’une des théories en vigueur – des Indo-Européens, et de leurs descendants
culturels, ces populations viennent se superposer à d'autres.
Notamment en Europe centrale et danubienne où aurait existé une civilisation prestigieuse ce
qui implique un certain prestige des langues et des cultures de ces occupants indigènes, de ce
que l'archéologue Marija Gimbutas appelle la Vieille Europe ou Alteuropa.
Or, c'est bien sur des questions de prestige et de fonction sociale des langues en contact que
se jouent les phénomènes d'interférence entre langues, qui participent aux conditions du
changement linguistique.
La diversité des langues indo- européennes anciennes et modernes laisse à penser qu'elles
sont entrées en contact avec des langues pré-indoeuropéennes qui ont laissé des traces. Elles
sont également entrées en contact entre elles, comme le montrent à date très récente l'exemple
du latin et du celtique continental (ibéro-celtique), puis du gallo-roman avec le germanique
(franc), ou encore plus proche, le dialecte d’oïl anglo-normand avec le vieil anglais, comme
nous l’avons vu plus haut. On peut
donc difficilement imaginer un proto indo-européen, et l’on doit se contenter d’imaginer
plutôt des variétés dialectalisées dans des habitats déjà diversifiés entre trois tropismes que
sont le bassin de l’Indus à l’est, la péninsule anatolienne au centre, les Balkans et l’Europe
atlantique et méditerranéenne à l’ouest. Une
deuxième question touche à l’origine des Indo-Européens. De multiples hypothèses
s’affrontent sur le foyer d’origine : Kazakhstan, Ukraine, Pologne, Anatolie (théorie de C.
Renfrew), Caucase (théorie de T. Gamkrelidze et V. Ivanov).
L’une des thèses dominantes de nos jours repose sur les travaux archéologiques de Marija
Gimbutas portant sur l'expansion de ce qu’on appelle la civilisation des kourganes,
mentionnée précédemment.
On pense que cette civilisation est celle des Indo-Européens, qui aurait connu un double foyer
d'expansion : l'actuelle Ukraine, au nord de la mer Noire, qui serait le point de départ de
l'expansion vers le sud et l'est, et les steppes de la Russie méridionale, par la migration de
guerriers à cheval. Si l’on peut décrire avec beaucoup de précision les langues indo-
européennes, dans leurs aspects anciens et modernes, on ne peut qu’accumuler les conjectures
sur le ou les peuple(s) indo-européen(s). L’indo-européen est un concept essentiellement
linguistique, il faut par conséquent rester extrêmement prudent lorsqu’on reconstitue une
civilisation à partir d’un concept linguistique.

En ce qui concerne les caractéristiques des langues indo-européennes aujourd’hui, M.


Malherbe (Le langage de l’humanité, Paris, Seghers, 1983), distingue les traits suivants :

 Tendance flexionnelle : les mots à forme fixe (adverbes, prépositions...) sont moins
nombreux que ceux qui subissent une flexion (noms, pronoms, verbes),
 Opacité des thèmes flexionnels : ces flexions, telles que les marques du pluriel, la
conjugaison du verbe, etc., peuvent altérer le radical qui reste ainsi peu apparent,
 Polyvalence des désinences : les désinences de ces flexions peuvent assurer
simultanément plusieurs fonctions grammaticales,
 Sites flexionnels terminaux : ces flexions apparaissent toujours à la fin du mot, jamais
au début,
 Prédominance de l’accord sujet : le verbe ne se conjugue qu'en fonction du sujet, les
compléments n'interviennent pas dans la conjugaison,
 Ordre des mots relativement libre : les mots ont une certaine autonomie dans la
phrase, l'ordre des mots n'est pas rigoureusement obligatoire, ni significatif,
 Interrogation prosodique : il n'y a pas systématiquement de particule interrogative,
l'interrogation est marquée par l'ordre des mots,
 Productivité de la dérivation : la formation des mots à partir d'un radical est très riche
et diversifiée, etc.

Il s’agit bien sûr d’une synthèse très générale, qui n’a de valeur de vérité que très relative.
Rien n’empêche de penser que ces tendances étaient manifestes ou latentes dans des états
anciens de ce qui a pu être le proto-indo-européen, mais il faut là encore rester prudent. Si
l’on devait déduire la typologie grammaticale et lexicale du latin classique à partir des
tendances actuelles de langues romanes, l’image du proto-roman alors induit des faits de
langues modernes serait sujet à caution : il n’est pas jusqu’au système casuel du daco-roman
(dialectes roumains) qui n’ait été entièrement refait, sur des bases très différentes de ce que
fut la flexion casuelle du latin classique.
Nous ne savons pas vraiment si les Indo-Européens ont existé, ni où ils ont habité
exactement, ni même quelle langue ils ont parlé.
En revanche, nous savons que les langues que l’on classe dans cette famille ont bien une
origine commune, et que les diverses théories élaborées durant ces deux derniers siècles sur
ce que pourrait être l’indo-européen, comptent parmi les modèles les plus cohérents de
l’analyse grammaticale moderne.

Vous aimerez peut-être aussi