Leçon 6

Leçon 6 : Les familles de langues
Il paraît difficile d’arrêter le classement des langues par familles. Des propositions nouvelles,
notamment celles des macro-familles permettant de réunir toutes les langues du monde,
comme celles que nous avons examinées avec prudence dans la leçon 4, sont encore objet de
virulents débats. Certaines langues résistent à toute classification : nous avons en Europe un
exemple bien connu : le basque, ou euskara.
Parfois, des territoires réduits offrent le spectacle de véritables mosaïques de langues
généalogiquement très différentes (ex. langues papoues de Nouvelle-Guinée).
La famille indo-européenne, la mieux étudiée, est en même temps le plus représentée ,la
moitié de la population mondiale parle une langue indo-européenne, et elle réunit au total
près de 200 langues.
Dans cette leçon, nous aborderons, dans un premier temps, deux thèmes :
 L’histoire du classement généalogique

 Le classement des langues dans l’état actuel des connaissances.
Dans un deuxième temps, nous aborderons la famille indo-européenne, du point de vue

historique et géographique.
Les premiers classements
L’idée que les langues ne proviennent pas de nulle part et que certaines d’entre elles
présentent des similitudes et même dériveraient d’un ancêtre commun (par exemple, le
français ou l’espagnol du latin) a fait son chemin depuis le XVIIIème siècle.
L’événement le plus important pour la généalogie des langues a été, au XIXème siècle, la
découverte de la parenté entre le sanscrit et certaines langues européennes (latin, grec). Cette
hypothèse, largement confirmée depuis, a contribué à la naissance du premier phylum
linguistique clairement établi : la famille indo-européenne.
Avant cette date, des rapprochements entre certaines langues avaient déjà été proposés :
durant l’Antiquité, entre le grec et le latin (que l’on sait désormais effectivement appartenir à
la famille indo-européenne), dès le Xème siècle pour l’arabe et l’hébreu, pour les langues
romanes, encore appelées « latines », au XIVème (lorsque Dante a réuni les langues de Si,
d’Oïl et d’Oc dans un même groupe).
La concrétisation de ces réflexions a été, comme nous l’avons dit, la parenté reconnue du
sanscrit avec le grec, le latin, les langues celtiques, les langues germaniques et le persan,
énoncée de manière mémorable par W. Jones, en 1787 :
« La langue sanscrite, quelle que soit son antiquité, est d'une structure admirable, plus parfaite que le grec,
plus riche que le latin et plus raffinée que l'un et l'autre; on lui reconnaît pourtant plus d'affinité avec ces deux
langues, dans les racines des verbes et dans les formes grammaticales, qu'on ne pourrait l'attendre du hasard.
Cette affinité est telle, en effet, qu'un philologue ne pourrait examiner ces trois langues sans croire qu'elles sont
sorties d'une source commune, qui peut-être n'existe plus. Il y a une raison semblable, mais qui n'est pas tout à
fait aussi victorieuse, pour supposer que le gothique et le celtique, bien qu'amalgamés avec un idiome très
différent, ont eu la même origine que le sanscrit; et l'on pourrait ajouter le persan à cette famille [...] » (W.
Jones, cité d'après B. Sergent, Les Indo-Européens, Payot, 1995).
Cette hypothèse de W. Jones suggère que les similitudes entre les langues doivent être
observées de façon minutieuse, au-delà d’une simple concordance lexicale : « on lui reconnaît
pourtant plus d'affinité avec ces deux langues, dans les racines des verbes et dans les formes grammaticales,
qu'on ne pourrait l'attendre du hasard ». C’est l’étiolement de cette rigueur méthodologique,
attentive aussi bien aux racines (le lexique) qu’aux morphèmes (la flexion, la dérivation) qui
a été souvent reproché aux « unificateurs » travaillant sur les macro-familles, comme M.
Ruhlen. Or, tout le programme de recherches de cette nouvelle discipline qui naît au XIXème
siècle, la grammaire comparée, est fondé sur une étude systématique des correspondances
grammaticales. Voici, à titre d’exemple, des similitudes dans les formes du verbe être
observées par l’un des premiers comparatistes de l’époque, F. Bopp :
Cependant, la plus grande contribution des comparatistes a été la théorie des lois phonétiques,
qui sera portée à ses ultimes conséquences par les élèves ou les épigones des premiers
comparatistes, avec le mouvement des « néogrammairiens », qui émergera dans le dernier
tiers du XIXème siècle (Brugmann, Leskien, Osthoff, etc.). Selon
cette théorie, lorsqu’un changement phonétique se produit au sein d’un paradigme dans une
langue, il tend à gagner l’ensemble des mots concernés. Par exemple, si une consonne dure
vélaire comme /k/ (ou occlusive vélaire sourde) se palatalise devant /i/, le changement
gagnera tous les mots de la langue qui contiennent la syllabe /ki/. On sait que
cette doctrine doit être relativisée, car il faut compter avec des mots d’emprunts ou des
formations analogiques, qui enfreignent cette règle. Par exemple, alors qu’en français
moderne, les occlusives vélaires latines /k, g/ se sont palatalisées devant toutes les voyelles
antérieures mais aussi devant /a/, donnant chat, chambre, jambe à partir de CATTUS,
CAMERA, GAMBA, etc., la crevette (ou « petite chèvre », en termes de motivation
sémantique) ne se dit pas chevrette (comme dans nombre de dialectes d’oïl occidentaux),
mais conserve l’occlusive vélaire sourde maintenue dans le dialecte normand, où les étymons
latins vus précédemment ont donné cat, cambre et gambe. Or, crevette dans le lexique
français est, de toute évidence, un emprunt au dialecte normand.
L’observation des lois phonétiques, qui restent un grand acquis du comparatisme, pourvu
qu’on ne les utilise pas de manière mécanique, permet de tirer des conclusions, en les
validant, sur la parenté des langues. La grammaire comparée a contribué à la naissance de la
linguistique historique dont la principale préoccupation est précisément l’histoire des langues,
qui suppose également le travail de comparaison entre les phénomènes observables dans les
langues anciennes et modernes et la reconstruction des protolangues. En
effet, l’idée sous- jacente à la généalogie des langues est que les langues, comme les humains,
connaissent des filiations : Elles ont des mères et des sœurs, pour utiliser une métaphore
généalogique. Le français a pour sœur, par exemple, la langue espagnole, pour mère le latin,
pour grand-mère une hypothétique langue italo-celtique, comme bisaïeule le proto-indo-
européen occidental (groupe centum), comme trisaïeule le proto-indo-européen à proprement
parler et ... si l’on suit J.H. Greenberg et M. Ruhlen, un ancêtre eurasiatique comme lointain
parent dont le souvenir se perd dans la nuit des temps, et pour lequel les ramifications
généalogiques deviennent incertaines. Si l’on opte pour une démarche minimaliste,
extrêmement prudente, on dira qu’au- delà du latin, langue-mère abondamment attestée sans
guère d’équivoque, il est dangereux de s’aventurer, d’autant plus que l’on peut difficilement
imaginer une stabilité phonétique et sémantique sur une période de plusieurs milliers
d’années. On conclura donc que les
protolangues, par définition reconstruites à partir d’attestations et d’indices les plus divers
(épigraphie, comparaison interdialectale, emprunts, onomastique, etc.), n’ont pas de valeur
historique, en tant qu’entités réelles, mais ont avant tout une valeur heuristique : ce sont des
construits qui aident le linguiste à comprendre les mécanismes de diversification des
systèmes linguistiques observables dans des espaces géographiques et temporels délimités par
un ensemble d’affinités structurales, rien de plus. Or, c’est déjà beaucoup, et à ce titre, le
comparatisme classique reste l’un des piliers de la linguistique moderne.
Les grandes familles de langues
La diversité des langues du monde se laisse difficilement réduire à un nombre limité de

familles. Cependant, si l’on laisse de côté les théories de macro-regroupement, on peut isoler
au moins une quinzaine de familles pour lesquelles un relatif consensus a été obtenu (et qui
sont loin de réunir toutes les langues du monde) :
 la famille indo-européenne
 la famille ouralienne
 la famille altaïque
 la famille dravidienne
 la famille kartvélienne
 la famille sino-tibétaine
 la famille austro-asiatique
 la famille eskimo-aléoute
 la famille tchouktche-kamtchadale
 la famille afro-asiatique (autrefois appelée chamito-sémitique)
 la famille niger-congo(-kordofanien)
 la famille nilo-saharienne
 la famille khoïsane.
Voyons à présent quelles sont les principales langues qui font partie de ces différentes
familles :
Ce classement réducteur, s’il a l’avantage d’être acceptable pour la majorité des linguistes, a
le défaut de laisser de côté un grand nombre de langues : langues des Amériques (plusieurs
dizaines de familles différentes pour les uns, trois seulement pour J.H. Greenberg.
L’amérinde, le na-déné et l’eskimo-aléoute), le basque, même le japonais et le coréen réputés
comme difficilement classables. Il laisse de côté également de nombreuses langues
austronésiennes, parfois réunies avec le sino-tibétain et l’austro-asiatique dans une macro-
famille.
On peut remarquer également que les familles sont de taille très inégale : d’une seule langue
(c’est le cas avec les isolats comme la langue burushaski au Pakistan), à plusieurs centaines
de langues (comme dans la grande famille austronésienne).
En fonction de documents disponibles, l’existence ou non de l’écriture, ces classements sont
plus sûrs pour certaines familles, plus discutables pour d’autres. Il arrive également que la
génétique soit appelée à la rescousse pour infirmer ou confirmer les résultats des classements
linguistiques. Il semblerait que la génétique soit en mesure de confirmer la théorie de
l’existence d’une macro-famille eurasiatique (dont l’existence est contestée par beaucoup de
linguistiques par ailleurs), alors que dans d’autres cas, elle donne des résultats pour le moins
étonnants : le tchétchène et l’ingouche dans le Caucase sont deux langues très proches, or, les
deux populations sont génétiquement très différentes ; les Arméniens et les Azéris,
génétiquement très semblables, parlent des langues appartenant à deux familles différentes
(famille indo-européenne et famille altaïque). Une fois
de plus, même si les recherches dans ce domaine sont aussi intéressantes que passionnantes,
on voit que les conclusions sur les corrélations génétiques et linguistiques doivent être prises
avec la plus grande prudence, car celles-ci peuvent s’avérer vraies dans certains cas, fausses
dans d’autres.
L’indo-européen
La famille indo-européenne peut encore être appelée la famille indo-hittite. Ce terme a été
conçu pour tenir compte d'un groupe dont la découverte récente, au début du XXème siècle, a
permis de confirmer ou d'infirmer en fait, de vérifier des hypothèses sur le prototype
linguistique que les fondateurs de la grammaire comparée au début du XIXème siècle avaient
baptisé l’indo-européen. C'est donc un terme de linguiste très spécialisé. Nous nous
contenterons du terme plus familier d’indo-européen.
Pour certains chercheurs, c’est la seule famille linguistique qui ne pose pas de problèmes
généalogiques, pour au moins deux raisons: les documents anciens sont disponibles
(évidemment, pas pour une hypothétique langue-mère, on la situe à une époque, 4000 ans
environ avant J-C., et qui ne connait pas l’écriture), le territoire géographique est facilement
délimitable, mais le foyer d’origine a été très discuté.
L'extension géographique des langues et des groupes de langues de la famille indo-
européenne déborde très largement le cadre de l'Europe et de l'Inde, comme le montre le
groupe persan au Moyen-Orient, et le tokharien du Turkestan chinois, en Asie.
L'extension des langues indo-européennes couvre en effet l’Europe péri-atlantique, centrale et
orientale, le nord de la Méditerranée et les Balkans, le Caucase sud (arménien) pour la
branche occidentale, le Moyen- Orient (Iran, Afghanistan, Pakistan et une grande partie du
bassin indien) pour la branche orientale, comme le montre la carte suivante (sur laquelle on
remarquera l’absence de l’arménien, des anciennes langues anatoliennes comme le hittite et
du tokharien, dans les groupes énumérés, mais qui a l’avantage de montrer, de façon claire,
l’étendue du territoire indo- européen) :
Parmi les langues indo-européennes figure aussi une grande « voyageuse » : le romani des
Gitans d'Europe, avec de nombreux dialectes, étant donné la dispersion et la mobilité des
locuteurs.
La famille indo-européenne couvre la plus grande partie du vieux continent. Deux exceptions
importantes sont à souligner dans le paysage linguistique européen : les langues finno-
ougriennes (langues fenniques au nord de l’Europe, le hongrois en Europe Centrale), et le
basque ou euskara en tant qu’isolat sans parenté proche avec aucune autre langue connue
(malgré les tentatives discutables de rapprochement avec la famille caucasienne ou encore
ouralienne). À cela s’ajoutent certaines langues minoritaires, comme le gagaouze en
Moldavie, le karaïm en Lituanie ou le turc, si l’on considère que la Turquie fait partie de
l’Europe géographiquement parlant.
On illustre généralement la classification des langues indo-européennes sous forme d’un
arbre. Présenter les langues du monde sous forme d’arborescence relève de la méthode
traditionnelle (le Stammbaum d’August Schleicher). Cette représentation, évolutionniste, a
pour principal défaut de ne pas mettre suffisamment l’accent sur le contact et sur les
changements typologiques forts, qui causent un décalage entre les filiations et les types.
L’exemple le plus connu est celui de l’anglais et de sa transformation lors de la période
anglo-normande, période durant laquelle une langue germanique qui ressemblait à bien des
égards aux dialectes bas- allemands de l’époque a considérablement rapproché son lexique et
sa grammaire d’une langue romane émergente, le français, à travers la variété anglo-
normande. Il en va de même dans le monde roman, où le roumain a vu son fond lexical
s’enrichir de façon considérable avec les emprunts slaves.
Le Stammbaum donne donc un aperçu de la filiation, en dépit des modulations typologiques
ultérieures. La représentation sous forme d’arbre généalogique cependant pose problème, car
dans la réalité, une langue ne « naît » pas d'une autre ou d'un dialecte. Une langue n’émerge
pas non plus seulement en raison de facteurs de diffusion et d'isolement des populations qui
parlent une langue d'origine, comme le suggèrent les branches orphelines. Bien au contraire,
l’un des principaux facteurs de changement est le contact linguistique, basé sur les échanges
ou phénomènes d’interdépendances entre communautés linguistiques. Les hypothétiques
Indo-Européens ne sont pas arrivés dans une Europe vide, et encore moins dans un Moyen-
Orient désert : le Proche-Orient est en effet l’une des plus anciennes régions de peuplement
de l'humanité et, en particulier, de développement de l’agriculture.
Voici un arbre généalogique possible des langues indo-européennes :
Cette disposition de l'arbre est très ethnocentrique : le groupe indo-persan réunit plus de dix
langues modernes du Moyen-Orient et de l'Inde nord et centrale pour le seul groupe indo-
arien : romani d'Europe, kashmiri, penjabi/punjabi, hindi, nepali, assamese, bengali, oriya,
gujrati, marathi, cinghalais.
Mais il n'y a pas de bons arbres : les distances linguistiques sont variables entre les familles et
les langues, et il faut toujours compter avec de nombreux isolats (grec, albanais, arménien),
eux-mêmes discutables car certaines langues isolées dans le phylum peuvent avoir des
réseaux dialectaux anciens ou modernes très diversifiés, comme le montre la branche du grec
dans l’arbre ci-dessous. En outre, de nombreuses langues ont disparu (osque, ombrien de la
famille italique), ainsi que des groupes entiers, anciens et fortement différenciés, comme le
groupe anatolien (palaique, hittite, luvien, lydien, carien, lycien).
Voici à présent, un tableau réunissant les principales langues indo-européennes :

Qu’en est-il d’une protolangue indo-européenne ? Il n'y a sans doute jamais eu de
protolangue indo-européenne, du moins en tant que norme homogène attribuable à une
communauté historique, ni même en tant que langue unifiée. Partout où les vestiges
archéologiques attestent la présence de la culture des « kourganes » (tumulus funéraires),
typique – selon l’une des théories en vigueur – des Indo-Européens, et de leurs descendants
culturels, ces populations viennent se superposer à d'autres.
Notamment en Europe centrale et danubienne où aurait existé une civilisation prestigieuse ce
qui implique un certain prestige des langues et des cultures de ces occupants indigènes, de ce
que l'archéologue Marija Gimbutas appelle la Vieille Europe ou Alteuropa.
Or, c'est bien sur des questions de prestige et de fonction sociale des langues en contact que
se jouent les phénomènes d'interférence entre langues, qui participent aux conditions du
changement linguistique.
La diversité des langues indo- européennes anciennes et modernes laisse à penser qu'elles
sont entrées en contact avec des langues pré-indoeuropéennes qui ont laissé des traces. Elles
sont également entrées en contact entre elles, comme le montrent à date très récente l'exemple
du latin et du celtique continental (ibéro-celtique), puis du gallo-roman avec le germanique
(franc), ou encore plus proche, le dialecte d’oïl anglo-normand avec le vieil anglais, comme
nous l’avons vu plus haut. On peut
donc difficilement imaginer un proto indo-européen, et l’on doit se contenter d’imaginer
plutôt des variétés dialectalisées dans des habitats déjà diversifiés entre trois tropismes que
sont le bassin de l’Indus à l’est, la péninsule anatolienne au centre, les Balkans et l’Europe
atlantique et méditerranéenne à l’ouest. Une
deuxième question touche à l’origine des Indo-Européens. De multiples hypothèses
s’affrontent sur le foyer d’origine : Kazakhstan, Ukraine, Pologne, Anatolie (théorie de C.
Renfrew), Caucase (théorie de T. Gamkrelidze et V. Ivanov).
L’une des thèses dominantes de nos jours repose sur les travaux archéologiques de Marija
Gimbutas portant sur l'expansion de ce qu’on appelle la civilisation des kourganes,
mentionnée précédemment.
On pense que cette civilisation est celle des Indo-Européens, qui aurait connu un double foyer
d'expansion : l'actuelle Ukraine, au nord de la mer Noire, qui serait le point de départ de
l'expansion vers le sud et l'est, et les steppes de la Russie méridionale, par la migration de
guerriers à cheval. Si l’on peut décrire avec beaucoup de précision les langues indo-
européennes, dans leurs aspects anciens et modernes, on ne peut qu’accumuler les conjectures
sur le ou les peuple(s) indo-européen(s). L’indo-européen est un concept essentiellement
linguistique, il faut par conséquent rester extrêmement prudent lorsqu’on reconstitue une
civilisation à partir d’un concept linguistique.
En ce qui concerne les caractéristiques des langues indo-européennes aujourd’hui, M.

Malherbe (Le langage de l’humanité, Paris, Seghers, 1983), distingue les traits suivants :
 Tendance flexionnelle : les mots à forme fixe (adverbes, prépositions...) sont moins
nombreux que ceux qui subissent une flexion (noms, pronoms, verbes),
 Opacité des thèmes flexionnels : ces flexions, telles que les marques du pluriel, la
conjugaison du verbe, etc., peuvent altérer le radical qui reste ainsi peu apparent,
 Polyvalence des désinences : les désinences de ces flexions peuvent assurer
simultanément plusieurs fonctions grammaticales,
 Sites flexionnels terminaux : ces flexions apparaissent toujours à la fin du mot, jamais
au début,
 Prédominance de l’accord sujet : le verbe ne se conjugue qu'en fonction du sujet, les
compléments n'interviennent pas dans la conjugaison,
 Ordre des mots relativement libre : les mots ont une certaine autonomie dans la
phrase, l'ordre des mots n'est pas rigoureusement obligatoire, ni significatif,
 Interrogation prosodique : il n'y a pas systématiquement de particule interrogative,
l'interrogation est marquée par l'ordre des mots,
 Productivité de la dérivation : la formation des mots à partir d'un radical est très riche
et diversifiée, etc.
Il s’agit bien sûr d’une synthèse très générale, qui n’a de valeur de vérité que très relative.
Rien n’empêche de penser que ces tendances étaient manifestes ou latentes dans des états
anciens de ce qui a pu être le proto-indo-européen, mais il faut là encore rester prudent. Si
l’on devait déduire la typologie grammaticale et lexicale du latin classique à partir des
tendances actuelles de langues romanes, l’image du proto-roman alors induit des faits de
langues modernes serait sujet à caution : il n’est pas jusqu’au système casuel du daco-roman
(dialectes roumains) qui n’ait été entièrement refait, sur des bases très différentes de ce que
fut la flexion casuelle du latin classique.
Nous ne savons pas vraiment si les Indo-Européens ont existé, ni où ils ont habité
exactement, ni même quelle langue ils ont parlé.
En revanche, nous savons que les langues que l’on classe dans cette famille ont bien une
origine commune, et que les diverses théories élaborées durant ces deux derniers siècles sur
ce que pourrait être l’indo-européen, comptent parmi les modèles les plus cohérents de
l’analyse grammaticale moderne.

Leçon 6

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Leçon 6

Transféré par

Droits d'auteur :

Formats disponibles

Leçon 6 : Les familles de langues

 L’histoire du classement généalogique

Dans un deuxième temps, nous aborderons la famille indo-européenne, du point de vue

Les premiers classements

Les grandes familles de langues

La diversité des langues du monde se laisse difficilement réduire à un nombre limité de

Voici un arbre généalogique possible des langues indo-européennes :

Voici à présent, un tableau réunissant les principales langues indo-européennes :

En ce qui concerne les caractéristiques des langues indo-européennes aujourd’hui, M.

Vous aimerez peut-être aussi