Vous êtes sur la page 1sur 7

INTRODUCTION

La linguistique est l’étude du langage articulé selon [ CITATION DUB12 \l 1036 ]. Cette
étude s’étend à divers domaines ou niveaux d’analyses (phonologie, morphologie syntaxe,
sémantique ou lexicographique) et sur divers plan (synchronie/diachronie). La linguistique
est une science empirique, qui procède par l’observation des faits recueillis que le linguiste
décrit après transcription, afin de comprendre le fonctionnement des langues. Pour ce faire, le
descripteur doit s’armer d’outils différents qui lui permettront de mesurer les occurrences des
sons ou des mots qui constituent un corpus donné. L’un de ces outils, est la lexicostatistique.

De ce fait, comment fonctionne cette méthode ? Quelles sont les différentes approches
dans lesquelles on peut l’utiliser ?

Ce travail entre dans le cadre de l’unité d’enseignement outils de transcription,


d’analyse et de présentation des données informatique, donnée au département de sciences du
langage, de l’information et de la communication par M. Thierry AFANE OTSAGA. Il sera
question, après un bref aperçu historique, d’expliciter la démarche heuristique qui rend
effective cette méthode et, nous donnerons divers approche dans lesquelles elle peut être
utilisée.
I. APERCU HISTORIQUE DE L’EVOLUTION DE LA METHODE.

La lexicostatistique émergent, au 19e s. grâce à la Société de Géographie qui, dans


son assemblée générale du 26 mars 1830, propose une médaille d’or de mille francs pour tout
travail sur l’origine des « nègres asiatiques ». Elle a été développée par Morris Swadesh dans
une série d'articles dans les années 1950, sur la base d'idées antérieures. La première
utilisation connue du concept fut celle de Dumont d'Urville en 1834 qui compara différentes
langues «océaniques» et proposa une méthode de calcul d'un coefficient de relation. Hymes
(1960) et Embleton (1986) examinent tous deux l'histoire de la lexicostatistique. L'on trouve
de bonnes descriptions de ses principes et de sa méthodologie, par exemple dans
Gudschinsky (1966) ou Penchoen (1968).

II. METHODOLOGIE

Le but est de générer une liste de significations universellement utilisées (main,


bouche, ciel, route, etc.). Les mots sont ensuite collectés à partir de ces créneaux de
signification pour chaque langue considérée. Swadesh a réduit un plus grand nombre de
significations à 200 à l'origine. Il a par la suite constaté qu'il était nécessaire de le réduire
davantage, mais qu'il pouvait inclure certaines significations qui ne figuraient pas dans sa
liste d'origine, en donnant sa liste ultérieure de 100 éléments. La liste Swadesh donne au total
207 significations dans un certain nombre de langues. La méthode consiste à appliquer des
taux de ressemblance différenciés ou "pondérés" selon que nous jugeons que les
ressemblances (ou les différences) sont plus ou moins prononcées entre les formes
comparées. En d'autres termes, pour calculer la proximité de deux langues ou de deux textes,
il est attribué plus de points de ressemblance lorsque deux formes comparées sont identiques
ou très proches l'une de l'autre que lorsqu'elles ne se ressemblent que sur de rares points. La
lexicostatistique procède par calcul des pourcentages. Ce calcul est lié à la proportion de
significations pour une paire de langues particulière qui sont apparentées, c'est-à-dire par
rapport au total sans indétermination. Cette valeur est entrée dans un tableau N x N de
distances, où N est le nombre de langues comparées. Une fois rempli, ce tableau est à moitié
rempli sous forme triangulaire. Plus la proportion de connaissance est élevée, plus les langues
sont proches.
III. APPROCHE LEXICOSTATISTIQUE

L’approche est l’ensemble des utilisations possibles de la méthode dans les recherches
scientifiques. Pour ce qui concerne la lexicostatistique, son domaine d’application est vaste. Il
sera la stylistique, si l’on cherche à apprécier la richesse du vocabulaire d’un écrivain, la
philologie, si l’on tente de dater des textes les uns par rapport aux autres, la pédagogie, si l’on
essaie de définir un vocabulaire fondamental d’une langue, enfin la linguistique générale, si
l’on cherche à déterminer si la fréquence des mots et leur rang fréquentiel obéissent à des lois
générale.

Isidore Dyen est l'un des principaux représentants de l'application lexicostatistique. Il


a utilisé la lexicostatistique pour classer les langues austronésiennes ainsi que les langues
indo-européennes. Des études ont également été menées sur les langues amérindiennes et
africaines. Pour ce qui concerne les langues africaines, la méthode lexicostatistique a permis
de comprendre, de classer les langues. La méthode se situe sur un plan synchronique mais,
nécessite nécessairement une comparaison développée de tout le corpus avec des
reconstructions historiques. Cela entraine que l'on peut accorder des coefficients nuls à des
paires de mots qui remonteraient pourtant à un même étymon ou, inversement, des
coefficients positifs à des mots non-apparentés. Les linguistes de Tervuren (Bastin et al) ont
proposé une classification des langues bantu sur la base du calcul lexicostatistique. Cette
classification a permis de mieux voir le degré de ressemblance entre certains parlers en vue
de proposer de meilleurs embranchements entre les langues.

IV. EVOLUTION DE LA METHODE ET CRITIQUE.

La méthode a pris une nouvelle forme en fonction de ces usages. Ainsi, lorsque l’on
s’intéresse à la datation exacte, des langues communes qui auraient existé, et l’on voudrait
établir l’époque à laquelle deux ou plusieurs langues se sont séparées d’une langue d’origine
commune, elle est appelée glottochronologie. Elle devient la dialectométrie lorsqu’il s’agit de
mesurer la distance entre les parlers de chaque groupe à travers une comparaison
systématique, ayant pour but l’élaboration d’une matrice de similarité regroupant des
pourcentages pondérés dont on peut assumer qu’ils sont représentatifs du degré de
ressemblance entre les parlers concernés. Une telle étude n’est de toute évidence pas une fin
en soi. Elle s’insère dans le cadre d’une analyse plus vaste, dépassant largement le simple
plan lexical.

La méthode de calcul lexicostatistique n’est pas sans faille. En effet, a fait l'objet de
nombreuses critiques, portant le plus souvent sur la validité de ses postulats de départ ,
comme par exemple l'affirmation de la possibilité d'établir un "vocabulaire de base" non
culturel, ou celle de la constance du taux de changement lexical. Ces critiques ont abouti à
faire reconnaître à la méthode un degré de fiabilité restreint, mais réel. En fonction de cela,
ses résultats en matière de sous classification sont assez largement acceptés, au moins comme
première approximation de la généalogie des familles de langues dans lesquelles la
comparaison systématique est peu avancée, voire à peine commencée, et en tout cas
insuffisamment pour établir des sous classifications. Les datations absolues qui
accompagnent les généalogies, fournies par la glottochronologie, discipline annexe qui repose
sur la même base théorique, plus l'affirmation que le taux de renouvellement du vocabulaire
de base est universel, sont plus largement mises en doute.
CONCLUSION
La recherche que nous avons menée, par l’entremise de ce travail nous a permis de
connaitre une méthode utilisée dans la science : la lexicostatistique. Ces premières utilisations
remontent au XIXe siècle mais, elle a connu un essor particulier grâce à Swadesh en 1950.

Elle est une méthode de calcul des occurrences lexicales ou sonores dans un texte ou
un ensemble de textes et permet de mesurer le degré de rapprochement entre des langues
apparentée ou non.

Elle a connu divers évolution en fonction du domaine dans lequel elle est utilisée.
Passant de la glottochronologie lorsque l’on cherche à connaitre le moment de séparation
entre des langues ; mais, elle permet de mesurer la distance entre deux parlers proche par la
dialectométrie.

Cependant, comme toutes méthodes, elle a des forces mais aussi des faiblesses. Au
nombre de ces dernières, il y a le fait que d’autres chercheurs trouvent ces conclusions trop
restrictives ou trop large. L’échantillonnage utilisé pour faire les calculs est souvent jugé non
représentatif du vocabulaire de base de certaines populations.

Ne nous vantons pas de l’exhaustivité, mais ce travail est une approche qui pourrait
être remise en cause par le truchement d’information plus approfondie sur le domaine que
nous avons traités.
BIBLIOGRAPHIE
BANCEL, Pierre. 1988. «Réflexions sur la méthode de calcul en lexicostatistique.»
Pholia, 17-26.

DUBOIS, Jean, Mathée GIACOMO, Louis GUESPIN, Christiane MARCELLESI,


Jean-Baptiste Marcellesi, et Pierre MEVEL. 2012. «Le dictionnaire de Linguistique et des
sciences du langage.» Paris: Larousse.

GREGOIRE, Claire, et HALLEUX Bernard de. 1994. «Etude lexicostatistique de


quarante-trois langues et dialectes Mandé.» Africana linguistica, 53-70.
TABLE DES MATIERES
INTRODUCTION.................................................................................................................................1
I. APERCU HISTORIQUE DE L’EVOLUTION DE LA METHODE........................................2
II. METHODOLOGIE...................................................................................................................2
III. APPROCHE LEXICOSTATISTIQUE..................................................................................3
IV. EVOLUTION DE LA METHODE ET CRITIQUE..............................................................3
CONCLUSION.....................................................................................................................................5
BIBLIOGRAPHIE................................................................................................................................6
TABLE DES MATIERES.....................................................................................................................7

Vous aimerez peut-être aussi