Académique Documents
Professionnel Documents
Culture Documents
10.2978/CSLL.corpusensciencesdulangage
O PEN ACCES S
*Noudjoud Berghout
Université d’Alger 2
noudjuod2dz@yahoo.fr
1
Université Princesse Noura bint Abdulrahmane
2
Université Abul Kacem Saad Allah
Le corpus en sciences du langage 79
Résumé Cet article est une lecture interdisciplinaire d’une notion clé en sciences
du langage; à savoir la notion de corpus en raison des différentes significations
épistémologiques qu’elle recouvre. Notre question de départ se résume comme suit:
quels sont les critères de sélection des corpus dans les sciences du langage? Pour
répondre à nos questions, nous tenterons de présenter les caractéristiques du corpus
dans les disciplines pertinentes des sciences du langage. Il s’agit donc de linguistique
structurale, d’analyse du discours, de linguistique de corpus et de sociolinguistique.
Nos lectures et nos analyses nous ont conduites à déduire que l’objet de la recherche
est corrélé au choix du corpus. Deux notions sont également apparues: celle d’un
corpus fermé caractérisant la linguistique de bureau de Saussure et celle d’un corpus
ouvert caractérisant la linguistique de terrain.
1. Introduction
Dans le cadre de notre contribution, nous voulons vérifier comment le statut des corpus
a évolué depuis le structuralisme jusqu’à nos jours par l’émergence de plusieurs champs
disciplinaires qui se sont autonomisés. En réponse à des questionnements incontournables,
nous essayerons d’apporter quelques éclaircissements épistémologiques dans le cadre
du présent article. À partir de là, des questions s’imposent: Quels sont les nouveaux
critères pris en considération par les linguistes postsaussuriens pour définir la notion de
corpus? Quelles formes le corpus prend-il en sciences du langage?
Désormais CLG.
1
80 W. Bedjaoui
Saussure a mis en place une linguistique synchronique, c’est-à-dire une science qui
étudie la langue à un moment donné, par opposition à la linguistique diachronique, qui
prédominait à l’époque, et observait l’évolution historique de la langue. L’originalité
de Saussure est de faire de la langue un objet scientifique. Selon lui, la langue est«à
la fois un produit social de la faculté de langage et un ensemble de conventions
nécessaires» (CLG: 23)2. Il l’oppose à la parole, qui est l’emploi de ce produit
social par les sujets parlants, en d’autres termes «un acte individuel de volonté et
d’intelligence» (CLG: 25).
De plus, Saussure considère la langue comme une structure qui obéit à un système;
d’où le nom de la discipline dans laquelle il s’inscrit: la linguistique structurale.
C’est Saussure aussi qui est le précurseur de la théorie du signe linguistique qui
s’inscrit dans la tradition logico-grammaticale. Deux élémentsconstituent le signe:
un signifié (le concept abstrait, le sens) et un signifiant (l’«image acoustique», la face
matérielle). Le signe linguistique est arbitraire, dans le sens où aucun rapport interne
entre signifié et signifiant existe. Selon Saussure.
Tout le travail théorique mené par Saussure pour délimiter les caractéristiques
intrinsèques et extrinsèques des différentes dichotomies qu’il a pu analyser a constitué
les jalons du corpus en linguistique structurale. Comme nous l’avons signalé plus
haut, la notion de corpus n’a pas été citée ni définie dans l’ouvrage de Saussure
explicitement. Mais, il est à préciser que toutes les définitions saussuriennes ont été
déterminées sur la base d’un corpus, celui des Anagrammes qu’il avait analysé et
décrit. D’où les premières prémices d’une linguistique textuelle.
En plus, la découverte des éléments et l’étude de leur fonctionnement dans le
système ne font qu’un, car pour établir les éléments, il faut percevoir les relations
qu’ils entretiennent entre eux. Ainsi, on ne saurait en français isoler le -ai- de
l’imparfait (il chant-ai-t) qu’en établissant, à l’intérieur du système temporel, qu’il
se distingue du présent (il chante), du futur (il chante-r-a), et du conditionnel (il
chanter-ai-t). Ces exemples, à priori simplistes, peuvent constituer un micro-corpus
à une étude linguistique structurale paradigmatique sur les temps verbaux et leur
structure. La linguistique structurale est donc une linguistique de la norme.
Cette linguistique de la norme a fait l’objet de critique de nombreux linguistes
qui ont remis en question les notions de «homogénéité» et de «représentativité»
préconisées par Saussure en matière de corpus.
Les discours des structuralistes semblent tous convergés sur les trois traits suivants
«représentativité, exhaustivité et homogénéité» (Greimas: 1966) des corpus qu’ils
analysaient. En fait, «la linguistique structurale travaillait à partir d’unusage
normé, alors que les autres disciplines à l’instar de la sociolinguistique et de la
linguistique de corpus prennent en comptedesusages concurrents» (Boyer, 2008:4),
contextualisés et situationnels, en d’autres termes l’accent est mis sur l’universel des
langues et les singularités des emplois.
Force est de noter que plusieurs linguistes à l’instar de Jakobson connu par son
schéma de communication considérait le Cours de Linguistique Générale tel que
2
Un système de signes commun à l’ensemble des membres d’une communauté.
Le corpus en sciences du langage 81
présenté par les disciples de Saussure comme apocryphe. Ce dernier avait été parmi
les premiers à travailler sur des corpus réduits à travers son interprétation et sa
transcription phonétique du poème «Chats» de Baudelaire (1977). La distinction
entre corpus écrit et oral commençait à voir le jour à cette époque, mais ne semblait
pas faire l’objet de théorisation.
Après avoir mis en relief la théorie qui a tenté de cerner le corpus sans le
mentionner ni le définir, nous allons voir comment le corpus est appréhendé dans les
prolongements théoriques de cette discipline «mère».
3
Il existe des sous-disciplines auxquelles nous ne nous sommes pas attardées, puisque notre objectif est
d’offrir une vue globale de la question du corpus en sciences du langage.
82 W. Bedjaoui
4
Corpus linguistics has been developed to extract the linguistic knowledge needed for language teaching
from a corpus, a corpus being a principled collection of real language data. Part of applied linguistics, it
made little claim to its own theoretical framework. Nevertheless, it has provided a new way to look at
language. Corpus linguistics situates meaning in the discourse, in the interaction between people, rather
than in the minds of speakers. Only words embedded in their contexts have meaning, and what they
mean is determined by their contextual collocates. Making sense of a text segment means exploring the
intertextual links connecting it to the diachronic dimension of the discourse. Hermeneutics thus is the
theoretical framework of a corpus linguistics bridging the gap between language and society
(WolfgangTeubert, 2016).
Le corpus en sciences du langage 83
5
La diglossie est un phénomène sociolinguistique de hiérarchisation des langues en présence dans une
société donnée. L’arabe standard est par exemple la forme de toutes les variétés de l’arabe dans le monde
arabe.
Le corpus en sciences du langage 85
4. Conclusion
Nous avons tenté de mettre en exergue la notion du corpus relatif aux sciences
du langage avec les principales disciplines qui étudient le langage comme objet
de recherche. À partir de notre analyse, nous avons pu définir le corpus comme
un construit hétérogène et que sa construction fait partie intégrante du prisme
théorique à travers lequel le chercheur entend appréhender le réel. D’un point de
vue méthodologique, nous avons défini le corpus dans le cadre de deux disciplines
différentes, mais complémentaires (linguistique générale et sociolinguistique).
Notre analyse a démontré que le corpus répond à divers modes de recueils
de données conformément à des critères préétablis du domaine de recherche.
En nous référant à toutes ces définitions que nous venons de présenter au sein
des sciences du langage, depuis pratiquement plus d’un quart de siècle, sur la
notion decorpus, nous avons pu constater qu’une évolution relatif au paradigme
épistémologique dans lequel est traité le corpus. Selon les objectifs de la recherche
et les exigences de la discipline, le corpus se construit en obéissant à certaines
règles telles que l’homogénéité ou l’hétérogénéité, clôture ou ouverture. La notion
d’ouverture de corpus trouve en effet ses échos dans d’autres disciplines qui ont
intégré de nouveaux paramètres répondants aux exigences de l’apparition de corpus
non traditionnels comme les corpus numériques. Il s’agit actuellement d’éclatement
de corpus. Ce qui ouvre des perspectives de recherches interdisciplinaires.
Au terme de cette lecture relative au statut du corpus dans quelques disciplines
des sciences du langage, il est indéniable de constater l’apport de chaque discipline
en matière d’appréhension d’un seul et même corpus. Un texte journalistique, en
guise d’exemple, peut faire l’objet de la linguistique structurale dans la mesure où
il s’attarde sur la structure des phrases sur le plan paradigmatique et syntagmatique.
En linguistique de corpus, le phénomène linguistique est appréhendé en diachronie
afin d’étudier les différentes constructions phrastiques. En analyse du discours,
les différentes approches (énonciative, pragmatique et textuelle) offre un éventail
d’approches analytiques. En sociolinguistique, les phénomènes de contacts des
langues sont à traiter sous la perspective des représentations et des pratiques
langagières. La présentation de ces exemples ne prétend aucunement l’exhaustivité,
mais tente d’esquisser les grandes lignes du corpus en sciences du langage.
5. Bibliographie
Bedjaoui, W., & Berghout, N. (2016). «Construire son corpus en sciences du langage: de la linguistique
structurale à la sociolinguistique», Colloque international: La linguistique, 100 ans après De Saussure,
Bilans et perspectives. Alger, Université d’Alger 2.
86 W. Bedjaoui