Vous êtes sur la page 1sur 14

SHS Web of Conferences 1 (2012)

DOI 10.1051/shsconf/20120100294
aux auteurs, publi par EDP Sciences, 2012

Congrs Mondial de Linguistique Franaise CMLF 2012


SHS Web of Conferences

Les Outils Informatiques au Service de


la Terminologie Saussurienne
Ruimy, Nilda, Piccini, Silvia & Giovannetti, Emiliano
Istituto di Linguistica Computazionale Antonio Zampolli
Consiglio Nazionale delle Ricerche
Pise - Italie
{nilda.ruimy silvia.piccini et emiliano.giovannetti}@ilc.cnr.it

Introduction

Ferdinand de Saussure (1857-1913) est universellement reconnu comme le pre fondateur de la


linguistique moderne. Sa pense et son uvre ont eu un impact considrable dans le domaine des sciences
humaines et sociales et en particulier en linguistique et en philosophie du langage. Un trait remarquable
de la personnalit de cet minent savant est en effet lclectisme de sa curiosit intellectuelle. La
multiplicit de ses intrts la amen conduire dimportantes recherches dans de nombreux et divers
champs du savoir. Nanmoins, Ferdinand de Saussure na jamais publi ses crits sur des thmes de
linguistique gnrale, et bien que son uvre ait t largement diffuse travers le monde, sa pense a t
en grande partie reconstruite et interprte par ses tudiants et ses disciples. Louvrage qui la rendu
clbre, le Cours de Linguistique Gnrale, fut en effet rdig partir de notes prises par certains de ses
tudiants durant les trois cours de linguistique gnrale que Saussure tint lUniversit de Genve, de
1907 1911. Le livre fut publi titre posthume, en 1916, par deux de ses disciples et collgues, Charles
Bally et Albert Sechehaye qui laborrent ces notes, non sans y ajouter des commentaires personnels
pouvant parfois dtourner le lecteur de lenseignement saussurien. Ces interventions ditoriales de Bally
et Sechehaye furent mises en vidence dans louvrage exgtique de Robert Godel Les sources
manuscrites (1957), ainsi que dans celui de Rudolf Engler Cours de linguistique gnrale (1968-1974)
qui mit en parallle le CLG, les notes des tudiants et les crits originaux de Saussure.
En ralit, la pense saussurienne est beaucoup plus subtile et moins catgorique quelle ne parat dans le
Cours: dune part, Saussure confesse souvent ses doutes sur des points cruciaux et fait de ces doutes
mmes son heuristique; dautre part, il lutte contre labsence dune rflexion pistmologique de la
linguistique de son poque et propose parfois mme une relecture des concepts fondamentaux. Ces deux
ples apparaissent clairement dans les notes et les crits autographes du matre genevois. Cest pourquoi,
afin de saisir pleinement la pense de Saussure, il est ncessaire de fonder sa recherche sur des crits
authentiques.
Concernant ces crits, Charles Bally et Lopold Gautier publirent en 1922 le Recueil des publications
scientifiques de Ferdinand de Saussure contenant des manuscrits dont la version finale avait t valide
par lauteur lui-mme. En 2002, sous le titre de crits de linguistique gnrale, Rudolf Engler et Simon
Bouquet publirent des documents autographes dcouverts en 1996 dans lorangerie de la maison
familiale de Saussure, Genve. Parmi eux figurait une premire rdaction manuscrite, intitule De
l'essence double du langage, du livre sur la linguistique gnrale auquel le linguiste genevois avait
souvent fait allusion, mais qui semblait dfinitivement perdue.

Article en accs libre plac sous licence Creative Commons Attribution 2.0 (http://creativecommons.org/licenses/by/2.0)

1043

Congrs Mondial de Linguistique Franaise CMLF 2012


SHS Web of Conferences

SHS Web of Conferences 1 (2012)


DOI 10.1051/shsconf/20120100294
aux auteurs, publi par EDP Sciences, 2012

Bien que fragmentaires, les crits authentiques de Saussure revtent une importance fondamentale car ils
rvlent la complexit du systme philosophique et smiologique labor par leur auteur. Ils mettent
galement en lumire lattention toute particulire que Saussure accorde la terminologie dont il dplore
le manque de rigueur dans le domaine linguistique, son poque. Lui-mme utilise souvent un
vocabulaire trs particulier afin dexprimer des ides et des thses qui ont eu une porte rvolutionnaire
dans le domaine de la linguistique. Il forge des nologismes ou confre un sens nouveau des mots
existants, il emploie quelques termes de faon phmre, change la dnotation de certains concepts au fil
du temps, crant ainsi une terminologie qui lui est propre et qui, de nos jours encore, caractrise fortement
sa pense et la contribution fondamentale quil a apporte la linguistique moderne.
La terminologie de Saussure a fait l'objet de plusieurs tudes. La documentation la plus complte en la
matire remonte cependant 1968. Il s'agit d'une publication de 57 pages intitule Lexique de la
terminologie saussurienne, rdige par Rudolf Engler. Cet opuscule fournit les dfinitions de 441 termes,
assorties de citations mais aussi de commentaires qui, selon Cristina Vallini (2006) pourraient fourvoyer
le lecteur. Prs d'un demi-sicle plus tard, et la lumire des manuscrits de lorangerie, il semble donc
opportun d'actualiser l'tude de la terminologie saussurienne.
Le travail que nous nous proposons dillustrer dans cet article sinscrit dans le cadre dun Projet de
Recherche dIntrt National (PRIN) financ par le gouvernement italien et dirig par le Professeur
Daniele Gambarara. Ce projet, intitul Per un'edizione digitale dei manoscritti di Ferdinand de
Saussure 1, a pour objectif la cration dun prototype ddition numrique des textes de F. de Saussure,
ralis partir dune slection de ses manuscrits. A cet effet, chaque manuscrit est numris, class et
dot dun lien hypertextuel qui renvoie sa transcription ainsi qu sa traduction italienne. Un systme de
gestion de textes permet de consulter, dannoter et daccomplir nombre dtudes philologiques et critiques
sur le corpus de documents numriss. Les concordances par forme et par lemme produites pour
lensemble des textes fournissent, entre autres, une slection de nouveaux termes spcifiques dont la
smantique est dcrite dans un thsaurus-lexique.

Un nouveau thsaurus

Un des aspects novateurs de ce projet consiste prcisment dans la cration du premier thsaurus-lexique
lectronique de la terminologie linguistique saussurienne. Lemploi du terme thsaurus-lexique
sexplique par le fait que, comme nous le verrons, la base de connaissances en cours de ralisation offre
infiniment plus dinformations quun thsaurus traditionnel. La population de ce lexique est constitue
par une nomenclature mise jour, comprenant tous les termes proposs par Godel (1957) et Engler (1968)
ainsi quun ensemble de mots-cls extraits des crits de linguistique gnrale. La nouvelle terminologie
extraite des manuscrits actuellement ltude y sera galement intgre. travers ce lexique, nous nous
proposons de fournir une reprsentation structure de la terminologie saussurienne, de dfinir le contenu
smantique de chacun des termes ainsi que la nature et limportance des relations qui les unissent.
De nos jours, lapplication des technologies informatiques dans les sciences humaines nous permet
denvisager cette tche dune faon bien diffrente que ne la t la compilation manuelle du lexique,
ralise par Engler. partir des annes 70, un nouveau paradigme de lexiques et thsaurus sest en effet
progressivement dvelopp grce aux instruments et aux mthodes informatiques qui permettent
dacqurir, de mmoriser, traiter et diter des quantits de donnes lexicales inconcevables pour la
constitution manuelle dun thsaurus ou dun dictionnaire.

1044

Article en accs libre plac sous licence Creative Commons Attribution 2.0 (http://creativecommons.org/licenses/by/2.0)

SHS Web of Conferences 1 (2012)


DOI 10.1051/shsconf/20120100294
aux auteurs, publi par EDP Sciences, 2012

Congrs Mondial de Linguistique Franaise CMLF 2012


SHS Web of Conferences

Un thsaurus est gnralement dfini comme un rpertoire alphabtique de termes relis par des relations
hirarchiques, associatives et synonymiques. Ces termes constituent le lexique dun domaine de la
connaissance et sont utiliss pour lindexation des textes et la recherche dinformation dans ce domaine.
Quelques thsaurus lectroniques ont t crs, parmi lesquels il convient de signaler le Thesaurus
mediae et recentioris latinitatis, labor Rome lIstituto del Lessico Intellettuale Europeo e Storia
delle Idee du Consiglio Nazionale delle Ricerche, et qui est consacr au lexique philosophique des XVII
et XVIII sicles et la liste des termes du haut Moyen-ge. Le Thesaurus Diplomaticus, une base de
donnes de textes et images de documents diplomatiques en latin, ainsi que le Thesaurus formarum totius
latinitatis a Plauto usque ad saeculum XXum contenant des formes latines annotes, ont t tous deux
raliss lUniversit Catholique de Louvain. Le Thesaurus Linguae Grecae, dvelopp la California
University, Irvine, contient, quant lui, la quasi totalit des textes grecs du VII sicle av. J.-C. lan
1453 apr. J.-C.
Les thsaurus peuvent sappuyer sur un systme de classification unidimensionnelle ou
multidimensionnelle. Ces derniers, appels thsaurus facettes, sont plus flexibles que ceux structure
monohirarchique puisquils fournissent une multiplicit de points daccs linformation et donc plus de
possibilits de recherches sur les donnes saisies. Notre but tant, ici, de dvelopper un thsaurus-lexique,
nous nous sommes tourns vers ltude de modles lexicaux.
Durant les quinze dernires annes, de remarquables modles lexicaux ont t conus pour le
dveloppement de grandes ressources lexicales informatises. Certains de ces modles, tels que Wordnet
(Fellbaum, 1998), EuroWordNet (Vossen, 1999), et ItalWordNet (Roventini et al., 2003) sont bass sur
des rseaux conceptuels ; dautres comme par exemple FrameNet (Fillmore et al., 2003) et Pattern
Dictionary (Hanks et Pustejovsky, 2005) sur des patrons smantiques ; dautres encore conjuguent
classification ontologique et description de la valence syntaxique et smantique, c'est le cas du modle
SIMPLE (Lenci et al., 2000) et de Brandeis Semantic Ontology (Pustejovsky et al., 2006).

Le choix dun modle lexical

Utiliser un modle existant en ladaptant aux exigences dun domaine de la connaissance est, sans aucun
doute, loption la plus avantageuse en matire de cot et de temps mais aussi et surtout en matire de
qualit des rsultats. Aprs un examen attentif des diffrents types de modles susnomms, nous avons
opt pour le modle smantique SIMPLE en raison de ses remarquables caractristiques, et lavons
customis en vue du dveloppement du thsaurus-lexique lectronique de la terminologie saussurienne.

3.1

Le modle de base

Le modle lexical SIMPLE fut adopt consensuellement au plan europen en 1998 en vue de crer douze
lexiques smantiques monolingues harmoniss, pour autant de langues europennes. Ds sa conception, il
sest impos comme standard de facto et a ainsi inspir de manire dterminante le standard international
ISO pour les lexiques du Traitement Automatique des Langues, le mtamodle Lexical Markup
Framework2 (Francopoulo, 2007). Dans le panorama de la Lexicographie Computationnelle, le modle
SIMPLE se distingue par certains aspects particulirement novateurs.
Lapproche thorique qui sous-tend la reprsentation de linformation smantique est fortement inspire
des principes fondamentaux de la thorie du Lexique Gnratif (Pustejovsky, 1995 ; 2001). Larchitecture

Article en accs libre plac sous licence Creative Commons Attribution 2.0 (http://creativecommons.org/licenses/by/2.0)

1045

Congrs Mondial de Linguistique Franaise CMLF 2012


SHS Web of Conferences

SHS Web of Conferences 1 (2012)


DOI 10.1051/shsconf/20120100294
aux auteurs, publi par EDP Sciences, 2012

flexible du modle ainsi que la mthodologie de construction du lexique permettent dencoder dans les
entres lexicales une vaste gamme dinformations hautement structures couvrant les principaux aspects
de la smantique lexicale des mots ; ceci de manire cohrente, et au degr de granularit souhait. La
structuration conceptuelle du lexique est confie une ontologie linguistique mettant en relief le caractre
multidimensionnel du sens lexical. Lontologie SIMPLE est forme de types smantiques indpendants
des langues et a t conue en prvision dexpansions ou de spcialisations visant satisfaire aux
exigences de domaines dintrt particuliers.
Outre la classification ontologique et un certain nombre de traits smantiques, les units lexicales sont
caractrises par un rseau de relations smantiques qui sont en majeure partie le fruit dune relecture de
la Structure des Qualia (Qualia Structure) que Pustejovsky emprunte Moravcsik (1975)3. La structure
des qualia, qui est un des quatre niveaux de reprsentation smantique4 dans la thorie du Lexique
Gnratif, est compose de quatre rles. Ceux-ci permettent respectivement de situer lentit dnote
parmi dautres (rle formel), den indiquer la fonction (rle tlique), lorigine (rle agentif) et la
composition (rle constitutif). La structure des qualia fournit donc un langage formel pour modliser
laspect componentiel du sens dun mot. Les relations qualia permettent de reprsenter linformation
concernant les diffrentes composantes smantiques qui concourent dfinir la structure interne dune
unit lexicale quelle que soit sa catgorie syntaxique. Elles explicitent ses liens paradigmatiques :
hyperonymiques, hyponymiques, mronymiques et holonymiques mais aussi, sur laxe syntagmatique, les
liens aux diffrents prdicats qui contribuent clairer son sens ; ces derniers renseignent en particulier
sur lorigine et la fonction de lentit dnote. Outre les relations qualia, dautres liens tels que la
synonymie, la polysmie logique et la drivation morphologique sont galement dfinis. Les lexmes
prdicatifs - verbes, noms prdicatifs et adjectifs - sont de surcrot caractriss par le scnario smantique
dans lequel ils sont impliqus. Celui-ci est dcrit en termes de classe aspectuelle et de structure
argumentale du prdicat, avec indication du rle smantique et des restrictions de slection smantique de
chacun des arguments.

La customisation du modle : de SIMPLE SIMPLE_FdS

Le modle SIMPLE offre donc, pour la structuration du lexique, un cadre riche mais cependant flexible,
dans lequel de nombreux lments sont paramtrables. Lontologie a t conue tant de manire
permettre llimination des types smantiques les plus spcifiques figurant au bas de la hirarchie, quen
vue dune expansion globale ou sectorielle. La structure qualia se prte aisment une rduction, une
extension ou une customisation des relations, afin de mieux saisir lorganisation conceptuelle dun
domaine particulier ou de rpondre aux besoins spcifiques dune application. Lintroduction de traits
smantiques ainsi que de relations non qualia supplmentaires est, quant elle, autorise.

4.1

Lontologie de domaine

La premire phase du processus de customisation du modle de base sest focalise sur la conception
dune ontologie lexicale de domaine permettant de structurer la terminologie saussurienne. Pour lusage
du terme ontologie, nous nous rfrons la dfinition la plus rpandue en linguistique et en
informatique : An ontology is an explicit specification of a conceptualization. [] An ontology defines
(specifies) the concepts, relationships, and other distinctions that are relevant for modelling a domain. 5
(Gruber, 1993 : 200).

1046

Article en accs libre plac sous licence Creative Commons Attribution 2.0 (http://creativecommons.org/licenses/by/2.0)

SHS Web of Conferences 1 (2012)


DOI 10.1051/shsconf/20120100294
aux auteurs, publi par EDP Sciences, 2012

Congrs Mondial de Linguistique Franaise CMLF 2012


SHS Web of Conferences

Construire une ontologie, cest modliser et reprsenter le schma conceptuel dun domaine de la
connaissance, en vue de partager une reprsentation formelle de ses lments constitutifs et des relations
quils entretiennent. En loccurrence, notre source dinspiration tant le systme de types smantiques du
modle SIMPLE, lontologie de domaine a t ralise conformment larchitecture et aux principes de
conception de notre archtype. Celui-ci refltant un prcepte fondamental de la thorie du Lexique
Gnratif selon lequel les units lexicales sont des entits multidimensionnelles qui diffrent en degr de
complexit vhicul par leur smantique lexicale, lontologie de domaine a donc t, elle aussi, conue de
faon reprsenter ces diffrences de complexit interne du sens des mots.
4.1.1

Identification des classes conceptuelles

La premire tape dans la cration de lontologie SIMPLE_FdS a t didentifier un ensemble de classes


smantiques partir de leurs instances. Lextraction de nouveaux termes des manuscrits ltude ntant
pas acheve, nous avons analys les termes recueillis par Godel et Engler termes indubitablement
fondamentaux dans la pense saussurienne. Chaque sens dun terme a reu un classement smantique
prliminaire et parfois mme approximatif. De cette classification ont merg les classes conceptuelles les
plus pertinentes de la future ontologie. Ces concepts, souvent situs un niveau intermdiaire de
lontologie, ont ensuite t dfinis et organiss en une hirarchie. Puis, dans un processus toujours en
cours, ils ont t gnraliss ou spcialiss travers la cration de classes smantiques plus vastes ou de
sous-classes, en combinant les approches ascendante et descendante. cet gard, nous avons pris soin
dviter tant une trop grande gnralisation que des distinctions trop fines et qui se rvlent souvent peu
utiles.
Ltape successive a t consacre la dfinition de la structure interne des classes (ou types)
smantiques : a) leurs proprits (attributs et valeurs), en distinguant celles qui sont communes toutes
les instances dun type smantique et qui en sont donc un trait dfinitoire (attribut obligatoire) de celles
qui ne caractrisent quun sous-ensemble des termes appartenant un type (attribut autoris); b) les
valeurs possibles des attributs : valeur boolenne, caractres, liste, chiffre, ainsi que leur cardinalit (le
nombre minimal et maximal de valeurs distinctes autorises).
4.1.2

La structuration des concepts

En accord avec notre modle dontologie, le systme de types smantiques SIMPLE_FdS est fond sur
des relations conceptuelles tant hirarchiques que non hirarchiques, selon le principe de lhritage
orthogonal6 (Pustejovsky et Boguraev, 1993). Il est donc constitu de types unidimensionnels ainsi que de
types multidimensionnels. Les premiers sont pleinement caractrisables par une relation hyperonymique ;
ainsi, le type smantique Natural_Entity est correctement dfini comme un sous-type de
Concrete_Entity. Les types multidimensionnels traduisent, quant eux, la multidimensionnalit du sens
travers la combinaison dune relation de subsomption et la rfrence dautres dimensions de sens. Ces
dimensions de sens sont exprimes au moyen de la structure des qualia, qui est inspire de la notion
aristotlicienne de modes dexplication (Aitiai) ; ainsi, le type smantique Artifactual_Entity ne peut
tre dfini que comme un sous-type de Concrete_Entity englobant galement une dimension agentive et
une dimension tlique. Dans le cadre de lontologie, les rles qualia dfinissent les proprits distinctives
des types smantiques et diffrencient leur constitution smantique interne.

Article en accs libre plac sous licence Creative Commons Attribution 2.0 (http://creativecommons.org/licenses/by/2.0)

1047

Congrs Mondial de Linguistique Franaise CMLF 2012


SHS Web of Conferences

SHS Web of Conferences 1 (2012)


DOI 10.1051/shsconf/20120100294
aux auteurs, publi par EDP Sciences, 2012

Graphique 1 : Visualisation de lontologie SIMPLE_FdS (version 0.2) avec le logiciel Protg


Il nest pas surprenant de constater que dans lontologie de domaine, les types smantiques les plus levs
dans la hirarchie, qui sont les plus gnriques et consensuels puisquils expriment des concepts trs
gnraux, refltent en grande partie ceux de lontologie SIMPLE. Au plus haut niveau de lontologie de
domaine figurent en effet outre les types Constitutif, Agentif et Tlique qui permettent de fournir une
reprsentation smantique dentits dont le rle formel est indfinissable et qui ninstancient lexicalement
que le rle Constitutif, Agentif ou Tlique, ex. : ensemble, origine du langage ou objet linguistique les
types Concrete_Entity, Abstract_Entity, Property et Event. De mme, une portion de lontologie gnrale
a inspir la construction de hirarchies de types pour la description du mtalangage linguistique.
Cette ontologie de domaine, constitue de 47 types smantiques, a t conue tant dans le respect des
principes gnraux de construction dune ontologie que dans celui des contraintes spcifiques imposes
par le modle lexical adopt. Nous nous sommes efforcs dadhrer aux principes de compltude et de

1048

Article en accs libre plac sous licence Creative Commons Attribution 2.0 (http://creativecommons.org/licenses/by/2.0)

SHS Web of Conferences 1 (2012)


DOI 10.1051/shsconf/20120100294
aux auteurs, publi par EDP Sciences, 2012

Congrs Mondial de Linguistique Franaise CMLF 2012


SHS Web of Conferences

cohrence et de prvoir la possibilit dextensions ou raffinements. Notre objectif principal a t de tendre


vers une modlisation la plus consensuelle possible des concepts et des relations constitutives propres
notre domaine de la connaissance, ceci dans le but de permettre une recherche dinformation efficace et
exhaustive et lacquisition de connaissances lexicales partir de textes.
Le rseau de classes smantiques ainsi conu ne reprsente, il est clair, quune des modlisations
possibles du domaine de la terminologie saussurienne. Le dveloppement dune ontologie est en effet un
processus cratif dans lequel un facteur de subjectivit sinscrit invitablement ; en dpit de tout effort de
consensus, une ontologie reflte toujours un point de vue. Nous assumons donc pleinement la
responsabilit du choix et de la dfinition des concepts qui caractrisent la connaissance du domaine, de
leurs relations, ainsi que du niveau de spcification du schma conceptuel tout entier. Dautre part, la
version actuelle de lontologie pourrait tre sujette volution, et en particulier des raffinements visant
une dfinition plus prcise des types smantiques ainsi qu des extensions pour lintroduction de
nouveaux concepts. Il est en effet possible que, dans une phase plus avance du dveloppement du
lexique, nous soyons confronts des instances de concepts non reprsents dans lontologie. Cette
volution doit, bien videmment, seffectuer de manire ne pas invalider les contraintes du modle et
dans le respect de la cohrence du systme tout entier.
Lontologie SIMPLE_FdS a t traduite dans le langage de reprsentation dontologie Web OWL (Web
Ontology Language). Disposer dune version OWL de lontologie offre un triple avantage : 1) OWL tant
bas sur une smantique formelle, il est possible deffectuer un grand nombre de tests sur lontologie et sa
cohrence (restrictions doubles, parents multiples, etc.) ; 2) il existe une srie de plugins de visualisation
pour lditeur dontologies Protg qui simplifient ldition et la consultation ; 3) OWL est le standard
propos depuis 2004 par le W3C pour la reprsentation et le partage dontologies sur le Web. Lontologie
reprsente dans le graphique 1 a t dite avec Protg-OWL, une plate-forme open-source qui fournit
une srie doutils pour la cration dontologies.

4.2

Traits et relations smantiques

Outre lontologie, deux autres composants du modle SIMPLE_FdS, i.e., un groupe de traits smantiques
et un vaste ensemble de relations smantiques, permettent dexprimer une large typologie dinformations
caractrisant le contenu smantique des mots.
Les traits smantiques expriment des informations telles que le domaine dusage dune unit lexicale,
ex. : Semantics, Morphology ; certaines proprits distinctives transversales la hirarchie des types
et qui permettent donc de regrouper les termes, ex. : Plus_Conventional, quelle que soit leur
classification ontologique ; ou encore des dimensions de sens qui sont clairement perues dans le contenu
smantique dun mot mais ne peuvent tre exprimes du point de vue lexical au moyen dune relation
smantique Agentive_yes, Telic_yes.
Les relations smantiques jouent, quant elles, un rle fondamental dans la modlisation des donnes
lexicales. Elles expriment, sous forme de triplets <unit smantique source, relation, unit smantique
cible>, une relation binaire entre des acceptions. Elles proviennent en grande partie de la Extended
Qualia Structure du modle SIMPLE, qui est elle-mme, comme prcdemment observ, le fruit dune
relecture de la structure des qualia. Les relations de lExtended Qualia permettent de fournir une
reprsentation structure de la multidimensionnalit dun sens et de saisir la nature des relations (intra- et
extracatgorielles) existant entre les units lexicales, travers la base de donnes. Lensemble des

Article en accs libre plac sous licence Creative Commons Attribution 2.0 (http://creativecommons.org/licenses/by/2.0)

1049

Congrs Mondial de Linguistique Franaise CMLF 2012


SHS Web of Conferences

SHS Web of Conferences 1 (2012)


DOI 10.1051/shsconf/20120100294
aux auteurs, publi par EDP Sciences, 2012

relations dont dispose le modle SIMPLE_FdS permet donc, en rsum, de relier une entit-objet une
entit plus gnrique, ses proprits, son origine, sa fonction, ses lments constitutifs ou au tout dont
elle fait partie ; une entit-vnement, peut, quant elle, tre relie son agent, patient, instrument,
ventuel lieu daction, ainsi qu son effet ou rsultat. Dautres types de relations sont galement
reprsentes, parmi lesquelles la synonymie et lantonymie.
Dans le modle SIMPLE_FdS, les traits et relations smantiques du modle de base jugs appropris pour
rendre compte de la terminologie saussurienne ont t retenus. Dautres traits et relations spcifiques ont
t crs afin dexprimer des proprits et des liens qui caractrisent les termes et plus gnralement
lorganisation conceptuelle de ce domaine particulier de la connaissance.
Seize nouveaux traits smantiques ont t introduits, qui expriment de nouveaux domaines dusage,
renseignent sur la source, la frquence doccurrence et la priode dattestation dun terme ainsi que sur le
caractre cognitif de lentit quil dnote.
ce jour, seize relations smantiques ont t cres dans le but de reprsenter a) diffrents types de
changements terminologiques (hasPrevious / hasSubsequent / hasOther_Denomination) exprimant soit la
volont de Saussure lui-mme (signifiant hasPreviousDenomination image acoustique) soit celle de
lditeur (chanon isEdSubstitutedWith fragment) (fragment substitutesFor chanon) ; b) une relation de
quasi-synonymie (diachronie hasNearSynonym volution) ; c) une opposition (consonante isOpposedto
sonante) ; d) lappartenance une sphre spcifique (smantique pertainsTo linguistique), (mtaplasme
belongsTo diachronie) ; e) un trait fondamental de la pense saussurienne (parole duality langue) ; f)
diffrents types dimplication rciproque (signifiant directlyImplies signifi), (image auditive
indirectlyImplies ide) ; g) une implication non rciproque, inspire de (Cruse, 1986 : 123) (parasme
hasEndonym sme), dans laquelle le terme conteneur (ici, lunit smantique source) englobe le sens du
terme reprsent par lunit smantique cible ; h) un ordre linaire ou temporel (frontire syllabique
precedes explosion) (suffixe follows racine) ; i) un lieu abstrait (trsor hasAbstractLocation pense).

Le niveau terminologique

Le modle conceptuel une fois tabli, la phase successive consiste reprsenter formellement la
smantique lexicale des instances des concepts ontologiques. Les moyens descriptifs qui ont t prsents
permettent la cration dentres lexicales (cf. tableaux 1 et 2) particulirement riches dinformations.
Une entre smantique dcrit une seule acception dun lexme simple ou complexe. Le sens analys y est
dfini par un ensemble dinformations structures couvrant un large ventail daspects smantiques :
classification ontologique ; domaine dusage ; dfinition fournie par Saussure lui-mme7 et par Engler et
Godel ; collocations ; type dvnement dnot, i.e. tat, procs, transition ; traits smantiques distinctifs
particuliers (source, frquence et priode dattestation dun terme) ; relation de synonymie et dantonymie
; relation de drivation morphologique; relations de la Extended Qualia Structure ; structure argumentale
du prdicat avec indication du rle smantique ainsi que des restrictions smantiques de ses arguments.
Une attention particulire est donc rserve aux liens existant entre les diffrentes units smantiques. Les
relations smantiques tablissent un lien entre le sens dcrit et un certain nombre dvnements ou
dentits qui lui sont strictement lis ; leur nature explicite permet, de surcrot, de dfinir le rle de ces
vnements ou entits dans la smantique lexicale du mot dcrit.

1050

Article en accs libre plac sous licence Creative Commons Attribution 2.0 (http://creativecommons.org/licenses/by/2.0)

SHS Web of Conferences 1 (2012)


DOI 10.1051/shsconf/20120100294
aux auteurs, publi par EDP Sciences, 2012

Congrs Mondial de Linguistique Franaise CMLF 2012


SHS Web of Conferences

id = "USem4514uni-spatialit"
Naming = "uni-spatialit"

id = "USemD9066temps_homogne"
Naming = "temps_homogne"

Saussure definition = "Principe de l'uni-spatialit (si l'on


considre le sme) ayant pour consquence dans le sme la
divisibilit par tranches (toujours dans le mme sens et par
coupures identiques) [] au lieu de la divisibilit pluriforme
quon aurait par exemple dans un systme visuel direct." 3317.2.
Il faut s'astreindre dire uni-spatialit du signe linguistique
chaque fois, afin de faire sentir que ce n'est pas un caractre
gnral du sme." 3318.1.

Saussure definition = "Espace (de temps) acoustiquement


homogne, correspondant l'articulation d'un phonme." 748
(3335,1).

Definition = "Linarit du signifiant [l'opposition entre deux


smes se rgle au moyen de tranches allant dans le mme sens et
n'arrivant qu'une une]. "(Engler, 51).
Semfeaturelist= " SemanticType Property
SuperType Thing
Domain LINGUISTICS "
Relations:
semr = "isa"
target = "USemD2841propriet" (Property)
semr = "isaPropertyOf"
target = "USemD24signifiant" (Concrete_Entity)
semr = "isaPropertyOf"
target = "USemD4057syntagme"
(Complex_Element)
semr = "isaPropertyOf"
target = "USemD06chane_de_la_parole"
(Speech_Act)
semr = "belongsTo"
target = "USemD4058parole" (Speech_Act)
semr = "hasSynonym"
target = "USemD76linarit" (Property)
semr = "deadjectivalNoun"
target = "USemD9224spatial" (Physical_Property)

Definition = "Correspondance d'un temps acoustique et d'un


temps articulatoire 749> E 65/64-66/65. Dans le Cours III,
Saussure dira moment ("des moments, pas des temps" 725)"
(Engler, 50). "Espace homogne dans la chane acoustique; acte
articulatoire qui lui correspond." (Godel, 279).
Semfeaturelist= " SemanticType Time
SuperType Abstract_Entity
Domain LINGUISTICS Domain PHONOLOGY
DurationUnderspecified"
Relations:
semr = "isa"
target = "USemD9120espace_temporel" (Time)
semr = "concerns"
target = "USemD2865chane_phonique" (Group)
semr = "Hasproperty"
target = "USemD9122homognit" (Property)
semr = "isRelatedTo"
target = "USem8phonme" (Basic_Element)
semr = "belongsTo"
target = "USemD4058parole" (Speech_Act)
semr = "pertainsTo"
target = "USem14phonologie"
(Domain_of_Knowledge)
semr = "hasSubsequentDenomination"
target = "USemD89121moment" (Time)

Predicative Representation:
predicate = "PREDspatial#1"
typeoflink = "AdjectiveNominalization"
Arguments:
id = "ARG0spatial#1"
semanticrole = "Role_Underspecified"
semanticrestriction = " SemanticType Thing"

id = "USemD4058parole"
Naming = "parole"

id = "USem11morphologie"
Naming = "morphologie"

Definition = "Excution du langage travers le code de la


langue (le langage moins la langue). " (CLG, Engler, 38). "Tout
ce qui est amen sur les lvres par le besoin du discours et par
une opration particulire (IR2.24). Acte de l'individu ralisant
sa facult du langage au moyen de la convention sociale qui est
la langue (IIR6-7)." (Godel, 271).

Saussure definition = "Science qui traite des units de son


correspondant une partie de lide, et du groupement de ces
units. Le vrai nom de la morphologie serait: la thorie des
signes, et non des formes." 3293 &2.

Semfeaturelist=" SemanticType Speech_Act


SuperType Act
Domain LINGUISTICS

Definition = "Dans les subdivisions de la grammaire (au sens


traditionnel), la morphologie s'oppose essentiellement la
phontique, tandis qu'il est difficile de la distinguer de la
syntaxe: "Etude des formes et des fonctions, c'est la mme
chose" 2136 (Engler, 35) (Godel, 269).

Article en accs libre plac sous licence Creative Commons Attribution 2.0 (http://creativecommons.org/licenses/by/2.0)

1051

Congrs Mondial de Linguistique Franaise CMLF 2012


SHS Web of Conferences

SHS Web of Conferences 1 (2012)


DOI 10.1051/shsconf/20120100294
aux auteurs, publi par EDP Sciences, 2012

EventType Process
IntentionalityYes"

Collocations = "morphologie historique; - rtrospective"

Relations:
semr = "isa"
target = "USemD2892excution" (Speech_Act)
semr = "concerns"
target = "USemD4037langage" (Property)
semr = "hasInstrument"
target = "USemD402langue" (Linguistic_System)
semr = "hasProperty"
target = "USemD76linarit" (Property)
semr = "isTypicalOf"
target = "USemD8383sujet_parlant" (Human)
semr = "duality"
target = "USemD402langue" (Linguistic_System)
semr = "hasSynonym"
target = "USemD9223langue_discursive"
(Speech_Act)
semr = "hasSynonym"
target = "USemD33discours" (Speech_Act)

Semfeaturelist=" SemanticType Domain_of_Knowledge


SuperType Abstract_Entity
Domain LINGUISTICS Domain MORPHOLOGY"
Relations:
semr = "isa"
target = "USemD15science" (Abstract_Entity)
semr = "concerns"
target = "USemD12forme" (Relational_Entity)
semr = "concerns"
target = "USemD17unit_morphologique"
(Basic_Element)
semr = "belongsTo"
target = "USemD22synchronie" (State)
semr = "pertainsTo"
target = "USem12grammaire"
(Domain_of_Knowledge)
semr = "hasPurpose"
target = "USemD18groupement"
(Cause_Change_Cognitive_Event)
semr = "hasOtherDenomination"
target = "USemD19thorie_des_signes"
(Domain_of_Knowledge)

Tableaux 1 et 2 - Exemples dentres lexicales


Privilgiant les termes dj rpertoris provenant des crits authentiques de Saussure, 375 entres
lexicales ont t cres ce jour, parmi lesquelles 284 noms simples ou complexes, 70 adjectifs et 21
verbes. Ces entres sont mmorises dans une base de donnes gre par un systme qui permet un accs
facile et simultan pour la cration, le stockage, la consultation et la modification des entres lexicales. Le
systme de gestion de la base de connaissances comprend un ensemble de requtes en SQL (Structured
Query Language), un langage de programmation dclaratif cr pour le contrle et la manipulation de
donnes mmorises dans les bases de donnes relationnelles. Ces requtes permettent deffectuer des
contrles de qualit sur la cohrence formelle des informations mmorises. Le systme supporte en outre
des fonctions de requtes avances permettant une recherche dinformation lexicale rapide, efficace et
complte et qui fournit des rsultats trs fins. titre dexemple, une requte concernant lusage dune
relation smantique dtermine, ex. : resultingFrom (avec une ventuelle restriction sur lunit
smantique cible, ex. : association) restitue tous les couples de termes lis par cette relation. travers une
requte concernant une unit lexicale, ex. : signifiant, lensemble des termes qui lui sont associs sont
slectionns et classs selon le type de relation quils entretiennent avec le mot cl. Une requte portant
sur un trait smantique, ex. plus_sound, saisit en revanche toutes les units smantiques concernes,
indpendamment de leur classification ontologique.
Source Semantic Unit
USemD9838analogie

Naming
analogie

Semantic Type Sem. Relation Target Semantic Unit


Mental_Creation resultingFrom USemD4039association

USemD9839novation_analogiquenovation_analogiqueMental_Creation resultingFrom USemD4039association


USemD2854paradigme

paradigme

Relational_State resultingFrom USemD4039association

USem4453rapport_associatif

rapport_associatif

Relational_State resultingFrom USemD4039association

Tableau 3 - Requte portant sur une relation smantique spcifique associe un mot cible dtermin

1052

Article en accs libre plac sous licence Creative Commons Attribution 2.0 (http://creativecommons.org/licenses/by/2.0)

SHS Web of Conferences 1 (2012)


DOI 10.1051/shsconf/20120100294
aux auteurs, publi par EDP Sciences, 2012

Congrs Mondial de Linguistique Franaise CMLF 2012


SHS Web of Conferences

Target Semantic Unit

Semantic Relation

Source Semantic Unit

USemD24signifiant

hasPart

USemD31onymique

USemD24signifiant

hasPart

USemD36sme

USemD24signifiant

hasPart

USem5signe

USemD24signifiant

hasPart

USemD27signe_linguistique

USemD24signifiant

directlyImplies

USemD35signifi

USemD24signifiant

indirectlyImplies

USemD23sens

USemD24signifiant

indirectlyImplies

USem35pense

USemD24signifiant

isa

USem4forme

USemD24signifiant

isPartOf

USem8phonme

USemD24signifiant

isPropertyOf

USemD76linarit

USemD24signifiant

isPropertyOf

USem4514uni-spatialit

USemD24signifiant

hasOtherDenomination

USemD4050image_verbale

USemD24signifiant

hasOtherDenomination

USemD26son

USemD24signifiant

hasOtherDenomination

USemD9010image_auditive

USemD24signifiant

hasOtherDenomination

USemD9007impression_acoustique

USemD24signifiant

hasSubsequentDenomination USemD34image_acoustique

USemD24signifiant

hasSynonym

USem10signe_linguistique

USemD24signifiant

hasSynonym

USem139sme

USemD24signifiant

hasSynonym

USemD25aposme

Tableau 4 - Requte sur un mot cible dans lensemble des relations auxquelles il est associ

Semantic Unit

Semantic Type

Semantic Feature

Speech_Act

Plus_sound

Group

Plus_sound

USemD60012unit_phonatoire

Basic_Element

Plus_sound

USemD60011unit_phonique

Basic_Element

Plus_sound

USemD2860fragment

Basic_Element

Plus_sound

USem4414sonorit

Constitutive

Plus_sound

USemD2861anneau

Basic_Element

Plus_sound

USemD2885ralisation

Speech_Act

Plus_sound

USem32acte_linguistique

Speech_Act

Plus_sound

USemD2892excution
USemD60008systme_phonologique

Article en accs libre plac sous licence Creative Commons Attribution 2.0 (http://creativecommons.org/licenses/by/2.0)

1053

Congrs Mondial de Linguistique Franaise CMLF 2012


SHS Web of Conferences

SHS Web of Conferences 1 (2012)


DOI 10.1051/shsconf/20120100294
aux auteurs, publi par EDP Sciences, 2012

USemD33discours

Speech_Act

Plus_sound

USemD4031chane_parle

Speech_Act

Plus_sound

USemD4058parole

Speech_Act

Plus_sound

USemD60006chane_de_la_parole

Speech_Act

Plus_sound

USemD60024phonation

Speech_Act

Plus_sound

USemD2863articulation

Speech_Act

Plus_sound

USemD2889chane_significative

Speech_Act

Plus_sound

USemD2869circuit_de_la_parole

Speech_Act

Plus_sound

USem4forme

Concrete_entity

Plus_sound

USemD26son

Concrete_entity

Plus_sound

Tableau 5 - Requte sur les units lexicales associes un trait smantique

Conclusions et perspectives

Le thsaurus-lexique lectronique que nous avons prsent est bas sur un modle lexical qui allie la
complexit et la rigueur des traits innovants. Une ressource lexicale ainsi structure et formalise offre
de nombreux avantages. En phase de cration, elle permet un dveloppement collaboratif rigoureux,
mme distance ; elle favorise une reprsentation systmatique de gnralisations concernant des
phnomnes linguistiques ; enfin, elle assure la cohrence et la compltude de linformation saisie. En
matire de maintenance, elle permet de raliser des contrles de cohrence formelle de linformation et
deffectuer des modifications ou corrections sur des ensembles de donnes ; elle offre une grande facilit
denrichissement de linformation ainsi que dextension de la couverture lexicale. En ce qui concerne son
exploitation, outre ses caractristiques doutil de description et de dsambigusation smantique trs
efficace, cette ressource lexicale permet de rechercher ou dinfrer une vaste gamme dinformations. La
structuration multidimensionnelle des concepts du domaine de rfrence ainsi quune reprsentation
smantique hautement structure, riche, diversifie et expressive en font un outil de recherche lexicale
particulirement performant. Des requtes de recherche dinformation peuvent en effet tre effectues trs
simplement et rapidement sur nimporte quel type de donnes mmorises, i.e. relations, traits
smantiques ou units smantiques, ces donnes pouvant tre interroges tant singulirement quen
combinaison. Effectues dans un environnement formalis qui garantit la compltude des rsultats
obtenus, ce genre de recherche lexicale permet dacqurir une vision plus approfondie de la nature
componentielle et relationnelle du sens des mots.
Le thsaurus-lexique smantique de la terminologie saussurienne en cours de dveloppement et qui sera
achev fin 2012 deviendra, notre avis, un outil essentiel pour les tudes saussuriennes. Lorganisation
structure de la connaissance lexicale qui y est propose favorise la recherche smantique et devrait donc
contribuer de manire significative mieux matriser le vocabulaire saussurien et, partant, clairer
certains aspects originaux de la pense du grand linguiste genevois.
Les outils informatiques et les mthodologies adopts pour le dveloppement de ce thsaurus lectronique
sont entirement portables et sont destins tre utiliss dans des domaines similaires pour tudier
luvre dautres crivains, philosophes et savants. En fait, dans le cadre dun ERC Advanced Project8, un

1054

Article en accs libre plac sous licence Creative Commons Attribution 2.0 (http://creativecommons.org/licenses/by/2.0)

SHS Web of Conferences 1 (2012)


DOI 10.1051/shsconf/20120100294
aux auteurs, publi par EDP Sciences, 2012

Congrs Mondial de Linguistique Franaise CMLF 2012


SHS Web of Conferences

thesaurus lectronique de termes reprsentatifs extraits de la pseudo-Thologie dAristote est


actuellement en cours de dveloppement. Il est fond sur une version customise de notre modle de base.

Rfrences bibliographiques
Cabr, M.T. (1999). Terminology. Theory, methods and applications. Sager, J.C. (d.). Amsterdam/Philadelphia :
John Benjamins Publishing Company.
Cruse, D. A. (1986). Lexical Semantics. Cambridge : Cambridge University Press.
Engler, R. (1968). Lexique de la terminologie saussurienne. Comit international permanent des linguistes.
Publication de la commission de terminologie. Utrecht-Anvers : Spectrum.
Fellbaum, C. (1998). WordNet. An Electronic Lexical Database. Cambridge, MA : The MIT Press.
Fillmore, C.J. et al. (2003). Background to FrameNet. International Journal of Lexicography, 16 (3), 235-250.
Francopoulo, G. et al. (2007). Lexical Markup Framework: ISO standard for semantic information in NLP lexicons.
Proceedings of Lexical-semantic and Ontological Resources Workshop at Gesellschaft fr linguistische
Datenverarbeitung, Biennal Spring Conference, Tubingen.
Godel, R. (1957). Les sources manuscrites du Cours de linguistique gnrale de Ferdinand de Saussure. Genve :
Droz.
Gruber, T. R. (1993). A translation approach to portable ontologies. Knowledge Acquisition, 5(2), 199-220.
Guarino, N. (1998). Some Ontological Principles for Designing Upper Level Lexical Resources. Proceedings of the
First International Conference on Language resources and Evaluation, Granada.
Guarino, N., Oberle, D., Staab, S. (2009). What Is an Ontology? In S. Staab and R. Studer (ds.) Handbook on
Ontologies, Second Edition, International Handbooks on Information Systems, Springer Verlag: 1-17.
Hanks, P., Pustejovsky, J. (2005). A pattern dictionary for natural language processing. Revue Franaise de
Linguistique Applique 10(2), 63-82.
Lenci, A., F. Busa, N. Ruimy, E. Gola, M. Monachini, N. Calzolari, A. Zampolli et al. (2000). SIMPLE Linguistic
Specifications LE4-8346 SIMPLE, Deliv. D2.1 & D2.2. Pisa : ILC and University of Pisa.
Lenci, A. et al. (2000). SIMPLE: A General Framework for the development of Multilingual Lexicons. International
Journal of Lexicography, special issue, Dictionaries, Thesauri and Lexical-Semantic Relations 13(4), 249-263.
Moravcsik, J. M. (1975). Aitia as Generative Factor in Aristotles Philosophy. Dialogue, 14, 622-36.
Pustejovsky, J. (1995). The Generative Lexicon. Cambridge, MA. : The MIT Press.
Pustejovsky, J. (2001). Type Construction and the Logic of Concepts. In Bouillon, P. et Busa, F. (ds.), The
Language of Word Meaning, Cambridge, MA : Cambridge University Press, 91-123.
Pustejovsky, J. et al. (2006). Towards a Generative Lexical Resource: The Brandeis Semantic Ontology. CD-ROM
Proceedings Fifth International Conference on Language resources and Evaluation, Genova.
Pustejovsky, J., Boguraev, B. (1993). Lexical Knowledge Representation and Natural Language Processing, Artificial
Intelligence, LXIII, 193-223.

Article en accs libre plac sous licence Creative Commons Attribution 2.0 (http://creativecommons.org/licenses/by/2.0)

1055

Congrs Mondial de Linguistique Franaise CMLF 2012


SHS Web of Conferences

SHS Web of Conferences 1 (2012)


DOI 10.1051/shsconf/20120100294
aux auteurs, publi par EDP Sciences, 2012

Rosati,L. (2003). La classificazione a faccette fra Knowledge Management e Information Architecture, itconsult.it.
http://www.itconsult.it/knowledge/articoli/pdf/itc_rosati_faccette_e_KM.pdf
Roventini A. et al. (2003). ItalWordNet: Building a Large Semantic Database for the Automatic Treatment of Italian.
In Zampolli et al. (ds.), Computational Linguistics in Pisa, Special Issue, Vol. XVIII-XIX, Tomo II, Pisa-Roma :
IEPI, 745-792.
Ruimy, N. et al. (2003). A computational semantic lexicon of Italian: SIMPLE. In Zampolli et al. (ds.),
Computational Linguistics in Pisa, Special Issue, Vol. XVIII-XIX, Tomo II, Pisa-Roma : IEPI, 821-864.
Saussure, F. de (1916). Cours de linguistique gnrale. Bally, C. et Sechehaye, A. (ds). Lausanne-Paris : Payot.
Saussure, F. de (1968-1974). Cours de linguistique gnrale. Engler, R. (d.). Vol. 1 et 2. Wiesbaden : Otto
Harrassowitz.
Saussure, F. de (1922). Recueil des publications scientifiques de Ferdinand de Saussure. In Bally, Ch. et Gautier, L.
(ds.). Lausanne : Payot.
Saussure, F. de (2002). crits de linguistique gnrale. Bouquet, S. et Engler, R. (ds.). Paris : Gallimard.
Sowa, J. F. (2002). Building, Sharing, and Merging Ontologies. http://www.jfsowa.com/ontology/ontoshar.htm
Vallini, C. (2006). Il metalinguaggio di Saussure fra vecchie e nuove scienze. In Gensini, S. e Martone, A. (ds.), Il
linguaggio: Teoria e storia delle teorie, in onore di Lia Formigari, Napoli : Liguori Editore.
Vossen, P. (d.) (1999). Eurowordnet. A multilingual database with lexical semantic networks. Dordrecht : Kluwer.

Pour une dition numrique des manuscrits de Ferdinand de Saussure .

ISO-24613:2008.

Moravcsik, quant lui, fournit une interprtation des quatre causes aristotliciennes .

Les trois autres niveaux tant: la structure argumentale, la structure vnementielle et la structure dhritage lexical.

Une ontologie est une spcification explicite dune conceptualisation. [] Une ontologie dfinit (spcifie) les
concepts, les relations ainsi que dautres distinctions pertinentes pour la reprsentation dun domaine.

Selon ce principe, les diffrentes facettes du sens dune unit lexicale peuvent tre hrites de nuds diffrents mais
une proprit donne est hrite dun unique parent.

Dans les crits autographes de Saussure, la dfinition dun terme nest pas toujours donne de manire explicite.
Dans ce cas, seules les dfinitions fournies par Engler et Godel sont reportes dans lentre lexicale.

1056

ERC Ideas Advanced Grant 249431 Greek into Arabic. Philosophical Concepts and Linguistic Bridges.

Article en accs libre plac sous licence Creative Commons Attribution 2.0 (http://creativecommons.org/licenses/by/2.0)

Vous aimerez peut-être aussi