Vous êtes sur la page 1sur 3

3/17/22, 8:47 AM Morphèmes, morphologie

Chapitre 4 Morphèmes, morphologie


Description linguistique
Modélisation informatique

En combinant des sons élémentaires qui, par eux-mêmes, ne veulent rien


dire, on finit par réussir à "dire"
quelque chose, c'est-à-dire à
référer à quelque chose du monde, à signifier. Il y a là
un saut qualitatif
considérable qui justifie qu'on lui associe un
niveau d'analyse spécifique. Ce nouveau niveau correspond à ce
que le
sens commun identifie par la notion de "mot". Mais, comme nous le
verrons, cette notion n'est pas très
pertinente pour la linguistique,
qui lui préfère celle de "morphème".

1 Description linguistique
1.1 Problèmes avec la notion de "mot"

Qu'est-ce qu'un mot ? La première définition possible fait appel à un


critère formel : un mot c'est ce qui, dans
un texte, est compris
entre deux séparateurs. Mais cette définition n'est pas aussi
opératoire qu'on pourrait
l'espérer. Qu'on songe aux cas suivants :

l'apostrophe est, la plupart du temps, la marque d'une


séparation entre deux mots : "j'ai", "l'arbre",
"d'un",
etc. sont bien constitués de deux "mots". Pourtant,
"aujourd'hui" et "prud'homme", malgré
l'apostrophe qu'ils
contiennent, ne sont généralement considérés que comme un seul mot.
le point est apparemment un séparateur assez puissant pour
isoler les phrases. Mais suffit-il pour autant
à empêcher que
"I.B.M.", "11.09.2001" ou "M. Dupont" ne semblent constituer
qu'une seule unité ?
le tiret est un séparateur encore plus problématique : qu'est-ce
qui nous autorise à ne trouver qu'un seul
mot dans "porte-monnaie"
ou "entre-déchirer", et à en trouver plusieurs dans "(cet)
homme-là", "est-
ce-que", "voulez-vous" ? Et combien de mots y
a-t-il dans "y a-t-il" ou dans "c'est-à-dire" ?
même le caractère blanc n'est pas un séparateur fiable : on a
bien envie de faire de "parce que" ou de
"pomme de terre" un
seul mot, tandis que "du" et "au", qui résultent d'un amalgamme
("du" pour "de
le", "au" pour "à le"), en font plutôt deux à
eux tous seuls.

A défaut d'être reconnaissables par leur forme, les mots le


seraient-ils par leur sens ? Un mot pourrait-il être
caractérisé comme
la plus petite unité de sens possible ? Là encore, le critère
se révèle insatisfaisant :

faut-il considérer que "chat" et "chats" sont exactement le


même mot ? Le "s" du second ne porte-t-il
pas, à lui tout seul,
une nuance de sens spécifique ? De même, le simple "i" qui fait la
différence entre
"aimons" et "aimions" ne change-t-il pas tout ?
le sens d'un mot unique comme "inimitables" semble bien
décomposable en unités de sens
élémentaires, au point que si le
verbe "troufigner" avait un jour un sens, on en déduirait
immédiatement celui de "introufignable".

Le mot, décidément, n'est pas une engeance très fiable. Saussure, on


l'a vu, lui préférait la notion de "signe"
tandis que Martinet
parlait, lui, de "monème". La linguistique contemporaine utilise
plutôt le terme de
"morphème", avec la définition suivante :
un morphème est une unité linguistique minimale ayant une forme
et un sens. L'étude des morphèmes et de leurs modes de combinaison
est l'objet de la morphologie. La
morphologie que nous
présentons par la suite est essentiellement celle de la langue
française.

La définition d'un morphème reprend en quelque sorte les critères qui


avaient été envisagés pour le mot, mais
sans contraindre la
délimitation par des séparateurs. On peut très bien, ainsi, considérer
que "pomme de
terre", "parce que" ou même "casser sa pipe" ne
constituent chacun qu'un seul morphème. On peut même
admettre l'existence de
morphèmes discontinus à l'intérieur desquels peuvent s'insérer
d'autres morphèmes :
c'est le cas par exemple, en français, de la
marque de la négation ("je ne dort pas") ou du
passé composé "j'ai
bien dormi").
https://www.lattice.cnrs.fr/sites/itellier/poly_info_ling/linguistique005.html 1/9
3/17/22, 8:47 AM Morphèmes, morphologie

Le découpage en morphèmes d'un énoncé peut s'avérer problématique. Par


exemple, même si les mots de
"pomme de terre" ne forment, la plupart
du temps, qu'un seul morphème, dans une phrase comme "Pour les
protéger,
il a recouvert les pommes de terre", ils sont à prendre comme autant
de morphèmes distincts. Dans
quelle mesure les expressions figées
idiomatiques comme "prendre la clé des champs" ne font qu'un seul ou
plusieurs morphèmes n'est pas non plus facile à trancher.

1.2 Les différents types de morphèmes

On répartit traditionnellement les morphèmes en deux groupes : les


morphèmes lexicaux et les morphèmes
grammaticaux. Pour
opérer cette distinction, plusieurs critères sont possibles :

critère sémantique : les morphèmes lexicaux ont la particularité


"d'avoir un sens par eux-mêmes", de
"référer à quelque chose dans
le monde (objet, action, propriété...)", alors que ce n'est pas le
cas des
morphèmes grammaticaux. On range ainsi parmi les premiers,
sans trop de difficultés, les noms
communs, les verbes et les
adjectifs. Le deuxième groupe accueille, lui, naturellement, comme
son
nom l'indique, les mots qui ont essentiellement un rôle
grammatical, syntaxique. C'est le cas des
déterminants ("un",
"le", etc.), des prépositions ("à", "pour", "avec", etc.),
des conjonctions ("qui",
"donc", etc.) ainsi que des auxiliaires
("être" et "avoir") et des morphèmes qui caractérisent le genre
et
le nombre des noms, les temps de conjugaison et les personnes des
verbes. Mais ce critère sémantique
est trop vague et pas vraiment
opérationnel : où ranger, par exemple, les pronoms ("je",
"celui", etc.) et
les adverbes ("beaucoup", "demain", etc.) ?
critère énumératif : les morphèmes grammaticaux appartiennent à
une liste fermée, non extensible,
tandis que les morphèmes lexicaux
appartiennent à une liste ouverte, pouvant toujours évoluer dans le
temps. Quand on joue à inventer de nouveaux mots, ce sont toujours
des morphèmes lexicaux (cf le
"troufigner" précédent). Personne ne
s'amuserait à créer une nouvelle conjonction de coordination,
sans
du moins prendre le risque de ne pas du tout se faire
comprendre... Ce critère-là est nettement plus
facile à utiliser. Il
nous permet de classer les pronoms parmi les morphèmes grammaticaux
(on peut en
faire la liste exhaustive), et les adverbes avec les
morphèmes lexicaux (on ne disait certainement pas
"c'est mega
bien" il y a quelques années...).

Dans certaines traditions linguistiques, on utilise le terme


"lexème" pour désigner ce que nous appelons ici
"morphème
lexical", et "morphème" pour ce que nous nommons ici "morphème
gramatical". Nous nous en
tiendrons par la suite à nos termes
initiaux.

Cette distinction entre morphèmes lexicaux et grammaticaux


est sans doute plus une affaire de degré que de
coupure
franche. Certaines prépositions comme "dans", par exemple, ont une
sémantique plus riche que
d'autres comme "de", et on peut discuter
de leur classification.

Ce découpage présente aussi l'inconvénient de laisser de côté une


famille de mots qui jouent un rôle
fondamental dans le TALN à l'heure
actuelle : il s'agit des entités nommées. On nomme ainsi depuis
quelques
années la classe des expressions qui désignent soit des
"noms propres" (de lieux, de personnes,
d'organisations, etc.), soit
des "valeurs numériques" (dates, nombres, etc.). Ces mots ou groupes
de mots ont
longtemps été oubliés des classifications parce qu'ils ne
figurent pas dans les dictionnaires usuels. Mais de
nombreux textes
(par exemple, les articles de presse) en sont truffés, et ils
contribuent au sens de ces textes
de façon déterminante. Toutes les
applications de fouille de textes fondées sur le sens se doivent donc
de les
identifier et de les prendre en compte. Cela justifie qu'ils
font l'objet de recherches intensives depuis
quelques années. Nous y
reviendrons plus loin.

Il ne fait pas de doute que les entités nommées appartiennent à une


liste ouverte : tout le monde peut inventer
le nom de sa nouvelle
société, voire le prénom qu'il donne à ses enfants. Mais le caractère
référentiel de ces
expressions est un problème connu en logique depuis
longtemps comme délicat. Nous préférerons donc les
considérer comme à
une classe à part.

1.3 Combinaisons de morphèmes

La morphologie étudie comment différents morphèmes se combinent entre


eux pour former des unités plus
https://www.lattice.cnrs.fr/sites/itellier/poly_info_ling/linguistique005.html 2/9
3/17/22, 8:47 AM Morphèmes, morphologie

complexes qu'on appelera unités


lexicales, parce qu'elle vérifient en général les critères associés
aux
morphèmes lexicaux (elles réfèrent à quelque chose et on peut en
créer de nouvelles). On distingue
habituellement au moins deux façons
d'opérer des combinaisons : la composition et
l'affixation.

La composition fonctionne par simple concaténation (mise bout à bout)


de morphèmes lexicaux. Elle est à
l'oeuvre dans des exemples comme
:

bon + homme = bonhomme


porte + manteau = portemanteau
chou + fleur = chou-fleur

On peut étendre ce mécanisme à certains groupes comme "pomme de


terre" ou "laisser tomber". Ce qui
justifie que ces derniers se
comportent comme un seul morphème (sauf dans la phrase citée précédemment
!),
c'est que leur sens ne se réduit pas à une combinaison des sens
des mots qui les composent, et qu'il est
quasiment impossible dans un énoncé
d'intercaler d'autres mots entre eux.

L'affixation est un mécanisme plus complexe qui fait interagir des


morphèmes lexicaux, sous la forme de
"racines", et des morphèmes
grammaticaux, les "affixes". Les affixes sont des morphèmes non
autonomes,
c'est-à-dire qu'ils ne peuvent exister sans être rattachés
à une racine. Ils sont eux-mêmes de deux types
distincts :

les affixes dérivationnels ont un contenu quasi-lexical : ce


sont soit des préfixes comme "de", "re", etc.
soit des
suffixes comme "eur", "ement", etc. ;
les affixes flexionnels sont ceux qui servent à exprimer
les variations en genre et en nombre des noms
et des adjectifs, et
les conjugaisons des verbes. Ils se positionnent toujours en
français après les affixes
dérivationnels.

La figure 4.1 montre comment fonctionne l'affixation


en français, et l'illustre sur le mot "in-imit-able-s". Sur
cette
figure, les affixes sont mis entre parenthèses parce qu'ils sont
facultatifs.

Figure 4.1 : l'affixation en français


Une même unité lexicale peut être construite à l'aide de plusieurs affixations
successives. Les suffixes ont la
particularité (que n'ont pas les préfixes) de pouvoir changer la catégorie grammaticale de la racine à laquelle
ils s'associent, comme l'illustrent les exemples du tableau suivant :

mot
racine
suffixe
 
nominal
adjectival
adverbial
am
i
cal
ement
 
our
eu(x)
sement
 
ant
 
 

Notons enfin que les entités nommées qui désignent des noms propres
peuvent, elles aussi, subir des
dérivations : des unités lexicales
comme "néo-nantais", "pseudo-RMIste", "crypto-chomskyen",
etc. dérivent
de telles entités.

1.4 Les informations associées à une unité lexicale


https://www.lattice.cnrs.fr/sites/itellier/poly_info_ling/linguistique005.html 3/9

Vous aimerez peut-être aussi