Académique Documents
Professionnel Documents
Culture Documents
© Éditions de la Maison des sciences de l'homme | Téléchargé le 19/08/2023 sur www.cairn.info (IP: 176.173.60.187)
Josiane Boutet
Université La Sorbonne-Paris
© Éditions de la Maison des sciences de l'homme | Téléchargé le 19/08/2023 sur www.cairn.info (IP: 176.173.60.187)
© Éditions de la Maison des sciences de l'homme | Téléchargé le 19/08/2023 sur www.cairn.info (IP: 176.173.60.187)
boutet@msh-paris.fr
1. Introduction
Les apports intellectuels de John J. Gumperz à la sociolinguistique inter-
nationale sont, comme on le sait, immenses et sans doute n’en mesurons-
nous pas encore toute l’ampleur. Dans ce dossier qui lui est consacré, il
me fallait choisir une perspective, c’est-à-dire en éliminer bien d’autres
tout aussi importantes. Je vais orienter mon propos autour de sa façon
de relever, de prendre en compte et d’interpréter la contribution des faits
phonétiques (articulation et prosodie) à la construction du sens. Gumperz
a montré dans nombre de ses travaux que, si les interactants sont guidés
dans leurs processus d’interprétation par les contenus propositionnels des
énoncés perçus, ils le sont aussi, et de façon souvent non consciente, par
des phénomènes de nature phonétique, comme l’intonation, le rythme,
l’accentuation, la prononciation.
Rappelons brièvement que dans la rhétorique antique, la voix et l’in-
tonation occupaient une place importante, car elles étaient considérées
comme l’un des composants de l’efficacité de l’orateur. Aristote, dans le
livre III de Rhétorique, traitant de l’action oratoire, insiste pour que la
voix soit prise en compte : « L’action oratoire réside dans la voix, qui sera
tantôt forte, tantôt faible, tantôt moyenne (et il faut examiner) comment
on doit s’en servir pour exprimer chaque état de l’âme, quel usage faire
des intonations qui la rendront tour à tour aiguë, grave ou moyenne, et
© Éditions de la Maison des sciences de l'homme | Téléchargé le 19/08/2023 sur www.cairn.info (IP: 176.173.60.187)
prolonge ainsi les positions de Ferdinand de Saussure pour qui la phoné-
tique et les faits matériels qu’elle étudie ne font pas partie de la langue, et
donc ne sont pas objet de la linguistique : « il est impossible que le son,
élément matériel, appartienne par lui-même à la langue » (Saussure 1972
[1916] : 164). Seul le phonème, objet abstrait et immatériel, l’est. Dans
la théorie de la double articulation d’André Martinet (1966 [1960]), le
sens des énoncés s’élabore au niveau de la première articulation, celle des
monèmes (ou morphèmes) qui forment les unités significatives douées
de sens. Les unités phonétiques relèvent de la deuxième articulation où
leur fonction est seulement distinctive : elles ne peuvent pas en elles-
mêmes participer à la construction du sens. Certes, Martinet reconnaît
que des faits prosodiques peuvent concourir au sens des énoncés, ainsi la
montée mélodique dans une phrase française comme « il pleut ? » (ibid. :
97). Cependant, tout en acceptant que « ces signes jouent dans les com-
munications humaines un rôle qui n’est pas négligeable », il les rejette de
l’analyse linguistique car : « On doit les considérer comme marginaux
parce qu’un énoncé n’est proprement linguistique que dans la mesure où
il est doublement articulé. » (ibid.)
À rebours de ces formats de pensées linguistiques dominantes1,
Gumperz pose que les unités phonétiques, loin de n’être que des compo
sants matériels des mots, sont aussi et de façon consubstantielle des
composants du sens et de l’interprétation, et il s’interroge sur leur rôle
dans l’interprétation par les interactants. Or à la même époque, un autre
© Éditions de la Maison des sciences de l'homme | Téléchargé le 19/08/2023 sur www.cairn.info (IP: 176.173.60.187)
2. Éléments de comparaison
Je reconnais qu’il n’y a pas d’évidence scientifique en 2014 à faire dia-
loguer de façon posthume ces deux linguistes du xxe siècle que furent
John J. Gumperz et Yvan Fonagy ; d’autant que, à ma connaissance, ils
ne se sont jamais rencontrés et que leurs bibliographies ne mentionnent
aucune référence de l’un à l’autre. Le seul auteur qu’ils auraient pu avoir
en commun est Roman Jakobson, mais seul Fonagy le cite et s’y réfère
abondamment. Dès lors, pourquoi opérer un tel rapprochement ?
Une première similitude tient au fait que, dans un contexte intel-
lectuel dont j’ai souligné la domination dans les années 1960 et 1970
par le structuralisme dans les sciences humaines en général et en lin-
guistique en particulier, l’un comme l’autre adoptent une conception
interprétative ou herméneutique des faits de langue : ils ne s’intéressent
pas à la seule description, au seul classement linguistiques mais bien au
processus d’interprétation des énoncés dans une perspective communi-
cative, voire sémiologique. De ce fait ils s’engagent, à contre-courant des
théories dominantes positivistes, structuralistes et quantitatives2, dans une
approche qualitative des faits de langue qu’ils replacent dans le processus
de la communication et de la co-interprétation.
Une seconde similitude réside dans le type des faits de langue sur
lesquels ils font porter leur attention : le niveau phonétique dans toute
sa matérialité et y compris les faits suprasegmentaux, loin de l’abstraction
du phonème. Pour Gumperz cela s’explique par son ancrage originel dans
la dialectologie (voir ici-même Peter Auer), discipline pour laquelle le
niveau phonétique des langues a toujours été essentiel. Pour Fonagy par
sa double spécialisation en psychanalyse et en phonétique. La troisième
similitude, et certainement la plus importante, est que tous deux consi-
dèrent le niveau phonétique des langues (prosodie, rythme, intonation,
qualité de la voix, accentuation, prononciation des sons) comme porteur
d’informations spécifiques, comme un des composants du sens et de
l’interprétation. Tous deux, bien que de façon distincte, se sont attachés
à décrire et comprendre ce que l’on communique à autrui au-delà ou en
deçà des mots et de leurs contenus référentiels, au moyen de la prosodie
ou de la prononciation3.
Certes, il ne faut pas sous-estimer de fortes différences entre eux.
Premièrement, c’est dans le cadre théorique de la psychanalyse que
© Éditions de la Maison des sciences de l'homme | Téléchargé le 19/08/2023 sur www.cairn.info (IP: 176.173.60.187)
© Éditions de la Maison des sciences de l'homme | Téléchargé le 19/08/2023 sur www.cairn.info (IP: 176.173.60.187)
Fonagy se situe. Il analyse la production et l’interprétation des faits pho-
nétiques selon la théorie freudienne de l’inconscient. Gumperz, lui, place
les interprétations dans un cadre culturaliste ou sociologique. Aussi les
catégories d’analyse mobilisées par l’un et par l’autre sont-elles distinctes.
Deuxièmement, Fonagy se situe dans une perspective universaliste justifiée
par le caractère commun à tous les humains de l’appareil phonatoire ; tandis
que Gumperz développe une approche culturaliste et comparative, pre-
nant en considération les différences interculturelles et interlinguistiques.
Troisièmement, au plan de la méthode de recueil des données, Gumperz
adopte résolument une démarche ethnographique, naturelle, et recueille
des données d’interactions sociales. De façon bien différente, Fonagy
privilégie les données expérimentales, propose des tests de perception en
laboratoire, y compris en modifiant de façon expérimentale tel ou tel para-
mètre acoustique et articulatoire, de façon à isoler les facteurs qu’il étudie.
© Éditions de la Maison des sciences de l'homme | Téléchargé le 19/08/2023 sur www.cairn.info (IP: 176.173.60.187)
de rites de fertilité (ibid. : 98). Aussi, dans les langues où ce son existe (ce
qui n’est pas le cas du français standard), produire des mots avec /r/c’est
envoyer un double message : le message conscient et explicite porté par les
mots et leur combinaison. Et le message non conscient (voire inconscient)
porté par la mimique vocale du /r/ : une métaphore corporelle de la
pulsion génitale masculine.
© Éditions de la Maison des sciences de l'homme | Téléchargé le 19/08/2023 sur www.cairn.info (IP: 176.173.60.187)
3.2. Le geste vocal
Dans cette conception du double codage, les organes de la phonation
contribuent doublement à la production des sons. D’une part les mou-
vements et contractions du larynx, des cavités pharyngo-buccales, des
fosses nasales permettent l’émission des sons attendus dans le système
phonologique d’une langue donnée, comme /l/ et /a/ dans le mot « là »
qui sera identifié comme tel par un auditeur : c’est le message linguistique.
Mais, parce que ce sont des sons concrets et non des phonèmes abstraits,
ils porteront aussi des phénomènes comme : un dévoisement de la voyelle
dans une voix caressante ou fatiguée ; un allongement de la consonne
et/ou une descente mélodique dans un ordre ; une forte contraction du
larynx dans l’expression de la colère, etc. Ceux-ci constituent ce que
Fonagy nomme « le geste vocal », qui se greffe nécessairement dans la
vive voix sur le message linguistique. Le geste vocal est donc l’écart entre
l’articulation idéale attendue dans une langue donnée – par exemple,
6. Une des conséquences importantes de cette conception du langage est que la démo-
tivation du signe linguistique, sur laquelle repose toute la théorie saussurienne
de la langue, se voit remise en question. Le codage secondaire remotive la subs-
tance phonique, ce que les linguistes structuralistes ne prennent pas en compte :
« L’interprétation psychologique de l’accent ou de l’intonation ne concerne guère le
linguiste préoccupé des règles qui déterminent l’emploi des schémas accentuels et
intonatifs, sans se soucier des bases pulsionnelles hypothétiques de l’accent ou de l’in-
tonation. Pas plus que des bases pulsionnelles éventuelles des consonnes “mouillées”,
“dures”, ou “sucrées”, des voyelles “vulgaires” ou “délicates”, vu que l’interprétation
phonologique ou sémantique des mots est complètement indépendante du caractère
pulsionnel des phonèmes qui les composent. » (Fonagy 1991 [1983] : 147)
L’INTERPRÉTATION DES FAITS PHONÉTIQUES / 77
© Éditions de la Maison des sciences de l'homme | Téléchargé le 19/08/2023 sur www.cairn.info (IP: 176.173.60.187)
dans un rapport complexe entre elles. Au sein du double codage, elles
peuvent converger ; ainsi l’ordre « va-t’en » peut être prononcé d’une voix
autoritaire avec une forte constriction laryngée et une courbe mélodique
descendante. Elles peuvent aussi diverger, ce même ordre étant prononcé
d’une voix plaintive avec un allongement des voyelles et des montées mélo-
diques régulières et faibles. On verra plus loin (section 5) que la figure de
l’ironie procède d’une divergence entre les contenus propositionnels (niveau
du codage linguistique) et le geste vocal (niveau du codage secondaire).
© Éditions de la Maison des sciences de l'homme | Téléchargé le 19/08/2023 sur www.cairn.info (IP: 176.173.60.187)
Discourse Strategies 8.
Levinson (1997) remarque et souligne à juste titre que, dans les très
nombreux exemples de dialogues fournis par Gumperz, les contextualiza-
tion cues tendent à présenter des régularités linguistiques formelles :
a – Lorsqu’ils sont de nature lexico-syntaxiques, on trouve des alternances
lexicales, ce qu’on peut classer comme des changements de registres. C’est
l’exemple, là aussi bien connu, de cet étudiant noir qui n’a pas su s’adapter
au style discursif de son interlocuteur. Menant une enquête, il souhaite
interviewer une femme noire-américaine contactée au préalable par
téléphone. Il sonne à la porte, est reçu par le mari souriant et le dialogue
s’engage ainsi :
Husband So y’re gonna check out ma ol lady, hah ?
Interviewer Ah, no. I only came to get some information. They called
from the office
(Husband, dropping his smile, disappears without a word and calls her
wife.) (Gumperz 1982 : 133)
L’entretien est ensuite insatisfaisant. Gumperz analyse cet échange comme
une inférence mal interprétée par l’étudiant. Le mari, par le style de sa
7. Les contextualization cues ont été à juste titre traduits par « indices de contextualisa-
tion » en français. On perd cependant avec le mot d’« indice » la pluriaccentuation et
l’épaisseur sémantique de cues en anglais qui renvoie en même temps pour le locuteur
anglophone à la notion de « réplique », de « fin de tirade » et « d’indication, d’indice ».
8. En particulier les chapitres v « Prosody in conversation » (p. 100-130), vi « Contex-
tualization conventions » (p. 130-152) et vii « ������������������������������������
Sociocultural knowledge in conversa-
tional inference » (p. 153-171).
L’INTERPRÉTATION DES FAITS PHONÉTIQUES / 79
formule « y’re gonna check out ma ol lady », attendait une réponse dans
un même style d’anglais noir américain, comme « Yeah, I ma git some
info ». L’étudiant n’a pas été capable de comprendre, d’interpréter et de
s’adapter aux « stylistic cues » du mari.
b – Les contextualization cues peuvent aussi se réaliser comme une constel-
lation de traits, à la fois prosodiques, kinésiques et lexicaux (comme dans
l’exemple du jeu entre des passagers dans un avion, 1982 : 161 et suiv.).
c – Très souvent, les indices de contextualisation sont portés par des
faits de nature verbale suprasegmentale (intonation, rythme, accentua-
tion), comme on l’a vu précédemment avec le chauffeur de bus. Aussi,
« [s]uprasegmental and other surface features of speech are often crucial
to identifying what an interaction is about » (1982 : 162).
La question de l’interprétation
© Éditions de la Maison des sciences de l'homme | Téléchargé le 19/08/2023 sur www.cairn.info (IP: 176.173.60.187)
© Éditions de la Maison des sciences de l'homme | Téléchargé le 19/08/2023 sur www.cairn.info (IP: 176.173.60.187)
Dans les nombreux dialogues qu’il analyse, Gumperz montre que les phéno-
mènes suprasegmentaux comme l’accentuation (place et force de l’accent),
les contours prosodiques ont une fonction proprement sémantique et
participent pleinement au sens des interactions. Il montre aussi qu’ils sont
souvent conventionnellement organisés dans les différentes langues. Par
exemple, une descente mélodique peut, selon la langue ou selon la variété
de langue, signifier une simple assertion ou de la colère. Aussi, en situation
de communication interculturelle, l’interprétation de ces indices supra
segmentaux peut-elle se révéler particulièrement délicate et sujette à malen-
tendus : ce sont les situations d’incidents, l’a-synchronie conversationnelle,
la réussite ou l’échec de l’interprétation. Cependant, même en situation de
communication non interculturelle, la perception et l’interprétation par les
locuteurs des indices de contextualisation n’est pas chose aisée. La nature
même de ces indices, qui pour une large part impliquent le suprasegmental,
font qu’ils sont dépendants du contexte précis d’une interaction concrète ;
à la différence du niveau segmental des mots dont le sens est, pour une part
au moins, indépendant de leur occurrence particulière :
The linguistic character of contextualization cues is such that they are
uninterpretable apart from concrete situations. In contrast to words or seg-
mental morphemes which, although ultimately also context-bound, can at
least be discussed in isolation, listed in dictionaries and explained in gram-
mar, contextualization phenomena are impossible to describe in abstract
terms. (Gumperz 1982 : 170)
C’est pourquoi l’interprétation des indices de contextualisation relève
de processus inférentiels, afin de percevoir et reconnaître ce que leur
présence véhicule de façon implicite.
80 / JOSIANE BOUTET
© Éditions de la Maison des sciences de l'homme | Téléchargé le 19/08/2023 sur www.cairn.info (IP: 176.173.60.187)
s’agit d’une tension mal résolue entre d’un côté le contenu propositionnel,
c’est-à-dire les éléments segmentaux que sont les mots, les énoncés, et de
l’autre le geste vocal au sens de Fonagy ou les indices de contextualisation
au sens de Gumperz, c’est-à-dire les éléments suprasegmentaux que sont
les allongements, le rythme, la hauteur de la voix, le dévoisement. Cette
mauvaise résolution conduit, dans l’interaction entre une opératrice de
centres d’appels et un client, à des interprétations non convergentes : en
particulier, le conseiller téléphonique se révèle incapable de reconnaître
et de décoder la figure de l’ironie dans l’énoncé du client (Boutet 2008).
Les premiers échanges professionnels concernent l’offre de service de
la conseillère qui souhaite « proposer les services de l’entreprise », « faire
le point », « donner des conseils en économie d’énergie ». Suivent les
échanges suivants9 :
1 A. très bien - alors mon rôle va être donc de vous apporter des
conseils comme j’vous l’ai dit auparavant [souffle] afin que vous
optimisiez au mieux votre facture et votre confort - alors avez-
vous des préoccupations particulières monsieur X euh: concer-
nant votre chauffage votre: au niveau du coût du confort dans
votre logement
2 Cl. ABsolument pas: c’est très cher: mais ça va bien
3 A. d’accord donc c’est une préoccupation le coût
9. Conventions de transcription :
: allongement
- pause brève
/ parole coupée par autrui
chevauchement.
L’INTERPRÉTATION DES FAITS PHONÉTIQUES / 81
© Éditions de la Maison des sciences de l'homme | Téléchargé le 19/08/2023 sur www.cairn.info (IP: 176.173.60.187)
syllabe « ab », qui est à la fois allongée et haute. La voyelle /a/ de l’adverbe
« pas » est allongée. L’ensemble est dit avec un débit très lent, un allonge-
ment marqué sur « cher » et un dévoisement de la voyelle nasale /E/ du
mot final « bien ». Le contenu propositionnel de cet énoncé est contra-
dictoire : comment peut-on à la fois énoncer qu’on n’a pas de problèmes,
que quelque chose est « très » cher, et en même temps juger et évaluer cette
situation positivement ? À cette contradiction dans les contenus proposi-
tionnels se combine un geste vocal ou des indices de contextualisation de
nature suprasegmentaux faits de lenteur de l’élocution, de dévoisement
et d’allongement des voyelles : il n’y a pas de colère ou de violence dans
l’intonation mais au contraire comme un calme amusement. Ceci tend
à orienter l’interlocuteur vers la figure de l’ironie.
Selon Fonagy, celle-ci résulte de signaux conflictuels entre les contenus
propositionnels énoncés et l’intonation : « de ces instructions contradic-
toires […] résultera une phrase ironique c’est-à-dire un message qui se
transforme en son contraire au cours du décodage » (1991 [1983] : 15).
L’interprétation des indices de contextualisation de nature suprasegmen-
tale est, on l’a vu, souvent difficile. L’ironie qui repose précisément sur
une disjonction entre les mots et l’intonation n’est pas nécessairement
perceptible et perçue dans les interactions verbales. Ce qui est le cas ici.
De plus, on peut supposer que la situation de communication profes-
sionnelle de l’opératrice, aux prises avec un script écrit par lequel sa parole
doit nécessairement passer, ne facilite pas la reconnaissance de l’ironie
qui suppose une attention forte, une disponibilité aux propos d’autrui.
L’échange suivant (lignes 3 et 4) signe en quelque sorte leur mal
entendu : la conseillère enchaîne sur le « coût », probablement parce que
82 / JOSIANE BOUTET
© Éditions de la Maison des sciences de l'homme | Téléchargé le 19/08/2023 sur www.cairn.info (IP: 176.173.60.187)
question ouverte du type « que pensez-vous de vos consommations ? »,
elle s’adresse à lui par une question fermée « vous trouvez que vous avez
des consommations importantes ? » Poursuivant dans un même style
prosodique, le client lui répond d’une voix lente, patiente, avec des allon-
gements sur « oh » puis sur la voyelle finale /E/ de « enfin ». Une montée
importante de la voix sur la syllabe finale de « normal » donne le ton de
l’évidence partagée avec le co-énonciateur. Sans tenir compte du chevau-
chement avec la conseillère (lignes 12/13), il énonce son argument « vu
les coûts de l’X », puis il répète l’énoncé évaluatif « c’est normal » avec la
même intonation que lors de sa première formulation.
Lenteur de la voix, allongements, dévoisements : il y a là un ensemble
d’indices de contextualisation de nature prosodique que la conseillère n’a
pas pu ou su repérer ni comprendre. Tout entière prise par le script de
l’entreprise dont elle ne sait pas se départir, elle n’interprète en aucune
façon les contenus implicites portés par le geste vocal et les indices de
contextualisation. Ce dialogue professionnel se terminera très mal, par un
client excédé qui refusera tout autre contact futur, postal ou téléphonique,
avec l’entreprise. Bref, un dialogue professionnel raté.
6. Pour conclure
Interpréter dans l’interaction, c’est engager tout un travail pour tenter de
converger à la fois sur le dit explicite de l’interlocuteur et sur son vouloir
dire implicite. Pour ce faire, il faut prendre des indices dans trois grands
ensembles de signes partiellement indépendants :
– les indices non verbaux comme l’hexis corporelle, la proxémie, les
gestes corporels, les regards, les sourires, les mimiques, etc. ;
L’INTERPRÉTATION DES FAITS PHONÉTIQUES / 83
© Éditions de la Maison des sciences de l'homme | Téléchargé le 19/08/2023 sur www.cairn.info (IP: 176.173.60.187)
Élements de bibliographie
Kassaï, G. (1983), « Yvan Fonagy. La vive voix », Langage & Société, 26 :
65-69.
Levinson, S. C. (1997), « Contextualizing Contextualization Cues », in
S. Eerdmans et al. (eds.), Discussing Communication Analysis, 1, Lau-
sanne, Beta Press.
Martinet, A. (1966 [1960]), Éléments de linguistique générale, Paris, Colin.
Mondada, L. (dir.) (2014), Corps en interaction, Lyon, ENS Éditions.
Saussure, F. de (1972 [1916]), Cours de linguistique générale, Paris, Payot.
© Éditions de la Maison des sciences de l'homme | Téléchargé le 19/08/2023 sur www.cairn.info (IP: 176.173.60.187)
© Éditions de la Maison des sciences de l'homme | Téléchargé le 19/08/2023 sur www.cairn.info (IP: 176.173.60.187)