Vous êtes sur la page 1sur 48

Extrait de P.

Mertens (2019) Phonétique, phonologie et prosodie du français – 55

La prosodie et l’intonation du français

1 La prosodie, ses aspects et ses fonctions

1.1 Délimitation du domaine de la prosodie


La transcription phonétique représente la parole comme une suite de segments
sonores ; on parle donc du niveau segmental. Le contraste entre ces sons repose sur des
différences de timbre qui sont à la fois audibles et distinctives : si on oppose le [i] au
[e], c’est que cette différence de timbre engendre des oppositions de sens, par exemple
[ni] ~ [ne] (« nid » ~ « nez »).
Outre ces oppositions de timbre, la parole présente d’autres propriétés audibles ayant
une fonction dans la communication : il s’agit des variations de hauteur, d’intensité et
de durée (durée des sons ou des syllabes) qui constituent le matériau de base de la
mélodie, de l’accentuation, du rythme et des pauses ; on peut y ajouter la qualité de la
voix (le type de phonation). On appelle prosodie l’ensemble de ces propriétés. Comme
celles-ci se réalisent rarement sur des segments individuels, mais le plus souvent sur des
entités plus grandes, telles que la syllabe, le groupe de syllabes ou l’énoncé, on parlera
du niveau suprasegmental.
Les deux niveaux, segmental et suprasegmental, sont autonomes : la voyelle [] peut
être prononcée à différentes hauteurs sans que l’identification du son (ou du mot auquel
elle appartient) soit affectée ; de la même façon l’interprétation d’un contour mélodique
reste identique quel que soit le support segmental auquel il est associé : syllabe simple,
constituée d’une voyelle seulement, syllabe complexe, comportant une attaque, un
noyau et une coda, ou encore suite de syllabes.

1.2 Les composantes de la prosodie


Les composantes élémentaires de la prosodie sont la hauteur, la durée et l’intensité.
1. La hauteur (angl. : pitch ; néerl. : toonhoogte) permet d’opposer des syllabes
hautes et basses ou, d’une manière générale, des syllabes de hauteur différente ; c’est
comme en musique, où on a des notes de hauteur différente. L’intervalle de hauteur (ou
intervalle mélodique) indique la distance mélodique (l’écart sur l’échelle de hauteur)
entre deux notes, entre deux syllabes, ou plus généralement entre deux instants du signal
sonore. La variation mélodique montante ou descendante peut se manifester sur une
seule syllabe ou s’étaler sur une suite de plusieurs syllabes. Lorsque la hauteur change
de façon audible et graduelle au cours d’un même son ou d’une même syllabe, donnant
une montée ou une chute sur cette même unité, on parle d’un glissando. Les change-
ments de hauteur sur une suite de syllabes donnent lieu à une mélodie. L’évolution de la
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 56

hauteur est appelée la courbe mélodique. On appelle registre l’intervalle entre les
hauteurs minimale et maximale employées par un locuteur.
2. La longueur permet d’opposer les éléments (sons, syllabes) brefs aux éléments
longs1. Le débit de parole ou tempo en fournit une mesure globale ; il indique le nombre
d’éléments (sons, syllabes) réalisés par unité de temps (par seconde, par exemple). Le
débit est d’autant plus élevé que les durées des éléments sont brèves. Le changement
rapide du débit provoque des accélérations ou des ralentissements de la parole. À un
niveau très local, les variations de longueur entre les syllabes donnent lieu au rythme.
Celui-ci peut être caractérisé comme la perception d’une organisation dans la succession
des syllabes, reposant sur leur poids relatif.
3. L’intensité permet d’opposer les sons forts aux sons faibles. Si une syllabe se
détache des syllabes environnantes par son intensité élevée, cela contribue à l’impres-
sion de l’accentuation de cette syllabe.
Les caractérisations auditives ci-dessus renvoient toutes à la façon dont ces phéno-
mènes prosodiques sont perçus par l’auditeur, qui est le premier observateur de la
parole. On s’intéressera également à leur origine physiologique (comment l’appareil
phonatoire permet-il de produire des variations de hauteur, par exemple), à leur mani-
festation acoustique (par quelles propriétés acoustiques se manifestent la hauteur,
l’intensité, la durée ; comment on les mesure), à leur perception (comment est perçue
une variation de hauteur), à leur fonctionnement linguistique et à leur représentation
phonologique (ou abstraite). Il importe de toujours préciser le niveau d’analyse ou de
description auquel on se situe : physiologique, acoustique, auditif, perceptif ou linguis-
tique. La terminologie l’indique dans la plupart des cas. Le tableau ci-dessous met en
relation les plans auditif et acoustique.

domaine auditif domaine acoustique


propriété auditive effet auditif sur paramètre acoustique unité de
une suite mesure
d’éléments
hauteur mélodie fréquence fondamentale Hz
intensité [accentuation] niveau sonore dB
durée/longueur débit, rythme, durée (temps) s
[accentuation]
pause durée (temps) s

Tableau 1. Composantes prosodiques, terminologie perceptive et acoustique.

1
Dans certaines langues, comme en néerlandais, la longueur contribue aux oppositions entre
phonèmes ; elle y a une valeur phonologique et distinctive. Dans d’autres langues, tel le
français, la durée des phonèmes dépend de facteurs comme le contexte phonétique et l’accen -
tuation, et la longueur n’y a pas de valeur distinctive.
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 57

Au niveau physiologique la hauteur correspond à la fréquence de vibration des


cordes vocales. Plus la vibration est rapide, plus le ton perçu sera haut. En acoustique, le
nombre de cycles de vibration par unité de temps est appelé la fréquence ; elle est
mesurée en Hertz (Hz). La fréquence de la vibration glottale est appelée fréquence
fondamentale (notée F0, prononcé « F zero »). La durée se mesure en secondes (s).
L’intensité perçue (anglais loudness ; français intensité subjective ou sonie, néerlandais
luidheid) dépend entre autres du niveau sonore, qui peut se mesurer en décibel (dB).
L’évolution de ces composantes prosodiques dans la temps, sur la suite de syllabes
de l’énoncé, engendre des propriétés prosodiques dérivées. L’évolution de la hauteur
donne lieu à une mélodie, au contour mélodique. Les différences d’intensité font ressor-
tir telle ou telle syllabe comme étant plus intense ou plus proéminente. Étant donné les
variations de durée syllabique, telle syllabe est perçue comme étant plus longue que les
syllabes voisines. Ensemble, les proéminences d’intensité et de durée contribuent à la
perception de l’accentuation de la syllabe en question.
Le rythme aussi est une caractéristique associée à la suite de syllabes. Il correspond à
l’organisation interne de la séquence syllabique, qui repose sur la régularité dans
l’alternance entre syllabes faibles et fortes, où le poids de chaque syllabe dépend de ses
propriétés prosodiques : sa durée relative, son accentuation et sa hauteur.
La pause, au sens restreint de pause silencieuse, correspond à un silence, c’est-à-dire
à une interruption de la phonation d’une durée suffisante, de l’ordre de la durée d’une
syllabe au moins. En effet, le silence très bref qui accompagne la tenue d’une occlusive
sourde, comme dans [epe], n’est pas identifié comme une pause. L’alphabet phonétique
ne prévoit aucun signe particulier pour indiquer les pauses ; nous emploierons le signe
d’égalité =. On oppose parfois les pauses silencieuses aux pauses remplies. Ces
dernières indiquent des sons tels que [ə] [œ], ou [ø], correspondant aux « euh » de la
langue écrite, dont la fonction serait comparable à celle des pauses silencieuses.

1.3 Langues à tons et langues à intonation


Selon le rôle joué par la hauteur, on oppose les langues à tons aux langues à
intonation.
Dans les langues à tons, comme le mandarin, le vietnamien ou les langues bantoues,
chaque élément du lexique s’accompagne d’un ton. Il s’agit du niveau ou de la variation
de hauteur qui accompagne la syllabe (ou telle ou telle syllabe de l’élément lexical). Ces
langues n’emploient en général que quelques tons distincts, de l’ordre de 2 à 5. Selon le
ton utilisé, la même suite de sons peut alors désigner différents éléments du lexique. La
hauteur y a donc une fonction distinctive lexicale. Dans certains cas, les tons jouent
également un rôle dans le marquage de propriétés morphologiques ou grammaticales.
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 58

Figure 1. Les tons du chinois

L’illustration ci-dessus montre les quatre2 tons du mandarin, associés à une même
suite de sons, avec la signification résultante. L’extrait qui suit, tiré d’un roman de
Pascal de Duve, décrit leur forme à partir de la façon dont l’interpréterait un Français.

Les sinologues maîtrisent rationnellement le ton de chacune des syllabes qu’ils


prononcent – sous peine de ne pas être compris. Nous, nous avons plutôt tendance à
donner à la hauteur de notre voix une connotation émotive qui, du reste, peut avoir une
certaine valeur sémantique. Oui. Je me servirai d’ailleurs de ce rapprochement pour
expliquer comment on prononce les quatre tons du chinois. Le premier est celui qu’on
pourrait qualifier, à l’occidentale, de « ton de l’indifférence », il reste à hauteur égale :
aaaah, comme quand le médecin vous appuie une cuillère sur la langue pour inspecter
votre gorge. Le second ton monte, c’est celui, pourrait-on dire, de l’étonnement calme : a-
ah?, comme dans: « A-ah? Vous n’êtes pas parti ? Tiens, c’est étrange, j’aurais juré vous
avoir vu partir. » Le troisième ton descend puis remonte, voilà pourquoi je l’appellerai le
ton de la compréhension en cours; c’est le m-m-m que la personne à qui on explique
quelque chose énonce régulièrement, en principe à toutes les étapes importantes du
raisonnement pour indiquer qu’elle le suit et encourager le locuteur à continuer la
démonstration. Enfin, le quatrième ton tombe brutalement, comme quand on prononce
l’interjection na!, exclamation enfantine servant à renforcer une affirmation ou une
négation de caractère souvent capricieux ; le Larousse cite: « J’irai pas, na ! » — Pascal
de Duve. « Izo ». Editions Jean-Claude Lattès. 1990.

Les langues romanes (français, italien, espagnol…) et germaniques (allemand,


anglais, néerlandais...) sont des langues à intonation. Dans ces langues la prosodie
remplit des fonctions diverses, à l’exception de la fonction lexicale observée pour les
langues à tons. D’abord, la prosodie sert à signaler le statut informationnel des consti-
tuants : quel constituant dans l’énoncé apporte une information importante dans la
perspective du locuteur. Elle marque l’organisation syntaxique : quelles parties forment
un tout et comment les ensembles résultants se rapportent les uns aux autres. Elle
indique des informations pragmatiques, permettant au locuteur d’indiquer qu’il enchaîne
sur l’énoncé précédent, qu’il entend garder la parole, qu’il termine une proposition, etc.
Enfin, la prosodie joue un rôle dans l’expression de l’état émotif du locuteur. Plus loin,
nous examinerons plus en détail quelques-unes de ces fonctions, telles qu’elles se
manifestent en français.
À la fois l’inventaire des formes mélodiques et le système (la grammaire) qu’elles
mettent en place varient d’une langue à l’autre. Le terme intonation désignera le code
linguistique mis en œuvre par les propriétés prosodiques (notamment les variations

2
Certains sinologues prévoient un cinquième ton neutre.
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 59

mélodiques, la durée et l’accentuation) et son utilisation fonctionnelle dans une langue


donnée.
Pour illustrer ces fonctions multiples, il convient de se munir d’un instrument pour
identifier, représenter et transcrire les formes intonatives de façon univoque.

1.4 La transcription de l’intonation


Les systèmes de notation de l’intonation abondent. Ils reflètent les choix théoriques
de leurs auteurs et les techniques d’analyse utilisées. Malheureusement aucun système
n’est généralement accepté. Martin (2009) offre un panorama complet des systèmes de
notation proposés ; ici on se limitera aux types principaux.
Les premières transcriptions de la hauteur dans la parole étaient des transcriptions
auditives, faites à l’oreille : à l’époque, l’enregistrement sonore (sur bande magnétique)
et l’analyse acoustique n’avaient pas encore été inventés et les phonéticiens n’avaient
pour outil d’analyse que l’ouïe. On indiquait la hauteur relative de chaque syllabe par un
trait placé entre deux lignes horizontales délimitant le registre du locuteur (cf. Couste-
noble & Armstrong 1931, Delattre 1961, Zwanenburg 1965, pour le français).

Figure 2. Transcription auditive manuelle de la hauteur dans la parole

En l’absence d’une calibration de l’axe vertical, l’interprétation des intervalles mélo-


diques devient très imprécise. Étant déterminé par la graphie des mots, l’axe horizontal
ne respecte pas le temps réel, de sorte que toute information sur la durée des syllabes,
sur le tempo et le rythme se perd. Le fait que la transcription est réalisée par un seul
individu la rend subjective et peu fiable. Enfin, ce genre de transcription est extrême-
ment lent et demande un entraînement intensif préalable : un vrai travail de bénédictin.
Le procédé rappelle bien sûr la portée musicale, qui par ailleurs a également été
utilisée (Kahn 1968, 1969). Dans ce cas, la précision élevée des intervalles mélodiques
dépasse cependant les capacités auditives de l’auditeur moyen.

Figure 3. Transcription de la hauteur proposée par Kahn (1968).


Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 60

Certains auteurs se sont servis de la typographie (la position des lettres sur l’axe
vertical) pour imiter la courbe mélodique (le « texte dansant » de Bolinger 1951), d’une
façon fort approximative.
Certains phonologues structuralistes (Pike 1945, Trager & Smith 1951, pour
l’anglais ; Isachenko & Schädlich 1964, pour l’allemand) représentent les variations de
hauteur à l’aide d’un nombre restreint de niveaux de hauteur (de 2 à 5, selon les
auteurs ; cf. infra §3.4). Ces niveaux seront indiqués de plusieurs façons. Soit on utilise
un jeu de lignes superposées sur lesquelles les syllabes sont marquées par des traits :
une portée musicale simplifiée, en quelque sorte. Alternativement on surimpose au texte
une ligne dont la hauteur peut varier par quelques pas (Smalley 1964). Enfin, les
niveaux peuvent être notés par des chiffres, qui seront insérés dans le texte (Pike 1945).

Figure 4. Transcription de la hauteur à la manière de Smalley (1964).

Des transcriptions basées sur l’analyse acoustique apparaissent vers 1960. Le


spectrographe3, inventé en 1945, permet de visualiser les harmoniques (les composantes
simultanées d’un son voisé) présents dans le signal de parole, leur évolution dans le
temps et donc l’évolution de la fréquence fondamentale, bien qu’avec une résolution
temporelle réduite. Ainsi, la notation proposée par Delattre depuis 1961 était basée
(assez librement) sur l’analyse spectrographique. Des courbes continues, portant sur des
groupes de syllabes, y remplacent les traits associés aux syllabes individuelles.

Figure 5. Transcription de l’intonation proposée par Delattre (1961, 1966).

Le type de transcription proposé par Delattre a eu beaucoup d’influence en France.


Sa simplicité apparente constitue en même temps son inconvénient majeur, à cause du
manque de précision : elle ne montre pas où exactement se produit (commence ou finit)
une variation mélodique, si la variation arrive à l’intérieur d’une syllabe (la syllabe
finale, par exemple) ou au contraire s’étale sur tout un groupe.
Pour bon nombre de phonologues, la courbe mélodique prononcée (ou mesurée)
n’est que la réalisation sonore d’une spécification sous-jacente de l’intonation, qui pren-
drait la forme d’une suite de cibles mélodiques (par exemple, des niveaux de hauteur),
associées à des endroits précis de l’énoncé, plus particulièrement à certaines syllabes ou
aux frontières de constituants. La notation peut alors se limiter à indiquer la hauteur de
ces cibles.
3
Voir le chapitre sur le phonétique acoustique.
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 61

Figure 6. Transcription manuelle de l’intonation proposée par Mertens (1987).


Dans la partie centrale, les accents aigu et grave, le dièse et les deux points
indiquent respectivement l’accent fort et faible, la pause et l’allongement marqué.
Les symboles dans la partie inférieure représentent la spécification abstraite sous-
jacente (les cibles), qui sera commentée plus loin.

Depuis les années 1970 on a vu apparaître des appareils spécialisés pour la mesure de
la fréquence fondamentale (F0), appelés détecteur du fondamental ou détecteur de
mélodie. L’illustration ci-dessous fournit un exemple de la mesure acoustique obtenue.

Figure 7. Courbe de F0 du signal « vous dites vous : la misogynie est le pilier de


toute société patriarcale » (corpus Benoîte Groult).

Afin d’interpréter ce tracé et de déterminer à quelle syllabe de l’énoncé correspond


telle ou telle partie de la courbe, il est nécessaire de l’aligner avec la transcription pho-
nétique, c’est-à-dire d’indiquer le début et la fin de chaque son. Cet alignement peut être
obtenu de plusieurs façons, le plus souvent manuellement. (Il existe des outils informa-
tiques spécialisés permettant de délimiter de façon interactive des fragments du signal,
de les écouter, de les étiqueter et de sauvegarder un fichier d’annotation.)

Figure 8. Courbe de F0 avec l’alignement phonétique (alphabet SAMPA) de l’énoncé


de la figure précédente.

La segmentation en sons est facilitée par l’alignement du signal avec la courbe


d’intensité et avec le spectrogramme (cf. le chapitre sur la phonétique acoustique).
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 62

Figure 9. Tracé de F0 (trait plein) et courbe d’intensité (pointillés) pour le même


énoncé.

Cependant l’interprétation correcte des mesures acoustiques suppose des connais-


sances solides en phonétique acoustique, ainsi qu’un alignement des tracés avec la
transcription phonétique.
La confrontation entre les transcriptions manuelles et les analyses acoustiques met en
évidence un fait crucial. Manifestement l’oreille humaine est incapable d’identifier cer-
taines variations pourtant évidentes sur le tracé acoustique. Il serait dès lors erroné de
prendre toute variation acoustique (même celles d’une certaine taille) pour un phéno-
mène audible et pertinent sur le plan linguistique. Il faut tenir compte de la perception
de la prosodie chez l’auditeur humain.
L’illustration suivante, appelée prosogramme4, montre une transcription semi-
automatique de la mélodie, basée sur nos connaissances concernant la perception de la
hauteur. Cette représentation du fondamental adopte l’échelle musicale en tons (ou en
demi-tons), plus proche de la hauteur perçue que la fréquence en Hertz. L’intervalle
entre deux lignes horizontales correspond à 2 demi-tons 5. Le trait épais associé à une
syllabe indique sa hauteur perçue. La calibration de l’axe du temps sur l’axe horizontal
donne des repères aux multiples de 100 ms ainsi que le temps à chaque seconde.

4
L’outil informatique Prosogram a été proposé par Mertens en 2004. Il s’agit d’une simulation
de la perception de la hauteur basée sur le modèle de perception tonale proposé par
d’Alessandro & Mertens (1995), Mertens & d’Alessandro (1995), Mertens et al. (1997). Le
modèle intègre les résultats d’études psycho-acoustiques sur la perception des variations de
fréquence fondamentale (seuil de glissando, effet de segmentation...).
5
L’intervalle mélodique qui sépare deux lignes dans la portée musicale est de 4 demi-tons dans
la plupart des cas, sinon de 3 demi-tons.
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 63

Figure 10. Prosogramme simple d’un fragment de corpus enregistré. L’alignement


temporel des sons et des mots apparaît en bas. La calibration sur l’axe horizontal
indique le temps en secondes. L’axe vertical gauche indique la hauteur en demi-
tons, l’axe vertical droit donne la fréquence fondamentale en Hertz.

L’illustration suivante, qui constitue une variante de la précédente, ajoute l’intensité


(le trait fin continu, en décibel), et le fondamental mesuré, sur la même échelle en demi-
tons (trait plein ; il sera la plupart du temps couvert par le trait épais indiquant la hauteur
perçue).

Figure 11. Prosogramme riche, ajoutant le F0 (trait fin en bleu), l’intensité (trait
continu en vert), le voisement et le noyaux syllabiques.

La représentation fournie par Prosogram est à la fois riche en informations et facile à


interpréter. Elle préserve l’organisation temporelle de l’énoncé et permet ainsi de déter-
miner la durée des syllabes, des sons et des pauses. Elle permet de déterminer les inter-
valles mélodiques et la hauteur absolue des syllabes. Un trait de hauteur incliné indique
que la syllabe en question présente, d’après le modèle de perception tonale, une varia-
tion de hauteur audible montante ou descendante.

Figure 12. Prosogramme d’un énoncé présentant des variations mélodiques intra-
syllabiques.
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 64

2 L’accent

2.1 L’accentuation
Certaines syllabes se détachent des syllabes environnantes par un ou plusieurs
aspects prosodiques : par la hauteur, par sa durée, par l’intensité, ou par une variation de
hauteur importante. La syllabe en question est alors proéminente. L’accentuation est un
type particulier de proéminence.
L’accentuation d’une syllabe peut se manifester de plusieurs façons, soit par sa force
phonatoire particulière (résultant de la pression sous-glottique élevée), soit par l’allon-
gement. Ensemble ces aspects produisent l’impression d’un niveau sonore plus élevé
pour la syllabe en question. Dans certains cas, l’effort phonatoire pour l’accentuation
affecte également l’articulation du groupe consonantique à l’attaque, la durée des
consonnes, ainsi que l’organisation temporelle des segments à l’intérieur de la syllabe.
L’alphabet phonétique international indique l’accentuation à l’aide du signe [] qui
sera placé devant la syllabe accentuée ou devant sa voyelle : « décision » [].
Selon la force de l’accent, on fait parfois la distinction entre l’accent primaire et
l’accent secondaire, indiqué par le signe [], par exemple dans les mots composés relati-
vement longs en néerlandais : « belastingskantoor » [], où le premier
accent sera plus fort que le deuxième6.

2.2 Langues à accent fixe et langues à accent libre


Comparons la place de l’accent dans des mots apparentés par l’étymologie ou la
morphologie dérivationnelle, et ceci pour plusieurs langues. Dans les formes ci-dessous
le soulignement indique la syllabe accentuée.
français photo photographe photographie photographique
néerlandais foto fotograaf fotografie fotografisch
anglais photo photograph photographer photography photographic
italien foto fotografo fotografia fotografico

D’abord, pour chacune de ces langues, la place de l’accent change d’une forme déri-
vée à l’autre. En anglais, par exemple, il frappe tantôt la première syllabe (« photo »),
tantôt la deuxième (« photography »), tantôt encore la troisième (« photografic »).
Ensuite, pour les formes correspondantes dans certaines langues, la position de
l’accent varie d’une langue à l’autre : c’est la troisième syllabe pour « photographe » et
« fotograaf », mais la deuxième pour « photographer » et « fotografo ».

6
Dans certaines études récentes sur l’intonation du français, ces mêmes termes sont employés
différemment : les accents primaire et secondaire désignent alors respectivement l’accent final
et l’accent initial (cf. infra, §2.4).
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 65

Troisièmement, dans une langue donnée, le déplacement de l’accent donnerait des


formes agrammaticales. Dans le mot anglais « proposal » par exemple, l’accent frappe
nécessairement la deuxième syllabe et l’accentuation de la première ou de la dernière
syllabe donnerait un forme agrammaticale. Il en est de même du mot « accurate », où
l’accent porte toujours sur sa première syllabe.
Ces observations permettent d’opposer deux types de langues selon la place de
l’accent. Dans une langue à accent libre, comme l’anglais, le néerlandais ou l’italien, la
place de l’accent dans le mot n’est pas entièrement prévisible à partir de sa forme
sonore (la nature des sons), mais dépend aussi de facteurs morphologiques ou lexicaux.
Pour chaque élément du lexique le locuteur doit mémoriser cette position. En français,
langue à accent fixe, il suffit de savoir que l’accent se place systématiquement sur la
dernière syllabe pleine du mot : « aides, aidons, aiderons, aiderions ».
Quand on prononce les mots français suivants, on constate qu’il est toujours possible
de les accentuer sur la syllabe finale : « maison, situation, élucubrations, précieux,
enfantin, verbaliser, acceptions, apportera, légèrement ». Les exemples « précieuse,
enfantine, verbalise, choisissent » montrent en outre que l’accent y frappe la dernière
syllabe pleine du mot, c’est-à-dire la dernière syllabe qui comporte une voyelle autre
que []. Le <e> final de l’orthographe soit n’est pas prononcé (« une belle armoire » [yn
bɛ laʁ ˈmwaːʁ]), soit apparaît sous forme de détente consonantique (« froide » [ˈfʁ̥wadə],
« table » [ˈtablə]), soit se confond avec le « euh » d’hésitation. Ce [] final a donc un
statut particulier, différent des autres voyelles dans le mot.
Étant donné qu’en français la place de l’accent est prévisible pour les mots isolés, on
dira qu’il s’agit d’une langue à accent fixe. Dans une langue à accent fixe la place de
l’accent dépend de la limite du mot (Garde 1968: 137). Il existe d’autres langues où
c’est également le cas, mais où la place diffère : en tchèque et en finnois, c’est la syllabe
initiale du mot qui porte l’accent ; en polonais et en gallois, c’est la pénultième ; en turc,
la syllabe finale (Crystal 1987).
Dans les langues dites à accent libre, la place de l’accent dépend des morphèmes
individuels, qu’il s’agisse de morphèmes dérivationnels, flexionnels ou lexicaux. Il
arrive alors que deux éléments du lexique se différencient par la seule place de l’accent.
Les paires minimales, même exceptionnelles, confirment le mécanisme en jeu.

anglais the export l’exportation to export exporter


the survey le rapport to survey rapporter
to billow below sous (prép.)
néerlandais overlopen parcourir overlopen changer de camp
overvallen cambrioler overvallen cambriolages
overhalen convaincre overhalen transporter
doorkruisen parcourir, doorkruisen raturer
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 66

traverser
de kanon canon (mus.) het kanon canon (arme)
italien papa pape papa papa
ancora ancre ancora encore
amo j’aime amò j’aimai
meta cible metà moitié
faro phare farò je ferai
pero pommier però cependant
grec nomos loi nomos département
fora impetus fora temps
σπάνιoς [ˈspanjos] exceptionnel σπανιός [span rarement
ˈjos]
πόλι [ˈpoli] ville πoλί [poˈli] beaucoup, très

2.3 Accent de mot, mot clitique ou tonique


Les exemples plus haut montrent qu’en français, les noms, les adjectifs, les verbes, et
les adverbes peuvent être accentués. Ils sont dits accentuables, ou toniques7.
En revanche, les articles, certains pronoms et particules, etc. ne sont normalement 8
pas accentués dans la parole ; ce sont des mots clitiques. Dans « je le lui dirai », on
n’accentue normalement pas les pronoms (en dehors d’une intonation contrastive forte-
ment marquée, cf. infra). Pour mettre en évidence les éléments clitiques de cette phrase,
la langue offre d’autres moyens, de nature syntaxique : « moi, je le lui dirai », « lui, je le
lui dirai », « ça, je le lui dirai », « c’est moi qui le lui dirai ». Dans ces constructions
(appélées dislocation et clivage), un pronom tonique apparaît. Le néerlandais, par
contre, permet d’accentuer le pronom sans changer l’ordre des mots : « ik zal het hem
zeggen » (« moi, je le lui dirai »), « ik zal het hem zeggen » (« lui, je le lui dirai »).
On appelle accent de mot ou accent lexical (angl. word stress) l’accent qui accom-
pagne la prononciation des mots toniques, quelle que soit sa place dans le mot, et quel
que soit le type de langue. Il est dit lexical parce qu’il est réservé à certaines catégories
lexicales.
La nature tonique ou clitique d’un mot peut en première approximation être dérivée
de sa catégorie grammaticale. (Alternativement, elle peut être définie à partir de la posi-
tion syntaxique. Cela supposerait bien entendu une analyse syntaxique complète.)
Mertens et al. (2001) propose une liste détaillée des catégories grammaticales clitiques
7
Garde (1968) parle de mots accentogènes.
8
Dans « Faites une phrase avec le pronom ‘je’. » le pronom clitique « je » sera pourtant
accentuable parce qu’il s’agit d’un emploi métalinguistique, où un élément du lexique, qu’il soit
tonique ou clitique, est traité comme un objet que l’on désigne, de la même façon qu’un nom
désigne un objet ou une notion. Il en de même du morphème flexionnel dans « La désinence ont
s’emploie au pluriel. »
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 67

et toniques en français. Cependant, pour prédire la nature clitique des mots, il faut en
outre tenir compte de critères syntaxiques.

2.4 Accent final et accent initial


Outre la forme « légèrement », accentuée sur la syllabe finale, la forme
« légèrement », avec deux syllabes accentuées, se rencontre aussi. Le français connaît
en effet deux types d’accent. L’accent final (AF) s’accompagne généralement d’un
allongement de la syllabe ; il peut être suivi d’une pause et accepte des contours mélo-
diques dynamiques (montée ou chute). Dans « il avançait lentement dans la foule » les
syllabes soulignées peuvent être accentuées et suivies d’une pause. S’il est vrai qu’on
peut également accentuer la syllabe « lent », la pause n’est jamais acceptable après cette
syllabe.
L’accent initial (AI), appelé également accent d’insistance, frappe le plus souvent la
syllabe initiale d’un mot sans pourtant allonger sa voyelle. Il se caractérise par la force
dans l’articulation de l’attaque syllabique, ce qui entraîne souvent l’allongement des
consonnes initiales (ou de leur tenue, pour les occlusives). Il peut être précédé d’une
pause. Lorsque le mot commence par une voyelle, soit l’ AI passe à la deuxième syllabe
(« exactement » [], « absolument » []), soit il entraîne la pronon-
ciation d’un coup de glotte (« exactement » [], « absolument »
[]). Dans les exemples suivants, la syllabe portant l’ AI sera soulignée.
L’astérisque précède une forme agrammaticale.

la circulation *la circulation


AI AF AI AF

absolument absolument
AI AF AI AF

Contrairement à l’accent final, l’accent initial peut frapper n’importe quel mot, même
un mot clitique. L’extrait suivant (figure 13) présente plusieurs articles « les » frappés
par l’AI.
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 68

Figure 13. Transcription de la hauteur de l’énoncé « ça a eu une grande gravité


parce que c’étaient les grands chefs religieux, les hommes de science, les hommes
de loi » prononcée par Benoîte Groult, où l’accent initial apparaît sur les 3 articles
« les ».

Certains auteurs distinguent plusieurs types d’accent d’insistance : d’une part


l’accent didactique ou intellectuel (« je n’ai pas dit francophone mais anglophone »),
d’autre part l’accent expressif, émotionnel, ou emphatique (« il est insupportable »,
« c’est merveilleux », « quelle mégalomanie »). Le dernier se caractériserait par un
allongement de la tenue de la consonne initiale de la syllabe accentuée. Comme le
montrent les exemples, la fonction (didactique, expressive, emphatique, etc.) de l’accent
d’insistance est presque prévisible à partir du sens lexical du mot porteur. Au niveau de
la forme mélodique, les différents types d’accent d’insistance ont le même comporte-
ment.
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 69

3 Des variations mélodiques aux niveaux de hauteur


Lorsque des locuteurs imitent un énoncé donné, les intonations produites seront assez
proches, sans que les courbes acoustiques soient pour autant identiques. Comment
s’expliquent les écarts entre locuteurs ? Et qu’est-ce qui permet à l’auditeur de décider
si deux intonations sont comparables, équivalentes ou très proches ? Comme chaque
voix a sa propre tessiture, les informations véhiculées par la hauteur seront encodées et
décodées indépendamment de la hauteur absolue, grâce à un mécanisme qui repose à la
fois sur des contrastes locaux (comme le changement abrupt de la hauteur ou le
glissando) et sur des repères globaux établis progressivement (les valeurs centrale et
extrêmes). Ensuite, étant donné nos capacités auditives limitées, tout jugement
d’équivalence entre deux productions suppose que les différences mineures entre elles
soient ignorées.

3.1 Propriétés mélodiques des voix individuelles : tessiture et registre


La hauteur moyenne (ou médiane) d’une voix de femme est généralement plus
élevée que celle d’une voix d’homme ; celle d’une voix d’enfant est encore plus élevée.
Ces différences s’expliquent par la physiologie de l’appareil phonatoire, à savoir par la
longueur des cordes vocales et la forme du larynx. La tessiture du locuteur indique la
plage de hauteur que sa voix peut émettre sans difficulté et dont il se sert dans la
réalisation des variations mélodiques. Ces propriétés varient d’un locuteur à l’autre et
interviennent dans l’identification des voix individuelles. La figure 14 montre la
tessiture détectée automatiquement par l’outil Prosogram (cf. supra).

Figure 14. La tessiture du détectée par Prosogram. La tessiture des locuteurs S1 et


S2 est indiquée par trois lignes horizontales (pointillés rouges) correspondant aux
valeurs minimale, médiane et maximale.

Dans la parole non émotive, on ne se sert pas de l’ensemble de sa tessiture, mais


seulement d’une partie centrale, appelée le registre normal (habituel, usuel ou modal).

3.2 Fréquence, hauteur et échelles de hauteur


Dans la parole la hauteur perçue varie continuellement. Elle suit la vibration des
cordes vocales. Sur le plan acoustique, la vitesse de vibration est mesurée comme la
fréquence fondamentale, notée F0, exprimée en Hertz (Hz), soit le nombre de cycles de
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 70

vibration par seconde. En musique les intervalles de hauteur s’expriment surtout en


tons9 ou en demi-tons. La plupart des études sur l’intonation adoptent le tracé de F0 en
Hertz comme représentation des variations de hauteur. On peut montrer 10 que l’échelle
musicale en tons est plus proche de la hauteur perçue que l’échelle acoustique de
fréquence. Pour cette raison l’outil Prosogram (Mertens 2004) fournit la courbe de
hauteur sur une échelle en demi-tons, obtenue à partir de la fréquence fondamentale
détectée. Dans ce qui suit il sera surtout question de la hauteur perçue, seule propriété
directement accessible à l’auditeur. Bien sûr le plus souvent les observations sur la
hauteur s’appliquent aussi à la fréquence fondamentale, mutatis mutandi.

3.3 Courbe, tracé, variation de hauteur, contour


La courbe ou le tracé mélodique visualise l’évolution de la hauteur dans le temps, sur
un fragment de parole, qu’il s’agisse d’une seule syllabe, d’une suite de syllabes, ou
même d’un énoncé entier.

Variation mélodique
La variation mélodique ou variation de hauteur correspond à l’évolution de la hau-
teur sur un fragment de parole considéré ; elle se caractérise par sa pente montante,
descendante ou plate, par sa durée, par l’intervalle mélodique parcouru ; la variation est
simple ou complexe selon qu’elle comporte une ou plusieurs parties de pente différente.

Contours syllabiques statique ou dynamique


Pour la plupart des syllabes on entend un ton stable, localisé en gros sur le noyau
vocalique de la syllabe, et à l’oreille on a l’impression que les changements de hauteur
éventuels se situent entre les noyaux syllabiques successifs11. On parle alors de syllabes
à hauteur statique.
Pour d’autres syllabes on perçoit une variation de hauteur au cours du noyau voca-
lique et éventuellement des consonnes voisées adjacentes. On identifie alors une montée
ou une descente dont on peut caractériser l’ampleur et la pente. Dans ces cas on parlera
de syllabes à hauteur dynamique.

9
Il ne faut pas confondre le ton en tant qu’intervalle mélodique du solfège, et le ton en tant que
niveau de hauteur employé dans l’étude phonologique des langues africaines et asiatiques.
10
Pour l’échelle musicale, des intervalles égaux (de 2 tons, par exemple) seront jugés compa-
rables quelle que soit la hauteur de départ. Il en est autrement de l’échelle acoustique en Hertz,
où des écarts de fréquence égaux (de 30 Hz, par exemple) seront perçus comme des intervalles
de taille différente selon que la fréquence de départ est de 100 ou 200 Hz, par exemple. Notons
qu’il existe d’autres échelles de hauteur (mel, ERB), établies en psychoacoustique. Pour un
exposé plus détaillé, voir le lien suivant :
https://sites.google.com/site/prosogram/userguide#semitones
11
L’examen du tracé de F0 montre que sur le plan acoustique ces syllabes présentent tout de
même une variation de F0 qui s’étale sur tous les segments voisés. Parfois, des variations
importantes ne sont pas perçues du tout. Il s’agit donc d’un phénomène de perception.
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 71

Le contour
Chez certains auteurs le contour désigne une courbe ou configuration de hauteur
considérée comme une forme de base du système intonatif d’une langue (voir § 4.1).
Les différences dues aux tessitures individuelles, au tempo et au rythme n’empêchent
pas des similarités entre contours envisagés comme des configurations mélodiques. Une
telle configuration associe des cibles de hauteur à des endroits précis (ou localisations)
du contour, tels que la syllabe accentuée, la syllabe pénultième, le début ou la fin de la
courbe. Bien entendu, l’identification d’une configuration suppose au préalable des
décisions sur l’unité prosodique (le segment sur lequel porte le contour), sur la nature
des localisations et, enfin, sur la quantification des intervalles mélodiques. C’est ici
qu’intervient la notion des niveaux de hauteur.

3.4 Les niveaux de hauteur fixes


Alors que la hauteur de la voix varie graduellement, seules les variations de taille
suffisante joueront un rôle dans l’intonation. Le système auditif ne différencie qu’un
nombre restreint d’intervalles mélodiques (’t Hart 1976, ’t Hart et al. 1990). En même
temps, l’étendue de la tessiture est limitée. Les descriptions linguistiques écartent donc
les variations réduites, pour ne retenir qu’un nombre restreint d’intervalles mélodiques,
et par conséquent d’oppositions de hauteur. Par exemple : montée à petit intervalle,
montée à grand intervalle, montée à très grand intervalle. Tout enchaînement de varia-
tions mélodiques peut alors être représenté à l’aide d’un système de paliers de hauteur,
qui en quelque sorte découpe la tessiture du locuteur en plusieurs échelons, appelés
niveaux de hauteur12. Cette approche par niveaux de hauteur fixes rappelle la portée
musicale (cf. figure 3), dont chaque ligne horizontale représente une hauteur constante,
dérivée de la clef musicale13.
L’application des niveaux de hauteur à la parole continue rencontre certains
problèmes. D’abord, les auditeurs éprouvent beaucoup de difficultés à comparer la
hauteur d’endroits éloignés l’un de l’autre dans l’énoncé (à une distance de 1 ou 2

 La notion de niveau de hauteur remonte à la description des langues à tons (langues bantoues,
12

en particulier) ; elle est appliquée à la description de l’intonation par le structuralisme américain


(Pike 1945). Le nombre de niveaux retenus varie selon les auteurs : les travaux structuralistes en
prévoyaient de trois à cinq ; les approches autosegmentales des années 1980 (Goldsmith 1978,
Pierrehumbert 1980) n’en retiennent plus que deux : le haut et le bas. C’est l’approche qui
semble se généraliser depuis les années 1990 avec le système de transcription ToBI (Tones and
Break Indices), d’abord dans le monde anglo-saxon, ensuite au niveau international.
13
La notion des niveaux de hauteur absolus est implicitement présente dans plusieurs proposi -
tions pour l’interprétation des valeurs de F0. Pour Earle (1975) un niveau de hauteur correspond
à une fraction (un pourcentage) de la tessiture (sur une échelle linéaire en Hertz). Rose (1987)
transforme d’abord les valeurs de F 0 en valeurs de z-score (écart-type de part et d’autre de la
valeur F0 moyenne), cf. Ladd (2008 : 199-202). Rossi (1999) détermine la fréquence des
niveaux à partir de la F 0 moyenne des syllabes atones dans l’énoncé, et de l’écart-type des
valeurs de F0. Cette approche est adoptée aussi par Morel & Danon-Boileau (1998).
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 72

secondes). Ensuite, la parole présente souvent un abaissement progressif de la hauteur


moyenne au cours de l’énoncé, dû à la diminution du souffle (et de la pression sous-
glottale), qui sera réinitialisé à la prise de souffle (cf. figures 8 et 10). Ce phénomène de
déclinaison suggère que la hauteur est interprétée de façon relative, par rapport à une
référence définie localement, ce qui est incompatible avec les niveaux fixes et nécessi-
tera une définition modifiée des niveaux.
L’analyse par niveaux de hauteur implique des choix théoriques majeurs. D’abord,
quelques niveaux de hauteur seulement suffiraient pour décrire le fonctionnement de
l’intonation dans la langue parlée ; par conséquent les changements plus petits seront
ignorés. Ensuite, la distance entre niveaux successifs augmente avec la tessiture du
locuteur. Pour certains auteurs l’utilisation de niveaux implique également que toute
variation de hauteur résulte du passage d’un niveau à l’autre, et que la forme de la
courbe elle-même, sa pente et sa position, n’ont pas de fonction propre. Dans tous les
cas il s’agit d’une réduction considérable des faits observés.

3.5 Les niveaux de hauteur relatifs


Une approche alternative postule des niveaux de hauteur relatifs locaux14. Le déco-
dage s’établit progressivement au cours de l’énoncé, sur la base des intervalles mélo-
diques entre syllabes successives ou à l’intérieur d’une même syllabe.
Dans la figure 15, l’intervalle montant de taille importante entre la deuxième et la
troisième syllabe entraîne le passage du niveau bas (noté L pour « low ») au niveau haut
(noté H). De la même façon, l’intervalle négatif entre la troisième et la quatrième fait
que l’on retourne au niveau bas. L’intervalle intra-syllabique (à l’intérieur d’une même
syllabe) est traité comme l’intervalle entre syllabes : la neuvième syllabe passe du haut
au bas (noté HL). Pour les variations dynamiques, on indique les niveaux de hauteur
atteints aux points extrêmes de la courbe perçue : le sommet et le creux.

Figure 15. Interprétation progressive des niveaux de hauteur relatifs pour une suite
de syllabes. Les flèches représentent des intervalles mélodiques majeurs. La ligne
pointillée donne la déclinaison reconstruite.

14
L’idée originale remonte à Van Dooren & van den Eynde (1982).
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 73

Comme on le voit, la hauteur absolue importe peu ; c’est au contraire la présence


d’un intervalle majeur qui déclenche le changement de niveau. C’est d’ailleurs ce qui
nous permet de décoder l’intonation d’un locuteur quelconque, quelle que soit sa tessi-
ture.
À la fin d’un énoncé déclaratif d’une certaine longueur, juste avant la prise de
souffle, la hauteur se rapproche de la limite inférieure (le plancher) de la tessiture du
locuteur. Ce niveau est appelé l’infra-bas ou l’infra-grave. Plus loin il sera noté L- ou
B- (prononcé « B moins »). À cette fréquence basse, la vibration des cordes vocales
devient irrégulière dans la plupart des cas, et c’est probablement ce qui permet à l’audi-
teur d’identifier cette hauteur comme le plancher (Honorof & Whalen 2005). C’est le
cas de la syllabe finale dans l’extrait suivant.

Figure 16. Le niveau infra-bas est atteint à la fin de la proposition « il faudrait faire
un dictionnaire de la misogynie ».

Le niveau suraigu, noté H+ (prononcé « H plus »), correspond au plafond de la tessi-


ture ; il ne se rencontre que dans l’expression d’une émotion forte (indignation, irrita-
tion, colère, étonnement, enthousiasme). Dans l’exemple suivant, la locutrice s’excite,
ce qui se manifeste par le ton de plus en plus haut.

Figure 17. Extrait qui illustre des intervalles mélodiques importants pour atteindre
le niveau suraigu.

L’approche par niveaux de hauteur relatifs (reposant sur l’interprétation progressive


des changements mélodiques et sur la tessiture du locuteur) est mise en œuvre dans le
système de transcription automatique en niveaux de hauteur, appelée « Polytonia »
(Mertens 2014).
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 74

Intervalles mélodiques majeurs et mineurs


Jusqu’ici on s’est limité aux intervalles majeurs. Typiquement, ils correspondent à
des écarts d’au moins 5 demi-tons, bien que cette valeur varie en fonction de la tessiture
individuelle et de facteurs paralinguistiques (tels que l’expressivité et l’état émotif du
locuteur).
Les intervalles majeurs et la tessiture permettent de définir les quatre niveaux de base
que sont le bas, le haut, l’infra-bas et le suraigu, notés B, H, B- et H+ respectivement.
Le nombre de niveaux augmente lorsque sont pris en compte les intervalles mineurs,
de l’ordre de 2 à 3 demi-tons. Ceux-ci donnent lieu au rehaussement ou au rabaissement
du niveau haut ou bas déjà atteint (avant la variation à intervalle mineur). Ils sont notés
par les signes / et \ placés devant le niveau de base haut ou bas : /B, /H, \B et \H.
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 75

4 L’intonation du français : diversité des approches


Comment analyser les variations mélodiques dans la parole ? Une écoute attentive
d’un échantillon représentatif et conséquent de parole spontanée met en lumière des
formes mélodiques qui reviennent régulièrement. Comment les caractériser ? L’identifi-
cation de ces formes suppose inévitablement un découpage de la courbe mélodique en
contours successifs. Quel critère peut-on proposer pour effectuer ce découpage ? Quels
sont alors les contours attestés en français ? Quelle est la place de l’accentuation dans le
découpage en contours ?
Plusieurs travaux ont déjà été consacrés aux descriptions de l’intonation du français
(par exemple Lacheret-Dujour & Beaugendre 1999, Martin 2009). Ici, on se limitera à
une esquisse sommaire de quelques approches représentatives, pour illustrer leur diver-
sité, en vue d’identifier les questions fondamentales auxquelles toute analyse doit
apporter une réponse. Ensuite on regardera en détail l’analyse proposée par Mertens
depuis 1987.

4.1 Les « dix intonations de base » de Pierre Delattre


Delattre (1966) propose un inventaire de dix contours (ou formes élémentaires) de
l’intonation du français. Cet inventaire ne couvrirait pas la totalité des formes possibles,
mais seulement les plus fréquentes15. Chaque contour reçoit un nom et est caractérisé
par sa forme schématique et par une spécification des niveaux de hauteur parcourus, au
besoin complétée par la forme convexe ou concave de la courbe. Par exemple, le
premier contour, appelé « continuation mineure », prend la forme d’une montée allant
du niveau 2 au niveau 3.

Figure 18. Les dix intonations de base de Delattre (1966).

15
Si l’inventaire contient en effet les contours les plus fréquents tels que les continuations
mineure et majeure, la finalité et l’implication, il inclut aussi des contours exceptionnels,
comme la parenthèse haute.
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 76

La nature schématique des courbes16 apparaît clairement lorsqu’elle est mise en


regard avec la mélodie de la suite de syllabes à laquelle elle s’applique. Comme le
montre l’illustration suivante, pour les contours d’« ordre » et d’« exclamation », la
courbe schématique représente la mélodie sur la séquence de syllabes, alors que pour
l’« implication » elle correspond à la syllabe finale.

Figure 19. Représentation schématique et courbe mélodique correspondante, pour


quelques contours (implication, parenthèse basse, exclamation, ordre).

Lorsque la notation à niveaux de hauteur ne suffit pas pour opposer deux ou plu-
sieurs contours (comme c’est le cas des contours de types 2-4 et de type 4-1), la forme
(concave ou convexe) de la courbe est également indiquée. Pour différencier « continua-
tion majeure », « question » et « implication », ces contours seront notés 2-4, 2-4+ et 2-
4_ respectivement. Pour les contours « interrogation », « exclamation » et« ordre » la
notation devrait également être enrichie. Il reste à vérifier si ces contours peuvent être
discriminés entre eux en l’absence d’informations segmentales, lexicales ou syn-
taxiques.
La dénomination des contours reflète leur fonction supposée, qui se situerait surtout
au niveau du marquage de la modalité de la phrase ou de l’organisation syntaxique. Là
où la « finalité » marque la fin d’une proposition déclarative, les « continuations
mineure et majeure » apparaissent aux frontières internes de la proposition (ou de la
structure syntaxique correspondante). Le contour d’« interrogation » accompagnerait
une phrase interrogative à mot interrogatif, celui de la « question » serait utilisé dans les
phrases sans marque lexicale ou syntaxique de l’interrogation. L’« implication » mar-
querait la conviction du locuteur.
L’identification du contour et du groupe intonatif qui le porte repose uniquement sur
la reconnaissance de la forme du contour. Delattre rejette la notion d’accent.

16
La résolution fréquentielle réduite du spectrographe à filtre étroit, utilisé par Delattre, entraîne
automatiquement un lissage de la courbe de fréquence fondamentale.
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 77

4.2 Les « patrons intonatifs » de Jacqueline Vaissière


Vaissière était parmi les premiers à utiliser la mesure acoustique de la fréquence
fondamentale. Son analyse, qui date du début des années ‘70, retient quatre patrons ou
contours, constitués de mouvements successifs, comme la montée initiale (Ri), le palier
(S), la chute (F), la montée de continuation (Rc), etc. La comparaison de formes
schématique et acoustique, illustrée par la figure 20, révèle que les mouvements (mon-
tants ou descendants) constitutifs du patron se produisent tantôt au cours de la rime
syllabique, tantôt sur une suite de syllabes, tantôt encore entre les noyaux syllabiques.

Figure 20. Représentation schématique des 4 patrons intonatifs proposés par


Vaissière, ainsi que leur réalisation sur une suite de syllabes.

4.3 Les contours de Philippe Martin


Le modèle élaboré par Ph. Martin depuis 1975 a connu de nombreuses moutures
(1978, 1981, 1987, 2009, 2011, par exemple), tant pour l’inventaire des formes, que
pour le cadre d’analyse syntaxique adopté.

Sidonie et sa mère ont visité Venise

Figure 21. Représentation schématique des contours dans l’approche de Martin.


Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 78

Dans la version initiale, les contours élémentaires correspondent à des mouvements


uniformes17 montants ou descendants, d’ampleur différente, indiqués par les symboles
C0, C1, C2, C3... et différenciés à l’aide de traits binaires ([±long], [±montant],
[±ample] et [±restreint]). La représentation schématique des contours, illustrée par la
figure 21, indique la direction et l’ampleur, mais non pas l’endroit précis de la variation
mélodique : elle pourrait s’étaler sur le groupe entier, être située juste avant la syllabe
accentuée finale ou au cours de celle-ci. En fait, la variation de F0 se produit au cours
de la syllabe accentuée finale.
Le contour terminal C0 a une pente descendante ou montante selon qu’il est associé à
un énoncé déclaratif (Cd), interrogatif (Ci) ou impératif (Co, ordre). Pour les contours
non terminaux C1, C2, etc., le modèle postule un principe d’inversion de pente : pour un
contour à frontière faible, la pente serait opposée à celui à frontière forte. Ainsi, pour un
contour C0 descendant (Cd), C1 sera montant, C2 descendant, etc., alors que pour un
C0 montant (Ci), ce sera l’inverse.
Dans les versions plus récentes, le modèle s’enrichit de contours à pente non
uniforme, soit montante-descendante, soit l’inverse. Ceux-ci font intervenir le trait
[±convexe]. Cet enrichissement ajoute les contours déclaratif d’implication (Cdi),
déclaratif de commandement (Cdc), interrogatif de doute (Cid), interrogatif de surprise
(Cis), etc.
L’auteur étudie surtout la relation entre intonation et syntaxe. À chaque contour est
associé une frontière droite18, dont la force dépend de l’ampleur du mouvement, le
contour descendant C0 ayant la frontière la plus forte. Le regroupement par l’intona-
tion, postulé par Martin, repose sur la force relative des frontières et sur l’inversion de
pente : deux contours seront regroupés dans une entité englobante, si leur pente est
opposée et si la frontière du deuxième est plus forte. Pour la figure 21, où C0 prend la
forme descendante (Cd), on obtient le regroupement de C2 avec C1, de C3 avec C0 et
enfin du groupe terminé par C1 avec celui terminé par C0.

4.4 Comparaison des modèles


Ce qui frappe dans ce petit éventail d’approches, c’est leur désaccord sur presque
tous les points.
Le nombre de contours de base varie de 4 à 10. Ensuite, leur forme caractéristique
correspondrait à un mouvement uniforme simple (montant ou descendant) selon Martin,
à une suite de mouvements selon Vaissière, ou à des courbes de forme particulière (con-
17
Cette idée remonte à l’approche développée à l’IPO à Eindhoven depuis 1965 (’t Hart et al.
1990), où les parties élémentaires sont des mouvements simples (montant, descendant, plat).
18
D’une manière générale, les frontières gauche et droite d’une unité ou d’un constituant coïnci-
dent respectivement avec son début et sa fin dans la chaîne linéaire. Dans le cas du contour
intonatif, porté par une ou plusieurs syllabes, la marque intonative associée à la frontière droite
du contour est portée par la syllabe finale du contour.
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 79

cave, convexe, linéaire…) selon Delattre. Par ailleurs, la caractérisation approximative


et rudimentaire de ces formes de base confond les variations étalées sur l’ensemble du
contour et celles situées à un endroit précis, par exemple avant ou au cours d’une
syllabe donnée. Si la caractérisation des intervalles mélodiques de Delattre repose sur
des niveaux de hauteur fixes, pour Martin et Vaissière ces intervalles seraient relatifs les
uns par rapport aux autres (sans que l’échelle de hauteur adoptée soit mentionnée). Tous
rejettent la notion d’accent. L’identification des limites du contour reposera dès lors sur
une autre propriété prosodique, le plus souvent la forme même de la courbe. Or on vient
d’en souligner la nature approximative. En effet, une suite de trois mouvements (montée
+ descente + montée) donne un seul contour P1 chez Vaissière, mais trois contours (C3
C2 C1) chez Martin. Si l’identification des unités de base reposait sur la seule forme de
la courbe mélodique, on obtiendrait d’autres unités que celles des modèles esquissés.
L’unité de base retenue par ces auteurs correspond en fait à l’ancien groupe
rythmique, aussi appelé groupe intonatif, unité de l’ordre d’un constituant syntaxique
mineur. La seule forme de la courbe ne permet pas de délimiter le groupe (ou son
contour) et sa délimitation reposera dès lors sur d’autres critères.
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 80

5 L’intonation du français selon Piet Mertens


Cette section présente les idées centrales de l’analyse de l’intonation proposée par P.
Mertens depuis 1987. Pour une synthèse des aspects linguistiques, voir Mertens (2008).

5.1 Unités de base

5.1.1 Accentuation et variations de hauteur

Le modèle tient compte de l’accentuation (§ 2.1) et fait la distinction entre l’accent


final et l’accent initial (§ 2.4).
Pour le traitement des variations mélodiques, le modèle de Mertens adopte l’analyse
par niveaux de hauteur relatifs (§ 3.5).
L’interprétation des intervalles majeurs résulte en quatre niveaux de base : le bas, le
haut, l’infra-bas et le suraigu. Ils sont notés B, H, B- et H+ respectivement, lorsqu’ils
apparaissent en syllabe accentuée, et par les minuscules correspondantes en syllabe
atone.
Les intervalles mineurs, de l’ordre de 2 à 3 demi-tons, donnent lieu au rehaussement
ou au rabaissement du niveau haut ou bas atteint avant l’intervalle mineur. Ils sont notés
par les signes / et \ placés devant le niveau de base haut ou bas : /B, /H, \B et \H.
Au total on obtient huit niveaux de hauteur : B-, \B, B, /B, \H, H, /H et H+ .

5.1.2 Le groupe intonatif

Dans la parole certains contours mélodiques reviennent régulièrement. Pour faire


l’inventaire des contours, il faut d’abord un critère pour le découpage de la chaîne
parlée en tronçons porteurs de contour. Plusieurs critères ont été envisagés. Certaines
approches partent de la forme de la courbe mélodique, qui sera découpée en segments
de pente uniforme ou – de manière circulaire – en segments dont la forme appartient à
un inventaire préétabli. Alternativement les segments sont délimités sur la base de
critères non prosodiques, comme le constituant syntaxique19 ou la fonction communica-
tive20, ce qui suppose au préalable la définition de ces unités. Une analyse strictement
prosodique partira des propriétés prosodiques des syllabes.
Le critère retenu ici repose sur l’accentuation, plus particulièrement sur l’accent
final21. À la question « Où est Jacques ? » on peut répondre par « Là ! », « Ici ! », « À la

19
La question se transforme alors en un problème d’analyse syntaxique, qui suppose la défini-
tion des constituants possibles et une procédure pour les identifier dans la chaîne parlée.
20
C’est implicitement le cas de l’approche de Delattre esquissée plus haut.
21
Comme les phénomènes d’accentuation sont propres à une langue donnée, l’unité prosodique
basée sur l’accent le sera aussi. Cependant, l’unité basée sur l’accent final est compatible avec
celle d’autres analyses pour le français, même celles basées sur la signification. En outre cette
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 81

cave ! », « Il sera à l’hôpital ! », avec à chaque fois sur la dernière syllabe pleine un
sommet de hauteur suivi d’une chute majeure. Les réponses portent toutes le même
contour, mais réparti sur un nombre de syllabes de plus en plus important (figure 22).
Le sommet de hauteur et la chute y restent au même endroit, à savoir à la syllabe finale ;
les syllabes précédentes restent au niveau bas. (Bien sûr d’autres contours pourraient
être utilisés pour ces mêmes énoncés.) Ces exemples montrent donc que la syllabe de
l’accent final constitue le pivot du contour, son élément central : c’est la partie indis-
pensable du contour, celle qui reste quel que soit le nombre de syllabes dans le groupe.

Là Ici À la cave Il sera à l’hôpital


Figure 22. Réalisation du même contour sur des groupes de longueur différente.

L’unité descriptive du groupe intonatif (en abrégé : GI) correspond à une suite de
syllabes comportant un seul accent final sur la dernière syllabe pleine du groupe. Les
autres syllabes éventuelles dans le groupe sont atones (non accentuées). Éventuellement
un accent initial (AI) peut apparaître à l’intérieur de la partie atone 22. Tout énoncé
apparaît alors comme une suite de groupes intonatifs.
Examinons le nombre et la nature des syllabes qui précèdent l’accent final dans GI.
Dans des énoncés comme « Où ? », « Là ! », « Quand ? », « Qui ? », « Jean ! », le GI ne
comporte que la syllabe accentuée et il n’y pas de syllabe atone. En revanche dans
« Pourquoi ? », « À Bruxelles. », « Il nous l’expliquera. », on obtient une suite de
syllabes atones d’une à quatre syllabes avant l’accent. L’énoncé « Absolument ! » forme
un seul GI : la syllabe accentuée finale y est précédée de syllabes atones. On rencontre
couramment des réalisations avec l’accent initial soit sur la première (« Absolument ! »)
soit sur la deuxième syllabe (« Absolument ! »). Il arrive que l’accent initial précède
immédiatement l’accent final, sans syllabe atone entre eux : « Assez ! ». Les accents
contigus, bien que évités dans la parole lue, ne sont pas exceptionnels dans la parole
spontanée (Mertens 1992).

où pourquoi absolument
AF . AF . . . AF
quand à Bruxelles absolument
AF . . AF AI . . AF
là il nous l’expliquera absolument
AF . . . . AF . AI . AF

unité peut être mise en rapport avec des entités de nature syntaxique.
22
Les cas où un groupe intonatif comporte plusieurs accents initiaux, ou où une telle analyse
pourrait être envisagée, sont rarissimes.
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 82

Malgré la diversité des contours mélodiques, due au nombre des syllabes et à la


présence et à la place de l’accent initial, les groupes intonatifs répondent tous à un
même schéma structural unique. Celui-ci correspond à une suite de positions ou
localisations, dont certaines sont facultatives. Les parties facultatives sont notées entre
parenthèses. Les localisations AF et AI représentent chacune une syllabe ; NA (non
accentué) représente une ou plusieurs syllabes atones.
((NA) AI) (NA) AF

5.1.3 Le contour et sa décomposition

Des exemples de contours de GI sont donnés dans la figure 23. La représentation


schématique du contour prévoit un trait par syllabe. Soulignons que cette figure ne
donne pas l’ensemble des contours du français, mais seulement un échantillon ; parmi
ces contours, certains sont très courants, d’autres exceptionnels.

Figure 23. Quelques contours intonatifs du français. Chaque trait indique la hauteur
d’une syllabe. Les traits épais indiquent les syllabes accentuées. Pour la notation en
niveaux de hauteur, voir le commentaire dans le texte. Cependant, « l » et « L »
indiquent ici le niveau bas, « l- » et « L- » l’infra-bas.

La dernière syllabe pleine de chaque groupe porte l’accent final. Sa hauteur perçue
peut être plate (1A, 1B), descendante (1C) ou montante (1D). Le niveau de hauteur
atteint peut varier : infra-bas (1A), haut (1B), mais aussi bas, bas rehaussé, bas abaissé,
haut rehaussé, haut abaissé et suraigu, soit l’ensemble des niveaux retenus. (Les conven-
tions de notation et la combinatoire des tons seront expliquées plus loin. )
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 83

Les contours en deuxième rangée portent un accent initial haut sur la première
syllabe du mot « sympathique ». Le contour de l’accent initial est généralement plat et
au niveau haut, rarement au niveau bas.
Les contours de la troisième rangée illustrent l’importance de la syllabe pénultième
atone. Le plus souvent celle-ci sera au niveau bas ; lorsqu’elle est au niveau haut, on
obtient un contour différent avec un effet de sens particulier (voir § 5.2.3).
Que nous apprend cet échantillon de contours ? Les contours de la deuxième rangée
sont identiques à ceux de la première, à l’exception de l’accent initial. De la même
façon, les contours 1A et 3A sont identiques à l’exception du niveau de hauteur à la
pénultième ; il en est de même pour 1D et 3D.
Ce rapprochement illustre le point suivant. Plutôt que de concevoir le contour comme
une entité indivisible, on peut le concevoir comme un object structuré, composé de
plusieurs parties, plus précisément comme la succession de formes situées à des endroits
précis du groupe intonatif. Cette approche analytique présente plusieurs avantages.
D’abord elle est économique : elle ramène le nombre élevé de contours distincts à une
combinaison d’éléments moins nombreux. Ensuite elle explicite la structure interne du
groupe intonatif. Ceci permet d’étudier son alignement avec le plan segmental (les sons,
les syllabes, les mots), son organisation interne, et d’envisager une fonction (séman-
tique) pour chacun des éléments constitutifs. Il en résulte une analyse compositionnelle,
où la signification de l’ensemble résulte de la combinaison de celles des parties
constitutives.
Dans la suite, le ton indiquera le ou les niveaux de hauteur associés à une localisa-
tion, soit à une syllabe23.
L’intonation d’un énoncé se présente alors comme une succession de groupes intona-
tifs (GI), où chaque groupe se décompose à son tour en une suite de localisations,
auxquelles est associé un ton du paradigme correspondant.

5.1.4 Les paradigmes de tons

On distingue trois classes de tons, selon le caractère accentué on non et selon le type
d’accent. Il s’agit des paradigmes24 de tons associés aux localisations de l’accent final
(AF), de l’accent initial (AI) et d’une suite non accentuée (NA). Le tableau suivant
illustre les paradigmes des tons dans chacune des localisations.

23
Comme on l’a vu, ce terme (le ton) est habituellement réservé aux variations mélodiques
rencontrées dans les langues à tons, où elles ont une fonction lexicale.
24
Le paradigme indique l’ensemble des éléments qui peuvent figurer à un point de la chaîne
parlée, c’est-à-dire dans un contexte donné. Ainsi dans la chaîne « je le regarde », on peut
remplacer le deuxième élément par « les » ou par « la », mais non pas par « il », « où », « de ».
On en déduit que « le, la, les » appartiennent au même paradigme, auquel n’appartiennent pas
« il », « où » et « de ».
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 84

NA AI NA AF
b b H b b B-B-
h h B h h H+H+
HB-
H/H
/HH
\HH
HB
BH
HH
/BB
BB
\BB

Tableau 2. Distribution des tons dans le groupe intonatif maximal (i.e.


comportant un nombre maximal de positions).

La notation des tons explicite sa position dans le GI. 1. Les majuscules s’emploient
en position accentuée, les minuscules en position atone. 2. Dans le cas d’un ton statique
sous l’accent (par exemple, le contour 1B), la notation redouble le niveau de hauteur :
nous transcrivons HH au lieu de H, BB au lieu de B, /BB au lieu de /B. Cette
convention de notation vise à distinguer le ton de l’accent final (par exemple HH) du
ton homophone sous l’accent initial (soit H). 3. Une suite atone (NA) est représentée par
deux localisations : le début et la fin de la séquence. Quand une partie atone ne com-
porte qu’une syllabe, les deux localisations coïncident dans la même syllabe, qui reçoit
alors deux niveaux de hauteur. Comme la syllabe atone ne connaît pas de variation
mélodique audible, ses deux niveaux seront forcément identiques.
on a retrouvé les corps des victimes
b........b HH bb HH b...b B-B-

Dans l’exemple ci-dessus, le premier et dernier GI comptent plusieurs syllabes atones


et le début et la fin de la série atone sont situés sur des syllabes distinctes. En revanche,
le deuxième GI ne compte qu’une seule syllabe atone, et début et fin coïncident dans
cette même syllabe.
Pour les positions atones, le tableau ne fournit que les niveaux de hauteur de base (b ,
h) qui peuvent aussi être rehaussés (/b, /h) ou abaissés (\b, \h)25.
Le ton final est celui qui dans un GI donné occupe la position AF. Le ton final est
porté par la dernière syllabe pleine du GI (sauf si celui-ci contient un appendice, contour
que nous décrirons maintenant).

25
La combinaison de tons des différents paradigmes doit respecter le principe de définition des
niveaux rehaussés et abaissés : ces niveaux supposent un intervalle mineur par rapport au niveau
de base précédent ; pour cette raison des suites telles que “b..b /HH”et “b../h BB” sont exclues.
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 85

5.1.5 Le contour d’appendice

Dans les énoncés suivants, la partie finale de l’énoncé (« en quelque sorte », « les
autres ») portera un contour plat au niveau infra-bas, réalisé avec une faible intensité,
sans syllabe accentuée. Ce contour sera appelé contour d’appendice.
et c’est comme ça que l’histoire marche en quelque sorte (R. Barthes)
j’aime bien comprendre comment ça marche les autres (F. Giroud)

Dans l’extrait ci-dessous, l’appendice apparaît aussi sur le mot « littéraire », après
l’accent final sur « mythe ».

Figure 24. Intonation de l’énoncé « il a contribué puissamment à la destruction du


mythe littéraire », avec mise en valeur du mot « mythe » et contour d’appendice
sur le mot «  littéraire ».

À côté de l’appendice au niveau infra-bas, on rencontre également la variante au


niveau de hauteur haut26.
Comment situer le contour d’appendice dans le groupe intonatif ? Le schéma
structural du GI, donné plus haut, ne prévoit aucun élément atone après l’accent final.
Cependant, en l’absence d’accentuation le mot « littéraire » ne peut pas constituer un GI
indépendant. Nous adapterons la définition du GI afin d’intégrer l’appendice comme
une partie facultative après l’accent final, ayant des propriétés distributionnelles27
propres. Le tableau 3 donne la distribution des tons pour la définition remaniée du GI
maximal (i.e. comportant le nombre maximal de positions). (Les lignes horizontales
indiquent des contraintes sur la combinaison d’éléments appartenant aux paradigmes
traversés par cette ligne. Par exemple, les tons b- (de l’appendice) ne se combinent
qu’avec les tons B-B-, HB-, et H+H+ du paradigme AF.)

cf. la « parenthèse haute » ou « écho » de Delattre (1966), le contour « interrogatif mineur » de


26

Rossi (1999: 86-88).


27
L’appendice n’apparaît jamais seul, il n’apparaît qu’après une syllabe accentuée finale portant
un ton appartenant à un sous-ensemble du paradigme AF. Entre l’AF et l’appendice on ne trouve
généralement pas de pause. Les deux variantes de l’appendice (au niveau de hauteur B- et au
niveau H) sont en distribution complémentaire en fonction du ton final qui précède.
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 86

NA AI NA AF NA
b b H b b B-B- b-...b-
h h B h h H+H+
HB-
H/H h..h
/HH
\HH
HB
HH
/BB
BB
\BB

Tableau 3. Distribution des tons dans le groupe intonatif maximal.

5.1.6 Le changement de registre

Il arrive que, pendant une partie de l’énoncé, le locuteur passe à un registre plus haut
ou plus bas que son registre usuel, par exemple pour délimiter une incise. Le change-
ment de registre peut aussi être employé comme un procédé expressif. Dans les
exemples ci-dessous les changements de registre sont notés par les symboles  et .
La preuve, c’est que actuellement, voyez-vous en soixante-quinze  je pense que vous
serez d’accord avec moi,  il n’y a plus ce qu'on appelait autrefois de grands écrivains.
(R. Barthes)
mais je crois que c'est à ces problèmes essentiels que nous devons consacrer  si
monsieur Fabius naturellement en est d'accord  notre entretien de ce soir (J. Chirac)
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 87

5.2 Les fonctions de l’intonation


Dans la communication parlée, l’intonation remplit plusieurs fonctions.

5.2.1 La fonction démarcative

La structuration en groupes intonatifs introduit dans la chaîne parlée des frontières,


aux limites des GI, qui découpent la parole en tronçons. L’intonation assure donc une
fonction démarcative. L’information (lexicale, syntaxique et intonative) est en quelque
sorte servie en pièces détachées, prêtes à l’assemblage suggéré par les relations syntaxi-
ques et par la force relative des frontières intonatives (cf. infra).
La taille moyenne du groupe intonatif est de 3 à 4 syllabes. Les groupes nettement
plus longs produisent un effet particulier : la suite de mots correspondante est présentée
comme un ensemble, comme une seule unité de sens. Le groupe particulièrement long
« d’épouser un monsieur avec de l’argent » dans l’extrait suivant évoque l’idée du
mariage d’intérêt.

Figure 25. Exemple d’un groupe intonatif exceptionnellement long « d’épouser un


monsieur avec de l’argent » qui correspond à un seul groupe de sens.

5.2.2 La fonction organisatrice : le regroupement intonatif

L’intonation indique comment les groupes intonatifs s’organisent dans l’énoncé ; elle
remplit une fonction organisatrice (hiérarchisante).
À chaque contour de groupe correspond une frontière prosodique ; son degré est lié
au ton de la syllabe accentuée finale28. La frontière maximale revient aux contours

28
La terminologie de M. Rossi (1999) fait écho à la fonction hiérarchisante : intonèmes conti-
nuatifs mineur et majeur, intonème conclusif. Elle prolonge en cela les étiquettes de P. Delattre
(1966). La notation des contours chez Ph. Martin (1978) reflète directement les degrés de
frontière (où le degré 0 correspond à la frontière maximale) : C0, C1, C2, C3...
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 88

descendant jusqu’au niveau infra-bas (B-B-, HB-). Dans les autres cas, la frontière est
proportionnelle au niveau de hauteur atteint au sommet de la syllabe accentuée finale :
plus le sommet est élevé, plus la frontière est forte.
L’enchaînement de groupes intonatifs avec leurs frontières respectives donne lieu à
une organisation hiérarchique. Quand une frontière faible est suivie d’une frontière
forte, les groupes en question forment une unité plus grande, tout en préservant le
rapport de force entre les deux parties. Il en résulte un paquet intonatif. Quand une
frontière est suivie d’une autre frontière de même degré ou de degré inférieur, les deux
groupes sont simplement juxtaposés. La succession de frontières donne un parenthésage
en constituants prosodiques emboîtés.
Les exemples suivants illustrent deux regroupements alternatifs pour une même suite
de mots, l’un en trois parties, l’autre en deux parties majeures.
((d’abord)(la viande)) ((les légumes) (ensuite)) ((laisser) (mijoter))
\BB HH \BB HH /BB B-B-
(((d’abord)(la viande)) (les légumes)) ((ensuite) ((laisser) (mijoter)))
\BB HH H/H HH /BB B-B-

Selon l’intonation employée, l’interprétation de « ils regardent les voitures et les


filles les pilotes » peut basculer de « eux, ils regardent les voitures, et, elles, elles
regardent les pilotes » en « les pilotes, ils regardent les voitures et les filles ».
ils regardent les voitures et les filles les pilotes
/BB HH /BB B-B-
ils regardent les voitures et les filles les pilotes
/BB HH B-B- b-......b-

Le regroupement intonatif repose sur les tons finals. L’accent initial n’y participe
pas ; il joue un rôle différent, mais complémentaire à celui du ton final (cf. 5.2.3).
Les frontières de GI et le regroupement intonatif entraînent une structuration de la
chaîne parlée ; celle-ci présente en même temps une organisation syntaxique. La
question de la correspondance entre les deux types d’organisation sera abordée dans la
section 5.3.2., où nous étudierons dans quels cas les organisations intonative et syn-
taxique sont compatibles.

5.2.3 La signification des tons et des contours

Simultanément avec les deux fonctions précédentes l’intonation en remplit d’autres,


de nature informationnelle et pragmatique. Un énoncé doté d’une structure syntaxique
donnée peut porter des intonations différentes. L’intonation n’est donc pas entièrement
déterminée par la syntaxe ; elle possède une certaine autonomie. On peut étudier
l’apport de tel ou tel ton, de tel ou tel contour, soit en lui-même, soit en relation avec la
structure syntaxique. Quand on se limite à des énoncés courts d’un seul GI, le facteur
syntaxique disparaît ; on observe alors la sémantique intonative à l’état pur.
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 89

Comment déterminer la signification des formes intonatives ? Un premier procédé


très ancien examine le changement de sens dû à la substitution d’une forme intonative
attestée par une autre. Ainsi, certains énoncés déclaratifs se transforment en interro-
gation par la montée finale (H/H), ou en exclamation par le contour montant-descendant
(HB-). Un deuxième procédé prend des énoncés syntaxiquement ambigus et leur associe
différents contours afin d’interpréter le changement de sens (Delattre 1967, Martin
1978), comme pour « Il a peint la jeune fille en blanc ». L’utilité de ce procédé se limite
aux contours ayant un effet sur l’organisation interne de l’énoncé (surtout les continua-
tions /BB, HH et H/H). Malheureusement les structures syntaxiques ambiguës ne sont
pas très nombreuses. Pour les autres aspects, les tests sont moins évidents. On essaie de
saisir ce qu’apporte une forme donnée à travers ses occurrences dans des contextes fort
hétérogènes faisant intervenir des éléments lexicaux et des structures syntaxiques les
plus variés. Dans tous les cas il s’agit d’une interprétation forcément subjective.
Le tableau suivant résume les valeurs communicatives associées aux formes intona-
tives disponibles à telle ou telle localisation du groupe intonatif (Mertens 2008).

forme sémantique générale effets de sens en contexte


B- finalité assertion

H/H continuation supérieure

HH continuation majeure

/BB, continuation mineure


BB,
\BB
HB, centre d’attention, information importante ou
HB- focus nouvelle, implication du locuteur
BH fait connu invitation à l’interlocuteur à
confirmer
H+H+ implication du locuteur conviction, information
importante
AI début d’une entité mise en valeur de l’entité
délimitée
...h B-B- évidence pour le péremptoire
locuteur
...h \HH évidence pour les savoir partagé,
interlocuteurs évocation d’une idée
appendice arrière-plan information accessoire
informationnel

Tableau 4. Signification associée aux différents tons des localisations du groupe


intonatif : accent final, accent initial, position pénultième et appendice.
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 90

Les tons à fonction énonciative


Parmi les valeurs communicatives évoquées dans ce tableau on peut distinguer deux
catégories : d’une part les tons qui marquent seulement un degré de frontière et qui
réalisent la fonction organisatrice, et d’autre part ceux qui renseignent sur le statut
informationnel ou sur le rôle des interlocuteurs, et qui sont parfois désignés comme les
formes à fonction énonciative. Le premier groupe comporte certains contours déjà
identifiés par Delattre : la finalité (ton final B-B-), les continuations majeure (ton final
H/H et HH) et mineure (tons finals /BB, BB ou \BB). Leur fonctionnement a été décrit
au paragraphe précédent (§ 5.2.2). Le deuxième groupe comprend le contour d’implica-
tion (HB ou HB-), le ton final BH, le ton H+H+, mais aussi l’accent initial H et la
pénultième haute (h). Certains tons remplissent en même temps les deux fonctions :
c’est le cas par exemple du ton HB-.
Ci-dessous on regarde de plus près certains tons à effet énonciatif, réalisés à l’accent
final, à la pénultième ou à l’accent initial.

Les tons HB et HB- : mise en valeur, effet contrastif


Le contour HB- ‒ l’implication de Delattre ‒ indique à la fois une frontière terminale
(due au niveau B-), qui clôture la proposition, et la mise en valeur du groupe intonatif
porteur. Le ton HB-, tout comme le ton HB, peut ainsi signaler l’implication du locuteur
dans son propos, comme dans l’exemple suivant.

Figure 26. Exemple du contour « b..b HB- » sur « importance » et du contour « b..b
HB » sur « des imbécil-euh ».

Employé en position non finale de constituant, le ton HB ou HB- provoque un effet


contrastif. Comparez :
ça n’avait aucune importanceHB (mise en valuer de la proposition)
ça n’avait aucuneHB b-importanceb- (mise en valeur de la quantification)
il a rencontré la secrétaire du ministreHB (= il a rencontré cette secrétaire-là)
il a rencontré la secrétaireHB- b-du ministreb- (= et non pas son adjoint).

Dans les exemples à effet contrastif, l’emploi du ton HB- en position non finale va de
pair avec le contour d’appendice sur la suite de la structure syntaxique après ce ton.

Le ton H/H : l’interaction inachevée


Une montée à partir du niveau haut (ton H/H) entraîne une frontière majeure, bien
que non terminale ; elle accompagne certains types d’interrogation : Tu viens ?
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 91

Le ton BH : la demande de confirmation adressée à l’interlocuteur


Le ton BH correspond à une montée tardive au cours du noyau syllabique et partant
d’un niveau bas. Il semble inviter l’interlocuteur à donner un commentaire ou à
confirmer ce qui vient d’être dit. On ajouterait volontiers un « n’est-ce pas ».

Figure 27. Exemple du contour « b..b BH » sur « jolie », « belle » et « élégante ».

La pénultième haute
Dans la plupart des contours la syllabe pénultième atone est basse. La pénultième à
ton haut (h) se rencontre surtout en combinaison avec les tons finals B-B- et \HH. La
première combinaison donne le contour « b..h B-B- », qui crée un effet d’évidence. Le
locuteur présente l’information comme étant évidente, ce qui peut être interprété comme
une marque d’assertivité. La deuxième combinaison « b..h \HH », avec la chute à inter-
valle mineur entre la pénultième et la finale, provoque une connotation où le locuteur
évoque implicitement une situation, un savoir partagé. À l’écrit cet effet est parfois
suggéré par l’emploi de guillemets.

Figure 28. Exemple du contour « b..h \HH » sur « enseigner ».

Figure 29. Exemple du contour « b..h \HH » sur « objectives ».


Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 92

L’accent initial : délimitation gauche


Dans l’exemple suivant l’accent initial frappe la syllabe initiale du mot « débarras-
ser », qui sera ainsi délimité à l’intérieur du groupe intonatif « pour nous débarrasser ».
La signification du ton « HB » sur la syllabe finale portera sur la partie ainsi délimitée, à
savoir le mot « débarrasser » plutôt que sur le groupe entier.

Figure 30. Exemple de l’accent initial sur « débarrasser » et sur « péjorative ».

L’accent initial peut être utilisé pour délimiter une entité plus grande que le mot
isolé, par exemple une suite de mots à l’intérieur du groupe ou du paquet intonatif. Il
permet ainsi de mettre en exergue un constituant ou de faire porter la valeur du ton sur
un élément qui dans la chaîne linéaire ne se trouve pas sous l’accent final. C’est le cas
dans l’exemple de la figure 26, où l’accent initial frappe la conjonction « si » et où la
subordonnée entière apparaît comme un seul bloc.
Les accents initiaux abondent dans la prononciation des présentateurs et présenta-
trices de radio et de télévision, qui semblent souligner tous les mots, ou presque. Ainsi
ils semblent vouloir donner un semblant de spontané à leur lecture de textes dont la
signification ne se découvre qu’à la lecture-même.

L’appendice : arrière-plan informatif


L’appendice est utilisé dans certaines constructions (cf. 5.3.3), comme la dislocation
à droite : « tout le monde sait qu’elle est misogyne, la culture occidentale ».
L’appendice permet aussi de repousser à l’arrière-plan informationnel un constituant
pourtant indispensable sur le plan syntaxique. Dans l’exemple suivant, « tout le monde
sait que la culture est misogyne », on obtient l’équivalent de « tout le monde le sait !
(que la culture est misogyne) », grâce à l’emploi de l’appendice, qui permet au locuteur
d’associer au verbe « sait » un contour terminal HB-, normalement réservé à la fin de la
proposition.
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 93

Figure 31. Contour d’appendice sur la partie finale correspondant à la complétive


« que la culture est misogyne ».

5.3 Intonation et syntaxe

5.3.1 Le groupe accentuel

La plupart des phrases, même les phrases syntaxiquement univoques, peuvent être
prononcées de plusieurs façons, avec un nombre variable de groupes intonatifs. À côté
de la prononciation « L’année universitaire | commence | demain | », avec trois syllabes
accentuées finales et dès lors trois GI, on trouve également « L’année | universitaire |
commence | demain | », prononcée en quatre groupes. Mais c’est le découpage maxi-
mal : il serait impossible d’en avoir plus. Dans les réalisations avec moins de GI, chaque
frontière réalisée apparaît également dans le découpage maximal. Les frontières réali-
sées forment donc un sous-ensemble des frontières possibles. Si certaines frontières
peuvent être supprimées, en aucun cas elles n’apparaîtront à des endroits autres que
ceux du découpage maximal : la segmentation « L’année uni | versitaire | commence |
demain | » est exclue. On appellera groupe accentuel (GA) chacune des unités du
découpage maximal. Le groupe intonatif comporte un ou plusieurs groupes accentuels
successifs.

Formation du groupe accentuel


Comment déterminer les frontières possibles (ou virtuelles), soit les groupes accen-
tuels ? Chaque GA se compose d’un élément (ou mot) tonique29 et des mots clitiques
contigus qui en dépendent syntaxiquement. Plus exactement : chaque élément tonique
forme le centre d’un GA et tout élément clitique s’intègre au GA formé par l’élément
tonique dont il dépend. Le clitique précède généralement le mot lexical, sauf en cas
d’inversion: « disait-il », « où va-t-il », « emporte-la ». La règle pour la constitution des
GA renvoie donc à la présence d’un accent lexical et aux relations de dépendance
syntaxique entre les mots.

29
Cf. § 2.3.
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 94

Précisons que si le clitique est séparé de l’élément dont il dépend par un autre
élément non clitique, il s’adjoint au groupe accentuel qu’il précède 30 : dans « ce
magnifique bateau », « ce » forme un GA avec « magnifique ».
Le squelette prosodique de l’énoncé explicite la formation des GA. Il montre le statut
de chaque syllabe, celles qui sont accentuables (susceptibles de recevoir un ton final),
mais sans fixer le ton qu’elles portent et qui dépendra d’autres facteurs.

ces livres, ils ont été écrits par de grands esprits


AL • o • o • o • o • • o • o
GA (• - ) (• -)(• -)(• - ) (• • - ) (• - )
GI (• + ) (• - • +)(• + ) (• • - • + )
GI (• HH ) (• - •BB)(• HH) (• • - • B-B-)

Le squelette prévoit plusieurs niveaux. 1. Sur le niveau AL (accent lexical), la der-


nière syllabe pleine d’un mot tonique est indiquée par un rond, et les syllabes atones par
un point31. 2. Sur le niveau des GA, les syllabes accentuables sont indiquées par un tiret.
Les parenthèses indiquent les frontières des GA et donc les frontières virtuelles des GI. 3.
La couche GI montre une des réalisations possibles ; le plus (+) indique une syllabe
effectivement accentuée et les parenthèses délimitent les GI résultants. 4. La dernière
ligne indique les tons finals associés aux syllabes accentuées finales dans la réalisation
envisagée.
L’accent final frappe toujours la dernière syllabe pleine du groupe accentuel, même
si cette syllabe appartient à un mot clitique32 : « où va-t-il », « emporte-la ».
où va-t-il
AL o o •
GA (-) (• -)
GI (• • +)

L’exemple suivant illustre encore le rôle de la syntaxe. Les éléments clitiques se


rangent du côté de l’élément dont ils dépendent. Celui-ci se situe tantôt à gauche, tantôt
à droite. Le clitique n’intègre pas nécessairement le groupe qui suit.
lui avait-elle envoyé cette lettre
AL • • o • • • o • o
GA ( • • • - ) (• • -) ( • - )
GI ( • • • + ) (• • +) ( • + )

30
Pour plus de détails, voir Mertens (1993: 30-40, 1997: 34-35), Mertens et al. (2001).
31
Certains auteurs considèrent les auxiliaires de temps comme des clitiques, surtout les formes
monosyllabiques. S’il est vrai qu’ils portent rarement l’accent, leur accentuation est pourtant
possible pourvu que soient évités les accents contigus : « nous l’aurions éliminé ». Une classifi-
cation basée sur la catégorie grammaticale ne devrait pas réserver un statut accentuel particulier
aux monosyllabiques.
 Notons cependant le comportement irrégulier de certains pronoms. Dans « dis-le », le schwa
32

est prononcé soit [], [] ou [], et accentué. En revanche, dans « puis-je », prononcé [],
c’est la syllabe « puis » qui reçoit l’accent. Dans d’autres inversions avec le pronom « je », on
prononce le schwa sans pourtant l’accentuer.
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 95

On trouve même quelques paires minimales selon que le pronom clitique soit
accentué ou non : « (arrêtez) (le voleur) » vs. « (arrêtez-le), (voleur) » (Delattre 1972).
L’exemple suivant illustre la situation d’un clitique éloigné de sa tête syntaxique par
un élément non clitique : « un » est séparé de « appartement » par « nouvel ». Notons
aussi la nature non clitique du pronom « nous » ici.
nous on y cherchait un nouvel appartement
AL o • • • o • • o • • • o
GA ( - ) (• • • - ) (• • - ) ( • • • - )
GI ( + ) (• • • + ) (• • + ) ( • • • + )

Un GI est donc constitué d’un ou plusieurs GA. La façon de regrouper les GA en GI,
dépend de plusieurs facteurs. 1. Le premier facteur, de nature phonétique, est la lon-
gueur du GI résultant. Il est difficile de prononcer une longue suite de syllabes atones ;
on sera spontanément amené à accentuer quelques syllabes accentuables. La longueur
moyenne observée par GI est de 3.8 syllabes (Delais 1995: 125). 2. Les accents contigus
sont évités (Mertens 1992). 3. Le nombre de GI dépend en outre du rapport syntaxique
entre les GA : le regroupement doit respecter l’emboîtement syntaxique (cf. §5.2.2). 4. Il
dépend également de la sémantique, des « unités de sens » (cf. §5.2.1, Mertens 1987:
111, 1993: 49-50). 5. Finalement, il faut mentionner d’autres facteurs comme le débit de
parole, le style (soigné ou non), ou le type de parole (texte lu, parole spontanée).

5.3.2 L’intonation de la structure syntaxique simple (à un élément recteur central)

Les frontières associées aux tons finals entraînent le regroupement des GI et mettent
ainsi en place l’organisation prosodique de l’énoncé. Comment cette organisation se
comporte-t-elle par rapport à l’organisation syntaxique33 ? L’exemple suivant comporte
quatre GI ; selon les tons finals employés, on obtient soit une intonation bien formée
(grammaticale) (a), soit une intonation qui entre en conflit avec l’organisation
syntaxique (b).
le père de ces enfants les accompagne à la guitare
(a) /BB HH /BB B-B-
(b) * HH /BB HH B-B-

Dans (a), l’intonation entraîne le regroupement de « le père » avec « de ces enfants »,
de même que celui de « les accompagne » avec « à la guitare ». Dans les deux cas, il
existe une relation syntaxique entre les parties regroupées : en effet, « père » régit
« enfants » et « accompagne » régit « à la guitare ». L’intonation (a) respecte donc les
relations syntaxiques. En revanche, l’intonation (b) va à l’encontre de ces relations,
puisqu’elle regroupe « de ces enfants » avec « les accompagne ». Or, entre le verbe et le

33
cf. Rossi et al. (1981), Mertens (1993, 1997, 2009), Mertens et al. (2001). La question est
cruciale pour les logiciels de synthèse de la parole à partir du texte, qui permettent à l’ordinateur
de prononcer des énoncés avec une intonation appropriée, cf. Rossi (1993), Mertens (1999,
2002, 2004).
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 96

groupe nominal il n’existe aucun lien de dépendance direct ; « enfants » dépend d’abord
de « père », avant de dépendre de « accompagne ». La deuxième intonation est erronée.
Le principe peut être formulé ainsi : dans une structure syntaxique simple constituée
d’un élément recteur (en l’occurrence le verbe) et de ses dépendants directs et indirects
éventuels, le regroupement intonatif ne peut pas aller à l’encontre des relations de
dépendance ; on ne peut regrouper par l’intonation deux éléments, si l’un d’entre eux
dépend d’un troisième élément qui ne figurerait pas dans l’unité résultante.
Ce principe permet d’expliquer bon nombre de phénomènes, comme celui de la
désambiguïsation de phrases syntaxiquement ambiguës comme « la belle ferme le
voile » (où le verbe principal est tantôt « ferme », tantôt « voile »), ou « un professeur
de français canadien » (où l’adjectif « canadien » modifie tantôt le nom « professeur »,
tantôt le nom « français »).
Le réseau de dépendance inclut à la fois les actants et les circonstants (soit les
compléments essentiels et accessoires) éventuels. Dans « tous les soirs, ma femme
racontait une histoire aux enfants », « ma femme racontait » peut former un seul groupe
intonatif, puisque le verbe régit l’objet. Ce n’est pas le cas de la séquence « tous les
soirs, ma femme » parce qu’il n’y a aucun lien de dépendance entre « tous les soirs » et
« ma femme ».

5.3.3 L’intonation de certaines constructions syntaxiques

La section précédente décrit la congruence entre les organisations syntaxique et into-


native pour le réseau de dépendance autour du prédicat principal (verbal ou autre) et de
ses dépendants, qu’ils soient actants (compléments essentiels) ou non. Certaines con-
structions syntaxiques dépassent ce réseau principal et contraignent fortement l’intona-
tion34.
Dans « l’année universitaire commence demain » l’accentuation du GA « l’année » est
facultative ; il peut aussi être regroupé avec le GA suivant (« universitaire »), vu le lien
de dépendance entre eux. En revanche, dans « l’année, elle commence demain »,
l’accentuation du GA « l’année » est obligatoire et ce groupe demande à sa fin une
frontière prosodique majeure. Certaines constructions syntaxiques contraignent forte-
ment l’intonation, en introduisant une frontière prosodique obligatoire (FPO) et forte,
ou bien en imposant le contour d’appendice. Ci-dessus nous examinons les cas les plus
importants.
1. La construction clivée entraîne une FPO entre la partie introduite par « c’est » et la
subordonnée relative35. La partie frontale constitue un seul paquet intonatif et reçoit le

34
cf. Mertens (1997), Eynde et al. (1998), Mertens et al. (2001), Mertens (2008, 2013).
35
Plus exactement, le noyau verbal principal introduit par « que » ou par un pronom relatif.
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 97

plus souvent le ton HB ou HB-, dont la fonction de mise en valeur s’accorde bien avec
le procédé syntaxique de clivage. Alternativement on trouve le ton B-B-.
c’est çaHB- b-qui ressort de son étudeb-
c’est précisément làHB- b-que des problèmes d’emploi surgissentb-
c’est luiB-B- b-qui l’a ditb-

Dans l’interrogation, on rencontre le ton H/H , suivi de l’appendice haut :


c’est quoiH/H hqui ressort de son étudeh ?
c’est quoiB-B- b-qui ressort de son étudeb-

Le noyau verbal reçoit le contour d’appendice s’il est court36.


La situation est analogue pour l’interrogation clivée :
est-ce un petit peu çaH/H || hqui ressort de votre étudeh ?

2. Le dispostif de binarisation37 indique une construction du type « cinq francsHB- b-il


manqueb- » ou « du gâteauHB- b-on a mangé b- », où un élément extrait du noyau verbal et
placé devant lui, porte un contour terminal, alors que le reste du noyau verbal porte un
contour d’appendice. Le rôle du prédicat verbal se limite alors à indiquer la fonction
syntaxique de l’élément antéposé.
3. Dans la dislocation à gauche un constituant non clitique en tête d’énoncé présente
un lien de coréférence avec un dépendant également présent sous forme clitique auprès
du verbe, par exemple : « ces textesH/H || ils ont été écrits par de grands esprits ».
L’élément disloqué est nécessairement accentué et une frontière prosodique majeure le
sépare de la suite de la construction. Quand il y a plusieurs termes dédoublés, il y a
autant de frontières : « Jean || ces textes || il ne les a pas lus ».
4. Dans la dislocation à droite, l’élément disloqué adopte le contour d’appendice et
est ainsi placé à l’arrière-plan informatif. Dans « ils ont été écritsHH par de grands
espritshB-B- b-ces textesb- », le groupe qui se termine par « esprits » doit être accentué,
alors que « ces textes » reste atone. Il en est de même pour « je les lui ai donnés, à
Jean ». Dans « à vrai dire on m’a poussé / on est venu me proposer... [question de
l’interlocuteur :] c’est qui, on ? » le pronom interrogatif « qui » doit être accentué, alors
que le « on » qui le suit reste atone (il reçoit le contour d’appendice).
5. Dans la construction pseudo-clivée une FPO sépare les deux volets : « ce qui
frappe dans ces textesH/H || c’est qu’ils ont été écrits par de grands esprits ». Contraire-
ment à la clivée (du type « c’est X qui »), on n’emploie pas l’appendice pour la
deuxième partie de la construction. Sur le plan prosodique la pseudo-clivée se comporte
comme la dislocation à gauche.

36
Rialland et al. (2002) et Delais-Roussarie et al. (2002) observent d’autres intonations et
concluent que la clivée peut avoir plusieurs organisations informationnelles auxquelles
répondent des intonations différentes ; comparez : « Qui est tombé ? C’est le petitHB- b-qui est
tombéb- . » « Qu’est-ce qui se passe ? C’est le petitHH qui est tombéHH dans l’escalier B-B-. »
Cependant, le dernier exemple n’est pas une clivée mais une subordonnée relative.
37
Voir Blanche-Benveniste et al. (1984) et Eynde & Mertens (2003).
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 98

6. Les adverbes de phrase (« assurément, décidément, en somme, en fait, simple-


ment, manifestement... ») suivent le comportement prosodique des dislocations (Mer-
tens 2013). En tête d’énoncé, l’adverbe sera accentué et accompagné d’une frontière
prosodique majeure : « décidémentHH || il faudra trouver quelqu’un d’autre pour le
faire ». En position finale, l’adverbe reçoit l’appendice : « ça devient problématiqueHB
décidémentb-b- ». Sans contour d’appendice, l’adverbe de phrase postposé sera interprété
comme une proposition indépendante : « ça devient problématiqueHB- DécidémentHB- ».
7. Une incise sera entourée de frontières prosodiques majeures. Le plus souvent elle
s’accompagne d’un changement du registre mélodique vers le bas ou vers le haut.
Les phénomènes liés à la modalité phrastique (interrogation, exclamation, ordre)
sont bien connus. Nous nous limitons à quelques exemples, adoptant un point de vue
strictement syntaxique. L’interrogation totale porte sur la proposition dans son
ensemble : « Travaille-t-il ? », « Il travaille déjà ? ». On y répond par « oui » ou « non ».
Dans l’interrogation totale sans mot interrogatif, l’accent final du dernier groupe into-
natif s’accompagne du ton H/H : « Il travaille déjàH/H ». Le même contour est accepté en
inversion : « Travaille-t-ilH/H ». Si l’interrogation se construit avec « est-ce que », on a
soit une montée (« est-ce qu’il travaille déjàH/H»), soit une courbe descendante avec un
accent d’insistance sur « est-ce » : « Hest-ce qu’il travaille déjàB-B- ». Dans les
interrogations partielles, qui portent sur tel ou tel élément de la proposition, le mot
interrogatif normalement est accentué : « avec laquelleHH sors-tuH/H ? avec quiHH sors-tuB-
B- 
? pourquoiHB- b-as-tu refusé celab- ? commentH/H helle le veuth ? »
Dans ces constructions, certains termes s’accompagnent nécessairement de formes
intonatives particulières. Parfois l’intonation seule impose telle interprétation plutôt que
telle autre : en effet, c’est l’intonation qui décide si « c’est la voiture qui a causé
l’accident » répond à la question « c’est quelle voiture ? » plutôt qu’à « qu’est-ce qui a
causé l’accident ? » et qui désambiguïse la construction à relative et la clivée.
L’association entre spécifications syntaxique et intonative est tellement étroite qu’on
peut affirmer que les propriétés intonatives sont indispensables à la définition de la
construction et que l’intonation est une composante de la syntaxe, au même titre que
l’ordre linéaire des constituants ou les relations de dépendance.
Quand on formule une idée, le lexique, la construction syntaxique et l’intonation
collaborent dans l’expression de l’information. L’intonation est-elle choisie selon la
construction syntaxique, ou est-ce l’inverse : la construction choisie dépend de
l’intonation ? Tout ce qu’on peut affirmer, c’est que l’énoncé prononcé doit respecter un
certain nombre de contraintes entre les plans de structuration syntaxique et intonatif : il
y a le rôle de l’accent lexical, celui du groupe accentuel, le regroupement intonatif, le
principe de congruence, et la construction syntaxique.
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 99

Questions et exercices

1. D’où vient le terme niveau suprasegmental ?


2. Quelles sont les composantes élémentaires de la prosodie ?
3. En quoi consiste la différence entre les variations mélodiques des langues à tons et
celles des langues à intonation, comme le français ?
4. Quelle est la fonction de l’intonation dans une langue comme le français ?
5. L’analyse acoustique de la mélodie, est-elle préférable à une analyse auditive ?
6. Qu’entend-on par syllabe proéminente ?
7. Soulignez les syllabes accentuables dans les mots suivants:
a. (français) simplicité — importance — crucial — investigation —
investissement — portait — politique — visage — individu — partirons
b. (anglais) simplicity — importance — crucial — investigation — investment —
political — politics — individual
c. (néerlandais) eenvoud — eenvoudig — politie — benadering — politiek —
averij — bakkerij — bakker — boer — boerin
8. Le français, est-il une langue à accent fixe ? Justifiez votre réponse à l’aide
d’exemples concrets. Est-ce que la situation est différente en anglais ou en néer-
landais ?
9. Par quelles propriétés audibles se manifeste l’accentuation d’une syllabe ?
10. Donnez la transcription phonétique et indiquez les syllabes accentuées:
étang sarabande carnivore
économique parlions hirondelle
11. Indiquez les mots non clitiques dans les phrases suivantes:
Les oiseaux migrateurs dessinent des formes dansantes dans le ciel.
La misogynie est le pilier de toute société patriarcale.
Il fallait bien prouver qu’elles étaient faites pour ça.
12. En quoi consiste la différence entre l’accent final et l’accent initial ? Pourquoi
convient-il de les distinguer ?
13. Qu’est-ce qu’un niveau de hauteur ? Quelle est son intérêt pour la description de
l’intonation ?
14. Expliquez la notion de groupe intonatif, sa structure interne, et son importance pour
la description de l’intonation.
15. En quoi consiste la différence entre le groupe intonatif et le groupe accentuel, et
quelle est l’utilité de cette distinction ?
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 100

References bibliographiques

Alessandro, C. d’; Mertens, P. (1995) Automatic pitch contour stylization using a model of
tonal perception. Computer Speech and Language 9(3), 257-288.
Bolinger, D.L. (1951) Intonation: levels vs. configurations. Word 7, 199-210.
Coustenoble, H.N. & Armstrong, L.E. (1934) Studies in French intonation, Cambridge : Heffer.
Crystal, David (1987) The Cambridge Encyclopedia of Language. Cambridge: Cambridge
University Press.
Delais, E. (1995) Pour une approche parallèle de la structure prosodique. Etude de
l'organisation prosodique et rythmique de la phrase française. Thèse de doctorat,
Université de Toulouse - Le Mirail, pp. 303 + xxv
Delais-Roussarie, E.; Rialland, A.; Doetjes, J.; Marandin, J.-M. (2002) The Prosody of Post-
Focus Sequences in French. Proceedings of the Speech Prosody 2002 conference, 11-13
April 2002. Aix-en-Provence.
Delattre, Pierre (1961) La leçon d’intonation de Simone de Beauvoir. Etude d’intonation
déclarative comparée. French Review 35 (1), 59-67.
Delattre, Pierre (1966) Les dix intonations de base du français. French Review 40(1), 1-14.
Delattre, Pierre (1967) La nuance de sens par l’intonation. French Review 41(3), 326-339.
Delattre, P. (1972) The distinctive function of intonation. in Bolinger, D.L. (ed) (1972)
Intonation, selected readings. Harmondsworth: Penguin Books. 159-174.
-Dell, François (1984) L’accentuation dans les phrases en français. in Dell et al. (ed) (1984), 65-
122.
-Dell, F.; Hirst, D.J. & Vergnaud, J.R. (eds.) (1984) La forme sonore du langage. Structure des
représentations en phonologie. Paris: Hermann.
Earle, Michael A. (1975) An acoustic phonetic study of northern Vietnamese tones. Santa
Barbara, CA: Speech Communications Research Laboratory.
Eynde, Karel van den; Mertens, Piet (2003) La valence : l’approche pronominale et son
application au lexique verbal. Journal of French Language Studies 13, 63-104.
Eynde, K. van den; Mertens, P. & Swiggers, P. (1998) Structuration segmentale et
suprasegmentale en syntaxe: Vers un modèle intégrationniste de l’écrit et de l’oral. In:
Bilger, M.; van den Eynde, K. & Gadet, F. (1998) Analyse linguistique et approches de
l’oral. Recueil d’études offert en hommage à Claire Blanche-Benveniste. Collection
"Orbis/Supplementa 10", Leuven-Paris: Peeters. 33-57.
Garde, P. (1968) L’accent. Paris: P.U.F., 171 pp. Collection Le Linguiste, 5.
Goldsmith, J. (1978) English as a tone language. Communication and Cognition 11(3-4), 453-
76.
Hart, J. ’t (1976) Psychoacoustic backgrounds of pitch contour stylisation. IPO Annual Progress
Report 11, 11-19.
Hart, J. ’t; Collier, R. & Cohen, A. (1990) A perceptual study of intonation. Cambrigde :
Cambridge Univ. Press, 227 pp.
Honorof, D.N. & Whalen, D.H. (2005) Perception of pitch location within a speaker’s F0 range.
Journal of the Acoustical Society of America 117 (41), 2193-2200.
Isachenko, A.V. & Schädlich (1964) Untersuchungen über die deutsche Satzintonation. Studia
Grammatica VII.
Kahn, F. (1968) Introduction à l’étude de la mélodie de l’énoncé français chez un jeune Parisien
cultivé du 16ème arrondissement. Cahiers Ferdinand de Saussure 24, 15-44.
Kahn, F. (1969) Différenciations mélodiques dans l’énoncé français. Cahiers Ferdinand de
Saussure 26, 15-31.
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 101

-Klinghardt, H. & de Fourmestraux, M. (1911) Französische Intonationsübungen. Cöthen


Lacheret-Dujour, Anne & Beaugendre, Frédéric (1999) La prosodie du français. Paris: Editions
CNRS, pp. 354
Ladd, D.R. (2009) Intonational Phonology. Cambridge: Cambridge University Press, 2nd
edition
Martin, Philippe (1975) Analyse phonologique de la phrase française. Linguistics 146, 35-67.
Martin, Philippe (1978) Questions de phonosyntaxe et de phonosémantique en français.
Lingvisticae Investigationes 2, 93-126.
Martin, Philippe (1981) Pour une théorie de l'intonation. L’intonation est-elle une structure
congruente à la syntaxe? in Rossi et al., pp. 234-271.
Martin, Philippe (1987). Prosodic and rhythmic structures in French. Linguistics 25, 925-949.
Martin, Philippe (2009). L’intonation du français. Paris: Armand Colin, 256 pages. Collection
« U ».
Martin, Philippe (2011) La prosodie du français: une approche pas très syntaxique. Journal of
French Language Studies 21, 1, 39-52.
Mertens, Piet. 1987. L’intonation du français. De la description linguistique à la
reconnaissance automatique. Thèse de doctorat, Université de Leuven.
Mertens, Piet (1990) Chap. IV. L’intonation. in Blanche-Benveniste, C.; Bilger, M.; Rouget, C.
& Eynde, K. van den (1990), Le français parlé. Etudes grammaticales. Paris : Éditions du
CNRS, p. 159-176
Mertens, Piet (1992) L’accentuation de syllabes contiguës. ITL-Review of Applied Linguistics
95-96, 145-165.
Mertens, Piet (1993) Accentuation, intonation et morphosyntaxe. Travaux de Linguistique 26,
21-69.
Mertens, Piet (1997) De la chaîne linéaire à la séquence de tons. T.A.L. 38 (1), 27-51.
Mertens, Piet (1999) Un algorithme pour la génération de l’intonation dans la parole de
synthèse. Actes Conférence Traitement Automatique du Langage Naturel 1999, Cargèse,
12-17 juillet 1999, 233-242.
Mertens, Piet (2002) Synthesizing Elaborate Intonation Contours in Text-to-Speech for French.
In Bernard Bel & Isabelle Marlien (eds.) 2002. Proceedings of the Speech Prosody 2002
conference, 11-13 April 2002. Aix-en-Provence: Laboratoire Parole et Langage. pp.
499-502.
Mertens, Piet (2004) Le prosogramme : une transcription semi-automatique de la prosodie.
Cahiers de l’Institut de Linguistique de Louvain 30 (1-3), 7-25.
Mertens, Piet (2004) Quelques allers-retours entre la prosodie et son traitement automatique. Le
français moderne 72: 1, 39-57.
Mertens, Piet (2008) Syntaxe, prosodie et structure informationnelle : une approche prédictive
pour l’analyse de l’intonation dans le discours. Travaux de Linguistique 56 (1), 87-124.
Mertens, Piet (2009) Prosodie, syntaxe, discours : autour d’une approche prédictive. Actes du
colloque IDP2009 (Interface Discours Prosodie), Paris, 9-11 septembre 2009
Mertens, Piet (2013) A classification of French adverbs based on distributional, syntactic and
prosodic criteria. Lingvisticae Investigationes 36: 2, 201-228.
Mertens, Piet (2014) Polytonia: a system for the automatic transcription of tonal aspects in
speech corpora. Journal of Speech Sciences 4 (2), 17-57.
Mertens, Piet; Auchlin, Antoine; Goldman, Jean-Philippe; Grobet, Anne; Gaudinat, Arnaud
(2001) Intonation du discours et synthèse de la parole : premiers résultats d’une approche
par balises. Cahiers de Linguistique Française 23, 189-209.
Mertens, P.; Beaugendre, F. & Alessandro, Ch. d’ (1997) Comparing approaches to pitch
contour stylization for speech synthesis. in Santen, J.P.H. van; Sproat, Richard W.; Olive,
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 102

Joseph P. & Hirschberg, Julia (eds) (1997) Progress in Speech Synthesis, 347-363. New
York: Springer Verlag.
Mertens, Piet; Goldman, Jean-Philippe, Wehrli, Éric; Gaudinat, Arnaud (2001) La synthèse de
l’intonation à partir de structures syntaxiques riches. Traitement Automatique des
Langues 42(1), 145-192.
Morel, Mary-Annick & Danon-Boileau, Laurent (1998) Grammaire de l’intonation, l’exemple
du français. Gap: Ophrys.
Pierrehumbert, J. (1980) The phonetics and phonology of English intonation. Ph.D. M.I.T.
Cambridge, MA.
Pike, K.L. (1945) The intonation of american English. Ann Arbor: Univ. of Michigan Press.
Rialland, A.; Doetjes, Jenny; Rebuschi, G. (2002) What is focused in c’est XP qui/que cleft
sentences in French ? Proceedings of the Speech Prosody 2002 conference, 11-13 April
2002. Aix-en-Provence.
Rose, Phil (1987) Considerations in the normalisation of the fundamental frequency of linguistic
tone. Speech Communication 6/4, 343-352.
Rossi, M. (1993) A model for predicting the prosody of spontaneous speech (PPSS model)
Speech Communication 13, 87-107
Rossi, Mario (1999) L’intonation, le système du français : description et modélisation. Gap -
Paris : Ophrys Coll. L’essentiel français.
Rossi, M.; Di Cristo, A.; Hirst, D.; Martin, Ph. & Nishinuma, Y. (1981) L’intonation. De
l’acoustique à la sémantique. Paris: Klincksieck, 364 pp.
Smalley, W.A. (1964) Manual of articulatory phonetics. New York: Practical Anthropology,
512 pp.
Trager, G.L. & Smith, H.L. (1951) An outline of English structure. Studies in Linguistics,
Occasional Papers, 3. Washington Norman, Oklahoma
Van Dooren, K. & Eynde, K. Van den (1982) A structure for the intonation of Dutch.
Linguistics 20, 203-235.
Zwanenburg, W. (1965) Recherches sur la prosodie de la phrase française. Leiden.

Vous aimerez peut-être aussi