hauteur est appelée la courbe mélodique. On appelle registre l’intervalle entre les
hauteurs minimale et maximale employées par un locuteur.
2. La longueur permet d’opposer les éléments (sons, syllabes) brefs aux éléments
longs1. Le débit de parole ou tempo en fournit une mesure globale ; il indique le nombre
d’éléments (sons, syllabes) réalisés par unité de temps (par seconde, par exemple). Le
débit est d’autant plus élevé que les durées des éléments sont brèves. Le changement
rapide du débit provoque des accélérations ou des ralentissements de la parole. À un
niveau très local, les variations de longueur entre les syllabes donnent lieu au rythme.
Celui-ci peut être caractérisé comme la perception d’une organisation dans la succession
des syllabes, reposant sur leur poids relatif.
3. L’intensité permet d’opposer les sons forts aux sons faibles. Si une syllabe se
détache des syllabes environnantes par son intensité élevée, cela contribue à l’impres-
sion de l’accentuation de cette syllabe.
Les caractérisations auditives ci-dessus renvoient toutes à la façon dont ces phéno-
mènes prosodiques sont perçus par l’auditeur, qui est le premier observateur de la
parole. On s’intéressera également à leur origine physiologique (comment l’appareil
phonatoire permet-il de produire des variations de hauteur, par exemple), à leur mani-
festation acoustique (par quelles propriétés acoustiques se manifestent la hauteur,
l’intensité, la durée ; comment on les mesure), à leur perception (comment est perçue
une variation de hauteur), à leur fonctionnement linguistique et à leur représentation
phonologique (ou abstraite). Il importe de toujours préciser le niveau d’analyse ou de
description auquel on se situe : physiologique, acoustique, auditif, perceptif ou linguis-
tique. La terminologie l’indique dans la plupart des cas. Le tableau ci-dessous met en
relation les plans auditif et acoustique.
1
Dans certaines langues, comme en néerlandais, la longueur contribue aux oppositions entre
phonèmes ; elle y a une valeur phonologique et distinctive. Dans d’autres langues, tel le
français, la durée des phonèmes dépend de facteurs comme le contexte phonétique et l’accen -
tuation, et la longueur n’y a pas de valeur distinctive.
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 57
L’illustration ci-dessus montre les quatre2 tons du mandarin, associés à une même
suite de sons, avec la signification résultante. L’extrait qui suit, tiré d’un roman de
Pascal de Duve, décrit leur forme à partir de la façon dont l’interpréterait un Français.
2
Certains sinologues prévoient un cinquième ton neutre.
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 59
Certains auteurs se sont servis de la typographie (la position des lettres sur l’axe
vertical) pour imiter la courbe mélodique (le « texte dansant » de Bolinger 1951), d’une
façon fort approximative.
Certains phonologues structuralistes (Pike 1945, Trager & Smith 1951, pour
l’anglais ; Isachenko & Schädlich 1964, pour l’allemand) représentent les variations de
hauteur à l’aide d’un nombre restreint de niveaux de hauteur (de 2 à 5, selon les
auteurs ; cf. infra §3.4). Ces niveaux seront indiqués de plusieurs façons. Soit on utilise
un jeu de lignes superposées sur lesquelles les syllabes sont marquées par des traits :
une portée musicale simplifiée, en quelque sorte. Alternativement on surimpose au texte
une ligne dont la hauteur peut varier par quelques pas (Smalley 1964). Enfin, les
niveaux peuvent être notés par des chiffres, qui seront insérés dans le texte (Pike 1945).
Depuis les années 1970 on a vu apparaître des appareils spécialisés pour la mesure de
la fréquence fondamentale (F0), appelés détecteur du fondamental ou détecteur de
mélodie. L’illustration ci-dessous fournit un exemple de la mesure acoustique obtenue.
4
L’outil informatique Prosogram a été proposé par Mertens en 2004. Il s’agit d’une simulation
de la perception de la hauteur basée sur le modèle de perception tonale proposé par
d’Alessandro & Mertens (1995), Mertens & d’Alessandro (1995), Mertens et al. (1997). Le
modèle intègre les résultats d’études psycho-acoustiques sur la perception des variations de
fréquence fondamentale (seuil de glissando, effet de segmentation...).
5
L’intervalle mélodique qui sépare deux lignes dans la portée musicale est de 4 demi-tons dans
la plupart des cas, sinon de 3 demi-tons.
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 63
Figure 11. Prosogramme riche, ajoutant le F0 (trait fin en bleu), l’intensité (trait
continu en vert), le voisement et le noyaux syllabiques.
Figure 12. Prosogramme d’un énoncé présentant des variations mélodiques intra-
syllabiques.
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 64
2 L’accent
2.1 L’accentuation
Certaines syllabes se détachent des syllabes environnantes par un ou plusieurs
aspects prosodiques : par la hauteur, par sa durée, par l’intensité, ou par une variation de
hauteur importante. La syllabe en question est alors proéminente. L’accentuation est un
type particulier de proéminence.
L’accentuation d’une syllabe peut se manifester de plusieurs façons, soit par sa force
phonatoire particulière (résultant de la pression sous-glottique élevée), soit par l’allon-
gement. Ensemble ces aspects produisent l’impression d’un niveau sonore plus élevé
pour la syllabe en question. Dans certains cas, l’effort phonatoire pour l’accentuation
affecte également l’articulation du groupe consonantique à l’attaque, la durée des
consonnes, ainsi que l’organisation temporelle des segments à l’intérieur de la syllabe.
L’alphabet phonétique international indique l’accentuation à l’aide du signe [] qui
sera placé devant la syllabe accentuée ou devant sa voyelle : « décision » [].
Selon la force de l’accent, on fait parfois la distinction entre l’accent primaire et
l’accent secondaire, indiqué par le signe [], par exemple dans les mots composés relati-
vement longs en néerlandais : « belastingskantoor » [], où le premier
accent sera plus fort que le deuxième6.
D’abord, pour chacune de ces langues, la place de l’accent change d’une forme déri-
vée à l’autre. En anglais, par exemple, il frappe tantôt la première syllabe (« photo »),
tantôt la deuxième (« photography »), tantôt encore la troisième (« photografic »).
Ensuite, pour les formes correspondantes dans certaines langues, la position de
l’accent varie d’une langue à l’autre : c’est la troisième syllabe pour « photographe » et
« fotograaf », mais la deuxième pour « photographer » et « fotografo ».
6
Dans certaines études récentes sur l’intonation du français, ces mêmes termes sont employés
différemment : les accents primaire et secondaire désignent alors respectivement l’accent final
et l’accent initial (cf. infra, §2.4).
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 65
traverser
de kanon canon (mus.) het kanon canon (arme)
italien papa pape papa papa
ancora ancre ancora encore
amo j’aime amò j’aimai
meta cible metà moitié
faro phare farò je ferai
pero pommier però cependant
grec nomos loi nomos département
fora impetus fora temps
σπάνιoς [ˈspanjos] exceptionnel σπανιός [span rarement
ˈjos]
πόλι [ˈpoli] ville πoλί [poˈli] beaucoup, très
et toniques en français. Cependant, pour prédire la nature clitique des mots, il faut en
outre tenir compte de critères syntaxiques.
absolument absolument
AI AF AI AF
Contrairement à l’accent final, l’accent initial peut frapper n’importe quel mot, même
un mot clitique. L’extrait suivant (figure 13) présente plusieurs articles « les » frappés
par l’AI.
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 68
Variation mélodique
La variation mélodique ou variation de hauteur correspond à l’évolution de la hau-
teur sur un fragment de parole considéré ; elle se caractérise par sa pente montante,
descendante ou plate, par sa durée, par l’intervalle mélodique parcouru ; la variation est
simple ou complexe selon qu’elle comporte une ou plusieurs parties de pente différente.
9
Il ne faut pas confondre le ton en tant qu’intervalle mélodique du solfège, et le ton en tant que
niveau de hauteur employé dans l’étude phonologique des langues africaines et asiatiques.
10
Pour l’échelle musicale, des intervalles égaux (de 2 tons, par exemple) seront jugés compa-
rables quelle que soit la hauteur de départ. Il en est autrement de l’échelle acoustique en Hertz,
où des écarts de fréquence égaux (de 30 Hz, par exemple) seront perçus comme des intervalles
de taille différente selon que la fréquence de départ est de 100 ou 200 Hz, par exemple. Notons
qu’il existe d’autres échelles de hauteur (mel, ERB), établies en psychoacoustique. Pour un
exposé plus détaillé, voir le lien suivant :
https://sites.google.com/site/prosogram/userguide#semitones
11
L’examen du tracé de F0 montre que sur le plan acoustique ces syllabes présentent tout de
même une variation de F0 qui s’étale sur tous les segments voisés. Parfois, des variations
importantes ne sont pas perçues du tout. Il s’agit donc d’un phénomène de perception.
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 71
Le contour
Chez certains auteurs le contour désigne une courbe ou configuration de hauteur
considérée comme une forme de base du système intonatif d’une langue (voir § 4.1).
Les différences dues aux tessitures individuelles, au tempo et au rythme n’empêchent
pas des similarités entre contours envisagés comme des configurations mélodiques. Une
telle configuration associe des cibles de hauteur à des endroits précis (ou localisations)
du contour, tels que la syllabe accentuée, la syllabe pénultième, le début ou la fin de la
courbe. Bien entendu, l’identification d’une configuration suppose au préalable des
décisions sur l’unité prosodique (le segment sur lequel porte le contour), sur la nature
des localisations et, enfin, sur la quantification des intervalles mélodiques. C’est ici
qu’intervient la notion des niveaux de hauteur.
La notion de niveau de hauteur remonte à la description des langues à tons (langues bantoues,
12
Figure 15. Interprétation progressive des niveaux de hauteur relatifs pour une suite
de syllabes. Les flèches représentent des intervalles mélodiques majeurs. La ligne
pointillée donne la déclinaison reconstruite.
14
L’idée originale remonte à Van Dooren & van den Eynde (1982).
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 73
Figure 16. Le niveau infra-bas est atteint à la fin de la proposition « il faudrait faire
un dictionnaire de la misogynie ».
Figure 17. Extrait qui illustre des intervalles mélodiques importants pour atteindre
le niveau suraigu.
15
Si l’inventaire contient en effet les contours les plus fréquents tels que les continuations
mineure et majeure, la finalité et l’implication, il inclut aussi des contours exceptionnels,
comme la parenthèse haute.
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 76
Lorsque la notation à niveaux de hauteur ne suffit pas pour opposer deux ou plu-
sieurs contours (comme c’est le cas des contours de types 2-4 et de type 4-1), la forme
(concave ou convexe) de la courbe est également indiquée. Pour différencier « continua-
tion majeure », « question » et « implication », ces contours seront notés 2-4, 2-4+ et 2-
4_ respectivement. Pour les contours « interrogation », « exclamation » et« ordre » la
notation devrait également être enrichie. Il reste à vérifier si ces contours peuvent être
discriminés entre eux en l’absence d’informations segmentales, lexicales ou syn-
taxiques.
La dénomination des contours reflète leur fonction supposée, qui se situerait surtout
au niveau du marquage de la modalité de la phrase ou de l’organisation syntaxique. Là
où la « finalité » marque la fin d’une proposition déclarative, les « continuations
mineure et majeure » apparaissent aux frontières internes de la proposition (ou de la
structure syntaxique correspondante). Le contour d’« interrogation » accompagnerait
une phrase interrogative à mot interrogatif, celui de la « question » serait utilisé dans les
phrases sans marque lexicale ou syntaxique de l’interrogation. L’« implication » mar-
querait la conviction du locuteur.
L’identification du contour et du groupe intonatif qui le porte repose uniquement sur
la reconnaissance de la forme du contour. Delattre rejette la notion d’accent.
16
La résolution fréquentielle réduite du spectrographe à filtre étroit, utilisé par Delattre, entraîne
automatiquement un lissage de la courbe de fréquence fondamentale.
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 77
19
La question se transforme alors en un problème d’analyse syntaxique, qui suppose la défini-
tion des constituants possibles et une procédure pour les identifier dans la chaîne parlée.
20
C’est implicitement le cas de l’approche de Delattre esquissée plus haut.
21
Comme les phénomènes d’accentuation sont propres à une langue donnée, l’unité prosodique
basée sur l’accent le sera aussi. Cependant, l’unité basée sur l’accent final est compatible avec
celle d’autres analyses pour le français, même celles basées sur la signification. En outre cette
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 81
cave ! », « Il sera à l’hôpital ! », avec à chaque fois sur la dernière syllabe pleine un
sommet de hauteur suivi d’une chute majeure. Les réponses portent toutes le même
contour, mais réparti sur un nombre de syllabes de plus en plus important (figure 22).
Le sommet de hauteur et la chute y restent au même endroit, à savoir à la syllabe finale ;
les syllabes précédentes restent au niveau bas. (Bien sûr d’autres contours pourraient
être utilisés pour ces mêmes énoncés.) Ces exemples montrent donc que la syllabe de
l’accent final constitue le pivot du contour, son élément central : c’est la partie indis-
pensable du contour, celle qui reste quel que soit le nombre de syllabes dans le groupe.
L’unité descriptive du groupe intonatif (en abrégé : GI) correspond à une suite de
syllabes comportant un seul accent final sur la dernière syllabe pleine du groupe. Les
autres syllabes éventuelles dans le groupe sont atones (non accentuées). Éventuellement
un accent initial (AI) peut apparaître à l’intérieur de la partie atone 22. Tout énoncé
apparaît alors comme une suite de groupes intonatifs.
Examinons le nombre et la nature des syllabes qui précèdent l’accent final dans GI.
Dans des énoncés comme « Où ? », « Là ! », « Quand ? », « Qui ? », « Jean ! », le GI ne
comporte que la syllabe accentuée et il n’y pas de syllabe atone. En revanche dans
« Pourquoi ? », « À Bruxelles. », « Il nous l’expliquera. », on obtient une suite de
syllabes atones d’une à quatre syllabes avant l’accent. L’énoncé « Absolument ! » forme
un seul GI : la syllabe accentuée finale y est précédée de syllabes atones. On rencontre
couramment des réalisations avec l’accent initial soit sur la première (« Absolument ! »)
soit sur la deuxième syllabe (« Absolument ! »). Il arrive que l’accent initial précède
immédiatement l’accent final, sans syllabe atone entre eux : « Assez ! ». Les accents
contigus, bien que évités dans la parole lue, ne sont pas exceptionnels dans la parole
spontanée (Mertens 1992).
où pourquoi absolument
AF . AF . . . AF
quand à Bruxelles absolument
AF . . AF AI . . AF
là il nous l’expliquera absolument
AF . . . . AF . AI . AF
unité peut être mise en rapport avec des entités de nature syntaxique.
22
Les cas où un groupe intonatif comporte plusieurs accents initiaux, ou où une telle analyse
pourrait être envisagée, sont rarissimes.
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 82
Figure 23. Quelques contours intonatifs du français. Chaque trait indique la hauteur
d’une syllabe. Les traits épais indiquent les syllabes accentuées. Pour la notation en
niveaux de hauteur, voir le commentaire dans le texte. Cependant, « l » et « L »
indiquent ici le niveau bas, « l- » et « L- » l’infra-bas.
La dernière syllabe pleine de chaque groupe porte l’accent final. Sa hauteur perçue
peut être plate (1A, 1B), descendante (1C) ou montante (1D). Le niveau de hauteur
atteint peut varier : infra-bas (1A), haut (1B), mais aussi bas, bas rehaussé, bas abaissé,
haut rehaussé, haut abaissé et suraigu, soit l’ensemble des niveaux retenus. (Les conven-
tions de notation et la combinatoire des tons seront expliquées plus loin. )
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 83
Les contours en deuxième rangée portent un accent initial haut sur la première
syllabe du mot « sympathique ». Le contour de l’accent initial est généralement plat et
au niveau haut, rarement au niveau bas.
Les contours de la troisième rangée illustrent l’importance de la syllabe pénultième
atone. Le plus souvent celle-ci sera au niveau bas ; lorsqu’elle est au niveau haut, on
obtient un contour différent avec un effet de sens particulier (voir § 5.2.3).
Que nous apprend cet échantillon de contours ? Les contours de la deuxième rangée
sont identiques à ceux de la première, à l’exception de l’accent initial. De la même
façon, les contours 1A et 3A sont identiques à l’exception du niveau de hauteur à la
pénultième ; il en est de même pour 1D et 3D.
Ce rapprochement illustre le point suivant. Plutôt que de concevoir le contour comme
une entité indivisible, on peut le concevoir comme un object structuré, composé de
plusieurs parties, plus précisément comme la succession de formes situées à des endroits
précis du groupe intonatif. Cette approche analytique présente plusieurs avantages.
D’abord elle est économique : elle ramène le nombre élevé de contours distincts à une
combinaison d’éléments moins nombreux. Ensuite elle explicite la structure interne du
groupe intonatif. Ceci permet d’étudier son alignement avec le plan segmental (les sons,
les syllabes, les mots), son organisation interne, et d’envisager une fonction (séman-
tique) pour chacun des éléments constitutifs. Il en résulte une analyse compositionnelle,
où la signification de l’ensemble résulte de la combinaison de celles des parties
constitutives.
Dans la suite, le ton indiquera le ou les niveaux de hauteur associés à une localisa-
tion, soit à une syllabe23.
L’intonation d’un énoncé se présente alors comme une succession de groupes intona-
tifs (GI), où chaque groupe se décompose à son tour en une suite de localisations,
auxquelles est associé un ton du paradigme correspondant.
On distingue trois classes de tons, selon le caractère accentué on non et selon le type
d’accent. Il s’agit des paradigmes24 de tons associés aux localisations de l’accent final
(AF), de l’accent initial (AI) et d’une suite non accentuée (NA). Le tableau suivant
illustre les paradigmes des tons dans chacune des localisations.
23
Comme on l’a vu, ce terme (le ton) est habituellement réservé aux variations mélodiques
rencontrées dans les langues à tons, où elles ont une fonction lexicale.
24
Le paradigme indique l’ensemble des éléments qui peuvent figurer à un point de la chaîne
parlée, c’est-à-dire dans un contexte donné. Ainsi dans la chaîne « je le regarde », on peut
remplacer le deuxième élément par « les » ou par « la », mais non pas par « il », « où », « de ».
On en déduit que « le, la, les » appartiennent au même paradigme, auquel n’appartiennent pas
« il », « où » et « de ».
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 84
NA AI NA AF
b b H b b B-B-
h h B h h H+H+
HB-
H/H
/HH
\HH
HB
BH
HH
/BB
BB
\BB
La notation des tons explicite sa position dans le GI. 1. Les majuscules s’emploient
en position accentuée, les minuscules en position atone. 2. Dans le cas d’un ton statique
sous l’accent (par exemple, le contour 1B), la notation redouble le niveau de hauteur :
nous transcrivons HH au lieu de H, BB au lieu de B, /BB au lieu de /B. Cette
convention de notation vise à distinguer le ton de l’accent final (par exemple HH) du
ton homophone sous l’accent initial (soit H). 3. Une suite atone (NA) est représentée par
deux localisations : le début et la fin de la séquence. Quand une partie atone ne com-
porte qu’une syllabe, les deux localisations coïncident dans la même syllabe, qui reçoit
alors deux niveaux de hauteur. Comme la syllabe atone ne connaît pas de variation
mélodique audible, ses deux niveaux seront forcément identiques.
on a retrouvé les corps des victimes
b........b HH bb HH b...b B-B-
25
La combinaison de tons des différents paradigmes doit respecter le principe de définition des
niveaux rehaussés et abaissés : ces niveaux supposent un intervalle mineur par rapport au niveau
de base précédent ; pour cette raison des suites telles que “b..b /HH”et “b../h BB” sont exclues.
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 85
Dans les énoncés suivants, la partie finale de l’énoncé (« en quelque sorte », « les
autres ») portera un contour plat au niveau infra-bas, réalisé avec une faible intensité,
sans syllabe accentuée. Ce contour sera appelé contour d’appendice.
et c’est comme ça que l’histoire marche en quelque sorte (R. Barthes)
j’aime bien comprendre comment ça marche les autres (F. Giroud)
Dans l’extrait ci-dessous, l’appendice apparaît aussi sur le mot « littéraire », après
l’accent final sur « mythe ».
NA AI NA AF NA
b b H b b B-B- b-...b-
h h B h h H+H+
HB-
H/H h..h
/HH
\HH
HB
HH
/BB
BB
\BB
Il arrive que, pendant une partie de l’énoncé, le locuteur passe à un registre plus haut
ou plus bas que son registre usuel, par exemple pour délimiter une incise. Le change-
ment de registre peut aussi être employé comme un procédé expressif. Dans les
exemples ci-dessous les changements de registre sont notés par les symboles et .
La preuve, c’est que actuellement, voyez-vous en soixante-quinze je pense que vous
serez d’accord avec moi, il n’y a plus ce qu'on appelait autrefois de grands écrivains.
(R. Barthes)
mais je crois que c'est à ces problèmes essentiels que nous devons consacrer si
monsieur Fabius naturellement en est d'accord notre entretien de ce soir (J. Chirac)
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 87
L’intonation indique comment les groupes intonatifs s’organisent dans l’énoncé ; elle
remplit une fonction organisatrice (hiérarchisante).
À chaque contour de groupe correspond une frontière prosodique ; son degré est lié
au ton de la syllabe accentuée finale28. La frontière maximale revient aux contours
28
La terminologie de M. Rossi (1999) fait écho à la fonction hiérarchisante : intonèmes conti-
nuatifs mineur et majeur, intonème conclusif. Elle prolonge en cela les étiquettes de P. Delattre
(1966). La notation des contours chez Ph. Martin (1978) reflète directement les degrés de
frontière (où le degré 0 correspond à la frontière maximale) : C0, C1, C2, C3...
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 88
descendant jusqu’au niveau infra-bas (B-B-, HB-). Dans les autres cas, la frontière est
proportionnelle au niveau de hauteur atteint au sommet de la syllabe accentuée finale :
plus le sommet est élevé, plus la frontière est forte.
L’enchaînement de groupes intonatifs avec leurs frontières respectives donne lieu à
une organisation hiérarchique. Quand une frontière faible est suivie d’une frontière
forte, les groupes en question forment une unité plus grande, tout en préservant le
rapport de force entre les deux parties. Il en résulte un paquet intonatif. Quand une
frontière est suivie d’une autre frontière de même degré ou de degré inférieur, les deux
groupes sont simplement juxtaposés. La succession de frontières donne un parenthésage
en constituants prosodiques emboîtés.
Les exemples suivants illustrent deux regroupements alternatifs pour une même suite
de mots, l’un en trois parties, l’autre en deux parties majeures.
((d’abord)(la viande)) ((les légumes) (ensuite)) ((laisser) (mijoter))
\BB HH \BB HH /BB B-B-
(((d’abord)(la viande)) (les légumes)) ((ensuite) ((laisser) (mijoter)))
\BB HH H/H HH /BB B-B-
Le regroupement intonatif repose sur les tons finals. L’accent initial n’y participe
pas ; il joue un rôle différent, mais complémentaire à celui du ton final (cf. 5.2.3).
Les frontières de GI et le regroupement intonatif entraînent une structuration de la
chaîne parlée ; celle-ci présente en même temps une organisation syntaxique. La
question de la correspondance entre les deux types d’organisation sera abordée dans la
section 5.3.2., où nous étudierons dans quels cas les organisations intonative et syn-
taxique sont compatibles.
HH continuation majeure
Figure 26. Exemple du contour « b..b HB- » sur « importance » et du contour « b..b
HB » sur « des imbécil-euh ».
Dans les exemples à effet contrastif, l’emploi du ton HB- en position non finale va de
pair avec le contour d’appendice sur la suite de la structure syntaxique après ce ton.
Figure 27. Exemple du contour « b..b BH » sur « jolie », « belle » et « élégante ».
La pénultième haute
Dans la plupart des contours la syllabe pénultième atone est basse. La pénultième à
ton haut (h) se rencontre surtout en combinaison avec les tons finals B-B- et \HH. La
première combinaison donne le contour « b..h B-B- », qui crée un effet d’évidence. Le
locuteur présente l’information comme étant évidente, ce qui peut être interprété comme
une marque d’assertivité. La deuxième combinaison « b..h \HH », avec la chute à inter-
valle mineur entre la pénultième et la finale, provoque une connotation où le locuteur
évoque implicitement une situation, un savoir partagé. À l’écrit cet effet est parfois
suggéré par l’emploi de guillemets.
L’accent initial peut être utilisé pour délimiter une entité plus grande que le mot
isolé, par exemple une suite de mots à l’intérieur du groupe ou du paquet intonatif. Il
permet ainsi de mettre en exergue un constituant ou de faire porter la valeur du ton sur
un élément qui dans la chaîne linéaire ne se trouve pas sous l’accent final. C’est le cas
dans l’exemple de la figure 26, où l’accent initial frappe la conjonction « si » et où la
subordonnée entière apparaît comme un seul bloc.
Les accents initiaux abondent dans la prononciation des présentateurs et présenta-
trices de radio et de télévision, qui semblent souligner tous les mots, ou presque. Ainsi
ils semblent vouloir donner un semblant de spontané à leur lecture de textes dont la
signification ne se découvre qu’à la lecture-même.
La plupart des phrases, même les phrases syntaxiquement univoques, peuvent être
prononcées de plusieurs façons, avec un nombre variable de groupes intonatifs. À côté
de la prononciation « L’année universitaire | commence | demain | », avec trois syllabes
accentuées finales et dès lors trois GI, on trouve également « L’année | universitaire |
commence | demain | », prononcée en quatre groupes. Mais c’est le découpage maxi-
mal : il serait impossible d’en avoir plus. Dans les réalisations avec moins de GI, chaque
frontière réalisée apparaît également dans le découpage maximal. Les frontières réali-
sées forment donc un sous-ensemble des frontières possibles. Si certaines frontières
peuvent être supprimées, en aucun cas elles n’apparaîtront à des endroits autres que
ceux du découpage maximal : la segmentation « L’année uni | versitaire | commence |
demain | » est exclue. On appellera groupe accentuel (GA) chacune des unités du
découpage maximal. Le groupe intonatif comporte un ou plusieurs groupes accentuels
successifs.
29
Cf. § 2.3.
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 94
Précisons que si le clitique est séparé de l’élément dont il dépend par un autre
élément non clitique, il s’adjoint au groupe accentuel qu’il précède 30 : dans « ce
magnifique bateau », « ce » forme un GA avec « magnifique ».
Le squelette prosodique de l’énoncé explicite la formation des GA. Il montre le statut
de chaque syllabe, celles qui sont accentuables (susceptibles de recevoir un ton final),
mais sans fixer le ton qu’elles portent et qui dépendra d’autres facteurs.
30
Pour plus de détails, voir Mertens (1993: 30-40, 1997: 34-35), Mertens et al. (2001).
31
Certains auteurs considèrent les auxiliaires de temps comme des clitiques, surtout les formes
monosyllabiques. S’il est vrai qu’ils portent rarement l’accent, leur accentuation est pourtant
possible pourvu que soient évités les accents contigus : « nous l’aurions éliminé ». Une classifi-
cation basée sur la catégorie grammaticale ne devrait pas réserver un statut accentuel particulier
aux monosyllabiques.
Notons cependant le comportement irrégulier de certains pronoms. Dans « dis-le », le schwa
32
est prononcé soit [], [] ou [], et accentué. En revanche, dans « puis-je », prononcé [],
c’est la syllabe « puis » qui reçoit l’accent. Dans d’autres inversions avec le pronom « je », on
prononce le schwa sans pourtant l’accentuer.
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 95
On trouve même quelques paires minimales selon que le pronom clitique soit
accentué ou non : « (arrêtez) (le voleur) » vs. « (arrêtez-le), (voleur) » (Delattre 1972).
L’exemple suivant illustre la situation d’un clitique éloigné de sa tête syntaxique par
un élément non clitique : « un » est séparé de « appartement » par « nouvel ». Notons
aussi la nature non clitique du pronom « nous » ici.
nous on y cherchait un nouvel appartement
AL o • • • o • • o • • • o
GA ( - ) (• • • - ) (• • - ) ( • • • - )
GI ( + ) (• • • + ) (• • + ) ( • • • + )
Un GI est donc constitué d’un ou plusieurs GA. La façon de regrouper les GA en GI,
dépend de plusieurs facteurs. 1. Le premier facteur, de nature phonétique, est la lon-
gueur du GI résultant. Il est difficile de prononcer une longue suite de syllabes atones ;
on sera spontanément amené à accentuer quelques syllabes accentuables. La longueur
moyenne observée par GI est de 3.8 syllabes (Delais 1995: 125). 2. Les accents contigus
sont évités (Mertens 1992). 3. Le nombre de GI dépend en outre du rapport syntaxique
entre les GA : le regroupement doit respecter l’emboîtement syntaxique (cf. §5.2.2). 4. Il
dépend également de la sémantique, des « unités de sens » (cf. §5.2.1, Mertens 1987:
111, 1993: 49-50). 5. Finalement, il faut mentionner d’autres facteurs comme le débit de
parole, le style (soigné ou non), ou le type de parole (texte lu, parole spontanée).
Les frontières associées aux tons finals entraînent le regroupement des GI et mettent
ainsi en place l’organisation prosodique de l’énoncé. Comment cette organisation se
comporte-t-elle par rapport à l’organisation syntaxique33 ? L’exemple suivant comporte
quatre GI ; selon les tons finals employés, on obtient soit une intonation bien formée
(grammaticale) (a), soit une intonation qui entre en conflit avec l’organisation
syntaxique (b).
le père de ces enfants les accompagne à la guitare
(a) /BB HH /BB B-B-
(b) * HH /BB HH B-B-
Dans (a), l’intonation entraîne le regroupement de « le père » avec « de ces enfants »,
de même que celui de « les accompagne » avec « à la guitare ». Dans les deux cas, il
existe une relation syntaxique entre les parties regroupées : en effet, « père » régit
« enfants » et « accompagne » régit « à la guitare ». L’intonation (a) respecte donc les
relations syntaxiques. En revanche, l’intonation (b) va à l’encontre de ces relations,
puisqu’elle regroupe « de ces enfants » avec « les accompagne ». Or, entre le verbe et le
33
cf. Rossi et al. (1981), Mertens (1993, 1997, 2009), Mertens et al. (2001). La question est
cruciale pour les logiciels de synthèse de la parole à partir du texte, qui permettent à l’ordinateur
de prononcer des énoncés avec une intonation appropriée, cf. Rossi (1993), Mertens (1999,
2002, 2004).
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 96
groupe nominal il n’existe aucun lien de dépendance direct ; « enfants » dépend d’abord
de « père », avant de dépendre de « accompagne ». La deuxième intonation est erronée.
Le principe peut être formulé ainsi : dans une structure syntaxique simple constituée
d’un élément recteur (en l’occurrence le verbe) et de ses dépendants directs et indirects
éventuels, le regroupement intonatif ne peut pas aller à l’encontre des relations de
dépendance ; on ne peut regrouper par l’intonation deux éléments, si l’un d’entre eux
dépend d’un troisième élément qui ne figurerait pas dans l’unité résultante.
Ce principe permet d’expliquer bon nombre de phénomènes, comme celui de la
désambiguïsation de phrases syntaxiquement ambiguës comme « la belle ferme le
voile » (où le verbe principal est tantôt « ferme », tantôt « voile »), ou « un professeur
de français canadien » (où l’adjectif « canadien » modifie tantôt le nom « professeur »,
tantôt le nom « français »).
Le réseau de dépendance inclut à la fois les actants et les circonstants (soit les
compléments essentiels et accessoires) éventuels. Dans « tous les soirs, ma femme
racontait une histoire aux enfants », « ma femme racontait » peut former un seul groupe
intonatif, puisque le verbe régit l’objet. Ce n’est pas le cas de la séquence « tous les
soirs, ma femme » parce qu’il n’y a aucun lien de dépendance entre « tous les soirs » et
« ma femme ».
34
cf. Mertens (1997), Eynde et al. (1998), Mertens et al. (2001), Mertens (2008, 2013).
35
Plus exactement, le noyau verbal principal introduit par « que » ou par un pronom relatif.
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 97
plus souvent le ton HB ou HB-, dont la fonction de mise en valeur s’accorde bien avec
le procédé syntaxique de clivage. Alternativement on trouve le ton B-B-.
c’est çaHB- b-qui ressort de son étudeb-
c’est précisément làHB- b-que des problèmes d’emploi surgissentb-
c’est luiB-B- b-qui l’a ditb-
36
Rialland et al. (2002) et Delais-Roussarie et al. (2002) observent d’autres intonations et
concluent que la clivée peut avoir plusieurs organisations informationnelles auxquelles
répondent des intonations différentes ; comparez : « Qui est tombé ? C’est le petitHB- b-qui est
tombéb- . » « Qu’est-ce qui se passe ? C’est le petitHH qui est tombéHH dans l’escalier B-B-. »
Cependant, le dernier exemple n’est pas une clivée mais une subordonnée relative.
37
Voir Blanche-Benveniste et al. (1984) et Eynde & Mertens (2003).
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 98
Questions et exercices
References bibliographiques
Alessandro, C. d’; Mertens, P. (1995) Automatic pitch contour stylization using a model of
tonal perception. Computer Speech and Language 9(3), 257-288.
Bolinger, D.L. (1951) Intonation: levels vs. configurations. Word 7, 199-210.
Coustenoble, H.N. & Armstrong, L.E. (1934) Studies in French intonation, Cambridge : Heffer.
Crystal, David (1987) The Cambridge Encyclopedia of Language. Cambridge: Cambridge
University Press.
Delais, E. (1995) Pour une approche parallèle de la structure prosodique. Etude de
l'organisation prosodique et rythmique de la phrase française. Thèse de doctorat,
Université de Toulouse - Le Mirail, pp. 303 + xxv
Delais-Roussarie, E.; Rialland, A.; Doetjes, J.; Marandin, J.-M. (2002) The Prosody of Post-
Focus Sequences in French. Proceedings of the Speech Prosody 2002 conference, 11-13
April 2002. Aix-en-Provence.
Delattre, Pierre (1961) La leçon d’intonation de Simone de Beauvoir. Etude d’intonation
déclarative comparée. French Review 35 (1), 59-67.
Delattre, Pierre (1966) Les dix intonations de base du français. French Review 40(1), 1-14.
Delattre, Pierre (1967) La nuance de sens par l’intonation. French Review 41(3), 326-339.
Delattre, P. (1972) The distinctive function of intonation. in Bolinger, D.L. (ed) (1972)
Intonation, selected readings. Harmondsworth: Penguin Books. 159-174.
-Dell, François (1984) L’accentuation dans les phrases en français. in Dell et al. (ed) (1984), 65-
122.
-Dell, F.; Hirst, D.J. & Vergnaud, J.R. (eds.) (1984) La forme sonore du langage. Structure des
représentations en phonologie. Paris: Hermann.
Earle, Michael A. (1975) An acoustic phonetic study of northern Vietnamese tones. Santa
Barbara, CA: Speech Communications Research Laboratory.
Eynde, Karel van den; Mertens, Piet (2003) La valence : l’approche pronominale et son
application au lexique verbal. Journal of French Language Studies 13, 63-104.
Eynde, K. van den; Mertens, P. & Swiggers, P. (1998) Structuration segmentale et
suprasegmentale en syntaxe: Vers un modèle intégrationniste de l’écrit et de l’oral. In:
Bilger, M.; van den Eynde, K. & Gadet, F. (1998) Analyse linguistique et approches de
l’oral. Recueil d’études offert en hommage à Claire Blanche-Benveniste. Collection
"Orbis/Supplementa 10", Leuven-Paris: Peeters. 33-57.
Garde, P. (1968) L’accent. Paris: P.U.F., 171 pp. Collection Le Linguiste, 5.
Goldsmith, J. (1978) English as a tone language. Communication and Cognition 11(3-4), 453-
76.
Hart, J. ’t (1976) Psychoacoustic backgrounds of pitch contour stylisation. IPO Annual Progress
Report 11, 11-19.
Hart, J. ’t; Collier, R. & Cohen, A. (1990) A perceptual study of intonation. Cambrigde :
Cambridge Univ. Press, 227 pp.
Honorof, D.N. & Whalen, D.H. (2005) Perception of pitch location within a speaker’s F0 range.
Journal of the Acoustical Society of America 117 (41), 2193-2200.
Isachenko, A.V. & Schädlich (1964) Untersuchungen über die deutsche Satzintonation. Studia
Grammatica VII.
Kahn, F. (1968) Introduction à l’étude de la mélodie de l’énoncé français chez un jeune Parisien
cultivé du 16ème arrondissement. Cahiers Ferdinand de Saussure 24, 15-44.
Kahn, F. (1969) Différenciations mélodiques dans l’énoncé français. Cahiers Ferdinand de
Saussure 26, 15-31.
Extrait de P. Mertens (2019) Phonétique, phonologie et prosodie du français – 101
Joseph P. & Hirschberg, Julia (eds) (1997) Progress in Speech Synthesis, 347-363. New
York: Springer Verlag.
Mertens, Piet; Goldman, Jean-Philippe, Wehrli, Éric; Gaudinat, Arnaud (2001) La synthèse de
l’intonation à partir de structures syntaxiques riches. Traitement Automatique des
Langues 42(1), 145-192.
Morel, Mary-Annick & Danon-Boileau, Laurent (1998) Grammaire de l’intonation, l’exemple
du français. Gap: Ophrys.
Pierrehumbert, J. (1980) The phonetics and phonology of English intonation. Ph.D. M.I.T.
Cambridge, MA.
Pike, K.L. (1945) The intonation of american English. Ann Arbor: Univ. of Michigan Press.
Rialland, A.; Doetjes, Jenny; Rebuschi, G. (2002) What is focused in c’est XP qui/que cleft
sentences in French ? Proceedings of the Speech Prosody 2002 conference, 11-13 April
2002. Aix-en-Provence.
Rose, Phil (1987) Considerations in the normalisation of the fundamental frequency of linguistic
tone. Speech Communication 6/4, 343-352.
Rossi, M. (1993) A model for predicting the prosody of spontaneous speech (PPSS model)
Speech Communication 13, 87-107
Rossi, Mario (1999) L’intonation, le système du français : description et modélisation. Gap -
Paris : Ophrys Coll. L’essentiel français.
Rossi, M.; Di Cristo, A.; Hirst, D.; Martin, Ph. & Nishinuma, Y. (1981) L’intonation. De
l’acoustique à la sémantique. Paris: Klincksieck, 364 pp.
Smalley, W.A. (1964) Manual of articulatory phonetics. New York: Practical Anthropology,
512 pp.
Trager, G.L. & Smith, H.L. (1951) An outline of English structure. Studies in Linguistics,
Occasional Papers, 3. Washington Norman, Oklahoma
Van Dooren, K. & Eynde, K. Van den (1982) A structure for the intonation of Dutch.
Linguistics 20, 203-235.
Zwanenburg, W. (1965) Recherches sur la prosodie de la phrase française. Leiden.