THESE
Présentée pour l’obtention du doctorat de Sciences du Langage
Spécialité : Phonétique Générale et Expérimentale
par
Fayssal BOUAROUROU
soutenue le 08 décembre 2014
JURY
Je remercie vivement les membres du jury, qui ont accepté d’évaluer mon travail.
Un grand merci aux rapporteurs, M. le Professeur Pascal Perrier et M. Shinji Maeda,
DR au CNRS, pour le temps qu’ils ont consacré à la lecture et l’évaluation de ce travail.
Un grand merci également à M. Yves Laprie, DR au CNRS, pour cette collaboration
fructueuse et ses conseils d’analyses des données cinéradiographiques avec le logiciel X-
articule. Merci pour les nombreuses heures qu’il a réservées à ma formation.
Merci à mes locuteurs : Khalifa, Hind, Sarah, Yassin et Karim. Ils n’ont pas compté les
heures d’enregistrement, malgré la difficulté de cette tâche.
Je remercie Aline et Saïd pour le travail technique. L’aide et le soutien de ces deux
personnes, chères à mes yeux, ont été particulièrement précieux.
Merci à Saïd, son amitié m’a aidé à traverser les moments difficiles tout au long de ces
années de recherche.
Un merci spécifique à Aline, qui a été présente en tout temps et a su me faire avancer.
Sa présence à mes côté a été essentielle pour l’aboutissement de ce travail de thèse.
Je remercie mes relecteurs : Marion Béchet, Fabrice Hirsch, Fabrice Marsac, Cécile
Merckel, Camille Fauth, Dominique Hamm, Nourdine Combo, Fatima Rami, et Elodie Lang.
Merci,
A tous mes collègues de l’Institut de Phonétique de Strasbourg : Said, Obama, Hasna,
Xuelu, Saoussan, Lucie, Marion, Cyril, Thomas, Camille, Ming, Nadjia, Fatima, Insaf,
Dominique, Tomoki, Célistine, Soucila, Amel, Naïma, Mélanie et Nabu.
A mes amis de pasta : Mohamed, Rachid, Boussif, Baghdad et Mounir. Et les autres...
4
Table des matières
1 Le berbère : présentation générale ................................................................................... 12
1.1 Le berbère au Maroc .................................................................................................. 12
1.1.1 Les différentes variétés du berbère..................................................................... 13
1.1.2 Spécificités phonologiques du berbère ............................................................... 14
1.2 Tarifit : le système phonologique .............................................................................. 16
1.2.1 Les labiales ......................................................................................................... 16
1.2.2 Les dentales ........................................................................................................ 17
1.2.3 Les alvéolaires .................................................................................................... 18
1.2.4 Les palato-alvéolaires ......................................................................................... 18
1.2.5 Les nasales.......................................................................................................... 18
1.2.6 Les liquides ........................................................................................................ 18
1.2.7 Les affriquées ..................................................................................................... 19
1.2.8 Les vélaires ......................................................................................................... 19
1.2.9 Les uvulaires ...................................................................................................... 20
1.2.10 Les pharyngales .................................................................................................. 20
1.2.11 La laryngale ........................................................................................................ 21
1.2.12 Les semi-consonnes............................................................................................ 21
1.2.13 Les emphatiques ................................................................................................. 21
1.2.14 Les labialisées .................................................................................................... 22
1.2.15 Le système vocalique du tarifit : ........................................................................ 22
1.2.16 L’influence de l’emphase sur la qualité des voyelles adjacentes : ..................... 23
1.2.17 L’amuïssement de la liquide .......................................................................... 24
1.2.18 La gémination : quelques remarques préliminaires............................................ 26
1.2.19 Les fonctions lexicales, morphologiques et phonologiques de la gémination ... 27
2 Gémination : représentation, comportement et implémentation phonétique ................... 30
2.1 Quelle représentation pour les géminées ? ................................................................ 30
2.1.1 S’agit-il d’un seul segment ou d’une suite de deux segments ? ......................... 30
2.1.2 Longueur ou tension ? ........................................................................................ 32
2.1.3 Représentation X-slot ou représentation moraïque ............................................ 35
2.1.4 La question des géminées initiales et finales ..................................................... 38
2.2 comportements pour les géminées ? .......................................................................... 40
2.2.1 L’ambivalence .................................................................................................... 42
2.2.2 Intégrité : ............................................................................................................ 46
2.2.3 L’inaltérabilité des géminées ............................................................................. 48
3 Dimension typologique de la gémination......................................................................... 58
3.1 Analyses perceptives et acoustiques .......................................................................... 58
3.2 Analyses articulatoires ............................................................................................... 64
3.3 Les consonnes géminées en vitesses d’élocution normale et rapide ......................... 73
4 Les grands courants théoriques en phonétique ................................................................. 78
4.1 La Théorie Motrice de la Perception ......................................................................... 78
4.2 La Théorie Quantique de Stevens (1985 ; 1989 ; 1991 ; 2002 ; 2005)................... 79
4.3 La Théorie de la Variabilité Adaptative de Lindblom (1987 ; 1990) ........................ 83
4.4 Le modèle de la dynamique des tâches -The Task Dynamics Model (Saltzman et al.,
1987) ................................................................................................................................... 87
5 Théories et modèles qui intègrent la variabilité dans leur conception ............................. 92
5.1 Le Modèle statistique (Maeda, 1990) ........................................................................ 92
5.2 Le Modèle de Laprie : construction et évaluation d’un modèle articulatoire du
conduit vocal ........................................................................................................................ 94
5.3 Le modèle biomécanique de production de la parole selon l'hypothèse du Point
d’Équilibre ............................................................................................................................ 95
5.4 Phonologie articulatoire ............................................................................................. 99
5.4.1 Geste articulatoire : propriétés ......................................................................... 100
5.4.2 Geste articulatoire et notion d’oppositions phonologiques .............................. 102
5.4.3 La Théorie de la Viabilité en production-perception de la parole.................... 103
5.4.4 Notions et concepts .......................................................................................... 104
5.5 Notions et outils pour l’analyse de la gémination ................................................... 107
5.5.1 Généralités sur la vitesse d’élocution ............................................................... 107
5.5.2 La vitesse d’élocution : un perturbateur naturel par excellence ....................... 108
5.5.3 VOT : « Voice Onset Time » ........................................................................... 110
5.5.4 VTT : « Voice Termination Time » ................................................................. 112
6 Etude acoustique ............................................................................................................ 116
6.1 Corpus ...................................................................................................................... 116
6.2 Les sujets ................................................................................................................. 118
6.3 Enregistrements ....................................................................................................... 118
6.4 Mesures et analyses acoustiques.............................................................................. 118
6.5 L’analyse statistique. ............................................................................................... 121
7 La radiocinématographie, acquisition et traitements des radiofilms .............................. 123
7.1 Description de l'appareillage et d'une séance d'enregistrement ............................... 124
7.2 Extraction des contours, tracés radiologiques, méthodes manuelles, semi-
automatiques et automatiques ............................................................................................ 128
8 Etude des paramètres temporels : durées absolues......................................................... 140
8.1 Les occlusives sourdes............................................................................................. 146
8.1.1 Les occlusives sourdes en position intervocalique ........................................... 146
8.1.2 Les occlusives sourdes en position initiale ...................................................... 151
8.1.3 Les occlusives sourdes en position finale ........................................................ 154
8.2 Les occlusives sonores............................................................................................. 158
8.2.1 Les occlusives sonores en position intervocalique ........................................... 158
8.2.2 Les occlusives sonores en position initiale ...................................................... 162
8.2.3 Les occlusives sonores en position finale ........................................................ 165
8.3 Les constrictives sourdes ......................................................................................... 168
8.3.1 Les constrictives sourdes en position intervocalique ....................................... 168
8.3.1 Les constrictives sourdes en position initiale ................................................... 170
8.3.2 Les constrictives sourdes en position finale ..................................................... 171
8.4 Les constrictives sonores ......................................................................................... 173
8.4.1 Les constrictives sonores en position intervocalique ....................................... 173
8.4.2 Les constrictives sonores en position initiale ................................................... 175
8.4.3 Les constrictives sonores en position finale ..................................................... 176
9 Le contrôle spatiotemporel de la gémination ................................................................. 180
10 Gestes du larynx et de l’os hyoïde ................................................................................. 224
11 L’étendue de contact : un paramètre pertinent pour l’étude de la gémination ? ............ 239
12 Paramètres articulatoires et/ou articulatori-acoustiques ................................................. 251
13 Synthèse Générale et discussion .................................................................................... 257
6
14 Conclusions et perspectives… ....................................................................................... 265
15 Bibliographie .................................................................................................................. 271
16 Index des figures ............................................................................................................ 299
17 Index des tableaux .......................................................................................................... 311
18 Annexe 1 ........................................................................................................................ 315
19 Annexe 2 ........................................................................................................................ 355
20 Annexe 3 ........................................................................................................................ 368
21 Annexe 4 ........................................................................................................................ 419
Introduction
L’objectif de notre travail est d’étudier le phénomène phonologique de la gémination en
berbère du tarifit parlé au Maroc, dans la province de Nador.
Quelques hypothèses seront formulées, aussi bien dans le domaine acoustique que dans
le domaine articulatoire. De manière générale, nous pensons que l’analyse du substrat
physique, articulatoire et acoustique, devrait nous permettre de mettre au jour des indices
articulatoires et acoustiques qui sont sous-jacents au trait phonologique. La gémination étant
principalement un phénomène temporel, ces indices devraient être plus remarquables au
niveau du contrôle temporel des gestes articulatoires et de leurs conséquences acoustiques.
Une première originalité du travail réside dans le fait qu’il combine données
acoustiques et données articulatoires cinéradiographiques. En effet, des investigations dans le
domaine de la production de la parole, reposant sur l’analyse de données cinéradiographiques,
sont relativement rares. Or, les données cinéradiographiques sont d'une grande utilité. Ce sont
les seules à offrir actuellement, en même temps, une résolution spatio-temporelle correcte sur
l'ensemble du conduit vocal dans le plan sagittal. Elles sont à la base de l'élaboration de
modèles géométriques (Maeda, 1988 ; Berger,1996), et sont d'une grande utilité pour l'étude
de la coordination spatio-temporelle des articulateurs de la parole (Wood, 1991 ; Vaxelaire,
1999), ainsi que pour l’étude de l’inversion (Laprie et al., 2003). L'exploitation de données
cinéradiographiques peuvent aussi servir à valider des modèles biomécaniques (Perrier et al.,
2011).
Une seconde originalité de ce travail tient au fait que la gémination est étudiée dans le
cadre du paradigme de la variation de la vitesse d’élocution. La variation de la vitesse
d’élocution est retenue comme moyen naturel de perturbation du système de production de la
parole. Elle devrait nous permettre de repérer ces patrons spatio-temporels résistants et
phonologiquement pertinents des gestes des articulateurs, lors de la réalisation de la
gémination. Elle devrait aussi offrir la possibilité d’évaluer le degré de flexibilité du système
8
de production de la parole, en dévoilant les réaménagements ou les réajustements possibles
aux niveaux intra-articulateur et inter-articulateur. Cela reviendra à analyser les différentes
stratégies cognitivo-motrices utilisées par nos sujets pour maintenir la distinctivité des
catégories phonologiques de la gémination, dans cette condition « difficile » de la vitesse
d’élocution rapide, en mettant en jeu de potentiels phénomènes de compensation (Sock &
Vaxelaire, 2004 ; Vaxelaire, 2006).
Nos résultats seront discutés brièvement dans le cadre de ces approches théoriques,
même si nous préférerons rationaliser nos données en termes de relations articulatori-
acoustiques. C’est dans cette perspective articulatori-acoustique que nous ferons quelques
propositions pour le traitement du phénomène phonologique de la gémination en tarifit.
Organisation de la thèse
Notre étude s’articule en trois parties. Dans la première partie, nous présentons l’état de
la question sous forme de cinq chapitres. Dans le premier chapitre, nous abordons le système
phonologique du tarifit (berbère). Le chapitre deux traite de la gémination et ses
considérations phonologiques, à savoir les différentes représentations et comportements des
géminées. Le troisième chapitre porte sur la dimension typologique de la gémination et
comporte des analyses perceptives, acoustiques et articulatoires. Le quatrième présente les
théories phonétiques majeures de la perception et la production de la parole. Dans le chapitre
cinq, nous exposons les théories et modèles intégrant la variabilité de la parole dans leur
conception : 1) le modèle statistique (Maeda, 1990) ; 2) le modèle de Laprie & Busset (2011),
3) le modèle biomécanique de production de la parole selon l’hypothèse du point d’Équilibre
(Perrier et al., 1996) ; 4) le modèle de la phonologie articulatoire de Browman & Goldstein
(1986). Nous introduisons également dans ce chapitre quelques notions et outils nécessaires à
l’analyse de la gémination.
Nous proposons, tout au long de la thèse, des résumés et des bilans partiels afin de
faciliter la lecture et la compréhension du travail.
10
PARTIE 1
État de la question
1 Le berbère : présentation générale
La langue berbère ou tamazight est, à l'heure actuelle, présente dans une dizaine de pays
du Maghreb-Sahara-Sahel : Maroc, Algérie, Tunisie, Libye, Égypte, Niger, Mali, Burkina-
Faso et Mauritanie. Mais l'Algérie et le Maroc sont de loin les deux pays qui comptent les
populations berbérophones les plus importantes. Signe fort de l'identité berbère face à
l'arabisation, la langue berbère est riche d'une tradition orale qui a su intégrer les médias
modernes. De plus, la renaissance volontariste de l'alphabet traditionnel, les tifinaghs, a
permis de suppléer à la mémoire collective, de traduire les œuvres majeures du patrimoine
mondial et de développer une littérature berbère qui répond à une forte demande.
Selon Chaker (1992), l'évaluation du nombre de berbérophones est une question
difficile et controversée, car il n'existe pas de recensements linguistiques systématiques et
fiables dans les pays concernés. De plus, la situation générale (objective, institutionnelle et
idéologique de la langue berbère) rend problématique toute évaluation. En fait, le nombre de
berbérophones constitue en lui-même un enjeu politique important dans les pays du Maghreb.
Il a donc toujours fait l'objet de vives polémiques et d'estimations très divergentes. Pourtant,
si l'on soumet à la critique l'ensemble des chiffres avancés par les diverses sources, des débuts
de la présence coloniale française jusqu'à nos jours, on peut raisonnablement estimer les
berbérophones à :
- un pourcentage d'environ 40 % de la population au Maroc, soit 12 à 13 millions de
berbérophones sur une population globale de 32 millions ;
- un pourcentage d'environ 25 % de la population en Algérie, soit entre 7 et 8 millions de
locuteurs sur un total de 31 ou 32 millions d'habitants.
Le Rif est une région de 2 500 000 habitants. Les plus grandes villes rifaines sont
Nador, Alhoceima, Berkane, Driouch et Melilla. Dans ce travail, nous nous focalisons sur le
tarifit parlé dans la province de Nador, et plus précisément sur le parler des Iqerâayen (la ville
de Nador et ses alentours).
12
La province de Nador est d'une superficie de 3 263 km2 et de 788 221 habitants (selon
l’office de tourisme de Nador en 2010). Cette province est située au nord-est du Maroc, dans
la région montagneuse du Rif. Elle est limitée :
au nord, par la mer Méditerranée ;
à l'est, par la province de Berkane ;
au sud, par les provinces de Taourirt et de Guercif (région de Taza-Al Hoceïma-
Taounate) ;
à l'ouest, par la province de Driouch.
Selon Cadi (1987, p. 9), « l’unité spatiale de territoire des Iqerâayyen est une
conséquence historique due au phénomène de l’alliance entre cinq tribus : At-sidar, At-
chichar, At-bouyehyi, At-bouyafar, et Imezzoujen. Ces cinq tribus ont donné la confédération
Iqerâayyen. Ce territoire fait partie de ce qu’il est convenu d’appeler le Rif oriental et
constitue une zone frontière entre le Haut-Rif central et le Maroc oriental. C’est un espace
essentiellement montagneux délimité au nord par la méditerranée, au sud par At-bouyehyi, à
l’est par Ichebdanen et Oulad-Settout, à l’ouest par At-sâid et une partie des Ibdarsen. »
Toujours selon Cadi (1987), le parler des Iqerâayyen est l’un des parlers qui constituent
le dialecte rifain (au sens large), dont les isoglosses sont encore mal définies. Ce problème a
été abordé depuis longtemps dans les travaux de Laoust (1927, p. 137) : « Ce que l’on connaît
mal c’est son aire d’extension, plus difficile encore à délimiter que les frontières linguistiques
de tout autre groupe marocain ».
1
Chamito-sémitique ou afro-asiatique, selon la terminologie américaine initiée par Greenberg (1963).
13
degré de parenté plus éloigné, le groupe « tchadique ». Le berbère peut être considéré comme
la langue « autochtone » de l’Afrique du Nord, et il n’existe actuellement pas de trace positive
d’une origine extérieure ou de la présence d’un substrat pré-berbère dans cette région. Aussi
loin que l’on puisse remonter, le berbère est déjà installé dans son territoire actuel. La
toponymie, notamment, n’a pas permis jusqu’ici d’identifier un quelconque sédiment pré-
berbère.
Une discussion sur la nature des géminées, plutôt longues ou plutôt tendues, segments
uniques ou suites de deux segments, anime le monde linguistique berbère. Il s’agit d’un
problème théorique fondamental auquel le berbère apporte un éclairage supplémentaire,
puisque la gémination est un problème central de sa phonologie. Nous reviendrons sur cette
question dans le chapitre 0.
Le mode articulatoire oppose les constrictives aux occlusives, c'est sans doute sur ce
point que le berbère présente les évolutions et les divergences les plus importantes. Tous les
dialectes de la bande méditerranéenne du Maghreb (Aurès, Kabylie, Algérie centrale et
occidentale, Rif, la majeure partie du Maroc central, etc.) connaissent, à des degrés divers,
une forte tendance à la spirantisation des occlusives : /b, t, d, , k, g/ deviennent
respectivement [, , , , , ]. Dans de nombreux dialectes (Aurès, Algérie centrale, Maroc
central, Mzab, Rif), le phénomène va encore plus loin : la fricative [] peut aboutir à la
fricative laryngale [h] ou disparaître totalement (Aurès). Dans ce cas, en tarifit, [] et [] sont
des variantes libres de /t/ et les fricatives palatales [] et [] finissent souvent en fricatives
post-alvéolaires [] et [], ou en semi-consonne palatale []. Les mêmes lexèmes peuvent donc
se rencontrer sous trois ou quatre formes différentes :
15
Au Maroc, on distingue trois grandes variétés du berbère parlées par environ 40% de la
population. Les variétés en question sont :
le tarifit, parlé dans le Nord et Nord-Est du Maroc ;
le tamazight, parlé dans la zone Centre et Sud-Est du Maroc ;
le tachelhit, parlé dans la zone Sud et Sud-Ouest du Maroc.
Le berbère se distingue par ses spécificités phonologiques, notamment par la gémination, la
pharyngalisation, la labialisation et la spirantisation des occlusives.
Ce travail se focalise sur le parler du tarifit de la province de Nador afin d’étudier la
gémination dans cette variante.
La labiodentale sonore /v/ n’existe pas en tarifit. Elle est remplacée par [β] quand il s’agit
d’un /v/ dans un mot emprunté.
16
Il est à noter que la bilabiale occlusive simple /b/ n’existe pas en tarifit. Elle est toujours
constrictive /β/ quand il s’agit d’une simple, et occlusive quand il s’agit d’une géminée /bb/.
C’est le cas lors du passage de l’aoriste à l’inaccompli.
aoriste inaccompli
Remarque : les consonnes /t/ et /d/ en tarifit restent des occlusives dentales devant les
nasales coronales comme dans les mots /ndh/ « conduire », /ndu/ « battre le lait », /nti/
« enfouir dans la terre ». Mais elles sont spirantisées, i.e. réalisées // et // dans d’autres
contextes. Ces spirantes2 //et // deviennent occlusives quand il s’agit des géminées /tt/ et
/dd/ :
aoriste inaccompli
Les occlusives dentales pharyngalisées du tarifit sont les coronales /t/et /d/ : la
consonne /d/ se réalise comme une spirante interdentale //, sauf devant les nasales
coronales.
2
Pour plus de détail voir la partie sur la spirantisation (section 2.2.3)
17
Notons que le /dd/ n’existe pas en tarifit, et que la contrepartie géminée de /d/ correspond à
/tt/.
aoriste inaccompli
aoriste inaccompli
18
(36) llamun « citron »
(37) arifi « rifain »
(38) arraw « descendants »
En tarifit, à l’exception des parlers des tribus de l’est et du sud-est, la consonne latérale
simple /l/ se réalise comme une non-latérale /r/ dans toutes les positions, lorsqu’il s’agit du /l/
emprunté à l’arabe. Selon Cadi (1987, p. 24), « le changement phonétique de /l/ arabe en [r]
rifain est opératoire pour la quasi-totalité des termes empruntés ».
En ce qui concerne la géminée /ll/, elle se transforme en affriquée sonore géminée /d/
(à l’exception des parlers des tribus de l’est et du sud-est).
Les affriquées /t/ et /d/ sont des variantes libres en tarifit de// et // respectivement :
19
En tarifit, la production de la consonne vélaire nasale géminée est labialisée //. C’est
probablement le résultat de la labio-vélarisation de la consonne /n/, comme dans le verbe //
« cuire » en kabyle /bb/ « cuire ». [] est issue d’une assimilation de la consonne /n/
lorsqu’il s’agit de la préposition « de » devant les voyelles /i/, /u/ et la semi-consonne /w/, elle
a tendance à se labialiser [] devant la voyelle /a/, comme dans les exemples suivants :
Commentaire : la géminée // est très rare en tarifit. Elle existe dans les mots comme :
L’emphatique /s/ et les emphatisées /l/ et /r/ sont attestées surtout dans les formes
empruntées à l’arabe :
21
1.2.14 Les labialisées
Les labialisées attestées dans le tarifit sont les labio-vélaires /gg/ et /kk/ et les labio-
uvulaire qq :
22
1.2.16 L’influence de l’emphase sur la qualité des voyelles adjacentes :
Les corrélats acoustiques de l’emphase, comme indiqué dans la littérature, consistent en
une élévation de F1 et un abaissement de F2, et cet effet, uniforme sur les voyelles fermées,
semble prendre la même direction pour les voyelles ouvertes.
La Figure 1 ci-dessous illustre les différentes réalisations des voyelles /i, a, u /du tarifit,
dans le contexte emphatique/neutre.
Figure 1 : Ellipses de dispersion sur F1/F2 pour les voyelles du tarifit en contexte neutre (en majuscules) et
emphatique (en minuscules) ; (adapté de Louali & Puech, 1998)
La Figure 1 montre la formation de couples dans l’espace vocalique suivant que les
voyelles sont en contexte neutre ou emphatique :
Le dédoublement s’opère sur l’axe F2 : les voyelles [], [] et [] (contextes neutres)
présentent un F2 plus élevé que les voyelles [], [] et [] (contextes emphatiques). La
séparation entre les deux catégories est particulièrement nette pour la voyelle ouverte.
L’incidence sur F1 contribue certainement à la discrimination des allophones, mais cette
contribution est liée à la partition opérée sur F2.
23
1.2.17 L’amuïssement de la liquide
tarifit tamazight
Louali & Puech (1998) expliquent ce phénomène dans un travail sur les voyelles du
tarifit de Temsamane. Ils ont montré qu’en position coda, un rhotacise le noyau vocalique,
l’allonge ou altère son timbre et sa structure (monophtongue ou diphtongue). Cette répartition
peut être envisagée comme gardant la trace de différentes étapes d’une évolution
diachronique, aboutissant à l’amuïssement du dans cette position. La réalisation de la
diphtongue [] correspondant à //, et celle de son homologue [] correspondant à //
pointent vers une même voyelle ouverte. Quant à la réalisation de //, elle se transforme en
24
[]. Cadi (1987) confirme ce phénomène en tenant compte d’un autre paramètre, à savoir la
durée de la voyelle. En effet, il s’est rendu compte que // en position coda précédé de /a/
devient [], avec une durée plus importante que la voyelle de base. Alors que le timbre des
voyelles fermées n’est pas affecté lorsque le /r/ est maintenu, la voyelle ouverte se réalise
également [] quand elle est suivie d’un /r/ maintenu à l’intervocalique, comme dans [ri]
« écris ». La réalisation de la diphtongue [] correspondant à // et celle de son homologue
[] correspondant à // pointent vers une même voyelle ouverte, comme le montre la figure
ci-après.
Figure 2 : Trajectoire de diphtongues [] (ir) et [] (ur) d’un locuteur du tarifit de Temsamane (adapté de
Louali & Puech, 1998)
Chtatou (1994, p. 177) est, à notre connaissance, le premier à avoir approfondi la notion
de durée. Son interprétation des faits du tarifit se caractérise par un système phonologique
comportant deux sous-ensembles : le triangle vocalique élémentaire et un second marqué par
la durée vocalique. Le deuxième triangle est dérivé du premier par le biais d’un phénomène
universellement connu, l’allongement compensatoire « compensatory lengthening », qui se
manifeste par exemple dans les parlers anglais du sud de l’Angleterre. Ce phénomène de
compensation se produit dans l’environnement d’une séquence consonantique, composée
d’une voyelle élémentaire et suivie de la liquide /r/ (Vr) ; il est dû au contexte vocalique. La
liquide en question s’efface, et sa disparition est compensée par l’augmentation de la durée
vocalique de la voyelle qui la précède, ce qui aboutit à une nouvelle gamme vocalique.
Pour Chtatou (1994), les voyelles compensées ne sont pas seulement sujettes à
l’augmentation de leurs durées, elles changent aussi d’identité sur l’échelle vocalique (il s’agit
25
ici de la notion de « raising-lowering », souvent retenue par les phonologues anglo-saxons).
L’analyse phonologique, menée sur le tarifit de Temsamane par Louali & Puech (1998), met
en évidence que le système vocalique du tarifit ne s’organise pas autour d’une opposition de
quantité. Il existe une différence de durée entre les voyelles /, , , u/ et les diphtongues /,
/.
Chtatou (1994) n’a pas pris en considération un autre contexte important, en
l’occurrence la position coda, car le /r/ subit le phénomène de l’allongement compensatoire
dans ladite position, mais se maintient dans le reste des positions.
Une discussion sur la nature des géminées, plutôt longues ou plutôt tendues, segments
uniques ou suites de deux segments, anime le monde linguistique berbère. Il s’agit d’un
problème théorique fondamental pour lequel le berbère apporte un éclairage supplémentaire,
puisque la gémination est un problème central de sa phonologie.
Ce qui nous intéresse le plus ici à propos des géminées sont les « irrégularités » qu’elles
présentent au sein du domaine linguistique berbère. En effet, certaines consonnes ont des
correspondantes géminées qui impliquent d’autres traits que la longueur, et certaines de ces
« irrégularités » se retrouvent dans une très large majorité du domaine berbère :
- un trait occlusif peut ainsi être ajouté à la gémination. Aussi, trouve-t-on dans presque
toutes les langues et variétés de berbères une correspondance entre la fricative uvulaire
sonore simple, notée //, et la géminée occlusive uvulaire sourde /qq/.
26
- un dévoisement peut aussi avoir lieu dans la correspondance entre // et /qq/. En outre,
la correspondante géminée du phonème pharyngalisé // est généralement // dans
les langues berbères.
aoriste inaccompli
Ces variations sont des irrégularités « normales » du domaine linguistique berbère, mais
certaines langues font figure d’exception, et on peut alors trouver des alternances
« régulières », qui sont les plus notables, certainement issues d’évolutions différentes et plus
tardives. Notons à ce propos le cas du zenaga, qui nous intéresse particulièrement ici pour
illustrer ce phénomène.
La gémination « irrégulière » que l’on retrouve dans tout le domaine berbère, faisant
correspondre la consonne simple voisée /d/ à la géminée non voisée //, est « régulière » en
zenaga, et // est alors géminée en //.
Étant donné que seul le zenaga présente cette particularité et que les langues ne rejettent
pas les emprunts contenant des consonnes géminées voisées [], on peut faire l’hypothèse
qu’il s’agit plutôt d’une innovation du zenaga.
Malgré ces quelques entorses au système de base, celui-ci est toutefois très bien attesté
dans le domaine berbère, et les correspondances « irrégulières » // => /qq/, /w/ => /gg/ et
// => //, ainsi que // => /tt/, peuvent être considérées comme des correspondances
« normales » entre consonnes simples et consonnes géminées dans les langues berbères.
27
(98) maa «prep. mais » maa « nourriture »
(99) asam « jalousie » assam « éclaire »
(100) azar « figue » azzar « fourche »
(101) amatar « masacre » amattar « demandeur »
(102)
a. aoriste inaccompli
b. singulier pluriel
Les géminées phonologiques dérivent d’une assimilation entre deux segments adjacents.
Dans (103-105) ci-dessous, nous présentons quelques exemples où les suffixes du féminin (ou
de la forme diminutive) ou les préfixes, comme les particules du futur ad, sont attachés à des
mots se terminant par des consonnes partageant le même lieu d’articulation :
28
Cette partie présente un aperçu général du système phonologique du tarifit, c’est-à-dire
l’inventaire consonantique et vocalique englobant toutes les consonnes et les voyelles des
parlers du tarifit, en comparaison avec quelques autres variantes du berbère. L’inventaire est
accompagné d’exemples et d’explications plus détaillées pour les simples et les géminées.
Nous avons aussi traité d’autres phénomènes, tels que la spirantisation des occlusives, que
nous développerons plus tard. Enfin, nous avons présenté les fonctions (a) lexicale, (b)
morphologique, avec les changements qui surviennent dans le cas de l’aoriste et de
l’inaccompli, du singulier et du pluriel, et (c) phonologique, avec le phénomène de
l’assimilation.
29
2 Gémination : représentation, comportement et implémentation
phonétique
Pour l’approche générative de Chomsky & Halle (1968), il existe deux manières de
décrire les géminées : comme un seul segment spécifié par le trait [+long] ou comme une
séquence de deux segments simples spécifiés par des traits identiques. Ce modèle linéaire
permet donc les deux représentations (1a) et (1b) ci-dessous :
X X
30 b b
De ce point de vue, une géminée est un groupe de deux consonnes identiques. La
première occupe une syllabe coda et la seconde est reformulée comme le début d'une syllabe
suivante. D'autre part, les consonnes longues sont considérées comme un seul segment
occupant les deux phases comme dans la représentation (2.b).
X X
McCarthy (1979) et Leben (1980) adoptent une approche autosegmentale des géminées.
Ils considèrent la géminée comme une seule consonne mappée sur deux niveaux
squelettiques, comme cela sera discuté dans la section (2.1.3) Ces auteurs voient ainsi une
géminée comme un segment unique quand Delattre (1971) affirme qu'une géminée devrait
être représentée comme deux segments identiques.
Autrement dit, les géminées sont des sons produits en deux phases avec deux
emplacements au niveau de la tire squelettale. Des linguistes se sont mis d'accord sur le fait
que, dans les deux représentations 2.a et 2.b ci-dessus, les géminées sont des consonnes
longues qui s’opposent aux simples (Ball & Rahilly 1999, Ladefoged & Maddieson 1996).
Toutefois, le terme « long » pourrait être illusoire. Il s’appuie sur l'opinion générale qui
postule que « la plupart des langues, avec une distinction de la longueur de consonnes, n’ont
que deux longueurs distinctives » (Ladefoged & Maddieson, 1996, p. 93). Cette distinction est
plus apparente en position intervocalique.
31
2.1.2 Longueur ou tension ?
Tension3 et durée :
Pour Jakobson et al. (1952), il est possible d’employer les deux traits [tense] et [voice]
pour une langue particulière. C’est le cas des langues qui utilisent l’aspiration et le voisement,
permettant trois voire quatre sortes de distinctions (Jakobson & Waugh, 1987). Par exemple,
le thai distingue phonologiquement les occlusives sonores non aspirées des sourdes non
aspirées et des sourdes aspirées. Le hindi également fait la distinction phonologique entre les
occlusives sonores non aspirées, les sourdes non aspirées, les sonores aspirées et les sourdes
aspirées. Kim (1965) considère, au contraire, que la tension est indépendante de la sonorité et
de l’aspiration : « […] by claiming the autonomy of the tense / lax category, I will not insist
upon discarding the voicing category. I will only claim that it is necessary to recognize both
categories, tensity and voicing, for the precise description of stops and that they are across-
cutting categories, just as gender and number are cross-cutting of noun » (Kim, 1965, p.
357).
3
Voir (Bothorel-Witz & Pétursson, 1972) et (Jessen, 1998) pour une revue de la littérature très détaillée sur cet
aspect.
32
am inclined to keep voicing, aspiration and tenseness as three separate features ». Ainsi, il
est justifié, d’après Fischer-Jørgensen, de pendre partie pour :
- la séparation des traits de tension et d’aspiration (1968, p. 88), car les occlusives dites
tendues et les occlusives aspirées ne sont pas caractérisées par les mêmes indices :
« […] the articulatory mechanism for subglottal and supraglottal tension is different
and independent and the two types must be kept apart » (Fischer-Jørgensen, 1968, p.
88), la séparation des traits de sonorité et d’aspiration, car la combinaison des deux
traits en un seul ne permettrait aucunement de définir les aspirées sonores des langues
indiennes (1968, p. 93) ;
- la séparation des traits de sonorité et de tension, car dans certaines langues telles que
le coréen, les occlusives ne peuvent être décrites au seul moyen de la sonorité et de
l’aspiration. En français, par exemple, sous l’effet de l’assimilation de sonorité, [p, t,
k] deviennent sonores tout en restant tendues (1968, p. 106).
Ladefoged (1968) utilise les termes de tense/lax et Lisker & Abramson (1964) utilisent
ceux de fortis/lenis dans un but purement pratique et sans leur attribuer de contenu précis.
Cette opposition ne repose, selon eux, sur aucune base physiologique. Notons ainsi que
Ladefoged n’applique ce trait qu’aux voyelles.
Le trait [tendu] fonctionne rarement seul dans une langue donnée. C’est-à-dire que
plusieurs autres traits – sonorité, aspiration, durée – lui sont souvent associés. Chomsky &
Halle (1968, p. 324) décrivent ces trois différences phonétiques au moyen de quatre traits :
Selon Chomsky & Halle (1968, p. 326), l’aspiration est autonome car elle est soumise à
un mécanisme diffèrent de celui qui commande la tension. « The tenseness of the supraglottal
muscles is evidently controlled by a different mechanism than its tenseness in the supraglottal
cavities ». Les auteurs définissent l’aspiration au moyen de deux variables :
33
Ce constat a été critiqué par plusieurs études. Ladefoged (1967), notamment, déplore
que Chomsky & Halle (1968) ne citent aucun travail de recherche établissant le lien entre
l’aspiration et la pression sous-glottique. (Fant, 1969, p. 11), à son tour, fait remarquer que la
position de Chomsky et Halle sur la nécessité du trait « heightened subglottal pressure » pour
l’aspiration n’est pas défendable. Fant (1969) propose plutôt le trait « glottal relaxation » qui
recouvrirait l’aspiration en général.
En ce qui concerne la durée, Jessen (1998) affirme que Jakobson et al. (1952)
considèrent la durée comme le corrélat primaire de la tension « in consonants tenseness is
manifested primarily by the length for their sounding period, and in stops, in addition, by the
greater strength of the explosion » (Jakobson et al., 1952, p. 36). Il souligne que Jakobson &
Halle (1961) voient la durée non seulement comme un corrélat primaire mais probablement
comme le seul corrélat du trait [tendu]. « The relative duration of the consonant and the
antecedent phoneme may remain for certain contextual or optional variants of tense and lax
consonants the chief or even the only cue to their distinction. » (p. 60).
Le trait de tension a été contesté par plusieurs chercheurs à cause de la complexité des
propriétés acoustiques, articulatoires et physiologiques qui lui sont attribuées. Ces
divergences se reflètent dans la terminologie même : [tendu], [fortis], [force d’articulation],
[lenis], [lâches] et [long]. À notre connaissance, aucun phénomène phonétique censé être le
même n’a été caractérisé par autant de termes différents. Comme nous l’avons souligné supra,
plusieurs facteurs peuvent expliquer les divergences qui entourent l’emploi de ce trait. Cette
divergence est tout d’abord liée à la nature même des segments analysés. Elle caractérise aussi
bien les oppositions de type /t/ vs. /d/, traditionnellement définies comme une opposition de
voisement, que les contrastes de type /t/ vs. /tt/, qui se distinguent en termes de durée. Un
autre problème méthodologique est associé aux mesures de la tension musculaire comme un
des corrélats du trait [tendu]. Braun (1988), cité par Jessen (1998), a montré que les mesures
électromyographiques n’avaient pas encore permis de dégager un corrélat convaincant et
consistant de ce trait. « As a first problem, electromyography (EMG) is among the methods in
instrumental phonetics that is very difficult to apply. Secondly, it is not clear which of the
muscles involved in speech production provides the most likely correlate of the feature
[tense]. EMG measurements of supralaryngeal muscles have so far not revealed a convincing
correlate of [tense]. » (p. 119).
34
Longueur ou tension : le cas du berbère
D’autres études, telles que Saïb (1977) et Guerssel (1977), s’inspirant du modèle
génératif, posent le problème en d’autres termes et s’intéressent davantage à la question de la
représentation de ces consonnes comme un ou deux segments. À partir de données
acoustiques du kabyle, Chaker (1975) conclut que la durée est le corrélat acoustique principal,
mais n’exclut pas le caractère tendu de ces consonnes.
35
syllabique de la gémination. La phonologie linéaire issue de SPE (Sound Pattern of English)
repose sur des séquences de matrices de traits. En revanche, la phonologie autosegmentale
suppose que les représentations phonologiques ne soient pas formées uniquement de
séquences de matrices de traits et que certaines structures supplémentaires puissent être prises
en compte sur différents paliers autonomes. L’autosegmentation a changé le statut de
certaines unités telles que le ton et la syllabe. Ainsi, certains processus tonals ont suggéré que
les tons devaient être considérés comme des unités séquentielles pouvant figurer sur leur
propre tire autosegmentale. Dans les représentations phonologiques, ces tons peuvent être
associés à des segments par l’intermédiaire de lignes d’association. Les lignes d’association
traduisent en quelque sorte une notion de simultanéité de deux propriétés. Outre les tons, le
développement de la phonologie autosegmentale a démontré que certains traits figurant dans
les matrices segmentales pouvaient être également autosegmentalisés. À ce titre, l’un des
développements les plus importants vis-à-vis de cette manipulation a été d’attribuer un statut
autonome à la syllabicité, qui n’avait aucun statut théorique particulier dans la phonologie
générative issue de SPE.
La représentation X-slot
La tire CV est apparue peu de temps après la théorie CV dans les représentations
phonologiques. Levin (1985) et Lowenstamm & Kaye (1986) considèrent qu’il est possible de
dériver la structure syllabique non pas d’une tire squelettique CV mais d’une tire temporelle.
À ce titre, toutes les unités squelettiques peuvent être représentées par une suite monotone de
X (Levin, 1985) ou de ● (Lowenstamm & Kaye, 1986). Les suites sont alors formellement
interprétées comme des positions pures. Levin (1985) suppose par exemple que la structure
syllabique peut être considérée de la même manière que les structures syntaxiques de type X-
bar. Selon elle, la notion de syllabe peut être interprétée en termes de projection d’une
catégorie primitive N essentielle à la syllabe : le noyau. Dans une telle approche de la
structure syllabique, l’attaque constitue le spécificateur du noyau et la coda son complément.
En ce qui concerne la rime, qu’elle considère non pas comme un constituant universel mais un
constituant spécifique, celle-ci est interprétée comme la première projection de la catégorie N.
En revanche, la projection du nœud syllabique N est quant à elle universelle. Dans la théorie
X de Levin (1985), chaque projection est associée à un segment par l’intermédiaire d’une tire
squelettique. Par ailleurs, Levin (1985), qui fournit des arguments à l’encontre de la théorie
CV de Clements & Keyser (1983), propose de remplacer la tire squelettique CV par une tire
uniquement constituée d’unités temporelles qu’elle symbolise par X.
36
La représentation moraïque
Dans les années 1980, les théories segmentales de la syllabe ont été concurrencées par
une théorie moraïque de la syllabe. Ainsi, certains auteurs comme Hyman (1985), McCarthy
& Prince (1986), Hayes (1989) et Itô (1989) ont rejeté un niveau de représentation
squelettique en faveur d’une structure reposant sur le poids syllabique, essentiellement
exprimé par l’intermédiaire de la more (symbolisée par μ).
Du point de vue formel, la notion traditionnelle de more a été introduite dans les
analyses phonologiques issues de la phonologie générative de Hyman (1985) et de McCarthy
& Prince (1986).
Dans l’approche développée par Hyman (1985), tous les segments d’une représentation
sous-jacente sont associés à une more. L’approche développée par McCarthy & Prince (1986)
favorise une représentation dans laquelle le statut moraïque d’un segment découle
généralement de son comportement vis-à-vis du poids syllabique diagnostiqué dans une
langue particulière. En lardil (parlée au nord de l’Australie) par exemple, seules les voyelles
longues (CVV) comptent comme des syllabes lourdes, alors qu’en kwakwala (wakashan,
Vancouver), seules les voyelles longues (CVV) et les voyelles brèves suivies par une sonante
(CVR) sont lourdes. Le modèle moraïque, sans doute le plus répandu aujourd’hui dans la
littérature phonologique, est celui développé par Hayes (1989). Son approche est fondée en
grande partie sur les modèles moraïques précédents. Selon Hayes (1989), les langues ne
diffèrent que dans la manière dont les structures moraïques sont phonologiquement
contrastives.
Comme le souligne Hayes (1989), la more possède un double rôle dans la théorie.
Premièrement, elle encode un contraste de poids syllabique relativement répandu qui
distingue les syllabes légères des syllabes lourdes. Ainsi, les recherches portant sur les
systèmes accentuels, la versification ainsi que d’autres processus tels que l’allongement
compensatoire ont révélé une distinction fondamentale entre deux types de syllabes : les
syllabes légères et les syllabes lourdes. Généralement, les syllabes lourdes contiennent une
voyelle longue (CVV) ou une consonne finale (CVC), alors que les syllabes légères
contiennent une voyelle brève (CV). Dans la théorie moraïque, une syllabe légère possède une
more et une syllabe lourde en possède deux. Deuxièmement, la more représente une position
phonologique identique aux positions pures des théories segmentales de la syllabe : un
segment simple est associé à une more alors qu’un segment long est généralement associé à
deux mores. En ce sens, la more encode aussi bien le poids que la quantité segmentale. La
37
conséquence d’une telle théorie est que seuls certains segments sont associés à des éléments
de la tire temporelle comme dans la représentation ci-dessous.
V C V V C V
Les géminées initiales, très rares à travers les langues, sont néanmoins attestées dans des
langues comme le suisse alémanique, le chypriote, le pattani malais, le berbère et certains
dialectes de l’arabe. Ces géminées initiales ont soulevé un certain nombre de problèmes
phonologiques par rapport à la représentation des géminées dans les modèles moraïques les
plus répandus (McCarthy & Prince, 1986 ; Hayes, 1989). Dans ces modèles, les attaques, qui
ne prennent part à aucun processus phonologique, ne peuvent être associées à une more dans
les représentations. Pour cela, les consonnes géminées initiales ont reçu différentes
interprétations dans la littérature. Selkirk (1990), par exemple, considère qu’une consonne
géminée en position initiale est une suite de deux consonnes associées à deux nœuds racines
qui partagent les mêmes traits. L’une des manières d’éviter une telle configuration dans la
représentation des géminées initiales consiste à attacher la more à laquelle cette consonne est
associée à un constituant prosodique supérieur à la syllabe. Pour Curtis (2003), par exemple,
les géminées initiales sont des segments dont la première partie est associée à une more elle-
même associée au mot prosodique, et dont la seconde partie est directement associée à un
nœud syllabique. Quant à Topintzi (2008), il considère la représentation dans lesquelles les
géminées initiales sont interprétées comme des segments monomoraïques directement
associés au nœud syllabique. « Initial geminates pose a serious problem for the theory since
word-initially no coda exists to host the first half of the geminate. Previous proposals have
38
addressed this issue but have not resolved it satisfactorily, because they have created new
difficulties pertaining to prosodification, syllabification or generation of insufficient or
incorrect patterns. I propose that treating the geminate as a moraic onset simultaneously
resolves all the issues above, provided we dispense with the stipulation that onsets are never
moraic. » (Topintzi, 2008, p. 147).
Mitchell (1993) passe en revue les sources de géminées initiales en arabe vernaculaire.
Il en conclut qu’une voyelle anaptyctique peut être entendue dans la plupart des cas de
gémination initiale, mais qu’elle n'est jamais essentielle et qu’il convient de l’omettre : « an
anaptyctic vowel may be heard in most cases of initial gemination but it is never essential and
better omitted » (pp. 93,94). Guerssel (1978), dans un travail sur le parler tamazight, montre
que le schwa est inséré dans les formes CCV et C:V mais pas dans la forme CV, comme dans
les exemples suivants :
Pour les géminées en position finale, en hongrois par exemple, il existe un processus
optionnel de dégémination qui touche les glides et les liquides en position finale. Dans ce cas,
la dégémination provoque régulièrement l’allongement de la voyelle précédente (Curtis,
2003).
Selon Ridouane (2003), il existe des différences significatives entre les durées
d’occlusion des simples et des géminées en fonction de la position qu’elles occupent dans le
mot. Il a montré que les occlusives en position finale (simples ou géminées) avaient une durée
d’occlusion plus longue qu’en position intervocalique.
Pour résumer,
(1) Il s’agissait d’abord de montrer les différents arguments concernant la représentation des
géminées en un seul segment ou en une suite de deux segments. Nous avons ensuite évoqué
les débats contradictoires concernant les notions de tension et de gémination.
(3) Enfin, nous avons présenté les caractéristiques phonétiques et phonologiques des
géminées en positions initiale et finale.
40
prosodiques (Leben, 1980). Cette représentation s'appuie sur le principe de la syllabicité
représentée sur la couche prosodique, appliqué ensuite à l'analyse des consonnes géminées, y
compris les géminées post-lexicales (Kenstowicz, 1994). Les schémas sous-jacents
représentent :
(3) a. b. c. d.
X X X X X X X
=
k k k k d t
Les représentations ci-dessus appliquées au tarifit donnent lieu aux exemples suivants :
a) simple
b) géminée lexicale
Ici, nous essaierons de traiter les trois comportements des géminées. Tout d’abord, nous
verrons la notion d’ambivalence : c’est-à-dire leur comportement à certains égards, comme si
elles constituaient deux segments, et dans d'autres, comme si elles n’en formaient qu’un seul
(cf. (Kenstowicz, 1970). Ensuite, nous présenterons la notion d’intégrité. Cette approche
permet de montrer que dans la mesure où ils constituent deux segments, les segments longs ne
peuvent pas être divisés par des règles d’épenthèses. Enfin, nous introduirons la notion
41
d’inaltérabilité. Le processus permet d’observer l’impossibilité de modifier les géminées
lexicales tout en affectant les simples et les fausses géminées (Hayes, 1986).
2.2.1 L’ambivalence
Les deux représentations différentes de l’approche générative des géminées (1a) et
(1b) plus haut reflètent une ambiguïté inhérente à leur comportement. Les géminées se
comportent comme un seul segment dans un cas, et comme une suite de deux segments dans
l’autre. Ce phénomène a été traité par Chomsky & Halle (1968) en termes de règles qui
modifient la représentation (1a) en (1b) ou vice-versa. Mais ces règles sont ad hoc. Les
travaux post-SPE ont rapidement mis en lumière les lacunes d’une telle description et ont
démontré qu’aucune des deux représentations ne peut adéquatement rendre compte de la
manière dont les géminées se comportent vis-à-vis de certains processus phonologiques (cf.
Kenstowicz, 1970 , Sampson, 1973 et Barkai, 1974).
Ce comportement est parfois attesté au sein d’une même langue, comme c’est le cas
pour le tarifit et quelques variantes du berbère. Nous allons nous servir d’exemples très
connus et utilisés par plusieurs auteurs pour illustrer cette ambiguïté. Nous proposerons
d’abord des exemples tirés de l’hébreu tibériade, puis nous reviendrons sur des exemples
attestés en tarifit pour illustrer ce phénomène. Sampson (1973) décrit le processus de
spirantisation qui affecte les segments simples mais pas les géminées, comme l’atteste aussi
(Kenstowicz, 1994, p. 411) : « A process of stop spirantization turns postvocalic stops into
fricatives. This phonological process affects short stops but not long stop ‘geminates’ ».
Ainsi, la spirantisation serait un processus phonologique par lequel certaines occlusives
simples (113) et (114) se réalisent comme les constrictives correspondantes. Leurs
homologues géminées (115) résistent à cette règle.
Dans les exemples (113) à (115), les occlusives deviennent des constrictives en position
postvocalique. Cependant, les géminées résistent à la spirantisation. Ce phénomène est attesté
également en tarifit, et ce dans tous les contextes. Si l’on observe le corpus suivant :
42
(116) /→ « femme »
(117) → « celle-là »
(118) → « ici »
(119) → « elle écrit »
(120) « larme »
(121) « la maison »
Dans les formes (116-118), les occlusives dentales se réalisent comme les constrictives
correspondantes. Le /t/ du féminin, qui est à la fois préfixe et suffixe (116), et le préfixe (117),
se réalisent comme . Le /d/, qui désigne l’adverbe de lieu (118), se réalise comme . En
revanche, dans les formes (119-121), leurs homologues géminées résistent à l’application de
cette règle. L’incapacité des géminées à se spirantiser est un aspect universel qui reflète
« l’inaltérabilité » de ces segments Hayes, 1986 ; Schein & Steriade, 1986 ; Churma 1988 ;
Kirchner, 2000).
Dans (122), la réduction vocalique réduit une voyelle en schwa dans le contexte ___
CVCV pour marquer le pluriel du mot « roi ». Cependant, la réduction est bloquée quand la
voyelle est suivie d’un groupe de consonnes (123) ou d'une géminée (124).
Ainsi, dans la phonologie linéaire, une géminée est représentée soit comme une
consonne longue, soit comme une séquence de deux consonnes identiques. Les géminées
constituent donc un problème pour le modèle linéaire. La période post-SPE n’a certes pas
apporté de réponse satisfaisante au problème de l’ambiguïté des géminées, à cause du cadre
théorique de l’époque qui ne le permettait pas. Mais, les différents travaux qui ont traité ce
sujet ont eu le mérite d’avoir identifié le problème. Certains auteurs, notamment Kenstowicz
(1970), ont remarqué que les règles phonologiques qui faisaient appel à la représentation
séquentielle étaient des règles prosodiques qui affectaient la durée ou l’accent. Les règles qui
43
requièrent des spécifications en terme de trait [+long] sont souvent des règles qui affectent la
qualité des segments. Cette distinction entre règles prosodiques et règles qualitatives a été
traitée et développée d’une manière formelle dans le cadre de la phonologie CV.
Dans le modèle non linéaire, le dilemme auquel est confrontée la représentation des
géminées dans le cadre linéaire n'existe plus. Dans ce cadre-ci, les géminées sont associées à
deux positions squelettiques, comme le montre la représentation ci-dessous :
b
La théorie de la phonologie CV, telle qu'elle est appliquée à la quantité, s’inscrit dans le
cadre plus large de la phonologie autosegmentale (cf. Leben, 1980 ; McCarthy, 1981 ;
Steriade, 1982 ; Clements & Keyser, 1983). Elle a fourni des solutions définitives pour
résoudre le problème de l’ambiguïté des géminées. L’idée de base de la phonologie CV est
que la propriété de la syllabicité est représentée sur une couche autosegmentale (couche
prosodique) séparée de la couche mélodique. Selon Clements et Keyser (1983), les deux
niveaux de représentation sont liés par des lignes d’association. Cette approche permet les
représentations suivantes :
(5) a. b. c.
C C C C
[] [] [] []
(5a) est une représentation d’un segment simple lié à une seule position prosodique. La
représentation (5b) est celle des affriquées, par exemple, ou des occlusives pré-nasalisées. La
représentation (5c) est celle des consonnes géminées. Les consonnes géminées se distinguent
des simples, non pas par un trait distinctif, mais par le nombre de positions prosodiques
qu’elles comportent : la simple est associée à une position prosodique (5a, voir aussi 6a) et la
géminée à deux positions prosodiques (5b, voir aussi 6b) :
C C C
[ traits] [ traits]
44
Les représentations (5-6) sont gouvernées par un certain nombre de principes comme le
Principe du Contour Obligatoire (PCO ou Obligatory Contour Principle). Ce principe a été
développé dans le cadre de la phonologie tonale par Leben (1973), et repris ensuite par
Goldsmith (1976). Le principe PCO interdit l’adjacence de deux éléments identiques sur un
même niveau autosegmental. Une telle suite est remplacée par un segment simple doublement
lié. C’est principalement à travers l’analyse de la structure de la racine en arabe que la valeur
explicative de ce principe a été développée. En effet, le PCO combiné aux principes
d’association gauche / droite permet d’expliquer l’asymétrie entre les mots de type
« samam », qui sont très largement répandus et les mots de type « sasam » qui sont exclus
McCarthy (1979, 1981). Ainsi, McCarthy (1981) le précise brièvement comme suit : « In
brief, Arabic allows roots of two, three, and four consonants, all of them subject to the
Obligatory Contour Principle. Biconsonantal roots are realized on the surface with
gemination of the second consonant as a direct consequence of the universal left-to-right
association convention. » (McCarthy, 1981, pp. 396–397)
(7)
C V C
a t
Assimilation = propagation « assimilation as spreading ». Halle et Flanagan (1980)
soutiennent que les règles d'assimilation totale ne changent pas un segment pour qu’il
devienne identique à un autre, mais impliquent plutôt la propagation de la mélodie du
segment déclencheur sur la position du segment cible sur la tire CV, exactement de la façon
dont les autosegments tonals se propagent. Ainsi, le processus d’assimilation totale de /t/ à /k/
implique la propagation des traits mélodiques de /k/ vers la position C de l’élément cible,
créant ainsi une structure avec deux positions prosodiques liées à un seul élément mélodique.
Le /t/ sous-jacent s’efface par convention « Stray Erasure » (McCarthy, 1981). L’output de
cette ré-association a la même représentation que celle d’une géminée lexicale. Cette règle est
formulée dans (8) :
(8)
C C C C
t k t k
45
2.2.2 Intégrité :
Dans les langues ayant des géminées et des règles d'épenthèse, il a toujours été constaté
que les segments épenthétiques ne pouvaient pas être insérés entre les deux moitiés des
géminées.
(9)
V/C C C
i #
Exemples de l’épenthèse en arabe palestinien :
La règle d'épenthèse (9) est insuffisante sur un point. Elle ne parvient pas à montrer
qu’elle est bloquée quand il s’agit d’insérer un /i/ au milieu de la géminée, comme dans les
exemples ci-dessous :
Comme indiqué ci-dessus (voir 7), la règle de l’épenthèse ne peut pas diviser les deux
parties d'une géminée. Il s'agit du phénomène d’inséparabilité ou d'intégrité des géminées.
Guerssel (1977, 1978), dans son analyse de la syllabisation en berbère, a montré que le
processus d’épenthèse de schwa avait lieu dans une suite de consonnes C---CC. C’est le cas
par exemple de / amə.tfu.nast/4 « comme une vache ». Il affirme cependant que lorsque les
deux premières consonnes de la séquence forment une géminée, comme dans tazzla
« course », *tazəzla, l’épenthèse est bloquée. En revanche, l’insertion du schwa est permise en
position pré-géminée (CCiCi) ou entre deux consonnes géminées (CiCi CiCi). Ce
phénomène est attesté aussi en tarfit, comme dans le cas des géminées morphologiques
permettant d’exprimer l’inaccompli (Bouarourou, 2006) :
4
Les points marquent les frontières syllabiques.
46
aorist inaccompli
(131) / bna / / bnna / « construire »
(132) / ngz / / nggz / « sauter »
(133) / nkar / / nkkar / « nier »
(134) / rz / / rbbz / « écraser »
(135) / ttu / / ttttu / « oublier »
L’impossibilité d’application de la règle d’insertion du schwa dans le cas de (tazzla)
« courir », (*tazəzla) et dans les formes (129-130) de l’arabe palestinien est une conséquence
de la contrainte universelle contre le chevauchement des lignes d’association. Il est en effet
impossible de scinder les géminées sans violer cette contrainte :
C C *C V C
k i k
C C C V C
k k
Itô (1986) conclut donc qu'une structure liée comme la géminée est « pleinement
syllabée », et que l’épenthèse n'est pas nécessaire. Le processus de « tier conflation »
(Younes, 1983 ; McCarthy, 1986) devient alors un facteur important pour expliquer cette
adhésion apparente des deux niveaux à l’intégrité des géminées.
47
segment lié à deux positions prosodiques. Une autre particularité des géminées est leur
inaltérabilité.
Tableau 3 : Résumé du blocage de la spirantisation dans les géminées dans différentes langues du monde
(Kirchner, 2000)
48
Comme dans les exemples de l’hébreu tibériade (Sampson, 1973 ; Leben, 1980), du
tigrinya (Schein, 1981), du tümpisa, du shoshone (Dayley, 1989), de l’ibibio (Connell, 1991),
du tamoul (Christdas, 1988), du wolof du Sénégal (Ka, 1994) et du berbère (Saïb,1977 ;
Elmedlaoui, 1993 ; Ridouane, 2008) le processus de la spirantisation est bloqué quand il s’agit
d’une géminée.
Sampson (1973) et Leben (1980) ont retenu l’exemple de l’hébreu tibériade pour
illustrer ce propos. Ils ont montré que les occlusives /p, t, k, b, d, g/ étaient en distribution
complémentaire avec les constrictives /f, , , , , /. Les occlusives se trouvent en position
initiale et post-consonantique et les constrictives se trouvent en position post-vocalique. Dans
le corpus suivant, Sampson (1973) montre la spirantisation post-vocalique de l’hébreu
tibériade :
[-son] [+cont] / V
Le corpus de Sampson (1973), ci-dessous, montre que la spirantisation n’affecte pas les
géminées dans l’hébreu tibériade, même si elles sont en position postvocalique :
Hayes (1986) a analysé des données tirées du tigrinya dont quelques exemples sont
reproduits dans le corpus ci-dessous :
Singulier Pluriel
klbi axalb « chien »
a
gni aan « terrain »
b fkkr fkkr « il s’est vanté »
c mrak-ka mrax-ka « veau, 2sg. masc. »
d y-t-kft ykkft « ouvrir, passive »
Dans cette langue, comme dans l’hébreu tibériade, les occlusives simples
postvocaliques se spirantisent. Notons qu’en hébreu tibériade, le processus de la spirantisation
49
affecte toutes les consonnes occlusives (Sampson, 1973). En tigrinya, seules les consonnes
vélaires se spirantisent. En revanche, la spirantisation n’affecte pas les géminées, même si la
première moitié de ce segment est post-vocalique. Hayes (1986) postule la règle suivante pour
rendre compte de ces données :
V C
C
- son [+ continu]
+ arrière
Selon Hayes (1986), il est possible de prédire les règles phonologiques qui ne peuvent
pas affecter les géminées. Il s’agit de règles qui mentionnent dans leurs descriptions
structurelles la couche mélodique et la couche prosodique. Les règles qui échappent à
l’inaltérabilité ne mentionnent qu’une seule de ces couches. Voici les critères établis par
Hayes (1986) pour déterminer dans quels cas une règle doit mentionner une couche
particulière :
a) Toute règle qui mentionne les traits distinctifs autres que le trait [syllabique] doit
mentionner la couche mélodique.
b) Toute règle qui fait appel à une classe de consonnes ou une classe de voyelles doit
mentionner la couche prosodique où la syllabicité est représentée.
c) Toute règle qui fait référence à la position au sein de la syllabe doit mentionner la
couche prosodique.
Selon Hayes (1986), le nombre de couches mentionnées dans une règle ne doit pas être
stipulé, mais découle naturellement de principes indépendants. Un aspect important
caractérisant les règles qui mentionnent les deux couches est qu’elles incluent les lignes
d’association dans leurs descriptions structurelles :
C C
V C C V C C
k k x k
V C C V C C
t k k
Schein & Steriade (1986) ont développé une analyse légèrement différente de celle de
Hayes (1986). Selon eux, les règles qui s’appliquent aussi bien aux simples qu’aux géminées
tendent à appartenir à une même classe de règles qui ne requièrent que des informations
segmentales.
L’inaltérabilité des géminées est donc entièrement prédictible à partir de la façon dont
les règles, qui s’appliquent aux simples, sont formulées. Ainsi, les structures (15) ci-dessous
peuvent être affectées différemment selon la description structurelle de la règle.
51
(15) couche A a. b.
couche B
Si la règle affectant impose des conditions qui sont satisfaites par et non par , alors
la règle ne pourra pas s’appliquer aux formes ayant la structure (15b). Si, en revanche, la règle
affecte un élément de la couche A et qu’aucune condition n’est imposée sur les éléments
associés à cet , alors la règle s’appliquera aussi bien à (15a) qu’à (15b), sans distinction entre
segments simples ou segments doublement liés.
Les effets de l’inaltérabilité des géminées ne sont pas limités à la spirantisation. Hayes
(1986) a indiqué d’autres blocages dans les géminées. Se basant sur un travail effectué par
Cowan & Yarmohammadi (1978) sur le persan, Hayes (1986) traite de la transformation de
/v/ à /w/ qu’il nomme l’affaiblissement de /v/ (« /v/-weakening ») en position finale de la
syllabe. De façon inattendue, l’affaiblissement de /v/ n’arrive pas à affecter /v/ en position
finale de la syllabe à chaque fois qu'il constitue la première moitié d'une géminée, comme le
montre le corpus ci-après :
Un autre processus illustrant le comportement différent entre les simples et les géminées
concerne le processus de dévoisement qui affecte les géminées, mais pas les simples. En
tarifit, par exemple, la correspondante géminée de // et /d/ est /tt/ et non /dd/.
Ce phénomène est attesté dans d’autres langues, comme l’illustre le tableau suivant tiré
de Kirchner (2000) :
52
Tableau 5 : description des processus de dévoisement affectant les géminées dans différentes langues (Kirchner,
2000)
En ce qui concerne le tarifit, nous avons observé une autre sorte d’inaltérabilité. C’est le
processus de l’amuïssement de la liquide /r/ en position coda, qui n’affecte pas les géminées
correspondantes. Rappelons que Louali et Puech (1998) ont traité du statut du /r/ en position
coda et ont montré que dans cette position rhotacise le noyau vocalique, l’allonge ou altère
son timbre et sa structure (monophtongue ou diphtongue). Chtatou (1994) qualifie ce
processus d’allongement compensatoire, identique à celui qui se manifeste dans les parlers
anglais du sud de l’Angleterre (cf., plus haut, Section : 1.2.17). On a constaté que ce
processus était bloqué pour les géminées.
53
aoriste inaccompli
La spirantisation en berbère
a. Les segments forts et les positions fortes ont priorité dans les processus de fortition de
trait et dans la distribution des traits fortis.
b. Les segments faibles et les positions faibles ont priorité dans les processus
d’affaiblissement de trait et dans la distribution des traits faibles.
La spirantisation des occlusives a attiré beaucoup de linguistes, et, entre autres, a servi
de facteur discriminant pour élaborer la classification des parlers berbères. Biarnay (1917),
par exemple, considère la spirantisation des occlusives comme un des traits les plus
importants qui permettent de distinguer les parlers du Nord des parlers chleuhs. Le tamazight
et le tarifit sont considérés comme des parlers spirants et le chleuh comme un parler occlusif.
Ridouane (2009) explique que les parlers chleuhs ne sont pas tous des parlers occlusifs. Le
tachelhit parlé dans le Haut-Atlas spirantise la bilabiale sonore, les vélaires et les
labiovélaires.
54
La spirantisation en tarifit, comme l’a indiqué Saïb (1977) sur le proto-berbère 5 ,
entraine une modification des occlusives en constrictives dans un contexte libre, mais celle-ci
est bloquée pour les géminées, contrairement à quelques langues, où la spirantisation est
conditionnée par le contexte. Prenons l’exemple de l’hébreu tibériade (Malone, 1993). Les
occlusives non emphatiques deviennent des constrictives en position postvocalique, mais la
transformation est bloquée aussi pour les géminées. En tarifit, la labiale sonore /b/, les
dentales /t, d/ et les vélaires /k, g/ se spirantisent. En revanche, selon Ridouane (2009), pour le
tachelhit, les dentales ne se spirantisent pas.
Le tarifit présente une alternance entre les spirantes simples et les occlusives géminées
comme dans l’exemple ci-dessous.
aoriste inaccompli
Pour rendre compte de l’alternance spirante simple ~ occlusive géminée, illustrée ci-
dessus, on a a priori le choix entre deux règles : une règle d’occlusivation ou une règle de
spirantisation, selon le statut phonologique attribué aux constrictives. Comme signalé
auparavant, différents auteurs considèrent que la direction historique du changement occlusive
/ constrictive ne peut plus rendre compte des données synchroniques. Ils postulent à l’inverse
une règle d’occlusivation (constrictive => occlusive). Dans le parler rifain de Beni Iznassen,
décrit par El Kirat (1987), les coronales simples /t, d/ se réalisent /, / sauf quand elles sont
immédiatement au contact de /m, n, l/, auquel cas les coronales simples restent occlusives.
Les vélaires et leurs homologues labialisées se spirantisent dans tous les contextes. La
gémination, comme en tachelhit, bloque la spirantisation. Un ensemble d’arguments justifie le
statut phonémique des constrictives, selon El Kirat (1987).
1- Ces segments sont attestés dans la forme verbale de base, qui est la catégorie la moins
marquée.
2- Le tarifit contient une grande quantité d’emprunts arabes qui sont intégrés au lexique
local, tout en gardant l’aspect occlusif de leurs segments. Cette adaptation des
occlusives sans les spirantiser a été facilitée par la réduction quantitative qui a affecté
5
Le proto-berbère est la langue première dont toutes les langues berbères modernes sont issues. Elle fait partie à
son tour de la famille afro-asiatique.
55
les géminées. Lorsqu’on compare le tachelhit au tarifit, on constate que la gémination
est maintenue pour le tachelhit, mais pas pour le tarifit, comme le montrent les formes
ci-après :
tarifit tachelhit
3- L’argument majeur, selon El Kirat (1987), est que la spirantisation n’est plus un
processus synchroniquement productif.
En tachelhit, la situation est différente, un ensemble d’arguments indique plutôt que les
constrictives dérivent d’occlusives sous-jacentes. Selon Ridouane (2009), un premier
argument est lié à la tendance universelle des langues à préférer les occlusives aux fricatives
dans la structure sous-jacente. Un système phonologique avec une occlusive /k/ est plus
naturel qu’un système contenant une constrictive /x/. L’existence de /x/ présuppose
l’existence de sa contrepartie occlusive /k/ et non pas l’inverse. Un deuxième argument
important est que les géminées occlusives labiales et vélaires en tachelhit restent géminées et
se distinguent des constrictives simples aussi bien en termes de durée qu’en termes de mode
d’articulation. Cela n’est pas le cas pour les occlusives géminées en tarifit ou en kabyle.
Les différents types de géminées ne réagissent pas tous de la même manière vis-à-vis de
la spirantisation. Les géminées lexicales, et c’est là une tendance universelle, ne se
spirantisent jamais. Les géminées issues d’une assimilation complète résistent aussi à
l’application de cette règle. En revanche, les géminées issues d’une concaténation se
spirantisent (Hayes, 1986).
Ridouane (2009) a mené une étude comparative des trois types de géminées du
tachelhit. Il a démontré que :
b. des différences existaient au niveau phonétique entre les géminées lexicales et issues
d’une assimilation complète d’un côté et les géminées par concaténation de l’autre ;
56
articulatoires montrent que la gémination lexicale est phonétiquement implémentée
par différents corrélats, dont le principal est la durée.
Dans la phonologie CV, une géminée est représentée comme une seule unité mélodique
associée à deux positions prosodiques. Les comportements des géminées, à savoir leur
ambivalence, leur intégrité et leur inaltérabilité, ont été observés ; les traits suivants ont été
retenus :
Ambivalence : dans certains cas les géminées se comportent comme si elles
constituaient deux segments, et dans d'autres, comme si elles n’en constituaient qu’un
seul.
Intégrité : dans la mesure où ils constituent deux segments, les segments longs ne
peuvent pas être divisés par des règles d’épenthèses.
Inaltérabilité : l'échec de certains processus phonologiques à modifier les géminées
lexicales, tout en affectant les simples et les « fausses » géminées.
57
3 Dimension typologique de la gémination
Cette partie dresse une vue globale des études phonétiques sur la gémination dans
diverses langues. Tout d’abord, seront présentés des travaux acoustiques et perceptifs qui ont
permis de dégager des indices acoustiques responsables de la distinction entre consonnes
simples et consonnes géminées. Ensuite, nous énumérerons les études articulatoires et
physiologiques des géminées qui montrent des comportements différents aux niveaux
glottique et supraglottique. Enfin, nous présenterons l’impact de la vitesse d’élocution sur les
consonnes simples et les consonnes géminées.
À titre d’exemple, Lahiri & Hankamer (1988) et Hankamer, et al. (1989) ont analysé la
durée des occlusives sourdes simples et géminées dans deux langues différentes : le turc et le
bengali. L’objectif de cette étude était de déterminer l’indice acoustique principal responsable
de l’opposition entre ces deux types d’occlusives et de vérifier s’il s’agissait du même indice
pour les deux langues. Leurs résultats montrent que la durée de l’occlusion est l’indice
perceptif significatif qui permet de distinguer les simples des géminées. En revanche, le VOT
ne permet pas, à lui seul, de différencier ces deux classes de consonnes. Pour le bengali et le
turc, la durée de l’occlusion des géminées est significativement différente de celle des
simples.
Ham (1998) a fait les mêmes remarques lors d’une analyse acoustique de la gémination
dans quatre langues typologiquement différentes : l’arabe levantin, le hongrois standard, le
madourais (parlé en Indonésie) et le bernois. La conclusion principale de cette étude est que ni
la durée du VOT positif ni la durée du burst ne contribuent acoustiquement à l’opposition
simple vs. géminée dans ces langues. Le seul indice acoustique qui permet de distinguer les
simples des géminées est la durée de l’occlusion. Ladefoged & Maddieson (1996) sont allés
dans le même sens en montrant que le corrélat phonétique le plus saillant des contrastes
phonologiques entre les simples et les géminées réside dans la tenue consonantique. En
moyenne, les occlusives géminées ont entre 1,5 à 3 fois plus de tenue consonantique que les
occlusives simples en parole soignée : « The most salient phonetic correlate of phonological
contrasts between singleton and geminate consonants is closure duration. On average, long
stops have between 1.5-3 times the closure duration of short stops in careful speech. »
(Ladefoged & Maddieson, 1996, p. 92).
58
Kraehenmann (2001) a présenté des preuves pour deux affirmations :
a) le contraste entre les occlusives dans les dialectes suisses alémaniques repose
uniquement sur la quantité ;
59
Les analyses acoustiques des géminées impliquent fréquemment la durée, mais un
nombre important d’autres corrélats phonétiques a été signalé. Parmi ces corrélats, on trouve
l’amplitude du burst, la fréquence fondamentale et la qualité des voyelles adjacentes. Ce
phénomène a déjà été mentionné dans d’anciens travaux. Signalons, par exemple, un travail
pionnier de Lisker (1958) qui a montré que les différences de durée sont combinées avec des
différences de voisement et de tension pour les occlusives du tamil. Par la suite, ce même
phénomène a fait l’objet d’études dans Abramson (1987, 1998) sur le pattani malais. Lahiri et
Hankamer (1988) et Hankamer, et al. (1989) ont étudié le même phénomène pour le turc et le
bengali (cité supra).
Esposito & Benedetto (1999) allient des considérations théoriques aux résultats
d’analyses acoustiques et perceptives. Ils ont fait l'hypothèse que la durée de la tenue
consonantique est le principal indice de la gémination en italien. Les résultats d'une analyse
acoustique d'un grand nombre de consonnes simples et géminées de l’italien mettent en
évidence deux corrélats acoustiques de la gémination : la longueur de la tenue consonantique
et la longueur de la voyelle précédant la consonne. D'autres paramètres acoustiques ne sont
pas systématiquement liés à la gémination. Ces résultats ont été validés au niveau perceptif.
Au niveau de la perception, les indices ci-dessus ont été utilisés par les auditeurs pour la
discrimination simple/géminée. À ce niveau, la durée de la tenue consonantique jouait un rôle
majeur. En outre, il a été constaté que l’allongement significatif de la consonne n'a été que
partiellement compensé par la réduction de la voyelle précédente et par un petit allongement
de l’énoncé de la géminée, par rapport à celle de la simple. Ce résultat suggère que les
intervenants suivent une sorte de timing (rythme) qui est fixe dans le temps et dépend du
nombre de syllabes dans le mot. Les mots avec un nombre égal de syllabes ne changent pas la
longueur de l’occurrence, un segment allongé étant en partie compensé par le
raccourcissement de l'autre. Ce processus semble être appliqué également au niveau perceptif,
ce qui suggère que le timing (rythme) d'une langue est aussi une attitude auditive.
Arvaniti & Tserdanelis (2000, 2001) et Arvaniti (2001) ont effectué plusieurs mesures
incluant la durée des consonnes simples et géminées, la durée de la voyelle précédente,
l’amplitude RMS des géminées, ainsi que les différences spectrales des voyelles précédant et
suivant les géminées (plus particulièrement le F1 et le F2 de ces voyelles). Les résultats
obtenus montrent que la durée est le corrélat le plus robuste et le plus consistant permettant de
distinguer les simples des géminées. Aucune différence n’a été relevée en terme d’amplitude
entre les simples et les géminées. La gémination n’affecte pas non plus ni la durée de la
voyelle précédente, ni la qualité des voyelles précédant ou suivant la consonne géminée.
60
Payne & Eftychiou (2006) ont examiné les variations de la durée des géminées
alvéolaires et latérales lexicales et post-lexicales sous différentes conditions de l’accent. Leurs
résultats révèlent que les géminées lexicales sont beaucoup plus longues que les géminées
post-lexicales, et que les deux catégories (simples et géminées) sont plus longues en position
initiale. La différence de durée est robuste dans toutes les conditions, et particulièrement pour
les géminées lexicales en position initiale. Les géminées lexicales et les géminées post-
lexicales sont significativement plus longues quand elles sont en position pré-accentuelle. Les
géminées en position initiale sont plus longues quand elles sont précédées d’une nasale en
position finale. Par conséquent, cela crée une sorte de consonne « super-géminée » et indique
que les nasales en position finale ne sont pas supprimées.
Cohn et al. (1999) ont analysé les caractéristiques de durée dans l’opposition simples vs.
géminées présentes dans trois langues indonésiennes : le bougi, le madourais et le toba batak.
Les géminées se caractérisent par une durée plus longue que les simples. Le VOT ne
contribue pas à la distinction de longueur dans les trois langues. Dans les trois langues en
revanche, la voyelle précédant les géminées a une durée clairement plus brève que lorsqu’elle
est devant une simple.
Hassan (2002) a mené une étude instrumentale et comparative des consonnes simples et
géminées en suédois et en arabe en se focalisant sur la durée de la voyelle précédente. Les
résultats obtenus indiquent, dans les deux langues, une durée plus importante pour les
géminées que pour les simples. De plus, en suédois, les voyelles précédant les simples ont une
durée nettement plus longue par rapport aux voyelles précédant les géminées. En revanche, la
différence de durée des voyelles n’a pas été significative en arabe. Ces résultats appellent
quelques remarques, relatives principalement au système vocalique dans les deux langues. Le
système vocalique suédois, traditionnellement considéré comme un système à 9 voyelles,
oppose les longues aux brèves. Les voyelles longues sont situées devant les consonnes
simples et les brèves devant les géminées ou devant les séquences de deux consonnes
successives. Il s’agit là de la distribution complémentaire des quantités. Les mêmes faits de
« distribution complémentaire des quantités » ont été observés par Sock et al. (1996) et Sock
(1998) lors d’une étude cinématique et acoustique des corrélats de la quantité en suédois et en
wolof du Sénégal. Les résultats obtenus dans cette étude montrent qu’en suédois la voyelle est
longue en position finale, ou quand elle est suivie d’une consonne brève dans un contexte
VVC. Elle est brève quand elle est suivie d’une consonne longue dans un contexte VCC. En
revanche, le wolof de Gambie n’a pas montré cette distribution complémentaire des quantités.
61
Les voyelles brèves et longues du wolof de Gambie sont toujours suivies d’une consonne
simple VC ou VVC.
Sur la gémination en japonais, Kawahara (2012) cite, parmi les travaux menés sur les
corrélats secondaires de la gémination, certains auteurs que nous mentionnons ci-après. Ces
auteurs ont montré que les voyelles sont plus longues devant les géminées que devant les
simples (Campbell, 1999 ; Fukui, 1987 ; Han, 1994 ; Hirata, 2007 ; Hirose & Ashby, 2007 ;
Idemaru & Guion, 2008 ; Kawahara, 2006 ; Ofuka, 2003 ; Port et al., 1987 ; Takeyasu, 2012).
Port et al. (1987), par exemple, trouvent que le [] dure en moyenne 68 ms devant les
simples et 86 ms devant les géminées. Contrairement aux simples, les voyelles suivantes sont
moins longues après les géminées (Campbell, 1999 ; Han, 1994 ; Hirata, 2007 ; Idemaru &
Guion, 2008 ; Ofuka, 2003). Selon Idemaru & Guion (2008), la moyenne de la durée de la
voyelle qui suit les géminées est de 63 ms, tandis que celle qui suit les simples est de 76 ms.
En ce qui concerne le VOT, Han (1994) affirme que le VOT des géminées est légèrement
moins long que celui des simples.
Kawahara (2006) a montré, dans un travail sur trois locuteurs, que les occlusives
géminées sonores sont généralement « semi-dévoisées » en japonais, et cela, à cause de
contraintes aérodynamiques : si le voisement est présent tout au long de la tenue
consonantique de [g], il s’arrête au milieu de la tenue totale de [gg] (40% de voisement sur
l’ensemble de la tenue totale). Hirose & Ashby (2007) ont appliqué la même méthode. Ils ont
trouvé une moyenne de 47% de voisement sur la tenue totale. Contrairement aux résultats
obtenus par Cohn et al. (1999) sur le bougi, le madourais et le toba batak, Hirose et Ashby
(2007) ont observé que le voisement des géminées occlusives se maintient durant toute la
durée de l’occlusion.
Pour les études menées sur le berbère, il est important de signaler les résultats des
travaux de Ridouane (2003) sur cinq locuteurs du parler tachelhit. Ces travaux prennent en
considération des mesures d’un ensemble de paramètres temporels et non temporels.
Ridouane (2003) a obtenu des résultats que nous présentons ci-dessous.
Tout d’abord, la durée (de l’occlusion pour les occlusives) est le paramètre principal qui
permet de distinguer les simples des géminées. Ce paramètre est présent pour toutes les
consonnes et dans toutes les positions. Les mesures de débit d’air oral ont montré que ce
paramètre permet de distinguer acoustiquement les occlusives sourdes simples des géminées,
en position initiale absolue aussi, même si cette différence n’est pas perçue.
62
Ensuite, la durée du VOT ne permet pas de distinguer les occlusives sourdes simples de
leurs contreparties géminées. Les occlusives sonores géminées, selon les positions et les
locuteurs, présentent parfois des durées de VOT significativement plus longues que celles de
leurs contreparties simples. L’allongement du VOT est dû au dévoisement qui les affecte et
donc indirectement à leurs durées d’occlusion plus longues.
De plus, la voyelle tend à s’abréger lorsqu’elle précède une consonne géminée, plus
particulièrement une occlusive géminée ou une fricative. Ridouane (2003) a observé
néanmoins des variations selon les locuteurs. L’aspect simple ou géminé des obstruantes n’a
aucun effet sur la durée de la voyelle suivante.
Enfin, aucune différence de durée n’a été observée entre les géminées
tautomorphémiques, les géminées issues d’une concaténation et celles qui résultent d’une
assimilation complète. La durée de la voyelle précédente est également identique. Elle est plus
longue uniquement pour un locuteur qui réalise la voyelle précédant les géminées issues
d’une concaténation avec une durée significativement plus longue. La durée de cette voyelle
est presque la même que celle qui précède les segments simples.
63
Sur le plan acoustico-perceptif, nous avons mentionné quelques travaux menés sur
différentes langues qui possèdent la distinction simple / géminée afin de dégager les indices
acoustiques responsables de cette opposition. Plusieurs tests ont été effectués sur plusieurs
paramètres comme la durée des voyelles adjacentes, la durée de l’occlusion, la durée du
VOT, la durée des fricatives, l’amplitude du burst et la fréquence fondamentale de la voyelle
suivante. Ces auteurs ont dégagé plusieurs indices qui permettent de distinguer les simples
des géminées. La plupart des travaux cités trouvent que la durée de la tenue consonantique
est l’indice principal pour distinguer les deux catégories. D’autres indices trouvés sur
certaines langues restent secondaires.
Parmi ces chercheurs pionniers, on peut citer Sievers (1876) qui, en retenant des
considérations perceptives et kinesthésiques, fut le premier à avoir proposé la notion de ré-
articulation des géminées. Quelques années plus tard, Rousselot (1891) devait réfuter cette
notion de ré-articulation des géminées, en se fondant sur ses données kymographiques pour
des consonnes géminées d’un dialecte gallo-roman. Ses dernières ne présentaient pas de
caractéristiques de consonnes doublement articulées. Cependant, l’étude de Stetson (1951) sur
les géminées hétéromorphémiques de l’anglais a permis de mettre au jour une double
articulation lors de la production des géminées /p+p/. En effet, les courbes correspondant à la
pression intra-orale ont nettement indiqué deux maxima pour les labiales géminées.
Cependant, Hegedüs (1959) n’a trouvé aucun indice qui puisse démontrer la ré-articulation
des géminées à partir de mesures acoustiques de la courbe de l’intensité pour les simples vs.
les géminées tautomorphémiques.
64
Précisons toutefois que Hegedüs (1959) avait analysé des consonnes
tautomorphémiques, tandis que d’autres auteurs avaient plutôt analysé des géminées séparées
par une frontière de mot. Afin de pouvoir comparer des choses comparables, Lehiste et al.
(1973) se sont proposés d’étudier deux types de géminées dans le cadre d’une même langue.
Leur étude a été faite à partir de données électromyographiques pour l’estonien et l’anglais.
L’électromyographie avait été retenue pour déterminer si les géminées impliquent une ré-
articulation ou non. La langue estonienne offre, d’une part, la possibilité de comparer les
géminées tautomorphémiques avec les géminées hétéromorphémiques. Elle permet, d’autre
part, de comparer les géminées aux super-géminées parce que cette langue présente un
système à trois degrés de longueur consonantique (brève vs. longue vs. extra-longue). Nous
reviendrons à quelques détails relatifs à cette étude ainsi qu’aux résultats, infra.
Dans l’étude de Lehiste et al. (1973), évoquée supra, le quadruplet estonien suivant :
/taba/ / tapa/ /tappa / /lapp peal / a été analysé. Les consonnes bilabiales de ce quadruplet
65
sont toutes des occlusives sourdes. /b/ est une labiale simple sourde (sic), /p/ une géminée
courte et /pp/ une géminée longue. Ils ont effectué des enregistrements électromyographiques,
associés à l’occlusion labiale, et des mesures de pression d’air intra orale. Les données de
l’estonien montrent que la durée de l’occlusion différencie clairement les simples des
géminées et des super-géminées. Le nombre de sommets sur les courbes
électromyographiques (sommets EMG) permet aussi de distinguer les géminées des super-
géminées, ainsi que les simples des géminées. En ce qui concerne l’opposition super longues
et géminées hétéromorphémiques, la différence ne semble pas significative. Dans la paire
/tappa/ vs. /lapp peal/, seule l’amplitude du sommet EMG semble différencier les deux
formes. Mais cela est probablement dû au fait que la deuxième syllabe de /tappa/ n’est pas
accentuée tandis que le deuxième mot de /lapp peal/ l’est. En outre, le contexte, ceteris
paribus, n’est pas contrôlé.
La différence entre les géminées courtes et les géminées longues serait clairement
établie. Elle se manifeste, en plus de la durée, par le nombre de sommets EMG sur les courbes
électromyographiques. En ce qui concerne l’aspect réarticulé des géminées, l’étude de Lehiste
et al. (1973) apporte des observations qui confirment la double articulation lors de la
production des géminées en estonien (courtes, longues, ainsi que la séquence CC+C).
Contrairement aux observations faites par Delattre (1971), les géminées en anglais ne sont pas
réalisées avec une double articulation.
Parmi les travaux menés sur des consonnes doubles, nous pouvons citer à titre
d’exemple l’étude cinéradiographique de Vaxelaire (1995b) sur des consonnes simples et
doubles du français. Vaxelaire montre que l’étendue de contact (la zone de contact
palais/langue) est plus importante pour les occlusives longues que pour les occlusives brèves.
En vitesse d’élocution rapide, les différences au niveau de l’étendue de contact s’accroissent
puisqu’une augmentation nette de l’aire de contact entre la langue et le palais est observée
notamment pour les occlusives longues.
66
Figure 3 : coupes sagittales du conduit vocal pour /aka/ (lignes continues) vs. /akka/ (lignes discontinues), en
vitesse d’élocution normale (à gauche) et pour /ada / (lignes continues) vs. /adda/ (lignes discontinues), en
vitesse d’élocution normale (à droite). D’après Vaxelaire, (1995a).
Les mesures obtenues des profils sagittaux, en vitesse d’élocution normale, montrent
que les étendues de contact correspondent à chaque fois à la valeur maximale de contact :
lèvre-lèvre et langue-palais (apex et dos). Les étendues pour les consonnes doubles,
hétéromorphémiques homorganiques, sont égales ou éventuellement plus longues que celles
des simples. Des résultats similaires ont été relevés dans le travail de Bouarourou et al. (2008)
présentant une étude cinéradiographique sur les consonnes simples et les consonnes géminées
du tarifit. Nous y reviendrons dans le chapitre 11.
Dunn (1993) a étudié les mouvements des lèvres pendant la tenue des consonnes
longues et courtes de l’italien et du finnois, en utilisant les mesures dérivées de l’aperture des
lèvres. Elle a trouvé que les lèvres restent en contact plus longtemps pour les sons longs, le
67
mouvement cinématique n’étant pas remarquablement différent pour les consonnes longues
par rapport aux consonnes courtes. Smith (1995) a fait une étude reliée à cette dernière. Elle a
examiné les mouvements des lèvres et de la langue pour les consonnes simples et les
consonnes géminées du japonais et de l’italien. Ses résultats indiquent que les mouvements de
fermeture des lèvres sont plus lents pour les géminées que pour les simples.
Gili-Fivela et al. (2007) ont réalisé des études articulatoires sur le contraste de la
longueur des consonnes simples et géminées de l’italien. Ces auteurs se sont focalisés sur la
cinématique des lèvres et de la langue. Leur objectif était de tester directement des hypothèses
sur l'organisation gestuelle des consonnes géminées et de recueillir des observations sur la
position possible des objectifs gestuels des consonnes simples et géminées. Leurs données
montrent que les géminées de l’italien semblent être mieux expliquées par un modèle hybride
qui utilise à la fois le modèle de Öhman (1966) « Voyelle à Voyelle » et celui de Browman &
Goldstein (1986) « Voyelle Consonne ». Concrètement, certains de leurs résultats montrent
une stabilité du cycle vocalique de « Voyelle à Voyelle », que la cible consonantique soit
simple ou géminée, alors que d’autres montrent une variabilité de ce cycle vocalique. De plus,
les données confirment en partie l'existence d'un objectif virtuel plus élevé chez les géminées
par rapport aux simples.
68
tendu, des fausses géminées qui résultent uniquement de l’adjacence entre deux segments
identiques (Hayes, 1986).
Nous proposons de nous attarder un peu plus ici sur quelques travaux de Löfqvist &
Gracco (1997 ; 2002) et de Löfqvist (2005 ; 2006 ; 2007 ; 2009). Leurs résultats semblent
particulièrement pertinents pour illustrer nos propos sur le contrôle de l’opposition simple vs.
géminée.
À l’aide de données cinématiques, Löfqvist & Gracco (1997) ont analysé des
événements moteurs durant la production d’occlusives bilabiales, couplées avec des
informations sur la pression d'air orale, et la force de contact labial. Leurs résultats montrent
que la vélocité du mouvement des lèvres était plus élevée durant la tenue consonantique avec
une cible pour les lèvres qui pouvait correspondre à une région d’ouverture labiale. Une telle
stratégie de contrôle laisse penser que les lèvres formeraient un ensemble hermétique
indépendamment de toute variabilité contextuelle. Löfqvist & Gracco (2002) ont appliqué la
même expérience sur le mouvement de la langue, chez quatre sujets, au cours de la production
de consonnes occlusives vélaires et alvéolaires. L’intérêt était d’examiner les événements
cinématiques avant, pendant et après la tenue consonantique. Les résultats obtenus sont
semblables à ceux qu’ils ont obtenus sur les lèvres. La langue se déplace souvent à une vitesse
élevée au début de la fermeture. Le mouvement de la langue était plus complexe, avec des
composants à la fois horizontaux et verticaux. La vitesse du mouvement de fermeture et de
relâchement des occlusives est influencée à la fois par les voyelles précédentes et par les
voyelles qui suivent. Pendant la tenue consonantique, la langue se déplace à travers une
trajectoire généralement de moins de 1 cm. L'ampleur du mouvement est encore dépendante
du contexte. Globalement, la langue adopte des trajectoires antérieure/postérieure. Ces
résultats sont compatibles avec l'idée que les mouvements de la langue sont libres pendant la
fermeture tant que celle-ci est hermétique. Une nouvelle interprétation repose sur le principe
d’effort minimal qui avait été appliqué, avec succès, dans certaines études des mouvements de
la main lors de la préhension (cf. Jeannerod (1988) ou Berthoz (1997)).
Löfqvist (2007) a étudié aussi les mouvements de la langue pour les consonnes
occlusives et fricatives, dans des conditions similaires à l’étude menée en 2006, citée supra.
Les résultats montrent une différence robuste dans la durée de fermeture pour les consonnes
longues et courtes. Globalement, lors de la production de la consonne, la trajectoire du
mouvement de la langue a été plus longue pour la consonne longue que pour la consonne
courte. Aussi, la vitesse du mouvement de la langue a diminué chez tous les locuteurs lors de
la production de la consonne longue. Ces ajustements dans les mouvements de la langue
70
étaient les plus susceptibles de maintenir le contact entre la langue et le palais, lors de la
fermeture et/ou de la constriction.
Toujours dans les mêmes conditions que ses études antérieures (relatées supra),
Löfqvist (2009) s’est consacré à l’étude de la coarticulation linguale voyelle-à-voyelle dans la
séquence voyelle-consonne bilabiale-voyelle. Dans cette séquence, la durée de la tenue
consonantique est soit longue, soit courte. Il a émis l'hypothèse qu'il y aurait davantage de
coarticulation de voyelle-à-voyelle dans le contexte d'une consonne brève, puisqu’une
consonne longue demanderait un mouvement lingual plus long. L'ensemble des résultats ne
corroborent cependant pas cette hypothèse. Toutefois, les sujets modulent la vitesse du
mouvement de la langue entre les deux voyelles, ce qui la rend plus lente durant la production
des consonnes longues que durant la production des consonnes brèves.
Une autre étude sur des géminées (à comprendre « consonnes doubles »), effectuée par
Benguerrel et al. (1978), peut être citée. Cette recherche a examiné, entre autres, les
ajustements glottiques pendant la production des occlusives et fricatives du français, à partir
d’un corpus réalisé par deux locuteurs. L’étude repose sur une analyse acoustique,
fibroscopique et électromyographique en se focalisant plus spécifiquement sur les aspects
suivants : sonore vs. sourde, accentuée vs. non accentuée, position initiale vs. position finale et
simple vs. géminée. Signalons que les géminées examinées par Benguerrel et al. sont des
géminées séparées par des frontières de mot, le français n’opposant pas les consonnes simples
aux géminées à l’intérieur du mot. Benguerrel et al. (1978) ont analysé, entre autres, le corpus
suivant : /terrible/ /c’est éristique/ /c’est terrible/ /sept terrines/.
Pour ce qui concerne l’opposition simple vs. géminée, ces chercheurs trouvent une
différence assez remarquable en termes de degré d’ouverture de la glotte. Les géminées se
réalisent avec une glotte plus ouverte que les simples. L’ouverture maximale de la glotte,
atteinte pendant l’occlusion orale des occlusives sourdes simples, est une fonction de la durée
de l’ouverture glottique (et de la durée de l’occlusion orale qui est concomitante). En d’autres
termes, plus la durée entre l’initiation du geste d’abduction et la fin du geste d’adduction est
longue, plus la largeur maximale atteinte sera grande. Pour les géminées, en revanche,
l’ouverture maximale atteinte n’est pas liée, selon les auteurs, à la durée de l’ouverture
glottique ou de l’occlusion orale.
Ces mêmes résultats ont été confirmés dans les travaux de Ridouane (2003) portant sur
des occlusives géminées, en relation avec la largeur de l’ouverture glottique. Selon lui, deux
hypothèses peuvent expliquer pourquoi les occlusives géminées sont systématiquement
produites avec une ouverture glottique aussi large. La première hypothèse est que le degré de
71
l’ouverture glottique est une fonction de la durée de l’ouverture glottique pour les occlusives.
Autrement dit, plus la durée de l’ouverture glottique est longue, plus son amplitude est
importante. Une deuxième hypothèse est de postuler que la largeur de l’ouverture glottique est
un aspect inhérent aux géminées occlusives sourdes qui sont produites avec une forte
augmentation de la pression intraorale et/ou avec un contact très fort entre le palais et la
langue. Une autre question, liée à la première, concerne l’intérêt phonétique ou phonologique
d’une telle ouverture systématique. Ridouane (2003) rappelle que d’un point de vue
biologique, le contrôle de l’ouverture glottique est généralement partie intégrante d’autres
activités comme la respiration, les réflexes de protection, ou la parole. Louali & Puech (1994)
ont analysé la pression intraorale lors de la tenue des occlusives géminées sourdes et ont
montré que ces occlusives géminées sourdes nécessitent effectivement une augmentation de la
pression orale. À noter que Löfqvist et al. (1981) ont également démontré que l’augmentation
de la pression intraorale est étroitement liée à la largeur de l’ouverture glottique.
Sur le plan articulatoire et physiologique, nous avons mentionné quelques travaux menés sur
différentes langues qui possèdent la distinction simple / géminée, afin de dégager les indices
articulatoires responsables de cette opposition. Différentes méthodes ont été testées sur le
phénomène de la gémination aux niveaux glottique et supraglottique. La méthode
fibroscopique permet de tester la durée et le degré d’ouverture glottale pendant la tenue des
consonnes simples et des consonnes géminées. Quant à la méthode électromyographique,
elle s’appuie sur le nombre de sommets des courbes pour distinguer les simples des géminées
et pour vérifier si les géminées impliquent une ré-articulation ou non. En ce qui concerne la
méthode électropalatographique, elle est utilisée pour déterminer la durée et l’étendue du
contact entre la langue et le palais. Enfin, la méthode cinématique vise à observer les
différents contacts et les différents mouvements des articulateurs, afin de comparer les
consonnes simples aux consonnes géminées.
Les principaux résultats sont les suivants : a) une durée acoustique de la tenue consonantique
plus longue pour les géminées ; b) des occlusions (contacts ou étendues de contact) plus
longues pour les géminées ; c) une forte augmentation de la pression intraorale ; un
mouvement de la langue de la première à la deuxième voyelle ayant une durée plus longue
pour les consonnes longues que pour les brèves.
72
3.3 Les consonnes géminées en vitesses d’élocution normale et rapide
Il s’agit maintenant de tester la robustesse des oppositions simples vs. géminées avec la
variation de la vitesse d’élocution. Rappelons que l’augmentation de la vitesse d’élocution est
un moyen de prédilection pour apprécier l’élasticité des segments phonétiques et
phonologiques (voir, par ex., Gaitenby (1965) ou Sock (1998)).
Ainsi, plusieurs études ont examiné les consonnes simples et les consonnes géminées en
vitesses d’élocution normale et rapide pour observer l’impact de la vitesse d’élocution, en tant
que perturbateur du contrôle temporel des segments consonantiques.
Arvaniti (1999) a mené une étude acoustique des sonantes simples et géminées (/ m, n,
l, r/) du grec chypriote en vitesses d’élocution normale et rapide, comparées à des sonantes du
grec standard. Ces dernières n’ont pas de distinction de longueur. Toutes les consonnes
simples et géminées du chypriote ont été compressées en vitesse d’élocution rapide, à
l'exception de []. Malgré cette compression, on n’observe pas de chevauchement entre les
simples et les géminées. La durée des sonantes grecques était intermédiaire entre les deux
catégories chypriotes. Ces résultats sur la consonne [] montrent que les effets des asymétries
de la vitesse d’élocution sont dus à l'incompressibilité de certaines catégories et ne sont pas
imposées par le système linguistique. Cependant, le contraste entre une catégorie au sein d'un
système affecte les valeurs de cette catégorie ; ce constat est visible dans la plus grande
longueur des sonantes grecques. Enfin, les résultats montrent que lorsque la durée est l’indice
principal pour une distinction catégorielle, il n’y a pas de chevauchement temporel qui
survient entre les catégories, contrairement à ce que certaines études sur la longueur vocalique
contrastive semblent suggérer. Nous reviendrons sur ce dernier point dans (la Section 5.5.1).
Pickett et al. (1999) ont examiné l’effet de la vitesse d’élocution sur les consonnes
simples et des consonnes géminées de l’italien. Ils ont analysé les labiales et les dentales
produites dans des mots isolément, et dans des phrases porteuses, en vitesses d’élocution
normale et rapide. Afin de distinguer les deux catégories de consonnes, la durée de
l’occlusion a été mesurée. Pour un locuteur, en vitesse d’élocution rapide, la durée de
l’occlusion des consonnes géminées était comparable à celle de la durée des consonnes
simples produites isolément. Les mesures qui reflètent la relation entre les deux durées, à
savoir le rapport entre la durée de la consonne et la durée de la voyelle précédente, distinguent
les simples des géminées, quelle que soit la vitesse d’élocution. Les auteurs ont aussi vérifié
expérimentalement, au niveau de la perception, si le fait de modifier le rapport entre la durée
de la consonne et celle de la voyelle pouvait mener à un changement perceptif. Les résultats
73
indiquent que le changement de ces rapports n’affecte pas systématiquement et de manière
cohérente la perception des distinctions simples vs. géminées. En d’autres termes, ces effets
varient significativement chez les auditeurs. Ces résultats soutiennent l’idée qu’il existerait
des propriétés acoustiques stables correspondant aux traits phonétiques et cela malgré les
variations temporelles au niveau de la durée des occlusions, en fonction des changements de
la vitesse d’élocution.
Dans Bouarourou et al. (2010), nous avons analysé d’un point de vue acoustique la
production des occlusives non-voisées simples et géminées de deux locuteurs du tarifit. Nous
avons confirmé une mesure pertinente pour la gémination, à savoir la durée de la tenue
consonantique. Les autres paramètres acoustiques retenus (durée des voyelles adjacentes,
VTT, VOT) n’ont pas révélé de comportement différent selon que l’on ait affaire aux simples
ou aux géminées. L’augmentation de la vitesse d’élocution a provoqué la compression des
segments acoustiques mesurés, y compris celle du paramètre pertinent de la gémination : la
tenue consonantique. Malgré le réaménagement temporel de ce paramètre critique, la
distinction des deux classes reste possible par la tenue consonantique, aussi bien en termes
absolus que relatifs (le pourcentage de temps pris par la tenue consonantique dans la syllabe
CV). Cela semble démontrer la résistivité de la gémination en tarifit. L’étude de Bouarourou
et al. (2010) a tenté d’établir des liens articulatori-acoustiques, en suggérant des corrélations
entre la tenue consonantique acoustique et l'étendue de contact articulatoire. L’étendue du
contact articulatoire est un autre paramètre robuste, puisqu’il a permis de distinguer, chez les
deux locuteurs, les deux catégories linguistiques à travers différents contextes consonantiques,
et cela dans différentes positions à l’intérieur du mot (Bouarourou et al., 2008).
Amano et Hirata (2010) ont testé la théorie de l'invariance acoustique relationnelle, avec
la distinction de quantité des occlusives du japonais, en dissyllabes prononcées avec des
vitesses d’élocution différentes. Les questions étaient de savoir : a) si la limite de perception
entre les deux catégories phonologiques des occlusives simples et géminées est invariante,
malgré la variation de ces conditions de vitesse d’élocution, et b) s'il existe une
correspondance étroite entre la perception et les frontières de production, dans le cadre d’un
mot. Le ratio des durées d’occlusion du mot (où «le mot» a été défini comme dissyllabique) a
été précédemment jugé un paramètre invariant qui permet de distinguer les deux catégories,
simples et géminées. Mais la présente étude a constaté que ce ratio pouvait varier avec
différents scores au niveau de la perception. Cependant, les analyses de régression et de
discrimination de données de perception et de production ont montré que le traitement de
l’occlusion, en fonction de la durée du mot, représente très bien les frontières de perception et
74
de production. Ce résultat indique que le ratio de la durée de la tenue des occlusives (par
exemple la fermeture avec une constante d’intégration) par rapport au mot était invariant et
distingue clairement les deux catégories phonémiques. Pris ensemble, ces résultats appuient la
théorie d’invariance relative acoustique, et aident à affiner la théorie en ce qui concerne
exactement la forme que peut prendre cette invariance.
Munhall et Löfqvist (1992) ont observé des variations dans les ajustements glottaux
pendant la production de sons non voisés dans la séquence [s t] en vitesse d’élocution rapide.
Les sujets étaient des locuteurs américains qui ont prononcé une séquence du type ‘kiss Ted’.
Ces auteurs ont remarqué qu’il y a des gestes d’ouverture et de fermeture glottales pendant
toute la séquence. En vitesse d’élocution lente, ils ont constaté un geste d’ouverture et de
fermeture pour [s] distinct de celui du [t]. En vitesse d’élocution intermédiaire, la phase
d’ouverture pour [t] est absorbée, en partie, par le geste de fermeture pour le [s]. Munhall &
Löfqvist (1992) concluent que les locuteurs réalisent habituellement deux gestes d’ouverture
et de fermeture glottale pendant la tenue de ce type de séquence. Mais en vitesse d’élocution
rapide, il y a tant de chevauchements entre les deux gestes qu’un seul pic apparaît dans le
mouvement glottal pendant la séquence. La même analyse semble correspondre parfaitement
aux mouvements mandibulaires des séquences consonantiques. Au niveau glottique, nous
pensons, toutefois, que les résultats devraient être différents pour une géminée
hétéromorphémique homorganique du type [t#t], puisque le geste glottique d’un [s] est
différent de celui d’un [t], celui du [s] étant habituellement plus large.
Dans cette même perspective, Ridouane et al. (2006) ont mené une étude sur les
ajustements laryngés lors de la production de groupes consonantiques obstruantes sourdes du
tachelhit. Les observations ont été faites simultanément par transillumination, à l’aide de films
obtenus par fibres optiques et d‘enregistrements acoustiques. Cette langue possède une riche
variété de groupes de consonnes sourdes. Plusieurs combinaisons de groupes de /s/ et /k/ ont
été examinés, y compris des consonnes simples et géminées. Dans ce travail, Ridouane et al.
(2006) ont observé le nombre de gestes d'ouverture-fermeture de la glotte, l'influence du mode
d'articulation et les effets de frontières de mots. Les résultats de cette étude fournissent la
preuve que le mode d'articulation des segments et leur position dans le groupe de mots ont un
impact majeur sur le nombre et la localisation des mouvements d’abduction de la glotte. Les
frontières de mots n'ont pas autant d'influence sur les ajustements laryngés.
Plusieurs études ont examiné les consonnes simples et les consonnes géminées au niveau
acoustique et au niveau articulatoire en variant la vitesse d’élocution. L’objectif est de vérifier
l’impact de la vitesse d’élocution sur ces consonnes : la compressibilité, l’incompressibilité de
certaines catégories et la résistivité de la gémination à l’augmentation de la vitesse d’élocution.
Quelques résultats principaux montrent : a) lorsque la durée est l’indice principal pour une
distinction catégorielle, il n’y a pas de chevauchement temporel qui survient entre les
catégories, malgré une augmentation de la vitesse d’élocution ; b) le changement des rapports
voyelle/consonne n’affecte pas systématiquement et de manière cohérente la perception des
distinctions simples vs. géminées ; c) le ratio de la durée de la tenue des occlusives par rapport
au mot était invariant et distingue clairement les deux catégories phonémiques.
Nous proposons, dans ce qui suit, d’examiner certaines théories en production de la parole,
théories qui pourraient nous être utiles pour rationaliser certains de nos résultats. Les sections
qui suivent doivent beaucoup à Sock (1998).
77
4 Les grands courants théoriques en phonétique
Sock (1998) souligne que pour Liberman (1984), le fait que l’auditeur n’arrive pas à
reconstituer auditivement le percept vient du fait qu’il intégrerait les deux parties du percept
dans un classement catégoriel qui serait de nature phonétique, et plus précisément gestuelle.
Selon Liberman (1984), il existerait un module spécialisé de perception de la parole, et plus
généralement du langage. Celui-ci fonctionnerait de bas en haut, empêchant que les modules
cognitifs de décodage de haut niveau aient accès aux différentes composantes du percept.
Selon ces derniers, l’efficacité perceptive de la parole serait liée à deux phénomènes : 1)
tout d’abord, il existe un nombre réduit d’unités phonologiques de base, qui sont rassemblées
en combinaisons plus ou moins libres pour constituer les parties du discours. 2) Ensuite, la
relative inertie des articulateurs est compensée par une coarticulation des segments
phonologiques à produire. Ils en concluent que le chevauchement spatial et temporel des
unités du code est indispensable pour permettre la production de la parole à une vitesse
d'élocution raisonnable. Ce serait, en réalité, ce phénomène de coarticulation qui
compliquerait le processus de perception de la parole, rendant non-linéaire la correspondance
entre les gestes phonétiques successifs et les segments acoustiques successifs.
78
Le signal acoustique étant de nature hautement complexe, étant donné les divers
facteurs coarticulatoires, Liberman et Mattingly (1985) proposent alors de rechercher un
invariant dans le domaine articulatoire, et notamment gestuel, où la correspondance entre
représentations phonologiques et gestes est moins complexe. Cette proposition d’analyses du
phénomène de la parole, sous forme de structures articulatoires élémentaires plus petites a été
exploitée, tel que nous le développons infra, par Browman & Goldstein (1989), dans leur
Phonologie Articulatoire, où les gestes correspondent à des structures coordinatives, c’est-à-
dire à des entités ayant une spécification spatio-temporelle. Cette théorie s’est établie
également grâce au modèle mathématique qu’est le « Task Dynamic Model », décrit infra, et
élaboré au sein des Laboratoires Haskins (Saltzman, 1986 ; Saltzman et Munhall, 1989 ;
Saltzman & Byrd, 2000).
Pour appuyer ce point de vue, Fujimura (1991) explique que le passage d'une
description articulatoire à une description acoustique de la parole est particulièrement non-
linéaire, au sens où une superposition linéaire de gestes ne se traduit pas par une combinaison
linéaire de paramètres acoustiques. En revanche, l'information au niveau moteur, selon
Fujimura (1991), se présente de telle sorte que la relation entre l'articulatoire et la
représentation phonologique est quasi-linéaire.
Pour Fowler & Saltzman (1993), il semblerait que les auditeurs emploient une
«constellation» de conséquences acoustiques de gestes linguistiquement signifiants du conduit
vocal, comme étant une information sur la source. Les auditeurs trieraient alors les gestes et
ne garderaient que ceux qui sont linguistiquement signifiants. Cependant Sock & Vaxelaire
(2001) émettent quelques réserves en montrant que le système de production et de perception
de la parole combinerait un espace de contrôle moteur avec un espace de contrôle acoustique.
79
Selon Stevens (1985 ; 1991), il existerait une organisation hiérarchique des traits
phonologiques qui structurent le lexique, ainsi qu’une représentation directe de ces indices
sous forme de caractéristiques acoustiques invariantes du signal de parole. Pour lui, le
locuteur doit apprendre les différents modèles de coordination des articulateurs, afin de
remplir les exigences acoustico-auditives du code phonologique.
« Given this view of the feature-based structure of the lexicon and the way in which the
various features are represented in the sound, we can speculate on the implications for
strategies for speech production. […] [In producing speech sounds] speakers must learn
patterns of coordination of the various articulators that satisfy [the] acoustic requirements. »
(Stevens, 1991, p. 86).
L’ensemble des conclusions de Stevens (1991) repose sur ses travaux, menés en
collaboration avec Blumstein depuis les années 70. Suite à une série d’expériences sur la
perception du lieu d’articulation des consonnes occlusives /b, d, g/ dans des stimuli de
synthèse du type consonne-voyelle, Stevens & Blumstein (1978) tentent de prouver
l’existence de propriétés acoustiques invariantes permettant la caractérisation du lieu
d’articulation de la consonne, indépendamment du contexte vocalique. Leurs données
montrent que la forme globale du spectre, calculé au relâchement (soit la détente acoustique)
de la consonne, diffère selon le lieu d’articulation. Ainsi, ils observent :
- un pic spectral proéminent dans les fréquences moyennes (1 à 3 kHz) pour les
vélaires,
Sock (1998) rappelle qu’il fallait cependant passer d’un invariant statique à un invariant
dynamique, plus tard, pour pouvoir se rendre compte de distinctions phonologiques plus fines
telles que la distinction entre /b/ et /w/ (Blumstein, 1986). Toutefois, l’hypothèse de base ne
change pas avec ce réaménagement de la théorie. Pour Blumstein (1986), il existerait une
invariance acoustique dans le signal de parole correspondant aux traits phonétiques d’une
langue. Cette dernière établit que le signal de parole serait hautement structuré, dans le sens
80
où il contiendrait des modèles acoustiques invariants. Ces modèles correspondent à la
dimension phonétique de la langue, associés aux segments linguistiques et aux traits
phonétiques. En outre, ces modèles resteraient invariants, quels que soient les locuteurs, les
contextes phonétiques et les langues : « There is acoustic invariance in the speech signal
corresponding to the phonetic features of natural language. That is, it is hypothesized that the
speech signal is highly structured in that it contains invariant acoustic patterns for the
phonetic dimension of language relating in particular to linguistic segments and to phonetic
features, and that these patterns remain invariant across speakers, phonetic contexts, and
languages. » ( Blumstein, 1986, p. 178).
Il s’agit alors de rendre compte des facteurs qui façonnent les caractéristiques
acoustiques et articulatoires utilisées pour signaler les distinctions linguistiques. Comme le
font par ailleurs remarquer Lindblom & Engstrand (1989), la Théorie Quantique est une
théorie des traits distinctifs qui, contrairement à la théorie relativement axiomatique de
Jakobson (1961), tente de rationaliser l’origine des traits à partir de l’observation des
phénomènes articulatoires et des résultats acoustiques associés.
Ce constat fait, il importe de signaler que le lien entre une théorie de l’invariance
acoustique et la Théorie Quantique n’est pas clairement défini chez Stevens (1989).
Blumstein, (1989) souligne ce fait, en disant que les propriétés invariantes ne sont pas
intrinsèques aux paramètres acoustiques dans la Théorie Quantique et que seule la stabilité de
l’acoustique par rapport à l’articulatoire peut être inférée. Elle admet, toutefois, qu’une théorie
de l’invariance acoustique ne peut être viable sans une Théorie Quantique sous-jacente,
puisqu’elle requiert l’émergence d’un nombre défini de propriétés acoustiques invariantes à
partir d’un nombre potentiellement infini de configurations articulatoires. Ainsi, l’existence
d’invariants acoustiques dans le signal de parole apparaît dans le cadre de la Théorie
Quantique (Quantal Theory) proposée par Stevens (1972 ; 1989). Le raisonnement de base de
cette théorie consiste en la non-linéarité du passage de l’articulatoire à l’acoustique,
responsable de l’existence de zones dans l’espace articulatoire pour lesquelles le résultat
acoustique est stable (Zones I et III dans la Figure 4), et de zones où une petite variation du
paramètre articulatoire implique une variation abrupte du paramètre acoustique (zone quantale
(Zone II)). Lorsqu’un paramètre articulatoire varie de manière linéaire, il arrive que les
conséquences acoustiques varient de façon non régulière. Autrement dit, dans certaines zones
articulatoires, des mouvements qui seront sans conséquences acoustiques (résultat stable) sont
observables.
81
Figure 4 : Non-linéarité du passage d’un paramètre de commande articulatoire à un paramètre de sortie
acoustique dans le paradigme de base de la Théorie Quantique. (Adaptée de Stevens, 1989).
Ladefoged (1983), lui, s’oppose à cette théorie. Il considère que si les locuteurs
favorisent certains points dans la zone de dispersion possible, c’est simplement qu’ils sont
plus faciles à réaliser et non pas du fait de leur nature quantale. En effet, il n’existerait pas de
qualité vocalique préférentielle, en dehors, peut-être, des voyelles [i, a, u], qui offrent un
maximum de distinction dans la mesure où ce sont des points extrêmes dans l’espace
articulatoire (et non du fait qu’une grande variation articulatoire aurait peu de conséquences
acoustiques). Aussi, il signale que certains objets peuvent être regroupés selon un « air de
famille » (family resemblance) au niveau articulatoire, sans que ceux-ci soient nécessairement
corrélés.
Clements et Ridouane (2006), dans leur revue de la Théorie Quantique, proposent deux
grandes familles de définitions des traits quantiques :
1. pour les définitions contextuelles, les indices acoustiques ou auditifs seraient détectés
uniquement lorsque les traits ont une position dans un contexte approprié ;
82
2. pour les définitions intrinsèques, les indices se trouveraient alors dans le segment lui-
même.
Nous pensons que cette théorie est une illustration adéquate de relations non linéaires
entre les gestes articulatoires et leurs conséquences acoustiques. Effectivement, la variation de
certains paramètres articulatoires n’a aucune conséquence au niveau acoustique, tandis que
d’autres, même plus minimes, peuvent entrainer une réorganisation remarquable de l’espace
acoustique et donc du message linguistique. La production de certains sons tolère une plus
grande variabilité des gestes articulatoires sans pour autant que le résultat acoustique soit
modifié. Nous dirions alors que, pour cette catégorie de sons, leur espace de viabilité est plus
large. C’est le cas par exemple de la production de la voyelle [a], où le paramètre critique du
contrôle est la constriction pharyngale, les autres régions du conduit vocal ayant des degrés de
liberté plus grands. Certains sons auront alors des zones de viabilité plus étendues que
d’autres. En d’autres termes, la réalisation de tels sons implique moins de contraintes
articulatoires pour obtenir un résultat acoustique désiré Sock (1998).
Les variabilités liées à la parole entrainent des différences de timing dans les différents
contextes. Les « cibles » articulatoires et acoustiques ne sont pas toujours atteintes, et sont
alors considérées comme un phénomène de ratage de la cible articulatoire, ou « undershoot »
(Stevens & House, 1963). Même lorsque ce « ratage » est lié à la durée, ou au contexte de la
réalisation du geste (Lindblom, 1963a ; 1963b), la cible articulatoire fondamentale d’un
phonème quelconque resterait invariante.
Dans les années 60 et 70, une grande partie des variabilités dévoilées dans les signaux
de parole, telles que les coarticulations vocaliques et consonantiques (Öhman, 1967), était
expliquée en termes de chevauchements spatio-temporels de commandes adjacentes
(MacNeilage, 1970). Ainsi, des études relatives à l’articulation compensatoire ont démontré
que des énoncés produits avec un « bite-block » ne présentaient que très peu de variabilité par
rapport aux productions canoniques. Cela permet de conclure à la capacité compensatoire du
locuteur, grâce à ces commandes qui gèreraient les chevauchements spatio-temporels de
manières invariantes. Le succès des compensations implique une réorganisation des gestes
articulatoires qui doit être contrôlée par des représentations cibles ou des commandes liées à
ces productions.
La notion de cible devrait être définie, selon Lindblom (1987), comme le rendement
acoustique que le locuteur veut atteindre, plutôt qu’en termes de simples invariants
articulatoires. Si l’invariance n’est pas articulatoire, se peut-il qu’elle soit acoustique ?
Nous avons vu supra que Stevens et Blumstein (1978) prônent que le signal acoustique
contient de véritables invariances physiques correspondant aux segments et aux traits
phonétiques.
Lindblom (1987) répond à cette question en disant que toutes les informations se
trouvent dans le signal, et plus particulièrement dans sa dynamique, lorsqu’il affirme : « All
84
the information is in the signal, particularly in its dynamics ». Mais pour valider ces propos, il
faut accepter le fait que les locuteurs, en faisant varier leur style d’élocution, contribuent à
augmenter la variabilité des aspects physiques de la parole. Or des énoncés dans lesquels les
unités linguistiques sont intelligibles révèleront toujours un « noyau invariant »
d’informations linguistiques physiques. C’est le noyau même d’une voyelle ou d’une
consonne qui devrait être conservé.
Ainsi, contrairement aux théories Motrice et Quantique (développées supra), qui toutes
les deux postulent l’existence d’un invariant associé à un invariant phonologique, la théorie de
la Variabilité Adaptative s’appuie sur la notion d’adaptabilité du locuteur, et renonce à
l’hypothèse de l’existence d’une Invariance Physique Absolue (Absolute Physical Invariance,
85
(Lindblom, 1987) dans le signal de la parole. Les paramètres physiques décrivant la parole
seraient variables à tous les niveaux pour un message linguistique invariant.
Figure 5 : Domaines d’hyper- et d’hypo-articulation en parole, en fonctions des informations du contexte et des
informations dans le signal, selon la Théorie de la Variabilité Adaptative. (Adaptée de Lindblom, 1987, in
Béchet (2011)).
Nous proposons maintenant de présenter, dans leurs grandes lignes, quelques modèles
en production de la parole.
Dans le modèle de dynamique des tâches, certaines constrictions sont contrôlées par un
système dynamique avec deux fonctions distinctes, mais ayant des niveaux interactifs. Le
niveau de coordination intergestuel est défini de façon relative à un ensemble d’activations
coordonnées. Le niveau de coordination interarticulatoire est défini selon deux ensembles : le
modèle articulatoire et les coordonnées des « tract variables ». L’identité linguistique de
chaque unité gestuelle est définie indépendamment du contexte, par un ensemble de
paramètres dynamiques. Les valeurs de chaque activation de gestes définissent la force avec
laquelle le geste forme les mouvements dans le conduit vocal, selon ses propres buts
phonétiques.
Les « tract variables » et les modèles articulatoires associés à chaque geste spécifient la
constriction particulière dans le conduit vocal (par ex. bilabiale) et un ensemble
d’articulateurs (par ex. lèvres et mâchoire), dont les comportements sont directement affectés
par l’activation des gestes.
Dans les simulations de la dynamique des tâches, chaque type de constriction est
associé à une paire typique de « tract variable ». L’une renvoie à la localisation de la
87
constriction, le long de l’axe longitudinal du conduit vocal, l’autre réfère au degré de la
constriction, mesurée perpendiculairement à l’axe longitudinal sur le plan sagittal.
Architecture du modèle task-dynamics
3. de dégager les lois qui régissent les dégradations de ces mouvements suivant les
conditions d’exécution et le contexte (Saltzman & Munhall, 1989).
Intergestural
Coordination
(gestural activation
variables)
Interarticulatory
Coordination
(tract variables ;
model articulatory
variables)
Figure 6 : Schématisation du modèle dynamique à deux niveaux pour la production de la parole. La flèche de
gauche indique les commandes d’activation gestuelle et celle de droite le feedback de l’état du système physique
de production. (d’après Saltzman & Munhall 1989).
88
Ce sont en effet les variables d’activation gestuelle qui constituent l’espace dans lequel
seront exprimés les gestes indépendamment du contexte. En d’autres termes, et dans le cadre
de la Phonologie Articulatoire (Articulatory Phonology), c’est dans cet espace que chaque
unité phonologique trouvera son expression sous forme de constellations ou d’agrégats de
gestes simples ( Browman & Goldstein, 1989).
Les variables du conduit vocal (tract variables) sont décrites dans l’espace des positions
et des degrés de constrictions le long du conduit vocal (par exemple l’ouverture et la
protrusion des lèvres). Les variables articulatoires (model articulatory variables) représentent
les articulateurs responsables de la forme du conduit vocal (par exemple la mandibule et les
lèvres inférieure et supérieure).
Les simulations du système physique de la production de parole sont faites à l’aide d’un
synthétiseur articulatoire développé par Rubin et al. (1981, 1996). C’est un modèle qui simule
les formes du conduit vocal sur le plan sagittal, grâce à une modélisation géométrique
simplifiée de la cinématique des articulateurs. Les variables du conduit vocal, ainsi que les
degrés de liberté au niveau des articulateurs sont présentés dans la Figure 7.
89
tract variable articulators involved
LP lip protrusion upper & lower lips, jaw
LA lip aperture upper & lower lips, jaw
TTCL tongue tip constrict location tongue tip, tongue body, jaw
TTCD tongue tip constrict degree tongue tip, tongue body, jaw
TBCL tongue body constrict location tongue body, jaw
TBCD tongue body constrict degree tongue body, jaw
VEL velic aperture velum
GLO glottal aperture glottis
Figure 7 : La Coupe sagittale du conduit vocal en sortie du synthétiseur articulatoire de Haskins Laboratories.
Les variables du conduit vocal (positions et degrés des constrictions) y sont montrées de manière schématique.
(D’après Browman & Goldstein, 1989).
Chaque geste est simulé par un système dynamique de second ordre (du type masse-
ressort) sur-amorti (pour l’équation du mouvement, voir Saltzman & Munhall (1989). Les
commandes de raideur, de frottement et de position d’équilibre apparaissent sous forme de
créneaux à l’entrée de chaque système. Dans un premier stade, l’orchestration temporelle des
gestes est faite « à la main » par le moyen d’un tableau appelé gestural score ou « partition
gestuelle » comportant la variable temps associée à l’axe horizontal et les différentes variables
du conduit vocal figurant sur l’axe vertical (Browman & Goldstein, 1990). La Figure 8
montre un exemple de partition gestuelle pour le mot anglais "palm".
90
Figure 8 : Partition gestuelle pour le mot anglais "Palm" d’après . Browman & Goldstein (1992)
- les boîtes grisées représentent l’intervalle d’activation de chaque geste, soit l’intervalle
durant lequel le geste est actif et exerce une influence sur la dynamique du conduit
vocal ;
- la courbe en noir est une courbe de mouvement calculée par le modèle Task
Dynamics, à partir de paramètres numériques dynamiques associés à chaque variable
du conduit vocal.
91
5 Théories et modèles qui intègrent la variabilité dans leur conception
92
Figure 9 : Les sept paramètres du modèle de Maeda (1990)
- la position de la mâchoire ;
- la hauteur du larynx.
Les paramètres articulatoires varient entre moins trois et plus trois écarts-types.
On peut aussi citer d’autres modèles qui reposent sur une étude statistique des contours
sagittaux. Ainsi, Beautemps et al. (2001) ont étudié les degrés de liberté pour la production de
voyelles orales, de consonnes occlusives et fricatives du français à partir de contours sagittaux
extraits de films cinéradiographiques. Le modèle articulatoire développé se compose de neuf
paramètres :
93
- un paramètre pour la mâchoire ;
Cette étude retient, comme celle de Maeda, l’intersection des contours de la langue avec
une grille semi-polaire. Cependant, Beautemps et al. (2001) ont retenu une grille qui s’adapte
en fonction du contour de la langue, afin de garder un nombre constant d’intersections de la
grille avec la langue.
La majorité des études effectuée concerne une vue sagittale du conduit vocal, car les
données articulatoires étaient principalement disponibles sur le plan sagittal. Les systèmes
d’acquisition en trois dimensions ont permis l’étude de modèles statistiques en trois
dimensions.
Selon Laprie & Busset (2011), les modèles articulatoires du conduit vocal jouent un rôle
important dans la recherche des relations entre la géométrie du conduit vocal et ses propriétés
acoustiques.
Le corpus a été enregistré dans les années 90 par un locuteur masculin français dans le
but d’étudier la coarticulation en français (Sock et al., 2011). Il se compose de quatre films.
Les deux premiers sont des séries de six phrases courtes allant de /se dø si ylt/ à /se dø sikst
skylt/ (pour chaque phrase une consonne non-labiale est ajoutée entre /i/ et /y/ par rapport à
la précédente) à des fréquences d’élocution normale et rapide. Les deux dernières séries sont
des séries de /VCV/ (/aku iku uku atu itu utu/) en vitesse d’élocution normale et rapide.
Ils avaient comme objectif de construire un modèle articulatoire basé sur les données de
de ce locuteur test. Pour la construction de ce nouveau modèle, il a été nécessaire de
déterminer la position et la forme des principaux articulateurs à partir des images
cinéradiographiques. La cinéradiographie, nous le verrons plus loin, fournit une image sur
laquelle toutes les structures se projettent contrairement à une tomographie. Les principaux
94
articulateurs de la parole sont plus ou moins visibles : la mâchoire, la langue, l’épiglotte, le
larynx et les lèvres.
Les contours des principaux articulateurs ont été extraits des images
cinéradiographiques, soit à la main soit automatiquement via le logiciel X-Articulator, qui
propose des outils développés dans ce but (Sock et al., 2011). X-Articulator propose des outils
automatiques afin de suivre les régions rigides, comme les os, des outils de suivi semi-
automatique pour les lèvres, le larynx et l’épiglotte et des outils pour tracer le contour de la
langue.
P1 P2 P1 P1 P2 P1
96
correspondent à un équilibre mécanique de toutes les forces agissant sur l'articulateur, dont les
caractéristiques sont déterminées par des variables de contrôle (Feldman, 1986).
A partir d'un corpus exploitant la séquence /iai/ insérée dans une phrase porteuse et
enregistrée pour un locuteur masculin français, trois conditions d'élocution sont étudiées :
Signalons que le terme « accentuation » désigne ici un accent de focus (ou une
emphase) porté sur la voyelle /a/.
Pour ces chercheurs, la réalisation allophonique du /a/ serait fonction de deux facteurs
clairement dissociés :
1) la coarticulation planifiée, guidée par les principes d'optimisation évoqués plus haut
et intégrant en particulier le contexte vocalique symétrique fermé et antérieur du /i/ ;
les effets de cette coarticulation sont indépendants des schémas prosodiques et ne
sont donc pas mis en évidence dans ce corpus ;
Il est supposé, d’une part, que dans la condition « lente et accentuée », les
configurations articulatoires (et par conséquent les trajectoires formantiques) correspondent
effectivement aux trajectoires planifiées, et d’autre part, que la variabilité observée dans les
deux autres conditions est le reflet des commandes prosodiques. C'est dans ce cadre qu'ils
décident d'exploiter les outils d’inversion développés jadis à l'Institut de la Communication
Parlée (Laboissiere et al., 1990) et d'inférer les séquences temporelles des variables de
contrôle, aptes à générer et à expliquer la variabilité observée sur les signaux acoustiques.
Perrier et al. (2011) ont élaboré des modèles biomécaniques des articulateurs en 3D,
basé principalement sur la langue et les lèvres, comme dans les figures ci-dessous. Les
principes de base ayant orientés ce travail sont proches de ceux proposés par Wilhelms-
Tricarico (1995) ou Sifakis et al. (2006), il s’agit de modèles continus basés sur des éléments
de structures finis, les mailles, opposés à des modèles discrets basés sur des réseaux de
masses élastiques, comme ceux de Kim et Gomi (2007), celui Dang & Honda (2004) et celui
de Terzopoulos et Waters (1993). L’activation du muscle influe sur les propriétés mécaniques
des éléments du maillage associés avec le muscle activé. Les propriétés mécaniques des
97
éléments du maillage sont non-linéaires. Comparés aux modèles de (Wilhelms-Tricarico,
1995) et Sifakis et al. (2006), leurs modèles musculaires sont fonctionnels et donc moins
précis. Cependant, dans le modèle de Perrier et al. (2011) l’interaction des tissus mous avec
les structures externes : les dents, le palais, les os crâniens sont modélisés avec des contacts,
et ceci n’est pas le cas des deux autres modèles (cf. infra).
Figure 11 : Exemple d’implémentations anatomiques du muscle. En haut à gauche : la localisation des parties
intérieure (gris foncé), médiane (gris clair) et postérieure (gris) du muscle gélioglosse dans la langue, à droite, les
microfibres pour le muscle genioglosse et le muscle styloglosse dans le modèle de la langue (Buchaillard,
Perrier, & Payan, 2009). En bas à gauche, la description volumétrique du muscle orbiculaire de la bouche dans le
modèle facial ; à droite : les microfibres du muscle principal dans le modèle facial (partie gauche) (Nazari et al.,
2010 in Perrier et al. (2011))
98
Les modèles statistiques sont souvent les plus réalistes, car ils sont construits à partir de
données de coupes sagittales. Ils sont habituellement fondés sur des formes réelles dérivées
de données cinéradiographiques ou d’IRM et sont en ce sens anthropomorphiques. Maeda
démontre que deux composantes suffisent à expliquer 90% de la variance des données de
contours de langue. Avec trois composantes retenues, ce taux s’élève à 98%.
Le travail de Laprie et Busset présente la construction et l'évaluation d'un modèle
articulatoire à partir d’un corpus de rayons X et d’images IRM, qui s’approche de la forme
latérale des voyelles et des consonnes avec une très grande précision. Enfin, une ligne
centrale d’algorithme est présentée, il s’agit d’un algorithme utilisé pour décomposer le
conduit vocal dans une séquence de tubes élémentaires.
Perrier propose une approche biomécanique. Il émet les deux hypothèses suivantes : a) une
partie de la variabilité acoustique serait le résultat d'une programmation cognitive de
l'articulation ; b) l'autre partie de la variabilité s'expliquerait par les caractéristiques inertielles
et dynamiques du système articulatoire. Perrier et ses collègues proposent une modélisation
de l'appareil de production de la parole qui permet d’implémenter concrètement ces deux
hypothèses.
99
5.4.1 Geste articulatoire : propriétés
En ce qui concerne l’organisation du geste, il a une propriété temporelle et spatiale. Il
est caractérisé dans le conduit vocal, en termes de lieux et d’aires d’une constriction
maximale. Le lieu et l’aire de la constriction varient selon le contexte vocalique ou
consonantique, les positions des articulateurs pouvant changer pour un même phonème.
Certains articulateurs peuvent participer simultanément à l’exécution de plusieurs segments.
Produire un son pertinent en parole reviendrait donc à réaliser une action décomposable
en un nombre limité d’unités primitives. Dans ce cas, les tâches seraient réparties entre
différents ensembles d’articulateurs (lèvres, langue, glotte, …), localisés à l’intérieur du
conduit vocal. Ces gestes seraient organisés dans le cadre d’une partition gestuelle spatio-
temporelle spécifique.
Selon Browman & Goldstein (1989), les gestes articulatoires sont considérés comme
des unités phonologiques ou « atoms of phonological representation ». Les gestes
articulatoires, définis dans leur dynamique, peuvent être considérés comme unité de base
servant à la représentation phonologique. Etant de nature spatio-temporelle et possédant leur
durée propre, ils représentent l’unité phonologique primitive. Ayant une valeur contrastive, ils
seront utilisés pour caractériser des données de mouvements articulatoires et pour constituer
une base d’unités phonologiques. Sur la base de l’analyse et de la description des articulateurs,
définis en tant que gestes articulatoires, Browman & Goldstein (1990) proposent une
explication quantitative et statistique de la représentation de l’organisation articulatoire.
Browman & Goldstein (1992) posent que les gestes se caractérisent par des faits physiques et
réels qui se déroulent pendant le processus de production. La Phonologie Articulatoire décrit
les unités lexicales selon les réalisations physiques que représentent les gestes qui deviennent
alors les unités de base des contrastes des unités lexicales, autant que l’unité de base de
l’action articulatoire.
Notons que chaque locuteur adapterait ses gestes articulatoires en fonction des
situations de parole. Chaque langue imposerait ses propres caractéristiques, en ce qui
concerne les gestes articulatoires, et cela indépendamment des contraintes de production et de
perception inhérente à cette langue (Browman & Goldstein, 2000).
Les gestes décrits dans leur dynamique seront définis comme variables du conduit
vocal. La théorie phonologique note deux hypothèses fondamentales : le caractère modulaire
et l’invariance du geste. Au plan articulatoire, la « cible » articulatoire correspondrait à
l’intersection des « positions de stabilité maximale » des différents articulateurs.
100
Signalons que Kirchner (2000) s’est basé sur le modèle de la phonologie articulatoire
pour tenter de rationaliser l’inaltérabilité des géminées et la lenition. En prenant en compte
deux paramètres, la position et le temps, il a réalisé les courbes suivantes correspondant au
geste de l’occlusive géminée. Il a réduit l’amplitude du geste sans modifier la courbe, le
résultat est une réduction de la durée de l’occlusion. Si l’on réduit encore plus l’amplitude du
geste, le résultat est que l’occlusive devient spirantisée, comme le montrent les schémas
suivant dans la Figure 12 :
a.a.Occlusive
Occlusivegéminée
géminée b. Amplitude réduite,
b. Amplitude réduite,
occlusion abrégée
occlusion abrégée
fermé fermé
durée
occlusion
d’occlusion
n
durée
c. Spirantisation
fermé
Figure 12 : Trois courbes correspondant aux gestes de (a) occlusive géminée, (b) amplitude réduite et occlusion
abrégée et (c) spirantisation. (Adapté de Kirchner, 2000).
fermé fermé
durée de
l’occlusion friction
durée durée
Figure 13 : Le processus de lénition modifie la courbe d’une occlusive géminée (a) à une fricative géminée (b).
(Adapté de Kirchner, 2000).
Kirchner (2000) montre que la lénition n’est pas une simple réduction du geste.
Néanmoins, le processus de lénition peut impliquer des modifications du geste original à
cause d’une simple réduction. Comme l’a observé Romero (1995) d’après des données
101
articulatoires électromagnétiques sur la lénition de l’espagnol d’Andalousie, la réduction du
degré de constriction est accompagnée de modification du lieu de la constriction. Les labiales
réduites tendent à devenir plus rétractées et les dentales réduites tendent à devenir plus
postérieures que les occlusives correspondantes.
- La présence ou non d’un geste. Par exemple, dans « doigt » et « oie », le premier de
ces mots commence par un geste d’occlusion alvéolaire, inexistant dans le second.
Fougeron (2005) montre ainsi comment ces trois types d’opposition permettent à elles
seules de rendre compte, non seulement des oppositions distinctives qui existent au sein d’une
même langue, mais aussi de rendre compte des différences entre systèmes phonologiques de
langues différentes. Il en va de même des différences rythmiques entre les langues qui
peuvent aussi s’expliquer par des différences de coordination temporelle.
102
La Phonologie Articulatoire présente l’avantage d’une organisation directe entre phonologie
et phonétique. En se servant d’une seule unité qui sert à la fois de primitive phonologique et
d’unité d’action motrice dans la production de la parole, « le Geste articulatoire », ce modèle
parvient à établir un lien tangible entre le niveau phonologique et le niveau phonétique
puisque ce sont les mêmes unités qui servent à la fois de représentation abstraite (et qui
permettent donc le contraste entre différentes unités lexicales) et d’unité d’action dans la
réalisation concrète de l’énoncé. Un Geste articulatoire est donc caractérisé en tout premier
lieu par des informations sur la façon dont est réalisée cette constriction et notamment sur les
différents articulateurs.
Signalons, à titre d’exemple, que Kirchner (2000) s’est fondé sur le modèle de la
phonologie articulatoire pour tenter de rationaliser l’inaltérabilité des géminées et la lenition.
En prenant en compte deux paramètres, la position et le temps, il a réalisé les courbes
correspondant au geste de l’occlusive géminée. En réduisant l’amplitude du geste sans
modifier la courbe, il obtient une réduction de la durée de l’occlusion. Si l’on réduit encore
plus l’amplitude du geste, le résultat est que l’occlusive devient spirantisée.
Ce cadre conceptuel représente la toile de fond pour nos études (menées au sein de
l’Equipe de Recherche « Parole et Cognition » de l’Equipe d’Accueil Linguistique, Langues
et Parole de Strasbourg) sur l’apparition des structures articulatoires dans le conduit vocal,
103
puis acoustiques à la sortie de ce conduit ; des structures motrices et sensorielles que nous
tâchons d’identifier, de quantifier et de rationaliser dans le cadre de cette théorie, entre autres
Sock & Vaxelaire (2001).
Nous savons que les individus et les systèmes linguistiques présentent de la variabilité
(individuelle, sociolectale, régionale…) et que l'émergence de catégories phonétiques
acceptables n'est que la satisfaction de deux contraintes linguistiques élémentaires, à savoir
l'opposition des classes et le maintien de ces oppositions.
Vaxelaire (2007) montre dans ses travaux que le comportement des catégories
phonétiques, accompagnant l'augmentation de la vitesse d'élocution, ne suit pas une trajectoire
unique et optimale pour le maintien des oppositions linguistiques. Différentes organisations
spatio-temporelles peuvent être empruntées, et elles sont plus ou moins variables selon les
locuteurs, les contextes segmentaux et suprasegmentaux, les langues, etc. Dans cette
perspective, il devient donc plus adéquat de parler de solutions sous-optimales dans le
maintien des oppositions phonologiques ou linguistiques que de stratégies distinctives
optimales, vu la grande variabilité des structures articulatori-acoustiques possibles. Malgré
cette variabilité intra-classe parfois remarquable, la séparation entre les catégories
phonétiques ou phonologiques reste suffisamment distincte, assurant ainsi une solution qui se
104
situe au-dessus d'un seuil critique. Ainsi, le système linguistique fonctionnerait sous forme
d'un large filtre, n'acceptant que les trajectoires et les formes qui assurent une distinction entre
les catégories de manière plus ou moins robuste (Sock, 1998).
Il s'agit, en d'autres termes, de ne plus chercher à tout prix à discerner les structures
articulatori-acoustiques optimales pour, par exemples, nos oppositions simples vs. géminées
pour expliquer le fonctionnement d'un système, même s’il est aussi performant que celui du
système phonologique. Nous obtenons des résultats intéressants en tâchant, « tout
simplement », de mettre au jour ces organisations articulatoires spatio-temporelles du conduit
vocal et du signal acoustique qui sont possibles, puisque aboutissant à des résultats perceptifs
acceptables, donc viables.
106
5.5 Notions et outils pour l’analyse de la gémination
5.5.1 Généralités sur la vitesse d’élocution
La vitesse d’élocution est une variable naturelle mais complexe en production de la
parole. Habituellement, on distingue la vitesse d’élocution (speech rate) de la vitesse
d’articulation (articulation rate).
C’est la vitesse d’élocution qui nous intéresse particulièrement ici, puisque nous
l’utilisons comme perturbateur du système linguistique. Nous y reviendrons (cf. infra).
Selon certaines données attestées dans la littérature (par ex. Grosjean & Deschamps,
1975), il semble qu’un changement de vitesse d’élocution se résumerait à une réorganisation
temporelle des pauses, alors que la vitesse d’articulation resterait relativement stable et
constituerait une donnée constante et spécifique à chaque locuteur. Signalons, toutefois, que
d’autres résultats indiquent une réorganisation temporelle de l’énoncé et non seulement de la
durée des pauses (Vaxelaire, 1993 ; Sock & Vaxelaire, 2001).
La littérature sur la vitesse d’élocution est très vaste, et il ne s’agit pas ici d’en faire un
état de la question. Nous nous contenterons, dans ce qui suit, de simplement justifier notre
choix de ce paradigme.
- les aspects temporels et spatiaux des gestes et des sons relevant de la nature
intrinsèque des catégories simples et géminées ;
- les aspects des gestes liés aux contraintes bio-mécaniques du système de production
(propriétés physiologiques des articulateurs, propriétés aérodynamiques, etc.).
108
réorganisation des configurations du conduit vocal, accompagnée d’un réajustement du timing
acoustique. Dans de tels cas, on constate ainsi l'émergence de nouvelles stratégies face à la
perturbation induite par l’augmentation de la vitesse d’élocution.
Figure 14 : A gauche, un exemple théorique de la compression d’un segment acoustique ou articulatoire avec
l’augmentation de la vitesse d’élocution. A droite, une visualisation de la simplification hypothétique du profil
de vitesse associé à un geste critique
Soulignons encore une fois que si ces changements structurels peuvent intervenir sans
que l'organisation globale du système soit modifiée, c'est grâce, largement, à la plasticité du
système de production-perception de la parole et à sa tendance à l'équilibre, c’est-à-dire grâce
à la propriété à maintenir relativement stable la dynamique de ses états internes, ainsi que la
cohérence globale de son organisation.
109
La variation de la vitesse d’élocution est retenue comme moyen naturel de perturbation
du système de production de la parole. Elle devrait nous permettre de repérer ces patrons
spatio-temporels résistants et linguistiquement pertinents des gestes des articulateurs, lors de
la réalisation d’une tâche linguistique. Elle devrait aussi offrir la possibilité d’évaluer le degré
de flexibilité du système de production de la parole, en dévoilant les réaménagements ou les
réajustements possibles aux niveaux intra-articulateur et inter-articulateur. Cela reviendra à
analyser les différentes stratégies cognitivo-motrices utilisées par les sujets parlants pour
maintenir la distinctivité phonétique des catégories phonologiques dans des conditions
difficiles, en mettant en jeu divers phénomènes de compensation (Sock & Vaxelaire, 2004 ;
Vaxelaire, 2006).
Pour Cho & Ladefoged (1999), le VOT serait un trait phonologique définissable en
termes de différence de durée entre l’initiation du geste articulatoire, responsable du
relâchement de la closion, et l’initiation du geste laryngé responsable de la vibration des
cordes vocales.
Le VOT a donné lieu à un grand nombre d’études ayant montré que ce paramètre varie
en fonction du lieu d’articulation. En effet, il a été observé, entre autres, que :
110
1. Plus l’occlusion a lieu à l’arrière de la cavité buccale, plus le VOT est long (Fischer-
Jørgensen, 1954 ; Peterson & Lehiste, 1960).
Hardcastle (1973) et Maddieson (1997) ont suggéré que l’un des facteurs qui
contribuent à ce qu’il y ait des différences de durée pour les VOT est la taille de la
cavité supraglottique, et plus exactement au lieu de la constriction ou de l’occlusion.
Ainsi, lorsqu’une occlusion a lieu, elle subdivise la cavité buccale en deux parties.
Partant de ce fait, il est possible de faire deux observations :
La première est que la cavité derrière une occlusion vélaire a un volume plus petit
que lorsqu’il s’agit d’une occlusion alvéolaire ou bilabiale.
2. Plus l’aire de contact est étendue, plus le VOT est élevé ( Stevens et al., 1986).
Pour expliquer cela, Stevens (2000) suggère que la pression intra-orale après le
relâchement change à une vitesse qui dépend de l’augmentation de l’aire à la
constriction.
Étant donné qu’une occlusive vélaire a une étendu de contact entre le dos de la langue
et le voile du palais plus large, le changement de la pression d’air sera relativement
plus lent que pour une bilabiale ou une alvéolaire, suite à un effet de Bernouilli. Par
conséquent, la diminution de la pression intraorale, après la fermeture, est moins
rapide pour les vélaires que pour les bilabiales. À noter que les données
aérodynamiques de Stevens (2000) montrent que la vélocité du flux d’air à la
constriction et au niveau de la glotte augmente proportionnellement avec le niveau de
diminution de la pression intra-orale, durant les 50 ms suivant le relâchement de
l’occlusion.
Ainsi, le timing pour la vibration des cordes vocales serait déterminé par deux facteurs
aérodynamiques qui sont en corrélation :
3. Plus les mouvements des articulateurs sont rapides, plus le VOT est court (Hardcastle,
1973).
111
Hardcastle (1973) émet l’hypothèse que les différences en matière de début de
voisement peuvent être dues, en partie, au fait que l’apex et les lèvres se déplacent
plus rapidement que le dos de la langue. Quelques investigations, dont l’étude
cinéradiographique de Kuehn & Moll (1976) pour des séquences VC et CV, ont
permis de montrer que les mouvements articulatoires étaient plus rapides pour la
pointe de la langue, plus lents pour le corps de la langue, les mouvements labiaux se
déroulant à une vitesse qualifiée d’intermédiaire. À noter que cela semble s’expliquer
par la masse des articulateurs impliqués, étant donné que l’apex est plus petit et plus
léger que les lèvres ou le corps de la langue, il a donc une célérité plus grande
(Lenneberg, 1967).
Pour compléter ces propos, il faut savoir que la mâchoire tient un rôle non
négligeable dans la vitesse de mouvement de certains articulateurs tels que la lèvre
inférieure et que son influence est moins importante pour d’autres. Ainsi, si la vitesse
de mouvements du dos de la langue est moins affectée par les mouvements de la
mâchoire, ceux de la lèvre inférieure sont accélérés par la mandibule lorsque celle-ci
se déplace.
Le VTT ou délai d’arrêt du voisement : « Voice Termination Time » est une dimension
acoustique de transition entre événements vocaliques et événements consonantiques. Il est
défini par la durée comprise entre le début de la tenue et la fin de la dernière période de
voisement.
112
Agnello (1975) est le premier à avoir utilisé le VTT en le définissant comme l’intervalle
allant de la dernière impulsion glottique jusqu’à la pression intra orale maximale ou la closion
articulatoire. Par la suite, Sock (1983) et Abry et al. (1985) ont repris cette mesure en la
définissant comme le temps que mettent les cordes vocales pour s’arrêter de vibrer (VT) après
la disparition de la structure formantique clairement définie provoquée par une closion ou une
constriction consonantique dans le conduit vocal.
D’après certaines études, le VTT varierait selon le lieu d’articulation. Suomi (1980), par
exemple, a étudié le VTT en anglais et trouve que le lieu d’articulation a un effet sur la fin du
voisement. Ainsi, les plus grandes durées de voisement sont constatées lorsque le lieu
d’articulation recule. Cela s’explique par le fait que si le voisement est considéré comme le
résultat d’un équilibre de pression transglottique, il finit plus rapidement si l’occlusion orale
se fait vers l’arrière de la cavité orale que vers les lèvres. L’auteur suggère donc que la fin du
voisement est une indication du début du geste d’abduction glottique. Parallèlement, Keating
(1984) a observé que les intervalles de voisement les plus longs, pendant la phase médiane
des consonnes sourdes, sont liés à l’antériorité du lieu d’articulation. Pour Keating (1984), ce
phénomène est dû aux différences de l’aire du conduit situé derrière le lieu d’articulation, et à
l’effet produit sur la vibration des cordes vocales. Autrement dit, plus l’aire est importante,
plus le voisement peut être maintenu longtemps.
Nous pensons que le VTT des simples devrait être plus long que celui des géminées,
étant donné que plus la tenue consonantique est brève, plus la proportion du délai d’arrêt du
voisement dans cette tenue sera élevée.
Nous reviendrons plus longuement sur les critères retenus pour mesurer ces intervalles,
avec des exemples graphiques en plus, dans le Chapitre 8.
113
A cause de l’élasticité des mots ou des énoncés produits (Gaitenby, 1965), les segments
phonétiques constitutifs de ces mots ou de ces énoncés peuvent subir des expansions ou des
compressions selon que la vitesse d’élocution est en ralentie ou en accélérée.
La variation de la vitesse d’élocution est retenue comme moyen naturel de perturbation du
système de production de la parole en relation avec la résistivité de l’organisation spatio-
temporelle des gestes et des sons du conduit vocal (Vaxelaire, 2006). La variation de la
vitesse d’élocution est centrale dans l’analyse des données de cette étude. C’est ainsi qu’il
devrait nous être possible de mettre au jour les éventuelles stratégies de compensation
motrice, souvent révélatrices du degré de flexibilité des structures articulatoires impliquées
dans la production d’une tâche phonétique ou phonologique déterminée.
Ce point sera revu en détail dans le Chapitre 8.
La plupart des recherches considèrent le VOT comme l’intervalle allant du relâchement du
geste articulatoire de l’occlusive au commencement de la vibration des cordes vocales de la
voyelle qui suit. Le VTT consiste à l’intervalle allant de la dernière impulsion glottique
jusqu’à la pression intra orale maximale ou la closion articulatoire (Agnello, 1975). Cette
étude se focalisera sur ces deux paramètres temporels afin de comparer les consonnes
simples aux géminées dans nos analyses acoustiques.
Muni de ces notions, concepts et outils, nous pouvons maintenant aborder notre investigation
sur les géminées du tarifit, en commençant par une présentation de la procédure
expérimentale.
114
PARTIE 2
Procédure expérimentale et
Etude des paramètres temporels
115
Notre analyse du signal acoustique repose sur une approche articulatori-acoustique.
Celle-ci nous permettra de déceler, sur le signal de parole, des événements acoustiques
interprétables en termes articulatoires (Abry et al., 1985). A partir de cette approche
événementielle, nous tâcherons de déterminer des intervalles spécifiques, révélateurs de
l’organisation temporelle ou timing du signal de parole, et pouvant nous permettre de
retrouver dans ce substrat physique des indices qui pourraient sous-tendre l’opposition
phonologique de la gémination.
6 Etude acoustique
L’étude menée dans ce chapitre a pour but de dégager les paramètres acoustiques qui
permettent de distinguer les consonnes simples des géminées. Nous avons enregistré six
locuteurs parlant en tarifit. Chaque locuteur a prononcé, dans un ordre aléatoire, un corpus de
27 paires minimales transcrites phonétiquement. Chacun a répété dix fois le corpus en vitesse
d’élocution normale et dix fois en vitesse d’élocution rapide. Les mots ont été insérés dans
une phrase porteuse : “Ini i umar” qui signifie “dis une fois”, cela pour contrôler, autant
que possible, le contexte segmental et prosodique et donner un certain sens aux phrases.
6.1 Corpus
Le corpus comporte cinq paires d’occlusives : trois sourdes /t/~ /tt/, /k/~ /kk/, /q/~/qq/
et deux sonores /d/~ /dd/, /g/~ /gg/. Il comporte également quatre paires de constrictives :
deux sourdes /s/~ /ss/, //~ //, et deux sonores /z/~ /zz/, //~ //. Ces paires ont été
introduites en trois positions : initiale (non absolue), intervocalique, et finale (non absolue).
Les tableaux ci-dessous contiennent la liste complète des mots prononcés par les sujets
ayant participé à cette expérience. Les tableaux sont classés selon le mode d’articulation des
consonnes, réparties dans les trois contextes opposant les consonnes simples aux consonnes
géminées. Les non-mots, précédés du symbole [*---], servent à remplacer l’un ou les deux
termes d’une paire minimale.
116
Tableau 6 : Les occlusives sourdes
117
Tableau 9 : Les constrictives sonores
6.3 Enregistrements
Les enregistrements ont été effectués à l’Institut de Phonétique de Strasbourg dans la
chambre sourde pour deux locuteurs (F et Kh), et au Maroc pour les quatre autres locuteurs
(K, Y, H et S) dans des endroits silencieux.
Ces enregistrements ont été réalisés à l’aide d’un enregistreur numérique portable
(Marantz Professional, model PMD 661) et d’un microphone directif (Sennheiser e835s).
b) La durée du VTT,
c) La durée de l’occlusion,
d) La durée du VOT,
e) La durée de la friction,
118
En ce qui concerne les occlusives sourdes, nous avons mesuré :
En position finale (non absolue) VC#V : les paramètres intersegmentaux, à savoir la durée de
la voyelle précédente et la durée des occlusives sourdes simples et géminées. Nous avons
mesuré également les paramètres intrasegmentaux, en l’occurrence la durée du VTT, du
silence acoustique et du VOT de la consonne simple et son homologue géminée.
119
tenue consonantique
occlusion VOT
En positon initiale (non absolue) V#CV : les paramètres intersegmentaux, soit la durée
des occlusives sonores simples et géminées, et de la voyelle suivante, les paramètres
intersegmentaux, à savoir la durée de l’occlusion et du VOT de la consonne simple et de son
homologue géminée.
tenue consonantique
120
En position finale C#V : les paramètres intersegmentaux, c’est-à-dire la durée de la voyelle
précédente et la durée des occlusives sonores simples et géminées.
Nous donnons, ci-dessous, les critères que nous avons retenus pour définir ces intervalles :
a. La durée de la voyelle a été définie comme l’intervalle temporel entre le début et la fin
de la structure formantique stable de la voyelle qui précède ou qui suit les segments
simples et géminés. Cet intervalle n’a été mesuré que pour les positions
intervocaliques et finales.
b. La durée du VTT (Voice Termination Time) correspond au délai d’arrêt du voisement
ou à la période de transition menant à la fermeture complète du canal buccal. C’est
donc l’intervalle qui va de la disparition de la structure formantique stable de la
voyelle au dernier signe de périodicité dans la consonne. Le VTT a été mesuré dans
les trois positions (initiale non absolue, intervocalique et finale non absolue).
c. La durée de l’occlusion a été définie comme l’intervalle temporel entre la fin du VTT
et le début du relâchement. Elle a été mesurée en position initiale non absolue, suivie
par la frontière de la voyelle précédente, en position intervocalique et finale. Le début
de l’occlusion a été déterminé par l’offset du F2 de la voyelle précédente. (à revoir
ensemble)
d. Le VOT a été déterminé comme l’intervalle temporel entre le début du burst et
l’apparition de la structure formantiquement stable de la voyelle qui suit. Ce paramètre
n’a été retenu que pour les positions initiales non absolues et les positions
intervocaliques.
e. La durée de la constrictive a été définie comme l’intervalle temporel entre le début et
la fin de la friction. La fin de la constrictive a été déterminée par l’onset du F2 de la
voyelle qui suit. En l’absence de cette voyelle, comme c’est le cas pour la position
finale, nous avons déterminé la fin de la fricative au moment où le bruit de friction
cesse complètement.
121
géminées aux deux vitesses d’élocution. Nous donnons la variance avec les facteurs f et df,
ainsi que la significativité de la différence des données comparées avec la valeur de p. Nous
avons également analysé l’interaction entre la gémination et la vitesse d’élocution. Pour cela,
une analyse ANOVA à deux facteurs a été conduite en considérant la moyenne des 10
répétitions de chaque locuteur comme une répétition non appariée et comme deux facteurs
analysés, la gémination et la vitesse d’élocution. Pour les analyses ANOVA, nous donnons les
données de variance avec le ratio F correspondant à la variabilité entre les locuteurs et la
valeur de p. En complément, des ANOVA à deux facteurs, nous avons également effectué des
T-test entre la durée des consonnes simple en vitesse d’élocution normale et les consonnes
géminées en vitesse d’élocution rapide. Seuls les résultats avec une probabilité de moins de
cinq pour cent (p<0.05) sont considérés comme significatifs.
Nous avons pu définir les paramètres acoustiques qui permettraient de distinguer les
consonnes simples des géminées. Nous avons enregistré six locuteurs. Chaque locuteur a
prononcé, dans un ordre aléatoire, un corpus de 27 paires minimales, répété dix fois, d’abord
en vitesse d’élocution normale, puis en vitesse d’élocution rapide. Le corpus comporte cinq
paires d’occlusives : trois sourdes et deux sonores. Il comporte également quatre paires de
constrictives : deux sourdes et deux sonores. Ces paires ont été introduites en trois positions
de mot : initiale (non absolue), intervocalique, et finale (non absolue).Les sujets sont deux
locutrices agées de 25 et 26 ans et quatre locuteurs agés de 27 et 35 ans, au moment de
l’enregistrement. Les enregistrements ont été effectués à l’Institut de Phonétique de
Strasbourg dans la chambre sourde, pour deux locuteurs (F et Kh), et au Maroc pour les
quatre autres locuteurs (K, Y, H et S) dans des endroits silencieux. Nous avons segmenté le
signal acoustique et mesuré les paramètres (intersegmentaux et intrasegmentaux) suivants : a)
la durée de la voyelle précédant la consonne cible, simple ou géminée ; b) la durée du VTT ;
c) la durée de l’occlusion ou du silence acoustique ; d) la durée du VOT ; e) la durée de la
friction ; f) la durée de la voyelle qui suit la consonne cible. Toutes les mesures ont été
soumises à des analyses statistiques.
Présentons maintenant la technique qui avait été retenue jadis pour l’acquisition des données
cinéradiographiques, extraites de la base de données de l’Institut de Phonétique de
Strasbourg.
122
7 La radiocinématographie, acquisition et traitements des radiofilms
Un aperçu historique6
C’est Roentgen qui a découvert les rayons X en 1895, ce qui a contribué à une avancée
considérable pour l’étude des gestes des articulateurs, et notamment ceux situés à l’intérieur
du conduit vocal. En effet, les rayons X ont pour propriété essentielle de traverser la matière
et de déterminer des zones plus ou moins foncées selon la plus ou moins grande opacité des
tissus traversés. En remontant jusqu’à 1916, on constate que Pacocelli-Calzia (1918) et
Navarro-Tomás (1950) avaient décidé d'utiliser les rayons X pour des études phonétiques et
de fixer sur des plaques photographiques les positions des articulateurs, vues de profil, de la
mâchoire aux fosses nasales et au larynx. Cependant, le premier avait donné l’impulsion
décisive aux travaux réalisés dans le domaine de la phonétique Chlumsky (1913), et cela au
sein de l'École de Prague. Ses travaux furent relayés par la suite par ceux de Hala & Polland
(1926), suivis ensuite par de nombreux travaux entrepris aussi bien en Allemagne, en
Angleterre, en Finlande, en France et aux États-Unis (pour une revue historique détaillée, voir
Simon (1967) et Simon et al. (2010) pour les travaux réalisés spécifiquement à l’Institut de
Phonétique de Strasbourg).
Un intérêt particulier est porté aux relations entre articulation et acoustique à partir du
Congrès de Phonétique d'Helsinki (1961) ; la radiocinématographie apporte une contribution
décisive au développement de théories sur la production de la parole, et aux premiers essais
de synthèse de type articulatoire (Fant, 1960 ; Mermelstein, 1973).
6
Cette section doit beaucoup aux travaux de Péla Simon (1967), ainsi qu’à nos échanges avec Vaxelaire (2007) et Vaxelaire
et al. (2009).
123
Questions de méthodologie
124
Figure 18 : Schéma de la salle de radiologie lors de l’acquisition des films cinéradiographiques (d’après
Vaxelaire, 2007).
125
d'un écran de scopie ordinaire. Cette augmentation de luminosité permet de diminuer
considérablement la dose de rayons X tolérables par le sujet.
Certains tissus, tels que les lèvres par exemple, ne sont pas visibles lorsque la
propagation des rayons X est à son maximum. D’où la présence d’un cache en plomb, placé
entre le locuteur et le générateur de rayons X qui a pour but d’atténuer la densité des rayons,
cela pour mieux discerner le contour de certains articulateurs.
Par ailleurs, une petite tige en plomb est également placée dans le champ, de façon à
ce qu’elle soit visible, mais qu’elle n’entre pas en contact avec les articulateurs qui seront
étudiés. Cette tige est reliée à un interrupteur qui est placé dans la cabine de radiologie. Au
début de chaque séquence, une impulsion est donnée sur l’interrupteur, impulsion qui fait
descendre la tige à l’aide d’un aimant. Une fois que la barrette arrive à son niveau le plus bas,
son contact avec l’aimant provoque un signal sonore qui est amplifié et qui permet une post-
synchronisation des images avec le son, comme nous le verrons plus bas.
126
Figure 20 : Installation de cinéradiographie et exemples d'images extraites de radiofilms (Vaxelaire et al., 2009).
Enfin, il est utile de signaler qu'une fois l’enregistrement terminé, une grille de
calibrage est positionnée à l’emplacement exact de la tête du locuteur.
Etant donné que le son a parfois pu être enregistré directement sur un support
numérique, comme ce fut le cas pour nos investigations, la méthode de synchronisation était
relativement simple. En effet, la correspondance entre les données visuelles et sonores
s’obtient alors en faisant correspondre le « top » provoqué par la tige en plomb, avec
l’emplacement de cette barrette sur les images (Connan et al., 2003). En d’autres termes, cette
technique consiste à faire coïncider le début du bruit de la tige sur le signal acoustique avec la
première image où cette même tige est à sa position la plus basse (voir Figure 21). Précisons
que pour réaliser cette opération, le « top » provoqué par la tige était enregistré, tout comme
l’audio, sur un canal de l’enregistreur digital.
Figure 21 : La tige réalise un mouvement vers le bas et provoque au contact de l'aimant un bruit que l’on
retrouve sur le signal acoustique.
127
L'analyse des données pose en particulier des difficultés spécifiques, liées à
l’extraction des contours des articulateurs à partir de trames individuelles des films
radiologiques, à la correction des mesures à partir des grilles de calibration, et au choix des
mesures les plus pertinentes.
Les radiofilms fournissent une information dans le plan sagittal de la position et des
déplacements d'un certain nombre d'articulateurs tels que les lèvres, la mâchoire, la langue, le
voile du palais, le pharynx, l'os hyoïde et le larynx.
Figure 22 : Illustration de la coordination motrice entre plusieurs articulateurs dans une séquence [iky] (in
Vaxelaire et al., 2009).
128
Figure 23 : Exemple d’un plan de travail avec projecteur utilisé pour le traçage manuel des radiogrammes (à
gauche), et un exemple d’une grille de référence projetée sur le plan de travail (à droite). (in Vaxelaire et al.,
2009).
L'extraction des contours et la mesure de la position de la langue ne sont pas une tâche
aisée, dans la mesure où le contraste entre les tissus est relativement faible, et qu'il est souvent
nécessaire, même pour un expert phonéticien, de revoir plusieurs fois les séquences de parole
filmées et analysées avant de pouvoir déterminer la limite des contours de la langue. Il est
parfois utile de revenir sur des images et de visualiser celles qui sont à venir pour délimiter,
avec le plus de précision possible, la position de la langue sur l’image étudiée. En outre,
l’expert phonéticien doit parfois choisir entre plusieurs contours de la langue. En effet,
certaines images présentent parfois un contour sur le plan médian de la langue ainsi que sur
ses côtés, ce qui donne lieu à deux, voire trois, contours de la langue. Généralement, c’est le
contour correspondant au plan médio-sagittal de la langue qui est privilégié (voir Figure 24),
malgré le fait que les deux côtés de la langue sont susceptibles d’avoir un impact phonétique.
De ce fait, la réalisation de tracés des images individuelles des radiofilms est une tâche
particulièrement fastidieuse qui peut limiter l'ampleur des études.
Il existe plusieurs méthodes de calcul pour mesurer les déplacements des différents
organes articulatoires et les modifications de la forme des résonateurs. Une première méthode,
à base de références angulaires (coordonnées semi-polaires), est utilisée dans le dépouillement
de données nombreuses relevées sur des sujets différents. Elle a, si l'on peut dire, l'avantage
de procéder de manière « aveugle » et de ne reposer sur aucun pré-requis de connaissances
phonétiques. Cette approche peut être utile pour des études sur les relations entre l'articulation
et l'acoustique, et pour le développement de modèles articulatoires de production de la parole.
Le modèle de Maeda (1990) a, par exemple, obtenu des résultats très intéressants à partir de
cette méthode.
Mais revenons sur la grille de mesures évoquées plus haut, ainsi que sur la méthode
utilisée pour la prise de mesures manuelle. Etant donné que les configurations du tractus vocal
sont différentes pour chaque locuteur, il est nécessaire de réaliser une grille pour chaque sujet.
La grille de mesure fonctionne par rapport à un repère orthonormé (Figure 26) qui est tracé au
préalable sur du papier calque millimétré. L’utilisation d’un repère orthonormé présente
l’avantage d’être un moyen efficace pour mesurer les distances dans le tractus vocal : il
permet en effet d’observer les déplacements maximaux : la projection des lèvres, le
déplacement de la langue, de la mandibule…
Une fois le repère orthonormé tracé et avant de prendre des mesures, il convient de
choisir une image de référence que l’on préférera neutre, nette et sûre du point de vue des
contours. L’image de référence peut, par exemple, être une position de repos où les lèvres ne
sont pas projetées, la langue n’est pas en mouvement et le velum est abaissé, ce qui laisse
131
libre le passage de l’air vers les fosses nasales. La méthode consiste ensuite à reproduire sur le
calque millimétré, où le repère orthonormé a été tracé auparavant, l’incisive supérieure et le
palais dur. Rappelons qu’il s’agit des seuls éléments fixes du tractus vocal, en faisant ainsi des
points de références particulièrement fiables. La pointe de l’incisive est placée de telle façon
qu’elle soit à 5 cm du point 0. L’oblique ainsi obtenue doit sectionner l’angle droit du repère
orthonormé en deux parties égales. Cette partie décalquée sera ensuite à superposer sur
chaque croquis le plus finement possible. Le repère orthonormé permet de mesurer la
courbure de la langue et d’indiquer son déplacement dans la cavité buccale.
Revenons maintenant, dans les détails, sur les démarches que nous avons suivies pour
la prise de nos mesures, faite de manière automatique ou semi-automatique (Busset, 2013)
L’image du locuteur dans la Figure 27 correspond à une vue sagittale qui montre,
outre les différents articulateurs, les structures osseuses de la tête.
Voile du palais
Langue
Lèvres
Pharynx
Epiglott
Mandibule
e
Os hyoïde
Larynx
132
L’algorithme de suivi démarre par le choix d’une image de référence. Sur cette image,
une région associée à la mâchoire doit être déterminée de façon à ce qu’elle apparaisse sur
toutes les autres images de manière précise. La région choisie ne doit pas chevaucher le filtre,
visible dans le coin, en bas à droite de l’image, et il est préférable aussi que son intersection
avec la langue soit limitée au minimum. Cette région retenue pour le suivi est représentée
dans la Figure 28.
Rotation
Translation
Figure 28 : L’image de référence de la mâchoire qui apparait sur toutes les autres images
La position des incisives inférieures est définie par un point dans le plan sagittal ; ce
point se situe sur la partie supérieure des incisives inférieures. Le plancher de la bouche est
représenté par un contour tracé manuellement. La position des incisives inférieures et le
plancher de la bouche sont définis sur l’image de référence utilisée pour initialiser le suivi de
la mâchoire. Leur position est obtenue en appliquant le mouvement obtenu pour la région de
la mâchoire (voir Figure 28).
L’algorithme de suivi par corrélation peut être utilisé pour toutes les structures rigides
qui ne sont pas entièrement recouvertes par d’autres organes. En effet la corrélation n’est plus
pertinente lorsque deux organes indéformables se recouvrent trop. Ainsi dans la quasi-totalité
des films disponibles il est possible de suivre la position de l’os hyoïde par corrélation parce
133
que l’os hyoïde n’est pas caché par d’autres structures osseuses. Ce n’est hélas pas le cas pour
le locuteur F pour lequel l’os hyoïde remonte beaucoup et est partiellement caché par la
mandibule (voir Figure 29), ce qui fait échouer le suivi par corrélation. Nous avons utilisé les
outils de déplacement manuel des contours offerts par X-Articulator pour corriger les
positions incorrectes. Plus généralement, X-Articulator est conçu de manière à pouvoir éditer
manuellement les résultats des suivis automatiques ou semi-automatiques. Il est ainsi possible
de corriger point par point tous les contours, ou de leur appliquer des rotations et des
translations de manière à les positionner au mieux.
Le suivi est aussi utilisé pour connaître le mouvement de la tête. En effet, malgré le
fait que la tête du locuteur soit maintenue à l’aide d’un serre-tête, on peut tout de même
constater de légers mouvements de la tête. Comme pour la mâchoire, on définit une région
dans la partie supérieure de la tête, puis son mouvement (une rotation et une translation) est
calculé pour les autres images.
Etant donné que les lèvres se déplacent en se déformant très légèrement dans le temps,
il n’est pas possible de suivre leur mouvement automatiquement par corrélation, à l’aide une
image de référence. Les contours des lèvres sont visibles et ne sont pas recouverts par d’autres
organes. En outre, en observant visuellement les images, on constate que de nombreuses
formes labiales sont semblables. En conséquence, le tracé des lèvres sur toutes les images
serait inutile étant donné la forte ressemblance entre les formes. C’est donc le suivi semi-
automatique proposé par Fontecave & Berthommier (2006) qui est retenu. Il s’agit, en
134
substance, de tracer les contours sur un nombre réduit d’images clés, puis de calculer les
contours sur les autres images à parti de ces images clés.
Pour détourer les contours d’une image inconnue, on calcule la distance DCT
(Discrete Cosine Transform ou Transformée en Cosinus Discrète en français) avec les images
clés. On retient les trois images clés les plus proches de l’image à traiter, et le contour résultat
est obtenu en pondérant les contours tracés sur les images clé par leur distance (à l’image à
traiter). Cet algorithme de suivi opère donc par indexation de l’image inconnue dans la base
des images clé. Le suivi marche d’autant mieux que le nombre d’images clés est grand et que
les images clés reflètent bien la variabilité des images à traiter. Quand le suivi échoue sur une
image, ses contours sont corrigés et elle est ajoutée aux images clés. Les performances du
suivi s’améliorent donc itérativement
Pour que la distance DCT soit pertinente, il faut que la région sur laquelle elle
s’applique ne concerne que le contour que l’on veut suivre. Pour cette raison, on délimite
préalablement la région qui contient le contour à suivre dans toutes les images. Cette région
n’est pas forcément rectangulaire de manière à ne considérer que le contour à suivre. De
manière à automatiser ce processus, la région d’intérêt est positionnée automatiquement par
rapport à la région indéformable, en l’occurrence la partie basse des os du crâne, qui a été
repérée pour toutes les images de la séquence.
L’épiglotte et le larynx possèdent les mêmes caractéristiques que les lèvres, c’est-à-
dire qu’ils se déforment légèrement, possèdent un contour visible et ne sont pas recouverts par
d’autres organes.
Figure 30 : Image cinéradiographique présentant les contours utilisés pour l’épiglotte et le larynx.
135
C’est par conséquent le même algorithme de suivi que celui pour les lèvres qui est
utilisé. La Figure 31 (épiglotte) montre les contours des régions utilisées pour le suivi de
l’épiglotte, de la paroi fixe du pharynx et du larynx. La région utilisée pour l’épiglotte est
hachurée en rouge. Elle a été choisie de manière à contenir le contour de l’épiglotte dans
toutes les images tout en conservant une taille minimale pour limiter l’influence des autres
structures déformables ou rigides. Les deux autres régions utilisées respectivement pour la
paroi du pharynx et le larynx ont été choisies de la même manière.
Le dernier articulateur étudié est la langue. La langue est l’articulateur le plus difficile
à suivre automatiquement. Plusieurs études sur le suivi automatique de la langue ont montré
que cette tâche n’est pas aisée (Berger et al., 1995 ; Thimm & Luettin, 1999 ; Fontecave &
Berthommier, 2006).
Tout d’abord, il faut rappeler que la forme de la langue peut conduire à plusieurs
contours dans le plan sagittal. En effet, la langue présente un sillon central, une vue sagittale
peut donc faire apparaître deux contours (voire trois si la langue n’est pas symétrique). De
plus, le contour peut être caché par d’autres organes comme les dents ou les os de la
mâchoire. C’est pourquoi les contours de la langue ont été tracés manuellement avec le
logiciel X-Articulator. Le contour de la langue tracé est celui correspondant au sillon central.
La région en haut de l’image qui correspond aux fosses nasales est utilisée pour recaler
les images entre elles en soustrayant le mouvement global de la tête à chacune des images de
136
la séquence. Les régions utilisées pour le suivi semi-automatique sont représentées en rouge.
Celle correspondant à l’épiglotte est hachurée en rouge pour mieux la mettre en évidence. La
position de chacune de ces régions est définie relativement à celle (située dans les fosses
nasales) utilisée pour le recalage des images entre elles. Les traits bleus représentent le lien
entre les régions. Un autre lien existe entre la région de recalage des fosses nasales et le palais
parce que la position relative du palais a été définie pour une image de référence de la
séquence. Une fois que la position de la région de recalage est déterminée à l’aide du suivi par
corrélation, éventuellement corrigée manuellement, la position du palais est aussitôt connue
parce que donnée par ce lien.
Figure 32 : Repère géométrique utilisé pour la mesure de la position des articulateurs ou de la constriction.
L’axe des abscisses est l’axe horizontal, les abscisses croissant de droite à gauche et
l’axe des ordonnées est l’axe vertical, les ordonnées croissant du bas vers le haut. Ce choix a
été dicté par des considérations de mise en œuvre informatique. On mesure ainsi la position
de l’os hyoïde donnée par le deuxième des trois points utilisés pour le représenter sur l’image,
la position de l’incisive inférieure et celle du centre du larynx. On mesure aussi l’ouverture
aux lèvres donnée par la différence des ordonnées du point le plus bas de la lèvre supérieure et
du point le plus haut de la lèvre inférieure. La protrusion des lèvres est donnée par l’abscisse
du point le plus en avant des lèvres inférieure et supérieure. Par ailleurs, l’angle de la
mandibule est calculé par rapport au palais.
137
La constriction est donnée par le point de la langue dont la distance au palais (mesurée
par projection orthogonale) est minimale. Cette distance donne l’ouverture de la constriction.
Pour repérer la position de la constriction, nous utilisons le contour du palais et nous
calculons la longueur du chemin entre l’incisive supérieure et le lieu de la constriction comme
l’indique la Figure 32. Nous avons fait ce choix plutôt que d’utiliser les coordonnées
cartésiennes du point de constriction parce que cela correspond mieux à la définition
traditionnelle des lieux d’articulation donnés relativement à la paroi fixe du conduit vocal.
Quand il y a contact entre la langue et le palais, c’est le point de la constriction le plus en
avant dans le conduit vocal qui est choisi. Par ailleurs nous avons cherché une solution pour
représenter la nature de la constriction, soit ponctuelle comme pour un /l/ par exemple, soit
sous forme de canal comme pour un // par exemple. Pour cela nous avons considéré trois
distances au palais plus grandes de 3, 5 ou 11 mm que la distance au palais mesurée à la
constriction appelées respectivement d1, d2, et d3. Pour chacune de ces valeurs de distance di
nous avons calculé l’étendue de la région du palais autour de la constriction pour laquelle la
distance à la langue est inférieure à di. Bien sûr par construction d1 < d2 < d3. Si la constriction
est ponctuelle (comme pour /l/) les trois valeurs sont assez proches l’une de l’autre. Au
contraire pour une constriction en forme de canal (comme pour //) d2 est nettement plus grand
que d1, et d3 plus grand que d2. Ces valeurs d’étendue peuvent donc être utilisées pour
caractériser la forme de la constriction.
Après avoir procédé au traitement des contours des articulateurs, et grâce au logiciel
X-articulator, on obtient les valeurs des paramètres mesurées comme dans le fichier suivant,
correspondant à une image :
Frame 4 F10046.grd
Hyoid position (wrt to upper incisor) in cm -4.61825 3.21958
Lower incisor (wrt to upper incisor) in cm -0.36946 -0.23751
Angle between mandible and palate (in degree) -15.3178
Larynx center (wrt to upper incisor) in cm -5.83147 6.01212
Lip aperture in cm 0.624071
Upper lip protrusion in cm (wrt to upper incisor) 1.2811
Lower lip protrusion in cm (wrt to upper incisor) 0.650751
Pharynx constriction in cm 1.85716
at (in cm wrt to upper incisor)-8.55036 0.44863
Constriction opening (cm) 0.31311
Distance from upper incisor (cm) 0.481834
138
Constriction < 0.51311 (cm) from 0.240816 cm to 1.67649(cm)
Constriction < 0.81311 (cm) from 0.240816 cm to 2.76019(cm)
Constriction < 1.11311 (cm) from 0.240816 cm to 6.49482(cm)
En ce qui concerne le phénomène de la gémination, nous avons retenu les paramètres
articulatoires suivants :
- L’ouverture de la constriction
- La constriction pharyngale
- L’aperture labiale
- La position du larynx
Pour ce qui concerne l’étendue de contact, nous renvoyons le lecteur au chapitre 11 pour les
explications relatives à la mesure de ce paramètre articulatoire.
La radiocinématographie a contribué à une avancée considérable pour l’étude des gestes des
articulateurs, et notamment ceux situés à l’intérieur du conduit vocal. Elle apporte une
contribution décisive au développement de théories sur la production de la parole, et aux
premiers essais de synthèse de type articulatoire. Les deux films (un par locuteur) que nous
avons extraits de la base de données de l’Institut de Phonétique de Strasbourg pour la
présente étude sont au format DICOM (25 Hz). Une postsynchronisation des images et du
son est nécessaire avant de pouvoir exploiter les données. Les radiofilms fournissent une
information dans le plan sagittal de la position et des déplacements d'un certain nombre
d'articulateurs tels que les lèvres, la mâchoire, la langue, le voile du palais, le pharynx, l'os
hyoïde et le larynx. Par rapport aux films de cette investigation, un logiciel X-Articulator
nous a permis d’obtenir le contour des différents articulateurs de manière automatique ou
semi-automatique. Pour notre étude sur la gémination, nous avons retenu les paramètres
articulatoires suivants : a) l’ouverture de la constriction ; b) La constriction pharyngale ; c)
l’aperture labiale ; d) la position du larynx ; e) la position de l’os hyoïde ; f) l’étendue de
contact.
Ces considérations clôturent cette partie sur les procédures expérimentales. Il convient
maintenant de passer à l’analyse de nos données, en commençant par celles relevant du
domaine acoustique.
139
8 Etude des paramètres temporels : durées absolues
Dans cette partie, nous allons analyser quelques paramètres temporels des occlusives
non voisées, des occlusives voisées, des constrictives non voisées et des constrictives voisées,
dans trois positions de mot : initiale non absolue, intervocalique et finale non absolue. Les
mesures de durées absolues ont été effectuées, d’une part au niveau intersegmental, à savoir la
durée de la tenue consonantique et la durée des voyelles adjacentes et, d’autre part, au niveau
intrasegmental, la durée du VTT, celle du silence acoustique et du VOT, pour les occlusives
sourdes. En ce qui concerne les occlusives sonores, outre les durées intersegmentales de la
tenue consonantique et des voyelles adjacentes, nous avons mesuré la durée de l’occlusion et
celle du VOT (Klatt, 1975).
L’objectif de cette expérience est de voir si les paramètres temporels mentionnés ci-
dessus jouent un rôle significatif, au niveau du timing, dans l’opposition phonologique entre
les consonnes simples et les géminées du tarifit. Il s’agit aussi de tester la robustesse de ces
paramètres dans le maintien éventuel de l’opposition phonologique, en variant la vitesse
d’élocution.
Hypothèses
140
- Hypothèse n° 6 : Il est probable que le VTT des simples soit plus long que celui des
géminées, étant donné que plus la tenue consonantique est brève, plus la proportion du délai
d’arrêt du voisement dans cette tenue risque d’être élevée.
Nos observations liminaires ont révélé que les résultats intra-locuteurs étaient
sensiblement les mêmes pour nos six locuteurs. Nous avons, en conséquence, décidé de ne
présenter in texte que les résultats tous locuteurs confondus. Cela dit, nous donnons, ci-
dessous, quelques résultats représentatifs pour chaque locuteur (voir Figure 33 à Figure 38 et
Tableau 10 à Tableau 15).
De manière générale, ces données montrent que chaque locuteur oppose les simples et
les géminées grâce à la tenue consonantique sur le plan intersegmental, et le silence
acoustique, ainsi que l’occlusion consonantique sur le plan intrasegmental, et cela dans les
deux conditions de vitesse d’élocution. Des commentaires plus détaillés figurent plus loin
dans l’analyse des résultats, tous locuteurs confondus.
Valeurs intersegmentales [ata] vs. [atta] Vitesse Normale Valeurs intersegmentales [ata] vs. [atta] Vitesse Rapide
300 300
250 250
FS FS
FG FG
200 Kh S 200 Kh S
Kh G Kh G
Durée (ms)
KS
Durée (ms)
KS
150 KG 150 KG
YS YS
YG YG
100 HS 100 HS
HG HG
SS SS
50 SG 50 SG
0 0
a t a a t a
Figure 33 : Valeurs intersegmentales /ata/ vs. /atta/ en vitesse d’élocution normale à gauche et en vitesse
d’élocution rapide à droite (S = simples et G = géminées).
141
Tableau 10 : Valeurs des moyennes et des écarts-types des durées intersegmentales (en noir pour la vitesse
d’élocution normale et en rouge pour la vitesse d’élocution rapide) pour /ata/ et /atta/ en (ms).
Simple Géminée
a t a a t a
[ata] vs. [atta] VN VR VN VR VN VR VN VR VN VR VN VR
F Moyenne 87,5 55,6 116,6 75,3 173,9 96,7 72,6 52,2 238,4 178,8 173,4 85
Ecart-type 12,6 5,8 4,6 8,3 13,7 6,7 8,3 6,2 14,2 26,4 8,4 8,9
Kh Moyenne 85,5 63,1 109,9 93,9 146,8 94,5 69,9 52,3 218,3 157,8 147,9 94,4
Ecart-type 11,3 5,1 13,3 5,2 11,0 8,8 6,1 3,9 8,4 13,8 12,7 11,7
K Moyenne 58,5 58,4 159,3 137 139 117 49,2 55,1 222,3 187,5 151,6 116,4
Ecart-type 9,1 6,4 14,7 15,5 10,0 10,2 5,2 7,2 13,8 9,9 13,2 10,2
Y Moyenne 78,4 64,3 94,6 85,8 113,8 94,9 70,6 59,8 195,7 168,1 108 79,9
Ecart-type 7,5 5,3 3,7 6,5 12,3 7,6 6,2 4,2 12,9 9,7 13,0 7,5
H Moyenne 91,1 63,7 119,1 91,1 152,1 95 87,6 58,8 210,6 137,7 149,5 94,1
Ecart-type 6,5 6,9 13,3 5,4 13,4 5,9 7,2 6,2 32,1 18,3 13,6 3,8
S Moyenne 88,8 55,9 121,9 87,2 139,5 82,4 83,2 54,4 244,1 151,8 153,1 84,5
Ecart-type 7,8 4,3 7,1 4,0 9,3 8,6 6,7 6,6 39,1 18,5 13,6 5,7
Valeurs intrasegmentales [ata] vs. [atta] Vitesse Normale Valeurs intrasegmentales [ata] vs. [atta] Vitesse Rapide
300 300
250 FS 250 FS
FG FG
Kh S Kh S
200 200
Kh G Kh G
Durée (ms)
Durée (ms)
KS KS
150 KG 150 KG
YS YS
YG YG
100 HS 100 HS
HG HG
SS SS
50 50
SG SG
0 0
vtt sil vot vtt sil vot
Figure 34 : Valeurs intrasegmentales /ata/ vs. /atta/ en vitesse d’élocution normale à gauche et en vitesse
d’élocution rapide à droite (S = simples et G = géminées).
Tableau 11 : Valeurs des moyennes et des écarts-types des durées intrasegmentales (en noir pour la vitesse
d’élocution normale et en rouge pour la vitesse d’élocution rapide) pour /ata/ vs. /atta/ en (ms).
Simple Géminée
vtt sil vot vtt sil vot
[ata] vs. [atta] VN VR VN VR VN VR VN VR VN VR VN VR
F Moyenne 24,2 14,5 69,1 40,2 23,3 20,6 33,30 16,7 186,70 145,8 18,40 16,3
Ecart-type 3,9 2,5 7,8 8,4 5,5 2,6 6,41 2,9 13,97 25,6 3,06 2,2
Kh Moyenne 23,7 12,5 50,2 54,5 36 26,9 30,3 16,9 153,7 116,9 34,3 24
Ecart-type 2,5 1,6 11,1 4,2 3,9 3,0 4,8 2,6 7,3 12,1 3,2 2,0
K Moyenne 21,9 17,3 101,5 86 35,9 33,7 25,1 19,9 167,4 141,6 29,8 26
Ecart-type 2,8 4,1 17,0 15,6 2,7 3,5 2,7 2,8 12,9 7,5 3,3 3,9
Y Moyenne 16,2 15,5 47,5 46 30,9 24,3 28,2 26,7 147,5 118,3 20 23,1
Ecart-type 1,5 3,3 4,7 10,8 3,5 8,9 5,7 5,2 11,4 9,3 1,8 1,6
H Moyenne 21,3 17,6 72 51,1 25,8 22,4 25,4 23,9 163,1 94,2 22,1 19,6
Ecart-type 2,9 3,0 13,4 4,7 4,4 2,9 3,3 6,3 32,4 19,1 2,1 1,9
S Moyenne 18,2 15,8 82,8 53 20,9 18,4 23,1 18,1 205,4 117,4 15,6 16,3
Ecart-type 2,3 2,1 11,9 6,4 6,6 4,6 3,8 4,8 39,9 15,7 3,5 1,9
142
Valeurs intersegmentales [aka] vs. [akka] Vitesse Normale Valeurs intersegmentales [aka] vs. [akka] Vitesse Rapide
300 300
250 250
FS FS
FG FG
200 Kh S 200 Kh S
Kh G Kh G
Durée (ms)
KS
Durée (ms)
KS
150 KG 150 KG
YS YS
YG YG
100 HS 100 HS
HG HG
SS SS
50 SG 50 SG
0 0
a k a a k a
Figure 35 : Valeurs intersegmentales /aka/ vs. /akka/ en vitesse d’élocution normale à gauche et en vitesse
d’élocution rapide à droite (S = simples et G = géminées).
Tableau 12 : Valeurs des moyennes et des écarts-types des durées intersegmentales (en noir pour la vitesse
d’élocution normale et en rouge pour la vitesse d’élocution rapide) pour /aka/ et /akka/ en (ms).
Simple Géminée
a k a a k a
[aka] vs. [akka] VN VR VN VR VN VR VN VR VN VR VN VR
F Moyenne 88,2 62,1 135,2 86 141,3 51,7 100,5 65 279 186,7 147,6 51,2
Ecart-type 12,9 4,9 8,1 6,6 15,7 6,1 8,3 2,7 15,4 31,3 9,7 7,0
Kh Moyenne 81 62,6 126,1 92,8 121,5 60,5 91,3 61,6 217,2 169,1 124 68
Ecart-type 10,6 3,4 6,5 8,9 3,6 11,0 18,2 5,5 10,9 20,6 7,8 16,0
K Moyenne 86 66,8 177,7 145,6 89,7 79,1 75,6 63,8 225 189,1 99,3 79,2
Ecart-type 9,4 5,3 8,8 5,2 14,8 8,2 15,6 7,7 7,8 8,0 17,2 9,1
Y Moyenne 77,4 62,4 113,8 93,6 68,5 63,1 73,3 64 201,2 161,5 69 64,6
Ecart-type 8,7 3,1 9,4 4,8 10,3 6,8 6,2 1,7 15,2 7,7 8,8 6,3
H Moyenne 92,1 62,1 123,2 91,4 109,3 66,3 88,9 62,9 258,2 145,7 109,4 62,9
Ecart-type 5,3 2,8 7,7 5,5 9,0 3,1 10,2 2,1 32,4 14,0 9,1 5,4
S Moyenne 98,3 61 131,8 93,9 96,9 53,8 90,2 63,9 241,5 168,9 110,4 54,3
Ecart-type 9,4 6,8 8,9 8,3 10,3 5,0 6,8 4,9 13,4 41,0 17,2 13,5
Valeurs intrasegmentales [aka] vs. [akka] Vitesse Normale Valeurs intersegmentales [aka] vs. [akka] Vitesse Rapide
300
250
250
200 FS FS
FG FG
Kh S 200 Kh S
Kh G Kh G
150
Durée (ms)
KS
Durée (ms)
KS
KG 150 KG
YS YS
100 YG YG
100 HS
HS
HG
HG
SS
50 SS
50 SG
SG
0 0
vtt sil vot a k a
Figure 36 : Valeurs intrasegmentales /aka/ vs. /akka/ en vitesse d’élocution normale à gauche et en vitesse
d’élocution rapide à droite (S = simples et G = géminées).
143
Tableau 13 : Valeurs des moyennes et des écarts-types des durées intrasegmentales (en noir pour la vitesse
d’élocution normale et en rouge pour la vitesse d’élocution rapide) pour /aka/ vs. /akka/ en (ms).
Simple Géminée
vtt sil vot vtt sil vot
[aka] vs. [akka] VN VR VN VR VN VR VN VR VN VR VN VR
F Moyenne 27,7 17,1 69,4 44,8 38,1 24,1 38,5 19 207,1 146,6 33,4 21,1
Ecart-type 3,0 2,1 8,1 8,3 5,3 3,4 8,7 5,9 8,9 26,0 4,6 2,4
Kh Moyenne 22,5 16,4 58,7 42,3 44,9 34,1 35,5 18,6 133 116,8 48,7 33,8
Ecart-type 3,1 2,1 6,2 7,1 3,6 4,7 4,7 3,9 10,5 17,6 2,5 3,0
K Moyenne 28 22,2 101,1 84,6 48,6 38,8 24,2 18,8 155,1 133,9 45,7 36,4
Ecart-type 3,5 2,8 6,2 3,6 5,8 4,6 4,6 2,7 8,9 7,4 5,1 2,7
Y Moyenne 21,7 19,8 58,2 44,2 33,9 29,6 26,3 26,9 144,9 107,6 30 27
Ecart-type 2,7 4,2 8,8 7,5 3,1 5,6 4,0 4,4 16,8 6,9 5,0 3,2
H Moyenne 23,3 19,2 72,3 51,2 27,6 21 27,1 23,6 206,3 101,5 24,8 20,6
Ecart-type 5,0 1,9 8,1 5,9 3,3 2,5 4,8 3,0 32,8 12,7 2,5 2,7
S Moyenne 23,9 15,7 73,4 47,4 34,5 30,8 22,4 20,1 184,7 120,4 34,4 28,4
Ecart-type 3,7 2,9 7,5 7,9 4,9 3,5 4,6 3,4 15,1 41,2 4,5 3,1
Valeurs intersegmentales [aqa] vs. [aqqa] Vitesse Normale Valeurs intersegmentales [aqa] vs. [aqqa] Vitesse Rapide
300 300
250 250
FS FS
FG FG
200 Kh S 200 Kh S
KG Kh G
Durée (ms)
KS
Durée (ms)
KS
150 KG 150 KG
YS YS
YG YG
100 HS 100 HS
HG HG
SS SS
50 SG 50 SG
0 0
a q a a q a
Figure 37 : Valeurs intersegmentales /aqa/ vs. /aqqa/ en vitesse d’élocution normale à gauche et en vitesse
d’élocution rapide à droite (S = simples et G = géminées).
Tableau 14 : Valeurs des moyennes et des écarts-types des durées intersegmentales (en noir pour la vitesse
d’élocution normale et en rouge pour la vitesse d’élocution rapide) pour /aqa/ et /aqqa/ en (ms).
Simple Géminée
a q a a q a
[aqa] vs. [aqqa] VN VR VN VR VN VR VN VR VN VR VN VR
F Moyenne 89,1 61,3 134,3 91,9 122,7 63,8 94,9 68,9 274,9 189,1 119,8 62,7
Ecart-type 4,1 5,7 8,0 7,5 5,0 5,5 6,3 9,8 18,4 43,3 6,2 4,2
Kh Moyenne 97,8 65,5 133,1 103,7 120 76 93 64,6 255,9 177,1 123 88,8
Ecart-type 1,2 2,9 9,9 8,1 16,3 7,6 5,0 3,1 9,8 22,6 13,6 13,7
K Moyenne 93,1 68,5 154,5 129,3 89,7 79,8 82,2 67 223,8 186,5 90,2 82,3
Ecart-type 15,3 6,8 10,9 7,7 7,0 5,3 8,8 6,5 18,1 12,2 9,5 12,2
Y Moyenne 79,9 60,5 112 106 71,6 59 81,8 61,1 233,8 174,9 73,7 62,2
Ecart-type 10,9 2,4 5,5 6,3 4,0 4,4 8,2 3,3 16,7 23,4 12,6 5,0
H Moyenne 82,5 53,1 126,7 103,1 87,1 58,8 82 55,4 241,3 155,8 91,7 59,4
Ecart-type 11,0 3,1 7,9 6,5 6,3 4,3 15,0 4,2 31,5 14,8 12,4 4,7
S Moyenne 86,6 60,7 143,7 110,8 97 62,1 79,3 62 234,6 180,2 100,1 63,3
Ecart-type 9,9 4,3 18,1 10,2 10,7 6,4 8,9 5,6 18,9 21,3 11,3 2,9
144
Valeurs intrasegmentales [aqa] vs. [aqqa] Vitesse Normale Valeurs intrasegmentales [aqa] vs. [aqqa] Vitesse Rapide
250 250
FS 200 FS
200
FG FG
Kh S Kh S
Kh G Kh G
150 150
Durée (ms)
KS
Durée (ms)
KS
KG KG
YS YS
100 100 YG
YG
HS HS
HG HG
50 SS 50 SS
SG SG
0 0
vtt sil vot vtt sil vot
Figure 38 : Valeurs intrasegmentales /aqa/ vs. /aqqa/ en vitesse d’élocution normale à gauche et en vitesse
d’élocution rapide à droite (S = simples et G = géminées).
Tableau 15 : Valeurs des moyennes et des écarts-types des durées intrasegmentales (en noir pour la vitesse
d’élocution normale et en rouge pour la vitesse d’élocution rapide) pour /aqa/ vs. /aqqa/ en (ms).
Simple Géminée
vtt sil vot vtt sil vot
[aqa] vs. [aqqa] VN VR VN VR VN VR VN VR VN VR VN VR
F Moyenne 29,5 21,9 75,2 47,6 29,6 22,4 31,9 24,9 214,3 145,1 28,7 19,1
Ecart-type 4,6 5,3 9,3 10,4 7,6 5,9 5,2 5,0 17,1 38,7 4,4 3,3
Kh Moyenne 31 22,1 63,8 52,1 38,3 29,5 32,5 30,2 186 120,7 37,4 26,2
Ecart-type 3,5 2,4 11,0 7,0 7,1 3,1 2,4 8,0 8,1 16,4 5,1 3,6
K Moyenne 22,8 22,3 90,7 75,5 41 31,5 22,1 24,9 161,8 131,3 39,9 30,3
Ecart-type 2,7 5,0 10,0 6,2 8,2 7,2 4,5 5,2 8,5 13,4 11,9 2,5
Y Moyenne 22,5 26,7 62,7 50,7 26,8 28,6 29,7 27,8 178,8 121,7 25,3 25,4
Ecart-type 2,1 3,3 4,2 6,1 2,9 4,3 3,2 2,8 15,5 24,8 5,3 1,3
H Moyenne 25,9 24,3 69,4 52,6 31,4 26,2 35,3 25,6 175,4 104,5 30,6 25,7
Ecart-type 3,9 2,9 6,9 6,6 3,6 2,5 5,3 5,1 28,7 14,6 2,3 4,5
S Moyenne 17,1 21,4 93,1 60 33,5 29,4 21,8 21,6 180,6 132,5 32,2 26,1
Ecart-type 3,2 4,7 18,0 8,3 3,2 2,3 1,7 3,3 17,5 18,6 3,4 3,0
Rappelons que les données complètes pour chaque locuteur figurent en Annexe 1.
Rappelons également que nos analyses statistiques reposent sur des T-test paire-par-paire
effectués entre les simples et les géminées pour chaque vitesse délocution, ainsi que sur les
paires simples et sur les paires géminées à différentes vitesse d’élocution. Pour les T-test,
nous donnons les données de variance avec les facteurs f et df et la significativité de leur
différence des facteurs comparés avec la valeur de p. Nous avons également effectué des
analyses de variance (ANOVA) à deux facteurs pour déterminer l’interaction entre la
gémination et la vitesse d’élocution pour les paires analysées. Pour ces analyses ANOVA,
nous donnons les données de variance avec le ratio F et la valeur de probabilité p. Seuls les
résultats avec une probabilité de moins de cinq pour cent (p<0.05) sont considérés ici comme
significatifs.
145
8.1 Les occlusives sourdes
8.1.1 Les occlusives sourdes en position intervocalique
Les paires d’occlusives sourdes analysées sont : /ata/ vs. /atta/
/aka/ vs. /akka/
/aqa/ vs. /aqqa/
En vitesse d’élocution normale, les résultats (Figure 39, à gauche) montrent que le
paramètre physique de prédilection de la gémination est la durée de la tenue consonantique,
car elle est significativement différente entre les simples et les géminées [t= 11,13, df= 5,
p=0,0001 pour la paire /t /vs. /tt/ ; t= 7,109, df= 5, p=0,0009 pour /k/ vs. /kk/, et t= 10,54, df=
5, p=0,0001 pour /q/ vs. /qq/]. En effet, la tenue consonantique de la classe des géminées est
systématiquement et remarquablement plus longue par rapport à leur homologues simples. En
revanche, les autres paramètres intersegmentaux, V1 et V2, ne permettent pas de différencier
les deux classes.
En vitesse d’élocution rapide, tous les paramètres intersegmentaux (Figure 39, à droite)
sont comprimés de manière significative [pour les simples t= 5,143, df= 5, p=0,0036 pour t
VN vs. t VR ; t= 8,899, df= 5, p=0,0003 pour k VN vs. k VR, et t= 5,393, df= 5, p=0,0030
pour q VN vs. q VR et pour les géminées t= 5,929, df= 5, p=0,0019 pour tt VN vs. tt VR ; t=
7,854, df= 5, p<0,0001 pour kk VN vs. kk VR, et t= 7,854, df= 5, p<0,0001 pour qq VN vs.
qq VR]. Malgré cette compression de durée, le scénario reste le même qu’en vitesse
d’élocution normale. La différence entre simples et géminées se fait grâce à une différence
significative de la durée de la tenue consonantique, celle des géminées étant plus longue que
celle des simples [t= 7,854, df= 5, p=0,0005 pour t vs. tt ; t= 5,257, df= 5, p=0,0033 pour k vs.
kk, t= 8,295, df= 5, p=0,0004 pour q vs. qq], quoique ces différences diminuent face à
l’augmentation de la vitesse d’élocution.
Nous n’observons pas d’interaction entre la gémination et la vitesse d’élocution pour les
paires /t / vs. /tt/ et /k/ vs. /kk/ [pour la paire /t/ vs. /tt/ : F(1,20) = 4,069, p=0,0573; pour la
paire /k/ vs. /kk/ : F(1,20) = 3,082, p=0,0945]. En revanche, nous observons une interaction
significative entre la gémination et la vitesse d’élocution pour la paire /q/ vs. /qq/ [F(1,20) =
11,47, p=0,0029]. Afin de vérifier la robustesse du contraste linguistique de la durée de la
tenue consonantique entre les deux groupes de données temporelles, il est également
intéressant de tester la différence de la durée de la tenue consonantique entre les géminées en
146
vitesse d’élocution rapide et les simples en vitesse d’élocution normale. Les résultats
montrent que la différence de tenue consonantique est significative dans cette configuration
pour les trois paires [pour la paire /t /vs. /tt/ : t= 4,904, df= 5, p=0,0045; pour la paire /k/ vs.
/kk/ : t= 5,544, df= 5, p=0,0026 ; pour la paire /q/ vs. /qq/ : t= 7,797, df= 5, p=0,0006] et
notamment pour la paire /q/ vs. /qq/. Pour les paires /t /vs. /tt/ et /k/ vs. /kk/, les résultats
montrent que la tenue consonantique est la bonne variable acoustique pour distinguer les
simples des géminées quelle que soit la vitesse d’élocution. Lorsqu’une interaction entre la
gémination et la vitesse d’élocution est obtenue, cela indique une assimilation entre consonne
simple et consonne géminée, ce qui signifie que la différence moyenne entre simple et
géminée en vitesse d’élocution normale serait plus grande que la différence moyenne entre
simple et géminée en vitesse d’élocution rapide, ce qui est testé avec le T-test entre les simple
en vitesse d’élocution normale et les géminées en vitesse d’élocution rapide. Pour la paire /q/
vs. /qq/, les résultats suggèrent que, malgrè l’interaction significative entre gémination et
vitesse d’élocution pour cette paire, la différence significative entre simple en vitesse normale
et géminée en vitesse rapide confirme que pour cette paire aussi, la tenue consonantique est la
bonne variable acoustique pour distinguer simple et géminée quelle que soit la vitesse
d’élocution.
Figure 39 : Valeurs intersegmentales des occlusives sourdes en vitesse d’élocution normale à gauche et en
vitesse d’élocution rapide à droite.
Le Tableau 16 donne les valeurs des moyennes et des écarts types des six locuteurs pour
les paramètres intersegmentaux des trois paires d’occlusives sourdes en vitesse d’élocution
normale (à gauche) et en vitesse d’élocution rapide (à droite). Notons que les écarts-types
restent relativement faibles, révélant ainsi une bonne maîtrise des paramètres temporels,
quelle que soit la condition de vitesse d’élocution.
147
Tableau 16 : Valeurs des moyennes et des écarts-types des durées intersegmentales des occlusives sourdes en
(ms).
Simple Géminée
a simple a a géminée a
ata vs atta VN Moyenne 81,63 120,23 144,18 72,18 221,57 147,25
Ecart Type 12,13 21,48 19,62 13,38 17,84 21,37
ata vs atta VR Moyenne 60,17 95,05 96,75 55,43 163,62 92,38
Ecart Type 4,01 21,51 11,20 3,22 18,25 13,09
aka vs akka VN Moyenne 87,17 134,63 104,53 86,63 237,02 109,95
Ecart Type 7,54 22,36 25,45 10,31 28,47 26,10
aka vs akka VR Moyenne 62,83 100,55 62,42 63,53 170,17 63,37
Ecart Type 2,02 22,26 9,87 1,17 16,18 10,04
aqa vs aqqa VN Moyenne 88,17 134,05 98,02 85,53 244,05 99,75
Ecart Type 6,65 14,51 19,90 6,63 18,46 18,85
aqa vs aqqa VR Moyenne 61,60 107,47 66,58 63,17 177,27 69,78
Ecart Type 5,24 12,37 9,05 4,81 11,83 12,46
Comme nous l’avons observé pour la tenue consonantique, il n’y a pas d’interaction de
la durée du silence acoustique entre la gémination et la vitesse d’élocution pour les paires /t /
vs. /tt/ et /k/ vs. /kk/ [pour la paire /t/ vs. /tt/ : F(1,20) = 4,301, p=0,0512; pour la paire /k/ vs.
148
/kk/ : F(1,20) = 3,225, p=0,0877]. En revanche, nous notons une interaction significative entre
la gémination et la vitesse d’élocution pour la paire /q/ vs. /qq/ [F(1,20) = 10,84, p=0,0036].
Là aussi, nous avons testé la différence de la durée du silence acoustique entre les géminées
en vitesse d’élocution rapide et les simples en vitesse d’élocution normale et obtenons une
difference significative dans cette configuration pour les trois paires [pour la paire /t /vs. /tt/ :
t= 5,660, df= 5, p=0,0024; pour la paire /k/ vs. /kk/ : t= 6,819, df= 5, p=0,0010 ; pour la paire
/q/ vs. /qq/ : t= 8,904, df= 5, p=0,0003]. Même si on observe une interaction entre vitesse
d’élocution et gémination pour la paire /q/ vs. /qq/, les résultats confirment que la durée du
silence acoustique demeure la bonne variable acoustique pour distinguer les simples des
géminées même en faisant varier la vitesse d’élocution.
Figure 40 : Valeurs intrasegmentales des occlusives sourdes en vitesse d’élocution normale à gauche et en
vitesse d’élocution rapide à droite.
Le Tableau 17 indique les valeurs des moyennes et des écarts-types des six locuteurs
pour les paramètres intrasegmentaux des trois paires d’occlusives sourdes en vitesses
d’élocution normale et rapide. Au regard des écarts-types, la viabilité est faible pour tous les
paramètres.
Tableau 17 : Valeurs des moyennes et des écarts-types des durées intrasegmentales des occlusives sourdes en
vitesses d’élocution normale et rapide en (ms).
Simple Géminée
vtt sil vot vtt sil vot
/ata/ vs /atta/ VN Moyenne 20,92 70,52 28,80 27,57 170,63 23,37
Ecart type 3,14 20,29 6,45 3,78 21,71 7,20
/ata/ vs /atta/ VR Moyenne 15,53 55,13 24,38 20,37 122,37 20,88
Ecart type 1,88 16,00 5,43 4,08 18,89 4,11
/aka/ vs /akka/ VN Moyenne 24,52 72,18 37,93 29,00 171,85 36,17
Ecart type 2,69 15,64 7,71 6,48 31,97 9,23
/aka/ vs /akka/ VR Moyenne 18,40 52,42 29,73 21,16 121,13 27,88
Ecart type 2,45 16,06 6,49 3,38 16,73 6,44
/aqa/ vs /aqqa/ VN Moyenne 24,80 75,82 33,43 28,88 182,82 32,35
Ecart type 5,11 13,25 5,36 5,66 17,43 5,45
/aqa/ vs /aqqa/ VR Moyenne 23,12 56,42 27,93 25,83 125,97 25,47
Ecart type 2,02 10,20 3,21 2,92 13,74 3,60
149
D’après nos résultats, nous constatons que :
2) Nous observons la même situation que celle décrite ci-dessus pour le silence
acoustique, c’est-à-dire : (1) le silence acoustique permet de distinguer les occlusives
simples des géminées pour les deux vitesses d’élocution et (2) le ratio F indique que la
différence la plus importante se fait entre le silence acoustique des consonnes
géminées par rapport à celui des simples (très significative), même si cette différence
se réduit en vitesse d’élocution rapide, elle reste tout de même significative. Signalons
enfin, que le silence acoustique est un paramètre plus performant que la tenue
consonantique dans la distinction des géminées des simples.
150
8.1.2 Les occlusives sourdes en position initiale
Nous analyserons dans cette section les paires d’occlusives sourdes: /ta/ vs. /tta/
/ka/ vs. /kka/
/qa/ vs. /qqa/
En position initiale des occlusives sourdes en vitesse d’élocution normale (Figure 41, à
gauche), le paramètre physique préférentiel de la gémination reste la tenue consonantique qui
est significativement plus longue pour la classe des géminées par rapport à leur homologues
simples [t= 12,99, df= 5, p<0,0001 pour la paire /t /vs. /tt/ ; t= 14,03, df= 5, p<0,0001 pour /k/
vs. /kk/, et t= 11,70, df= 5, p<0,0001 pour /q/ vs. /qq/]. En revanche, l’autre paramètre
intersegmental, la durée de la voyelle suivante, ne permet toujours pas de différencier les deux
classes.
En vitesse d’élocution rapide (Figure 41, à droite), tous les paramètres intersegmentaux
sont comprimés de manière significative [pour les simples : [t= 6,058, df= 5, p=0,0018 pour t
VN vs. t VR ; t= 4,431, df= 5, p=0,0068 pour k VN vs. k VR /, et t= 6,213, df= 5, p=0,0016
pour q VN vs. q VR et pour les géminées [t= 6,464, df= 5, p=0,0013 pour tt VN vs. tt VR; t=
6,014, df= 5, p=0,0018 pour kk VN vs.kk VR, et t= 7,714, df= 5, p=0,0053 pour qq VN vs. qq
VR]. Cependant, la tenue consonantique des géminées reste significativement plus longue que
celle des simples [t= 13,34, df= 5, p<0,0001 pour la paire /t /vs. /tt/ ; t= 10,56, df= 5,
p=0,0001 pour /k/ vs. /kk/, et t= 4,893, df= 5, p=0,0045 pour /q/ vs. /qq/].
Il n’existe pas d’interaction entre la gémination et la vitesse d’élocution pour les trois
occlusives sourdes en position initiale non absolue [pour la paire /t/ vs. /tt/ : F(1,20) = 1,348,
p=0,2593; pour la paire /k/ vs. /kk/ : F(1,20) = 3,248, p=0,0866 et pour la paire /q/ vs. /qq/ :
F(1,20) = 0,4100, p=0,5293]. A titre indicatif, nous avons également testé la difference de la
tenue consonantique entre simple en vitesse normale et géminée en vitesse rapide. La
différence est significative pour les deux paires /t/ vs. /tt/ et /q/ vs. /qq/ [pour la paire /t /vs.
/tt/ : t= 5,130, df= 5, p=0,0037; pour la paire /k/ vs. /kk/ : t= 3,073, df= 5, p=0,0277] et se
trouve juste à la limite de significativité pour la paire /q/ vs. /qq/ [t= 2,560, df= 5, p=0,0507].
Si l’on considère à la fois les résultats des interactions et ceux du T-test, la tenue
consonantique reste la bonne variable acoustique pour distinguer les simples des géminées
quelle que soit la vitesse d’élocution.
151
Figure 41 : Valeurs intersegmentales des occlusives sourdes en vitesse d’élocution normale à gauche et en
vitesse d’élocution rapide à droite.
Le Tableau 18 donne les valeurs des moyennes et des écarts-types des six locuteurs
pour les paramètres intersegmentaux des trois paires d’occlusives sourdes en vitesses
d’élocution normale et rapide. Notons que les écarts-types restent relativement faibles,
révélant ici aussi une bonne maîtrise des paramètres temporels, quelle que soit la condition de
vitesse d’élocution.
Tableau 18 : Valeurs des moyennes et des écarts-types des durées intersegmentales des occlusives
sourdes en vitesses d’élocution normale et rapide en (ms).
Simple Géminée
simple a géminée a
/ta/ vs /tta/ VN Moyenne 140,40 161,72 239,58 161,32
Ecart type 17,33 32,94 18,62 31,91
/ta/ vs /tta/ VR Moyenne 100,37 100,42 182,63 97,82
Ecart type 17,14 9,34 18,84 9,54
/ka/ vs /kka/ VN Moyenne 149,95 164,70 244,02 166,27
Ecart type 15,27 37,82 13,84 36,56
/Ka/ vs /kka/ VR Moyenne 113,33 101,28 183,73 99,87
Ecart type 13,36 15,54 20,77 15,22
/qa/ vs /qqa/ VN Moyenne 146,48 119,90 238,02 119,10
Ecart type 9,41 33,43 23,75 30,80
/qa/ vs /qqa/ VR Moyenne 111,20 69,48 189,33 69,48
Ecart type 11,18 6,06 43,01 6,11
En vitesse d’élocution normale, seul le silence acoustique permet encore, dans cette
position initiale non absolue, de différencier les simples des géminées parmi les paramètres
composites de la tenue consonantique (les durées intrasegmentales VTT, le silence acoustique
et le VOT) (Figure 42, à gauche). La durée du silence acoustique des géminées est
significativement supérieure à celle de leurs homologues simples [t= 13,94, df= 5, p<0,0001
pour la paire /t /vs. /tt/ ; t= 13,42, df= 5, p<0,0001 pour /k/ vs. /kk/, et t= 10,84, df= 5,
152
p=0,0001 pour /q/ vs. /qq/]. Pour les autres paramètres, le VTT ne donne toujours pas de
résultats concluants, et le VOT garde cette tendance à être plus long pour les géminées (p=ns).
En vitesse d’élocution rapide (Figure 42, à droite), le silence acoustique subit une
compression significative [pour les simples : t= 5,528, df= 5, p=0,0027 pour t VN vs. t VR; t=
4,016, df= 5, p=0,0102 pour k VN vs. k VR, et t= 5,819, df= 5, p=0,0021 pour q VN vs. q
VR] et pour les géminées : t= 5,622, df= 5, p=0,0025 pour tt VN vs. tt VR ; t= 6,215, df= 5,
p=0,0016 pour kk VN vs. kk VR, et t= 3,475, df= 5, p=0,0178 pour qq VN vs. qq VR].
Néanmoins, la durée du silence acoustique est toujours un paramètre robuste pour permettre la
distinction entre les simples et les géminées [t= 13,09, df= 5, p<0,0001 pour la paire /t /vs.
/tt/ ; t= 9,997, df= 5, p=0,0002 pour /k/ vs. /kk/, et t= 4,846, df= 5, p<0,0047 pour /q/ vs. /qq/].
Figure 42 : Valeurs intrasegmentales des occlusives sourdes en vitesse d’élocution normale à gauche et en
vitesse d’élocution rapide à droite.
Le Tableau 19 indique les valeurs des moyennes et des écarts-types pour les paramètres
intrasegmentaux des six locuteurs. Là encore, les écarts-types du silence acoustique sont
faibles reflétant la faible variabilité de ce paramètre par rapport à celle du VTT et du VOT.
153
Tableau 19 : Valeurs des moyennes et des écarts-types des durées intrasegmentales des occlusives sourdes en
vitesses d’élocution normale et rapide en (ms).
Simple Géminée
vtt sil vot vtt sil vot
/ta/ vs /tta/ VN Moyenne 17,17 92,98 30,25 18,30 193,02 28,27
Ecart type 1,49 17,43 4,68 1,34 19,71 4,84
/ta/ vs /tta/ VR Moyenne 13,85 62,98 23,53 15,15 145,28 22,20
Ecart type 1,20 15,08 3,80 2,25 17,31 3,27
/ka/ vs /kka/ VN Moyenne 17,90 92,27 39,78 19,27 184,18 40,57
Ecart type 1,14 14,11 5,50 1,97 15,95 7,99
/Ka/ vs /kka/ VR Moyenne 15,18 66,72 31,43 16,37 135,95 31,42
Ecart type 1,94 10,51 4,78 1,68 20,04 5,94
/qa/ vs /qqa/ VN Moyenne 22,43 86,27 37,78 23,47 176,52 38,03
Ecart type 4,36 8,99 4,47 4,38 25,15 5,81
/qa/ vs /qqa/ VR Moyenne 18,17 64,80 28,23 19,37 142,48 27,48
Ecart type 2,77 7,06 3,15 3,14 41,11 3,00
1) Dans cette position d’initiale de mot, la distinction entre simples et géminées reste
toujours possible, au niveau intersegmental, grâce à la tenue consonantique ; les
géminées sont nettement et significativement plus longues que les simples, et cela
dans les deux vitesses d’élocution.
En position finale, le scénario reste inchangé par rapport aux positions précédentes :
pour les occlusives sourdes en vitesse d’élocution normale (Figure 43, à gauche), c’est la
tenue consonantique qui est le paramètre significatif / significativement plus longue [t= 22,64,
154
df= 5, p<0,0001 pour la paire /t /vs. /tt/ ; t= 6,945, df= 5, p=0,0010 pour /k/ vs. /kk/, et t=
9,306, df= 5, p=0,0002 pour /q/ vs. /qq/] distinguant ainsi les simples des géminées.
Pour la paire /t/ vs. /tt/, nous observons une interaction significative de la durée du
silence acoustique entre la gémination et la vitesse d’élocution [F(1,20) = 4,607, p=0,00443],
alors que pour les autres paires nous n’observons pas d’interaction [pour la paire /k/ vs. /kk/ :
F(1,20) = 1,215, p=0,2835 et pour la paire /q/ vs. /qq/ : F(1,20) = 0,4675, p=0,5020].
Cependant, la différence de la durée du silence acoustique entre les simples en vitesse
normale et les géminées en vitesse rapide est significative pour les trois paires [pour la paire /t
/vs. /tt/ : t= 6,429, df= 5, p=0,0014; pour la paire /k/ vs. /kk/ : t= 2,688, df= 5, p=0,0434 ; pour
la paire /q/ vs. /qq/ : t= 5,078, df= 5, p=0,0038]. En conclusion, la durée de la tenue
consonantique permet de distinguer les simples des géminées même en variant la vitesse
d’élocution.
Figure 43 : Valeurs intersegmentales des occlusives sourdes en vitesse d’élocution normale à gauche et en
vitesse d’élocution rapide à droite.
Le Tableau 20 donne les valeurs des moyennes et des écarts-types des six locuteurs
pour les paramètres intersegmentaux des trois paires d’occlusives sourdes en vitesses
155
d’élocution normale et rapide. Nous constatons ici aussi que les écarts-types restent
relativement faibles, révélant ainsi un bon contrôle des paramètres temporels, quelle que soit
la condition de vitesse d’élocution.
Tableau 20 : Valeurs moyennes et les écarts-types des durées intersegmentales des occlusives sourdes en vitesses
d’élocution normale et rapide en (ms).
Simple Géminée
a simple a géminée
/ta/ vs /tta/ VN Moyenne 85,15 81,75 81,87 186,37
Ecart type 11,12 3,48 9,11 25,91
/ta/ vs /tta/ VR Moyenne 59,33 55,58 57,82 124,55
Ecart type 8,34 8,48 8,68 29,99
/ka/ vs /kka/ VN Moyenne 92,67 97,35 88,13 186,50
Ecart type 11,71 20,14 9,75 27,94
/Ka/ vs /kka/ VR Moyenne 64,85 65,93 63,45 136,12
Ecart type 6,68 11,77 6,28 21,26
/qa/ vs /qqa/ VN Moyenne 126,65 99,88 124,57 173,40
Ecart type 18,18 10,87 14,69 16,84
/qa/ vs /qqa/ VR Moyenne 75,30 73,70 73,07 140,57
Ecart type 8,58 5,62 7,86 11,58
Figure 44 : Valeurs intrasegmentales des occlusives sourdes en vitesse d’élocution normale à gauche et en
vitesse d’élocution rapide à droite.
Le Tableau 21 donne les valeurs des moyennes et des écarts-types des six locuteurs
pour les paramètres intrasegmentaux des trois paires d’occlusives sourdes en vitesses
d’élocution normale et rapide. Les écarts-types sont faibles reflétant la faible variabilité de
tous les paramètres.
Tableau 21: Valeurs moyennes et les écarts-types des durées intrasegmentales pour des occlusives sourdes en
vitesses d’élocution normale et rapide en (ms).
Simple Géminée
vtt sil vtt sil
/at/ vs /att/ VN Moyenne 26,43 55,32 27,60 158,77
Ecart type 1,77 3,53 2,00 27,10
/at/ vs /att/ VR Moyenne 14,03 41,55 15,05 109,50
Ecart type 2,23 6,81 2,38 29,16
/ak/ vs /akk/ VN Moyenne 23,72 73,63 24,95 161,55
Ecart type 3,06 17,55 3,24 27,24
/ak/ vs /akk/ VR Moyenne 14,85 51,08 15,60 120,52
Ecart type 2,57 9,90 2,16 20,52
/aq/ vs /aqq/ VN Moyenne 28,95 70,93 29,40 144,00
Ecart type 6,88 9,53 5,93 19,66
/aq/ vs /aqq/ VN Moyenne 16,27 57,43 17,47 123,10
Ecart type 2,15 5,65 1,52 11,55
157
1) Dans cette position finale de mot, la distinction entre simples et géminées reste
toujours possible, au niveau intersegmental, grâce à la tenue consonantique ; les
géminées sont nettement et significativement plus longues que les simples, et cela
dans les deux vitesses d’élocution.
Par le biais de cette étude des durées absolues, nous avons pu constater que les durées de la
tenue consonantique et du silence acoustique des occlusives sourdes géminées sont
significativement plus longues que celles de leurs homologues simples, et ce pour les trois
positions étudiées (intervocalique, initiale non absolue et finale non absolue). Les différences
de durée, obtenues pour ces deux paramètres critiques, sont maintenues en condition de
vitesse d’élocution rapide, révélant ainsi la résistivité de ces deux indices temporels qui
semblent sous-tendre l’opposition phonologique de la gémination, en contexte non voisé.
Dans cette section, nous analyserons les paires d’occlusives sonores suivantes :
158
L’augmentation de la vitesse d’élocution provoque la compression de tous les
paramètres intersegmentaux (Figure 45, à droite), [pour les simples : t= 9,138, df= 5,
p=0,0003 pour /d/ VN vs. /d/ VR et t = 8,662, df= 5, p=0,0003 pour /g/ VN vs. /g/ VR et pour
les géminées : t= 10,26, df= 5, p=0,0002 pour /dd/ VN vs. /dd/ VR et t= 5,642, df= 5,
p=0,0024 pour /gg/ VN vs. /gg/ VR]. La tenue consonantique reste significativement
discriminante, et ce malgré la compression des durées [t= 30,97, df= 5, p<0,0001 pour /d/ vs.
/dd/ et t= 21,03, df= 5, p<0,0001 pour /g/ vs. /gg/].
Figure 45 : Valeurs intersegmentales des occlusives sonores en vitesse d’élocution normale à gauche et en
vitesses d’élocution rapide à droite.
Le tableau 22 indique les moyennes et les écarts-types des paramètres intersegmentaux des
six locuteurs, les écarts-types étant relativement faibles pour ces paramètres.
159
Tableau 22 : Valeurs moyennes et les écarts-types des durées intersegmentales des occlusives sonores en vitesses
d’élocution normale et rapide en (ms).
Simple Géminée
a simple a a géminée a
/ada/ vs /adda/ VN Moyenne 83,65 83,98 81,22 85,82 210,52 91,00
Ecart type 7,56 7,49 10,15 6,95 11,56 6,72
/ada/ vs /adda/ VR Moyenne 60,13 61,00 64,08 61,10 155,05 69,17
Ecart type 5,04 4,33 5,38 4,67 10,08 5,67
/aga/ vs /agga/ VN Moyenne 92,85 90,38 122,78 95,28 189,77 126,70
Ecart type 10,27 5,94 11,10 11,10 21,87 15,04
/aga/ vs /agga/ VR Moyenne 61,00 72,32 83,65 64,62 143,88 80,90
Ecart type 4,98 6,78 11,20 3,28 10,41 11,70
La aussi, nous obtenons la même situation que celle avec les données intervocaliques,
c’est-à-dire une interaction significative de la durée d’occlusion entre la gémination et la
vitesse d’élocution pour les paires /d / vs. /dd/ et /g/ vs. /gg/ [pour la paire /d/ vs. /dd/ : F(1,20)
= 25,66, p<0,0001; pour la paire /g/ vs. /gg/ : F(1,20) = 8,588, p=0,0083]. Par conséquent,
nous avons testé la différence de la durée d’occlusion entre les géminées en vitesse
d’élocution rapide et les simples en vitesse d’élocution normale. Cette différence est
significative pour les deux paires [pour la paire /d /vs. /dd/ : t= 19,69, df= 5, p<0,0001 et pour
la paire /g/ vs. /gg/ : t= 16,06, df= 5, p<0,0001]. Cette observation confirme que la durée
160
d’occlusion est le paramètre acoustique principal pour distinguer les simples des géminées
dans les deux vitesses d’élocution.
Figure 46 : Valeurs intrasegmentales les occlusives sonores en vitesse d’élocution normale à gauche et en
vitesses d’élocution rapide à droite.
Le Tableau 23 donne les valeurs des moyennes et des écarts-types pour les paramètres
intrasegmentaux de six locuteurs. Au regard des écarts-types, la variabilité est réduite aussi
bien pour la durée de l’occlusion que pour le VOT, et cela pour les simples et les géminées.
Tableau 23 : Valeurs moyennes et les écarts-types des durées intrasegmentales des occlusives sonores en vitesses
d’élocution normale et rapide en (ms).
Simple Géminée
tenue vot tenue vot
/ada/ vs /adda/ VN Moyenne 62,63 21,35 188,45 22,07
Ecart type 5,48 3,67 10,87 4,23
/ada/ vs /adda/ VR Moyenne 44,02 16,98 138,50 16,55
Ecart type 2,52 2,94 8,70 2,32
/aga/ vs /agga/ VN Moyenne 63,78 26,60 161,98 27,78
Ecart type 3,86 4,83 19,93 3,53
/aga/ vs /agga/ VR Moyenne 48,95 23,37 120,12 23,77
Ecart type 4,14 3,17 8,81 3,07
161
4) Bien qu’il existe une interaction entre la gémination et la vitesse d’élocution pour
les 2 paires /d/ vs. /dd/ et /g/ vs. /gg/, la différence significative de la durée de la
tenue consonantique ou de la durée de l’occlusion entre les géminées en vitesse
d’élocution rapide et les simples en vitesse d’élocution normale confirme la
robustesse de ces deux paramètres pour distinguer les simples des géminées même
en faisant varier la vitesse d’élocution.
162
Figure 47 : Valeurs intersegmentales des occlusives sonores en vitesse d’élocution normale à gauche et en
vitesse d’élocution rapide à droite.
Le Tableau 24 indique les valeurs des moyennes et les faibles valeurs des écarts-types
des paramètres intersegmentaux des six locuteurs. Les résultats sont comparables à ceux
observés en position intervocalique.
Tableau 24 : Valeurs moyennes et les écarts-types des durées intersegmentales des occlusives sonores en vitesses
d’élocution normale rapide en (ms).
Simple Géminée
simple a géminée a
/da/ vs /dda/ VN Moyenne 107,60 169,38 211,42 169,35
Ecart type 18,15 32,57 18,63 29,91
/da/ vs /dda/ VR Moyenne 77,48 107,43 162,58 104,08
Ecart type 21,16 8,20 21,39 10,67
/ga/ vs /gga/ VN Moyenne 109,38 132,45 196,67 133,07
Ecart type 13,12 30,32 7,57 29,92
/ga/ vs /gga/ VR Moyenne 81,67 82,05 152,27 80,82
Ecart type 15,69 16,53 19,17 15,99
Ici aussi, seule la durée de l’occlusion permet de différencier les simples des géminées,
et cela dans les deux conditions de vitesses d’élocution normale (Figure 48, à gauche) et
rapide (Figure 48, à droite). La durée du VOT, elle, ne semble pas contribuer à la distinction
des catégories. Les données statistiques sont les suivantes : [t= 11,92, df= 5, p<0,0001 pour
/d/ vs. /dd/ et t= 16,67, df= 5, p<0,0001 pour /g/ vs. /gg/].
163
/g/ VR et pour les géminées : t= 6,497, df= 5, p=0,0013 pour /dd/ VN vs. /dd/ VR et t= 6,252,
df= 5, p=0,0015 pour /gg/ VN vs. /gg/ VR]. Néanmoins, la durée de l’occlusion permet
toujours de distinguer les simples des géminées [t= 9,626, df= 5, p=0,0002 pour /d/ vs. /dd/ et
t= 15,60, df= 5, p<0,0001 pour /g/ vs. /gg/].
Figure 48 : Valeurs intrasegmentales des occlusives sonores en vitesse d’élocution normale à gauche et en
vitesses d’élocution rapide à droite.
Le Tableau 25 indique les valeurs des moyennes et des écarts-types pour les paramètres
intrasegmentaux des six locuteurs. Là encore, les écarts-types de la durée de l’occlusion et de
la durée du VOT sont faibles.
164
Tableau 25 : Valeurs moyennes et les écarts-types des durées des occlusives sonores en vitesses d’élocution
normale rapide en (ms).
Simple Géminée
tenue vot tenue vot
/da/ vs /dda/ VN Moyenne 86,38 21,22 190,70 20,72
Ecart type 16,33 2,29 18,14 1,94
/da/ vs /dda/ VR Moyenne 59,72 17,77 144,93 17,65
Ecart type 18,58 3,42 19,79 3,34
/ga/ vs /gga/ VN Moyenne 79,12 30,27 167,17 29,50
Ecart type 12,78 3,24 9,07 3,33
/ga/ vs /gga/ VR Moyenne 57,13 24,53 127,20 25,07
Ecart type 11,91 4,52 15,48 4,73
Nos résultats nous permettent de constater qu’en position initiale, et au niveau du timing
intersegmental, c’est toujours la durée de la tenue consonantique qui permet de différencier
les occlusives sonores simples des occlusives sonores géminées, malgré l’augmentation de la
vitesse d’élocution. Nous confirmons, dans cette position initiale de mot aussi, la pertinence
de l’occlusion consonantique en tant que paramètre temporel efficace pour distinguer les
consonnes simples des géminées. L’augmentation de la vitesse d’élocution a bien été
effectuée par nos locuteurs, puisque tous les segments ont été comprimés en vitesse
d’élocution rapide.
Comme en position initiale, les résultats ici sont semblables, à savoir qu’en vitesse
d’élocution normale (Figure 49, à gauche), c’est toujours la tenue consonantique qui est le
paramètre significatif [t= 12,53, df= 5, p<0,0001 pour /d/ vs. /dd/ et t= 10,07, df= 5, p=0,0002
pour /g/ vs. /gg/] pour distinguer les simples des géminées. La tenue consonantique des
géminées est systématiquement plus longue, et de manière importante pour cette catégorie par
rapport aux simples. Ici aussi, l’autre paramètre intersegmental, la durée de V1, ne permet pas
de différencier les deux classes.
En vitesse d’élocution rapide (Figure 49, à droite), tous les paramètres intersegmentaux
sont comprimés de manière significative [pour les simples : t= 3,522, df= 5, p=0,0169 pour /d/
165
VN vs. /d/ VR et t= 4,926, df= 5, p=0,0044 pour /g/ VN vs. /g/ VR et pour les géminées : t=
3,472, df= 5, p=0,0178 pour /dd/ VN vs. /dd/ VR et t= 4,938, df= 5, p=0,0043 pour /gg/ VN
vs. /gg/ VR]. Malgré cette compression de la durée des paramètres, le scénario reste le même
qu’en vitesse d’élocution normale. En effet, en vitesse d’élocution rapide, la distinction entre
simples et géminées se fait grâce à une tenue consonantique significativement plus longue [t=
15,07, df= 5, p<0,0001 pour /d/ vs. /dd/ et t= 10,70, df= 5, p=0,0001 pour /g/ vs. /gg/].
Figure 49 : Valeurs intersegmentales des occlusives sonores en vitesse d’élocution normale à gauche et en
vitesse d’élocution rapide à droite.
Le Tableau 26 indique les valeurs moyennes et les écarts-types pour les paramètres
intersegmentaux des six locuteurs. Notons que les écarts-types restent relativement faibles
pour la tenue consonantique, confirmant ainsi une bonne maîtrise de ce paramètre temporel,
quelle que soit la condition de vitesse d’élocution.
166
Tableau 26 : Valeurs moyennes et les écarts-types des durées intersegmentales des occlusives sonores en vitesses
d’élocution normale et rapide en (ms).
Simple Géminée
a simple a géminée
/ad/ vs /add/ VN Moyenne 116,22 77,62 116,42 167,57
Ecart type 27,35 22,87 25,94 15,33
/ad/ vs /add/ VR Moyenne 82,88 54,63 80,83 142,40
Ecart type 15,03 8,03 13,26 8,59
/ag/ vs /agg/ VN Moyenne 136,77 80,58 133,62 165,12
Ecart type 12,28 8,70 16,59 22,47
/ag/ vs /agg/ VR Moyenne 87,77 62,53 87,22 126,78
Ecart type 10,72 10,30 7,95 17,48
En position finale de mot, les données révèlent qu’au niveau du timing intersegmental,
c’est décidemment la durée de la tenue consonantique qui permet de différencier les
occlusives sonores simples des occlusives sonores géminées, et cela même en vitesse
d’élocution rapide. Il en va de même de l’occlusion consonantique en tant que paramètre
temporel efficace pour distinguer les consonnes simples des géminées. L’augmentation de la
vitesse d’élocution a bien été effectuée par nos locuteurs, puisque tous les segments ont été
comprimés en vitesse d’élocution rapide.
A travers cette étude, nous avons pu montrer que la durée de la tenue consonantique des
occlusives, ainsi que celle de l’occlusion des sonores géminées étaient significativement plus
longues que celle des occlusives sonores simples. Cela est vérifiable dans les deux conditions
de vitesses d’élocution, dans les trois positions de mot, à savoir à l’intervocalique, à l’initiale
et en finale. Étant donné que les différences de durée, obtenues pour ces deux paramètres
temporels de prédilection, sont maintenues en condition de vitesse d’élocution rapide, et
malgré la compression subie par tous les segments, ils confirment ainsi leur robustesse dans
la distinction phonologique de la gémination, dans ce contexte voisé, tout comme dans le
contexte non voisé étudié supra.
En ce qui concerne les constrictives non voisées et voisées, nous allons essentiellement
procéder à l’analyse de leurs durées intersegmentales, n’ayant pas effectué une détection, peu
aisée, du VOT (Klatt, 1975) pour cette catégorie de consonnes et, en conséquence, d’un
intervalle intrasegmental clairement occlusif. Comme pour les occlusives, nous examinerons
les éventuels indices responsables de la distinction, d’abord, entre les constrictives non
voisées simples et géminées, puis entre leurs homologues voisées, et cela pour les trois
positions.
167
La question qui se pose ici, pour les consonnes constrictives qui ont un degré de
striction moindre que les occlusives, est de savoir si le contrôle temporel, dans la réalisation
du contraste phonologique de la gémination, est similaire, au moins au niveau intersegmental,
à celui de leurs homologues occlusives.
Nous retrouvons pour cette catégorie de consonnes, des résultats similaires à ceux
constatés pour les occlusives. En effet, en vitesse d’élocution normale (Figure 50, à gauche),
le paramètre saillant de la gémination est toujours la tenue consonantique, car elle est
significativement différente entre les simples et les géminées [t= 18,75, df= 5, p<0,0001 pour
/s/ vs. /ss/ et t= 15,53, df= 5, p<0,0001 pour // vs. //]. De même, la tenue consonantique de
la catégorie des géminées est systématiquement et remarquablement plus longue par rapport à
celle de leurs homologues simples. En revanche, les autres paramètres intersegmentaux, la
durée de V1 et V2, ne permettent pas de différencier les deux classes.
168
Figure 50 : Valeurs intersegmentales des constrictives sourdes en vitesse d’élocution normale à gauche et en
vitesses d’élocution rapide à droite.
Le Tableau 27 indique les valeurs des moyennes et des écarts-types des paramètres
intersegmentaux des six locuteurs. Notons que les écarts-types restent relativement faibles
pour la tenue consonantique, semblant ainsi confirmer un bon contrôle temporel des relations
intersegmentales, quelle que soit la condition de vitesse d’élocution.
Tableau 27 : Valeurs moyennes et les écarts-types des durées intersegmentales des constrictives sourdes en
vitesses d’élocution normale et rapide en (ms).
Simple Géminée
a simple a a géminée a
/asa/ vs /assa/ VN Moyenne 99,40 128,30 115,12 94,35 210,75 119,83
Ecart type 15,40 14,06 11,89 12,67 8,37 13,19
/asa/ vs /assa/ VR Moyenne 67,88 89,47 70,68 67,90 165,08 68,25
Ecart type 5,07 7,07 13,36 5,82 10,72 15,12
/acha/ vs /achcha/ VN Moyenne 90,63 123,13 123,08 86,97 211,50 126,33
Ecart type 9,58 17,70 25,11 10,49 13,57 26,37
/acha/ vs /achcha/ VR Moyenne 61,83 89,65 78,22 61,55 167,85 73,70
Ecart type 8,46 19,10 16,88 5,39 17,51 16,99
169
8.3.1 Les constrictives sourdes en position initiale
Les observations faites pour la position intervocalique sont semblables à celles que l’on
peut faire pour la position initiale ; pour les consonnes sourdes en vitesse d’élocution normale
(Figure 51, à gauche), la tenue consonantique est significativement plus longue pour la classe
des géminées par rapport aux simples [t= 28,54, df= 5, p<0,0001 pour /s/ vs. /ss/ et t= 26,92,
df= 5, p<0,0001 pour // vs. //]. En revanche, la voyelle suivante ne contribue pas à
différencier les deux classes phonologiques.
En vitesse d’élocution rapide (Figure 51, à droite), la compression des paramètres
intersegmentaux est de mise, et cela de manière significative [pour les simples : t= 6,706, df=
5, p=0,0011 pour /s/ VN vs. /s/ VR et t= 7,392, df= 5, p=0,0007 pour // VN vs. // VR et pour
les géminées : t= 5,432, df= 5, p=0,0029 pour /ss/ VN vs. /ss/ VR et t= 6,666, df= 5, p=0,0011
pour // VN vs. // VR]. De plus, la tenue consonantique des géminées reste
significativement plus longue que celle des simples [t= 13,32, df= 5, p<0,0001 pour /s/ vs. /ss/
et t= 24,46, df= 5, p<0,0001 pour // vs. //].
Comme précédemment, nous n’observons pas d’interaction de la durée de la tenue
consonantique entre la gémination et la vitesse d’élocution pour les constrictives sourdes en
position initiale du mot [pour la paire /s/ vs. /ss/ : F(1,20) = 1,846, p=0,1894; pour la paire //
vs. // : F(1,20) = 0,7391, p=0,4001]. De manière concordante, la différence de la durée de la
tenue consonantique entre les géminées en vitesse d’élocution rapide et les simples en vitesse
d’élocution normale est significative [pour la paire /s /vs. /ss/ : t= 7,540, df= 5, p=0,0007 et
pour la paire // vs. // : t= 6,728, df= 5, p=0,0011]. Tous ces résultats confirment que la
tenue consonantique est le correlat acoustique principal pour distinguer les simples des
géminées quelle que soit la vitesse d’élocution.
Figure 51 : Valeurs intersegmentales des constrictives sourdes en vitesse d’élocution normale à gauche et en
vitesses d’élocution rapide à droite.
170
Le Tableau 28 indique les moyennes et les écarts-types des paramètres intersegmentaux
mesurés chez les six locuteurs. Les résultats montrent des écarts-types faibles.
Tableau 28 : Valeurs moyennes et les écarts-types des durées des constrictives sourdes en vitesses d’élocution
normale et rapide.
Simple Géminée
simple a géminée a
/sa/ vs /ssa/ VN Moyenne 112,00 119,42 202,82 120,03
Ecart type 12,67 14,00 13,23 15,04
/sa/ vs /ssa/ VR Moyenne 82,85 79,25 157,30 75,52
Ecart type 10,26 6,90 20,73 6,31
/cha/ vs /chcha/ VN Moyenne 123,83 145,87 214,67 142,98
Ecart type 12,92 24,01 19,88 23,43
/cha/ vs /chcha/ VR Moyenne 86,28 88,23 166,10 85,87
Ecart type 11,13 11,65 17,30 9,77
Le scénario reste inchangé par rapport aux deux positions précédentes. En vitesse
d’élocution normale (Figure 52, à gauche), la tenue consonantique est plus longue pour les
géminées [t= 24,40, df= 5, p<0,0001 pour /s/ vs. /ss/ et t= 22,76, df= 5, p<0,0001 pour // vs.
//].
Il en est de même en vitesse d’élocution rapide (Figure 52, à droite) [pour les simples :
t= 6,313, df= 5, p=0,0015 pour /s/ VN vs. /s/ VR et t= 5,933, df= 5, p=0,0019 pour // VN vs.
// VR et pour les géminées : t= 4,505, df= 5, p=0,0064 pour /ss/ VN vs. /ss/ VR et t= 4,698,
df= 5, p=0,0053 pour // VN vs. // VR]. La distinction entre les simples et les géminées est
maintenue grâce à une différence significative de la tenue consonantique [t= 18,34, df= 5,
p<0,0001 pour /s/ vs. /ss/ et t= 17,39, df= 5, p<0,0001 pour // vs. //].
Figure 52 : Valeurs intersegmentales des constrictives sourdes en vitesse d’élocution normale à gauche et en
vitesses d’élocution rapide à droite.
Tableau 29 : Valeurs moyennes et les écarts-types des durées intersegmentales des constrictives sourdes en
vitesses d’élocution normale et rapide en (ms).
Simple Géminée
a simple a géminée
/as/ vs /ass/ VN Moyenne 111,45 130,17 108,32 231,25
Ecart type 17,38 14,84 16,68 21,09
/as/ vs /ass/ VR Moyenne 74,08 93,88 71,72 185,92
Ecart type 12,72 7,18 11,97 9,09
/ach/ vs /achch/ VN Moyenne 115,03 125,08 114,35 226,70
Ecart type 17,88 13,15 15,24 20,17
/ach/ vs /achch/ VR Moyenne 77,98 91,50 76,12 177,68
Ecart type 12,66 7,33 9,10 11,36
Lorsque les constrictives sourdes sont en position finale du mot, la tenue consonantique
reste le paramètre temporel critique pour assurer la distinction entre constrictives simples et
constrictives géminées, quelle que soit la condition de vitesse d’élocution. Ce résultat révèle
172
ainsi que ce paramètre résiste à la compression des segments, induite par l’augmentation de la
vitesse d’élocution.
Nos données indiquent que la durée de la tenue consonantique des constrictives non voisées
géminées est plus longue que celle des simples, et ce pour toutes les positions :
intervocalique, initiale et finale de mot. La durée des voyelles adjacentes ne contribue pas à
différencier les catégories phonologiques. Si tous les segments sont comprimés avec
l’augmentation de la vitesse d’élocution, le maintien du contraste phonologique repose tout
de même sur cette différence de durée de la tenue consonantique entre consonnes simples et
géminées.
Nous allons maintenant étudier les durées intersegmentales des constrictives voisées
simples et géminées, toujours dans les trois positions de mots, et dans les deux conditions de
vitesse d’élocution.
En vitesse d’élocution rapide (Figure 53, à droite), les paramètres intersegmentaux sont
comprimés de manière significative [pour les simples : t= 4,608, df=5, p=0,0058 pour /z/ VN
vs. /z/ VR et t= 2,630, df= 5, p=0,0465 pour // VN vs. // VR et pour les géminées : t= 6,697,
df= 5, p=0,0011 pour /zz/ VN vs. /zz/ VR et t= 4,235, df= 5, p=0,0082 pour // VN vs. //
VR]. Malgré la compression de la durée des paramètres, le scénario reste le même qu’en
vitesse d’élocution normale. [t= 24,71, df= 5, p<0,0001 pour /z/ vs. /zz/ et t= 21,42, df= 5,
p<0,0001 pour // vs. //].
Figure 53 : Valeurs intersegmentales des constrictives sonores en vitesse d’élocution normale à gauche et en
vitesses d’élocution rapide à droite.
Le Tableau 30 donne les valeurs des moyennes et des écarts-types des paramètres
intersegmentaux pour les six locuteurs et montrent des valeurs faibles pour les écarts-types.
Tableau 30 : Valeurs moyennes et écarts-types des durées intersegmentales des constrictives sonores en vitesses
d’élocution normale rapide en (ms).
Simple Géminée
a simple a a géminée a
/aza/ vs /azza/ VN Moyenne 112,35 83,32 140,22 109,72 180,50 136,98
Ecart type 19,19 15,94 17,68 19,64 17,34 18,22
/aza/ vs /azza/ VR Moyenne 70,50 62,43 89,50 73,48 142,62 87,50
Ecart type 6,24 10,84 10,69 9,51 12,39 9,02
/aja/ vs /ajja/ VN Moyenne 107,73 82,17 132,30 109,78 184,72 139,65
Ecart type 18,03 21,95 13,05 21,62 16,77 17,38
/aja/ vs /ajja/ VR Moyenne 71,55 61,40 95,53 74,53 153,52 98,88
Ecart type 8,82 10,93 7,89 8,57 17,25 6,27
174
8.4.2 Les constrictives sonores en position initiale
La classe des géminées reste distincte de celle des simples (Figure 54, à gauche), [t=
21,36, df= 5, p<0,0001 pour /z/ vs. /zz/ et t= 25,76, df= 5, p<0,0001 pour // vs. //]. Le
constat est le même en vitesse d’élocution rapide (Figure 54, à droite), [pour les simples : t=
8,239, df=5, p=0,0004 pour /z/ VN vs. /z/ VR et t= 7,442, df= 5, p=0,0007 pour // VN vs. //
VR et pour les géminées : t= 5,297, df= 5, p=0,0032 pour /zz/ VN vs. /zz/ VR et t= 6,570, df=
5, p=0,0012 pour // VN vs. // VR]. La tenue consonantique des géminées demeure
significativement plus longue que celle des simples [t= 22,55, df= 5, p<0,0001 pour /z/ vs.
/zz/ et t= 16,65, df= 5, p<0,0001 pour // vs. //].
Comme observé en position intervocalique, il n’y a pas d’interaction de la durée de la
tenue consonantique entre la gémination et la vitesse d’élocution pour les constrictives
sonores en position initiale du mot [pour la paire /z/ vs. /zz/ : F(1,20) = 1,188, p=0,2888; pour
la paire // vs. // : F(1,20) = 0,4606, p=0,5051]. Il y a également une différence significative
de la durée de la tenue consonantique entre les géminées en vitesse d’élocution rapide et les
simples en vitesse d’élocution normale [pour la paire /z /vs. /zz/ : t= 9,473, df= 5, p=0,0002 et
pour la paire // vs. // : t= 12,71, df= 5, p<0,0001]. Ces résultats confirment que la durée de
la tenue consonantique permet la distinction entre les consonnes simples et les consonnes
géminées quelle que soit la vitesse d’élocution.
Figure 54 : Valeurs intersegmentales des constrictives sonores en vitesse d’élocution normale à gauche et en
vitesses d’élocution rapide à droite.
175
Tableau 31 : Valeurs moyennes et les écarts-types des durées intersegmentales des constrictives sonores en
vitesses d’élocution normale et rapide en (ms).
Simple Géminée
simple a géminée a
/za/ vs /zza/ VN Moyenne 97,12 174,12 197,05 176,38
Ecart type 13,12 33,48 15,78 35,17
/za/ vs /zza/ VR Moyenne 72,03 109,10 157,12 105,37
Ecart type 14,81 12,61 21,76 8,47
/ja/ vs /jja/ VN Moyenne 97,23 181,17 194,22 182,52
Ecart type 15,16 35,66 13,43 34,48
/ja/ vs /jja/ VR Moyenne 73,53 112,08 161,52 110,12
Ecart type 16,25 13,67 19,51 14,13
Comme pour les positions précédentes, nous n’obtenons pas d’interaction de la durée de
la tenue consonantique entre la gémination et la vitesse d’élocution pour les constrictives
sonores en position finale du mot [pour la paire /z/ vs. /zz/ : F(1,20) = 0,2161, p=0,6470; pour
la paire // vs. // : F(1,20) = 0,1632, p=0,6905]. Nous observons également une différence
significative de la durée de la tenue consonantique entre les géminées en vitesse d’élocution
176
rapide et les simples en vitesse d’élocution normale [pour la paire /z /vs. /zz/ : t= 10,51, df= 5,
p=0,0001 et pour la paire // vs. // : t= 7,223, df= 5, p=0,0008]. En conclusion, la durée de la
tenue consonantique demeure la bonne variable acoustique pour distinguer les simples des
géminées quelle que soit la vitesse d’élocution.
Figure 55 : Valeurs intersegmentales des constrictives sonores en vitesse d’élocution normale à gauche et en
vitesses d’élocution rapide à droite.
Tableau 32 : Valeurs moyennes et les écarts-types des durées intersegmentales des constrictives sonores en
vitesses d’élocution normale et rapide en (ms).
Simple Géminée
a simple a géminée
/az/ vs /azz/ VN Moyenne 153,37 105,57 147,90 199,95
Ecart type 22,67 18,55 21,86 28,96
/az/ vs /azz/ VR Moyenne 97,42 74,55 93,25 157,68
Ecart type 15,27 8,81 14,76 15,19
/aj/ vs /ajj/ VN Moyenne 148,68 96,55 142,42 188,12
Ecart type 25,28 15,13 23,60 19,35
/aj/ vs /ajj/ VR Moyenne 91,33 69,12 86,33 148,68
Ecart type 4,81 4,08 4,41 7,99
En position finale, nous avons montré que la durée de la tenue consonantique des
constrictives sonores géminées est plus longue que celle de leurs homologues simples. Nous
avons obtenu le même résultat pour les constrictives sonores en position intervocalique et en
position initiale. Tous les segments, vocaliques et consonantiques, subissent une compression
avec l’augmentation de la vitesse d’élocution.
177
Dans cette partie, nous avons mesuré la durée des consonnes simples et géminées dans trois
positions : intervocalique, initiale non absolue et finale non absolue, produites à deux vitesses
d’élocution, normale et rapide.
Nous avons mesuré les durées intersegmentales pour les consonnes simples et géminées dans
les trois positions citées ci-dessus. Pour toutes les consonnes, simples et géminées, produites
en vitesse d'élocution normale ou rapide, la durée de la tenue consonantique est l’indice
principal qui permet de les distinguer.
Nous avons aussi relevé les durées intrasegmentales des occlusives sourdes et sonores en
vitesse d’élocution normale et rapide. Les durées intrasegementales ont été prélevées pour les
sourdes en position intervocalique, en initiale et finale non absolue, et uniquement en
position intervocalique et initiale non absolue pour les sonores. L’analyse a permis de
conclure que la durée du silence acoustique est le corrélat principal qui permet de distinguer
les occlusives sourdes simples de leurs homologues géminés. Pour les occlusives sonores
simples et géminées, c’est la durée de l’occlusion qui sert à distinguer les deux catégories.
La compression des segments, provoquée par l’augmentation de la vitesse d’élocution, ne
nuit pourtant pas au maintien du contraste phonologique.
178
PARTIE 3
Le contrôle spatiotemporel de la
gémination
179
9 Le contrôle spatiotemporel de la gémination
Rappelons que le phénomène de la gémination fait partie d’un cas particulier de
production de séquences motrices en parole, à savoir l’exécution supposée de deux gestes
identiques simultanément. Vaxelaire (2007) souligne que la mise en lumière des principes de
contrôle spatiotemporel pour ces types d’actions motrices est nécessaire pour la modélisation
des systèmes biologiques moteurs en général. Elle signale que c’est l’incapacité d’intégrer de
tels principes de coordination dans certains modèles de type parallèle (cf. Rumelhart &
Norman, 1982) pour la production du doubling en dactylographie qui avait conduit d’autres
chercheurs (par ex. Jordan, 1988) à élaborer des réseaux séquentiels (Sock ,1998).
180
différences au niveau de la taille de certaines constrictions dans le conduit vocal, selon que la
voyelle soit brève ou longue.
L’observation des stratégies spatiotemporelles, déployées pour opposer les simples aux
géminées, se fera en fonction de la position des séquences cibles dans les mots.
- L’ouverture de la constriction ;
- La constriction pharyngale ;
- L’aperture labiale ;
- La position du larynx ;
- L’étendue du contact.
181
Les quatre premiers paramètres seront étudiés aussi bien dans leur dimension spatiale
(mm) que temporelle (ms). Les paramètres supraglottiques (l’ouverture de la constriction, la
constriction pharyngale et l’aperture labiale) seront analysés séparément des paramètres plutôt
glottiques (la position du larynx et la position de l’os hyoïde). En ce qui concerne l’étendue
du contact, elle sera examinée à part sur des vues de profil, vu sa nature purement spatiale
(voir Chapitre 11).
182
147). Le geste pour la réalisation du contact apico-alvéolaire semble entraîner la masse de la
langue vers la partie frontale de la cavité buccale, ce qui serait à l’origine d’une augmentation
de la taille de la constriction au niveau de la cavité pharyngale, aussi bien pour la consonne
simple que pour son homologue géminée de V à C, puis à V. La taille de la cavité pharyngale
semble être plus grande pour la géminée, comparée à la simple (une différence maximale de
10 mm). Cette augmentation de la taille de la cavité pharyngale persiste durant le contact
alvéolaire, et se maintient plus longtemps pour la géminée, comparée à la consonne simple.
L’observation du timing des gestes dans le contexte /ata/ laisse entrevoir une
anticipation des gestes linguaux et du geste labial, pour la production de la consonne, déjà
dans les configurations du conduit vocal, associées à la voyelle /a/. En effet, on peut voir que
le déplacement de l’apex pour la réalisation du contact apical, ainsi que celui de la langue au
niveau pharyngal, et la réduction de l’aperture labiale sont tous entamés durant la réalisation
de la voyelle /a/ précédente (image 145). En ce qui concerne la géminée /atta/, l’anticipation
des gestes articulatoires pour la réduction de l’aperture labiale et pour le contact apical se fait
plus tôt dans les configurations vocaliques, par rapport à la consonne simple. En outre, on voit
que l’anticipation du geste apical se fait plus précocement, par rapport aux gestes pharyngal et
labial, pour ce locuteur ; il nous reste à vérifier, infra, si ce dernier comportement apparaîtra
chez le second locuteur. Au relâchement de la consonne, on constate que les gestes pour
réaliser le /a/ post-consonantique sont déclenchés de manière anticipatoire, avec une réduction
de la taille de la cavité pharyngale et une augmentation de l’aperture labiale. Cependant, ces
gestes vocaliques anticipatoires se mettent en place de façon plus graduelle pour la consonne
géminée, pour en quelque sorte accorder plus de temps à la réalisation de la gémination.
Pour résumer, l’analyse des données de ce locuteur (Kh), révèle que nos paramètres
articulatoires, à savoir l’ouverture de la constriction, la constriction pharyngale et l’aperture
labiale sont de bons candidats pour l’organisation spatiotemporelle de la production de la
consonne simple et de son homologue géminée, dans ce contexte apical. Le contact apical est
positivement « corrélé » avec l’aperture labiale, ces deux derniers paramètres étant
inversement « corrélés » avec la constriction pharyngale. En se focalisant sur le timing de ces
trois paramètres articulatoires, nous constatons que c’est le contact apical, plus long pour la
géminée, qui est le paramètre de prédilection de la distinction phonologique simple vs.
géminée. Il est accompagné de l’augmentation de la constriction pharyngale et de la réduction
de l’aperture labiale, qui durent plus longtemps pour la géminée comparée à la simple, durant
le contact alvéolaire.
183
Avons-nous affaire ici à un comportement qui serait spécifique à ce locuteur ou
pouvons-nous observer des stratégies articulatoires similaires chez le second locuteur ? Si cela
est le cas, la pertinence de ces paramètres dans la réalisation de la gémination pourrait être
davantage renforcée.
Kh
ata atta
30 30
25 a t a 25 a tt a
Déplacement (mm)
Overture de la
Déplacement (mm)
Overture de la
constriction constriction
20 20
Constriction Constriction
pharyngale
15 pharyngale 15
Aperture labiale
Aperture labiale
10 10
5
5
0
141 142 143 144 145 146 147 148 149 150 151 152 153 0
602 603 604 605 606 607 608 609 610 611 612 613 614
Images en unités de 40 ms
Images en unités de 40 ms
Ici aussi, le timing relatif du geste labial et des gestes linguaux est structurellement
comparable pour les deux termes de l’opposition phonologique. L’amplitude des gestes reste
comparable entre la consonne simple et la consonne géminée. Au niveau du contrôle
temporel, l’ouverture de la constriction confirme un contact apical plus long pour la consonne
géminée (images 633 à 636), par rapport à son homologue simple (images 187 et 188). La
trajectoire de l’aperture labiale évolue dans la même direction que celle pour réaliser le
contact lingual, et cette aperture minimale dure plus longtemps pour la géminée (images 633 à
636) que pour la simple (images 187 à 188). Est-ce le geste pour la réalisation du contact
apical qui entraîne la masse de la langue vers la partie frontale de la cavité buccale, ce qui
serait à l’origine d’une augmentation de la taille de la constriction au niveau de la cavité
pharyngale, est le même pour la consonne simple que pour son homologue géminée ? Ou est-
ce que ces deux gestes linguaux sont différenciés ? Nous pourrons, peut-être, apporter des
éléments de réponse à cette interrogation lorsque nous étudierons la réalisation de la
gémination en contexte vélaire. Comme pour le locuteur précédent, la taille de la cavité
pharyngale est légèrement plus grande pour la géminée, comparée à la simple (une différence
maximale de 20 mm). Cette augmentation de la taille de la cavité pharyngale perdure pendant
184
le contact apico-alvéolaire, et se maintient plus longtemps pour la géminée, comparée à la
consonne simple.
Les stratégies anticipatoires sont comparables pour les deux locuteurs. En effet, les
gestes articulatoires pour la production de la consonne démarrent, pour ce locuteur aussi, dans
les configurations ouvertes associées à la production de la voyelle. En ce qui concerne la
géminée /atta/, il est vrai que les gestes anticipatoires sont initiés plus tôt durant la production
de la voyelle précédente, comparée à la consonne simple. En revanche, l’anticipation du geste
apical ne se fait pas plus tôt, par rapport aux gestes pharyngal et labial, pour ce second
locuteur ; il ne s’agit pas, semble-t-il, d’un comportement à relier explicitement à la
réalisation de la gémination. Les gestes vocaliques anticipatoires pour le /a/ subséquent,
émergent, ici également, de façon plus graduelle pour la consonne géminée pour, nous
supposons, accorder plus de temps à la réalisation de la gémination.
En résumé, étant donné que l’analyse des données de ce locuteur F fait apparaître des
ressemblances notoires dans le comportement des paramètres articulatoires retenus, comparé
au comportement observé chez le locuteur Kh, nous pouvons poser qu’il s’agit là
effectivement de bons candidats pour la mise au jour de l’organisation spatiotemporelle de la
production de la consonne simple et de son homologue géminée, dans ce contexte apical.
Signalons toutefois, que les gestes de transition des configurations vocaliques ouvrantes aux
configurations consonantiques fermantes, montrent une plus grande dynamique chez le
locuteur Kh par rapport au locuteur F ; cela serait imputable à des spécificités individuelles.
F
ata atta
30 30
Constriction
25
a t a Opening
25
a tt a Constriction
Déplacement (mm)
Opening
Déplacement (mm)
Pharynx
20 20 Pharynx
Constriction
Constriction
Aperture labiale
15 15
Aperture labiale
10 10
5 5
0 0
182 183 184 185 186 187 188 189 190 191 192 629 630 631 632 633 634 635 636 637 638 639 640
Images en unités de 40 ms Images en unités de 40 ms
185
Le contexte vélaire /k/
Ayant observé des stratégies articulatoires similaires chez nos deux locuteurs, la
pertinence de ces paramètres dans la réalisation de la gémination semble devenir de plus en
plus plausible. Cela dit, il convient maintenant d’examiner le contexte vélaire pour pouvoir
évaluer la robustesse de ces stratégies articulatoires. C’est ce que nous proposons de faire
dans ce qui suit.
Le contact dorso-vélaire est plus long pour la géminée (images 642 à 645) que pour la
simple (images 184 à 185). Les deux autres paramètres accompagnent ce contact vélaire avec
un maintien d’une cavité pharyngale agrandie plus longtemps et d’une aperture labiale réduite
également plus longtemps pour la géminée, comparée à la simple. Etant donné que les zones
apicale et laminale de la langue ne sont pas activement sollicitées pour la réalisation de cette
consonne, on ne peut pas leur attribuer l’agrandissement du pharynx lors de la réalisation de
l’occlusion consonantique ; cette hypothèse paraissait plausible dans le contexte apical. Il
semble que cette augmentation de la taille de la cavité pharyngale soit une composante à part
entière de l’organisation spatiotemporelle de ces consonnes vélaires, et cela malgré le fait que
ces consonnes vélaires soient entourées de la voyelle radico-pharyngale /a/ qui, elle, exige une
constriction pharyngale réduite pour l’émergence de sa qualité acoustique. Les voyelles
adjacentes et les consonnes vélaires « négocient », en quelque sorte, la trajectoire du geste
lingual afin d’atteindre convenablement des configurations ouvrantes et fermantes,
respectivement.
186
Kh
aka akka
30 30
25
a k a 25
a k a
Déplacement (mm)
Déplacement (mm)
Overture de la Overture de la
20 constriction 20 constriction
Constriction Constriction
15 pharyngale 15 pharyngale
5 5
0 0
179 180 181 182 183 184 185 186 187 188 189 639 640 641 642 643 644 645 646 647 648 649 650
Images en unités de 40 ms Images en unités de 40 ms
Le contact dorso-vélaire est plus long pour la géminée (images 673 à 676) que pour la
simple (images 224 à 225). L’agrandissement de la cavité pharyngale durant le contact dorso-
vélaire demeure plus longtemps pour la géminée, par rapport à la simple. Il en va de même de
l’aperture labiale dont la réduction se maintient plus longtemps pour la géminée, comparée à
la simple. Les données pour ce locuteur, semblables à celles du locuteur précédent, nous
permettent maintenant de poser, en ce qui concerne l’augmentation de la taille de la cavité
pharyngale, qu’elle est à associer temporellement et spatialement à la production des
consonnes vélaires, simples et géminées. Cette augmentation de la taille du pharynx, ainsi que
sa durée, sont plus marquées chez les géminées. La consonne vélaire simple /k/ semble
résister moins aux influences du /a/. En effet, l’anticipation des gestes consonantiques, dans
les configurations vocaliques ouvrantes, démarre plus tardivement (image 223), comparée à
l’initiation plus précoce des gestes anticipatoires consonantiques de la géminée (images 671).
Dans la même veine d’une plus faible résistance coarticulatoire de la consonne simple, par
rapport à son homologue géminée, on constate une anticipation du geste vocalique de la
voyelle subséquente, relativement tôt dans les configurations associées à la consonne simple.
En effet la réduction de la constriction pharyngale pour produire le /a/ commence dès la
réalisation du contact vélaire (image 224), alors que cette réduction de la taille du pharynx
187
n’est initiée que tardivement durant le contact vélaire de la géminée (image 676). Les
données de ce locuteur confirment ici aussi que les gestes vocaliques anticipatoires pour le /a/
subséquent, émergent de façon plus graduelle pour la consonne géminée pour, nous le
supposions, accorder plus de temps à la réalisation de la gémination. Cela suggère que le
maintien du contraste phonologique, pour la réalisation de la gémination, prend le pas sur le
poids habituellement plus élevé de la voyelle par rapport à la consonne en contexte
coarticulatoire purement phonétique.
Si l’on compare les stratégies articulatoires des deux locuteurs, aucune spécificité
individuelle n’est décelable dans le contrôle spatiotemporel des gestes des articulateurs. On
peut signaler ici et là quelques différences d’amplitudes de mouvement des articulateurs ; ce
sont cependant des différences minimes qui ne doivent pas avoir de conséquences acoustiques
significatives.
F
aka akka
30 30
25
a k a 25
a kk a
Déplacement (mm)
Déplacement (mm)
20 20
Ouverture de la Ouverture de la
constriction constriction
15 15
Constriction Constriction
10 pharyngale 10 pharyngale
0 0
219 220 221 222 223 224 225 226 227 228 669 670 671 672 673 674 675 676 677 678 679 680
Images en unités de 40 ms Images en unités de 40 ms
Nous proposons, dans la suite de nos analyses, de reculer encore dans le conduit vocal
et voir ce qu’il en est des dorso-uvulaires /q/ et /qq/, se rapprochant ainsi du lieu d’articulation
pharyngal de la voyelle /a/. Il serait intéressant de savoir ainsi comment nos deux locuteurs
vont gérer le timing des gestes articulatoires, à mesure qu’un conflit potentiel entre gestes
vocaliques et gestes consonantiques s’accroît. Rappelons que la prise semi-automatique de
mesures dans ce contexte avait été problématique (cf. Chapitre 7), notamment en ce qui
concerne le suivi du contour lingual. Aussi, lorsque nous parlons de contact, il s’agit de
constats que nous avons faits à partir de l’analyse des vues de profil qui révèlent de véritables
contacts dorso-uvulaires, même si ceux-ci ne sont pas visibles dans les données quantitatives
étudiées ci-après.
188
Nos observations dans ce contexte uvulaire, pour le locuteur Kh (Figure 60), sont les
suivantes : les trajectoires des articulateurs sont globalement similaires entre la simple (à
gauche) et la géminée (à droite) ; l’ouverture de la constriction diminue dans les deux cas
pour réaliser le contact dorso-uvulaire ; le contact est plus long pour la géminée (images 657 à
659) que pour la simple (image 375) ; la constriction pharyngale diminue en même temps que
l’ouverture de la constriction, et elle dure plus longtemps pour la géminée que pour la simple ;
l’aperture labiale, elle, reste relativement stable durant la séquence entière, VCV.
Kh
aqa aqqa
30 30
a q a a qq a
Déplacement (mm)
25 25
Déplacement (mm)
Overture de la
Overture de la
constriction
20 20 constriction
Constriction
pharyngale Constriction
15 15 pharyngale
Aperture labiale
Aperture labiale
10 10
5 5
0 0
369 370 371 372 373 374 375 376 377 378 379 652 653 654 655 656 657 658 659 660 661 662 663 664
Images en unités de 40 ms Images en unités de 40 ms
La situation est quelque peu différente pour le locuteur F, chez qui seule la constriction
pharyngale augmente de manière continue, en vue de la production du /a/ suivant ; le geste est
clairement anticipatoire dans le contexte de la consonne simple (image 379), mais elle l’est
189
beaucoup moins dans le contexte de la géminée. Pour la consonne simple, l’ouverture de la
constriction, après le contact, s’agrandie de manière anticipatoire (image 379), pour
commencer à diminuer dans les configurations associées à la voyelle suivante. En ce qui
concerne la géminée, cette augmentation de l’ouverture de la constriction se fait tardivement
(image 831). Puis, elle reste stable durant la réalisation de la voyelle.
Ainsi, on peut dire qu’aucune stratégie anticipatoire ne semble être mise ici au service
de la réalisation de la gémination dans ce contexte, et que seul le locuteur F exploite le
phénomène de la rétention du geste consonantique, en contexte de la consonne géminée, afin
de marquer le contraste temporelle entre les deux termes de l’opposition phonologique.
F
aqa aqqa
30
30
25
a q a 25
a qq a
Déplacement (mm)
Ouverture de la Ouverture de la
Déplacement (mm)
20 constriction 20 constriction
Constriction Constriction
15 15
pharyngale pharyngale
5 5
0 0
373 374 375 376 377 378 379 380 381 382 823 824 825 826 827 828 829 830 831 832 833 834
Images en unités de 40 ms Images en unités de 40 ms
L’analyse des données de nos deux locuteurs, Kh et F, pour ces séquences VCV, où la
consonne est une occlusive sourde, révèle que nos paramètres articulatoires, à savoir
l’ouverture de la constriction, la constriction pharyngale et l’aperture labiale sont de bons
candidats pour l’étude de l’organisation spatiotemporelle de la production de la consonne
simple et de son homologue géminée, aussi bien dans le contexte alvéolaire que vélaire et
uvulaire. La trajectoire de ces trois paramètres, dans les configurations consonantiques
cibles, est structurellement similaire entre la simple et la géminée.
Au niveau spatial, si la réduction de l’ouverture de la constriction pour réaliser les contacts
alvéolaire et vélaire est toujours positivement « corrélée » avec la réduction de l’aperture
labiale, ces deux derniers paramètres sont inversement « corrélés » avec la constriction
pharyngale ; celle-ci augmente lorsque les deux autres paramètres diminuent. Pour ce qui
concerne la consonne uvulaire /q/, en revanche, la constriction pharyngale diminue en même
temps que l’ouverture de la constriction, alors que l’aperture labiale, elle, reste relativement
stable. Nous posons, au vu de ces résultats, que l’augmentation de la taille de la constriction
au niveau de la cavité pharyngale, aussi bien lors de la production de la consonne simple que
190
de son homologue géminée, n’est pas nécessairement attribuable au geste de protrusion de la
langue, vers la partie frontale de la cavité buccale, dans la réalisation du contact alvéolaire.
En effet, cette augmentation de la taille de la cavité pharyngale est aussi clairement visible en
contexte vélaire, un contexte qui ne favorise pas particulièrement une avancée de la masse
linguale. On peut donc, dans ce cas, supposer l’existence d’un geste typiquement
consonantique, avec la taille d’une constriction pharyngale spécifique, et un autre geste
typiquement vocalique, ayant une constriction pharyngale réduite, intrinsèque à la voyelle
radico-pharyngale /a/. Reste maintenant à vérifier cette supposition à partir d’observations en
contextes vocaliques d’une voyelle antérieure, telle que le /i/, par exemple.
Par rapport au timing de ces trois paramètres articulatoires, il est évident que c’est le contact
alvéolaire, vélaire et uvulaire, plus long pour la géminée, qui est le paramètre préférentiel de
la distinction phonologique simple vs. géminée. Dans le cas des consonnes alvéolaires et
vélaires, ce contact est accompagné de l’augmentation de la constriction pharyngale et de la
réduction de l’aperture labiale, qui durent plus longtemps pour la géminée comparée à la
simple, pendant l’occlusion. Le contact uvulaire, lui, est accompagné d’une réduction de la
constriction pharyngale, qui a une durée plus longue pour les géminées, comparées aux
simples. L’aperture labiale, pour l’uvulaire, reste relativement stable tout au long de la
production de la séquence VCV.
Toujours au niveau du timing articulatoire, nous avons constaté que les gestes anticipatoires,
pour produire les consonnes cibles, simples ou géminées, sont initiés plus précocement
durant la production de la voyelle précédente. Cette stratégie anticipatoire est encore plus
précoce pour les géminées, comparées aux consonnes simples, en contextes apical et vélaire.
Nous avons vu aussi, dans les contextes apical et vélaire, la mise en place d’une stratégie de
coarticulation rétentrice au service de la réalisation de la gémination, afin de marquer le
contraste temporelle entre les deux termes de l’opposition phonologique. Cette dernière
conduite motrice n’est pas généralisable en contexte uvulaire.
Nous tâcherons, dans ce qui suit, de savoir si le voisement peut avoir quelques influences sur
le contrôle spatiotemporel de la gémination, et cela à partir de l’examen de nos paramètres
supraglottiques.
191
Le contrôle spatiotemporel de la gémination : les occlusives voisées
Tout comme dans le contexte non voisé, une observation du timing des gestes dans ce
contexte /ada/ confirme l’anticipation des gestes linguaux et, à un degré moindre, du geste
labial, pour la production de la consonne, dès les configurations du conduit vocal, associées à
la voyelle /a/. Ce constat est plus visible dans le contexte géminé /adda/, où l’on peut voir en
192
effet que le déplacement de l’apex pour la réalisation du contact apical, ainsi que celui de la
langue au niveau pharyngal sont tous entamés durant la réalisation de la voyelle /a/ précédente
(image 679). Par rapport à la réduction de l’aperture labiale, celle-ci démarre certes de
manière anticipatoire (image 680) mais cette réduction reste relativement faible. En ce qui
concerne la simple /ada/ (Figure 62), seule l’anticipation du geste pour le contact alvéolaire se
fait tôt, et de manière claire, dans les configurations vocaliques (image 219), le geste labial
restant relativement stable.
Kh
30
ada adda
30
25
a d a 25 a dd a
Déplacement (mm)
Overture de la Overture de la
Déplacement (mm)
20 constriction constriction
20
Constriction Constriction
15 pharyngale 15 pharyngale
5 5
0 0
214 215 216 217 218 219 220 221 222 223 224 678 679 680 681 682 683 684 685 686 687 688 689
Images en unités de 40 ms Images en unités de 40 ms
L’analyse des données du second locuteur F (Figure 63) indique que nous n’avions pas
affaire à un comportement qui serait spécifique au locuteur précédent ; nous pouvons en effet
observer des stratégies articulatoires similaires chez ce second locuteur. Il semble, néanmoins,
que les stratégies anticipatoires de voyelles à consonnes soient déclenchées plus précocement
chez ce locuteur F, et cela de façon synchrone : par ex. à l’image 259 pour la simple, de
voyelle à consonne, et à l’image 715 pour la géminée, de voyelle à consonne.
F
ada adda
30 30
25 25
a d a a dd a Ouverture de la
Déplacement (mm)
Ouverture de la
constriction
Déplacement (mm)
20 constriction 20
Constriction Constriction
15 15 pharyngale
pharyngale
5 5
0 0
256 257 258 259 260 261 262 263 264 265 712 713 714 715 716 717 718 719 720 721 722 723 724
Images en unités de 40 ms Images en unités de 40 ms
193
Le contexte vélaire /g/
L’étude du timing des gestes dans le contexte vélaire pour nos consonnes voisées
confirme la tendance générale de l’évolution des trois paramètres, observée auparavant, dans
les séquences VCV : une augmentation de la taille de la constriction pharyngale durant le
contact, une réduction plus ou moins marquée de l’aperture labiale et l’émergence de gestes
anticipatoires. Les gestes consonantiques sont anticipés dans les configurations du conduit
vocal associées à la voyelle qui précède la consonne cible, et les gestes vocaliques pour la
production de la voyelle suivant la consonne cible sont préparés durant la phase obstruante du
conduit vocal. Les spécificités liées au locuteur (comparer Figure 64 et Figure 65) ne
semblent pas être pertinentes en termes de contrôle moteur.
Kh
aga agga
30 30
a g a a gg a
Déplacement (mm)
25 25
Déplacement (mm)
Overture de la Overture de la
20 constriction 20 constriction
Constriction Constriction
15 15 pharyngale
pharyngale
Aperture labiale
10 Aperture labiale 10
5 5
0 0
252 253 254 255 256 257 258 259 260 261 262 757 758 759 760 761 762 763 764 765 766 767 768
Images en unités de 40 ms Images en unités de 40 ms
F
aga agga
30 30
25 a g a 25 a gg a
Déplacement (mm)
Déplacement (mm)
Ouverture de la Ouverture de la
20 constriction 20 constriction
Constriction Constriction
15 pharyngale 15
pharyngale
10 Aperture labiale 10 Aperture labiale
5 5
0 0
293 294 295 296 297 298 299 300 301 302 303 304 48 49 50 51 52 53 54 55 56 57 58 59
194
La trajectoire de nos trois paramètres articulatoires, dans les configurations vocaliques
environnantes et les configurations consonantiques voisées cibles, est structurellement
similaire entre la simple et la géminée, même si cette similarité est moins marquante ici, par
rapport aux contextes non voisés, analysés supra.
Dans ce contexte voisé aussi, les « corrélations » entre les paramètres dans leurs trajectoires
sont comparables à celles observées en contexte non voisé : lorsque l’apex ou le dos de la
langue s’élèvent pour réaliser l’occlusion, la taille de la constriction au niveau pharyngale
augmente, et l’aperture labiale diminue, accompagnant ainsi le geste de la langue pour la
réalisation du contact. La diminution de l’aperture labiale dans le contexte vélaire est très peu
marquée, une partie significative des gestes supraglottiques se produisant plutôt dans la partie
arrière du conduit vocal, dans le contexte vélaire.
L’étude du timing des gestes nous révèle que le contact, nécessaire pour la réalisation de la
consonne, est plus long pour les géminées que pour les simples. Les deux autres paramètres
accompagnent le contact, avec un maintien d’une cavité pharyngale agrandie plus longtemps
et d’une aperture labiale réduite également plus longtemps pour la géminée, comparée à la
simple. Les gestes consonantiques sont anticipés dans les configurations du conduit vocal
associées à la voyelle qui précède la consonne cible, et les gestes vocaliques pour la
production de la voyelle suivant la consonne cible sont préparés durant la phase obstruante
du conduit vocal. Les spécificités liées au locuteur ne semblent pas être pertinentes en termes
de contrôle moteur.
Qu’en sera-t-il de la pertinence de nos trois paramètres articulatoires de prédilection pour
caractériser l’opposition phonologique simples vs. géminées en contexte de consonnes
constrictives ? Nous proposons d’examiner cela dans ce qui suit.
195
réalisation de la consonne, observé chez les occlusives, se confirme ici pour les constrictives,
même si le constat est moins prononcé ici. On notera un comportement de non
agrandissement du pharynx chez le locuteur F durant la production de la fricative simple (cf.
Figure 67, à gauche). Les gestes anticipatoires sont plus nets lors des transitions de voyelles à
consonnes que du contraire.
Kh
asa assa
30 30
25
a s a Overture de la 25
a ss a
Déplacement (mm)
Déplacement (mm)
Overture de la
constriction constriction
20 20
Constriction
Constriction
pharyngale
15 15 pharyngale
Aperture labiale
Aperture labiale
10 10
5 5
0 0
656 657 658 659 660 661 662 663 664 665 666 448 449 450 451 452 453 454 455 456 457 458 459 460
Images en unités de 40 ms Images en unités de 40 ms
F
asa assa
30 30
25
a s a Constriction
25
a ss a
Déplacement (mm)
Déplacement (mm)
Constriction
20 Opening 20 Opening
Pharynx Pharynx
15 15
Constriction Constriction
10 Aperture labiale 10 Aperture labiale
5 5
0 0
31 32 33 34 35 36 37 38 39 40 461 462 463 464 465 466 467 468 469 470 471 472
Images en unités de 40 ms Images en unités de 40 ms
Dans le contexte alvéolaire labialisé // vs. //, les manœuvres les plus saillantes
s’observent pour les géminées : elles consistent à maintenir relativement stable et plus
longtemps les constrictions linguales (alvéolaire et pharyngale) et l’aperture labiale, et cela
chez les deux locuteurs (voir Figure 68 et Figure 69), comparées à celles des simples. On
notera, toutefois, que malgré cette tendance à une stabilité relative des trajectoires des
paramètres pour les consonnes géminées, la taille du pharynx augmente légèrement durant la
production de la consonne (sauf chez le locuteur F encore, durant la production de la fricative
simple - cf. Figure 69, à gauche), alors que la constriction au niveau alvéolaire, elle, tend à
196
diminuer. Les gestes anticipatoires sont toujours plus nets lors des transitions de voyelles à
consonnes que du contraire.
Kh
aa aa
30 30
25 a a 25
a a
Déplacement (mm)
Déplacement (mm)
Overture de la Overture de la
20 constriction constriction
20
Constriction Constriction
15 pharyngale 15 pharyngale
Aperture labiale Aperture labiale
10 10
5 5
0 0
695 696 697 698 699 700 701 702 703 704 705 706 707 488 489 490 491 492 493 494 495 496 497 498 499 500
Images en unités de 40 ms Images en unités de 40 ms
F
aa aa
30 30
25
a a 25
a a Ouverture de la
Déplacement (mm)
Ouverture de la
Déplacement (mm)
constriction 20 constriction
20
Constriction Constriction
15 15 pharyngale
pharyngale
5 5
0 0
65 66 67 68 69 70 71 72 73 74 75 76 503 504 505 506 507 508 509 510 511 512 513 514
Images en unités de 40 ms Images en unités de 40 ms
197
L’examen des trajectoires de nos trois paramètres articulatoires dans ces contextes
alvéolaires /s/ vs. /ss/ et // vs. // révèle des comportements clairs et généralisables à ces
alvéolaires.
Au niveau spatial, l’agrandissement du pharynx lors de la réalisation de la consonne, observé
pour les occlusives, se confirme ici pour les constrictives, même si le constat est moins
prononcé et moins systématique pour les consonnes simples. L’aperture labiale diminue ou
reste stable en même temps que la réduction de la constriction alvéolaire.
Au niveau du timing des gestes, la constriction maximale dure plus longtemps pour les
géminées que pour les simples, et cela de façon remarquable. La diminution de l’aperture
labiale, durant le maintien de la constriction alvéolaire maximale dure, elle aussi, plus
longtemps pour les géminées que pour les simples. Les gestes anticipatoires sont plus nets
lors des transitions de voyelles à consonnes que des transitions des consonnes cibles aux
voyelles suivantes. C’est grâce à ces stratégies de persévération des gestes associés aux
configurations fermantes du conduit vocal pour les géminées que les différences temporelles
entre consonnes simples et consonnes géminées sont maximisées.
Comme dans les contextes de consonnes occlusives examinées précédemment, il sera
également question, ci-après, de savoir si le voisement peut avoir quelques influences sur le
contrôle spatiotemporel supraglottique de la gémination.
Dans ce contexte alvéolaire voisé (/z/ vs. /zz/), les gestes des articulateurs sont
globalement comparables à ceux observés dans le contexte non voisé (/s/ vs. /ss/). En effet, si
l’on compare Figure 66 et Figure 67 (ci-dessus) avec Figure 70 et Figure 71 (ci-dessous), on
constate que les timing des articulateurs se ressemblent remarquablement, avec une tenue plus
longue des gestes linguaux (alvéolaire et pharyngal) et labial durant la production de la
géminée. En revanche, on ne note pas d’augmentation de la cavité pharyngale en passant de la
voyelle à la consonne pour les simples et les géminées, sauf pour notre locuteur F pour qui,
cette fois-ci, la taille de cette cavité augmente. Le contrôle de la constriction pharyngale ne
semble pas être régulier chez ce dernier locuteur. En ce qui concerne les gestes anticipatoires,
seul celui de la constriction alvéolaire semble se faire de manière consistante, se réduisant
déjà dans les configurations vocaliques pour être au minimum lors de la production des
198
consonnes cibles. Cette réduction de la taille de la constriction alvéolaire est plus prononcée
pour les simples que pour les géminées, et cela pour nos deux locuteurs.
Kh
aza azza
30 30
25
a z a 25
a z a
Déplacement (mm)
Overture de la
Déplacement (mm)
Overture de la
constriction 20 constriction
20
Constriction Constriction
15 pharyngale 15 pharyngale
Aperture labiale
Aperture labiale
10 10
5 5
0 0
66 67 68 69 70 71 72 73 74 75 76 526 527 528 529 530 531 532 533 534 535 536
Images en unités de 40 ms Images en unités de 40 ms
F
aza azza
30 30
25 a z a 25 a zz a
Déplacement (mm)
Déplacement (mm)
Ouverture de la Ouverture de la
20 20
constriction constriction
15 15 Constriction
Constriction
pharyngale
pharyngale
10 10 Aperture labiale
Aperture labiale
5 5
0 0
106 107 108 109 110 111 112 113 114 115 543 544 545 546 547 548 549 550 551 552 553
Images en unités de 40 ms Images en unités de 40 ms
Dans ce contexte alvéolaire labialisé et voisé // vs. // (voir Figure 72 et Figure 73)
les gestes qui sous-tendent l’opposition phonologique reposent, comme dans le contexte non
voisé (voir Figure 68 et Figure 69) sur une constriction maintenue plus longuement pour les
géminées que pour les simples. Il convient de signaler, toutefois, qu’en ce qui concerne
l’ouverture de la constriction alvéolaire, elle est moins marquante pour l’opposition entre
simple et géminée chez le locuteur Kh. La taille de l’aperture labiale est maintenue
relativement stable et plus longuement pour les géminées. La taille de la cavité pharyngale a
tendance à augmenter durant la production de la consonne cible, mais cela n’est pas
systématique, puisque ce comportement n’a pas été observé pour la consonne géminée chez le
locuteur F (voir Figure 73 à droite). Si l’on doit parler de gestes anticipatoires (de V à C), seul
celui de la constriction alvéolaire est remarquable et généralisable aux deux catégories
consonantiques et aux deux locuteurs.
199
Kh
aa aa
30 30
25
a a Overture de la
25
a a
Déplacement (mm)
Déplacement (mm)
Overture de la
constriction constriction
20 20
Constriction Constriction
15 pharyngale 15 pharyngale
Aperture labiale Aperture labiale
10 10
5 5
0 0
100 101 102 103 104 105 106 107 108 109 110 562 563 564 565 566 567 568 569 570 571 572 573 574 575
F
aa aa
30 30
25
a a
25
a a
Déplacement (mm)
15 Constriction
15 pharyngale pharyngale
5 5
0 0
138 139 140 141 142 143 144 145 146 147 148 149 586 587 588 589 590 591 592 593 594 595 596
200
Dans les contextes alvéolaires voisés /z/ vs. /zz/ et // vs. //, c’est notamment au niveau du
timing des gestes, qui sous-tendent l’opposition phonologique, que les comportements
gestuels semblent être plus marquants, à savoir une constriction alvéolaire réduite, maintenue
plus longuement pour les géminées que pour les simples. Il en va de même de la taille de
l’aperture labiale, également réduite, qui est maintenue relativement stable et plus
longuement pour les géminées, comparées aux simples. La taille de la cavité pharyngale, elle,
même si elle a tendance à augmenter durant la production de la consonne cible, n’affiche pas
de comportement systématique. En termes de gestes anticipatoires (de V à C), seul celui de la
constriction alvéolaire est remarquable et généralisable aux deux catégories consonantiques
et aux deux locuteurs. On ne voit pas de manière notoire une initiation précoce de ce geste
anticipatoire pour les géminées, par rapport aux simples. En revanche les stratégies de
préservation des gestes, associés aux configurations fermantes du conduit vocal chez les
géminées, permettent, ici aussi, d’obtenir des différences temporelles plus nettes entre
simples et géminées.
Qu’en sera-t-il de la robustesse de nos paramètres articulatoires qui se sont révélés pertinents
dans l’émergence du contraste phonologique, en position initiale de mot ? Nous proposons
d’apporter des éléments de réponse à cette question dans ce qui suit.
Rappelons que dans ce contexte CV, la voyelle précédente de la phrase porteuse est
systématiquement le /i/. Les Figure 74 et Figure 75 montrent un contact plus long pour la
géminée /tt/ par rapport à celui de la simple /t/. Ce contact est préparé durant la voyelle
précédente aussi bien pour les simples que pour les géminées. L’aperture labiale ne semble
pas adopter de comportement notoire, lors du passage de la voyelle à la consonne ; elle reste
relativement stable (sauf pour une légère diminution remarquée chez le locuteur Kh, voir
Figure 74). Une réduction anticipatoire de la taille de la constriction est déjà entamée dans les
configurations associées à la consonne, pour préparer la voyelle /a/ suivante, cette dernière
exigeant une constriction radico-pharyngale réduite. Ainsi, ce geste anticipatoire au niveau
pharyngal démarre pendant la tenue de la consonne apicale. L’augmentation de la constriction
alvéolaire se fait de manière remarquable dès le relâchement, avec un conduit vocal largement
dégagé pour la production de cette voyelle ouverte.
201
Kh
ta tta
30 30
25 t a 25 tt a
Déplacement (mm)
Déplacement (mm)
Overture de la Overture de la
constriction constriction
20 20
Constriction Constriction
15 pharyngale pharyngale
15
Aperture labiale Aperture labiale
10 10
5 5
0 0
200 201 202 203 204 205 206 207 208 209 210 497 498 499 500 501 502 503 504 505 506 507 508 509 510
Images en unités de 40 ms Images en unités de 40 ms
F
ta tta
30 30
25 t a 25 tt a
Déplacement (mm)
0 0
190 191 192 193 194 195 196 197 198 199 200 201 500 501 502 503 504 505 506 507 508 509 510 511
Images en unités de 40 ms Images en unités de 40 ms
Dans ce contexte vélaire, le contact dorso-vélaire est plus long pour les géminées que
pour les simples, et cela pour nos deux locuteurs (Figure 76 et Figure 77). Ce contact se
prépare déjà dans les configurations ouvrantes correspondant à la voyelle /i/ précédente,
comme cela fut le cas dans le contexte apical. L’aperture labiale reste relativement stable lors
du passage de la voyelle /i/ à la consonne, un comportement qui a été aussi remarqué dans le
contexte apical. En revanche, la taille de la constriction pharyngale n’entame pas de
diminution précoce de la consonne cible à la voyelle suivante /a/, étant donné la localisation
postérieure du lieu d’articulation qui sollicite une intervention active du dos de la langue. Ce
n’est qu’au relâchement, voire après celui-ci, que le geste de réduction de la constriction
pharyngale pour la réalisation de la voyelle /a/, est déployé.
202
Kh
ka kka
30 30
25 k a 25 kk a
Déplacement (mm)
Overture de la Overture de la
Déplacement (mm)
constriction 20 constriction
20
Constriction Constriction
15 pharyngale 15 pharyngale
Aperture labiale Aperture labiale
10 10
5 5
0 0
235 236 237 238 239 240 241 242 243 244 245 246 247 536 537 538 539 540 541 542 543 544 545 546 547 548
Images en unités de 40 ms Images en unités de 40 ms
F
ka kka
30 30
25 k a 25
kk a
Déplacement (mm)
5 5
0 0
227 228 229 230 231 232 233 234 235 236 237 238 540 541 542 543 544 545 546 547 548 549 550 551 552 553
L’examen du timing des gestes dans ce contexte uvulaire révèle (Figure 78 et Figure
79) un contact dorso-uvulaire plus prolongé pour les géminées, comparées aux simples. Il est
vrai que le suivi de ce contact, quoique visible sur les vues de profil (cf. Figure 134 et Figure
135), a été plus problématique dans ce contexte uvulaire. Cela explique l’absence de stabilité
du paramètre « ouverture de la constriction » lors de la réalisation de la consonne, celui-ci
montrant une augmentation, à notre avis erronée, dans les configurations cibles de la
consonne, chez le locuteur Kh. Si l’aperture labiale reste relativement stable durant la
séquence VCV, la constriction pharyngale, elle, est préparée durant le /i/, en se réduisant
jusqu’à une valeur minimale durant la consonne dorso-uvulaire. Cette constriction augmente
légèrement pour la réalisation du /a/ suivant chez Kh, ou reste stable en passant de la
consonne géminée à la voyelle chez F.
203
Kh
qa qqa
30 30
25
q a 25 qq a
Déplacement (mm)
Déplacement (mm)
Overture de la Overture de la
20 constriction 20 constriction
Constriction Constriction
15 pharyngale 15 pharyngale
Aperture labiale 10 Aperture labiale
10
5 5
0 0
292 293 294 295 296 297 298 299 300 301 302 303 612 613 614 615 616 617 618 619 620 621 622 623
Images en unités de 40 ms Images en unités de 40 ms
F
qa qqa
30 30
25
q a 25
qq a
Déplacement (mm)
Ouverture de la
Déplacement (mm)
Ouverture de la 20
20 constriction
constriction
15 Constriction
15 Constriction
pharyngale
pharyngale
10 10 Aperture labiale
Aperture labiale
5 5
0 0
334 335 336 337 338 339 340 341 342 343 777 778 779 780 781 782 783 784 785 786 787 788
204
Les résultats sont plus clairs, en termes de timing, dans les contextes alvéolaire et vélaire, la
phase obstruante étant plus longue pour les géminées que pour les simples. Ce constat est
vrai aussi dans le contexte uvulaire, même si les données, en suivi de points, sont moins
parlantes (cf. supra). Dans les deux contextes alvéolaire et vélaire, ce contact se prépare de
manière anticipatoire, déjà dans les configurations ouvrantes correspondant à la voyelle /i/
précédente ; cela n’est pas le cas dans le contexte uvulaire. Si, dans le contexte apical, l’on
observe une réduction anticipatoire de la taille de la constriction pharyngale, entamée déjà
dans les configurations associées à la consonne, pour préparer la voyelle /a/ suivante, la
réduction de cette constriction ne se fait, dans le contexte vélaire, qu’au relâchement, voire
après celui-ci. La constriction pharyngale, dans le contexte uvulaire, est préparée durant le /i/,
en se réduisant jusqu’à une valeur minimale durant la consonne dorso-uvulaire. Il semble
donc que seul le lieu d’articulation dorso-vélaire du /k/ soit en conflit avec l’émergence
d’une configuration réduite du /a/ suivant.
L’aperture labiale reste relativement stable lors du passage de la voyelle /i/ à la consonne,
puis augmente pour réaliser le /a/, un comportement remarqué dans les contextes apical et
vélaire. Une stabilité de la taille de l’aperture labiale est maintenue, dans le contexte /q/ de la
voyelle /i/ à la voyelle /a/, en passant par la consonne. Nous tenterons de rationaliser
l’ensemble de ces résultats dans la Synthèse Générale (Chapitre 13).
25 d a 25 dd a
Déplacement (mm)
Déplacement (mm)
Overture de la Overture de la
20 constriction 20 constriction
Constriction Constriction
15 pharyngale 15 pharyngale
Aperture labiale
Aperture labiale
10 10
5 5
0 0
274 275 276 277 278 279 280 281 282 283 284 574 575 576 577 578 579 580 581 582 583 584 585 586 587
Images en unités de 40 ms Images en unités de 40 ms
F
da dda
30 30
25 d a 25 dd a
Déplacement (mm)
Ouverture de la
Déplacement (mm)
Ouverture de la 20
20 constriction
constriction
Constriction
15 Constriction 15
pharyngale
pharyngale
10 Aperture labiale
10 Aperture labiale
5
5
0
0
581 582 583 584 585 586 587 588 589 590 591 592 593
266 267 268 269 270 271 272 273 274 275 276
Images en unités de 40 ms Images en unités de 40 ms
Kh
ga gga
30 30
g a gg a
25 25
Déplacement (mm)
Overture de la
Déplacement (mm)
Overture de la
20 constriction 20 constriction
Constriction Constriction
15 pharyngale 15 pharyngale
Aperture labiale Aperture labiale
10 10
5 5
0 0
308 309 310 311 312 313 314 315 316 317 318 319 615 616 617 618 619 620 621 622 623 624 625 626 627
Images en unités de 40 ms Images en unités de 40 ms
206
F
ga gga
30 30
25
g a gg a
25
Déplacement (mm)
Déplacement (mm)
Ouverture de la Ouverture de la
20 constriction 20 constriction
Constriction Constriction
15 15
pharyngale pharyngale
10 Aperture labiale 10 Aperture labiale
5 5
0 0
303 304 305 306 307 308 309 310 311 312 313 620 621 622 623 624 625 626 627 628 629 630 631
Par rapport au contexte non voisé, le comportement spatiotemporel des occlusives voisées
apicales et vélaires reste remarquablement similaire (cf. résumé supra). En ce qui concerne le
contexte non voisé, on constate une augmentation de la taille des constrictions alvéolaires et
vélaires plus notoire, dès le relâchement de ces occlusives, afin de préparer un conduit vocal
suffisamment dégagé pour permettre l’émergence de la voyelle grande ouverte /a/.
Nous suggérons à présent d’examiner le cas du contrôle spatiotemporel de la
gémination chez les constrictives non voisées.
207
Kh
30
sa ssa
30
25 s a Overture de la
25 ss a
Déplacement (mm)
Déplacement (mm)
Overture de la
20 constriction constriction
20
Constriction Constriction
15 pharyngale 15 pharyngale
Aperture labiale Aperture labiale
10 10
5 5
0 0
60 61 62 63 64 65 66 67 68 69 344 345 346 347 348 349 350 351 352 353 354
Images en unités de 40 ms Images en unités de 40 ms
F
sa ssa
30 30
25
s a 25 ss a
Déplacement (mm)
Ouverture de la
Déplacement (mm)
Ouverture de la
constriction constriction
20 20
Constriction Constriction
15 pharyngale 15 pharyngale
5 5
0 0
42 43 44 45 46 47 48 49 50 51 341 342 343 344 345 346 347 348 349 350 351
Images en unités de 40 ms Images en unités de 40 ms
208
Kh
a a
30 30
25
a 25 a
Déplacement (mm)
Déplacement (mm)
Overture de la Overture de la
20 constriction 20 constriction
Constriction Constriction
15 pharyngale 15
pharyngale
5 5
0 0
94 95 96 97 98 99 100 101 102 103 104 386 387 388 389 390 391 392 393 394 395 396 397
Images en unités de 40 ms Images en unités de 40 ms
F
a a
30 30
25 a 25 a
Déplacement (mm)
Déplacement (mm)
Ouverture de la Ouverture de la
20 constriction 20 constriction
Constriction 15 Constriction
15 pharyngale pharyngale
10 Aperture labiale 10
Aperture labiale
5
5
0
0
382 383 384 385 386 387 388 389 390 391 392 393
78 79 80 81 82 83 84 85 86 87 88 89
Images en unités de 40 ms
Images en unités de 40 ms
209
Le contrôle spatiotemporel de la gémination en contexte CV : les constrictives voisées
Par rapport au contexte non voisé analysé précédemment, nous constatons que le
contrôle spatiotemporel des trois paramètres articulatoires, dans ce contexte voisé, est
notoirement similaire (comparer les Figure 84 à Figure 87 supra avec les Figure 88 à Figure
91 infra). En quelques termes, nous dirions que le timing des gestes de l’ouverture de la
constriction et de l’aperture labiale révèle une tenue plus longue pour les géminées. La
réduction anticipatoire de la taille de la constriction pharyngale pour produire le /a/ suivant est
aussi une constante dans les deux contextes et chez nos deux locuteurs ; cette réduction
anticipatoire peut soit démarrer dans les configurations du conduit vocal associées au /i/, soit
dans celles associées à la consonne alvéolaire cible. Le contraste de voisement ne semble pas,
en conséquence, influencer le contrôle spatiotemporel de ces gestes dans la réalisation de la
gémination.
Kh
za zza
30 30
25 z a 25 zz a
Déplacement (mm)
Déplacement (mm)
Overture de la
Overture de la
20 20 constriction
constriction
Constriction Constriction
15 15 pharyngale
pharyngale
10 Aperture labiale 10 Aperture labiale
5 5
0 0
130 131 132 133 134 135 136 137 138 139 140 425 426 427 428 429 430 431 432 433 434 435 436
Images en unités de 40 ms Images en unités de 40 ms
210
F
za 30
zza
30
25 z a 25 zz a
Déplacement (mm)
Ouverture de la
Déplacement (mm)
Ouverture de la
20 constriction 20 constriction
Constriction Constriction
pharyngale pharyngale
15 15
Aperture labiale
Aperture labiale
10 10
5 5
0 0
116 117 118 119 120 121 122 123 124 125 126 127 423 424 425 426 427 428 429 430 431 432 433
Images en unités de 40 ms Images en unités de 40 ms
Kh
a a
30 30
25 a 25
a
Déplacement (mm)
Déplacement (mm)
Overture de la Overture de la
20 constriction 20 constriction
Constriction Constriction
15 pharyngale 15 pharyngale
5 5
0 0
166 167 168 169 170 171 172 173 174 175 176 177 178 462 463 464 465 466 467 468 469 470 471 472 473 474
Images en unités de 40 ms Images en unités de 40 ms
F
a
30
a 25 a
Déplacement (mm)
Ouverture de la
20 constriction
Constriction
15 pharyngale
Aperture labiale
10
0
460 461 462 463 464 465 466 467 468 469 470 471 472
Images en unités de 40 ms
211
Le contrôle spatiotemporel de nos trois paramètres articulatoires, dans ces contextes voisés,
est notoirement similaire. En effet, le timing des gestes de l’ouverture de la constriction et de
l’aperture labiale révèle une tenue plus longue pour les géminées. La réduction anticipatoire
de la taille de la constriction pharyngale pour produire le /a/ suivant est aussi une constante
dans les deux contextes et chez nos deux locuteurs.
Qu’en sera-t-il du comportement de ces paramètres articulatoires en position finale de mot ?
C’est ce que nous allons découvrir infra.
Les Figure 92 et Figure 93 indiquent un contact apical plus long pour les géminées
(ouverture de la constriction à 0 mm), et cela pour les deux locuteurs. De la voyelle /a/ à la
consonne cible, la taille de l’aperture labiale diminue, alors que celle de la constriction
pharyngale augmente. Le timing de ces deux gestes est relativement plus stable et plus longue
pour les géminées par rapport aux simples. Le geste labial et les gestes linguaux pour réaliser
les consonnes cibles sont tous initiés de manière anticipatoire dans les configurations liées au
/a/.
Kh
at att
30 30
25 a t 25 a tt
Déplacement (mm)
Déplacement (mm)
Overture de la Overture de la
20 constriction 20 constriction
Constriction Constriction
15 pharyngale 15 pharyngale
5 5
0 0
147 148 149 150 151 152 153 154 155 156 157 158 159 473 474 475 476 477 478 479 480 481 482 483 484 485
Images en unités de 40 ms Images en unités de 40 ms
212
at att
30 30
25
a t
25
a tt Ouverture de la
Déplacement (mm)
Ouverture de la
Déplacement (mm)
20 constriction 20 constriction
Constriction Constriction
15 pharyngale 15 pharyngale
5 5
0 0
257 258 259 260 261 262 263 264 265 266 602 603 604 605 606 607 608 609 610 611 612
Kh
30
ak 30
akk
25
a k
25
a kk
Déplacement (mm)
Déplacement (mm)
20 Overture de la 20 Overture de la
constriction constriction
15 Constriction 15 Constriction
pharyngale pharyngale
10 Aperture labiale 10 Aperture labiale
5 5
0 0
221 222 223 224 225 226 227 228 229 230 231 232 508 509 510 511 512 513 514 515 516 517 518 519 520
Images en unités de 40 ms Images en unités de 40 ms
213
F
ak akk
30 30
25
a k 25 a k
Déplacement (mm)
Déplacement (mm)
Ouverture de la Ouverture de la
20 constriction 20 constriction
Constriction Constriction
15 pharyngale 15 pharyngale
Aperture labiale Aperture labiale
10 10
5 5
0 0
298 299 300 301 302 303 304 305 306 307 308 645 646 647 648 649 650 651 652 653 654 655 656
Kh
30
aq 30
aqq
25 a q 25
a qq
Déplacement (mm)
Déplacement (mm)
Overture de la Overture de la
20 constriction 20 constriction
Constriction
15 Constriction
pharyngale 15
pharyngale
10 Aperture labiale
10 Aperture labiale
5
5
0
0
411 412 413 414 415 416 417 418 419 420 421 422
691 692 693 694 695 696 697 698 699 700 701 702
Images en unités de 40 ms
Images en unités de 40 ms
25 25
a q a qq
Déplacement (mm)
Déplacement (mm)
Ouverture de la
constriction Ouverture de la
20 20
constriction
Constriction
15 Constriction
pharyngale 15
pharyngale
Aperture labiale Aperture labiale
10 10
5 5
0 0
413 414 415 416 417 418 419 420 421 422 870 871 872 873 874 875 876 877 878 879 880
Images en unités de 40 ms Images en unités de 40 ms
Les observations robustes qui se dégagent ici sont les suivantes : les contacts alvéolaire et
vélaire sont plus longs pour les géminées (ouverture de la constriction à 0 mm), chez les deux
locuteurs. Pour ces deux consonnes, si la taille de la constriction pharyngale augmente lors
de la transition de la voyelle /a/ à la production de la consonne vélaire, celle de l’aperture
labiale, elle, reste relativement stable du passage de la voyelle à la consonne. Toujours pour
ces deux occlusives (alvéolaire et vélaire), nous constatons que le geste labial et les gestes
linguaux pour réaliser les consonnes cibles sont tous initiés de manière anticipatoire dans les
configurations liées au /a/. La situation est différente dans le contexte uvulaire /q/.
L’anticipation des gestes linguaux et du geste labial se fait, certes, mais de manière peu
remarquable et a tendance à démarrer plutôt vers les dernières configurations ouvrantes de la
voyelle /a/ qui précède cette consonne. Toujours pour ce que concerne le /q/, l’ouverture
minimale de la constriction (contact), peu stable, dure plus longtemps pour les géminées que
pour les simples. L’aperture labiale se réduit avec la diminution de l’ouverture de la
constriction uvulaire, durant la réalisation de la consonne, alors que la taille de la constriction
pharyngale, elle, augmente pendant la production de cette consonne uvulaire.
Nous proposons d’examiner, ci-après, le contrôle spatiotemporel de la gémination dans ce
contexte VC, les occlusives étant voisées cette fois-ci.
215
Le contrôle spatiotemporel de la gémination en contexte VC : les occlusives voisées
Kh
ad add
30 30
25
a d
25 a dd
Déplacement (mm)
Déplacement (mm)
Overture de la Overture de la
20 constriction 20 constriction
Constriction Constriction
15 pharyngale 15 pharyngale
Aperture labiale Aperture labiale
10 10
5
5
0
0
543 544 545 546 547 548 549 550 551 552 553 554 555
256 257 258 259 260 261 262 263 264 265 266 267
Images en unités de 40 ms
Images en unités de 40 ms
216
F
ad add
30 30
25
a d 25
a dd
Déplacement (mm)
Ouverture de la
Déplacement (mm)
Ouverture de la
20 constriction 20 constriction
Constriction Constriction
15 pharyngale 15 pharyngale
Aperture labiale Aperture labiale
10 10
5 5
0 0
340 341 342 343 344 345 346 347 348 349 692 693 694 695 696 697 698 699 700 701 702
Images en unités de 40 ms Images en unités de 40 ms
Kh
ag agg
30 30
25 a g 25 a gg
Déplacement (mm)
Overture de la
Déplacement (mm)
Overture de la
constriction 20 constriction
20
Constriction
Constriction
15 15 pharyngale
pharyngale
Aperture labiale
10 Aperture labiale 10
5
5
0
0
581 582 583 584 585 586 587 588 589 590 591 592 593
289 290 291 292 293 294 295 296 297 298 299 300 301
Images en unités de 40 ms
Images en unités de 40 ms
Figure 100 : Trajectoires de trois paramètres articulatoires, à savoir l’ouverture de la constriction, la constriction
pharyngale et l’aperture labiale, pour la séquence /ag/ (à gauche) et /agg/ (à droite) ; locuteur Kh
217
F
ag agg
30 30
25
Ouverture de la
25
a gg
a g
Déplacement (mm)
Déplacement (mm)
constriction Ouverture de la
20 20
Constriction constriction
pharyngale Constriction
15 15
Aperture labiale pharyngale
10 10 Aperture labiale
5 5
0 0
382 383 384 385 386 387 388 389 390 391 736 737 738 739 740 741 742 743 744 745 746
Images en unités de 40 ms Images en unités de 40 ms
Figure 101 : Trajectoires de trois paramètres articulatoires, à savoir l’ouverture de la constriction, la constriction
pharyngale et l’aperture labiale, pour la séquence /ag/ (à gauche) et /agg/ (à droite) ; locuteur F
218
Le contrôle spatiotemporel de la gémination en contexte VC : les constrictives non
voisées
Les Figure 102 et Figure 103 montrent une ouverture de la constriction alvéolaire
minimale nettement plus longue pour les géminées que pour les simples. Par rapport aux
configurations du /a/, l’aperture minimale est maintenue réduite durant la production de la
consonne (ce constat est moins marqué chez le locuteur F, lorsqu’il réalise l’alvéolaire
simple ; cf. Figure 103, à gauche). Si la taille de la cavité pharyngale a tendance à augmenter
légèrement lors de la réalisation des consonnes simples, elle reste relativement stable durant la
production des géminées. La réduction de l’ouverture de la constriction alvéolaire et de
l’aperture en vue de la réalisation de la consonne alvéolaire /s/ est anticipée dans les
configurations du /a/.
Kh
as ass
30 30
a s a ss
Déplacement (mm)
25 25
Déplacement (mm)
Overture de la Overture de la
20 constriction 20 constriction
Constriction Constriction
15 15 pharyngale
pharyngale
5 5
0
0
325 326 327 328 329 330 331 332 333 334 335
798 799 800 801 802 803 804 805 806
Images en unités de 40 ms
Images en unités de 40 ms
Figure 102 : Trajectoires de trois paramètres articulatoires, à savoir l’ouverture de la constriction, la constriction
pharyngale et l’aperture labiale, pour la séquence /as/ (à gauche) et /ass/ (à droite) ; locuteur Kh
F
as ass
30 30
25
a s 25
a ss Ouverture de la
Déplacement (mm)
Ouverture de la
Déplacement (mm)
constriction constriction
20 20
Constriction
Constriction
15 15 pharyngale
pharyngale
Aperture labiale
Aperture labiale
10 10
5 5
0 0
92 93 94 95 96 97 98 99 100 101 428 429 430 431 432 433 434 435 436 437
Images en unités de 40 ms Images en unités de 40 ms
Figure 103 : Trajectoires de trois paramètres articulatoires, à savoir l’ouverture de la constriction, la constriction
pharyngale et l’aperture labiale, pour la séquence /as/ (à gauche) et /ass/ (à droite) ; locuteur F
219
Le contexte alvéolaire //
Dans ce contexte alvéolaire labialisé, les Figure 104 et Figure 105 indiquent, comme
dans le contexte alvéolaire précédent, une ouverture de la constriction alvéolaire minimale
plus longue pour les géminées que pour les simples. Par rapport aux configurations du /a/,
l’aperture minimale reste relativement stable durant la production de la consonne. La taille de
l’aperture labiale a tendance à être plus grande pour cette consonne / / par rapport au /s/, mais
seulement pour le locuteur Kh (comparer Figure 102 et Figure 104). La taille de la cavité
pharyngale a tendance à augmenter légèrement lors de la réalisation des consonnes simples et
géminées ; ce geste d’augmentation de la taille de la cavité pharyngale est anticipé dans les
configurations associées au /a/ précédent. Il en va de même pour la réduction de l’ouverture
de la constriction alvéolaire en vue de la réalisation de la consonne alvéolaire //.
Kh
a a
30 30
25 25
a Overture de la
a Overture de la
Déplacement (mm)
Déplacement (mm)
constriction constriction
20 20
Constriction Constriction
pharyngale 15 pharyngale
15
Aperture labiale
Aperture labiale
10 10
5
5
0
0
361 362 363 364 365 366 367 368 369 370 371 372
42 43 44 45 46 47 48 49 50 51 52
Images en unités de 40 ms Images en unités de 40 ms
Figure 104 : Trajectoires de trois paramètres articulatoires, à savoir l’ouverture de la constriction, la constriction
pharyngale et l’aperture labiale, pour la séquence /a/ (à gauche) et /a/ (à droite) ; locuteur Kh
F
a a
30 30
25
a 25
a
Déplacement (mm)
Déplacement (mm)
Ouverture de la Ouverture de la
20 constriction 20 constriction
Constriction Constriction
15 pharyngale 15 pharyngale
5 5
0 0
135 136 137 138 139 140 141 142 143 144 470 471 472 473 474 475 476 477 478 479
Images en unités de 40 ms Images en unités de 40 ms
Figure 105 : Trajectoires de trois paramètres articulatoires, à savoir l’ouverture de la constriction, la constriction
pharyngale et l’aperture labiale, pour la séquence /a/ (à gauche) et /a/ (à droite) ; locuteur F
220
Les données indiquent dans ce contexte de fricatives non voisées, une ouverture de la
constriction alvéolaire minimale plus longue pour les géminées que pour les simples.
L’aperture minimale reste relativement stable durant la production de la consonne par rapport
au /a/ précédent. La taille de la cavité pharyngale a tendance à augmenter légèrement lors de
la réalisation des consonnes simples et géminées ; ce geste d’augmentation de la taille de la
cavité pharyngale est anticipé dans les configurations associées au /a/ précédent. Il en va de
même de la réduction de l’ouverture de la constriction alvéolaire en vue de la réalisation de
la consonne alvéolaire //.
221
Kh
az azz
30 30
25
a z 25
a zz
Déplacement (mm)
Déplacement (mm)
Overture de la Overture de la
20 constriction 20 constriction
Constriction Constriction
15 pharyngale 15 pharyngale
Aperture labiale
10 10 Aperture labiale
5 5
0 0
74 75 76 77 78 79 80 81 82 83 84 396 397 398 399 400 401 402 403 404 405 406 407
Images en unités de 40 ms Images en unités de 40 ms
Figure 106 : Trajectoires de trois paramètres articulatoires, à savoir l’ouverture de la constriction, la constriction
pharyngale et l’aperture labiale, pour la séquence /az/ (à gauche) et /azz/ (à droite) ; locuteur Kh
F
az azz
30 30
25
a z Déplacement (mm)
25
a zz Ouverture de la
Déplacement (mm)
Ouverture de la
20 constriction 20 constriction
Constriction Constriction
15 pharyngale 15 pharyngale
5 5
0 0
172 173 174 175 176 177 178 179 180 181 182 512 513 514 515 516 517 518 519 520 521 522
Figure 107 : Trajectoires de trois paramètres articulatoires, à savoir l’ouverture de la constriction, la constriction
pharyngale et l’aperture labiale, pour la séquence /az/ (à gauche) et /azz/ (à droite) ; locuteur F
Kh
a a
30 30
25
a 25
a
Déplacement (mm)
Déplacement (mm)
Overture de la Overture de la
20 constriction 20 constriction
Constriction Constriction
15 pharyngale 15 pharyngale
Aperture labiale Aperture labiale
10 10
5 5
0 0
107 108 109 110 111 112 113 114 115 116 117 118 432 433 434 435 436 437 438 439 440 441 442 443
Images en unités de 40 ms Images en unités de 40 ms
Figure 108 : Trajectoires de trois paramètres articulatoires, à savoir l’ouverture de la constriction, la constriction
pharyngale et l’aperture labiale, pour la séquence /a/ (à gauche) et /a/ (à droite) ; locuteur Kh
222
F
a a
30
30
25 a a
Ouverture de la 25
Déplacement (mm)
Déplacement (mm)
constriction Ouverture de la
20
Constriction 20 constriction
15 pharyngale Constriction
15 pharyngale
Aperture labiale
10 Aperture labiale
10
5
5
0
0
215 216 217 218 219 220 221 222 223 224
556 557 558 559 560 561 562 563 564 565 566
Images en unités de 40 ms Images en unités de 40 ms
Figure 109 : Trajectoires de trois paramètres articulatoires, à savoir l’ouverture de la constriction, la constriction
pharyngale et l’aperture labiale, pour la séquence /a/ (à gauche) et /a/ (à droite) ; locuteur F
L’analyse des données révèle une organisation spatio-temporelle remarquable entre les
constrictives non voisées et ces constrictives voisées. Nous observons les mêmes stratégies
anticipatoires en ce qui concerne les gestes linguaux et le geste labial que dans le contexte
non voisé précédent. En conséquence, nous référons le lecteur au commentaire donné supra
pour leurs homologues non voisés, par souci de ne pas trop alourdir la description et
l’analyse de nos données
223
10 Gestes du larynx et de l’os hyoïde
Vaxelaire (2007) nous signale que les gestes d’élévation et d’abaissement de l’ensemble
du larynx sont fréquemment observés durant la déglutition, mais également lors de la
production de la parole, afin de contrôler la hauteur de la voix, mais aussi pour réaliser des
oppositions consonantiques phonologiques sourdes vs. sonores (Ohala & Eukel, 1978;
Lindqvist et al., 1973).
L’os hyoïde, structure isolée de la structure squelettique humaine, est en effet non
seulement relié à la langue et à la mandibule, mais aussi au larynx grâce à un système
complexe de muscles et de ligaments. Il est donc judicieux d’étudier le comportement du
larynx en relation avec la position de l’os hyoïde pendant la production de la parole (cf., par
ex., Ladefoged et al., 1972 ; Bothorel, 1979 ; Vaxelaire & Sock, 1997 ; Vaxelaire, 2006).
Bien que des données sur le déplacement vertical du larynx durant la production de
voyelles et de consonnes soient attestées dans la littérature (voir, par ex., Perkell, 1969 ;
Hirose, 1977 ; Barbier, 1979 ; Bothorel, 1979 ; Rossi & Autesserre, 1979 ; Vaxelaire & Sock,
1997) celles sur les gestes du larynx dans le cas de la gémination ou des consonnes doubles
manquent cruellement dans la littérature. Les résultats des recherches que nous allons
présenter ici prennent donc place parmi les contributions aux connaissances sur le contrôle
robuste de positions et de trajectoires laryngales, notamment pendant la réalisation de certains
gestes consonantiques des langues du monde.
Les données cinéradiographiques obtenues par Vaxelaire (1993 ; 2007) ainsi que
Vaxelaire & Sock (1997) pour deux locuteurs produisant des phrases qui comportent des
séquences Voyelle-Consonne-Voyelle (VCV) dans deux conditions de vitesse d’élocution,
normale ou conversationnelle et rapide, révèlent plusieurs faits intéressants. Citons-en
quelques-uns ici.
224
En premier lieu, elles confirment l’existence d’une relation étroite entre le mouvement
du larynx et celui de l’os hyoïde. Les auteurs Vaxelaire & Sock (1997) montrent ainsi que le
déplacement de l’os hyoïde est diagonal en nature, avec un mouvement d’élévation
accompagné de celui d’une translation en arrière. Cette translation en arrière correspond donc
à la composante horizontale du mouvement de l’os hyoïde. Ils obtiennent des corrélations
relativement élevées entre le déplacement vertical du larynx et la composante horizontale du
mouvement diagonal de l’os hyoïde.
Leurs Figure 110 et Figure 111 montrent l’évolution de la position du larynx à travers
des séquences VCV, où V1 est toujours la voyelle haute /u/ et V2 la voyelle basse /a/. Dans la
Figure 110, en vitesse d’élocution normale (graphique de gauche), on voit que la position du
larynx pour la locutrice MM est à 18 mm en moyenne durant les configurations correspondant
à la production du /u/ (images 863 à 867). Cette position du larynx atteint une valeur moyenne
de 24 mm dans les configurations relatives à la production du /a/ (images 871 à 876). En
augmentant la vitesse d’élocution (graphique de droite), la position initiale du larynx pour la
production du /u/ (images 544 à 546) est maintenant à 23 mm en moyenne (nous reviendrons
infra sur ce point) alors qu’elle atteindra une valeur de 29 mm dans les configurations du /a/
(images 550 à 555). Ils signalent cependant que l’amplitude des déplacements du larynx, des
configurations vocaliques de la voyelle haute à celles de la voyelle basse, est comparable dans
les deux conditions de vitesse d’élocution : elle est de 6 mm en moyenne.
Figure 110 : Gestes du larynx (déplacement vertical) et de l’os hyoïde (déplacements vertical et horizontal) pour
la séquence /uta/. L’axe des ordonnées montre le déplacement de ces structures (mm) et l’axe des abscisses
indique le temps, une image toutes les 20 ms (Adapté de Vaxelaire & Sock, 1997).
225
Figure 111 : Gestes du larynx (déplacement vertical) et de l’os hyoïde (déplacements vertical et horizontal) pour
la séquence /uka/. L’axe des ordonnées montre le déplacement de ces structures (mm) et l’axe des abscisses
indique le temps, une image toutes les 20 ms (Adapté de Vaxelaire & Sock, 1997).
En comparant la Figure 110 et la Figure 111, les auteurs attirent notre attention sur les
deux faits suivants :
1) une similarité entre les trajectoires du larynx et de l’os hyoïde à travers les séquences
VCV ;
2) une ressemblance structurelle des trajectoires, quels que soient les contextes
consonantiques /t/ ou /k/, et les locuteurs.
Cette robustesse de la corrélation entre les deux structures, quels que soient les
contextes segmentaux (vocaliques ou consonantiques) et prosodiques (vitesses d’élocution,
voix d’homme, voix de femme, voyelle aiguë, voyelle grave, etc.), les a autorisés à considérer
les deux entités comme une seule unité fonctionnelle.
Ensuite, ils observent que la position du larynx est systématiquement plus basse pour les
voyelles dites fermées, par rapport à leurs homologues ouvertes. Ce constat est en accord avec
les résultats obtenus par Bothorel (1975) pour une variante dialectale du breton parlé à Argol.
Pour les séquences /upa/ (dans la phrase « Nous pâlissons.») et /apu/ (dans la phrase « Il a
pourri.»), pour lesquelles la production consonantique « extra-buccale » ne requiert pas
l’intervention active de la langue, la masse de cette dernière se déplace dans une direction
opposée à celle du couple larynx-os hyoïde.
Alors que la masse de la langue adopte une trajectoire descendante constante pour la
production des séquences /upa/, l’unité larynx-os hyoïde, elle, continue son mouvement
d’élévation. Leur Figure 112 montre cette évolution des trajectoires du larynx, couplé à l’os
hyoïde, et de la masse de la langue à travers la séquence /upa/, en vitesses d’élocution
normale (à gauche) et rapide (à droite). Ce patron gestuel s’oppose symétriquement à celui
226
observé pour la production de la séquence /apu/. Dans les deux cas, il résulte une distance
maximale pour la configuration du /u/ entre la position de la masse de la langue et celle du
couple larynx-os hyoïde. Pour la configuration du /a/, cette distance entre la position de la
masse de la langue et celle du couple larynx-os hyoïde est minimale. On voit bien que ce
scénario se produit également en vitesse d’élocution rapide.
Figure 112 : Une analyse image par image de la séquence /upa/ en vitesses d’élocution normale (à gauche) et
rapide (à droite). On voit sur la figure que le timing relatif des gestes du dos de la langue et du larynx est
comparable dans les deux conditions de vitesse d’élocution (Adapté de Vaxelaire & Sock, 1997).
Il a aussi semblé intéressant, pour Vaxelaire & Sock (1997), de revenir sur une
observation signalée supra : le larynx et l’os hyoïde ont une position plus haute en vitesse
d’élocution rapide, comparée aux ajustements initiaux observés en vitesse d’élocution
normale (Figure 112). Pour eux, l’augmentation de la vitesse d’élocution requerrait une
configuration initiale sans doute nécessaire pour l’accélération de la tâche articulatoire. Ils
proposent également de garder ouverte la question de l’incidence de l’accélération de la
vitesse d’élocution sur l’élévation de la position du larynx et d’une co-variation possible de la
fréquence fondamentale (Bothorel, comm. pers., 2004).
227
Figure 113 : Vues de profil pour la production du /u/ (à gauche) et du /a/ (à droite), en vitesses d’élocution
normale (ligne continue) et rapide (pointillés). Remarquer une position plus élevée du larynx et de l’os hyoïde en
vitesse d’élocution rapide (Adapté de Vaxelaire & Sock, 1997).
Étant donné que le mouvement de l’ensemble larynx-os hyoïde est inversement corrélé
avec le déplacement vertical de la masse de la langue et, en conséquence, avec l’aperture
vocalique, leurs données rejettent systématiquement « l’hypothèse tongue-pull » (tongue-pull
hypothesis). Il s’agit plus précisément de la version de cette hypothèse qui prône une relation
forte entre l’élévation de la masse de la langue, de l’os hyoïde et des structures rigides du
larynx. Pour eux, il existerait ainsi une corrélation étroite et positive entre le déplacement de
ces trois structures, où le déplacement vertical de la masse linguale entrainerait le
déplacement vertical du couple larynx-os hyoïde et, par-là, la diminution du diamètre de la
constriction vocalique. Les auteurs signalent que cette hypothèse, qui avait d’abord été
défendue par Ladefoged (1964), puis par Lehiste (1970), tentait également d’établir une
corrélation entre ces gestes d’élévation et une variation de F0 : la langue, en s’élevant pour
réaliser les voyelles les plus fermées, tirerait l’os hyoïde et le larynx vers le haut, ce qui
provoquerait une tension dans les cordes vocales et, en conséquence, une élévation de F0. Or,
il n’en est rien dans les données attestées dans la littérature. Vaxelaire (2007) signale que les
différents tenants de cette hypothèse devaient, plus tard, soit simplement la rejeter (voir, par
ex., Ladefoged et al., 1972), soit la réviser en prônant sa pertinence dans le domaine du chant
ou dans la production de voyelles soutenues, et en reconnaissant son invalidité en production
de la parole (voir, par ex., Ohala & Eukel, 1978). Le comportement de ces structures
228
s’expliquerait par la contraction de muscles spécifiques : le géniohyoïde, le ventre antérieur
du digastrique et le mylohyoïde (Perkell, 1969).
Enfin, Vaxelaire (2007) indique que les trajectoires du larynx et de l’os hyoïde de
voyelle-à-voyelle dans les séquences VCV ne sont pas significativement perturbées, ni par le
changement de la vitesse d’élocution, ni par la présence d’une consonne médiane, même
lorsque cette dernière requiert un geste lingual pour son articulation. Ce seraient, en effet, les
trajectoires vocaliques du larynx et de l’os hyoïde qui imposeraient leurs spécificités propres
aux configurations consonantiques, « cachant » ainsi ces dernières (cf. Vaxelaire, 1993). Cette
observation confirme l’hypothèse plus générale de la robustesse des gestes vocaliques,
comparés aux gestes consonantiques (Öhman, 1966).
En faisant varier la vitesse d’élocution, elle a réussi à montrer que les configurations,
ainsi que les trajectoires laryngales, sont robustes dans la production de la parole (surtout
celles associées à la production des éléments vocaliques). Pour Vaxelaire (2007), ce résultat
ne serait pas surprenant, compte tenu de la relative rigidité de ces structures, mais surtout de
la primauté du contrôle des gestes glottiques, en tant que source des sons de la parole, sur
ceux apparaissant dans les cavités du conduit vocal. Une initialisation correcte du geste à la
source serait en effet déterminante pour tout couplage adéquat avec les mouvements
supraglottiques, d’où la résistivité spatio-temporelle de ces gestes de l’unité larynx-os hyoïde.
Les données qu’elle a obtenues sont, en conséquence, en accord avec son hypothèse de départ
(cf., supra).
Pour mémoire, rappelons que Vaxelaire & Sock (1997) puis Vaxelaire (2007)
défendent, entre autres, l’idée que les gestes du larynx et de l’os hyoïde devraient être
résistants à la perturbation induite par l’augmentation de la vitesse d’élocution puisque :
1) les deux structures sont relativement rigides, ayant peu de degrés de liberté dans leurs
déplacements ;
2) le larynx représente l’organe « source » des sons, et son couplage avec une autre structure
d’importance fondamentale, en l’occurrence l’os-hyoïde où la racine de la langue
s’attache, révélerait une haute précision dans son organisation spatio-temporelle,
organisation fine indispensable pour les couplages oro-laryngés.
Nous proposons, dans la section suivante, de voir dans quelle mesure nos données
corroborent ces constats.
229
Étant donné que les résultats sont sensiblement les mêmes pour nos deux locuteurs, et
cela quels que soient les contextes consonantiques (lieu d’articulation et voisement) et les
positions dans l’énoncé, nous nous contenterons ici de ne présenter graphiquement et de ne
commenter que quelques exemples typiques. Le lecteur trouvera les autres données en
Annexe 3 qui confirment ces assertions.
1) les trajectoires du geste du larynx et de l’os hyoïde évoluent dans la même direction.
Nous confirmons ainsi un certain couplage entre les gestes d’élévation de ces deux
structures en contextes apical, vélaire et uvulaire;
230
Kh
ata atta
Images en unités de 40 ms
Images en unités de 40 ms
141 142 143 144 145 146 147 148 149 150 151 152 153 602 603 604 605 606 607 608 609 610 611 612 613 614
30 30
35 35
Position du Position du
40
Déplacement (mm)
40
Déplacement (mm)
larynx larynx
45 45
50 Position de 50 Position de
55 l'os hyoïde l'os hyoïde
a t a a tt a
55
60 60
65 65
70 70
75 75
80 80
Figure 114 : Les gestes du larynx et de l’os hyoïde en position intervocalique pour la séquence /ata/ (à gauche) et
/atta/ (à droite) ; locuteur Kh
F
ata atta
Images en unités de 40 ms Images en unités de 40 ms
182 183 184 185 186 187 188 189 190 191 192 629 630 631 632 633 634 635 636 637 638 639 640
20 20
Déplacement (mm)
Déplacement (mm)
25 Position du 25
Position du
30 larynx 30 larynx
35 35
40 Position de 40 Position de
45 l'os hyoïde 45
a t a a tt a
l'os hyoïde
50 50
55 55
60 60
65 65
70 70
Figure 115 : Les gestes du larynx et de l’os hyoïde en position intervocalique pour la séquence /ata/ (à gauche) et
/atta/ (à droite) ; locuteur F
Kh
aka akka
Images en unités de 40 ms Images en unités de 40 ms
179 180 181 182 183 184 185 186 187 188 189 639 640 641 642 643 644 645 646 647 648 649 650
30 30
35 35
Position du Position du
Déplacement (mm)
Déplacement (mm)
40 40
larynx larynx
45 45
50 Position de 50 Position de
55 l'os hyoïde 55 l'os hyoïde
60 a k a 60 a kk a
65 65
70 70
75 75
80 80
Figure 116 : Les gestes du larynx et de l’os hyoïde en position intervocalique pour la séquence /aka/ (à gauche)
et /akka/ (à droite) ; locuteur Kh
231
F
aka akka
Images en unités de 40 ms
Images en unités de 40 ms
219 220 221 222 223 224 225 226 227 228
669 670 671 672 673 674 675 676 677 678 679 680
20
20
25
Déplacement (mm)
Déplacement (mm)
Position du 25 Position du
30 30 larynx
larynx
35 35
40 40 Position de
Position de
45 45 l'os hyoïde
l'os hyoïde
50 a k a 50 a kk a
55 55
60 60
65 65
70 70
Figure 117 : Les gestes du larynx et de l’os hyoïde en position intervocalique pour la séquence /aka/ (à gauche)
et /akka/ (à droite) ; locuteur F
Kh
aqa aqqa
Images en unités de 40 ms Images en unités de 40 ms
369 370 371 372 373 374 375 376 377 378 379 652 653 654 655 656 657 658 659 660 661 662 663 664
30 30
35 35
Position du Position du
40 40
Déplacement (mm)
Déplacement (mm)
larynx larynx
45 45
50 Position de 50 Position de
l'os hyoïde
55
60
a q a 55
60
a qq a l'os hyoïde
65 65
70 70
75 75
80 80
Figure 118 : Les gestes du larynx et de l’os hyoïde en position intervocalique pour la séquence /aqa/ (à gauche)
et /aqqa/ (à droite) ; locuteur Kh
F
aqa aqqa
Images en unités de 40 ms Images en unités de 40 ms
373 374 375 376 377 378 379 380 381 382
823 824 825 826 827 828 829 830 831 832 833 834
20
20
Déplacement (mm)
25
Déplacement (mm)
Position du 25 Position du
30 larynx
larynx 30
35 35
40 Position de Position de
45 a q a l'os hyoïde
40
45 a qq a l'os hyoïde
50 50
55 55
60 60
65 65
70 70
Figure 119 : Les gestes du larynx et de l’os hyoïde en position intervocalique pour la séquence /aqa/ (à gauche)
et /aqqa/ (à droite) ; locuteur F
232
Gestes du larynx et de l’os hyoïde en position initiale de mot
2) la position du couple larynx-os hyoïde est relativement basse pour la voyelle /i/, et
entame un geste d’élévation vers le /a/, passant par la consonne. Dans ce contexte
aussi, on ne peut pas dire que la consonne, simple ou géminée, modifie la trajectoire
de voyelle-à-voyelle. Les quelques perturbations induites par les gestes
consonantiques sont minimes;
4) s’il est vrai que le couple larynx-os hyoïde est dans une position relativement basse
durant la réalisation du /i/, puis se trouve dans une position plus haute lors de la
production du /a/, il convient de signaler cependant que cette différence de position
verticale reste faible: elle est de l’ordre de 5 mm à 10 mm, au maximum;
5) nous ne constatons pas non plus ici de stratégie individuelle remarquable dans cette
position.
Kh
ta tta
Images en unités de 40 ms Images en unités de 40 ms
200 201 202 203 204 205 206 207 208 209 210 497 498 499 500 501 502 503 504 505 506 507 508 509 510
30 30
35 35
Position du Position du
40
Déplacement (mm)
larynx 40
Déplacement (mm)
larynx
45 45
50 Position de 50 Position de
55 l'os hyoïde 55 l'os hyoïde
60
65
i t a 60
65
i tt a
70 70
75 75
80 80
Figure 120 : Les gestes du larynx et de l’os hyoïde en position intervocalique pour la séquence /ita/ (à gauche) et
/itta/ (à droite) ; locuteur Kh
233
F
ta tta
Images en unités de 40 ms Images en unités de 40 ms
190 191 192 193 194 195 196 197 198 199 200 201 500 501 502 503 504 505 506 507 508 509 510 511
20 20
25 25 Position du
Position du
30 30
Déplacement (mm)
Déplacement (mm)
larynx larynx
35 35
40 Position de 40 Position de
45 i t a l'os hyoïde 45
50 50 i tt a l'os hyoïde
55 55
60 60
65 65
70 70
Figure 121 : Les gestes du larynx et de l’os hyoïde en position intervocalique pour la séquence /ata/ (à gauche) et
/atta/ (à droite) ; locuteur F
Kh
ka kka
Images en unités de 40 ms Images en unités de 40 ms
235 236 237 238 239 240 241 242 243 244 245 246 247 536 537 538 539 540 541 542 543 544 545 546 547 548
30 30
35 35
Position du Position du
40 40
Déplacement (mm)
Déplacement (mm)
larynx larynx
45 45
50 Position de 50 Position de
55 l'os hyoïde 55 l'os hyoïde
60 i k a 60 i kk a
65 65
70 70
75 75
80 80
Figure 122 : Les gestes du larynx et de l’os hyoïde en position intervocalique pour la séquence /ika/ (à gauche) et
/ikka/ (à droite) ; locuteur Kh
F
ka kka
Images en unités de 40 ms Images en unités de 40 ms
227 228 229 230 231 232 233 234 235 236 237 238 540 541 542 543 544 545 546 547 548 549 550 551 552 553
20 20
25 Position du 25 Position du
30 larynx
30 larynx
Déplacement (mm)
35 35
40 Position de Position de
40
l'os hyoïde l'os hyoïde
45
50 i k a 45
50
i kk a
55 55
60 60
65 65
70 70
Figure 123 : Les gestes du larynx et de l’os hyoïde en position intervocalique pour la séquence /ika/ (à gauche) et
/ikka/ (à droite) ; locuteur F
234
Kh
qa qqa
Images en unités de 40 ms Images en unités de 40 ms
292 293 294 295 296 297 298 299 300 301 302 303 612 613 614 615 616 617 618 619 620 621 622 623
30 30
35 Position du 35 Position du
Déplacement (mm)
Déplacement (mm)
40 larynx 40 larynx
45 45
50 Position de 50 Position de
l'os hyoïde l'os hyoïde
55
60
i q a 55
60
i qq a
65 65
70 70
75 75
80 80
Figure 124 : Les gestes du larynx et de l’os hyoïde en position intervocalique pour la séquence /iqa/ (à gauche) et
/iqqa/ (à droite) ; locuteur Kh
F
qa qqa
Images en unités de 40 ms Images en unités de 40 ms
334 335 336 337 338 339 340 341 342 343 777 778 779 780 781 782 783 784 785 786 787 788
20 20
Position du Position du
25 larynx 25 larynx
30 30
Déplacement (mm)
Déplacement (mm)
35 Position de 35 Position de
40
i q a
l'os hyoïde 40 i qq a l'os hyoïde
45 45
50 50
55 55
60 60
65 65
70 70
Figure 125 : Les gestes du larynx et de l’os hyoïde en position intervocalique pour la séquence /iqa/ (à gauche) et
/iqqa/ (à droite) ; locuteur F
2) la position du couple larynx-os hyoïde est relativement haute pour la voyelle /a/ et
basse pour le /i/. L’insertion d’un geste consonantique, simple ou géminée, ne change
pas remarquablement la trajectoire de voyelle-à-voyelle. Les quelques perturbations
induites par les gestes consonantiques sont minimes. Comme dans les positions
235
précédentes, elles proviennent surtout des consonnes vélaires et uvulaires, avec des
dynamiques assez faibles au niveau du déplacement vertical de ces structures;
4) nos données ne montrent pas non plus de stratégie individuelle remarquable dans
cette position.
Kh
at att
Images en unités de 40 ms Images en unités de 40 ms
147 148 149 150 151 152 153 154 155 156 157 158 159
473 474 475 476 477 478 479 480 481 482 483 484 485
30
30
35 35
40 Position du Position du
Déplacement (mm)
Déplacement (mm) 40
45 larynx larynx
45
50 50 Position de
Position de
55 a t i l'os hyoïde 55 a tt i l'os hyoïde
60 60
65 65
70 70
75 75
80 80
Figure 126 : Les gestes du larynx et de l’os hyoïde en position intervocalique pour la séquence /ati/ (à gauche) et
/atti/ (à droite) ; locuteur Kh
F
at att
Images en unités de 40 ms Images en unités de 40 ms
257 258 259 260 261 262 263 264 265 266 602 603 604 605 606 607 608 609 610 611 612
20 20
25 25
Déplacement (mm)
Position du
Déplacement (mm)
30 30 Position du
larynx larynx
35 35
40 Position de 40 Position de
45 a t i l'os hyoïde 45 a tt i l'os hyoïde
50 50
55 55
60 60
65 65
70 70
Figure 127 : Les gestes du larynx et de l’os hyoïde en position intervocalique pour la séquence /ati/ (à gauche) et
/atti/ (à droite) ; locuteur F
236
Kh
ak akk
221 222 223 224 225 226 227 228 229 230 231 232 508 509 510 511 512 513 514 515 516 517 518 519 520
30 30
35 Position du 35 Position du
larynx 40 larynx
40
Déplacement (mm)
Déplacement (mm)
45 45
Position de
50 Position de 50 l'os hyoïde
l'os hyoïde
55
60 a k i
55
60 a kk i
65 65
70 70
75 75
80 80
Figure 128 : Les gestes du larynx et de l’os hyoïde en position intervocalique pour la séquence /aki/ (à gauche) et
/akki/ (à droite) ; locuteur Kh
F
ak akk
Images en unités de 40 ms Images en unités de 40 ms
298 299 300 301 302 303 304 305 306 307 308 645 646 647 648 649 650 651 652 653 654 655 656
20 20
25
Déplacement (mm)
Position du 25
Position du
30 larynx 30
Déplacement (mm)
larynx
35 35
40
45
a k i
Position de
l'os hyoïde
40
45 a kk i
Position de
l'os hyoïde
50 50
55 55
60 60
65 65
70 70
Figure 129 : Les gestes du larynx et de l’os hyoïde en position intervocalique pour la séquence /aki/ (à gauche) et
/akki/ (à droite) ; locuteur Kh
237
Pour résumer nos résultats, nous rappelons les constats suivants :
1) nous avons remarqué une similarité entre les trajectoires du larynx et de l’os hyoïde à
travers nos différentes séquences, ainsi qu’une ressemblance structurelle des trajectoires,
quels que soient les contextes consonantiques, les positions des séquences cibles dans les
mots et les locuteurs. Ce couplage étroit observé entre le couple larynx-os hyoïde se
confirme même si la « corrélation » entre les trajectoires de ces deux structures est
obtenue à partir de leur déplacement vertical respectif. Rappelons que Vaxelaire et Sock
(1997) obtiennent, eux, des corrélations relativement élevées entre le déplacement vertical
du larynx et la composante horizontale du mouvement diagonal de l’os hyoïde;
2) nous avons trouvé que le contrôle spatiotemporel du geste du larynx et de celui de l’os
hyoïde était comparable entre les consonnes simples et les consonnes géminées;
Ayant exploré, tant que faire se peut, le domaine spatiotemporel de la gémination en tarifit,
nous proposons maintenant d’essayer de déceler quelques relations entre paramètres
articulatoires et/ou articulatori-acoustiques. Nous pensons que de telles relations (voire
corrélations) pourraient sous-tendre l’opposition phonologique de la gémination.
238
11 L’étendue de contact : un paramètre pertinent pour l’étude de la
gémination ?
Suivant l’étude cinéradiographique menée par Vaxelaire (1995b) sur des consonnes
simples et doubles (hétéromorphémiques homorganiques) du français, où elle montre que
l’étendue de contact (la zone de contact palais/langue) est plus importante pour les occlusives
doubles que pour les occlusives simples, nous avons nous-mêmes conduit une expérience
similaire, mais préliminaire, sur les géminées du tarifit (Bouarourou et al., 2008). Nos
résultats ainsi ont révélé une étendue de contact plus large pour les géminées que pour les
simples.
Les tableaux suivants montrent les étendues de contact pour nos deux locuteurs, pour
toutes nos consonnes occlusives et dans les trois positions de mots (en positions
intervocalique, initiale et finale non absolues). Cependant, nous ne donnons dans le texte que
les résultats d’un seul locuteur, et cela uniquement en position intervocalique. En effet,
l’observation et l’analyse des données nous ont indiqué une ressemblance remarquable des
résultats, tant qualitative que quantitative, entre nos deux locuteurs et dans les trois positions
(cf.Annexe 3).
Tableau 33 : Données correspondant à l’étendue de contact des occlusives en positions initiale, intervocalique et
finale du locuteur Kh
t tt k kk q qq
CV 6 9 12 17 12 14
Etendue de contact (mm)
VCV 6 9 13 20 7 20
VC 6 11 11 22 11 19
d dd g gg
CV 5 9 10 17
VCV 5 9 13 20
VC 6 10 11 18
239
Tableau 34 : Données correspondant à l’étendue de contact des occlusives en positions initiale, intervocalique et
finale du locuteur F
t tt k kk q qq
CV 5 9 12 21 14 26
Etendue de contact (mm)
VCV 5 11 11 18 13 20
VC 5 11 11 22 11 33
d dd g gg
CV 5 11 12 22
VCV 5 10 11 18
VC 4 10 9 20
Il convient alors, au préalable, de donner ici quelques précisions sur la manière dont la
mesure de ce paramètre a été effectuée.
Nous avons d’abord sélectionné les images présentant le contact maximum pour chaque
consonne considérée. Nous avons ensuite copié chaque image sélectionnée sur un fichier
(Word), et nous avons tracé une ligne recouvrant le contact entre la langue et les alvéoles pour
les consonnes alvéolaires, le contact entre la langue et le palais mou pour les consonnes
vélaires, et enfin le contact entre la langue et la luette pour les consonnes uvulaires.
Dans le fichier, nous obtenons la hauteur ainsi que la longueur de la ligne tracée. Afin
de déterminer la taille de la ligne tracée, nous avons appliqué le théorème de Pythagore
puisque la taille de la ligne de contact correspond à l’hypoténuse du triangle correspondant à
la hauteur et la longueur obtenue. Ainsi, la distance de contact, correspondant à l’hypoténuse
tracée par le triangle, dont nous avons la hauteur et la longueur, correspond à la racine carrée
de la largeur au carré sur la hauteur au carré. Les mesures sont indiquées en mm.
L’analyse des vues de profil indique les résultats suivants (voir Figure 130 et Figure 139
et Tableau 33 et Tableau 34) :
1) l’étendue de contact est systématiquement plus importante pour les géminées que pour
les simples, aussi bien pour les occlusives non voisées que pour les voisées ;
2) cette différence entre les étendues de contact pour les deux catégories est au minimum
de 3 mm, et de 22 mm au maximum ;
240
4) ces résultats traversent l’ensemble de nos données qui figurent en Annexe 3.
241
Figure 131 : Étendue de contact (/tt/ =11mm) du locuteur F.
242
Figure 132 : Étendue de contact (/k/ =11mm) du locuteur F.
243
Figure 133 : Étendue de contact (/kk/ =18mm) du locuteur F.
244
Figure 134 : Étendue de contact (/q/ =13mm) du locuteur F.
245
Figure 135 : Étendue de contact (/qq/ =20mm) du locuteur F.
246
Figure 136 : Étendue de contact (/d/ =5mm) du locuteur F.
247
Figure 137 : Étendue de contact (/dd/ =10mm) du locuteur F.
248
Figure 138 : Étendue de contact (/g/ =11mm) du locuteur F.
249
Figure 139 : Étendue de contact (/gg/ =18mm) du locuteur F.
250
Ce paramètre spatial est décidemment un candidat robuste pour distinguer les consonnes
simples des géminées du tarifit, tout comme il l’a été pour distinguer les consonnes simples
des doubles du français (Vaxelaire, 1995b).
Essayons maintenant de voir s’il existe certaines relations entre nos paramètres
articulatoires et/ou articulatori-acoustiques.
La Figure 140 montre, en opposant les termes de chaque opposition phonologique, que
la durée de la tenue articulatoire (ms) des occlusives sourdes géminées est plus longue que
celle de leurs homologues simples, et cela est valable pour les deux locuteurs. On constate
également que l’étendue de contact en millimètres (mm) des consonnes occlusives sourdes
géminées est plus large que celle des simples, pour les deux locuteurs. On voit aussi que plus
le contact est postérieur dans le conduit vocal, plus l’étendue de contact tend à être plus large,
et cela est vrai pour les simples et pour les géminées (à l’exception de la consonne uvulaire du
locuteur Kh ; voir Figure 140 à droite).
F Kh
35 35
30 30
Etandue de contact (mm)
25 25
t t
20 tt 20 tt
15 k 15 k
kk kk
10 10
q q
5 5
qq qq
0 0
0 50 100 150 200 0 50 100 150 200
Durée de la tenue articulatoire Durée de la tenue articulatoire
Figure 140 : Étendue de contact (mm) et la durée de la tenue articulatoire (ms) des occlusives sourdes en
position intervocalique, pour le locuteur F, (à gauche) et Kh, (à droite).
Pour les consonnes sonores, la Figure 141 montre que la durée articulatoire (ms) des
occlusives sonores géminées est plus longue que celle de leurs homologues simples, et cela
est valable pour les deux locuteurs. L’étendue de contact des consonnes occlusives sonores
géminées est encore plus large que celle des simples pour les deux locuteurs. On constate
également que l’étendue de contact des vélaires est plus large que celle des alvéolaires, aussi
bien pour les simples que pour les géminées, et ce pour les deux locuteurs.
251
Si l’on ne peut pas parler ici de corrélations entre ces deux paramètres articulatoires, au
sens strict du terme, on observe néanmoins une sorte d’assignation de valeurs de base : à
tenue articulatoire longue, une étendue de contact large, et vice versa.
F Kh
35 35
30 30
25 25
20 d 20 d
15 dd 15 dd
g g
10 10
gg gg
5 5
0 0
0 20 40 60 80 100 120 140 160 180 200 0 50 100 150 200
Durée de la tenue articulatoire Durée de la tenue articulatoire
Figure 141 : Étendue de contact (mm) et la durée de la tenue articulatoire des occlusives sonores en position
intervocalique pour le locuteur F (à gauche) et Kh (à droite).
La Figure 142 condense les résultats donnés ci-dessus. Elle montre que la durée
articulatoire (ms) des occlusives sonores géminées est plus longue que celle de leurs
homologues simples, pour les deux locuteurs et dans les trois positions (initiale,
intervocalique et finale). Nous voyons aussi que l’étendue de contact des consonnes
occlusives sourdes et sonores géminées, dans les trois positions de mot, ne permet pas une
séparation globale entre nos deux classes phonologiques (simples/géminées). L’étendue de
contact des géminées est plus large que celle des simples pour les deux locuteurs.
35
30
Etandue de contact (mm)
25
20
15 simple
géminée
10
0
0 50 100 150 200
Durée de la tenue articulatoire (ms)
Figure 142 : Étendue de contact (mm) et la durée de la tenue articulatoire des occlusives sourdes et sonores en
positions initiale, intervocalique et finale pour les locuteurs F et Kh.
252
Relations entre paramètres articulatori-acoustiques : étendue de contact / durée acoustique
Les Figure 143 et Figure 144 montrent que la durée acoustique (ms) des occlusives
sourdes et sonores géminées est plus longue que celle de leurs homologues simples, et cela est
valable pour les deux locuteurs. Quant à l’étendue de contact (mm), on constate qu’elle est
plus large pour les consonnes occlusives sourdes et sonores géminées par rapport aux simples
pour les deux locuteurs. Si nous avions signalé ces résultats auparavant, ce qui nous semble
intéressant ici est de remarquer comment la combinaison des deux paramètres permet une
nette distinction des termes de l’opposition phonologique.
F Kh
35 35
30
25 25
t t
20 tt 20 tt
15 k 15 k
kk kk
10 10
q q
5 5
qq qq
0 0
0 50 100 150 200 250 300 0 50 100 150 200 250 300
Durée (ms) Durée (ms)
Figure 143 : Étendue de contact (mm) et la durée acoustique (ms) des occlusives sourdes en position
intervocalique pour le locuteur F (à gauche) et Kh (à droite).
F Kh
35 35
30 30
Etandue de contact (mm)
Etandue de contact (mm)
25 25
20 d 20 d
15 dd 15 dd
g g
10 10
gg gg
5 5
0 0
0 50 100 150 200 250 300 0 50 100 150 200 250 300
Durée (ms) Durée (ms)
Figure 144 : Étendue de contact (mm) et la durée acoustique (ms) des occlusives sonores en position
intervocalique pour le locuteur F (à gauche) et Kh (à droite).
La Figure 145 montre que la durée acoustique (ms) et la durée de la tenue articulatoire
des occlusives sourdes géminées sont plus longues que celles de leurs homologues simples, et
cela est valable pour les deux locuteurs.
253
Relations entre paramètres articulatori-acoustiques : tenue articulatoire / durée acoustique
L’examen des figures (Figure 145 à Figure 148) révèle que lorsque ces deux paramètres
temporels sont combinés, ils possèdent une puissance notoire pour distinguer nettement les
deux catégories phonologiques, aussi bien pour les consonnes non voisées que voisées, et
autant pour les occlusives que pour les constrictives. Le phénomène phonologique de la
gémination repose décidemment et prioritairement sur du substrat physique temporel.
F Kh
180 180
140 140
120 t 120 t
100 tt 100 tt
80 k 80 k
60 kk 60 kk
40 q 40 q
20 qq 20 qq
0 0
0 50 100 150 200 250 300 0 50 100 150 200 250 300
Durée (ms) Durée (ms)
Figure 145 : Durée de la tenue articulatoire et la durée acoustique (ms) des occlusives sourdes en position
intervocalique pour le locuteur F (à gauche) et Kh (à droite).
F Kh
180 180
Durée de la tenue articulatoire
160 160
Durée de la tenue articulatoire
140 140
120 120
100 100 d
d
80 80
dd dd
60
g 60 g
40
gg 40 gg
20
20
0
0 50 100 150 200 250 300 0
0 50 100 150 200 250 300
Durée (ms) Durée (ms)
Figure 146 : Durée de la tenue articulatoire et la durée acoustique (ms) des occlusives sonores en position
intervocalique pour le locuteur F (à gauche) et Kh (à droite).
254
F Kh
250 250
Durée de la tenue articulatoire
150 150
s s
ss ss
100 100
S S
50 SS 50 SS
0 0
0 50 100 150 200 250 0 50 100 150 200 250
Durée (ms) Durée (ms)
Figure 147 : Durée de la tenue articulatoire et la durée acoustique (ms) des constrictives sourdes en position
intervocalique pour le locuteur F (à gauche) et Kh (à droite).
La Figure 148 montre que la durée acoustique (ms) et la durée de la tenue articulatoire
des constrictives sonores géminées sont plus longues que celles de leurs homologues simples,
et cela est valable pour les deux locuteurs.
F Kh
250 250
Durée de la tenue articulatoire
200 200
150 150
z z
zz zz
100 100
Z Z
50 ZZ 50 ZZ
0 0
0 50 100 150 200 250 0 50 100 150 200 250
Durée (ms) Durée (ms)
Figure 148 : Durée de la tenue articulatoire et la durée acoustique (ms) des constrictives sonores en position
intervocalique pour le locuteur F (à gauche) et Kh (à droite).
255
L’analyse des vues de profil indique les résultats suivants en ce qui concerne l’étendue de
contact (mm) : a) l’étendue de contact des occlusives est systématiquement plus importante
pour les géminées que pour les simples ; b) l’étendue de contact augmente de la consonne
alvéolaire, au vélaire (réalisée plutôt palatale ici), puis à l’uvulaire (à quelques rares
exceptions près). Par rapport à la durée de la tenue articulatoire (ms), celle des occlusives et
des constrictives géminées (voir Annexe pour ces dernières) est plus longue que celle de
leurs homologues simples.
Au niveau de relations entre paramètres articulatoires, les données montrent une sorte
d’assignation de valeurs de base : à tenue articulatoire longue, une étendue de contact large,
et vice versa. Par rapport aux relations articulatori-acoustiques, on remarque que la
combinaison de l’étendue de contact et de la durée acoustique des consonnes permet une
nette distinction des termes de l’opposition phonologique. L’examen des données révèle que
lorsque deux paramètres temporels sont combinés, à savoir la tenue articulatoire et la durée
acoustique, ils possèdent une puissance notoire pour distinguer nettement les deux catégories
phonologiques, aussi bien pour les consonnes non voisées que voisées, et autant pour les
occlusives que pour les constrictives. Le phénomène phonologique de la gémination repose
décidemment et prioritairement sur du substrat physique temporel.
Au terme de ces analyses articulatoires, nous allons maintenant proposer, dans la partie qui
suit, une synthèse générale de notre travail, à savoir nos réflexions phonologiques et
phonétiques, de tous nos résultats, acoustiques et articulatoires, le tout discuté dans le cadre
de considérations théoriques présentées au début de cette étude.
256
13 Synthèse Générale et discussion
Ce travail s’est focalisé sur le parler du tarifit de la province de Nador, afin d’étudier la
gémination dans cette variante du berbère, parlée au Maroc.
Au Maroc, on distingue trois grandes variétés du berbère parlées par environ 40% de la
population. Les variétés en question sont :
ETAT DE LA QUESTION
Dans la revue critique de l’état de la question (Ridouane, 2003), nous avons tenté,
d’abord, de montrer les différents arguments concernant la représentation des géminées en un
seul segment ou en une suite de deux segments. Nous avons ensuite évoqué les débats
contradictoires concernant les notions de tension et de gémination. En effet, dans le cadre de
la phonologie CV, il existe deux représentations : la représentation X-slot et la représentation
moraïque. La première est fondée sur la durée et la seconde sur le poids de la syllabe. Enfin,
nous avons présenté les caractéristiques phonétiques et phonologiques des géminées en
positions initiale et finale.
Rappelons que dans la phonologie CV (par ex. Leben, 1980), une géminée est
représentée comme une seule unité mélodique associée à deux positions prosodiques. Les
comportements des géminées, à savoir leur ambivalence, leur intégrité et leur inaltérabilité,
ont été observées ; les traits suivants ont été retenus pour le tarifit : a) L’ambivalence : dans
257
certains cas les géminées se comportent comme si elles constituaient deux segments, et dans
d'autres, comme si elles n’en constituaient qu’un seul. b) L’intégrité : dans la mesure où ils
constituent deux segments, les segments longs ne peuvent pas être divisés par des règles
d’épenthèses. c) L’inaltérabilité : l'échec de certains processus phonologiques à modifier les
géminées lexicales, tout en affectant les simples et les « fausses » géminées.
Sur le plan acoustico-perceptif, nous avons mentionné quelques travaux (par ex.
Ridouane, 2003 ; Abramson, 1987, 1998 ; Lahiri & Hankamer, 1988 ; Arvaniti & Tserdanelis,
2000, 2001 ; Kawahara, 2012), menés sur différentes langues qui possèdent la distinction
simple / géminée, afin de dégager les indices acoustiques responsables de cette opposition.
Plusieurs tests ont été effectués sur plusieurs paramètres comme la durée des voyelles
adjacentes, la durée de l’occlusion, la durée du VOT, la durée des fricatives, l’amplitude du
burst et la fréquence fondamentale de la voyelle suivante. Ces auteurs ont dégagé plusieurs
indices qui permettent de distinguer les simples des géminées. La plupart des travaux cités
trouvent que la durée de la tenue consonantique est l’indice principal pour distinguer les deux
catégories. D’autres indices trouvés sur certaines langues restent secondaires.
Sur le plan articulatoire et physiologique, nous avons présenté quelques travaux (par
ex. Vaxelaire, 1995b ; Ridouane, 2003 ; Ridouane, 2007 ; Farnetani, 1990 ; Byrd, 1995 ;
Kraehenmann & Lahiri, 2008 ; Löfqvist, 2005 ; 2006 ; 2007 ; 2009) menés sur différentes
langues qui possèdent la distinction simple / géminée, afin de dégager les indices
articulatoires responsables de cette opposition. Différentes méthodes ont été testées sur le
phénomène de la gémination aux niveaux glottique et supraglottique. La méthode
fibroscopique permet de tester la durée et le degré d’ouverture glottale pendant la tenue des
consonnes simples et des consonnes géminées. Quant à la méthode électromyographique, elle
s’appuie sur le nombre de sommets des courbes pour distinguer les simples des géminées et
pour vérifier si les géminées impliquent une ré-articulation ou non. En ce qui concerne la
méthode électropalatographique, elle est utilisée pour déterminer la durée et l’étendue du
contact entre la langue et le palais. Enfin, la méthode cinématique vise à observer les
différents contacts et les différents mouvements des articulateurs, afin de comparer les
consonnes simples aux consonnes géminées. Les principaux enseignements à tirer de telles
investigations sont les suivants : a) une durée acoustique de la tenue consonantique plus
longue pour les géminées ; b) des occlusions (contacts ou étendues de contact) plus longues
pour les géminées ; c) une forte augmentation de la pression intraorale ; un mouvement de la
langue de la première à la deuxième voyelle ayant une durée plus longue pour les consonnes
longues que pour les brèves.
258
Dans le cadre du paradigme de la perturbation et des réajustements, plusieurs études
ont examiné les consonnes simples et les consonnes géminées au niveau acoustique et au
niveau articulatoire, en variant la vitesse d’élocution (cf. Gaitenby, 1965 ; Sock, 1998 ;
Arvaniti, 1999 ; Pickett et al., 1999 ; Amano & Hirata, 2010 ; Munhall & Löfqvist, 1992 ;
Vaxelaire 1995.a et b). L’objectif est de vérifier l’impact de la vitesse d’élocution sur ces
consonnes : la compressibilité, l’incompressibilité de certaines catégories et la résistivité de la
gémination à l’augmentation de la vitesse d’élocution. Quelques résultats principaux
montrent : a) lorsque la durée est l’indice principal pour une distinction catégorielle, il n’y a
pas de chevauchement temporel qui survient entre les catégories, malgré une augmentation de
la vitesse d’élocution ; b) le changement des rapports voyelle/consonne n’affecte pas
systématiquement et de manière cohérente la perception des distinctions simples vs.
géminées ; c) le ratio de la durée de la tenue des occlusives par rapport au mot était invariant
et distingue clairement les deux catégories phonémiques.
METHODOLOGIE
Sur le plan articulatoire, nous avons extrait deux films sur le berbère du tarifit de la base
de données de l’Institut de Phonétique de Strasbourg pour la présente étude. Les radiofilms
fournissent une information dans le plan sagittal de la position et des déplacements d'un
certain nombre d'articulateurs tels que les lèvres, la mâchoire, la langue, le voile du palais, le
pharynx, l'os hyoïde et le larynx. Par rapport aux films de cette investigation, le logiciel X-
Articulator nous a permis d’obtenir le contour des différents articulateurs de manière
259
automatique ou semi-automatique. Nous avons retenu les paramètres articulatoires suivants :
a) l’ouverture de la constriction ; b) La constriction pharyngale ; c) l’aperture labiale ; d) la
position du larynx ; e) la position de l’os hyoïde ; f) l’étendue de contact.
RESULTATS EXPERIMENTAUX
Au niveau acoustique, les données absolues reposent sur les mesures suivantes : a) la
durée des consonnes simples et géminées dans trois positions : intervocalique, initiale non
absolue et finale non absolue, produites à deux vitesses d’élocution, normale et rapide ; b) les
durées intersegmentales pour les consonnes simples et géminées dans les trois positions citées
ci-dessus ; c) les durées intrasegmentales des occlusives sourdes et sonores en vitesse
d’élocution normale et rapide (ces durées intrasegementales ont été prélevées pour les sourdes
en position intervocalique, en initiale et finale non absolue, et uniquement en position
intervocalique et initiale non absolue pour les sonores).
Les résultats dans le domaine intersegmental montrent, pour toutes les consonnes,
simples et géminées, produites en vitesse d'élocution normale ou rapide, que la durée de la
tenue consonantique est l’indice principal qui permet de les distinguer (conformément à
l’Hypothèse n° 1). Ce résultat corrobore ceux attestés dans la littérature (voir par ex.
Ridouane, 2003, 2007 ; Abramson, 1987, 1998 ; Lahiri & Hankamer, 1988). La durée des
voyelles adjacentes ne contribue pas à l’opposition phonologique de la gémination
(l’Hypothèse n° 2 n’est pas vérifiée). Nos données pour le tarifit ne correspondent pas à celles
de McKay (1980) sur le rembarrnga (langue nord-australienne), qui ont démontré que les
voyelles sont plus courtes devant les géminées que devant les simples. Elles ne correspondent
pas non plus à celles de (Campbell, 1999 ; Fukui, 1987 ; Han, 1994 ; Hirata, 2007 ; Hirose &
Ashby, 2007 ; Idemaru & Guion, 2008 ; Kawahara, 2006 ; Ofuka, 2003 ; Port et al., 1987 ;
Takeyasu, 2012), qui ont montré que les voyelles sont plus longues devant les géminées que
devant les simples (cité par Kawahara (2012)).
En revanche, elles confirment celles attestées par (Ridouane, 2003, 2007 ; Abramson,
1987, 1998 ; Lahiri & Hankamer, 1988). Dans le domaine intrasegmental, l’analyse a permis
de conclure que la durée du silence acoustique est le corrélat principal qui permet de
distinguer les occlusives sourdes simples de leurs homologues géminées (l’Hypothèse n° 3 est
vérifiée). Pour les occlusives sonores simples et géminées, c’est la durée de l’occlusion qui
sert à distinguer les deux catégories (ce qui est conforme à l’Hypothèse n° 4). Le VOT
n’intervient pas la séparation des catégories phonologiques (ce qui va à l’encontre de
260
l’Hypothèse n° 5). Il en va de même du VTT qui ne permet pas (Hypothèse n° 6) de séparer
les occlusives sourdes simples des géminées. La compression des segments, provoquée par
l’augmentation de la vitesse d’élocution, ne nuit pas au maintien du contraste phonologique
(l’Hypothèse n° 7 est confirmée). Pour conclure, nous posons que la tenue consonantique est
un indice absolu et universel pour discriminer les simples des géminées.
DONNEES ARTICULATOIRES
L’analyse des données de nos deux locuteurs, Kh et F, pour les séquences VCV, où la
consonne est une occlusive sourde ou sonore, révèle que nos paramètres articulatoires, à
savoir l’ouverture de la constriction, la constriction pharyngale et l’aperture labiale sont de
bons candidats pour l’étude de l’organisation spatiotemporelle de la production de la
consonne simple et de son homologue géminée, aussi bien dans le contexte apical que vélaire
et uvulaire (pour les sourdes). La trajectoire de ces trois paramètres, dans les configurations
consonantiques cibles, est structurellement similaire entre la simple et la géminée.
Par rapport au timing de ces trois paramètres articulatoires, il est évident que c’est le
contact alvéolaire, vélaire et uvulaire, plus long pour la géminée, qui est le paramètre
préférentiel de la distinction phonologique simple vs. géminée (Hypothèse n° 1). Dans le cas
261
des consonnes alvéolaires et vélaires, ce contact est accompagné de l’augmentation de la
constriction pharyngale et de la réduction de l’aperture labiale, qui durent plus longtemps
pour la géminée comparée à la simple, pendant l’occlusion. Le contact uvulaire, lui, est
accompagné d’une réduction de la constriction pharyngale, qui a une durée plus longue pour
les géminées, comparées aux simples. L’aperture labiale, pour l’uvulaire, reste relativement
stable tout au long de la production de la séquence VCV.
Toujours au niveau du timing articulatoire, nous avons constaté que les gestes
anticipatoires, pour produire les consonnes cibles, simples ou géminées, sont initiés plus
précocement durant la production de la voyelle précédente. Cette stratégie anticipatoire est
encore plus précoce pour les géminées, comparées aux consonnes simples Delattre (1971) en
contextes alvéolaire et vélaire. Nous avons vu aussi, dans les contextes apical et vélaire, la
mise en place d’une stratégie de coarticulation rétentrice au service de la réalisation de la
gémination, afin de marquer le contraste temporel entre les deux termes de l’opposition
phonologique. Cette dernière conduite motrice n’est pas généralisable en contexte uvulaire
(Hypothèse n° 4).
Par rapport aux constrictives sourdes et sonores, l’examen des trajectoires de nos trois
paramètres articulatoires dans les contextes révèle des comportements clairs et généralisables.
Au niveau du timing des gestes, la constriction maximale dure plus longtemps pour les
géminées que pour les simples, et cela de façon remarquable (Hypothèse n° 1). La diminution
de l’aperture labiale, durant le maintien de la constriction alvéolaire maximale dure, elle aussi,
plus longtemps pour les géminées que pour les simples.
Les gestes anticipatoires sont plus nets lors des transitions de voyelles à consonnes que
des transitions des consonnes cibles aux voyelles suivantes. C’est grâce à ces stratégies de
persévération des gestes associés aux configurations fermantes du conduit vocal pour les
géminées que les différences temporelles entre consonnes simples et consonnes géminées sont
maximisées (Hypothèse n° 4).
En ce qui concerne le niveau laryngal, nous avons remarqué une similarité entre les
trajectoires du larynx et de l’os hyoïde à travers nos différentes séquences, ainsi qu’une
262
ressemblance structurelle des trajectoires, quels que soient les contextes consonantiques, les
positions des séquences cibles dans les mots et les locuteurs. Ce couplage étroit observé entre
le couple larynx-os hyoïde se confirme même si la « corrélation » entre les trajectoires de ces
deux structures est obtenue à partir de leur déplacement vertical respectif. Rappelons que
Vaxelaire et Sock (1997) obtiennent, eux, des corrélations relativement élevées entre le
déplacement vertical du larynx et la composante horizontale du mouvement diagonal de l’os
hyoïde.
Nous avons trouvé que le contrôle spatiotemporel du geste du larynx et de celui de l’os
hyoïde était comparable entre les consonnes simples et les consonnes géminées (Hypothèse n°
5 n’est pas confirmée). Le mouvement de l’ensemble larynx-os hyoïde est inversement
corrélé avec le déplacement vertical de la masse de la langue et, en conséquence, avec
l’aperture vocalique. Ainsi, nos données rejettent elles aussi « l’hypothèse tongue-pull »
(tongue-pull hypothesis). L’analyse du déplacement vertical de l’ensemble larynx-os hyoïde
ne permet pas de déceler un comportement qui serait à lier avec des oppositions
consonantiques phonologiques sourdes vs. sonores. Cette affirmation devrait toutefois être
nuancée étant donné que le contexte adjacent n’est pas comparable.
Les trajectoires des structures supraglottiques et celles des structures glottiques restant
comparables quels que soient les contextes et les locuteurs, nous ne pouvons pas affirmer que
les structures glottiques soient plus résistantes.
L’analyse des vues de profil indique les résultats suivants en ce qui concerne l’étendue
de contact (mm) : a) l’étendue de contact des occlusives est systématiquement plus importante
pour les géminées que pour les simples ; b) l’étendue de contact augmente de la consonne
apical, à la vélaire (réalisée plutôt palatale ici), puis à l’uvulaire (à quelques rares exceptions
près). Par rapport à la durée de la tenue articulatoire (ms), celle des occlusives et des
constrictives géminées est plus longue que celle de leurs homologues simples.
Au niveau des relations entre paramètres articulatoires, les données montrent une sorte
d’assignation de valeurs de base : à tenue articulatoire longue, une étendue de contact large,
et vice versa. Par rapport aux relations articulatori-acoustiques, on remarque que la
combinaison de l’étendue de contact et de la durée acoustique des consonnes permet une nette
distinction des termes de l’opposition phonologique. L’examen des données révèle que
lorsque deux paramètres temporels sont combinés, à savoir la tenue articulatoire et la durée
263
acoustique, ils possèdent une puissance notoire pour distinguer nettement les deux catégories
phonologiques, aussi bien pour les consonnes non voisées que voisées, et autant pour les
occlusives que pour les constrictives. Le phénomène phonologique de la gémination repose
décidemment et prioritairement sur du substrat physique temporel.
Nous avions fait varier le voisement en supposant que ce trait puisse avoir quelques
impacts sur l’opposition phonologique. Il s’agissait pour nous d’avoir une idée globale sur la
question, sachant que nous n’avions pas de paires minimales pouvant nous permettre de tirer
des conclusions sûres relatives à cette question. Globalement, il nous semble que le voisement
n’ait pas d’influences sur le contrôle spatiotemporel de la gémination, et cela à partir de
l’examen de nos paramètres acoustiques et articulatoires.
Nous allons, dans le chapitre suivant, exposer nos remarques conclusives, ainsi que
quelques perspectives.
264
14 Conclusions et perspectives…
Nous avons étudié, dans cette thèse, le phénomène phonologique de la gémination dans
le berbère du tarifit parlé au Maroc, dans la province de Nador.
Un certain nombre d’hypothèses a été formulé, aussi bien dans le domaine acoustique
que dans le domaine articulatoire. Il s’agissait essentiellement d’identifier des indices
acoustiques et articulatoires potentiels qui pourraient sous-tendre le trait phonologique de la
gémination. Nous proposons de rappeler ici ces hypothèses, et de voir dans quelle mesure
celles-ci ont été confirmées ou infirmées par les résultats de nos investigations.
Sur le plan acoustique, nous tentons maintenant de donner des réponses concises aux
hypothèses suivantes que nous avions formulées :
Hypothèse n° 2 : Des faits phonologiques reposant habituellement sur des dimensions pluri-
indicielles, nous pensons que la ou les voyelles adjacentes pourraient contribuer à renforcer le
trait phonologique de la gémination.
Le silence acoustique pour les sourdes (Hypothèse n° 3) et l’occlusion consonantique pour les
sonores (Hypothèse n° 4), deux intervalles intrasegmentaux consonantiques, devraient sous-
tendre l’opposition phonologique de la gémination, en tant qu’indices de renfort du trait
potentiellement principal de la tenue consonantique.
265
Réponses n° 3 et 4 : Ces deux hypothèses ont été vérifiées, soulignant ainsi le caractère
temporel de la gémination en tant que fait phonologique.
Hypothèse n° 5 : Nous pensons, comme précisé auparavant, que l’opposition entre consonnes
simples et géminées, qui pourrait reposer aussi sur des différences de pression intra-orale
durant la tenue consonantique, et également sur des différences de changement de la pression
d’air au relâchement, aurait une incidence sur la durée du VOT ; la durée du VOT des
géminées devrait, en conséquence, être plus longue que celle des simples.
Réponse n° 5 : Nous n’avons pas observé de différences de durée de VOT entre simples et
géminées, ce qui laisse penser que des différences éventuelles de pression intra-orale entre les
deux catégories n’ont pas été suffisamment importantes pour avoir des conséquences
acoustiques. D’ailleurs, ce constat semble être conforté par nos données articulatoires qui ne
révèlent pas de différences de position du larynx, entre simples et géminées (voir infra).
Hypothèse n° 6 : Il est probable que le VTT des simples soit plus long que celui des géminées,
étant donné que plus la tenue consonantique est brève, plus la proportion du délai d’arrêt du
voisement dans cette tenue risque d’être élevée.
Réponse n° 6 : La durée du VTT reste comparable pour les deux classes phonologiques, ce
qui indique que le voisement ne « déborde » pas dans la phase silencieuse de la tenue
consonantique, au risque de mettre à mal l’opposition de sonorité qui est pertinent en tarifit.
Au niveau articulatoire, nous apportons des réponses aux hypothèses suivantes que nous
avions avancées :
266
est ainsi probable que l’on trouve des différences de durée des occlusions et de durée des
constrictions, entre consonnes simples et leurs homologues géminées.
Réponse n° 1 : Cela a été confirmé, puisque les occlusions articulatoires, la tenue des
constrictions articulatoires ont toutes été systématiquement plus longues pour les géminées
que pour les simples.
Hypothèse n° 2 : Il est tout-à-fait loisible de croire que les différences temporelles entre les
catégories phonologiques, géminées vs. simples, pourraient être accompagnées de différences
au niveau des déplacements d’articulateurs critiques, soit dans la dimension spatiale.
Hypothèse n° 3 : Des différences spatiotemporelles entre nos deux locuteurs pourraient être
observées dans cette investigation, si l’on prend en compte les facteurs liés généralement aux
spécificités du locuteur.
Réponse n° 4 : Il est vrai que des stratégies anticipatoires, tout comme des faits liés à la
rétention spatiotemporelle des gestes, servent à faire émerger correctement les géminées.
267
les éjectives, à cause d’un taux de la pression intra-orale supérieur pour les géminées, par
rapport aux simples.
Réponse n° 5 : La position du couple larynx-os hyoïde reste comparable pour les deux termes
de l’opposition phonologique. Cela semble indiquer que des différences éventuelles de
pression intra-orale n’ont pas eu d’incidence sur la position de ce couple et, en conséquence,
sur les valeurs du VOT (discuté supra).
Au total, nos données et nos observations nous amènent à insister sur la mise au jour de
régularités acoustiques et articulatoires dans la réalisation du trait phonologique de la
gémination. Si l’on ne peut pas, selon nos résultats, parler de présence d’invariances absolues
ou relatives qui sous-tendraient la gémination, nous pensons qu’il convient de prendre en
compte les indices acoustiques robustes - que nous avons signalés - présents dans le signal de
parole (Stevens, 1972), ainsi que les indices articulatoires relatifs au niveau du contrôle
spatiotemporel des gestes articulatoires (Liberman & Mattingly, 1985 ; Fujimura, 1991 ;
Browman & Goldstein, 1989 ; Saltzman et al., 1987). On gardera toutefois à l’esprit la nature
écologique du système de production / perception de la parole qui devrait forcément intégrer
les phénomènes de variabilités (Lindblom , 1987) pour être mieux appréhendé.
Ainsi, les géminées du tarifit seraient calquées sur leurs homologues simples, le
locuteur ayant appris à mettre en place des réorganisations spatiotemporelles articulatoires et
268
acoustiques adéquates pour passer d’une entité à l’autre. En effet, selon nos données
articulatoires et acoustiques, le locuteur ferait la même chose une fois, mais pour un lapse de
temps plus long (« doing the same thing once, for a longer period of time »), puisque :
En perspectives…
1) Nous espérons conduire des tests de perception afin de déterminer les points de
rupture perceptive, dans les dimensions temporelle et spatiale, entre consonnes
simples et consonnes géminées, grâce à des tests de perception catégorielle ou de
gating, par exemple.
2) Il serait intéressant aussi de se servir de ces données sur la gémination du tarifit pour le
développement de modèles articulatoires géométriques du conduit vocal (Maeda,
1990 ; Laprie & Busset, 2011). De tels modèles peuvent être utilisés afin d’étudier la
gémination d’un point de vue dynamique, ainsi que la variabilité interlocuteur. La
synthèse articulatoire (Laprie et al., 2014), et plus généralement les techniques de
simulation de la production de la parole, font le lien entre les espaces articulatoire et
acoustique. Elles permettent en particulier d’étudier les mécanismes d’anticipation et
de coordination gestuelle du point de vue de leur impact acoustique (Laprie et al.,
2014). Etant donné que nous disposons de nos données cinéradiographiques
bidimensionnelles et du signal acoustique associé, il convient pour la suite de ce
travail de procéder, en vue d’une synthèse articulatoire, à l’acquisition de données
IRM tridimensionnelles, pour nos deux locuteurs.
- Le lecteur aurait remarqué que les analyses plus précises sur la gémination en lien
avec la variation du trait de voisement n’ont pas été possibles à cause de quelques
limitations inhérentes à un corpus de phrases courtes. Pour pallier ce problème, il
serait bien de construire un corpus plus contrôlé (ceteris paribus), qui nous permettrait
de conduire des analyses statistiques systématiques sur des oppositions simples vs.
géminées, tout en testant l’effet du voisement sur le contraste phonologique de la
gémination.
- Notre corpus ne nous permet pas de comparer les patterns spatiotemporels
articulatoires et acoustiques des géminées à ceux des géminées hétéromorphémiques
homorganiques. C’est seulement en procédant à une analyse comparative de telles
données que nous pourrions savoir si, d’un côté nous avons un contrôle spatiotemporel
correspondant à « doing the same thing once, but for a longer period of time », et de
l’autre côté, un contrôle spatiotemporel renvoyant à « faire deux choses à la fois » ou
« doing two things at once ».
- Toujours par rapport au corpus, si les séquences cibles en position intervocalique ne
posent aucun problème, celles en initial et finale ne sont pas en positions absolues.
Nous n’avons donc pas testé, au sens strict du terme, l’effet de ces positions sur le trait
phonologique.
- Enfin, nous n’avons pas non plus évalué statistiquement les variabilités
interindividuelles, même si d’un point de vu global, les résultats articulatoires et
acoustiques de nos différents locuteurs sont structurellement semblables.
Ces différents points que nous venons de soulever, ainsi que d’autres qui vont sûrement
surgir à la lecture de ce travail, seront pris en compte dans nos travaux de recherche futurs.
270
15 Bibliographie
the 11th International Congress of Phonetic Sciences (Vol. 6, pp. 143–147). Tallinn.
Aix-en-Provence.
Abramson, A. S. (1998). The complex acoustic output of a single articulatory gesture: Pattani
Papers from the Fourth Annual Meeting of the Southeast Asian Linguistics Society
Abry, C., Autesserre, D., Barrera, C., Benoit, C., Boë, L. J., Caelen, J., … Vigouroux, N.
Abry, C., Orliaguet, J.-P., & Sock, R. (1990). Patterns of speech phasing. Their robustness in
the production of a timed linguistic task: single vs. double (abutted) consonants in
Agnello, J. (1975). Voice Onset and Voice Termination features of stutterers. In L. C. Furst &
L. M. Webster (Eds.), Vocal Tract dynamics and dysfluency (pp. 940–954). New
geminate stops in Japanese. The Journal of the Acoustical Society of America, 128(4),
2049–2058.
Armosti, S. (2009). The phonetics of plosive and affricate gemination in Cypriot Greek (PhD
Arvaniti, A. (1999). Effects of speaking rate on the timing of single and geminate sonorants.
Arvaniti, A. (2001). Comparing the phonetics of single and geminate consonants in Cypriot
Arvaniti, A., & Tserdanelis, G. (2000). On the phonetics of geminates: evidence from Cypriot
Arvaniti, A., & Tserdanelis, G. (2001). The acoustic characteristics of geminate consonants in
Ball, M., & Rahilly, J. (1999). Phonetics: The science of speech. London: Arnold.
Barbier, P. (1979). Les mouvements du larynx dans la chaîne parlée en français. In Séminaire
Inquiry, 5, 456–459.
272
Mettouchi, & G. Philipson (Eds.), Etudes de phonétique et linguistique berbères
Beautemps, D., Badin, P., & Bailly, G. (2001). Linear degrees of freedom in speech
Strasbourg, France.
Berger, M. O., & Laprie, Y. (1996). Tracking articulators in X-ray images with minimal user
Berger, M. O., Mozelle, G., & Lapprie, Y. (1995). Towards automatic extraction of tongue
Biarnay, S. (1917). Étude sur les dialectes berbères du Rif: lexique, textes et notes de
(Eds.), Invariance and variability in speech processes (pp. 178–193). Hilsdale, New
273
Blumstein, S. E. (1989). Theoretical implications of the quantal nature of speech: a
Bothorel, A. (1975). Positions et mouvements de l’os hyoïde dans la chaîne parlée. Travaux
Bothorel, A., Simon, P., Wioland, F., & Zerling, J. P. (1986). Cinéradiographie des voyelles
vues latérales du conduit vocal, vues frontales de l’orifice labial, données acoustiques.
Bothorel-Witz, A., & Pétursson, M. (1972). La nature des traits de tension, de sonorité et
Bloch, Strasbourg.
Bouarourou, F., Vaxelaire, B., Ridouane, R., Hirsch, F., Fauth, C., & Sock, R. (2011).
Gemination in Tarifit Berber: Doing one or two things at once? In Proceedings of the
Bouarourou, F., Vaxelaire, B., Ridouane, R., Hirsch, F., & Sock, R. (2008). Gemination in
Tarifit Berber: x-ray and acoustic data. In Proceedings of the 8th International
Bouarourou, F., Vaxelaire, B., Ridouane, R., Hirsch, F., & Sock, R. (2010). La résistivité de
la gémination en tarifit. In Actes des 28e Journées d’Étude sur la Parole (pp. 341–
345). Mons.
Bourciez, E., & Bourciez, J. (1967). Phonétique française : étude historique. Paris: Editions
Klincksieck.
274
Braun, A. (1988). Zum Merkmal “Fortis - Lenis.” F. Steiner Verlag Wiesbaden.
219–252.
Browman, C. P., & Goldstein, L. (1989). Articulatory gestures as phonological units. Haskins
Buchaillard, S., Perrier, P., & Payan, Y. (2009). A biomechanical model of cardinal vowel
production: muscle activations and the impact of gravity on tongue positioning. The
Stockholm.
Campbell, N. (1999). A study of Japanese speech timing from the syllable perspective. Onsei
275
Chaker, S. (1975). Les paramètres acoustiques de la tension consonantique en berbère
Editions d’Harmattan.
Charbonneau, R. (1971). Etude sur les voyelles nasales du francais canadien. [Mit Tab.]. Les
Chomsky, N., & Halle, M. (1968). The Sound Pattern of English. New York ; Evanston [etc.]:
Cho, T., & Ladefoged, P. (1999). Variations and universals in VOT: evidence from 18
Chtatou, M. (1994). La représentation vocalique dans les dialectes berbères du Rif. Etudes et
Churma, D. G. (1988). Consonant gradation in Fula suffixes: the ugly truth. Studies in African
Clements, G. N., & Keyser, S. J. (1983). CV Phonology. Cambridge, MA : MIT Press.
Clements, G. N., & Ridouane, R. (2006). Quantal phonetics and distinctive features: a review.
Cohn, A., Ham, W., & Podesva, R. (1999). The phonetic realization of singleton-geminate
276
Connan, P. Y., Brock, G., Roy, J. P., & Hirsch, F. (2003). Using digital cine-radiography to
Spain.
Connell, B. (1991). Phonetic aspects of the Lower Cross languages and thier implications for
Cowan, J. R., & Yarmohammadi, L. (1978). The Persian verb reconsidered. Archiv Orientàli,
46, 46–60.
Curtis, E. (2003). Geminate weight : Case studies and formal models (Ph.D. thesis).
University of Washington.
Dang, J., & Honda, K. (2004). Construction and control of a physiological articulatory model.
California Press.
El Kirat, Y. (1987). Spirantization in the Beni Iznassen dialect, diachrony and synchrony .
Engstrand, O. (1987). Durational patterns of Lule Sami phonology. Phonetica, 44, 117–128.
277
Esposito, A., & Benedetto, M. G. D. (1999). Acoustical and perceptual study of gemination in
Italian stops. The Journal of the Acoustical Society of America, 106(4), 2051–2062.
Fant, G. (1960). Acoustic Theory of Speech Production. S-Gravenhage: Mouton & Co.
Hardcastle & A. Marchal (Eds.), Speech Production and Speech Modelling (pp. 93–
Feldman, A. G. (1986). Once more on the Equilibrium-Point hypothesis (l model) for motor
42–59.
special reference to French and Danish. Annual Report of the Institute of Phonetics,
Flanagan, J. R., Ostry, D. J., & Feldman, A. G. (1990). Control of Human Jaw and Multi-Joint
278
Fougeron, C. (2005). La phonologie articulatoire : une introduction. In N. Nguyen, S.
Fowler, C. A., & Saltzman, E. (1993). Coordination and coarticulation in speech production.
Modularity and the Motor Theory of Speech Perception (pp. 25–31). Hillsdale, New
chooshu [perception for the Japanese stop consonants with reduced and extended
Gaitenby, J. (1965). The elastic word. Haskins Laboratories, Status Report, Speech Research,
2, 1–12.
Galand, L. (1960). “La langue” (art . “Berbère”). In Encyclopédie de l’ Islam. Leyde, Paris:
Brill.
Galand, L. (1988). Le berbère. In D. Cohen & J. Perrot (Eds.), Les langues dans le monde
ancien et moderne (Vol. Troisième partie : les langues chamito-sémitiques., pp. 207–
Galand, L. (1997). Les consonnes tendues en berbère et leur notation, 19, 57–77.
Grenoble).
Gay, T. (1978). Effect of speaking rate on vowel formant movements. Journal of Acoustical
279
Gendron, J.-D. (1966). Tendances phonétiques du française parlé au Canada. C. Klincksieck.
Giannelli, L., & Savoia, L. (1979). Indebolimento consonantico in Toscana. Revista Italiana
Di Diallettologia, 2, 23–58.
Gili-Fivela, B., Zmarich, C., Perrier, P., Savariaux, C., & Tisato, G. (2007). Acoustic and
Saarbrücken
Greenberg, J. H. (1963). Some Universals of Grammar with Particular Reference to the Order
Grosjean, F., & Deschamps, A. (1975). Analyse contrastive des variables temporelles de
Hala, B., & Polland, B. (1926). Uvedeni do fonetiky ceskych zvuku v roentgenovych obrazech
Research, 1, 83–105.
Hankamer, J., Lahiri, A., & Coreman, J. (1989). Perception of consonant length: voiceless
280
Han, M. S. (1994). Acoustic manifestations of mora timing in Japanese. The Journal of the
Harris, K. S., Hoffman, H. S., Liberman, A. M., & Delattre, P. C. (1958). Effect of third-
Hassan, Z. M. (2002). Gemination in Swedish and Arabic with particular reference to the
253–306.
Hegedüs, L. (1959). Beitrag zur Frage der Geminaten. Zeitschrift Für Phonetik, 12, 68–106.
Hirata,Y. (2007). Durational variability and invariance in japanese stop quantity distinction:
Roles of adjacent vowels. Onsei Kenkyuu [Journal of the Phonetic Society of Japan],
11(1), 9–22.
Hirose, A., & Ashby, M. (2007). An acoustic study of devoicing of the geminate obstruents in
294.
Idemaru, K., & Guion, S. G. (2008). Acoustic covariants of length contrast in Japanese stops.
281
Itô, J. (1986). Syllable Theory in Prosodic Phonology (Ph.D. dissertation). University of
Massachusetts, Amherst.
Itô, J. (1989). A prosodic theory of epenthesis. Natural Language and Linguistic Theory, 7,
217–260.
Jakobson, R., Fant, G., & Halle, M. (1952). Preliminaries to speech analysis: The distinctive
Jakobson, R., & Halle, M. (1961). Tension et laxité. In Essais de Linguistique Générale (eds.
Jakobson, R., & Halle, M. (1968). Phonology in relation to phonetics. In B. Malmberg (Ed.),
Jakobson, R., & Waugh, L. R. (1987). The sound shape of language. Berlin: Mouton de
Gruyter.
(Vol. xii). New York, NY, US: Clarendon Press/Oxford University Press.
Jessen, M. (1998). Phonetics and Phonology of Tense and Lax Obstruents in German.
Jomaa, M., & Abry, C. (1988). La résistivité de la quantité vocalique aux variations de la
Nancy.
Jordan, M. I. (1988). Supervised Learning and Systems with Excess Degrees of Freedom.
Ka, O. (1994). Wolof Phonology and Morphology. Lanham: University Press of America.
282
Kawahara, S. (2006). A faithfulness ranking projected from a perceptibility scale: The case of
Kelso, J. A. S., Saltzman, E. L., & Tuller, B. (1986a). dynamical perspective on speech
Kelso, J. A. S., Saltzman, E. L., & Tuller, B. (1986b). Intentional contents, communicative
context, and task dynamics: a reply to the commentators. Journal of Phonetics, 14,
171–196.
Kelso, J. A. S., & Tuller, B. (1984). A dynamical basis for action systems. In M. S. Gazzaniga
3, 73–113.
Kim, C. W. (1965). On the autonomy of the tensity feature in stop classification. Word, 21,
339–359.
Kim, K., & Gomi, H. (2007). Model-Based Investigation of Control and Dynamics in Human
283
Klatt, D. H. (1975). Voice Onset Time, Frication, and Aspiration in Word-Initial Consonant
Kraehenmann, A. (2001). Swiss German stops: geminates all over the word. Phonology,
18(01), 109–145.
Kraehenmann, A., & Lahiri, A. (2008). Duration differences in the articulation and acoustics
of Swiss German word-initial geminate and singleton stops. The Journal of the
Laboissiere, R., Schwartz, J. L., & Bailly, G. (1990). Motor control for speech skills: a
Proceedings of the 1990 Summer School, Morgan Kaufmann Publishers (pp. 319–
Press.
Press.
Ladefoged, P. (1968). A phonetic study of West African languages. (2nd ed.). Cambridge:
Ladefoged, P. (1983). The linguistic use of different phonation types. In D. Bless & J. Abbs
(Eds.), Vocal fold physiology: Contemporary research and clinical issues (pp. 351–
284
Ladefoged, P., Declerk, J., Lindau, M., & Papçun, G. (1972). An auditory-motor theory of
22, 48–75.
Ladefoged, P., & Maddieson, I. (1996). The sounds of the world’s languages. Oxford: Wiley-
Blackwell.
Lahiri, A., & Hankamer, J. (1988). The timing of geminate consonants. Jornal of Phonetics,
16(3), 327–338.
Laprie, Y., & Busset, J. (2011). Construction and evaluation of an articulatory model of the
Laprie, Y., Ouni, S., Potard, B., & Maeda, S. (2003). Inversion experiments based on a
Speech Production.Sydney
Laprie, Y., Sock, R., Vaxelaire, B., & Élie, B. (2014). Comment faire parler les images aux
Lehiste, I., Tatham, M., & Morton, K. (1973). An instrumental study of consonant
Lenneberg, E. G. (1967). Biological foundations of language. New York: John Wiley & Sons.
285
Liberman, A. M., & Mattingly, I. G. (1985). The motor theory of speech production revised.
Liberman, A. M., & Mattingly, I. G. (1989). A specialization for speech perception. Science,
243, 289–294.
Liberman, P. (1984). The biology and evolution of language. Cambridge : Harvard University
Press.
Lindblom, B. (1963). On vowel reduction (Ph.D. thesis). In the Royal Institute of Technology,
Lindblom, B. (1987). Absolute Constancy and Adaptative Variability: two Themes in the
Marchal & W. J. Hardcastle & (Eds.), Speech production and speech modelling (pp.
Lindblom, B., & Engstrand, O. (1989). In what sense is speech quantal ? Journal of
Lindblom, B., & Lindgren, R. (1985). Speaker-listener interaction and phonetic variation.
Lindqvist, J., Sawashima, M., & Hirose, H. (1973). Investigation of the vertical movement of
the larynx in a Swedish speaker. Annual Bulletin, Research Inst. of Logopedics and
Lisker, L. (1958). The Tamil occlusives: short vs. long or voiced vs. voiceless? Indian
Lisker, L., & Abramson, A. S. (1964). A cross-language study of voicing in initial stops:
286
Löfqvist, A. (2005). Lip kinematics in long and short stop and fricative consonants. The
Löfqvist, A. (2007). Tongue movement kinematics in long and short Japanese consonants.
Löfqvist, A., Baer, T., & Yoshioka, H. (1981). Scaling of glottal opening. Phonetica, 38, 265–
276.
Löfqvist, A., & Gracco, V. L. (1997). Lip and jaw kinematics in bilabial stop consonant
production. Journal of Speech, Language, and Hearing Research: JSLHR, 40(4), 877–
893.
Löfqvist, A., & Gracco, V. L. (2002). Control of oral closure in lingual stop consonant
Louali, N., & Puech, G. (1992). Les consonnes “tendues” du berbère: indices perceptuels et
Louali, N., & Puech, G. (1994). Les consonnes “fortes” du berbère : indices perceptuels et
Louali, N., & Puech, G. (1998). La partition de l’espace vocalique en berbère rifain. In Actes
Dordrecht: Foris.
287
MacNeilage, P. (1970). Motor control of serial ordering of speech. Psychological Review, 77,
182–196.
Maeda, S. (1988). Improved articulatory models. The Journal of the Acoustical Society of
Maeda, S. (1990). Compensatory Articulation During Speech: Evidence from the Analysis
Hardcastle & A. Marchal (Eds.), Speech Production and Speech Modelling (pp. 131–
Maeda, S. (1996). Phoneme as concatenable units: VCV synthesis using a vocal tract
Mathieu, B., & Laprie, Y. (1997). Adaptation of Maeda’s model for acoustic to articulatory
12, 373–418.
McCarthy, J. (1986). OCP effects : Gemination and Antigemination. Linguistic Inquiry, 17,
207–263.
Phonetics, 8, 343–352.
288
Mefferd, A. S., & Green, J. R. (2010). Articulatory-To-acoustic relations in response to
speaking rate and loudness manipulations. Journal of Speech, Language, and Hearing
Mermelstein, P. (1973). Articulatory model for the study of speech production. The Journal of
Muller, J. (2001). The phonology and phonetics of word-initial geminates. (Ph.D. diss.,). Ohio
State University.
Munhall, K. G., & Löfqvist, A. (1985). Gestural aggregation in speech: laryngeal gestures.
Munhall, K., & Löfqvist, A. (1992). Gestural agregation in speech: Laryngael gestures. Jornal
Nazari, M. A., Perrier, P., Chabanas, M., & Payan, Y. (2010). Simulation of dynamic
Stockholm.
tokuchoo niyoru chigai [perception of a Japanese geminate stop /tt/: the effect of pitch
289
type and acoustic characteristics of preceding/following vowels]. Onsei Kenkyuu
Ohala, J., & Eukel, B. (1978). Explaining the intrinsic pitch of vowels. In Report of the
Ostry, D. J., Keller, E., & Parush, A. (1983). Similarities in the control of the speech
articulators and the limbs: Kinematics of tongue dorsum movement in speech. Journal
Ostry, D. J., & Munhall, K. G. (1985). Control of rate and duration of speech movements. The
Autònoma de Barcelona.
Ouakrim, O. (1999). Aperceptual study of tenseness. Some acoustic cues identifying tense vs
290
Payne, E., & Eftychiou, E. (2006). Prosodic Shaping of Consonant Gemination in Cypriot
Perrier, P., Loevenbruck, H., & Payan, Y. (1996). Control of tongue movements: the
Perrier, P., & Ma, L. (2008). Speech Planning for V1CV2 Sequences: Influence of the
Strasbourg.
Perrier, P., Payan, Y., Buchaillard, S. I., Nazari, M. A., & Chabanas, M. (2011).
Peterson, G. E., & Lehiste, I. (1960). Duration of syllable nuclei in English. Journal of the
Pickett, E. R., Blumstein, S. E., & Burton, M. W. (1999). Effects of Speaking Rate on the
Port, R., Dalby, J., & O’Dell, M. (1987). Evidence for mora timing in Japanese. Journal of the
Prasse, K.-G. (1984). The Origin of Vowels e and o in touareg and Ghadamsi. In Current
291
Ridouane, R. (2003). Suites de consonnes en berbère : phonétique et phonologie (Thèse de
Ridouane, R., Fuchs, S., & Hoole, P. (2006). Laryngeal adjustments in the production of
Klincksieck.
connecticut.
Rossi, M., & Autesserre, D. (1979). Mouvements de l’os hyoïde et du larynx et fréquences
292
Rubin, P., Saltzman, E., Goldstein, L., Mcgowan, R., Tiede, M., & Browman, C. (1996). Casy
Rumelhart, D. E., & Norman, D. A. (1982). Simulating a Skilled Typist: A Study of Skilled
Saïb, J. (1977). The treatment of geminates: evidence from Berber. Studies in African
Linguistics, 8, 299–316.
model. In Heuer H., Fromm C., eds., Experimental Brain Research Series (Vol. 15,
Saltzman, E. L., & Byrd, D. (2000). Task-dynamics of gestural timing: phase windows and
Saltzman, E. L., Rubin, P. E., Goldstein, L., & Browman, C. P. (1987). Task-dynamic
Santerre, L. (1971). Les voyelles orales dans le français parlé à montréal (Thèse de doctorat).
Schein, B., & Steriade, D. (1986). On geminates. Linguistic Inquiry, 17, 691–744.
Sherzer, J. (1975). A problem in Cuna phonology. Jornal of the Linguistic Association of the
Southwest, 1, 45–53.
293
Sievers, E. (1876). Grundzüge der Lautphysiologie. Leipzig: Breitkopf & Härtel.
Sifakis, E., Selle, A., Robinson-Mosher, A., & Fedkiw, R. (2006). Simulating Speech with a
Simon, P., Brock, G., & Zerling, J. P. (2010). Histoire du radiocinéma à l’institut de
1–214.
Smith, C. L. (1995). Prosodic patterns in the coordination of vowel and consonant gestures,.
Strasbourg.
Sock, R., Delattre, P. C., Doublier, D., & Zohair, L. (1989). Comment faire deux fois de suite
Sock, R., Hirsch, F., Laprie, Y., Perrier, P., Vaxelaire, B., Brock, G., … Sturm, J. (2011). An
X-ray database, tools and procedures for the study of speech production. In
41–48). Montréal.
294
Sock, R., & Löfqvist, A. (1995). Some Timing Constraints in the Production of Bilabial
Sock, R., Lofqvist, A., & Perrier, P. (1996). kinematic and acoustic correlates of quantity in
swedish and wolof: A cross language study. In Proceedings of the 4th Speech
Sock, R., & Vaxelaire, B. (2001). Réflexions sur le timing de la quantité. Travaux de l’Institut
Sock, R., & Vaxelaire, B. (2004). L’anticipation: A l’horizon du Présent. Editions Mardaga.
Sock, R., Vaxelaire, B., Roy, J. P., Ferbach-Hecker, V., & Hirsch, F. (2005). Temporal and
spatial correlates of quantity contrasts in Wolof. Acoustic, kinematic and X-ray data.
processes, and tehniques (pp. 253–273). New York and Hove: Psychology Press.
Steriade, D. (1982). Greek prosodies and the nature of syllabification. MIT, Cambridge,
Mass.
Stetson, R. H. (1951). Motor Phonetics : A Study of Speech Movements in Action (2nd ed).
Stevens, K. N. (1972). The quantal nature of speech: evidence from articulatory acoustic data.
Stevens, K. N. (1985). Evidence for the role of acoustic boundaries in the perception of
Stevens, K. N. (1989). On the quantal nature of speech. Journal of Phonetics, 17, 3–45.
295
University of Stockholm (pp. 83–88). University of Stockholm, Sweden: Institute of
Linguistics.
Stevens, K. N. (2002). Toward a model for lexical access based on acoustic landmarks and
Stevens, K. N. (2005). Features in speech perception and lexical access. In D. E. Pisoni & R.
Blackwell.
Stevens, K. N., & Blumstein, S. E. (1978). Invariant cues for place of articulation in stop
Stevens, K. N., Keyser, S. J., & Kawasaki, H. (1986). Toward a phonetic and phonological
Associates.
Straka, G. (1963). La division des sons du langage en voyelles et consonnes peut-elle être
Suomi, K. (1980). Voicing in English and Finnish Stops: A Typological Comparison with an
10.
jizokujikanno eikyoo [effects of the consonant and vowel durations in the preceding
296
Terzopoulos, D., & Waters, K. (1993). Analysis and synthesis of facial image sequences
using physical and anatomical models. IEEE Transactions on Pattern Analysis and
Thimm, G., & Luettin, J. (1999). Extraction Of Articulators In X-Ray Image Sequences. In
Topintzi, N. (2008). On the existence of moraic onset geminates. Natural Language &
Vaxelaire, B. (1993). Étude comparée des effets des variations de débit, lent, rapide, sur les
Vaxelaire, B. (1995b). Single vs. double (abutted) consonants across speech rate. X-ray and
297
Vaxelaire, B. (2007). Le geste et la production de la parole. Résultats et implications d’études
Vaxelaire, B., Marchal, A., Hirsch, F., & Sock, R. (2009). Apports des techniques
A. Marchal & Cavé (Eds.), Imagerie médicale pour l’étude de la parole (pp. 125–
Vaxelaire, B., & Sock, R. (1997). Laryngeal movements and speech rate, an X-ray
Vaxelaire, B., Sock, R., & Hecker, V. (1999). Perceiving anticipatory phonetic gestures in
1979, p.25-43).
Texas, Austin.
298
16 Index des figures
Figure 1 : Ellipses de dispersion sur F1/F2 pour les voyelles du tarifit en contexte neutre (en
majuscules) et emphatique (en minuscules) ; (adapté de Louali & Puech, 1998) ................... 23
Figure 2 : Trajectoire de diphtongues [] (ir) et [] (ur) d’un locuteur du tarifit de
Temsamane (adapté de Louali & Puech, 1998) ....................................................................... 25
Figure 3 : coupes sagittales du conduit vocal pour /aka/ (lignes continues) vs. /akka/ (lignes
discontinues), en vitesse d’élocution normale (à gauche) et pour /ada / (lignes continues) vs.
/adda/ (lignes discontinues), en vitesse d’élocution normale (à droite). D’après Vaxelaire,
(1995a). .................................................................................................................................... 67
Figure 4 : Non-linéarité du passage d’un paramètre de commande articulatoire à un paramètre
de sortie acoustique dans le paradigme de base de la Théorie Quantique. (Adaptée de Stevens,
1989)......................................................................................................................................... 82
Figure 5 : Domaines d’hyper- et d’hypo-articulation en parole, en fonctions des informations
du contexte et des informations dans le signal, selon la Théorie de la Variabilité Adaptative.
(Adaptée de Lindblom, 1987, in Béchet (2011)). .................................................................... 86
Figure 6 : Schématisation du modèle dynamique à deux niveaux pour la production de la
parole. La flèche de gauche indique les commandes d’activation gestuelle et celle de droite le
feedback de l’état du système physique de production. (d’après Saltzman & Munhall 1989). 88
Figure 7 : La Coupe sagittale du conduit vocal en sortie du synthétiseur articulatoire de
Haskins Laboratories. Les variables du conduit vocal (positions et degrés des constrictions) y
sont montrées de manière schématique. (D’après Browman & Goldstein, 1989). .................. 90
Figure 8 : Partition gestuelle pour le mot anglais "Palm" d’après . Browman & Goldstein
(1992) ....................................................................................................................................... 91
Figure 9 : Les sept paramètres du modèle de Maeda (1990) ................................................... 93
Figure 10 : Optimisation des trajectoires dans l'espace articulatoire selon le « modèle à
fenêtres » (adapté de Keating, 1988). ....................................................................................... 96
Figure 11 : Exemple d’implémentations anatomiques du muscle. En haut à gauche : la
localisation des parties intérieure (gris foncé), médiane (gris clair) et postérieure (gris) du
muscle gélioglosse dans la langue, à droite, les microfibres pour le muscle genioglosse et le
muscle styloglosse dans le modèle de la langue (Buchaillard, Perrier, & Payan, 2009). En bas
à gauche, la description volumétrique du muscle orbiculaire de la bouche dans le modèle
facial ; à droite : les microfibres du muscle principal dans le modèle facial (partie gauche)
(Nazari et al., 2010 in Perrier et al. (2011)) ............................................................................. 98
Figure 12 : Trois courbes correspondant aux gestes de (a) occlusive géminée, (b) amplitude
réduite et occlusion abrégée et (c) spirantisation. (Adapté de Kirchner, 2000). .................... 101
Figure 13 : Le processus de lénition modifie la courbe d’une occlusive géminée (a) à une
fricative géminée (b). (Adapté de Kirchner, 2000). ............................................................... 101
Figure 14 : A gauche, un exemple théorique de la compression d’un segment acoustique ou
articulatoire avec l’augmentation de la vitesse d’élocution. A droite, une visualisation de la
simplification hypothétique du profil de vitesse associé à un geste critique ........................ 109
Figure 15 : Paramètres intrasegmentaux du signal acoustique de la séquence [ata] .............. 119
Figure 16 : paramètres intrasegmentaux du signal acoustique de la séquence [ada] ............. 120
Figure 17 : Paramètres intersegmentaux du signal acoustique de la séquence [asa] ............. 120
Figure 18 : Schéma de la salle de radiologie lors de l’acquisition des films
cinéradiographiques (d’après Vaxelaire, 2007). .................................................................... 125
Figure 19 : Représentation d’une photographie réalisée au moment de l’acquisition du film
cinéradiographique. ................................................................................................................ 126
Figure 20 : Installation de cinéradiographie et exemples d'images extraites de radiofilms
(Vaxelaire et al., 2009). .......................................................................................................... 127
Figure 21 : La tige réalise un mouvement vers le bas et provoque au contact de l'aimant un
bruit que l’on retrouve sur le signal acoustique. .................................................................... 127
299
Figure 22 : Illustration de la coordination motrice entre plusieurs articulateurs dans une
séquence [iky] (in Vaxelaire et al., 2009). ............................................................................. 128
Figure 23 : Exemple d’un plan de travail avec projecteur utilisé pour le traçage manuel des
radiogrammes (à gauche), et un exemple d’une grille de référence projetée sur le plan de
travail (à droite). (in Vaxelaire et al., 2009). ......................................................................... 129
Figure 24 : Exemple de croquis de radiogramme (d’après Vaxelaire, 2007) ........................ 130
Figure 25 : Interface de X-Articulators (LORIA, Nancy). ..................................................... 130
Figure 26 : Exemple de grille de mesures. ............................................................................. 131
Figure 27 : Radiographie d’une vue sagittale du conduit vocal ............................................. 132
Figure 28 : L’image de référence de la mâchoire qui apparait sur toutes les autres images .. 133
Figure 29 : Le cas d’un os hyoïde remonté et partiellement caché par la mandibule ............ 134
Figure 30 : Image cinéradiographique présentant les contours utilisés pour l’épiglotte et le
larynx. ..................................................................................................................................... 135
Figure 31 : Les régions utilisées pour le recalage des images cinéradiographique................ 136
Figure 32 : Repère géométrique utilisé pour la mesure de la position des articulateurs ou de la
constriction. ............................................................................................................................ 137
Figure 33 : Valeurs intersegmentales /ata/ vs. /atta/ en vitesse d’élocution normale à gauche et
en vitesse d’élocution rapide à droite (S = simples et G = géminées). .................................. 141
Figure 34 : Valeurs intrasegmentales /ata/ vs. /atta/ en vitesse d’élocution normale à gauche et
en vitesse d’élocution rapide à droite (S = simples et G = géminées). .................................. 142
Figure 35 : Valeurs intersegmentales /aka/ vs. /akka/ en vitesse d’élocution normale à gauche
et en vitesse d’élocution rapide à droite (S = simples et G = géminées)................................ 143
Figure 36 : Valeurs intrasegmentales /aka/ vs. /akka/ en vitesse d’élocution normale à gauche
et en vitesse d’élocution rapide à droite (S = simples et G = géminées)................................ 143
Figure 37 : Valeurs intersegmentales /aqa/ vs. /aqqa/ en vitesse d’élocution normale à gauche
et en vitesse d’élocution rapide à droite (S = simples et G = géminées)................................ 144
Figure 38 : Valeurs intrasegmentales /aqa/ vs. /aqqa/ en vitesse d’élocution normale à gauche
et en vitesse d’élocution rapide à droite (S = simples et G = géminées)................................ 145
Figure 39 : Valeurs intersegmentales des occlusives sourdes en vitesse d’élocution normale à
gauche et en vitesse d’élocution rapide à droite. .................................................................... 147
Figure 40 : Valeurs intrasegmentales des occlusives sourdes en vitesse d’élocution normale à
gauche et en vitesse d’élocution rapide à droite. .................................................................... 149
Figure 41 : Valeurs intersegmentales des occlusives sourdes en vitesse d’élocution normale à
gauche et en vitesse d’élocution rapide à droite. .................................................................... 152
Figure 42 : Valeurs intrasegmentales des occlusives sourdes en vitesse d’élocution normale à
gauche et en vitesse d’élocution rapide à droite. .................................................................... 153
Figure 43 : Valeurs intersegmentales des occlusives sourdes en vitesse d’élocution normale à
gauche et en vitesse d’élocution rapide à droite. .................................................................... 155
Figure 44 : Valeurs intrasegmentales des occlusives sourdes en vitesse d’élocution normale à
gauche et en vitesse d’élocution rapide à droite. .................................................................... 157
Figure 45 : Valeurs intersegmentales des occlusives sonores en vitesse d’élocution normale à
gauche et en vitesses d’élocution rapide à droite. .................................................................. 159
Figure 46 : Valeurs intrasegmentales les occlusives sonores en vitesse d’élocution normale à
gauche et en vitesses d’élocution rapide à droite. .................................................................. 161
Figure 47 : Valeurs intersegmentales des occlusives sonores en vitesse d’élocution normale à
gauche et en vitesse d’élocution rapide à droite. .................................................................... 163
Figure 48 : Valeurs intrasegmentales des occlusives sonores en vitesse d’élocution normale à
gauche et en vitesses d’élocution rapide à droite. .................................................................. 164
Figure 49 : Valeurs intersegmentales des occlusives sonores en vitesse d’élocution normale à
gauche et en vitesse d’élocution rapide à droite. .................................................................... 166
Figure 50 : Valeurs intersegmentales des constrictives sourdes en vitesse d’élocution normale
à gauche et en vitesses d’élocution rapide à droite. ............................................................... 169
300
Figure 51 : Valeurs intersegmentales des constrictives sourdes en vitesse d’élocution normale
à gauche et en vitesses d’élocution rapide à droite. ............................................................... 170
Figure 52 : Valeurs intersegmentales des constrictives sourdes en vitesse d’élocution normale
à gauche et en vitesses d’élocution rapide à droite. ............................................................... 172
Figure 53 : Valeurs intersegmentales des constrictives sonores en vitesse d’élocution normale
à gauche et en vitesses d’élocution rapide à droite. ............................................................... 174
Figure 54 : Valeurs intersegmentales des constrictives sonores en vitesse d’élocution normale
à gauche et en vitesses d’élocution rapide à droite. ............................................................... 175
Figure 55 : Valeurs intersegmentales des constrictives sonores en vitesse d’élocution normale
à gauche et en vitesses d’élocution rapide à droite. ............................................................... 177
Figure 56 : Trajectoires de trois paramètres articulatoires, à savoir l’ouverture de la
constriction, la constriction pharyngale et l’aperture labiale, pour la séquence /ata/ (à gauche)
et /atta/ (à droite) ; locuteur Kh. ............................................................................................. 184
Figure 57 : Trajectoires de trois paramètres articulatoires, à savoir l’ouverture de la
constriction, la constriction pharyngale et l’aperture labiale, pour la séquence /ata/ (à gauche)
et /atta/ (à droite) ; locuteur F ................................................................................................. 185
Figure 58 : Trajectoires de trois paramètres articulatoires, à savoir l’ouverture de la
constriction, la constriction pharyngale et l’aperture labiale, pour la séquence /aka/ (à gauche)
et /akka/ (à droite) ; locuteur Kh ............................................................................................ 187
Figure 59 : Trajectoires de trois paramètres articulatoires, à savoir l’ouverture de la
constriction, la constriction pharyngale et l’aperture labiale, pour la séquence /aka/ (à gauche)
et /akka/ (à droite) ; locuteur F ............................................................................................... 188
Figure 60 : Trajectoires de trois paramètres articulatoires, à savoir l’ouverture de la
constriction, la constriction pharyngale et l’aperture labiale, pour la séquence /aqa/ (à gauche)
et /aqqa/ (à droite) ; locuteur Kh ............................................................................................ 189
Figure 61 : Trajectoires de trois paramètres articulatoires, à savoir l’ouverture de la
constriction, la constriction pharyngale et l’aperture labiale, pour la séquence /aqa/ (à gauche)
et /aqqa/ (à droite) ; locuteur F ............................................................................................... 190
Figure 62 : Trajectoires de trois paramètres articulatoires, à savoir l’ouverture de la
constriction, la constriction pharyngale et l’aperture labiale, pour la séquence /ada/ (à gauche)
et /adda/ (à droite) ; locuteur Kh ............................................................................................ 193
Figure 63 : Trajectoires de trois paramètres articulatoires, à savoir l’ouverture de la
constriction, la constriction pharyngale et l’aperture labiale, pour la séquence /ada/ (à gauche)
et /adda/ (à droite) ; locuteur F ............................................................................................... 193
Figure 64 : Trajectoires de trois paramètres articulatoires, à savoir l’ouverture de la
constriction, la constriction pharyngale et l’aperture labiale, pour la séquence /aga/ (à gauche)
et /agga/ (à droite) ; locuteur Kh ............................................................................................ 194
Figure 65 : Trajectoires de trois paramètres articulatoires, à savoir l’ouverture de la
constriction, la constriction pharyngale et l’aperture labiale, pour la séquence /aga/ (à gauche)
et /agga/ (à droite) ; locuteur F ............................................................................................... 194
Figure 66 : Trajectoires de trois paramètres articulatoires, à savoir l’ouverture de la
constriction, la constriction pharyngale et l’aperture labiale, pour la séquence /asa/ (à gauche)
et /assa/ (à droite) ; locuteur Kh ............................................................................................. 196
Figure 67 : Trajectoires de trois paramètres articulatoires, à savoir l’ouverture de la
constriction, la constriction pharyngale et l’aperture labiale, pour la séquence /asa/ (à gauche)
et /assa/ (à droite) ; locuteur F ................................................................................................ 196
Figure 68 : Trajectoires de trois paramètres articulatoires, à savoir l’ouverture de la
constriction, la constriction pharyngale et l’aperture labiale, pour la séquence /aa/ (à gauche)
et /aa/ (à droite) ; locuteur Kh ............................................................................................. 197
Figure 69 : Trajectoires de trois paramètres articulatoires, à savoir l’ouverture de la
constriction, la constriction pharyngale et l’aperture labiale, pour la séquence /aa/ (à gauche)
et /aa/ (à droite) ; locuteur F ................................................................................................ 197
301
Figure 70 : Trajectoires de trois paramètres articulatoires, à savoir l’ouverture de la
constriction, la constriction pharyngale et l’aperture labiale, pour la séquence /aza/ (à gauche)
et /azza/ (à droite) ; locuteur Kh ............................................................................................. 199
Figure 71 : Trajectoires de trois paramètres articulatoires, à savoir l’ouverture de la
constriction, la constriction pharyngale et l’aperture labiale, pour la séquence /aza/ (à gauche)
et /azza/ (à droite) ; locuteur F ............................................................................................... 199
Figure 72 : Trajectoires de trois paramètres articulatoires, à savoir l’ouverture de la
constriction, la constriction pharyngale et l’aperture labiale, pour la séquence /aa/ (à gauche)
et /aa/ (à droite) ; locuteur Kh ............................................................................................. 200
Figure 73 : Trajectoires de trois paramètres articulatoires, à savoir l’ouverture de la
constriction, la constriction pharyngale et l’aperture labiale, pour la séquence /aa/ (à gauche)
et /aa/ (à droite) ; locuteur F ................................................................................................ 200
Figure 74 : Trajectoires de trois paramètres articulatoires, à savoir l’ouverture de la
constriction, la constriction pharyngale et l’aperture labiale, pour la séquence /ta/ (à gauche) et
/tta/ (à droite) ; locuteur Kh .................................................................................................... 202
Figure 75 : Trajectoires de trois paramètres articulatoires, à savoir l’ouverture de la
constriction, la constriction pharyngale et l’aperture labiale, pour la séquence /ta/ (à gauche) et
/tta/ (à droite) ; locuteur F ...................................................................................................... 202
Figure 76 : Trajectoires de trois paramètres articulatoires, à savoir l’ouverture de la
constriction, la constriction pharyngale et l’aperture labiale, pour la séquence /ka/ (à gauche)
et /kka/ (à droite) ; locuteur Kh .............................................................................................. 203
Figure 77 : Trajectoires de trois paramètres articulatoires, à savoir l’ouverture de la
constriction, la constriction pharyngale et l’aperture labiale, pour la séquence /ka/ (à gauche)
et /kka/ (à droite) ; locuteur F ................................................................................................. 203
Figure 78 : Trajectoires de trois paramètres articulatoires, à savoir l’ouverture de la
constriction, la constriction pharyngale et l’aperture labiale, pour la séquence /qa/ (à gauche)
et /qqa/ (à droite) ; locuteur Kh .............................................................................................. 204
Figure 79 : Trajectoires de trois paramètres articulatoires, à savoir l’ouverture de la
constriction, la constriction pharyngale et l’aperture labiale, pour la séquence /qa/ (à gauche)
et /qqa/ (à droite) ; locuteur F ................................................................................................. 204
Figure 80 : Trajectoires de trois paramètres articulatoires, à savoir l’ouverture de la
constriction, la constriction pharyngale et l’aperture labiale, pour la séquence /da/ (à gauche)
et /dda/ (à droite) ; locuteur Kh .............................................................................................. 206
Figure 81 : Trajectoires de trois paramètres articulatoires, à savoir l’ouverture de la
constriction, la constriction pharyngale et l’aperture labiale, pour la séquence /da/ (à gauche)
et /dda/ (à droite) ; locuteur F ................................................................................................. 206
Figure 82 : Trajectoires de trois paramètres articulatoires, à savoir l’ouverture de la
constriction, la constriction pharyngale et l’aperture labiale, pour la séquence /ga/ (à gauche)
et /gga/ (à droite) ; locuteur Kh .............................................................................................. 206
Figure 83 : Trajectoires de trois paramètres articulatoires, à savoir l’ouverture de la
constriction, la constriction pharyngale et l’aperture labiale, pour la séquence /ga/ (à gauche)
et /gga/ (à droite) ; locuteur F ................................................................................................. 207
Figure 84 : Trajectoires de trois paramètres articulatoires, à savoir l’ouverture de la
constriction, la constriction pharyngale et l’aperture labiale, pour la séquence /sa/ (à gauche)
et /ssa/ (à droite) ; locuteur Kh ............................................................................................... 208
Figure 85 : Trajectoires de trois paramètres articu