Vous êtes sur la page 1sur 343

Variation et changement phonétiques chez les jeunes

adultes québécois

Thèse

Josiane Riverin-Coutlée

Doctorat en linguistique
Philosophiæ doctor (Ph. D.)

Québec, Canada

© Josiane Riverin-Coutlée, 2019


Variation et changement phonétiques chez les
jeunes adultes québécois

Thèse

Josiane Riverin-Coutlée

Sous la direction de :

Johanna-Pascale Roy, directrice de recherche


Résumé
L’acquisition d’un second régiolecte (R2) peut être définie comme le processus par lequel un
individu géographiquement mobile adapte ses usages linguistiques à ceux en cours dans son nouvel
environnement, sans que l’apprentissage d’une nouvelle langue ne soit toutefois en jeu.
Typiquement, cette acquisition se produit au niveau phonétique, comme le reflète cette intuition que
les personnes qui déménagent « changent d’accent ». L’étude scientifique de l’acquisition d’un R2
ne s’est intensifiée que récemment, les travaux antérieurs en linguistique ayant plutôt cherché à
décrire les usages de locuteurs sédentaires. En parallèle, la prononciation d’un individu a longtemps
été considérée stable passé l’adolescence.

Si l’acquisition d’un R2 est un phénomène répandu en raison de l’essor de la mobilité géographique


individuelle, ses conséquences phonétiques s’avèrent particulièrement hétérogènes. Les différents
travaux consacrés à ce phénomène mettent de l’avant un éventail de facteurs potentiellement
explicatifs des résultats variant d’un locuteur à l’autre et d’un contexte linguistique à l’autre. Des
facteurs internes comme la régularité des règles à maîtriser, ou externes comme l’intégration du
locuteur dans son nouveau milieu ou le souci de demeurer fidèle à ses origines, ont été proposés.
Selon l’angle théorique adopté pour en rendre compte, l’acquisition d’un R2 peut être interprétée
comme un automatisme, ou encore comme un processus régulé par les caractéristiques de la
situation de communication, le rapport du locuteur à l’interlocuteur, la fréquence et la récence des
propriétés phonétiques de la parole ambiante, etc.

Cette contribution consiste en une étude sociophonétique de l’acquisition d’un R2 en contexte


québécois. Plus précisément, 33 locuteurs natifs du français québécois âgés de 18 à 22 ans ont été
recrutés alors qu’ils entreprenaient un baccalauréat à l’Université Laval. De ce nombre, 18 étaient
des participants mobiles : ils venaient de s’installer dans la ville de Québec pour leurs études, mais
étaient originaires d’ailleurs dans la province. Ayant toujours vécu dans la ville de Québec, les 15
autres participants étaient sédentaires. Au moment du recrutement (T1), les locuteurs ont été
enregistrés en chambre anéchoïque lors de la lecture de mots cibles isolés ou insérés dans des
phrases porteuses. Ces mots cibles présentaient l’ensemble des voyelles orales du français
québécois en position accentuée. Ces voyelles ont été analysées acoustiquement : leur durée, ainsi
que la fréquence et la dynamique de leurs trois premiers formants (F1, F2 et F3) ont été mesurées.
Les participants ont également rempli des questionnaires visant à évaluer leur degré d’intégration
sociale, leur appartenance à la phase socio-psychologique d’émergence de l’âge adulte et, pour les
mobiles, le souci de fidélité à leurs origines. L’expérience a été répliquée un an plus tard (T2).

iii
Les résultats indiquent que de fins changements acoustiques sont survenus au cours du temps. Les
différentes catégories vocaliques analysées se sont rapprochées dans l’espace F1/F2. La fréquence de
F3 et l’ampleur de la dynamique formantique de certaines voyelles ont diminué. Une réduction des
mouvements articulatoires semble ainsi s’être produite. Ces changements sont toutefois survenus
chez tous les locuteurs, qu’ils soient mobiles ou sédentaires. Aucun des autres facteurs considérés
(intégration, émergence et fidélité) ne s’est davantage révélé apte à les expliquer. En conséquence,
nous avons émis l’hypothèse qu’un changement dans la manière dont les participants ont perçu la
situation expérimentale était survenu. Quant à l’absence de modifications de prononciation de plus
grande envergure chez les locuteurs mobiles, elle pourrait s’expliquer par l’intervalle temporel
réduit entre les deux temps d’enquête, le niveau phonétique n’étant pas réputé changer le premier
lors de l’acquisition d’un R2. Il est également possible qu’il n’y ait pas suffisamment de spécificités
régionales à Québec pour que les locuteurs mobiles procèdent à un changement systématique,
sachant en outre que la population locale pourrait ne pas constituer la principale influence
linguistique des jeunes universitaires investigués.

Les participants mobiles se sont néanmoins avérés conscients de certaines différences entre leurs
usages et ceux de leur nouvel environnement, aussi une sensibilité linguistique accrue pourrait jouer
un rôle lors d’un changement phonétique. La progression de la compréhension du lien entre la
perception et la production pourrait également éclairer les mécanismes en action aux stades initiaux
de l’acquisition d’un R2. Nos résultats se joignent à ceux provenant d’un nombre croissant de
travaux qui suggèrent qu’une certaine flexibilité phonétique se maintient à l’âge adulte.

iv
Abstract
Second dialect acquisition (SDA) may be defined as the process by which a geographically mobile
individual adapts their linguistic practices to those in use in their new environment, without learning
a new language per se. Typically, this acquisition occurs at the phonetic level, as reflected in the
intuitive idea that people who move away “change their accent”. Scientific accounts of SDA have
only recently increased in number, as previous linguistic work has mostly focused on the practices
of sedentary speakers. At the same time, pronunciation has long been thought to be settled from
adolescence on.

SDA is a widespread phenomenon given the increasing geographic mobility of individuals,


although its phonetic outcomes are especially heterogeneous. Studies addressing this issue highlight
the extensive array of factors that might explain why results vary across individuals and linguistic
contexts. Internal factors such as the regularity of the rules that need to be learned, or external like
the speakers’ integration to their new environment or concern to remain faithful to their origin, have
been put forward. Depending on the theoretical perspective, SDA has been interpreted as an
automatism, or as a process mediated by various aspects of the communication situation, the
relationship between the speaker and their interlocutor, the frequency and recency of the phonetic
properties of ambient speech, etc.

This contribution is a sociophonetic study of SDA in Quebec. More precisely, 33 native speakers of
Quebec French aged 18 to 22 were recruited upon enrollment in an undergraduate program at
Université Laval. Eighteen of them were mobile speakers: they had just moved in Quebec City in
order to start university, but were from somewhere else in the province. Born and raised in Quebec
City, the 15 remaining participants were sedentary. On recruitment (T1), the speakers were recorded
in a sound-attenuated booth while reading target words in isolation or inserted in carrier sentences.
These target words featured all of the oral vowels of Quebec French in stressed syllable. The
vowels were analyzed acoustically: their duration and the frequency and dynamics of their first
three formants (F1, F2 and F3) were measured. The participants also completed questionnaires
assessing their social integration, belonging to the socio-psychological phase of emerging adulthood
and, for the mobiles only, faithfulness to their origin. The experiment was replicated a year later
(T2).

Results show that fine-grained acoustic changes occurred over time. The vowels moved closer to
each other in the F1/F2 plane. Frequency of F3 and formant dynamics decreased in some vowels. A
reduction of the articulatory movements thus seems to have occurred. However, these changes took

v
place in all speakers, whether they be mobile or sedentary. Neither of the other external factors
taken into account (integration, emerging adulthood, faithfulness) could explain the changes.
Therefore, we hypothesized that the way the participants perceived the experiment had evolved over
time. As for the lack of more substantial phonetic shifts in mobile speakers, it could be explained by
the short time span between the two experiments, since the first changes taking place during SDA
do not usually happen at the phonetic level. Another possibility is that there are not enough dialectal
features in Quebec City for the mobile speakers to change systematically, whereas, furthermore, the
local population might not even be the main linguistic influence of university students.

The mobile participants nonetheless proved aware of differences between their own speech and that
of their new environment, suggesting that enhanced linguistic sensitivity may play a role in
phonetic change. Further progress in understanding the link between speech perception and
production may also shed light on the mechanisms underlying the first stages of SDA. Our results
add to those from a growing body of studies evidencing that a certain phonetic flexibility is
maintained throughout adulthood.

vi
Table des matières
Résumé ............................................................................................................................................... iii
Abstract ............................................................................................................................................... v
Liste des tableaux ................................................................................................................................ x
Liste des figures ................................................................................................................................. xi
Remerciements ................................................................................................................................. xiii
Introduction ......................................................................................................................................... 1
Chapitre 1 : Problématique ................................................................................................................. 5
1.1 Mobilité géographique ............................................................................................................ 5
1.2 Émergence de la notion de second dialecte ............................................................................. 7
1.2.1 Dialecte : rapport à la langue et définitions..................................................................... 8
1.2.2 Langue et lecte : au-delà de la nomenclature ................................................................ 14
1.3 Interrogations initiales ........................................................................................................... 17
Chapitre 2 : État de la question ......................................................................................................... 19
2.1 L’acquisition d’un second régiolecte chez l’enfant ............................................................... 19
2.2 Le changement phonétique à l’âge adulte ............................................................................. 27
2.3 Des contraintes internes à l’acquisition d’un second régiolecte ............................................ 35
2.3.1 Niveaux, règles et complexité linguistiques .................................................................. 36
2.3.2 Saillance perceptive ...................................................................................................... 44
2.3.3 Lien perception-production ........................................................................................... 49
2.3.4 Synthèse ........................................................................................................................ 57
2.4 Des facteurs externes qui influencent l’acquisition d’un second régiolecte .......................... 59
2.4.1 Intégration sociale ......................................................................................................... 60
2.4.2 Prestige .......................................................................................................................... 64
2.4.3 Intégrité et fidélité ......................................................................................................... 67
2.4.4 Saillance (subjective) .................................................................................................... 70
2.4.5 Sujet de conversation .................................................................................................... 75
2.4.6 Âge et temps de résidence ............................................................................................. 76
2.4.6.1 L’émergence de l’âge adulte ................................................................................. 81
2.4.6.2 Un second régiolecte en contexte universitaire ..................................................... 83
2.4.7 Synthèse ........................................................................................................................ 87
2.5 Synthèse générale .................................................................................................................. 87
Chapitre 3 : Cadres théoriques .......................................................................................................... 89
3.1 Théorie de l’accommodation ................................................................................................. 89
3.2 Théorie H&H......................................................................................................................... 98
3.3 L’effet caméléon ou la convergence automatique ................................................................. 99
3.4 Théorie des exemplaires ...................................................................................................... 104
3.5 Synthèse .............................................................................................................................. 111
Chapitre 4 : Objectifs ...................................................................................................................... 113
Chapitre 5 : Méthodologie .............................................................................................................. 117
5.1 Lieux d’enquête ................................................................................................................... 117
5.2 Temporalité ......................................................................................................................... 121
5.3 Participants .......................................................................................................................... 124

vii
5.4 Corpus ................................................................................................................................. 127
5.4.1 La parole de laboratoire .............................................................................................. 127
5.4.2 Choix des variables ..................................................................................................... 131
5.4.3 Analyse acoustique...................................................................................................... 140
5.5 Facteurs et indices externes ................................................................................................. 145
5.5.1 Le questionnaire .......................................................................................................... 146
5.5.2 Catégorisation et quantification des facteurs et indices externes ................................ 147
5.5.2.1 Questionnaire démographique et facteur MOBILITÉ ........................................... 148
5.5.2.2 Indice INTÉGRATION ............................................................................................ 149
5.5.2.3 Indice ÉMERGENCE .............................................................................................. 155
5.5.2.4 Indice FIDÉLITÉ.................................................................................................... 158
5.5.2.5 Synthèse .............................................................................................................. 160
5.6 Analyses statistiques............................................................................................................ 161
5.6.1 Analyses statistiques sur les indices acoustiques ........................................................ 161
5.6.2 Analyses statistiques sur les indices INTÉGRATION et ÉMERGENCE ............................ 165
5.7 Synthèse générale ................................................................................................................ 165
Chapitre 6 : Résultats ...................................................................................................................... 167
6.1 Résultats acoustiques ........................................................................................................... 167
6.1.1 Survol général ............................................................................................................. 168
6.1.2 Facteur TEMPS ............................................................................................................. 173
6.1.2.1 Effets du TEMPS sur F1, F2 et F3 .......................................................................... 174
6.1.2.2 Effets du TEMPS sur la dynamique de F1, de F2 et de F3 ..................................... 177
6.1.2.3 Interactions impliquant le TEMPS ........................................................................ 179
6.1.3 Facteur MOBILITÉ ....................................................................................................... 183
6.1.4 Facteur SEXE ............................................................................................................... 187
6.2 Indices INTÉGRATION et ÉMERGENCE ................................................................................. 191
6.3 Retour sur les objectifs ........................................................................................................ 196
Chapitre 7 : Discussion ................................................................................................................... 201
7.1 Résumé de l’étude ............................................................................................................... 201
7.2 Les changements au cours du temps ................................................................................... 204
7.3 Les effets de la MOBILITÉ ................................................................................................... 208
7.4 INTÉGRATION, ÉMERGENCE et FIDÉLITÉ .............................................................................. 214
7.5 Français québécois, phonétique et corpus : perspectives .................................................... 221
Conclusion....................................................................................................................................... 229
Bilan ........................................................................................................................................... 229
Limites générales ....................................................................................................................... 230
L’acquisition d’un second régiolecte : tendances actuelles et futures........................................ 233
Apports interdisciplinaires ......................................................................................................... 242
Bibliographie ................................................................................................................................... 247
Annexe 1 : Courriel d’appel à participation .................................................................................... 267
Annexe 2 : Mots cibles du corpus ................................................................................................... 268
Annexe 3 : Phrases porteuses de la tâche 1 et phase d’entraînement .............................................. 269
Annexe 4 : Script Praat de relevé des mesures ............................................................................... 271
Annexe 5 : Questionnaire démographique ...................................................................................... 273
Annexe 6 : Questionnaires autoadministrés .................................................................................... 274

viii
Annexe 7 : Tableau des moyennes et écarts-types par voyelle et indice acoustique....................... 286
Annexe 8 : Graphiques des écarts-types par voyelle et indice acoustique ...................................... 292
Annexe 9 : Effets significatifs des facteurs pris en compte dans les modèles mixtes et
exclusions nécessaires pour atteindre une distribution normale des résidus ................. 298
Annexe 10 : Résultats détaillés des effets fixes ............................................................................... 308
Annexe 11 : Tableau synthèse des effets significatifs du facteur CONTEXTE ................................. 323
Annexe 12 : Graphiques des interactions avec le CONTEXTE ......................................................... 324

ix
Liste des tableaux
Tableau 1 : Hiérarchie de l’acquisition des traits d’un R2 en fonction de leur difficulté
d’assimilation. Tableau extrait de Kerswill (1996 : 200) ..........................................................42
Tableau 2 : Synthèse des critères utilisés pour définir la saillance objective et la saillance
subjective, et études dont ils sont issus (Sch : Schirmunski; Tru : Trudgill, 1986; Auer :
Auer et coll., 1998). Tableau inspiré d’Auer et coll. (1998 : 167) ............................................47
Tableau 3 : Origine géographique des 18 participants mobiles, regroupés par régions
administratives québécoises ....................................................................................................127
Tableau 4 : Échelles ordinales construites pour mesurer les sous-indices qui composent
l’indice INTÉGRATION ..............................................................................................................155
Tableau 5 : Différences significatives entre le T1 et le T2 par voyelle et indice acoustique. Les
nombres correspondent aux différences entre les moyennes estimées par le modèle. Une
valeur positive traduit une augmentation de la valeur estimée des formants, de la durée ou
de l’ampleur de la trajectoire formantique au cours du temps. Les interactions sont
signalées par un astérisque suivi du ou des facteurs en interaction avec le TEMPS .................173
Tableau 6 : Différences significatives entre les mobiles et les sédentaires par voyelle et indice
acoustique. Les nombres correspondent aux différences entre les moyennes estimées par
le modèle. Un nombre positif signifie que la valeur estimée du formant, de la durée ou de
l’ampleur de la dynamique formantique est plus importante chez les mobiles. Les
interactions sont signalées par un astérisque suivi du ou des facteurs en interaction avec la
MOBILITÉ .................................................................................................................................183
Tableau 7 : Différences significatives entre les hommes et les femmes par voyelle et indice
acoustique. Les signes + indiquent que la valeur moyenne estimée du formant, de la durée
ou de l’ampleur de la dynamique formantique est significativement plus élevée chez les
femmes. Les interactions sont signalées par un astérisque suivi du ou des facteurs en
interaction avec le SEXE ..........................................................................................................187
Tableau 8 : Résultats de régressions linéaires à mesures répétées rendant compte de la relation
entre les indices acoustiques et les indices INTÉGRATION et ÉMERGENCE. L’estimé
correspond à la variation prédite de l’indice acoustique lorsque la valeur de
l’INTÉGRATION (gauche) ou de l’ÉMERGENCE (droite) augmente de 1 ...................................195

x
Liste des figures
Figure 1 : Trois conceptualisations de la notion de dialecte. Figure extraite de Harris
(1990 : 11) .................................................................................................................................12
Figure 2 : Distance à parcourir par l’apprenant pour maîtriser une L2 ou un R2. Figure adaptée
de Siegel (2010 : 137)................................................................................................................15
Figure 3 : Modèle de dissonance idiolectale. Figure extraite de Berthele (2002 : 331) ....................23
Figure 4 : Représentation schématique de la relation entre la perception et la production de la
parole en contexte de variation et de changement. Figure extraite de Beddor (2015 : 7) .........53
Figure 5 : Continuum de l’hypoarticulation à l’hyperarticulation. Figure inspirée de la
contribution de Lindblom (1990) ..............................................................................................98
Figure 6 : Adaptation du questionnaire IDEA-8 (Reifman et coll., 2007; Baggio et coll., 2015)...157
Figure 7 : Diagrammes F1/F2 et F2/F3 présentant la dispersion des occurrences produites par les
femmes (haut, n=23) et les hommes (bas, n=10), TEMPS et MOBILITÉ confondus. Les
ellipses regroupent 75 % des occurrences d’une catégorie .....................................................169
Figure 8 : Plan cartésien présentant la dynamique moyenne du F1 et du F2 des occurrences
produites par l’ensemble des participants (n=33) ....................................................................170
Figure 9 : Plan cartésien présentant la dynamique moyenne du F2 et du F3 des occurrences
produites par l’ensemble des participants (n=33) ....................................................................171
Figure 10 : Diagrammes boîtes à moustaches de la durée des occurrences produites par
l’ensemble des participants (n=33). Les valeurs éloignées sont incluses dans les
moustaches ..............................................................................................................................172
Figure 11 : Valeur moyenne estimée du F1 des voyelles [ɪ y ʏ u ʊ] /ø o ɛ œ ɔ/, en fonction du
facteur TEMPS ..........................................................................................................................174
Figure 12 : Valeur moyenne estimée du F2 des voyelles [ʏ] /ɛː œ a/, en fonction du facteur
TEMPS ......................................................................................................................................175
Figure 13 : Valeur moyenne estimée du F3 des voyelles [ɪ ʏ ʊ] /ø o ɛ ɛː œ ɔ a ɑ/, en fonction du
facteur TEMPS ..........................................................................................................................175
Figure 14 : Diagrammes F1/F2 (haut) et F2/F3 (bas) des voyelles produites au T1 (cercles) et au
T2 (triangles). Toutes les différences entre les valeurs estimées, significatives ou non,
sont représentées......................................................................................................................176
Figure 15 : Valeur moyenne estimée de la dynamique du F1 des voyelles /o ɛ ɛː œ ɔ/, en
fonction du facteur TEMPS. Une valeur négative traduit une diminution de l’indice en
cours d’émission. Plus la valeur est proche de 0, moins le mouvement formantique est
important..................................................................................................................................177
Figure 16 : Valeur moyenne estimée de la dynamique du F2 de /ɛ/, en fonction du facteur
TEMPS. Une valeur négative traduit une diminution de l’indice en cours d’émission. Plus
la valeur est proche de 0, moins le mouvement formantique est important ............................178
Figure 17 : Valeur moyenne estimée de la dynamique du F3 de /ɑ/, en fonction du facteur
TEMPS. Une valeur positive traduit une augmentation de l’indice en cours d’émission.
Plus la valeur est proche de 0, moins le mouvement formantique est important ....................179
Figure 18 : Valeur moyenne estimée du F1 de [y], en fonction des facteurs TEMPS et SEXE .........180

xi
Figure 19 : Valeur moyenne estimée du F2 de /ɑ/, en fonction des facteurs TEMPS et SEXE ..........180
Figure 20 : Valeur moyenne estimée de la durée de /ɛː/ au T1 et au T2, en fonction du facteur
MOBILITÉ .................................................................................................................................181
Figure 21 : Valeur moyenne estimée du F1 de [ʊ] au T1 et au T2, en fonction des facteurs
MOBILITÉ et SEXE ...................................................................................................................181
Figure 22 : Valeur moyenne estimée du F1 de /o/ au T1 et au T2, en fonction des facteurs
MOBILITÉ et SEXE ...................................................................................................................182
Figure 23 : Valeur moyenne estimée de la dynamique du F2 de [ʏ] /œ/, en fonction du facteur
MOBILITÉ. Une valeur négative traduit une diminution de l’indice en cours d’émission.
Plus la valeur est proche de 0, moins le mouvement formantique est important ....................184
Figure 24 : Valeur moyenne estimée de la durée de [i], en fonction du facteur MOBILITÉ ............185
Figure 25 : Comparaison entre les écarts-types de F1 et de F2 chez les femmes (haut) et les
hommes (bas) en fonction du facteur MOBILITÉ, T1 et T2 confondus ....................................186
Figure 26 : Valeur moyenne estimée du F1 des voyelles [i ɪ y ʏ ʊ] /e ø o ɛ ɛː œ ɔ a ɑ/, en
fonction du facteur SEXE .........................................................................................................188
Figure 27 : Valeur moyenne estimée du F2 des voyelles [i ɪ y ʏ ʊ] /e ø ɛ ɛː œ ɔ a ɑ/, en fonction
du facteur SEXE .......................................................................................................................189
Figure 28 : Valeur moyenne estimée du F3 des voyelles [i ɪ y ʏ u ʊ] /e ø o ɛ ɛː œ ɔ a ɑ/, en
fonction du facteur SEXE .........................................................................................................189
Figure 29 : Diagrammes F1/F2 (gauche) et F2/F3 (droite) représentant la moyenne estimée des
occurrences produites par les hommes (n=10) et les femmes (n=23), TEMPS et MOBILITÉ
confondus ................................................................................................................................190
Figure 30 : Valeur moyenne estimée de la dynamique du F1 des voyelles [i y], en fonction du
facteur SEXE. Une valeur négative traduit une diminution de l’indice en cours d’émission.
Plus la valeur est proche de 0, moins le mouvement formantique est important ....................190
Figure 31 : Scores à l’indice INTÉGRATION au T1 (haut) et au T2 (bas). Les moyennes estimées
correspondent aux lignes verticales pleines et les intervalles de confiance, aux lignes
pointillées ................................................................................................................................192
Figure 32 : Scores à l’indice ÉMERGENCE au T1 (haut) et au T2 (bas). Les moyennes estimées
correspondent aux lignes verticales pleines et les intervalles de confiance, aux lignes
pointillées ................................................................................................................................194
Figure 33 : Droites de régression résultant de l’analyse sur les indices INTÉGRATION et F3. Une
équation ajustée est présentée par temps d’enquête, puisque le modèle prédit des
coordonnées à l’origine différentes au T1 et au T2 .................................................................195
Figure 34 : Quatre patrons possibles de l’évolution d’une variable phonétique au quotidien et
au cours du temps. Figure adaptée de Sonderegger (2015 : 1) ................................................212
Figure 35 : Diagrammes F1/F2 présentant la répartition des 198 occurrences du mot prépare
selon le timbre perçu : les 95 [a] sont en rouge et les 103 [ɑ], en noir; les productions des
hommes sont à gauche et celles des femmes, à droite. L’ellipse de dispersion des voyelles
des mots face, part et porc est donnée comme référence ........................................................223

xii
Remerciements
Mes premiers remerciements vont à ma directrice de recherche, Johanna-Pascale Roy. Je ne saurais
exprimer combien j’apprécie la confiance et la grande liberté intellectuelle que tu m’as accordées
tout au long de mon parcours. Merci pour ta disponibilité, ton honnêteté et ton éthique, sur
lesquelles j’ai toujours pu compter et qui m’ont servi de modèle plus d’une fois. Merci aussi de faire
du labo un havre où il fait bon vivre et apprendre. J’en repars avec un bagage professionnel et
personnel inestimable, des effluves de menthe et d’agrumes dans les narines, et ne t’en fais pas,
avec mes petits bas.

Je remercie Vincent Arnaud d’avoir évalué ma thèse bien sûr, mais surtout pour tout le reste. Merci
de partager ton savoir avec art et générosité, de me faire douter et creuser les méninges. Merci pour
toutes ces discussions, passées et à venir, songées ou spontanées, sur des sujets phonétiques,
statistiques, socioculturels, musicaux, culinaires; que sais-je ? Merci enfin de ta présence, depuis
l’UQAC, à chaque étape de ce voyage au bout des études supérieures.

Je remercie également Kristin Reinke d’avoir accepté d’évaluer ma thèse. Merci de t’être intéressée
au projet dès le début. Ce fut un réel plaisir d’explorer avec toi l’univers de la pédagogie
universitaire et de te côtoyer pendant mes années à l’Université Laval. Bientôt je saurai te dire plus
que danke.

My sincerest thanks also go to Bronwen Evans. Your own work on second dialect acquisition has
been the very first inspiration for this thesis, and it means a lot to me that you undertook the
linguistic challenge of evaluating it. I can’t thank you enough for the stimulating time I had at UCL,
for your scientific insights, your sharp eye, and for being such a sensitive and enthusiastic person in
general.

Je remercie le Conseil de recherches en sciences humaines du Canada (CRSH), dont la bourse


Joseph-Armand-Bombardier aura permis d’effectuer mes études doctorales et le supplément
Michael-Smith de passer une session à Londres, la Faculté des études supérieures et postdoctorales
de l’Université Laval pour les bourses de soutien à la réussite, ainsi que le Bureau international de
l’Université Laval, LOJIQ et l’AELIÉS pour les bourses de mobilité.

Merci à Laurence Desbois-Bédard du Service de consultation statistique de l’Université Laval pour


ses conseils et sa disponibilité.

xiii
Un grand merci à mes parents de porter un intérêt soutenu à ce que je fais, de respecter mes choix et
de m’avoir montré, par l’exemple, à aller au fond des choses. Je suis également très reconnaissante
envers mon frère, sur qui je peux invariablement compter pour tenir le fort en mon absence. Mille
mercis à David d’avoir partagé les hauts et les bas, le stress et les incertitudes du doctorat, d’avoir
sauté à pieds joints dans l’aventure londonienne, d’avoir accepté ces moments où j’étais davantage
un pyjama ambulant qu’un humain, d’avoir géré l’agenda culturel et social, et surtout, de toujours
croire que tout est possible.

Je salue et remercie tous les professeurs, étudiants et membres du personnel que j’ai eu la chance de
côtoyer à l’Université Laval et à UCL, tout particulièrement Caroline Sigouin, ma comparse de labo
depuis tant d’années, pour les réflexions sur la phonétique et le doctorat, le chocolat, les recettes, les
pomodori, le badminton, les plantes (mortes), et bien d’autres petites choses.

À mes amis hors université, je m’excuse de vous avoir parfois négligés et vous remercie de votre
patience, de votre curiosité et de votre intérêt. Parfois vos questions m’ont fait m’en poser à mon
tour, et d’autres fois parler d’autre chose m’a fait le plus grand bien. Je salue également les
incroyables Filles poches, qui ont su me changer les idées à tout coup.

Finalement, je souhaite exprimer ma plus vive gratitude envers mes participants. Sans le temps
qu’ils m’ont généreusement accordé, rien de tout ceci n’aurait été possible. Merci, et continuez à
contribuer à la science !

xiv
Introduction
La notion de lieu est de celles qui paraissent immuables. À première vue, un lieu peut être défini à
partir de critères physiques et objectifs, qu’il s’agisse d’éléments tangibles comme une chaîne de
montagnes ou un fleuve, ou de divisions politiques entérinées (Johnstone, 2004 : 65). Par le fait
même, l’origine géographique d’un individu, c’est-à-dire le lieu qui lui est intimement lié, est
perçue comme une catégorie qui ne laisse nulle place à interprétation. La notion de lieu a joué, et
joue toujours, un rôle de premier plan en linguistique, notamment pour l’étude de la variation. Que
le chercheur s’inscrive dans un cadre variationniste, dialectologique ou autre, quels que soient les
facteurs sociaux corrélés aux usages observés, il demeure que le concept même de locuteur est
indissociable de l’emplacement géographique qui lui est attribué (Milroy, 2002a : 4).

Dans la mesure où le lieu est envisagé comme un facteur de catégorisation sociale, un certain
décalage peut cependant survenir entre une classification de facto et le rapport audit lieu entretenu
par les individus. Le sentiment d’appartenance à un autre groupe social peut prédominer, et le
concept de groupe n’est pas tenu de s’arrêter à la frontière. En parallèle, la mobilité individuelle ne
cesse de croître. Le profil des migrants, les canaux de migration et les points de chute sont de plus
en plus diversifiés (Vertovec, 2007). Des phénomènes contemporains tels que l’embourgeoisement
de certains secteurs (Becker, 2009), le déplacement d’individus pour cause de catastrophe naturelle
(Carmichael, 2014, 2017) et l’arrivée massive de migrants politiques (Hernández et Maldonado,
2012) modifient profondément la composition démographique et linguistique des quartiers et des
villes. À l’ère du numérique, la nécessité et la possibilité de délimiter physiquement un lieu
apparaissent en outre relatives. Inévitablement, le rapport au lieu traditionnellement entretenu par
les individus s’en trouve ébranlé, modifiant jusqu’à leur conception de l’origine géographique
(Johnstone, 2004 : 71; Bigham, 2012 : 536). La manière d’envisager le lieu en recherche sur la
variation mérite ainsi d’être revisitée, car comme le souligne Bigham (2012 : 541) : « our use of
ideas like place, network, class, gender, and age, if they are to make any sense as social factors,
must be open to change as society changes ».

Coïncidant avec la montée de telles réflexions, un nouvel objet de recherche centré sur les
conséquences linguistiques de la mobilité géographique individuelle émerge à partir des années
1980 : l’étude de l’acquisition d’un second dialecte1 (second dialect acquisition, Siegel, 2010). Ce

1
Nous utilisons pour l’instant le terme dialecte comme traduction de dialect, tel que défini par Wolfram
(1997 : 107) : « any regional, social, or ethnic variety of a language ». Nous reviendrons plus en détails sur ce
terme et ses définitions dans la section 1.2.

1
phénomène est passible de survenir lorsqu’un locuteur migre d’une aire dialectale à l’autre, où
certains usages diffèrent, mais non la langue même. Alors que la majorité des travaux en
sociolinguistique et en dialectologie ne tiennent compte que de locuteurs sédentaires (Johnstone,
2004; Chambers et Trudgill, 1998), cet objet d’étude émergent est centré sur les usages jusque-là
méconnus de locuteurs géographiquement mobiles. Une contribution de Payne (1980) à propos de
l’acquisition du dialecte de Philadelphie par des enfants migrants est régulièrement citée comme
l’une des premières à traiter du sujet (Tagliamonte et Molfenter, 2007 : 651).

L’acquisition d’un second dialecte peut être envisagée comme une forme de convergence vers une
nouvelle parole ambiante, parfois aussi nommée imitation2, et tend à faire partie de l’imaginaire
collectif (Munro et coll., 1999; Nycz, 2015). En effet, dès l’âge de 3 ans, les enfants conçoivent que
deux personnes originaires d’endroits différents n’ont pas la même prononciation (Weatherhead et
coll., 2016). Intuitivement, on sait également que les individus fréquemment en contact
s’influencent mutuellement, y compris en ce qui a trait à leur façon de s’exprimer. Ainsi il semble
logique qu’un locuteur qui migre vers un autre lieu soit enclin à adopter les usages différents des
nouvelles personnes avec qui il interagit. De hâtifs travaux en dialectologie évoquaient déjà cette
potentielle influence des usages linguistiques d’autrui. Hempl (1896 : 316), par exemple, considère
important de poser la question suivante aux témoins prenant part à une enquête dialectologique :
« Has your speech been modified by that of persons speaking differently from what is usual in your
neighborhood? » Puisque ce phénomène semble aller de soi, le fait qu’il ne se soit pas imposé plus
tôt comme objet d’étude scientifique peut surprendre. Cela dit, si le domaine est désormais
relativement prolifique, il demeure qu’à notre connaissance, aucune étude n’a été menée sur
l’acquisition d’un second dialecte du français québécois (FQ). C’est le sujet que nous nous sommes
proposé d’aborder dans le cadre de cette thèse de doctorat.

Comme plusieurs de nos prédécesseurs, nous avons choisi d’axer notre recherche sur l’aspect
phonétique du processus d’acquisition d’un second dialecte (Auer, 2007 : 112). L’approche adoptée
pour en traiter s’inscrit dans le courant de la sociophonétique (Foulkes et Docherty, 2006; Jannedy
et Hay, 2006; Hay et Drager, 2007; Foulkes et coll., 2010; Di Paolo et Yaeger-Dror, 2010; Thomas,
2011; etc.). Ce champ de recherche s’est initialement présenté comme l’interface entre deux
disciplines établies de longue date : la sociolinguistique et la phonétique. Foulkes et coll.

2
Dans la littérature qu’il nous a été donné de consulter, les auteurs usant du terme imitation le font là où
d’autres emploient convergence. Dans ce contexte, on peut donc les considérer synonymes, comme le
confirme cet extrait de Babel (2012 : 178) : « Phonetic imitation, also known as phonetic convergence or
phonetic accommodation […] ».

2
(2010 : 703) soulignent que l’une des premières acceptions du terme revient à Deshaies-Lafontaine
(1974), dont la thèse de doctorat sur le français parlé à Trois-Rivières représente bien l’orientation
des premiers travaux identifiés sous cette appellation : il s’agit en réalité d’une analyse
variationniste, mais ne ciblant que la dimension phonétique et excluant les variables lexicales et
syntaxiques. Depuis une vingtaine d’années, le nombre croissant d’études se réclamant du domaine,
la variété grandissante de sujets couverts, la mise au point de méthodes spécifiques, certaines prises
de position théoriques et la poursuite d’objectifs structurants ont néanmoins modifié la définition de
la sociophonétique et contribué à lui accorder légitimité et indépendance (Thomas, 2011 : 1-2).
Foulkes et coll. (2010 : 704) définissent de la manière suivante la ligne directrice du domaine : « the
unifying theme of sociophonetic work is the aim of identifying, and ultimately explaining, the
sources, loci, parameters, and communicative functions of socially structured variation in speech ».

L’étude de la dimension phonétique de l’acquisition d’un second dialecte s’insère naturellement


dans le courant sociophonétique en joignant à une analyse instrumentale fine une réflexion sociale
détaillée. D’une part, une description précise des changements phonétiques qui se produisent chez
un individu mobile offre une perspective sans précédent sur la flexibilité linguistique à différents
âges, sur la gradation des formes produites et perçues par le locuteur-auditeur, sur l’équilibre entre
les modifications généralisées et les modifications idiosyncrasiques, contribuant de cette manière à
enrichir les modèles de perception et de production de la parole (Jannedy et Hay, 2006 : 406).
D’autre part, proposer d’entrée de jeu d’adapter la notion de lieu aux réalités contemporaines
témoigne d’une intention de mettre au jour les catégories sociales signifiantes autour desquelles la
variation phonétique s’articule. L’étude de l’acquisition d’un second dialecte mène en effet à
s’interroger sur la nature et les effets des facteurs externes susceptibles d’influencer les usages de
locuteurs évoluant dans un contexte social spécifique ou atypique (Hay et Drager, 2007 : 93)
comme les individus mobiles. Nycz (2015 : 475) mentionne que l’étude de l’acquisition d’un
second dialecte met ainsi à profit tous les outils du sociophonéticien.

Cette thèse de doctorat consacrée à l’étude sociophonétique de l’acquisition d’un second dialecte du
FQ se présente comme suit. Le Chapitre 1 illustre de quelle manière les conséquences linguistiques
de la mobilité géographique se sont imposées comme objet d’étude au XXe siècle, expose quelques
problèmes définitoires et conceptuels reliés au domaine, et se termine par deux questionnements
généraux qui orientent le Chapitre 2. Celui-ci commence par une revue de la littérature sur
l’acquisition d’un second dialecte chez l’enfant et se poursuit avec une réflexion sur les
changements phonétiques susceptibles de survenir à l’âge adulte. Les principaux facteurs internes et
externes qui sont réputés influencer le processus d’acquisition d’un second dialecte sont ensuite

3
recensés. Au Chapitre 3, quatre cadres théoriques permettant d’interpréter le phénomène à l’étude
sont exposés : la théorie de l’accommodation, la théorie H&H, la convergence automatique et la
théorie des exemplaires. Une fois les principaux écrits sur le sujet résumés, les trois objectifs
poursuivis par cette recherche sont formulés au Chapitre 4. Notre but premier est bien entendu
d’étudier l’éventuelle acquisition d’un second dialecte du FQ, mais nous poursuivons également
l’objectif d’évaluer l’impact des facteurs sociaux que sont l’âge, l’intégration et la fidélité aux
origines sur la trajectoire phonétique d’un individu. Les choix méthodologiques effectués pour
mener à bien l’étude sont ensuite détaillés au Chapitre 5 : lieu et techniques d’enquête, échantillon,
variables phonétiques récoltées, quantification des facteurs sociaux et analyses statistiques
appliquées aux données. Le Chapitre 6, consacré à la description des résultats obtenus, propose
d’abord un survol des principales caractéristiques de la parole récoltée, suivi d’une évaluation des
changements phonétiques survenus et de l’impact des facteurs sociaux, puis d’une mise en
perspective des résultats en regard des objectifs de recherche formulés précédemment. Le
Chapitre 7 et la Conclusion synthétisent l’étude, discutent des tendances qui s’en dégagent et de ses
limites, suggèrent quelques possibilités d’exploitation du corpus au-delà du cadre de cette thèse et
offrent un aperçu des avenues que pourrait emprunter la recherche sur l’acquisition d’un second
dialecte, dans le but notamment de contribuer à l’avancement des connaissances en sociophonétique
et en linguistique de manière plus générale.

4
Chapitre 1 : Problématique
1.1 Mobilité géographique
1.2 Émergence de la notion de second dialecte
1.2.1 Dialecte : rapport à la langue et définitions
1.2.2 Langue et lecte : au-delà de la nomenclature
1.3 Interrogations initiales

1.1 Mobilité géographique


Une majeure partie des études réalisées au XXe siècle portant sur l’aspect phonétique ou
phonologique de la langue sont fondées sur le locuteur sédentaire. Cet idéal d’un témoin établi
depuis sa naissance, aux côtés d’autres membres de sa famille, depuis plusieurs générations, en un
lieu précis constitue, en particulier, la pierre angulaire des travaux en dialectologie et en
sociolinguistique (Chambers et Trudgill, 1998; Johnstone, 2004). Pour le dialectologue, le locuteur
natif est un gage d’accès aux usages régionaux les plus emblématiques et les mieux enracinés
(Chambers, 1992 : 673-674). Pour le sociolinguiste, les patrons de variation qu’il est possible
d’observer dans une communauté reposent sur une évaluation commune de ses normes par les
locuteurs natifs (Labov, 1976 : 187). Bref, comme le résume Britain (2013 : 490) : « [e]vidence of
such an idealisation of fixity is not hard to find in the linguistic literature ».

Au milieu du XXe siècle, Davis et McDavid (1950) et Reed et Spicer (1952) soulèvent toutefois un
problème rencontré en dialectologie nord-américaine, celui des zones de transition et de peuplement
récent. Au contraire de ce qu’ils nomment les focal areas et les relic areas, respectivement étudiées
pour leur rôle dans l’innovation et la conservation linguistiques, les aires de transition sont à
l’époque très souvent laissées de côté, en raison de la complexité des patrons de production qu’on y
rencontre (Davis et McDavid, 1950 : 264), mais également de l’absence virtuelle du locuteur
sédentaire. Dans le nord-ouest de l’Ohio, zone de peuplement récent (permis seulement lors de
l’assèchement des marais sources de prolifération de moustiques porteurs de malaria, au milieu du
XIX
e
siècle) et de transition (en raison de la construction d’un canal destiné au transport, vers la
même époque), Davis et McDavid (1950) sont effectivement confrontés à des locuteurs aux origines
géographiques diverses et à des usages lexicaux et phonétiques tout aussi variés, témoignant tantôt
de la conservation de traits anciens, tantôt d’innovations, et surtout, d’une importante variabilité
inter-individuelle. En Californie, Reed et Spicer (1952) estiment que la situation linguistique est
encore plus hétérogène.

Les centres urbains d’importance présentent une réalité similaire, de par l’intensité et la complexité
des patrons migratoires qui les caractérisent (Vertovec, 2007). Sur le plan méthodologique, la quête

5
du locuteur sédentaire dans de tels épicentres de l’immigration s’avère donc délicate, comme
l’illustre Kerswill (1993 : 35) :

Various criteria, mainly to do with place of birth or age on arrival, are applied in order to sift
out people who are not ‘native’. In Labov’s (1966) New York Lower East Side study, this leads
to an extreme reduction of the target population; my calculations, based on Labov’s
presentation (1966), suggest that well over 50% of the original sample are excluded by various
nativeness-related criteria.

Labov et coll. (2006 : 3) rapportent pour leur part qu’en 1990, à l’échelle des États-Unis, 39,2 % des
Américains étaient nés dans un autre État que celui où ils vivaient, une réalité ayant
considérablement complexifié le recrutement pour l’ANAE (Atlas of North American English), une
vaste enquête téléphonique portant sur la variation phonétique en anglais nord-américain et ciblant
des locuteurs natifs, sédentaires. Au-delà de la contrainte technique qu’elles évoquent, les
estimations de Kerswill (1993) et les statistiques rapportées par Labov et coll. (2006) mettent en
exergue la réalité sociale que constitue désormais la mobilité géographique en Occident (Chambers,
2002; Britain, 2013; Vertovec, 2007). Sachant l’impact que peut avoir toute réalité sociale sur les
pratiques linguistiques (Labov, 1976), celles des locuteurs mobiles présentent un intérêt scientifique
certain.

En dépit de leur quasi-absence en dialectologie et en sociolinguistique variationniste, les locuteurs


mobiles se sont néanmoins retrouvés sous la loupe de chercheurs d’autres disciplines, par exemple
en linguistique historique. Le contact entre migrants en situation de colonisation contribue
effectivement à l’étude de la formation de langues, de créoles et de koinès (voir entre autres
Trudgill, 1986, 2008). Les hypothèses concernant l’émergence des langues du Nouveau Monde, y
compris la question de leurs différences avec les variétés-souches européennes, sont pour la plupart
fondées sur le contact entre populations mobiles (concernant spécifiquement le FQ, voir l’ouvrage
édité par Mougeon et Beniak, 1994). Les locuteurs mobiles ont également intéressé les chercheurs
décrivant les usages en cours dans des villes industrielles récentes (Kerswill et Williams, 2000a,
2000b) ou marquées par des vagues d’immigration (Watt, 2002), révélant l’existence de koinès ou
de phénomènes de nivellement des variétés régionales. Par ailleurs, une importante littérature sur
l’acquisition des langues secondes repose sur l’étude de locuteurs migrants (voir Flege, 1987;
Sancier et Fowler, 1997, parmi bien d’autres).

Il est cependant un type spécifique de locuteurs mobiles, aux pratiques linguistiques tout aussi
spécifiques, au sujet desquelles les connaissances sont jusqu’à tout récemment demeurées
parcellaires et anecdotiques (Munro et coll., 1999 : 385) : les locuteurs migrant individuellement
entre aires dialectales. Malgré certains points communs avec les autres groupes de locuteurs

6
susmentionnés, les individus migrant entre aires dialectales occupent dans le paysage linguistique
une position suffisamment singulière pour que la généralisation intégrale des théories, notions et
postulats provenant d’autres disciplines soit inadéquate. Par exemple, il est question de mobilité
géographique individuelle, mettant en cause des locuteurs qui, seuls ou en famille, quittent leur
milieu d’origine pour s’installer dans un nouvel environnement. Il est fort probable que le locuteur
qui s’installe individuellement dans un nouvel environnement linguistique soit celui qui s’y adapte,
alors qu’à l’inverse, en linguistique historique, ce sont les effets de déplacements de masse sur les
structures linguistiques qui sont examinés (Trudgill, 1986 : 3). De même, les individus migrant
entre aires dialectales sont face à la possibilité de s’adapter à un nouveau dialecte, et non face à la
nécessité d’apprendre une nouvelle langue. Les observations et principes issus des études sur
l’acquisition des langues secondes sont ainsi fondés sur un tout autre processus linguistique (Siegel,
2010), ce dont nous rediscuterons dans la section 1.2.2. Pour ces raisons, un examen linguistique
approfondi des conséquences de la réalité sociale contemporaine que constitue la mobilité
individuelle entre aires dialectales s’est éventuellement imposé.

1.2 Émergence de la notion de second dialecte


Dans les années 1970, William Labov et son équipe mènent une série d’études sur la communauté
linguistique de Philadelphie dans le cadre du projet à grande échelle Linguistic Change and
Variation (Labov, 1994 : xi). Parmi les contributions issues de ce projet, celle de Payne (1980)
porte sur les usages d’enfants dans la banlieue de King of Prussia. Se détachant des modèles
traditionnels d’acquisition du langage fondés sur la transmission des usages parentaux, l’auteure
cherche à documenter l’influence des pratiques de la communauté sur le processus d’acquisition.
Pour parvenir à isoler une telle influence, Payne (1980) se tourne vers des locuteurs dont l’input à la
maison et dans la communauté diffère. La parole de 108 enfants provenant de 24 familles
anglophones de classe moyenne, réparties en trois groupes, est examinée : a) les familles composées
de parents et d’enfants nés sur place; b) celles composées d’enfants nés sur place et de parents nés
ailleurs; c) celles composées de parents et d’enfants nés ailleurs. L’auteure constate que même s’ils
ne sont pas nés à King of Prussia, tous les enfants du groupe c) ont acquis certaines des
caractéristiques phonétiques qui y sont utilisées; les plus jeunes sont parvenus à une maîtrise quasi-
totale des usages locaux et les plus âgés présentent un profil d’acquisition plus variable et souvent
partiel. Elle observe également que le « short-a » philadelphien, dont le conditionnement obéit à
une règle phonologique complexe (voir Payne, 1980 : 156-159), n’est parfaitement maîtrisé que par
les enfants du groupe a), dont les parents sont eux-mêmes originaires de Philadelphie.

7
Au-delà de ses implications pour la description de la variation et du changement linguistiques à
Philadelphie, cette étude révèle que les usages phonétiques d’un locuteur sont fortement influencés
par ceux de la communauté, même s’il n’en est pas originaire. En d’autres termes, lorsque soumis à
un changement d’environnement linguistique, les locuteurs apparaissent enclins à modifier leur
prononciation. En traitant de locuteurs ayant migré entre zones géographiques où certains usages,
mais non la langue même, diffèrent, la contribution de Payne (1980) représente un jalon pour
l’étude de l’acquisition d’un second dialecte, telle que définie par Tagliamonte et Molfenter
(2007 : 650) : « the process by which people transplanted from one region to another acquire a
second dialect of the same language ». Dans la foulée de ce prélude probant, les recherches portant
sur le sujet s’accumulent dans les décennies suivantes, et sont pour la première fois colligées par
Siegel (2010) dans un manuel qui présente l’état de l’art des méthodes, résultats, applications et
défis liés à ce champ de recherche émergent. Avant d’entrer dans le vif du sujet, il convient
toutefois d’exposer brièvement quelques concepts essentiels pour situer la notion de second
dialecte, à commencer par ce qui distingue langue et dialecte.

1.2.1 Dialecte : rapport à la langue et définitions


Hinskens (1998 : 160) définit un système linguistique comme étant constitué d’éléments (segments,
morphèmes, etc.), de structures (syllabes, syntagmes, etc.) et de processus (assimilation, inversion,
etc.) gouvernés par des principes et des contraintes (phonotactique, règles d’accord, etc.). Tous les
locuteurs n’utilisent pas le même système linguistique : d’après la terminologie saussurienne
(Saussure, 1969 [1916]), il existe différents systèmes de signes, ou comme l’exprime Labov
(1976 : 263), il est possible de « di[r]e “la même chose” de plusieurs façons ». L’ampleur des
divergences entre ces « façons » de dire la même chose varie toutefois considérablement, allant par
exemple d’une simple différence de lieu d’articulation d’un segment de la chaîne, à des chaînes de
segments sans lien apparent entre elles, puisant dans des inventaires phonémiques différents et dont
l’agencement au sein d’un énoncé suit une logique distincte. L’inter-compréhension s’en trouve
tantôt inaffectée, tantôt réduite à néant. Intuitivement, il apparaît évident que l’on cherche à
nommer différemment le rapport entre deux systèmes linguistiques qui, d’un côté, sont
structurellement proches et mutuellement intelligibles (dialectes), et de l’autre, structurellement
éloignés et non intelligibles mutuellement (langues).

Remontant à l’Antiquité gréco-romaine, Harris (1990 : 4-5) expose pourtant que chez les Grecs, des
termes comme diálektos, glōssa et léxis sont utilisés de manière interchangeable. La proximité
relative des usages linguistiques n’est pas ignorée, mais traitée sur un continuum unidimensionnel.
Par exemple, le grec et le perse pourraient constituer deux extrémités jointes par toute une gamme

8
de systèmes linguistiques intermédiaires. Dans la pensée grecque, la distinction entre les différents
systèmes composant cet axe est fondée sur quelques caractéristiques linguistiques opposant les
habitants d’un lieu à ceux d’un autre lieu, ce qui en fait selon Harris (1990) la première attestation
du concept de dialecte. Bien entendu, cette vision reflète les connaissances et les perspectives
d’alors sur le monde. Si le continuum était contextuellement valide, les Grecs auraient été en peine
d’en établir un unissant de manière cohérente leur langue et le japonais. Néanmoins, Harris
(1990 : 7) avance que cette conception n’est sans doute pas très éloignée de celle d’un public non
initié. Pour illustrer son propos, l’auteur met en scène un Français du début du XXe siècle, sédentaire
et sans formation en linguistique, qui par hasard, aurait pris connaissance de la carte 27 de l’Atlas
linguistique de la France (Gilliéron et Edmont, 1902-1910). Il n’aurait vraisemblablement pas été en
mesure de distinguer les langues des dialectes parmi les formes [alɔ], [vɔ] et [an ], utilisées
respectivement à Paris, à Poilly (Marne) et à Seilhac (Corrèze) pour exprimer le présent du verbe
aller à la première personne du pluriel. À l’instar des Grecs, ce Français du début du XXe siècle
aurait sans doute positionné les formes sur un continuum unidimensionnel, la proximité structurelle
n’étant pas d’emblée évidente. Un concept de langue distinct de celui de dialecte n’aurait pu faire
surface que si une rupture de communication causée par un nombre trop élevé de différences était
survenue.

Cet exemple met en évidence la fragilité des assises de la distinction initiale entre langues et
dialectes, en particulier celle des affinités structurelles. D’ailleurs, ni ce critère ni celui de
l’intelligibilité mutuelle ne rendent intégralement compte de la conception scientifique moderne du
rapport entre langue et dialecte, et ce, pour des raisons à la fois historiques et politiques. D’abord,
on tend à considérer comme des langues différentes des systèmes d’origine distincte, par exemple le
grec par rapport au japonais, l’innu par rapport au swahili, des paires de systèmes qui incidemment,
ne sont pas intelligibles mutuellement. Le mandarin et le cantonnais, qui eux non plus, ne sont pas
intelligibles mutuellement, sont néanmoins considérés comme des dialectes parce qu’ils partagent
une origine commune. Suivant cette logique, l’italien et l’espagnol devraient donc être traités
comme des dialectes, partageant un ancêtre commun, le latin. S’ils ne le sont pas, la raison en est
que l’aspect politique eut tôt fait d’entrer dans la définition de ce qu’est ou n’est pas une langue
(Harris, 1990 : 10-11). En effet, la consécration d’un système linguistique est fortement liée à
l’indépendance proclamée et reconnue de la nation où il est usité. L’italien n’est pas un dialecte du
latin, mais la langue de l’Italie; celle d’un gouvernement, d’un système d’éducation, d’une scène
socioculturelle. Sa parenté historique et ses degrés de similarité structurelle et d’intelligibilité
mutuelle avec d’autres langues romanes comme l’espagnol sont relégués au second plan.

9
Par contraste, la légitimité accordée à la langue tend à priver le dialecte de la sienne (Chambers et
Trudgill, 1998 : 3). La définition suivante, proposée par Hinskens (1998 : 156), en témoigne : « a
dialect is defined as a linguistic variety, displaying structural peculiarities (often referred to as
dialect features) in more than one component, usually of relatively little prestige, lacking
codification and mainly used orally in a geographically limited area ». Selon l’auteur, il s’agit là
d’une vision culturo-centriste du dialecte, où les différences et les spécificités sont mises en
évidence afin d’accentuer l’appartenance des locuteurs à un groupe et leur non-appartenance aux
autres groupes (voir également Tajfel, 1974; Tajfel et Turner, 1986). Ces groupes sont
indissociables d’un lieu donné, ancrant une fois de plus la notion de dialecte dans une perspective
avant tout géographique. Le rapport entre langues et dialectes n’est plus unidimensionnel comme
chez les Grecs, mais relationnel et hiérarchisé : un dialecte « appartient » à une langue et ne peut
exister de manière autonome, au même titre que le concept de parent ne peut exister sans celui
d’enfant (Harris, 1990 : 8). Crucialement toutefois, ce que l’on nomme langue ne correspond pas à
un dialecte qui aurait plus de prestige que les autres, une répartition géographique plus vaste, ou
encore une forme écrite. La langue, ou standard, est un supra-système qui surplombe les dialectes
(Dachsprache3; Muljačić, 1993) alors que ces derniers n’en font autant avec aucune autre forme, et
l’écart structurel entre langue standard et dialectes est parfois abrupt.

Hinskens (1998 : 158) reconnaît cependant que si cette description trouve écho en contexte
européen, la réalité nord-américaine est passablement différente. Dans la mesure où les langues
européennes sont concernées, le paysage linguistique des Amériques n’est effectivement pas
empreint de la même profondeur sociohistorique. En conséquence, les aires dialectales y sont plus
vastes, la densité des formes dialectales dans ces aires est moindre et l’écart structurel entre les
formes est réduit. Dans un tel contexte, langues et dialectes sont forcément perçus de manière moins
hiérarchisée, l’idée d’un continuum refait surface et la frontière entre les concepts s’estompe. La
représentation du standard est davantage celle d’un dialecte parmi d’autres, ce qu’atteste un adage
rendu célèbre par Weinreich : « A language is a dialect with an army and navy » (cité par Siegel,
2010 : 2). Autre différence critique, l’origine de la variation dialectale dans les Amériques n’est pas
d’emblée à prédominance géographique. Wardhaugh (2010 : 43), un linguiste canadien, formule
même la remarque suivante : « [s]ince most of us realize that it is not only where you come from
that affects your speech but also your social and cultural background, age, gender, race, occupation,
and group loyalty, the traditional bias toward geographic origin alone now appears to be a serious

3
Littéralement : langue-toit; également traduit coiffure linguistique et parapluie linguistique.

10
weakness ». Wolfram (1997 : 107), qui identifie trois types de dialectes – régionaux, sociaux et
ethniques – (voir note 1), s’inscrit donc résolument dans cette perspective.

Que les contextes européen et (nord-)américain diffèrent ne pose pas problème en soi; en revanche,
l’utilisation d’un terme commun pour rendre compte de réalités aussi éloignées cause
nécessairement un flou autour de la notion de dialecte. À cela s’ajoute le fait que certains
chercheurs en adoptent une définition strictement opérationnelle (Harris, 1990 : 9). Par exemple, on
oppose volontiers les « dialectes rhotiques » aux « dialectes non rhotiques » dans une étude sur la
rhoticité, mais on peut s’interroger sur la pertinence de regroupements fondés sur une seule
caractéristique, sachant qu’ils risquent fort de ne pas tenir la route dans une étude portant sur une
autre caractéristique. Concevoir de la sorte les dialectes comme des regroupements d’usages fondés
sur des caractéristiques communes, plutôt que de chercher à distinguer des systèmes par rapport à ce
qu’ils ont de différent, est une approche initialement proposée par Bloch (1948 : 8), pour qui un
dialecte est un agrégat d’idiolectes partageant un même système phonologique. L’intérêt de cette
nouvelle conceptualisation est qu’elle endosse l’unicité des usages individuels en n’en faisant pas
un obstacle à la catégorisation. Harris (1990 : 10) lui reproche toutefois d’ouvrir la porte à une
fragmentation artificielle de la notion de dialecte, à ce que ses différentes dimensions (lexique,
grammaire, prononciation) soient traitées isolément, alors que dans la pratique, elles sont
indissociables :

Only in a highly literate community does there arise the possibility of achieving this quite
artificial divorce between pronunciation on the one hand and grammar-cum-vocabulary on the
other, so that we can present people with the explicit task of providing their own pronunciation
for a text of which the grammar and vocabulary are supplied in advance.

Pour résumer, il apparaît clairement que toutes les facettes de la définition d’un dialecte ne font pas
l’unanimité. Une vision relativement consensuelle est celle d’un système linguistique partagé par
certains locuteurs, comportant des spécificités par rapport à celui d’autres locuteurs et généralement
peu prestigieux. Pour ce qui est des divergences, l’une d’elles concerne la conceptualisation de la
relation entre dialectes, langues et idiolectes, la Figure 1 illustrant les trois principaux points de vue
exposés jusqu’ici.

Une autre divergence réside au sein même du concept relationnel représenté sur la Figure 1 et
concerne la nature de la langue standard. Pour Hinskens (1998), dialecte et standard constituent
deux systèmes distincts, le premier étant dépourvu de prestige, limité au domaine oral et
possiblement assez éloigné structurellement du second, qui lui, agit en quelque sorte comme un
dôme. Cette conception est cependant au moins partiellement tributaire du contexte sociohistorique

11
ayant vu les dialectes se développer et être étudiés. Chez les chercheurs nord-américains, la
tendance est plutôt à percevoir le standard comme un dialecte jouissant simplement d’un plus grand
prestige (Weinreich).

Figure 1 : Trois conceptualisations de la notion de


dialecte. Figure extraite de Harris (1990 : 11)

Également corollaire de cette différence sociohistorique, le poids relatif du lieu et d’autres facteurs
sociaux dans la définition du dialecte varie. L’inclusion de l’aspect géographique apparaît comme
une condition sine qua non de la définition européenne (Hinskens, 1998), alors que des facteurs
comme l’origine socio-économique et l’appartenance ethnique sont d’égale importance pour des
chercheurs comme Wolfram (1997) ou Wardhaugh (2010). Finalement, Harris (1990) souligne la
multidimensionnalité du dialecte. Aussi bien des spécificités liées à la prononciation, au vocabulaire
et à la grammaire sont susceptibles d’entrer dans la composition d’un dialecte, ce à quoi Siegel
(2010 : 11) ajoute le niveau pragmatique et les éléments suivants : « differences in body language,
proxemics (the distances between people when they interact) and paralinguistic features such as
voice quality, loudness and the use of silence ». Chercher à isoler une composante n’est pas
impensable, mais on ne saurait la prétendre représentative du dialecte, et le chercheur qui choisirait
cette voie devrait être pleinement conscient du niveau de littératie de la population étudiée et de ce
que la technique d’enquête sélectionnée est à même de révéler.

Une problématique supplémentaire entourant la notion de dialecte est spécifique à la langue


française. D’abord, le terme patois pourrait sans doute être défini dans des termes à peu près
similaires à ceux employés par Hinskens (1998 : 156) pour décrire le dialecte. De fait, selon Knecht
(1998 : 123), patois et dialecte sont fréquemment employés comme synonymes. Ils ont toutefois un
sens bien distinct en Alsace et en Suisse, où patois fait référence à un parler gallo-roman et dialecte,

12
à un parler germanique (Rézeau, 2001 : 363; Thibault, 2012 : 327). Les patois sont par ailleurs à
différencier des français régionaux : ces derniers sont structurellement plus proches de la langue
française que les patois et se retrouvent à l’échelle de la francophonie plutôt qu’en Europe
seulement. Malgré cette distinction, français régional est aussi utilisé comme synonyme de
dialecte, notamment par « des linguistes français travaillant dans des cadres théoriques américains »
(Knecht, 1998 : 124). Il semble ainsi que le sens déjà évanescent de dialecte soit de surcroît
tributaire de la traduction du chercheur, elle-même influencée par son secteur de recherche.

Face à la délicatesse de ces problèmes définitoires, étant donné la nuance péjorative inhérente au
terme de dialecte, et afin de signaler que tous les niveaux linguistiques ne sont pas pris en compte,
certains chercheurs qui comme nous, s’intéressent spécifiquement aux variations de prononciation,
se tournent vers le terme accent. Harmegnies (1998 : 9) le définit comme « l’ensemble des
caractéristiques de prononciation liées aux origines linguistiques, territoriales ou sociales du
locuteur, et dont la perception permet au destinataire d’identifier la provenance du destinateur »
(voir aussi Crystal, 2008 : 3). Cette définition de l’accent inclut le volet géographique, comme pour
le dialecte, mais également d’autres aspects de l’origine du locuteur. Entre autres, la mention de son
origine linguistique ajoute une dimension inédite aux phénomènes qu’englobe l’accent : il peut faire
référence à la prononciation de locuteurs d’origine linguistique autre que les auditeurs, y compris de
langue maternelle différente (accent étranger). Harmegnies (1998 : 11) ajoute que le terme est
parfois utilisé de manière dépréciative, ce qui se reflète dans l’expression à connotation positive
« ne pas avoir d’accent ». Ironiquement, l’utilisation du terme est en outre ambigüe en sciences
phonétiques, puisqu’il peut aussi faire référence à la mise en relief de segments ou de syllabes de la
chaîne parlée (Harmegnies, 1998 : 9; Crystal, 2008 : 3-4). La perception d’un accent peut ainsi être
attribuable au placement de l’accent… Enfin, la définition proposée par Harmegnies (1998) laisse
présumer que juger de la présence d’un accent revient d’abord et avant tout à l’auditeur naïf, le rôle
du chercheur demeurant imprécisé. À la lumière de ces différents éléments, il semble que le recours
au terme accent ne résolve pas intégralement les problèmes soulevés par l’utilisation de dialecte, en
plus d’être en proie aux siens propres.

Pour sa part, Bailey (1973 : 11) propose le terme lecte et le définit de la manière suivante : « a
completely non-commital term for any bundling together of linguistic phenomena ». Par rapport aux
termes précédents, le lecte de Bailey (1973) présente deux avantages majeurs : il évacue toute
nuance péjorative et ne regroupe ni plus ni moins que ce que le chercheur veut regrouper. C’est le
terme que nous privilégierons pour la suite de cet écrit. Précisons que nous adoptons une
conceptualisation relationnelle du lecte, où il est subordonné à une langue et coexiste avec d’autres

13
lectes. Une attention particulière sera accordée à la variation d’origine géographique, c’est-à-dire
aux régiolectes, et plus spécifiquement, au processus d’acquisition d’un second régiolecte
(désormais R2). Néanmoins, étant donné l’affiliation multiple d’un locuteur au sein de la structure
sociale (Wolfram, 1997 : 107), nous reconnaissons que d’autres facteurs ont le potentiel de façonner
sa prononciation. Le cas échéant, nous adjoindrons au terme lecte les préfixes socio-, idio-, ethno-,
etc., selon ce que les auteurs cités ou nous-même cherchons à exprimer. Comme la plupart de nos
prédécesseurs (Auer, 2007 : 112), nous nous concentrerons sur la dimension phonétique du
régiolecte, sans pour autant exclure que d’autres niveaux linguistiques puissent varier
concomitamment.

1.2.2 Langue et lecte : au-delà de la nomenclature


La nécessité de distinguer des concepts comme langue et lecte n’est pas uniquement motivée par
des considérations d’ordres terminologique ou idéologique. Établir cette distinction vise en effet à
déterminer d’entrée de jeu si acquérir une langue seconde (L2) et un second régiolecte (R2) relèvent
de mécanismes suffisamment semblables pour que la littérature portant sur l’acquisition d’une L2,
notamment les théories étayées à ce sujet, soit applicable aux situations d’acquisition d’un R2, et
corollairement, pertinente pour la suite de cette contribution.

Tout d’abord, mentionnons que l’acquisition d’un R2 et d’une L2 présente certaines similitudes. Par
exemple, il s’agit dans les deux cas d’acquisition d’un second système, impliquant qu’un premier,
natif, soit déjà en place (Rys et coll., 2017 : 268). La cible à atteindre, c’est-à-dire le second
système, est clairement définie, contrairement à des situations linguistiques comme l’émergence de
koinès ou de créoles (Bickerton, 1983 : 238). Autre distinction par rapport à de telles situations, il
s’agit de processus dont le résultat est individuel plutôt que collectif (Bickerton, 1983). Selon
Sankoff (2018a : 45), ce dernier élément de ressemblance fait en sorte que l’issue du processus
d’acquisition d’un R2 comme d’une L2 est appelée à varier d’un individu à l’autre, suivant des
facteurs tels que l’intensité des contacts avec des locuteurs du second système pendant l’acquisition.
De plus, s’il est théoriquement aussi probable qu’un arabophone apprenne le turc et qu’un
turcophone apprenne l’arabe, ou qu’un Portugais adopte le régiolecte brésilien et qu’un Brésilien
adopte le régiolecte portugais, dans les faits, l’acquisition d’un R2 et d’une L2 présente une
tendance à l’unidirectionnalité. Escure (1997 : 7) fait remarquer que lorsque deux lectes ne jouissent
pas du même prestige, on s’attend à ce que les locuteurs du lecte moins prestigieux adoptent le
standard, mais non l’inverse, et à ce que le standard soit plus facile à maîtriser que le non-standard,
une conception difficilement rattachable à quelque fondement scientifique. De la même manière, le
choix d’une L2 n’est pas nécessairement aléatoire, et la prédominance d’une lingua franca donnée à

14
une époque donnée est inévitablement associée à des qualités subjectives et impressionnistes
comme son esthétisme, sa logique grammaticale, sa facilité d’apprentissage (Crystal, 2003 : 7).

Pour ce qui est des dissemblances, Siegel (2010 : 5) mentionne que l’acquisition peut se produire
dans des conditions naturelles (naturalistic) ou résulter d’un enseignement explicite (educational).
Bien que le R2 comme la L2 puissent être acquis dans les deux contextes, il est plus fréquent que le
R2 soit adopté naturellement et que la L2 soit enseignée4. Dans les rares situations où l’acquisition
d’un R2 résulte néanmoins d’un enseignement, la cible à atteindre est d’ordinaire plus prestigieuse
que le R1. Par exemple, des enfants dont les usages employés à la maison seraient peu prestigieux
pourraient bénéficier d’un enseignement formel visant l’acquisition des usages privilégiés par le
système scolaire (Siegel, 2010 : 6). Ce déséquilibre de prestige, en plus de ses conséquences sur la
directionnalité de l’acquisition mentionnées précédemment, mène certains chercheurs à envisager le
processus sous l’angle d’une perte des caractéristiques non standards et d’un gain des
caractéristiques standards (voir section 2.3.2). Le prestige mis à part, l’utilisation d’un tel
vocabulaire révèle par ailleurs une différence fondamentale entre l’acquisition d’un R2 et d’une L2 :
le R2 tend à remplacer le R1, alors que la L2 cohabite avec la L15.

Les raisons qui mènent les locuteurs à adopter un R2 et une L2 peuvent également être radicalement
différentes. L’absolue nécessité peut motiver l’acquisition d’une L2, par exemple une personne
immigrante qui doit maîtriser la langue de son pays d’accueil afin d’y travailler et de subvenir à ses
besoins. Ou encore, un voyageur pourrait souhaiter communiquer avec les habitants du pays qu’il
visite et ainsi apprendre leur langue ou une langue véhiculaire internationale. En revanche, il n’est
a priori jamais essentiel d’utiliser un R2 si le R1 est compris par l’interlocuteur, laissant entrevoir
que d’autres facteurs sont vraisemblablement en cause (Siegel, 2010 : 5).

Siegel (2010) avance de surcroît que l’écart structurel entre les deux systèmes impliqués ne peut
être ignoré et illustre son propos à l’aide de la Figure 2.

L2

R2
Figure 2 : Distance à parcourir par l’apprenant pour maîtriser
une L2 ou un R2. Figure adaptée de Siegel (2010 : 137)

4
Cette généralisation exclut le bilinguisme (simultané ou séquentiel) chez les enfants d’âge préscolaire.
5
Le bilectalisme n’est pas impossible, non plus que « l’oubli » de la L1, mais ce ne sont pas les cas les plus
fréquents.

15
L’auteur explique qu’au début de l’acquisition, l’apprenant se situe au point x et que le point z
représente la cible à atteindre. En supposant que l’apprenant d’une L2 n’en possède initialement
aucune notion, alors que l’apprenant d’un R2 maîtrise déjà la majorité de son lexique, de sa
phonologie, de sa morphologie et de sa syntaxe, le second peut sembler avantagé en termes de
distance à parcourir pour atteindre la cible. D’un autre côté, ce que l’apprenant d’une L2 doit
parvenir à maîtriser est d’une telle ampleur que ses progrès sont plus évidents et que les attentes à
son égard ne sont pas les mêmes. En accédant au point y, il est possible que le locuteur soit
considéré bilingue, en dépit du fait qu’il n’a pas atteint la compétence native. Typiquement, la
distance y-z qu’il lui resterait à parcourir concerne la prononciation : il est fluide dans sa L2 mais
conserve un accent étranger (Siegel, 2010 : 137). Cette étape ultime, que la plupart des apprenants
d’une L2 ne franchissent jamais, est précisément celle à laquelle sont confrontés les apprenants d’un
R2. Possiblement parce que la progression sur cette distance réduite est plus difficile à mesurer,
l’acquisition d’un R2 semble davantage une question de tout ou rien : si le point z n’est pas atteint,
le R2 n’est pas acquis.

Renchérissant sur l’importance de prendre en considération l’écart structurel entre les systèmes,
Siegel (2010) évoque deux théories sur l’acquisition de la L2 accordant un rôle déterminant à la
distance phonétique entre les sons des deux langues impliquées : le Speech Learning Model (SLM)
de Flege (1995) et le Perceptual Assimilation Model (PAM) de Best (1995). Pour Flege (1995), les
productions d’un locuteur sont modulées par ses catégories perceptives, elles-mêmes façonnées par
l’inventaire phonémique de sa L1. Un apprenant exposé aux sons nouveaux d’une L2 sera porté soit
à les associer à ses catégories perceptives existantes, soit à en créer de nouvelles. Selon Flege
(1995 : 239), ce qui détermine l’issue de ce processus est la distance que perçoit l’apprenant entre
les nouveaux sons de sa L2 et ceux de sa L1. Si la distance perçue est importante, il est probable
qu’une nouvelle catégorie perceptive soit créée. Si au contraire elle est faible, les nouveaux sons
seront traités comme ceux de la L1. Au moment de la production, l’apprenant sélectionne les
formes à produire parmi ses catégories perceptives. Si pour un son donné de la L2, il n’a pas créé de
catégorie spécifique, il le produira comme en L1; s’il y avait néanmoins lieu de le produire
différemment, l’apprenant sera perçu comme s’exprimant avec un accent étranger.

Dans le cadre du PAM, les catégories formées par un locuteur sont de nature articulatoire plutôt que
perceptive. Selon Best (1995 : 193), les locuteurs développent au cours du temps des routines
articulatoires spécifiques à leur L1. Dans cette perspective, une catégorie phonémique correspond à
une constellation de gestes à la coordination et au phasage précis. L’apprenant exposé à un son
nouveau détecte ses similarités et ses écarts par rapport aux constellations existantes. Le son est

16
ensuite assimilé à une catégorie de la L1 aux propriétés articulatoires semblables. Toutefois, si
d’importants écarts et peu de similarités sont perçus, deux scénarios sont possibles : soit que le son
demeure inclassé, ouvrant la voie à la formation d’une nouvelle catégorie; soit que le son est jugé le
fruit d’une constellation non destinée à produire de la parole, par exemple un hoquet (Best,
1995 : 194). L’accent étranger provient du fait qu’un son de la L2 a été assimilé à une constellation
articulatoire de la L1 alors qu’il aurait dû faire partie d’une nouvelle.

Qu’il s’agisse du SLM ou du PAM, l’insuccès de l’apprenant à reproduire le phonétisme d’une L2 à


la manière des locuteurs natifs est attribué à une distance trop faible entre les sons des deux langues
pour que la différence soit perçue puis reproduite. Puisqu’en règle générale, l’écart structurel entre
deux lectes est réduit, le SLM et le PAM mènent à prédire que le phonétisme d’un R2 sera
particulièrement difficile, voire impossible à acquérir (Siegel, 2010 : 141-143). Cette interprétation
pose toutefois un problème fondamental : elle présuppose qu’un auditeur dispose de capacités
perceptives identiques dans sa L1 et sa L2. Or, que ce ne soit pas le cas est un fait avéré (voir par
exemple Sebastián-Gallés, 2005). Pour cette raison, mais aussi parce qu’un R2 et une L2 diffèrent
en termes de contexte d’acquisition habituel (naturel ou en classe), de rapport avec le premier
système déjà en place (remplacement ou coexistence), de motivations à l’apprentissage,
d’évaluation de la progression et de ce qui est perçu comme une acquisition effective, nous
estimons que l’adoption d’un R2 doit être traitée comme un phénomène propre à la L1 et distinct
des mécanismes en jeu lors de l’acquisition d’une L2. Pour la suite de cette contribution,
notamment au Chapitre 3, où seront exposés des cadres théoriques expliquant le phénomène
d’acquisition d’un R2, nous nous concentrerons sur une littérature et des modèles spécifiques à la
L1, plutôt que sur ceux consacrés à la L2.

1.3 Interrogations initiales


Comme mentionné au début de la section 1.2, l’étude fondatrice de Payne (1980) a ouvert la voie à
un tout nouveau champ de recherche qui vise à décrire les usages de locuteurs qui avaient jusque-là
évolué dans une zone grise, car ils n’étaient ni natifs, ni apprenants d’une langue seconde : l’étude
de l’acquisition d’un R2. Au moins trois conclusions auxquelles parvient Payne (1980) suscitent la
réflexion entourant ce nouvel objet d’étude. Premièrement, l’auteure constate que les jeunes enfants
qui composent son échantillon parviennent à une maîtrise des usages locaux nettement plus
importante que les enfants plus âgés, dont l’acquisition est souvent partielle et sujette à variabilité
inter-individuelle. On peut alors s’interroger sur la possibilité d’un seuil critique, au-delà duquel
l’acquisition d’un R2 est moins probable. Deuxièmement, la complexité de la règle d’apparition du
« short-a » philadelphien inhibe son acquisition, alors que des phénomènes phonétiques plus

17
simples sont davantage maîtrisés, laissant entrevoir que le processus d’acquisition d’un R2 peut être
régi par des facteurs d’ordre linguistique. Troisièmement, puisque l’étude de Payne (1980) a permis
de montrer que les usages des locuteurs sont fortement influencés par ceux des pairs, c’est-à-dire
une source de variation extra-linguistique, on peut se demander si d’autres facteurs externes sont
également susceptibles d’intervenir dans le processus d’acquisition d’un R2.

Deux interrogations initiales se dégagent de ces observations :

1) L’acquisition d’un R2 observée chez l’enfant est-elle également possible chez l’adulte ?

2) Quels sont les facteurs internes et externes susceptibles d’influencer l’acquisition d’un R2 ?

18
Chapitre 2 : État de la question
2.1 L’acquisition d’un second régiolecte chez l’enfant
2.2 Le changement phonétique à l’âge adulte
2.3 Des contraintes internes à l’acquisition d’un second régiolecte
2.3.1 Niveaux, règles et complexité linguistiques
2.3.2 Saillance perceptive
2.3.3 Lien perception-production
2.3.4 Synthèse
2.4 Des facteurs externes qui influencent l’acquisition d’un second régiolecte
2.4.1 Intégration sociale
2.4.2 Prestige
2.4.3 Intégrité et fidélité
2.4.4 Saillance (subjective)
2.4.5 Sujet de conversation
2.4.6 Âge et temps de résidence
2.4.6.1 L’émergence de l’âge adulte
2.4.6.2 Un second régiolecte en contexte universitaire
2.4.7 Synthèse
2.5 Synthèse générale

Dans ce chapitre, nous tâcherons de répondre, au moyen d’une revue de la littérature, aux deux
interrogations générales qui se dégagent de la problématique exposée : l’acquisition d’un R2 est-elle
possible chez l’adulte, et quels sont les facteurs susceptibles d’influencer ce processus ? Dans un
premier temps, il sera question de différentes études, outre celle de Payne (1980), qui portent sur le
thème de l’acquisition d’un R2 chez l’enfant, ce qui permettra de jeter un premier regard sur les
facteurs qui interviennent dans le processus. Nous établirons par la suite dans quelle mesure il est
également possible, pour l’adulte, de modifier ses usages phonétiques une fois franchie la période
dite critique. Ces bases jetées, nous identifierons les facteurs internes, puis les facteurs externes que
la littérature reconnaît pouvoir influencer favorablement ou défavorablement le processus
d’acquisition d’un R2 chez l’adulte.

2.1 L’acquisition d’un second régiolecte chez l’enfant


La question centrale de plusieurs études portant sur l’acquisition d’un R2 chez l’enfant, y compris
l’étude fondatrice de Payne (1980) rapportée précédemment, consiste à vérifier si les enfants
migrants adopteront les usages de leurs parents ou ceux de la communauté d’accueil. La littérature
suggère en effet qu’avant l’âge de 6 ans environ, le principal input linguistique des enfants est celui
des parents (voire de la mère) et qu’entre 6 et 12 ans, l’influence des pairs s’accentue (Kerswill,
1996)6. Chambers (2009 : 170) fait valoir que cette situation n’est pas particulièrement conflictuelle
sur le plan linguistique dans la mesure où parents et pairs appartiennent à la même communauté.

6
Les âges évoqués par Kerswill (1996) constituent des points de rupture sociologiques, qui peuvent ne pas
correspondre de manière tout à fait exacte aux âges critiques postulés pour la plasticité cérébrale.

19
Bien entendu, la question est tout autre en situation de mobilité géographique : quelle est l’influence
relative des pairs et des parents lorsque les usages de ces derniers diffèrent de ceux qui ont cours
dans la communauté où l’enfant grandit ?

Tâchant de fournir quelques éléments de réponse, Starks et Bayard (2002) s’intéressent à


l’incidence du /r/ postvocalique chez quatre enfants, issus de trois familles, nés en Nouvelle-
Zélande de parents nord-américains. Précisons que le /r/ postvocalique est présent dans l’input
parental (par exemple, le mot card prononcé [kɑːɹd]) mais absent des usages de la communauté
d’accueil ([kɑːd]). Au moment des enregistrements, trois enfants sont âgés de 3,6 à 6,1 ans, alors
que le quatrième est enregistré à plusieurs reprises depuis sa naissance jusqu’à l’âge de 20 ans. Les
auteurs constatent que le taux de production du /r/ postvocalique n’est pas lié à l’âge de l’enfant, ni
donc au temps d’exposition aux différents patrons d’utilisation existant dans son environnement,
mais bien à l’âge auquel les enfants sont entrés à la garderie : plus ils ont franchi cette étape tard,
plus leur taux de production de /r/ postvocaliques est élevé, oscillant entre 0 % et 3 % pour ceux qui
ont commencé la garderie à 6 semaines, 24 % pour celle qui a commencé à 11 mois, et environ
80 % pour celui qui a commencé à 25 mois. Starks et Bayard (2002) en concluent que plus
l’intégration à la communauté (par le biais de la garderie) est hâtive, plus les usages linguistiques
qui y ont cours sont adoptés, alors que l’influence parentale s’avère décisive lorsque l’exposition est
plus tardive, tout en demeurant précoce (25 mois seulement). Cette étude est d’autant plus
révélatrice que l’empan d’âge d’entrée à la garderie des quatre enfants est très restreint (moins de
deux ans).

Dans une étude de cas, Kobayashi (1981) analyse le système accentuel d’une jeune Japonaise née à
Kyoto de parents originaires de Tokyo lorsqu’elle est âgée de 2 ans et 11 mois, puis de 8 ans. Le
système accentuel du japonais parlé à Tokyo et à Kyoto comporte des différences substantielles7; ce
sont également les deux régiolectes comptant le plus de locuteurs au Japon et le premier est réputé
être le standard national (Kobayashi, 1981 : 5). L’analyse du premier enregistrement, constitué
d’une interaction entre la locutrice et sa mère, indique qu’elles utilisent toutes les deux le même
patron accentuel, celui de Tokyo, en dépit de leur lieu de résidence. Le corpus récolté lorsque la
locutrice est âgée de 8 ans comporte différentes modalités de production : lecture, interaction en
famille, interaction mère-enfant et interaction enfant-enfant (où la seconde enfant, ainsi que sa
famille, sont originaires de Kyoto). Les résultats indiquent que lors des interactions en famille et
mère-enfant, la locutrice conserve le même patron accentuel que lorsqu’elle était plus jeune, soit

7
Il s’agit ici d’accentuation lexicale. Nous référons le lecteur à l’article de Kobayashi (1981) pour une
description plus détaillée du système accentuel des deux régiolectes en question.

20
celui de Tokyo. En présence d’une paire, elle adopte plutôt le système de Kyoto. Selon Kobayashi
(1981 : 14), la locutrice étudiée a développé un second patron accentuel qu’elle est en mesure de
déployer lorsque la situation s’y prête. De plus, lors de l’interaction mère-enfant, la locutrice passe
du patron de Tokyo à celui de Kyoto lorsque l’échange porte sur des sujets entourant les pairs, ce
que Kobayashi (1981 : 16) interprète comme une activation du « peers’ code » en fonction du sujet
de conversation. En lecture, la locutrice adopte le système de Tokyo, possiblement parce qu’il s’agit
du standard japonais. En somme, cette étude montre que l’enfant peut développer un système
bilectal et que l’émergence plus ou moins consciente de l’un ou l’autre des lectes semble
conditionnée par des facteurs externes comme la modalité de production, l’interlocuteur et le sujet
de conversation.

Il est cependant probable que les mécanismes en jeu soient différents selon que l’enfant naît dans la
communauté d’accueil (comme c’est le cas des locuteurs de Starks et Bayard, 2002 et de
Kobayashi, 1981) ou y arrive en maîtrisant déjà un R1. Ainsi, Tagliamonte et Molfenter (2007)
s’intéressent à trois enfants canadiens issus d’une même famille qui emménagent à York, au
Royaume-Uni, à l’âge de 2, 4 et 5 ans. Cette étude longitudinale repose sur l’enregistrement quasi-
hebdomadaire d’interactions entre les trois enfants et couvre une période de 5 ans. La variable
ciblée par les auteures est le /t/ intervocalique (later, total), l’anglais canadien présentant dans ce
contexte une variante battue [ɾ], l’anglais britannique une variante occlusive sourde [t] et le
régiolecte de York, une variante glottique [ʔ]. Les résultats indiquent que les trois enfants
acquièrent la variante britannique [t] de manière progressive et qu’une intensification de son
utilisation est observée lorsqu’ils commencent l’école, soit au contact de pairs. Quant à la variante
glottique [ʔ], autrefois peu prestigieuse, elle était à York au moment des enregistrements le fait de
jeunes femmes urbaines. Tagliamonte et Molfenter (2007) constatent une utilisation de ce [ʔ]
nettement plus fréquente chez les deux filles (première et troisième enfants) que chez le garçon, ce
qu’elles interprètent comme un signe d’acquisition du conditionnement sociolinguistique de la
variante.

Par ailleurs, une hypothèse émise par Starks et Bayard (2002) en conclusion de leur étude était que
l’ordre des enfants dans une famille pouvait avoir un effet sur le degré d’acquisition d’un R2, les
plus jeunes adoptant davantage les variantes locales sous l’influence de leurs aînés. Ne disposant de
données que pour quatre locuteurs, dont seulement deux issus de la même famille, Starks et Bayard
(2002) étaient difficilement en mesure de mettre à l’épreuve leur hypothèse. Les résultats d’autres
études peuvent toutefois apporter des éléments de réponse. Tagliamonte et Molfenter (2007),
notamment, notent que le degré d’acquisition de la benjamine pourrait appuyer cette hypothèse,

21
mais non celui du cadet. Ainsi, d’autres facteurs doivent nécessairement être pris en compte, par
exemple le fait qu’une partie du processus d’acquisition du langage (et non seulement du R2) de la
benjamine a eu lieu au Royaume-Uni (Tagliamonte et Molfenter, 2007 : 670). Pour leur part,
Rogers (1981) et Trudgill (1986) s’intéressent au cas de jumeaux (un garçon et une fille) originaires
de Reading, dans le sud de l’Angleterre, déménagés en Australie à l’âge de 7 ans. Ils sont
enregistrés à six reprises sur une période de 8 mois et demi et leur acquisition de l’anglais australien
est évaluée en fonction de caractéristiques suprasegmentales par Rogers (1981) et phonétiques et
phonologiques par Trudgill (1986). Rogers (1981) observe au terme de l’étude l’acquisition de
patrons intonatifs de l’anglais australien et un changement du débit de parole chez les deux
locuteurs, bien que leur évolution linguistique respective soit très différente d’une séance
d’enregistrement à l’autre. De manière similaire, Trudgill (1986 : 28-31) constate que lors du
dernier enregistrement, les variantes australiennes sont acquises par les deux enfants pour la très
grande majorité des 15 variables à l’étude. L’acquisition de la sœur survient cependant plus
tardivement, est marquée par une accélération vers les cinquième et sixième mois de l’étude, et les
quelques variantes australiennes qu’elle n’acquiert pas ne sont pas les mêmes que celles que son
frère n’a pas acquises. Bien entendu, le parcours individuel des deux enfants ne peut s’expliquer par
leur ordre dans la famille comme le proposent Starks et Bayard (2002), ni même par leur âge
d’arrivée en Australie. Les auteurs attribuent à d’autres facteurs externes, nommément le sexe et le
groupe de pairs fréquenté, les différences observées.

Berthele (2002) aborde pour sa part la question de l’identité lors du processus d’acquisition d’un
régiolecte par des enfants du primaire. Son enquête prend place à Fribourg, en Suisse, auprès de 14
enfants âgés de 9 ans, bilingues ou multilingues pour la plupart, scolarisés en allemand à partir de
l’âge de 7 ans. Quand il s’agit de l’enseignement de l’allemand, la Suisse fait face à une situation de
diglossie : l’allemand standard est utilisé à l’écrit et l’allemand suisse, à l’oral, par les élèves
comme par les enseignants. L’allemand suisse comprend différents régiolectes; à Fribourg, le
régiolecte de Berne jouit d’un certain prestige et est utilisé à l’école. Berthele (2002) s’intéresse
donc à l’acquisition du régiolecte bernois par des enfants qui parlent un autre régiolecte de
l’allemand suisse à la maison. Il propose de vérifier empiriquement un modèle d’acquisition d’un
R2 qu’il nomme modèle de dissonance idiolectale, en référence à la théorie de la dissonance
cognitive de Festinger8. Ce modèle vise à décrire et à classifier les choix linguistiques auxquels

8
Omdal (1994 : 117) résume en ces termes la théorie de la dissonance cognitive de Festinger (1957) : « This
theory states that when thoughts, attitudes and behaviour do not match up in a particular individual, at least
one of these factors must be changed or adjusted so that ‘harmony’ can be established ». Appliquée à la
sociolinguistique, cette théorie postule qu’un locuteur qui entretient une opinion favorable d’un lecte qu’il ne

22
l’acquérant peut procéder, choix qui permettent de minimiser ou de maximiser les différences entre
un individu et un groupe donné (Berthele, 2002 : 342). Une schématisation du modèle de
dissonance idiolectale est reproduite à la Figure 3.

Figure 3 : Modèle de dissonance idiolectale. Figure extraite de


Berthele (2002 : 331)

La Figure 3 présente le locuteur Ego, qui parle un R1 avec sa famille et ses pairs, mais qui est
amené à migrer avec ses parents vers une zone où un R2 est parlé. Pour une variable donnée, les
variantes du R1 et du R2 sont soit différentes (présence de dissonance, branche N), soit identiques
(absence de dissonance, branche Y). En situation N, quatre stratégies sont possibles : 1) la plus
probable et la moins « marquée », Ego élimine la dissonance et s’adapte au R2, soit en remplaçant
sa variante native, soit en intégrant dans ses usages une nouvelle variante (splitting); 2) dans le but
de s’adapter au R2, Ego applique une règle de manière erronée (par surgénéralisation, par exemple)
et ne produit pas la variante « correcte » du R2; 3) Ego modifie la variante de son R1 de manière à
produire une variante intermédiaire, à mi-chemin entre celle du R1 et celle du R2; 4) Ego ne
modifie pas ses usages et conserve la variante de son R1, entretenant de ce fait la dissonance. En
situation Y, deux stratégies sont possibles : 5) Ego ne modifie pas ses usages et conserve la variante
de son R1, les variantes du R1 et du R2 étant de toute manière identiques; 6) la stratégie improbable
selon laquelle Ego change ses usages même s’il n’avait pas à le faire pour adopter une variante

parle pas tendra à modifier ses usages en direction de ce lecte afin de réduire la distance (ou la dissonance)
entre son opinion et ses usages. Omdal (1994) ajoute qu’il faut toutefois tenir compte de la capacité du
locuteur à identifier, puis à modifier les éléments linguistiques qui causent la dissonance. En cas d’échec, le
locuteur pourrait alors réduire la dissonance en modifiant son opinion du lecte qu’il n’est pas en mesure
d’adopter.

23
différente du R2, mais aussi de son R1, accentuant ainsi la dissonance. En ce qui concerne la partie
supérieure gauche de la Figure 3, Berthele (2002) précise que trois types de contraintes régissent les
stratégies présentées dans le modèle : linguistiques, écologiques et psychologiques. Il est également
à noter que le recours à ces six stratégies peut être conscient ou non, et qu’un choix doit être
effectué pour chaque variable.

L’analyse auditive de 18 variables phonétiques et morphophonologiques indique que la plupart des


élèves interrogés produisent plusieurs des variantes bernoises, à l’exception d’une locutrice
(éliminée de l’étude) qui refusait de s’exprimer autrement qu’en allemand standard. L’auteur
effectue une analyse plus approfondie des stratégies adoptées par quatre élèves et du lien entre leurs
pratiques linguistiques et leur intégration sociale au sein de la classe. Il constate qu’une bonne
intégration sociale et une réduction de la dissonance (stratégies 1 et 5) semblent aller de pair. Une
intégration plus difficile est plutôt corrélée à une non-réduction de la dissonance (stratégie 4), mais
également à l’accentuation de la dissonance : à la surprise de l’auteur, deux élèves ont effectivement
recours à l’improbable stratégie 6. Enfin, Berthele (2002) fait remarquer que la stratégie 1,
lorsqu’elle s’actualise sous forme d’ajout d’une variante, peut entraîner un conflit chez un enfant
qui se retrouve en présence simultanée de sa famille (avec laquelle il utilise les variantes du R1) et
de personnes issues de son milieu scolaire (avec qui il utilise les variantes du R2). La possibilité
d’un tel système bilectal en fonction de l’interlocuteur ressortait également de l’étude de Kobayashi
(1981), qui observait en outre un effet du sujet de conversation et de la modalité de parole.

Les résultats des quelques travaux sur l’acquisition d’un R2 chez les enfants rapportés jusqu’ici
montrent qu’il s’agit d’un processus complexe, influencé par une multitude de facteurs
linguistiques, sociaux et développementaux. D’abord, il se dégage des études citées que les pairs
sont un facteur d’influence majeur lors de l’acquisition d’un R2. Starks et Bayard (2002) constatent
que plus les enfants sont exposés tôt au R2 par le biais de l’entrée à la garderie, plus l’acquisition
est importante. Les jumeaux étudiés par Rogers (1981) et Trudgill (1986) acquièrent quant à eux un
R2 selon un cheminement distinct, ce qui pourrait être en partie attribuable au fait qu’ils fréquentent
un cercle de pairs différent. Tagliamonte et Molfenter (2007) rapportent une augmentation de
l’utilisation des variantes du R2 chez les trois enfants prenant part à leur étude lorsque ceux-ci
commencent l’école, soit au contact de pairs. Enfin, dans son observation d’élèves du primaire,
Berthele (2002) établit un lien entre l’intégration sociale des enfants et leur acquisition plus ou
moins importante du régiolecte de Berne. Il demeure néanmoins que l’influence parentale apparaît
non négligeable. Par exemple, l’étude de Starks et Bayard (2002) implique qu’un enfant exposé au
R2 à un âge aussi précoce que 25 mois peut retenir des caractéristiques de l’input parental. Dans le

24
cas de la locutrice analysée par Kobayashi (1981), que l’enfant ait d’abord été exposée au modèle
parental fait en sorte qu’elle développe un système bilectal : un lecte utilisé avec ses parents, l’autre
avec ses pairs. L’étude pionnière de Payne (1980) rapportée précédemment suggère d’autre part que
les règles phonologiques les plus complexes d’un régiolecte sont difficilement acquises sans input
parental, et ce, même lorsque le régiolecte en question constitue le R1 des enfants.

Le modèle de dissonance idiolectale développé par Berthele (2002) constitue un outil intéressant
pour l’analyse de l’acquisition d’un R2 chez les enfants. Cet arbre de décisions propose un éventail
concis mais assez complet des sorties possibles pour une variable donnée, en plus de rendre compte
des cas de bilectalisme. Le modèle demeure toutefois sommaire quant aux contraintes écologiques,
linguistiques et psychologiques qui pourraient prédire, ou du moins expliquer les directions
empruntées par l’enfant en situation de dissonance : cet aspect de l’analyse demeure ainsi post hoc.
D’un point de vue phonétique, la principale limitation que nous y voyons est que les réalisations
d’une variable sont envisagées de manière discrète et, à l’exception de la stratégie 3 (production
d’une variante intermédiaire), binaire. Ce modèle peut difficilement rendre compte du caractère
riche et gradué de la variation et du changement phonétiques (Thomas, 2002), à plus forte raison
des continuums acoustiques mis en évidence lorsqu’une telle analyse est en jeu, et se limite, en
l’état, à ce que le chercheur perçoit.

Linguistiquement parlant, l’enfant est cependant reconnu traverser une phase unique. Les années au
cours desquelles le langage est acquis, marquées par le développement des facultés motrices et
cognitives, donnent lieu à de rapides progrès tant en compréhension qu’en production (Clark, 2009).
Les études sur l’acquisition d’une L2 en bas âge mettent également en évidence la malléabilité
cognitive de l’enfant (De Houwer, 1996). De telles constatations sont d’ailleurs à l’origine de
l’hypothèse de la période critique (critical period hypothesis), formulée par Lenneberg (1967).
Selon cet auteur, la période critique serait caractérisée par un état de déséquilibre organisationnel
favorisant la plasticité des fonctions cérébrales. Elle commencerait vers l’âge de 2 ans, c’est-à-dire
lors de l’émergence d’une maturité cérébrale suffisante pour produire du langage, et se terminerait à
la puberté, coïncidant avec la latéralisation définitive. Lenneberg (1967 : 376-377) décrit ainsi ce
qui se produirait au terme de la période critique : « [a]t this time, apparently a steady state is
reached, and the cognitive processes are firmly structured, the capacity for primary language
synthesis is lost, and cerebral reorganization of functions is no longer possible ». En conséquence,
l’apprentissage d’une L2 (ou d’une L1 dans les cas où un enfant n’aurait pas acquis de L1 pendant
la période critique) devient plus coûteuse cognitivement, requiert un engagement conscient et est
typiquement caractérisée par la présence d’un accent étranger. Si Lenneberg (1967 : 176) reconnaît

25
que l’acquisition n’est pas impossible au-delà de la puberté, l’hypothèse de la période critique
s’inscrit d’abord et avant tout une perspective développementale, et son applicabilité au contexte
spécifique de l’acquisition d’un R2, un champ d’études relativement récent, demeure imprécisée.

Quelques remarques sur la période critique ponctuent néanmoins certains travaux pionniers sur
l’acquisition d’un R2. Par exemple, Krashen et Seliger (1975) interrogent 214 adultes anglophones
vivant à New York mais n’en étant pas originaires à propos de la manière dont leur prononciation
est perçue lorsqu’ils voyagent en-dehors de la ville. Les participants arrivés enfants (3-9 ans) sont
plus nombreux à être perçus comme new-yorkais que les participants arrivés adolescents
(10-15 ans), qui sont eux-mêmes plus nombreux à être perçus comme new-yorkais que ceux arrivés
après l’âge de 15 ans. Krashen et Seliger (1975 : 28) considèrent que leurs résultats valident la
pertinence de l’hypothèse de la période critique en situation d’acquisition d’un R2, bien que certains
de leurs participants arrivés à l’âge adulte soient perçus comme new-yorkais (15/80), que plusieurs
participants arrivés enfants ne soient pas perçus comme new-yorkais (27/67), et que la méthode
d’enquête utilisée ne permette pas de vérifier empiriquement les impressions des répondants.

Payne (1980) postule quant à elle que l’âge de 8 ans constitue un point de rupture en ce qui a trait à
la capacité d’acquisition d’un R2. L’auteure observe effectivement que les enfants arrivés à King of
Prussia au-delà de cet âge présentent une acquisition de l’anglais philadelphien moins importante
que les plus jeunes. Cette hypothèse est appuyée notamment par l’étude de Sibata (1958)9, rapportée
par Chambers (1992 : 689) :

In 1949, about 500 children were still left in Shirakawa city who were displaced directly from
Tokyo and Yokohama to avoid bombardment. We interviewed every child and found that
children who came there before six or seven years of age had adopted Shirakawa dialect almost
perfectly in the course of five or six years, while those who came at the age of 14 or more were
not affected at all by that dialect.

Ainsi, en plus d’un point de rupture après l’âge de 7 ans, Sibata (1958) observe une absence totale
d’acquisition du R2 chez les locuteurs arrivés à Shirakawa après l’âge de 13 ans.

Au vu des remarques formulées dans ces quelques études fondatrices, on peut s’interroger sur la
capacité des locuteurs ayant dépassé la période critique à s’adapter phonétiquement à un R2. Alors
que les propos de Sibata (1958) suggèrent une remarquable stabilité des usages après la puberté, les
tendances rapportées par Krashen et Seliger (1975), de même que les résultats de Payne (1980),

9
L’étude de Sibata (1958) est disponible en japonais seulement, cet extrait ayant été traduit pour Chambers
(1992 : 689, note 7) personnellement. Au même titre que Kobayashi (1981), l’objet d’étude de Sibata (1958)
est l’accentuation lexicale dans différents régiolectes du japonais.

26
offrent une perspective plus nuancée, en ce que leurs participants plus âgés semblent faire preuve
d’une capacité certes moins importante, mais non nulle, à acquérir de nouveaux usages phonétiques.

2.2 Le changement phonétique à l’âge adulte


Il est admis que certains niveaux linguistiques, en particulier le lexique (Kerswill, 1996 : 179),
échappent à l’idée de stabilité du système à l’âge adulte. Cette hypothèse est en revanche au cœur
de certains secteurs de recherche, en particulier la dialectologie et la sociolinguistique
variationniste, dont certains des principes fondamentaux reposent précisément sur l’idée de fixité du
système adulte. Dans la première discipline, le locuteur-type, en plus d’être sédentaire, est âgé : on
postule ainsi qu’il est le gardien d’un état de langue antérieur (Chambers et Trudgill, 1998 : 30), car
il a conservé les usages qui avaient cours dans sa communauté d’origine à l’époque où son système
s’est stabilisé (Poplack et St-Amand, 2009). En sociolinguistique, le concept de temps apparent
(Bailey, 2002; Labov, 1976 : 234) repose entièrement sur l’hypothèse selon laquelle un locuteur ne
change pas ses usages en cours de vie (Eckert, 1997 : 151). Comme le font toutefois remarquer
Gerstenberg et Voeste (2015 : 4), les locuteurs âgés d’environ 20 à 60 ans sont paradoxalement les
plus représentés, et de loin, dans les études statiques, alors que la dynamique de leurs usages au
cours de ce « plateau » délimité par l’acquisition et le potentiel déclin des fonctions langagières est
peu connue. Ainsi, en cherchant notamment à pallier cette lacune, mais aussi à mettre à l’épreuve le
principe de temps apparent, certains auteurs ont récemment proposé des résultats empiriques
appelant à nuancer l’idée de stabilité de la prononciation des locuteurs à l’âge adulte.

À ce chapitre, soulignons le rôle fondamental du corpus Sankoff-Cedergren et de ses suivis de 1984


et de 1995 (Sankoff et Cedergren, 1971; Thibault et Vincent, 1990; Vincent et coll., 1995; Sankoff,
2018a), réputés constituer la première base de données longitudinales s’inscrivant dans le
paradigme variationniste (Buchstaller et Wagner, 2018 : 8). Le corpus original, récolté en 1971, est
composé de la parole de 120 locuteurs francophones montréalais stratifiés en fonction de l’âge, du
sexe et de la classe socio-économique. À la base, le but poursuivi par les chercheurs était
d’appliquer la méthodologie mise au point par Labov (2006 [1966]) en contexte francophone, et
non d’entreprendre une étude longitudinale (Sankoff, 2018a : 21). Pourtant, 13 ans plus tard, une
équipe de recherche renouvelée s’est chargée de recontacter les participants et est ainsi parvenue à
en réenregistrer 60, auxquels se sont ajoutés 12 nouveaux (Thibault et Vincent, 1990). Puis, en
1995, ce sont 12 participants interrogés en 1971 et 1984, ainsi que deux s’étant ajoutés en 1984, qui
ont pu être enregistrés par une équipe de recherche encore renouvelée (Vincent et coll., 1995). Les
suivis longitudinaux ont entre autres été utilisés pour documenter les usages individuels lorsqu’un
changement phonétique se produit à l’échelle de la communauté.

27
En particulier, Sankoff et Blondeau (2007) se sont intéressées à la trajectoire individuelle, entre
1971 et 1984, de 32 locuteurs tous âgés d’au moins 15 ans lors du premier enregistrement. Les
auteures ont choisi de se concentrer sur la variable /r/, puisqu’à l’époque de la constitution du
corpus, la variante apicale [r] de l’Ouest du Québec cédait progressivement la place aux variantes
dorsales [ʁ]/[ʀ] de l’Est. En moyenne, 115 occurrences par locuteur ont été analysées auditivement
par deux expérimentateurs, menant à un pourcentage d’utilisation des variantes apicales et dorsales
pour chacun des 32 locuteurs, aux deux époques mentionnées. Les résultats indiquent que dans
l’ensemble, l’utilisation des /r/ dorsaux augmente d’environ 12 % entre 1971 et 1984. Sankoff et
Blondeau (2007 : 571) mentionnent que les 16 locuteurs les plus âgés (38-69 ans en 1984)
présentent une augmentation de près de 10 %, un résultat selon elles surprenant étant donnée l’idée
généralement admise de stabilité du système linguistique à l’âge adulte. Les auteures soulignent
néanmoins l’importante variabilité des trajectoires individuelles, certains locuteurs apparaissant plus
stables que d’autres. Quoi qu’il en soit, à une exception près, tous les locuteurs pour lesquels un
changement est observé produisent davantage de variantes dorsales en 1984, une évolution
congruente avec celle ayant cours dans la communauté.

Sankoff et Blondeau (2013) examinent de plus près le patron de production de /r/ de deux locuteurs
enregistrés en 1971, 1984 et 1995. La première participante, Lysiane, était une utilisatrice quasi-
catégorique de la variante apicale [r] en 1971. Alors qu’elle appartenait à cette époque à la classe
ouvrière, elle a connu au cours des ans une importante ascension sociale, accompagnée d’un
glissement progressif vers une utilisation majoritaire des variantes dorsales. André, l’autre locuteur,
également issu de la classe ouvrière, montre davantage de stabilité au cours du temps, mais moins
de catégoricité : à chaque temps de mesure, il alterne entre les deux formes dans des proportions à
peu près égales. Sankoff et Blondeau (2013 : 257-258) expliquent qu’adulte, André a reçu un
enseignement explicite à l’école de théâtre visant à lui faire adopter un « français international » qui
exclut [r]. Il est ainsi pleinement conscient de la variation et apte à manipuler ses productions de
manière à créer un effet stylistique, opposant par exemple le français parlé au théâtre à celui de tous
les jours à l’aide d’un ensemble de variables incluant /r/. Lysiane, en revanche, apparaît peu
sensible au contexte et semble avoir modifié son système pour de bon.

Utilisant le même corpus, MacKenzie et Sankoff (2010) effectuent l’analyse acoustique de voyelles
orales produites par 18 locuteurs, dont 6 enregistrés en 1971 et 1984, dans le cadre d’une étude
visant à quantifier un potentiel déclin de la diphtongaison dans les usages montréalais (voir
également Yaeger-Dror, 1994). Plus précisément, les deux premiers formants de cinq occurrences
des voyelles /i y u ɛ œ ɔ ɑ/ devant /ʁ/, et /o/ en syllabe fermée, ont été mesurés dans le noyau et

28
l’appendice. Les productions des 12 locuteurs enregistrés à une seule reprise ont permis de constater
une réduction de la distance entre l’appendice et le noyau dans l’espace F1/F2 entre 1971 et 1984. Le
volet longitudinal de l’expérience a révélé que : les 6 locuteurs présentaient au moins une différence
significative d’un enregistrement à l’autre; 5 avaient modifié au moins une voyelle dans le sens du
changement en cours dans la communauté; 5 avaient modifié au moins une voyelle différemment du
changement en cours; 5 étaient demeurés stables pour au moins une voyelle. MacKenzie et Sankoff
(2010) en concluent que le système phonétique d’un individu ne se cristallise pas nécessairement
après la puberté, bien que sa participation aux changements en cours apparaisse imprévisible.

Nahkola et Saanilahti (2004) enregistrent en 1986 et 1996 24 locuteurs du finnois originaires de la


municipalité de Virrat (sud de la Finlande). Quatorze variables morpho-phonologiques sont
analysées auditivement et catégorisées de manière binaire, avec l’objectif de vérifier les trajectoires
individuelles en contexte de changement en cours. En moyenne, toutes les variables présentent un
changement de 1986 à 1996, dont 11 dans le sens de celui ayant cours dans la communauté.
Examinant les 326 taux d’utilisation individuels à chaque expérimentation (14 variables ×
24 locuteurs10), Nahkola et Saanilahti (2004) ciblent ceux pour lesquels un changement de 10 % ou
plus est observé entre 1986 et 1996, c’est-à-dire des variables pour lesquelles l’alternance
individuelle entre les deux variantes a été modifiée à hauteur de 20 % ou plus. De tels changements
sont observés dans 38,7 % des cas (126/326), une proportion considérée particulièrement élevée par
les chercheurs, qui mentionnent néanmoins avoir sélectionné ce taux de manière arbitraire. Enfin,
les participants âgés de 14 à 25 ans en 1986 présentent davantage de changements que ceux âgés de
54 à 65 ans, une tendance attendue en regard de la littérature antérieure. En revanche, ceux âgés de
32 à 43 ans offrent un portrait similaire au groupe des 14-25 ans, amenant les chercheurs à suggérer
que des changements importants sont encore possibles vers le milieu de l’âge adulte.

Bowie (2005, 2015) exploite quant à lui les archives de discours prononcés par des prédicateurs
mormons de l’Utah à l’occasion de rassemblements religieux semi-annuels. Un tel corpus récolté à
des fins non linguistiques peut certes présenter des défis techniques lors de l’analyse, mais il
possède l’avantage de rassembler de nombreux enregistrements des mêmes locuteurs au cours de
leur vie, s’exprimant sur des sujets similaires, dans un contexte identique, et sans la présence d’un
expérimentateur ou d’un interlocuteur immédiat. Dans sa première étude, Bowie (2005) sélectionne
cinq locuteurs enregistrés en 1940 et 1960 (3), 1960 et 1980 (1), et 1940, 1960 et 1980 (1). Évaluant
acoustiquement et auditivement 13 variables vocaliques, il constate que 10 d’entre elles sont

10
En réalité, le résultat de cette multiplication est 336 et non 326, mais Nahkola et Saanilahti (2004) ne
justifient pas la différence.

29
demeurées stables au cours du temps chez tous les locuteurs, que 3 tendent à changer chez au moins
deux locuteurs, et qu’aucun locuteur n’exhibe une complète stabilité. Deux de ces trois variables
sont en cours de changement dans la communauté, mais comme le phonétisme de l’anglais parlé en
Utah n’était que partiellement documenté au moment de l’étude, Bowie (2005) ne peut se prononcer
quant à la troisième. Le locuteur dont trois extraits ont été utilisés présente un intérêt particulier,
révélant, d’une part, que certains changements ne sont pas parfaitement graduels (par exemple,
changement important de 1940 à 1960, puis stabilité de 1960 à 1980), et d’autre part, qu’ils ne sont
pas nécessairement irréversibles. En effet, pour l’une des variables étudiées, le locuteur affiche un
changement important de 1940 à 1960, puis un retour à ses usages originaux en 1980.

C’est notamment ce qui amène Bowie (2015) à étendre son analyse à 12 prédicateurs du corpus et à
exploiter de 5 à 10 enregistrements de chacun (de 1940 à 2010, à intervalles de 5 ans). Dans cette
seconde étude, l’auteur analyse auditivement la variable (wh) à l’initiale, qui peut être produite [hw]
ou [w], menant à une homophonie entre des mots comme which et witch si [h] est omis. La variante
[hw] est considérée plus conservatrice, ayant pratiquement disparu de l’anglais américain, à
l’exception de quelques poches de résistance notamment en Utah. Bowie (2015) constate dans un
premier temps que plus l’année d’enregistrement de l’extrait s’approche de 2010, moins la variante
[hw] est présente, confirmant qu’un changement est en cours. Sur les 12 locuteurs analysés,
7 présentent au moins une divergence significative par rapport à leurs autres enregistrements.
Conformément aux observations préliminaires de l’étude de 2005, aucun patron de variation ne
s’avère complètement graduel et unidirectionnel. Bowie (2015 : 56) estime ainsi que l’instabilité qui
caractérise une communauté linguistique en contexte de changement se reflète dans le système du
locuteur adulte, dont les usages sont appelés à fluctuer de manière parfois importante, contrairement
à certaines hypothèses antérieures.

Harrington et coll. (2000, et seq.11) procèdent à l’analyse acoustique de voyelles produites par la
Reine d’Angleterre dans le cadre de son discours de Noël annuel. Ce corpus présente des avantages
semblables à celui exploité par Bowie (2005, 2015), c’est-à-dire qu’il est composé de la parole
d’une même locutrice, s’exprimant selon la même modalité de parole, dans les mêmes conditions
d’enregistrement, et ce, à chaque année depuis 1952. Par ailleurs, les auteurs mentionnent qu’il
existe en Angleterre la Queen’s English Society, groupe chargé de défendre et de promouvoir la

11
Une série d’études sur les voyelles de la Reine produites lors de son discours de Noël annuel a été réalisée
par Jonathan Harrington et ses collaborateurs. Nous en rapportons une seule ici, mais l’idée générale se
maintient dans les travaux subséquents. Par ailleurs, précisons que Reubold et Harrington (2018) se sont
assurés que les changements observés dans les voyelles de la Reine n’étaient pas la stricte conséquence de
changements physiologiques liés à l’avancement en âge.

30
« pureté » de l’anglais parlé par la Reine. Harrington et coll. (2000 : 65) supposent qu’en tant que
locutrice par excellence d’un anglais tenu en si haute estime, la Reine peut être considérée comme
peu propice au changement linguistique. Si tel était néanmoins le cas, il s’agirait d’un appui
supplémentaire aux études rapportées précédemment, selon lesquelles le système phonétique du
locuteur adulte moyen est susceptible de changer au cours de sa vie.

Harrington et coll. (2000) se concentrent sur des monophtongues accentuées récoltées lors de neuf
discours de Noël, répartis selon trois époques : les années 50 (discours de 1952, 1954 et 1957), les
années 60 (1967, 1968 et 1972) et les années 80 (1983, 1985 et 1988). La parole de cinq lectrices de
bulletins de nouvelles de la BBC a également été retenue à des fins comparatives. La fréquence des
deux premiers formants des voyelles a été relevée lors de l’atteinte de la valeur maximale de F1 pour
les voyelles ouvertes et de la valeur maximale/minimale de F2 pour les voyelles
antérieures/postérieures (en l’absence de changements spectraux suffisants pour localiser de telles
valeurs maximales et minimales, les mesures étaient prises lors du pic d’intensité, et en l’absence de
pic d’intensité, à 50 % de la durée). Les résultats font montre de changements relativement
importants dans les productions de la Reine, en particulier entre les années 50 et 60, alors que le
passage des années 60 à 80 laisse entrevoir davantage de stabilité. Des diagrammes biformantiques
permettent d’observer que de manière générale, les catégories vocaliques à l’étude tendent à se
distancer sur l’axe F1 (expansion verticale) et à se resserrer sur l’axe F2 (compression horizontale).
Le système vocalique de la Reine se rapproche ainsi progressivement de celui des lectrices de
bulletins de nouvelles de la BBC. Les auteurs pensent que ce phénomène peut être en partie
attribuable à un changement d’attitude envers la received pronunciation (RP) ayant eu lieu en
Angleterre au cours du XXe siècle, le statut de la RP passant de prestigieux à posh. Tout comme ce
changement de statut a affecté le système vocalique de locuteurs adultes non royaux, tel que
documenté par Bauer (1985), il semble avoir eu un effet sur celui de la Reine, en dépit de
l’existence de la Queen’s English Society. Harrington et coll. (2000 : 75) mettent en garde contre le
fait que l’influence des changements en cours dans la communauté sur le système vocalique de
l’adulte pourrait avoir été sous-estimée dans les études utilisant le concept de temps apparent et que
certains résultats pourraient s’en trouver faussés.

Pour résumer, les études présentées jusqu’ici cherchaient à vérifier si la prononciation de locuteurs
adultes demeurait stable en dépit des bouleversements linguistiques ayant cours dans leur
communauté. Pour ce faire, un volet longitudinal a été inclus aux canevas méthodologiques,
l’empan de vie couvert allant de 10 (Nahkola et Saanilahti, 2004) à 45 ans (Bowie, 2015). Bien
qu’aucun auteur cité n’ait observé une stabilité complète chez les locuteurs testés, tous ont été

31
confrontés à l’hétérogénéité des trajectoires. Sankoff et Blondeau (2007, 2013) et MacKenzie et
Sankoff (2010) repèrent des changements individuels congruents avec ceux en cours en français
montréalais entre 1971 et 1984, mais également des cas de stabilité et de modifications inattendues.
En examinant les usages de locuteurs à plus de deux époques, Bowie (2005, 2015) constate que les
changements ne sont pas nécessairement unidirectionnels, ni toujours graduels, ce que notent
également Harrington et coll. (2000), la Reine présentant des changements plus substantiels dans les
années 50-60 que subséquemment. Bowie (2015) émet l’hypothèse que les fluctuations observées
chez l’individu sont le reflet de celles qui caractérisent une communauté en cours de changement
linguistique. Sankoff et Blondeau (2013) ajoutent la possibilité d’alternance stylistique induite par
une conscience exacerbée de la variation phonétique. Nahkola et Saanilahti (2004) signalent pour
leur part que des modifications relativement importantes peuvent encore avoir lieu au milieu de
l’âge adulte, dans ce cas précis au cours de la décennie suivant une première expérimentation où les
participants étaient âgés de 32 à 43 ans. Pour l’ensemble de ces auteurs, les résultats d’études
fondées sur le principe de temps apparent (Bailey, 2002; Labov, 1976) ne sont pas à rejeter en bloc,
mais à interpréter avec prudence, et idéalement à complémenter avec un suivi en temps réel
(Sankoff, 2018a : 43).

La capacité à préserver quelque flexibilité linguistique à l’âge adulte apparaît d’emblée cruciale
dans certains cas extrêmes, par exemple un réfugié qui devrait apprendre rapidement une nouvelle
langue pour assurer sa subsistance. Hernández et Maldonado (2012 : 47) rapportent également le
cas de migrants salvadoriens transitant illégalement par le Mexique en direction des États-Unis, qui
pour éviter la déportation, usent de toutes les stratégies possibles pour paraître mexicains, y compris
l’adoption rapide de variantes de prononciation mexicaines. Pour illustrer l’utilité de la flexibilité
linguistique même chez le locuteur adulte qui ne vivrait pas de bouleversement aussi exceptionnel,
Sankoff (2018b : 299, note 3) cite un extrait d’entrevue avec l’écrivain Mohsin Hamid, qui établit
un parallèle entre l’avancée en âge et les migrations : « Every human being migrates through time.
The place we grew up in, in our childhood, is gone when we’re in our fifties and sixties and
seventies. You can live in the same city your entire life and still be a foreigner when you step out, in
your old age, onto the street ». Le maintien de la plasticité permettrait ainsi au locuteur de s’adapter
aux changements dans son environnement linguistique, mais ne constituerait pas pour autant un
« mécanisme de survie » permettant d’éviter de devenir étranger chez soi; Sankoff (2018b) postule
au contraire que c’est la pression sociale subie par le locuteur confronté à un environnement
changeant qui contrebalancerait la tendance naturelle au déclin de sa plasticité. Puisque la mobilité

32
géographique résulterait en une pression sociale semblable à celle d’un changement en cours dans la
communauté, elle pourrait dès lors contribuer à entretenir la plasticité linguistique de l’adulte.

De récentes études longitudinales sur la parole d’adultes mobiles semblent aller en ce sens. Par
exemple, Kwon (2018) s’intéresse aux changements phonétiques chez Noam Chomsky, né en 1928
à Philadelphie et installé à Boston en 1955, à l’âge de 27 ans. Si Chomsky est un locuteur natif de
l’anglais américain, ses parents ont le yiddish comme langue maternelle et ne sont pas originaires de
Philadelphie. Kwon (2018) exploite deux enregistrements d’allocutions publiques de Chomsky, l’un
datant de 1970 et l’autre de 2009, soit 15 et 54 ans après son arrivée à Boston. Trois variables sont
ciblées : la fusion de /ɑ/ et /ɔ/ (caught-cot), présente à Boston et non à Philadelphie; la distribution
complexe du « short-a », dont les réalisations phonétiques diffèrent entre les deux villes; la voyelle
postérieure avec appendice fermant /o/, dont le noyau est très antériorisé à Philadelphie. À l’aide
d’une analyse acoustique de la fréquence des deux premiers formants de 2290 voyelles, l’auteure
observe dans un premier temps que le /ɑ/ s’est nettement rapproché du /ɔ/ de 1970 à 2009, bien que
les deux catégories vocaliques demeurent statistiquement distinctes, suggérant un changement
phonétique mais non une réorganisation phonologique. En 2009, la distribution du « short-a »
correspond davantage, quoique partiellement, au système bostonien. En 1970 toutefois, les
productions de Chomsky ne correspondent au système d’aucune des deux villes. Suivant Payne
(1980), Kwon (2018 : 287) émet l’hypothèse que le locuteur n’a jamais maîtrisé le système
philadelphien puisque ses parents n’en étaient pas originaires, et que son acquisition tardive du
système bostonien, même partielle, témoigne d’une remarquable flexibilité phonologique. Enfin, /o/
demeure stable au cours du temps, mais s’avère dès 1970 plus similaire à la variante de Boston qu’à
celle de Philadelphie. Les trois variables étudiées témoignent ainsi d’une tendance à s’aligner sur le
phonétisme en usage à Boston : rapprochement phonétique de voyelles fusionnées dans cette ville;
adoption partielle du système bostonien du « short-a »; maintien d’un /o/ déjà similaire à celui des
locuteurs de Boston. Concernant l’acquisition d’un R2 à l’âge adulte, Kwon (2018 : 287-288) émet
la remarque suivante : « adult speakers are capable of making significant qualitative and
quantitative changes to their phonological systems, but they certainly have sizeable obstacles in
mastering second-dialect features ».

Reubold et Harrington (2015, 2018) effectuent une étude longitudinale des voyelles produites par le
journaliste et animateur de radio Alistair Cooke, né en 1908 près de Manchester, dans le nord de
l’Angleterre, et installé aux États-Unis en 1937. Correspondant pour la BBC, Cooke anime alors
une émission radiophonique hebdomadaire de 15 minutes destinée à un auditoire britannique et
portant sur des thèmes culturels, sociaux et politiques américains. Éventuellement baptisée Letter

33
from America, l’émission est animée par Cooke jusqu’en février 2004, soit un mois avant son décès,
et est à ce jour considérée comme l’émission radiodiffusée sur la plus longue période de temps.
Parmi cet abondant matériel produit par un même locuteur, dans le même contexte et sur des sujets
comparables, Reubold et Harrington (2015) sélectionnent une émission par décennie à partir des
années 1950, soit des enregistrements effectués en 1951, 1960, 1970, 1981, 1993 et 2004 (de l’âge
de 42 à 95 ans). Reubold et Harrington (2018) ajoutent à ce corpus une entrevue réalisée en 1934,
alors que le locuteur, âgé de 25 ans, ne vivait pas encore aux États-Unis, ainsi que 14 émissions de
Letter from America diffusées de 1975 à 1977. La fréquence des deux premiers formants a été
mesurée au centre de voyelles monophtonguées accentuées appartenant à 13 catégories. Dix de ces
catégories varient en termes de timbre, de durée ou de rhoticité entre l’anglais américain et la RP,
soit les voyelles de BATH, DRESS, FLEECE, FORCE, GOOSE, LOT, NORTH, NURSE, START et THOUGHT.
Les voyelles de KIT, STRUT et TRAP sont en revanche réputées identiques dans les deux régiolectes.

L’examen de l’entrevue de 1934 confirme qu’avant son arrivée aux États-Unis, Alistair Cooke parle
un anglais pouvant être catégorisé comme RP. Reubold et Harrington (2018) pensent qu’il s’agit
déjà du second lecte du locuteur, adopté à partir de l’âge de 12-13 ans, lorsqu’il quitte le nord de
l’Angleterre pour étudier à Cambridge. De 1981 à 2004, les voyelles du locuteur sont également
perçues comme similaires à la RP. Cependant, de 1951 à 1970, le timbre des voyelles de BATH,
DRESS, LOT et THOUGHT est caractéristique de l’anglais américain. En comparant, dans l’espace
acoustique, les fréquences formantiques de ces voyelles à celles de voyelles d’ancrage, demeurées
stables au cours du temps, les auteurs confirment que de la période 1951-1970 à la période 1981-
2004, les productions de Cooke passent progressivement de l’anglais américain à la RP pour DRESS,
LOT et THOUGHT. Pour BATH, le changement est beaucoup plus abrupt : la variante américaine [æ]
produite en 1970 est complètement remplacée par la variante RP [ɑː] en 1981. L’analyse des 14
émissions supplémentaires diffusées de 1975 à 1977 révèle que c’est précisément à cette époque
que le locuteur, alors âgé de 66 à 68 ans, postériorise la voyelle de BATH.

Alistair Cooke aurait donc partiellement acquis l’anglais américain après son arrivée aux États-
Unis, modifiant le timbre de voyelles comme celles de BATH, DRESS, LOT et THOUGHT, mais
conservant néanmoins certains traits de la RP, par exemple la non-rhoticité des voyelles de FORCE,
NORTH, NURSE et START. Vers le milieu des années 1970, la tendance s’inverse, et le locuteur
revient, progressivement ou abruptement, à ses usages pré-émigration. Sachant en outre que Cooke
aurait potentiellement utilisé un autre régiolecte pendant son enfance, sa flexibilité linguistique
apparaît considérable. Quant aux raisons qui pourraient être à l’origine de son volte-face
phonétique, Reubold et Harrington (2015, 2018) expliquent qu’à son arrivée aux États-Unis, le

34
locuteur est très enthousiaste par rapport à son pays d’accueil : il demande rapidement sa
citoyenneté, épouse une Américaine, fonde une famille, parcourt le pays dans le cadre de son
travail. À partir du milieu des années 1970, l’enthousiasme laisse place à la désillusion. Aussi bien
le climat politique aux États-Unis que la constatation qu’il sera toujours un étranger aux yeux des
Américains amènent Cooke à se détacher de son pays d’accueil et, par le fait même, à se retrancher
phonétiquement (Reubold et Harrington, 2015 : 32-33).

En somme, les études citées dans cette section illustrent que les usages phonétiques d’un locuteur
peuvent bel et bien être modifiés passé la période critique, soit sous l’effet de changements en cours
dans la communauté (Sankoff et Blondeau, 2007, 2013; MacKenzie et Sankoff, 2010; Nahkola et
Saanilahti, 2004; Bowie, 2005, 2015; Harrington et coll., 2000), ou encore de la mobilité
géographique (Kwon, 2018; Reubold et Harrington, 2015, 2018), deux contextes que Sankoff
(2018b) juge analogues. Selon l’auteure, les locuteurs confrontés à plusieurs variantes
simultanément en raison d’un changement en cours, et par extension, de la mobilité géographique,
peuvent adopter trois comportements : demeurer tels quels, participer au mouvement, ou encore se
replier vers des formes plus conservatrices, ce qui expliquerait certains cas de divergence ou de
modifications inattendues. Ces trois cas de figure, la remarque de Kwon (2018) concernant les
obstacles à la maîtrise de nouvelles caractéristiques, les motivations derrière le retour aux usages
antérieurs d’Alistair Cooke, ainsi que l’importante hétérogénéité observée par les chercheurs cités
dans cette section laissent présager que tout comme chez l’enfant, le processus d’acquisition d’un
R2 chez l’adulte est susceptible d’être régi par des facteurs internes et externes.

2.3 Des contraintes internes à l’acquisition d’un second régiolecte


Ce qui a certainement rendu célèbre l’étude fondatrice de Payne (1980) est la mise au jour de la
difficulté des enfants à acquérir une règle phonologique complexe sans input parental, même
lorsque ces enfants étaient nés à King of Prussia. En d’autres termes, ce volet de l’étude suggère
que le conditionnement linguistique d’une variante peut régir son acquisition et primer sur des
facteurs d’ordre développemental ou social. Dans cette section, nous rendrons ainsi compte d’un
éventail de points de vue concernant les contraintes internes susceptibles de régir l’acquisition d’un
R2. D’abord, nous rapporterons quelques règles et principes formulés dans la littérature concernant
la propagation du changement en fonction de contraintes propres à chaque système linguistique et
de l’interaction entre les paliers qui le composent. Nous discuterons ensuite brièvement de la notion
de saillance et de son éventuel rôle lors de l’acquisition d’un R2. Nous conclurons cette section en
exposant différentes expériences menées dans le but d’élucider la question du lien entre la
perception et la production chez les acquérants d’un R2.

35
2.3.1 Niveaux, règles et complexité linguistiques
Un système linguistique est défini par Hinskens (1998 : 160) comme étant constitué d’éléments, de
structures et de processus gouvernés par des principes et des contraintes (voir section 1.2.1). Tout
système linguistique comprend des éléments, structures et processus qui ne varient pas, et d’autres
qui varient. Selon l’auteur, la proportion de phénomènes variables augmente à mesure qu’on
s’approche de la périphérie du système, la phonétique étant considérée périphérique dans la suite
syntaxe < morphologie < phonologie < phonétique. Ainsi, quel que soit le système auquel un
locuteur est exposé, les différents niveaux linguistiques sont appelés à varier de manière plus ou
moins importante, aussi l’ampleur de l’adaptation nécessaire, de même que les difficultés éprouvées
par le locuteur pour y arriver, peuvent varier d’un niveau à l’autre. Selon Rys et coll. (2017 : 270),
les mécanismes d’acquisition de la variation aux différents niveaux d’un système linguistique sont
un volet de l’adoption d’un R2 peu représenté dans la littérature, la référence la plus influente à ce
sujet demeurant l’article fondateur de Chambers (1992).

À partir d’un examen auditif des usages de six Canadiens anglophones âgés de 9 à 17 ans installés
au Royaume-Uni et d’une revue d’écrits en lien avec le sujet, Chambers (1992) établit huit grands
principes formalisant les principales contraintes linguistiques susceptibles d’influencer l’acquisition
d’un R2. Bien que ces principes reposent en grande partie sur l’observation d’un nombre limité de
locuteurs n’ayant pas atteint l’âge adulte, leur portée se veut plus vaste et Chambers (1992 : 676-
677) appelle à leur mise à l’épreuve.

Principe 1 : les substitutions lexicales surviennent plus rapidement que l’acquisition de


variantes phonétiques et phonologiques.
Principe 2 : les substitutions lexicales surviennent rapidement dans les premiers stades de
l’acquisition, puis perdent en vitesse.
Principe 3 : les règles phonologiques simples sont plus rapidement assimilées que les règles
phonologiques complexes.
Principe 4 : l’acquisition de règles phonologiques complexes et de scissions phonémiques divise
les locuteurs entre acquérants hâtifs et tardifs.
Principe 5 : dans les premiers stades de l’acquisition, il résulte de l’apprentissage de règles
simples comme complexes de la variabilité intra-individuelle.
Principe 6 : les innovations phonologiques s’amorcent au terme d’une phase de diffusion
lexicale.
Principe 7 : la suppression d’anciennes règles se produit plus rapidement que l’acquisition de
nouvelles règles.
Principe 8 : les variantes orthographiquement transparentes sont acquises plus rapidement que
les variantes orthographiquement opaques.

36
Concernant les Principes 1 et 2, Chambers (1992) explique qu’un certain nombre de substitutions
lexicales sont parfois nécessaires pour assurer une bonne transmission du message, mais qu’une fois
ces changements initiaux effectifs, les substitutions moins essentielles s’opéreront plus
graduellement. Pour ce qui est du Principe 3, appuyé notamment par les travaux de Payne (1980),
Chambers (1992) précise que la complexité d’une règle phonologique est évidemment relative.
Néanmoins, ce que l’auteur cherche à faire valoir est que lors du passage du R1 au R2, si une
simple substitution phonétique est nécessaire, elle sera assimilée rapidement. Si au contraire, pour
un phonème unique dans le R1, le R2 en possède deux ou plus et que leur apparition est lexicalisée
ou conditionnée par un environnement phonémique précis, cette règle sera acquise plus
difficilement. Elle pourrait éventuellement ne jamais être tout à fait maîtrisée si les locuteurs
arrivent dans leur communauté d’accueil à un âge avancé (Principe 4), mais quels que soient l’âge
des apprenants et la complexité de la règle, les premiers stades de l’acquisition seront caractérisés
par une importante variabilité intra-individuelle, les anciennes et les nouvelles formes cohabitant un
certain temps (Principe 5). Chambers (1992 : 693) postule également au Principe 6 que les
nouvelles formes sont d’abord intégrées de manière ponctuelle, lexicale, et que leur systématisation
ne survient qu’au bout d’une exposition substantielle. Le Principe 7 complémente le Principe 3, en
ce que l’auteur y propose que si une scission phonémique est difficile à acquérir, une fusion est
assimilée plus facilement. En d’autres termes, l’acquisition est plus aisée si elle entraîne une
simplification. Le Principe 8 présuppose la scolarisation des acquérants et énonce que les variantes
orthographiquement justifiées sont davantage adoptées que celles qui ne le sont pas. Par exemple,
des anglophones nord-américains acquérant l’anglais britannique remplacent plus rapidement la
variante battue [ɾ] par les occlusives [t] et [d] dans des mots comme putting et pudding qu’ils ne se
conforment à la non-rhoticité, qui n’est pas appuyée orthographiquement. Chambers (1992 : 701)
reconnaît que le Principe 8 constitue une légère entorse au principe uniformitariste12 de Labov
(1976 : 371), la littératie de masse étant relativement récente. Bien entendu, ces huit principes ne
sont en aucun cas mutuellement exclusifs, et dans la pratique, l’acquisition se présente comme un
enchevêtrement complexe de plusieurs d’entre eux (Tagliamonte et Molfenter, 2007 : 656).

Une étude récente qui permet d’éprouver certains des principes de Chambers (1992) est celle de
Kwon (2018), citée dans la section 2.2, sur la parole de Noam Chomsky. Rappelons que celui-ci,
arrivé à Boston à l’âge adulte, ne maîtrise que partiellement la règle complexe du « short-a », ce qui
tend à confirmer le Principe 4. Le rapprochement phonétique des voyelles /ɑ/ et /ɔ/, sans que la

12
« Nous posons que les forces aujourd’hui à l’œuvre pour produire le changement linguistique sont du même
type et du même ordre de grandeur que celles qui ont agi au cours des cinq ou dix mille ans écoulés » (Labov,
1976 : 371), principe s’inspirant de la géologie.

37
fusion ne soit néanmoins effective, fournit un appui au Principe 3 mais laisse planer un doute quant
au Principe 7. En effet, le locuteur a été en mesure de procéder à un changement phonétique assez
simple, mais la perte du contraste phonémique présent dans son R1 n’est pas arrivée à complétion.
La suppression de la règle originale n’a donc pas eu lieu, tandis que de nouvelles règles, soit celles
qui régissent le « short-a », ont au moins partiellement été intégrées par le locuteur.

Rys et coll. (2017) s’interrogent pour leur part sur le Principe 6, qui s’inscrit directement dans le
cadre de la théorie de la diffusion lexicale. Hinskens (1998 : 164) décrit le postulat principal de
cette théorie en ces termes :

The lexical diffusion of a sound change typically starts slowly; the speed with which items
surrender is initially low. After a while, the change gains momentum and the number of items
that fall prey to the change in a given amount of time increases, but before the change reaches
saturation, it slows down again. Some changes slow down so much that they never reach
completion […]

Il résulte d’ordinaire de cette diffusion en trois phases un patron de changement curvilinéaire


(s-curve). La diffusion lexicale est souvent mise en parallèle avec la diffusion dite
néogrammairienne, soit la progression par règles, régulière et sans exceptions. Selon Hinskens
(1998 : 161), l’opposition entre les deux repose essentiellement sur le fait que la diffusion lexicale
est phonétiquement abrupte et lexicalement graduelle, tandis que la diffusion néogrammairienne est
phonétiquement graduelle et lexicalement abrupte. La diffusion lexicale est également à différencier
de la lexicalisation, définie comme la fin de la productivité d’un changement, les items concernés
constituant les reliques d’une règle ou d’un changement anciens, sans lien synchronique apparent
entre eux (Hinskens, 1998 : 164).

Le Principe 6 repose sur l’observation récurrente d’un patron curvilinéaire chez les témoins de
Chambers (1992). Plus précisément, l’auteur propose que pour les premiers 20 % des items lexicaux
concernés par une différence phonologique, l’acquisition est lente et au mot à mot. Au terme de
cette première phase, l’exposition est suffisante pour que le locuteur crée une règle13 dont
l’application est rapide et fait bondir à 80 % la proportion d’items lexicaux modifiés. La phase
d’acquisition des 20 % finaux est marquée par un retour à l’acquisition lente et au mot à mot. Les
participants de Chambers (1992) se situent ainsi soit dans les premiers 20 %, soit dans les derniers
20 %, mais pas entre les deux, la phase centrale étant tellement rapide que l’auteur n’a pas été en
mesure de la croquer sur le vif.

13
La théorie de la diffusion lexicale telle que décrite par Hinskens (1998) n’implique pas nécessairement que
l’accélération de l’acquisition pendant la phase centrale soit attribuable à la formation d’une règle.

38
Rys et coll. (2017) choisissent de tester le Principe 6 à l’aide d’un corpus récolté auprès de 40
locuteurs belges âgés de 9, 12 et 15 ans, dont le R1 est le néerlandais standard et le R2, le régiolecte
flamand de Maldegem, considéré non standard. Les auteurs sélectionnent 18 variables
phonologiques présentant une différence entre le R1 et le R2, 9 d’entre elles étant
phonologiquement conditionnées et considérées comme des règles complexes, les 9 autres étant
lexicalement conditionnées, donc imprévisibles. En plus de calculer le taux d’utilisation effectif des
variantes du R2 par les participants, Rys et coll. (2017 : 275) exploitent le programme TiMBL
(Tilburg Memory-Based Learner) pour simuler l’acquisition du R2. TiMBL repose sur
l’apprentissage automatique de type « paresseux » (lazy), par opposition au type « avide » (eager).
L’apprentissage avide consiste à soumettre à un programme informatique un corpus, à partir duquel
des règles sont formées. Le programme doit ensuite faire des prédictions par rapport aux nouvelles
unités lexicales seulement à partir de ces règles, le corpus d’entraînement n’étant plus accessible. Le
type paresseux fonctionne également à partir d’un corpus, mais le conserve en mémoire et ne
formule pas de règle, ainsi les prédictions par rapport aux nouvelles unités lexicales reposent sur
l’analogie, c’est-à-dire sur la comparaison entre la nouvelle entrée et les unités contenues dans le
corpus. TiMBL simule ainsi l’acquisition au mot à mot plutôt que par règles.

Un patron curvilinéaire n’est observé pour aucune des 18 variables considérées par Rys et coll.
(2017), les acquérants occupant largement les 60 % centraux. Quant aux résultats obtenus par
simulation, de manière générale, plus il y a d’items analogues disponibles pour la comparaison,
meilleure est la prédiction de TiMBL. La présence importante d’items analogues peut être due au
conditionnement phonologique, même complexe, par opposition au conditionnement lexical, au
nombre élevé de mots du lexique (et donc du corpus) affectés par une différence phonologique
donnée, et à la taille du corpus d’entraînement, censé refléter le degré d’exposition aux formes du
R2 au cours du temps. Rys et coll. (2017) en tirent deux conclusions. Premièrement, le Principe 6
de Chambers (1992) n’est que partiellement confirmé, puisque l’acquisition initiale semble bien
progresser par diffusion lexicale, mais rien n’indique que des règles sont formées par la suite, le
patron curvilinéaire n’ayant pas été observé. TiMBL est également parvenu à des prédictions
respectables par seule analogie, sans formuler de règle. Deuxièmement, la régularité et la fréquence
apparaissent primordiales pour l’acquisition d’un R2, du moins en ce qui concerne l’apprentissage
machine (au sujet de la fréquence, voir la section 3.4).

L’importance de ces deux éléments a été mise en évidence antérieurement par Rys et Bonte (2006),
qui utilisent le même corpus dans le but de mettre à l’épreuve un modèle prédictif à principe unique.
Le modèle de correspondance des règles, à l’origine conceptualisé par Auer (1993, cité par Rys et

39
Bonte, 2006 : 204), se résume en ces termes : « The Standard Dutch (SD) sound x is realized as y in
the Maldegem dialect (DIA) ». Dans le cadre de ce modèle, la possibilité de réanalyse de la part du
locuteur est exclue, celui-ci se référant constamment à son R1 afin d’établir des correspondances
qui lui permettent de comprendre et d’acquérir les règles du R2. L’application de ce principe unique
se voit néanmoins complexifiée par l’intervention de quatre facteurs : l’incidence, la fréquence, la
prédictibilité et la régularité. L’incidence correspond au nombre de mots du lexique auxquels
s’applique une règle donnée. Le modèle prédit que plus cet indice est élevé, plus la correspondance
est aisément acquise. La fréquence correspond à la fréquence des mots auxquels s’applique la règle.
Plus ces mots sont fréquents, plus la correspondance est acquise. La prédictibilité renvoie au
nombre de variantes impliquées dans la correspondance. Si une forme du R1 possède plusieurs
formes de correspondance dans le R2, la règle sera difficilement apprise; si une ou plusieurs formes
du R1 possèdent une seule forme de correspondance dans le R2, la règle sera facilement apprise. Le
quatrième et dernier facteur renvoie à la régularité d’une règle par rapport à l’environnement
phonémique. Plus le conditionnement phonémique d’une règle est régulier, plus son acquisition est
aisée.

Parmi ces facteurs, on note que la prédictibilité correspond grosso modo au Principe 7 de Chambers
(1992), qui postule qu’une simplification est plus aisée qu’une complexification. La régularité
renvoie au Principe 3, selon lequel une règle phonologique complexe ou lexicalement conditionnée
pose problème à l’apprenant. La régularité a également permis au programme TiMBL d’effectuer
de meilleures prédictions, de même qu’une incidence élevée, soit un nombre important d’unités du
lexique affectées par le phénomène phonologique (Rys et coll., 2017). Une série de régressions
logistiques montrent que les quatre variables indépendantes permettent de prédire significativement
et positivement l’acquisition du R2. Une régression logistique multiple de type pas à pas (stepwise)
indique toutefois que dans l’ensemble, celle qui prédit le mieux l’acquisition est l’incidence. Ce
résultat présente l’intérêt de ramener à un facteur commun les modèles de diffusion antithétiques
utilisés en 2006 et en 2017, soit un modèle qui fonctionne exclusivement par règle (Rys et Bonte,
2006) et un modèle qui exclut toute règle (Rys et coll., 2017)14.

Vousten et Bongaerts (1995) analysent quant à eux les productions de 76 élèves du secondaire
vivant dans la province néerlandaise de Limburg, où le régiolecte de scolarisation est le néerlandais
standard et celui utilisé entre pairs, le régiolecte de Limburg. L’administration d’un questionnaire
linguistique permet de catégoriser ces locuteurs comme étant « natifs » ou « apprenants » : les 38

14
Cette comparaison n’est pas établie par Rys et coll. (2017) eux-mêmes, qui ne confrontent pas directement
leurs positionnement théorique et résultats à ceux de 2006.

40
natifs rapportent utiliser majoritairement le régiolecte de Limburg, y compris en famille, leurs
parents étant nés dans cette province; les 38 apprenants rapportent utiliser le néerlandais standard à
la maison et ne faire usage du régiolecte de Limburg que lors d’échanges informels avec les pairs.
Vousten et Bongaerts (1995) précisent qu’au moment de leur enquête, le régiolecte de Limburg est
réputé perdre du terrain au profit du néerlandais standard et que les locuteurs natifs les moins âgés,
dont font partie ceux de leur échantillon, n’atteignent pas le même niveau de compétence que leurs
aînés. Par conséquent, les apprenants sont exposés à un système irrégulier.

Examinant deux variables phonologiques et six variables morphologiques, les auteurs observent
chez les natifs un taux d’utilisation des variantes du régiolecte de Limburg quasi-catégorique pour
les deux variables phonologiques (99,6 %), mais beaucoup moins stable pour les variables
morphologiques (de 50 % à 83,7 %). Ces tendances se reflètent chez les apprenants : les variantes
du régiolecte de Limburg sont utilisées dans 60,6 % et 68,4 % des cas pour les variables
phonologiques, et dans 17,1 % à 47,4 % des cas pour les variables morphologiques. Cette étude
souligne à nouveau l’importance de la régularité pour l’acquisition d’un R2. Dans ce cas précis, il
s’agit moins de la régularité du système même (règles plus ou moins complexes) que de la
régularité de l’input dont les apprenants bénéficient. Les résultats de Vousten et Bongaerts (1995)
appuient par ailleurs le Principe 5 de Chambers (1992), qui met de l’avant la variabilité intra-
individuelle caractérisant le processus d’acquisition, indifféremment de la complexité des règles :
les apprenants demeurent éminemment plus variables que les natifs quant à leur utilisation des
variantes du régiolecte de Limburg, y compris pour les deux variables phonologiques, qui admettent
peu d’exceptions chez les natifs (99,6 %).

En lien avec l’âge auquel les locuteurs acquièrent un R2, Kerswill (1996 : 200) propose pour sa part
une hiérarchisation des traits selon leur difficulté d’apprentissage, se fondant notamment sur ses
travaux antérieurs à Bergen (Norvège) et à Milton Keynes (Royaume-Uni). En observant le
Tableau 1, où cette hiérarchie est reproduite, on constate que certaines des propositions de l’auteur
recoupent celles de Chambers (1992). Par exemple, le trait le plus facile à acquérir selon Kerswill
(1996) est l’emprunt lexical (xii), ce qui rejoint le Principe 1; une scission (ii) est acquise plus
difficilement qu’une fusion (viii), et peut l’être avec succès pendant une période plus restreinte de la
vie (Principes 4 et 7). D’autres éléments s’avèrent au contraire inédits, comme l’inclusion de la
dimension prosodique (iv), ou encore la mention d’une probable influence du statut
sociolinguistique des variantes (i et x). Contrairement à ce que Chambers (1992) met de l’avant
avec le Principe 6, Kerswill (1996) n’estime pas que le changement se propage selon un mécanisme
commun à tous les phénomènes. Sa progression dépendrait plutôt de la nature de la variable. Les

41
changements progressant par diffusion lexicale (x) sont par ailleurs considérés plus aisés que ceux
se propageant par diffusion néogrammairienne (ix), pourtant plus régulière, et les variantes
lexicalisées (i) sont considérées comme les plus difficiles de toutes à acquérir.

Tableau 1 : Hiérarchie de l’acquisition des traits d’un R2 en fonction de


leur difficulté d’assimilation. Tableau extrait de Kerswill (1996 : 200)

Les résultats d’une étude de Nielsen (2011) sur la propension de locuteurs anglophones à calquer le
délai d’établissement du voisement (voice onset time ou VOT) de la parole entendue relativisent
l’apparente facilité à acquérir une fusion. Brièvement, précisons que le VOT est un corrélat
acoustique important de la perception du trait de voisement des occlusives (Lisker et Abramson,
1964). En anglais, le VOT est toujours positif, mais court pour les occlusives voisées et long pour
les occlusives non voisées15. Nielsen (2011) manipule des mots commençant par une occlusive non
voisée produits par un locuteur anglophone de manière à allonger leur VOT d’au moins 40 ms et à
le raccourcir d’au moins 40 ms. Deux groupes de participants effectuent ensuite une série de trois
tâches, soit une première lecture de mots, l’écoute de mots (sans répétition), puis une deuxième
lecture de mots. Le groupe de participants dont la phase d’écoute était constituée de mots avec VOT
allongés produit des VOT significativement plus longs à la deuxième qu’à la première lecture. En
revanche, le groupe de participants exposé à des VOT raccourcis ne modifie pas la valeur de ses
VOT lors de la seconde lecture. Nielsen (2011) attribue ces résultats au fait qu’en anglais, allonger

15
Du moins sous sa forme canonique; il peut parfois varier en fonction du locuteur ou du régiolecte (Lisker et
Abramson, 1964; Docherty et coll., 2011).

42
le VOT d’occlusives sourdes est « sans conséquences », alors que le raccourcir peut nuire au
contraste phonémique, la différence entre des mots comme pear et bear reposant en grande partie
sur la valeur de cet indice. La tendance des participants à s’aligner sur la parole entendue s’est ainsi
trouvée inhibée dès lors que le sens a été compromis. Les phénomènes de fusion, qui consistent en
la neutralisation d’oppositions phonologiques, ont eux aussi le potentiel de causer des ambiguïtés
lexicales. Un locuteur mobile pourrait résister à l’acquisition d’une fusion ayant cours dans sa
nouvelle communauté pour préserver un contraste phonémique qui linguistiquement, lui est utile
(voir par exemple Kwon, 2018). À l’opposé, dans la mesure où une scission désambigüise certaines
unités, elle pourrait se révéler avantageuse pour le locuteur mobile et, en dépit de sa complexité,
être propice à l’acquisition. Cet exemple illustre que les propositions de Chambers (1992) et de
Kerswill (1996) gagnent à être enrichies par leur mise à l’épreuve dans un éventail de contextes :
l’intrication et le poids relatif des niveaux linguistiques propres à chaque langue et lecte, entre
autres facteurs, peuvent changer la donne.

La question des niveaux linguistiques est abordée par Miller (2005) dans une étude sur l’acquisition
d’un régiolecte de l’arabe. Dans le cadre d’un projet plus vaste visant à décrire les profils
d’intégration sociale de migrants d’origine rurale dans la ville du Caire, en Égypte, Miller (2005)
s’intéresse aux modifications linguistiques qui se produisent dans l’arabe parlé par sept adultes
originaires de Haute-Égypte, au sud du pays. Entre l’arabe de cette région (AHÉ) et l’arabe cairote
(ALC), les différences sont nombreuses et se situent à tous les niveaux linguistiques; l’un des
objectifs de l’auteure est de vérifier si l’acquisition de l’ALC progresse différemment selon le
niveau linguistique. Miller (2005) repère dans la littérature 19 caractéristiques qui varient entre les
régiolectes et calcule le taux d’utilisation des variantes de l’ALC. Pour les sept variables
phonologiques, ce taux varie entre 20 et 96 %, pour les six variables morpho-phonologiques, entre
25 et 60 %, pour les quatre variables lexico-syntaxiques, entre 76 et 100 %, et pour les deux
variables morpho-syntaxiques, le taux est de 42 et 77 %. Comme chez les locuteurs de Vousten et
Bongaerts (1995), les variables phonologiques sont acquises dans des proportions supérieures à
celles des variables morphologiques. L’acquisition la plus importante et la plus uniforme se produit
toutefois pour les variables lexico-syntaxiques, c’est-à-dire des mots grammaticaux tels les pronoms
personnels, les déterminants démonstratifs et les adverbes interrogatifs dont le rôle est davantage
syntaxique que sémantique.

Foreman (2003) s’attarde au taux de production de variantes du R2 en fonction de la partie du


discours (nom, verbe, préposition, etc.). Son enquête porte sur l’adoption de l’anglais australien par
34 locuteurs originaires des États-Unis et du Canada installés en Australie depuis 6 mois à 32 ans.

43
Six variables sont analysées auditivement, soit le /r/ en position autre que pré-vocalique et les
voyelles de KIT, GOAT, FLEECE, FACE et PRICE. Pour chaque occurrence analysée, en plus de
déterminer si une variante australienne ou nord-américaine a été produite, Foreman (2003) note la
partie du discours concernée. La plus importante production de variantes australiennes se retrouve
dans les noms (30,4 %), suivis des verbes (24,5 %). Des parties du discours comme les déterminants
(1,2 %) et les prépositions (3,1 %) ont été nettement moins modifiées par les participants. Une
charge sémantique plus importante semble ainsi rendre les mots plus propices au changement
phonétique. Chez Miller (2005), l’adoption la plus importante des variantes de l’ALC (le R2) est au
contraire observée pour les mots grammaticaux, à faible charge sémantique, mais rappelons que
cette étude ne se limite pas à la prononciation et que la différence entre les variantes est parfois
importante. Par exemple, l’adverbe interrogatif comment, pour lequel la variante du R2 a été
observée dans 100 % des cas, est produit , a ou kefinnak dans le R1 et izzay dans le R2
(Miller, 2005 : 922).

Les travaux exposés dans cette section constituent différentes tentatives de formalisation des règles
et principes régissant l’acquisition des particularités d’un second système linguistique dans toute sa
complexité. Chambers (1992) formule huit principes et Kerswill (1996) hiérarchise des traits en
fonction de leur difficulté d’acquisition, deux séries de propositions mises à l’épreuve,
explicitement ou non, par d’autres chercheurs (Kwon, 2018; Rys et coll., 2017; Rys et Bonte, 2006;
Vousten et Bongaerts, 1995; Nielsen, 2011). La question de la diffusion du changement, de nature
plus ou moins néogrammairienne ou lexicale (Hinskens, 1998), est notamment sujette à débat (Rys
et coll., 2017; Rys et Bonte, 2006). La régularité se révèle favorable à l’acquisition, qu’il s’agisse
du conditionnement phonémique d’un phénomène, ou encore de l’input dont bénéficient les
apprenants (Rys et Bonte, 2006; Rys et coll., 2017; Vousten et Bongaerts, 1995). S’il ne se dégage
pas de cette section de consensus net par rapport à la facilité ou à la difficulté d’acquisition des
différents niveaux et caractéristiques linguistiques (Miller, 2005; Foreman, 2003), les changements
de prononciation semblent rarement caractérisés par la catégoricité.

2.3.2 Saillance perceptive


Une autre perspective sur le rôle des facteurs linguistiques lors du processus d’acquisition d’un R2
est centrée autour de la notion de saillance (voir par exemple les traits i et x de Kerswill, 1996).
D’entrée de jeu, signalons que ce concept demeure étonnamment sous-défini et peu consensuel en
regard de la fréquence à laquelle la littérature y fait appel. Campbell-Kibler (2016 : 138) évoque
même un rapport amour-haine entretenu par les variationnistes à son égard : au-delà d’une forte
intuition, sa quantification est notoirement ardue. Pierrehumbert (2006 : 525), par exemple, définit

44
comme saillants les éléments ni trop fréquents, ni trop inusités, qui renseignent. À première vue
attrayante, cette définition est difficilement implémentable dans un cadre quantitatif. Cela dit, dans
un ouvrage fondateur portant sur les conséquences du contact entre régiolectes, Trudgill (1986 : 11)
postule que ce sont les traits les plus saillants qui seront modifiés par les acquérants. L’auteur tente
de rendre compte de cette notion à l’aide des quatre critères définitoires suivants :

a) Les traits saillants sont stigmatisés.


b) Ils sont impliqués dans un changement en cours.
c) Les variantes d’une variable saillante sont phonétiquement éloignées.
d) Une variable est saillante si ses variantes assurent le maintien d’un contraste phonologique.

Siegel (2010 : 123) note que la définition de Trudgill (1986) tend à être critiquée, notamment parce
que les critères a) et b) apparaissent circulaires : un trait est-il impliqué dans un changement en
cours parce qu’il est saillant, ou est-il rendu saillant par le fait d’être impliqué dans un changement
en cours; la stigmatisation est-elle la cause ou la conséquence de la saillance ?

Auer et coll. (1998) ne se satisfont pas davantage de la définition de Trudgill (1986), entre autres
parce qu’elle entremêle facteurs internes et sociolinguistiques. L’hypothèse de ces auteurs est qu’il
existe deux saillances, deux angles sous lesquels aborder cette notion. La saillance « objective »
peut être décrite au moyen de critères linguistiques, structuraux; elle est le fruit d’une analyse
scientifique. La saillance « subjective » repose plutôt sur la perception et les attitudes des naïfs, et
se définit à l’aide de critères sociolinguistiques; la saillance subjective peut être envisagée comme
une conséquence de la saillance objective. Auer et coll. (1998) s’attachent à dresser un inventaire
des critères linguistiques et extralinguistiques permettant de définir les deux saillances en revisitant
les travaux d’auteurs ayant traité de cette notion. Ils attribuent au dialectologue russe Victor
Schirmunski la première analyse des conséquences du contact entre lectes mettant
systématiquement à profit la notion de saillance dans une série d’études portant sur le nivellement
lectal dans des enclaves germanophones en Russie dans les années 1920-1930. Schirmunski
considère qu’une caractéristique linguistique est plus ou moins susceptible d’être conservée ou
abandonnée en cours de nivellement selon qu’elle est primaire ou secondaire, c’est-à-dire saillante
ou non. Le caractère plus ou moins primaire ou secondaire d’une caractéristique est établi au moyen
de six critères, qui constituent en quelque sorte une liste de vérification : plus une caractéristique
remplit de critères, plus elle est saillante (ou primaire), et plus elle est susceptible d’être abandonnée
ou acquise.

45
(1) La distance articulatoire et perceptive entre les variantes du R1 et du R2 : les variantes
phonétiquement proches sont considérées moins saillantes et sont acquises ou perdues plus
tardivement.
(2) La lexicalisation16 : si une règle phonologique est systématique, elle est peu saillante; si elle
est plutôt lexicalisée, elle est saillante et propice à la perte ou à l’acquisition.
(3) Le caractère dichotomique ou continu : si une variable possède un continuum de variantes,
elle est peu saillante; si au contraire elle ne possède que deux variantes discrètes, elle est
saillante et propice au changement.
(4) La conscience linguistique (awareness) : les locuteurs-auditeurs naïfs ne sont en mesure
d’identifier que les caractéristiques primaires, saillantes. Elles seules sont donc sujettes à
devenir des stéréotypes, à être imitées, à être adoptées ou abandonnées.
(5) L’orthographe : si une caractéristique phonétique possède un pendant orthographique, elle
est peu saillante; si l’une des variantes implique un changement dans la représentation écrite
mentale du locuteur, la variable est saillante.
(6) La compréhension mutuelle : s’il résulte de la différence entre deux variantes un problème
d’intercompréhension, cette différence est saillante.

Auer et coll. (1998) classent les critères (2) et (3) comme objectifs et les critères (4), (5) et (6),
comme subjectifs. Le critère (1) est classé dans les deux catégories, la distance articulatoire (1a)
étant considérée objective et la distance perceptive (1b), subjective, car elle est fondée sur la
perception d’auditeurs naïfs. D’autre part, le critère (2) semble partiellement contredire le
Principe 3 de Chambers (1992), selon lequel les règles complexes sont acquises plus difficilement
que les règles simples. D’après Auer et coll. (1998 : 168), cette contradiction apparente est
symptomatique d’un problème sous-jacent des critères de Schirmunski : ceux-ci sont supposés
s’appliquer aussi bien aux processus d’acquisition que de perte d’un lecte. Or, si une règle
complexe peut être facilement abandonnée, elle est difficilement acquise. Les auteurs pensent ainsi
que la perte et l’acquisition doivent être considérées comme deux composantes distinctes du
changement de lecte, ce qui résoudrait le problème de directionnalité engendré par le critère (2)17.
Quant au critère (5), il a été formulé dans l’optique que l’un des deux lectes en jeu est non standard

16
Par lexicalisation, Auer et coll. (1998 : 164) entendent la diffusion lexicale d’une règle phonologique
complexe, par opposition à la diffusion néogrammairienne d’une règle simple. Il n’est pas question de la
distinction proposée par Hinskens (1998) entre diffusion lexicale et lexicalisation, où cette dernière renvoie
aux reliques ponctuelles d’une règle ayant perdu sa productivité.
17
Ils ajoutent que cette distinction est principalement pertinente lorsque le R1 est un lecte peu prestigieux et
le R2, un lecte standard. Les variantes du R1, parce qu’elles ne sont pas standards, sont perdues. Cette
allégation nous semble cependant pour le moins ambigüe, dans la mesure où Auer et coll. (1998) ont recours
au critère (2) pour jeter les bases de la saillance objective. De plus, des auteurs tels Chambers (1992), Kerswill
(1996) et Rys et Bonte (2006) accordent de l’importance à la distinction entre perte et acquisition en raison
des simplifications et complexifications linguistiques que ces deux processus entraînent. Or, il n’existe pas
nécessairement de correspondance entre le prestige relatif d’une caractéristique et la complexité de son
conditionnement linguistique.

46
et strictement oral (voir la définition de dialecte de Hinskens, 1998, section 1.2.1). Si une variante
de ce lecte oral et non standard dévie du système standard au point où il serait nécessaire d’utiliser
un autre symbole orthographique pour en rendre compte, elle est considérée saillante. Ce critère est
considéré subjectif parce qu’il est fondé sur la perception des locuteurs (représentation écrite
mentale). Le critère (6) est également catégorisé comme subjectif, car il repose en grande partie sur
les attitudes des locuteurs et des auditeurs.

En ce qui concerne la définition de Trudgill (1986), Auer et coll. (1998) considèrent que les critères
a) et c) sont équivalents, respectivement, aux critères (4) et (1a) de Schirmunski, et par conséquent,
classés respectivement subjectif et objectif. Le critère d), qui complémente le critère (2) de
Schirmunski en ce qu’il prend en charge les cas de fusion et de scission, est également catégorisé
comme objectif. Le critère b) n’est quant à lui pas mentionné. Auer et coll. (1998 : 167) ajoutent
parmi les critères objectifs la distribution géographique, postulant que les variantes usitées sur un
territoire plus restreint tendent à être abandonnées plus rapidement. La distribution géographique est
considérée comme un critère objectif, car elle est établie par les linguistes, non par les naïfs. Un
dernier critère subjectif concerne les variantes impliquées dans l’alternance codique, celles-ci étant
considérées saillantes et propices à l’abandon (Auer et coll., 1998 : 167). Le Tableau 2 synthétise
les 10 critères utilisés par Auer et coll. (1998) pour rendre compte des deux volets de la notion de
saillance.

Tableau 2 : Synthèse des critères utilisés pour définir la saillance objective et la saillance
subjective, et études dont ils sont issus (Sch : Schirmunski; Tru : Trudgill, 1986; Auer :
Auer et coll., 1998). Tableau inspiré d’Auer et coll. (1998 : 167)
Critères objectifs Critères subjectifs
Sch (1a)/Tru c) distance articulatoire Sch (1b) distance perceptive
Sch (2) lexicalisation Sch (4)/Tru a) conscience linguistique
Sch (3) dichotomie/continuum Sch (5) orthographe
Tru d) contraste phonologique Sch (6) compréhension mutuelle
Auer distribution géographique Auer alternance codique

En instaurant cette distinction entre saillance objective et saillance subjective, Auer et coll. (1998)
poursuivent un double objectif : vérifier si la saillance prédit adéquatement les changements de
prononciation survenant lors d’un contact entre régiolectes; le cas échéant, déterminer si la saillance
peut être définie au moyen de critères strictement linguistiques (autrement dit, vérifier si l’une des
deux définitions prévaut). Les auteurs utilisent un corpus récolté de 1990 à 1992 auprès de 56
locuteurs germanophones originaires de Leipzig et de Dresde (est) s’étant installés dans les villes de
Constance et de Sarrebruck (ouest) peu après la chute du mur de Berlin. La perte du R1 de ces
locuteurs est évaluée auditivement en fonction de 12 variables (9 vocaliques et 3 consonantiques)

47
dont la saillance est établie au moyen des 10 critères présentés dans le Tableau 2. Les chercheurs
constatent dans un premier temps que la saillance ne semble pas pouvoir prédire à elle seule le
changement. Certaines variables à haute cote de saillance apparaissent effectivement très
résistantes. Auer et coll. (1998 : 182) avancent l’hypothèse d’un effet démesuré du critère de
lexicalisation, dont l’issue est par ailleurs radicalement différente selon que l’on s’intéresse à la
perte ou à l’acquisition des caractéristiques du R1 ou du R2. De plus, les résultats témoignent de
l’absence d’adéquation entre les deux types de saillance. Dans l’ensemble, les critères subjectifs
pèsent davantage dans la balance que les critères objectifs. Auer et coll. (1998) en concluent que s’il
est une saillance qui permette de prédire ou d’expliquer l’acquisition d’un R2, elle repose sur
l’évaluation de locuteurs-auditeurs naïfs plutôt que sur des critères linguistiques établis par les
chercheurs.

Partageant cet avis, MacLeod (2014 : 353) reproche d’ailleurs leur rigidité aux listes de critères
établissant la saillance linguistique comme celles de Schirmunski, de Trudgill (1986) et d’Auer et
coll. (1998). D’une part, elles ne permettent pas de déterminer avec certitude si une caractéristique
est nécessairement saillante ou non saillante, ou si le concept peut être plus finement gradué.
D’autre part, les listes ne permettent de prendre en compte ni le contexte social au sein duquel une
variante est perçue, ni les différences individuelles en perception. Les listes mènent ainsi à
envisager la saillance comme une propriété intrinsèque des caractéristiques linguistiques à l’étude,
évacuant la possibilité qu’elle soit plutôt le fruit d’une évaluation contextuelle (Watson et Clark,
2013 : 320). De plus, Watson et Clark (2013 : 300) rappellent qu’aussi « objectif » soit un critère,
ses modalités dépendent du jugement certes expert, mais néanmoins subjectif, du chercheur. Si l’on
prend l’exemple de la distance articulatoire, la catégorisation doit être opérée en fonction de ce qui
a été défini comme étant, disons, une distance forte ou faible. En réalité, les distances se présentent
comme un continuum, aussi un autre analyste pourrait établir un autre seuil de division entre fort et
faible, choisir de constituer trois catégories au lieu de deux, et ainsi de suite, ce que dresser des
listes de critères était précisément destiné à éviter. Bref, si au terme de cette section, la définition de
la saillance demeure au minimum poreuse, il apparaît de plus en plus clairement qu’il s’agit
davantage d’un facteur externe qu’interne, puisqu’essentiellement fondé sur des opinions
entretenues à l’égard de certains usages. En contexte de mobilité géographique, le poids de ce
facteur pourrait néanmoins s’avérer difficile à évaluer, puisque les locuteurs qui s’établissent dans
une nouvelle communauté peuvent être étrangers aux opinions partagées par les natifs (Amastae et
Satcher, 1993), ce dont nous rediscuterons dans la section 2.4.2. MacLeod (2014) suggère en outre
que la saillance pourrait en partie dépendre de différences individuelles en perception. La variabilité

48
inter-locuteurs s’avérant déjà une réalité complexe du phénomène d’acquisition d’un R2, la notion
de saillance dans un tel contexte risque donc d’être aussi difficile à saisir que le veut sa réputation
(Campbell-Kibler, 2016; Watson et Clark, 2013).

2.3.3 Lien perception-production


Si l’on évitera désormais d’avoir recours au terme saillance pour rendre compte de la dimension
objective de ce concept, quelques considérations soulevées à ce propos dans la section précédente
n’en restent pas pour autant lettre morte. Déterminer l’ampleur des différences linguistiques
nécessaires pour qu’un changement survienne, établir si l’audibilité d’un phénomène est essentielle
à la conscience de la variation et vérifier si cette audibilité et cette conscience sont nécessaires au
changement sont autant de préoccupations exprimées dans la littérature portant sur l’influence des
facteurs internes sur le processus d’acquisition d’un R2. Dans les faits, il s’avère cependant difficile
de répondre à ces questions, notamment en raison du caractère relatif de certains des concepts
qu’elles impliquent. Par exemple, concernant les différences nécessaires au changement, on peut
s’interroger sur ce qui est réellement mis en cause : l’écart minimal entre les variantes du R1 et du
R2, ou bien l’ampleur de l’écart phonétique que doit parcourir l’apprenant pour que
l’expérimentateur juge qu’un changement s’est produit ? Pour ce qui est de l’audibilité, dans une
étude sur la quasi-fusion des voyelles /e/ et /ʌ/ en anglais philadelphien, Labov et coll. (1991)
observent que des auditeurs originaires de Philadelphie échouent à discriminer des stimuli qui
présentent pourtant une opposition claire pour des auditeurs originaires de l’extérieur de cette ville.
Le concept de conscience apparaît tout aussi relatif, Kraljic et coll. (2008 : 73) rapportant par
exemple que des auditeurs qui assurent ne pas avoir conscience d’une caractéristique phonétique la
reproduisent tout de même lors d’une tâche suscitant la convergence entre interlocuteurs. En regard
de ces considérations, peut-être le véritable enjeu au centre des préoccupations soulevées ci-haut
est-il mieux circonscrit en posant la question suivante : quelle est l’étroitesse de la correspondance
entre les mécanismes de perception et de production de la parole lors du processus d’acquisition
d’un R2 ?

Howell et coll. (2006) s’intéressent à l’influence de conditions d’écoute altérées sur la production
d’un R2. Dans cette étude, 20 locuteurs natifs de l’anglais ont été recrutés : 4 d’entre eux avaient
toujours vécu dans les environs de Londres; les 16 autres vivaient à Londres depuis 5 à 35 ans et
étaient originaires, dans des proportions égales, d’Irlande du Nord, d’Écosse, de Liverpool et de
Newcastle. Deux des quatre participants originaires de chaque région pensaient avoir modifié leur
prononciation depuis leur arrivée à Londres, les deux autres non. Les locuteurs ont été enregistrés
lors de la lecture de textes dans trois conditions : 1) normale; 2) avec rétroaction auditive différée

49
(de 66 ms); 3) avec rétroaction à fréquences modifiées (diminution d’une demi-octave de
l’ensemble du spectre). Dans le premier volet de l’expérience, où seule la parole produite dans la
condition normale a été utilisée, 8 auditeurs naïfs ont été amenés à évaluer la similarité entre la
prononciation des locuteurs mobiles et celle des Londoniens sur une échelle à 7 degrés. Une analyse
par regroupements hiérarchiques révèle que les locuteurs qui rapportent avoir changé leur
prononciation sont effectivement perçus plus similaires aux locuteurs londoniens que ceux qui
estiment avoir conservé leur prononciation d’origine, l’auto-perception se révélant plutôt juste.
Dans le second volet de l’expérience, 32 nouveaux auditeurs ont pris part à la tâche d’évaluation de
la similarité, mais cette fois, la moitié des stimuli présentés étaient composés de parole produite soit
dans la condition avec rétroaction différée (16 auditeurs), soit dans la condition avec rétroaction à
fréquences modifiées (16 auditeurs). Les résultats de la première expérimentation sont répliqués
dans la deuxième pour ce qui est de la parole produite dans la condition normale. L’analyse par
regroupements hiérarchiques montre que dans les deux autres conditions, les locuteurs mobiles
précédemment jugés similaires aux locuteurs londoniens sont désormais perçus plus proches des
locuteurs mobiles ayant conservé leur prononciation d’origine. Autrement dit, les conditions
d’écoute altérées ont provoqué chez les locuteurs ayant acquis un R2 une réémergence du R1.
D’après Howell et coll. (2006 : 149), lorsque la rétroaction auditive habituelle d’un locuteur est
perturbée, ses représentations les plus robustes sont sélectionnées pour la production, soit celles de
son R1. À ce stade, on peut ainsi présumer que les changements observés en production ne sont pas
dénués de lien avec une réaction quelconque du système perceptif à la perturbation, sans que la
nature de ladite réaction ni que les causes exactes du repli vers des formes plus robustes ne soient
tout à fait claires.

Ziliak (2012) s’intéresse à la relation entre la perception et la production des voyelles /a æ ɛ ʌ/ chez
76 locuteurs âgés de 20 à 60 ans : 26 sédentaires originaires de Jasper (Indiana), 24 sédentaires
originaires de Chicago (Illinois) et 26 mobiles originaires de Jasper et vivant à Chicago. Dans cette
dernière ville, le timbre des voyelles à l’étude est impliqué dans le Northern Cities Shift (NCS), un
changement en chaîne ayant cours dans l’anglais parlé au nord des États-Unis et au Canada.
L’auteure cherche à vérifier dans quelle mesure les locuteurs mobiles s’y sont adaptés. Dans un
premier temps, la frontière perceptive entre les voyelles des paires /a/-/æ/, /æ/-/ɛ/ et /ɛ/-/ʌ/ a été
établie pour chacun des auditeurs. Pour ce faire, un locuteur de Jasper a produit des mots contenant
les voyelles cibles, puis la fréquence de leurs trois premiers formants a été modifiée de manière à
créer un continuum de 10 occurrences joignant chaque paire de voyelles. Les participants ont
ensuite écouté les stimuli et identifié le mot entendu, par exemple bad ou bed pour les occurrences

50
du continuum /æ/-/ɛ/. Ils ont également produit les voyelles cibles au cours d’un entretien et la
valeur des trois premiers formants de ces occurrences a été comparée aux frontières perceptives
déterminées lors de la tâche de perception. Les résultats montrent qu’en production, les locuteurs
mobiles se situent à mi-chemin entre les deux groupes de locuteurs sédentaires, suggérant que leurs
usages ont changé depuis leur arrivée à Chicago. En perception toutefois, les trois groupes se
distinguent à peine : seule la frontière entre /æ/-/ɛ/ est significativement différente sur la dimension
F1 et marginalement différente sur F2 entre le groupe de Chicago et les deux autres. Par-dessus tout,
la mise en relation des résultats individuels obtenus aux deux tâches révèle l’absence de
concordance entre les valeurs fréquentielles des occurrences produites et les frontières perceptives,
y compris chez les sédentaires, complexifiant considérablement la possibilité de tirer quelque
conclusion concernant un potentiel changement en perception chez les mobiles. Ziliak (2012 : 255)
reconnaît qu’une analyse plus complète nécessiterait des données longitudinales.

Evans et Iverson (2007) cherchent précisément à savoir si un changement en production nécessite


un changement en perception. Leur point de départ consiste en une étude sur l’adaptation perceptive
à un accent étranger menée par Clarke et Garrett (2004), qui observent chez leurs auditeurs une
capacité d’adaptation remarquablement rapide : il suffit d’une exposition de deux à quatre phrases
pour que les participants parviennent à accomplir des tâches telles que la reconnaissance de parole
dans le bruit aussi rapidement qu’un groupe-contrôle exposé à de la parole sans accent. Evans et
Iverson (2007) s’attachent à vérifier si une telle adaptation perceptive se produit également lorsque
les auditeurs sont exposés à des régiolectes différents et si cette éventuelle adaptation se traduit par
des changements perceptifs à plus long terme, sachant que leurs participants sont des locuteurs
mobiles chez qui un changement en production a pu être constaté. Une vingtaine d’étudiants
universitaires originaires du nord de l’Angleterre ont pris part à deux tests de perception, soit une
tâche de localisation du meilleur exemplaire (best exemplar location) et une tâche de
reconnaissance de parole dans le bruit, et ce, à quatre reprises : avant le début de leurs études (T1),
puis après trois mois (T2), un an (T3) et deux ans (T4) de scolarité. La première tâche consiste à
identifier, dans un espace tridimensionnel composé de différentes valeurs de F1, de F2 et de durée, la
localisation (ou position) de l’occurrence perçue par l’auditeur comme le meilleur exemplaire de sa
catégorie. Des voyelles synthétiques en contexte /bV/, /bVd/ ou /kVd/ contenues dans des phrases
porteuses produites avec l’accent du nord et du sud de l’Angleterre par un locuteur bilectal sont
soumises aux auditeurs, qui doivent juger de la qualité des exemplaires vocaliques entendus. En
fonction du jugement des auditeurs, la valeur de F1, de F2 et de la durée est ajustée par itérations
jusqu’à l’obtention du meilleur exemplaire. Il s’avère que quelle que soit la phrase porteuse, les

51
participants préfèrent des exemplaires s’approchant de leurs propres productions moyennes et que la
localisation du meilleur exemplaire dans l’espace tridimensionnel F1/F2/durée ne change pas au
cours du temps. Lors de la seconde tâche de perception, les auditeurs sont amenés à reconnaître des
phrases simples produites par une locutrice du nord de l’Angleterre et par une locutrice du sud,
phrases dont l’intensité varie et auxquelles est superposé un bruit blanc. Comme précédemment, les
résultats indiquent que la reconnaissance de la parole dans le bruit ne change pas de manière
substantielle avec le temps et que les auditeurs réussissent mieux la tâche lorsque la parole entendue
s’approche de leurs usages moyens. Il semble donc qu’un changement en production n’exige pas un
changement en perception.

Qu’aucun changement perceptif ne se soit produit chez les auditeurs semble cependant entrer en
contradiction avec les tendances qui se dégagent de l’étude de Clarke et Garrett (2004). Pour
expliquer cet écart, Evans et Iverson (2007 : 3824) mettent en cause le fait que les auditeurs de
Clarke et Garrett (2004) ont été exposés à des locuteurs spécifiques plutôt qu’à un régiolecte de
manière générale, à l’instar de leurs propres participants. Poursuivant la réflexion en ce sens, Kraljic
et coll. (2008) cherchent à vérifier empiriquement si les auditeurs s’adaptent effectivement de
manière différente à des sources de variation différentes. Pour ce faire, ces auteurs se concentrent
sur une variante de /s/ se situant, acoustiquement et auditivement, à mi-chemin entre [s] et [ʃ] : ~sʃ.
Dans certains régiolectes de l’anglais, dont celui de New York et des environs, cette variante
intermédiaire est fréquente dans la séquence /str/, contenue dans des mots comme street et
astronaut. Il s’agit d’un effet coarticulatoire, la masse linguale étant postériorisée lors de la
production du /s/ par anticipation du /r/ subséquent, ce que Kraljic et coll. (2008 : 56) identifient
comme étant de la variation d’origine contextuelle. Le ~sʃ peut aussi constituer une spécificité
idiosyncrasique attribuable à différentes particularités physiologiques, par exemple la présence d’un
perçage dans la langue. Dans ce cas, quels que soient l’origine géographique du locuteur et le
contexte d’apparition du /s/, une variante intermédiaire est toujours produite, ce que les auteurs
identifient comme étant de la variation d’origine non contextuelle. Kraljic et coll. (2008) ont
d’abord amené une locutrice anglophone à produire des logatomes comportant un /s/ ou un /ʃ/ (par
exemple, [asi] et [aʃi]). Ces productions naturelles ont ensuite été modifiées pour créer un
continuum de stimuli jugés auditivement ambigus par les expérimentateurs. Les stimuli naturels et
manipulés ont été utilisés pour mettre au point une tâche d’identification consonantique (/s/ ou /ʃ/),
à laquelle ont participé 64 auditeurs américains. Avant d’effectuer cette tâche, la moitié d’entre eux
(32) ont été exposés en laboratoire à des ~sʃ d’origine contextuelle et l’autre moitié, à des ~sʃ
d’origine non contextuelle. Les résultats indiquent que les participants préalablement exposés à la

52
variation contextuelle ont plus fréquemment identifié les stimuli ambigus comme étant des /ʃ/ que
ceux exposés à la variation non contextuelle. Autrement dit, la variation idiosyncrasique (non
contextuelle) semble avoir provoqué chez les auditeurs un ajustement de frontière perceptive,
contrairement à la variation contextuelle. Ces résultats font écho à la divergence entre les
observations de Clarke et Garrett (2004) et d’Evans et Iverson (2007). Dans la première étude, les
auditeurs ont été exposés en laboratoire à un accent étranger spécifique, que l’on peut considérer
comme étant de la variation idiosyncrasique, d’origine non contextuelle, ce qui a provoqué une
adaptation perceptive. Dans la seconde, les auditeurs ont été exposés pendant leurs deux années de
scolarité à de la variation régiolectale, d’origine contextuelle, à laquelle le système perceptif ne s’est
pas ajusté.

Si les résultats de l’étude d’Evans et Iverson (2007) témoignent de la présence d’un fort lien entre
les mécanismes de perception et de production, les auditeurs préférant des exemplaires s’approchant
de leurs propres productions et reconnaissant mieux des usages similaires aux leurs, il semble que
ce lien se manifeste de manière complexe lors de l’acquisition d’un R2, car rappelons qu’en dépit
de l’absence d’ajustement perceptif, un changement en production s’est tout de même produit.
Partageant les résultats de travaux préliminaires sur la nasalisation vocalique en anglais américain et
sur une tonogenèse en afrikaans, Beddor (2015) contribue à faire progresser la compréhension de ce
lien dans un contexte monolingue où ont cours variation et changement phonétiques. L’assise
initiale de l’auteure est que la majorité des locuteurs-auditeurs reproduisent les caractéristiques du
signal sonore auxquelles ils sont sensibles. La zone grisée de la Figure 4 illustre ce principe et
montre que plus un individu est sensible à une propriété donnée du signal sonore, plus il est

Figure 4 : Représentation schématique de la relation entre la


perception et la production de la parole en contexte de variation
et de changement. Figure extraite de Beddor (2015 : 7)

53
susceptible de la reproduire, et inversement. L’hypothèse de Beddor (2015) implique également que
les individus sont peu susceptibles de manifester un comportement associé aux zones blanches,
c’est-à-dire une sensibilité élevée à une propriété qui n’est pas produite (coin supérieur gauche) et
une faible sensibilité à une propriété qui est produite (coin inférieur droit).

Les deux expériences rapportées par l’auteure consistent à mettre en relation les productions de 55
participants avec leurs résultats lors d’un test de perception de la nasalisation vocalique en anglais
américain faisant appel à l’oculométrie (32 participants natifs de l’anglais américain), ou d’un test
d’identification de consonnes occlusives de l’afrikaans (23 participantes natives de l’afrikaans). Les
résultats préliminaires confirment la prédiction selon laquelle la plupart des locuteurs-auditeurs se
situent dans la zone grisée de la Figure 4. L’auteure note en outre que certains locuteurs-auditeurs
se situent dans le coin supérieur gauche, mais qu’aucun n’occupe le coin inférieur droit. Autrement
dit, certains auditeurs sont sensibles à des caractéristiques qu’ils ne produisent pas, mais aucun
auditeur n’est insensible à une caractéristique qu’il produit lui-même. Ces résultats laissent penser
que les productions d’un locuteur ne représentent qu’un infime empan de tout ce à quoi le système
perceptif est exposé, révélant d’une part la flexibilité nettement supérieure de ce mécanisme, et
suggérant d’autre part qu’un locuteur sélectionne ses productions parmi celles dont il dispose
(considérant toujours qu’il ne dispose que de ce à quoi il est sensible). Par conséquent, en L1, un
changement en perception n’apparaît pas essentiel à la sélection d’une nouvelle forme, à moins
qu’un tel changement ne résulte d’une sensibilité accrue, consécutive par exemple à un
entraînement perceptif. Beddor (2015 : 8) conclut sa contribution par la remarque suivante : « the
phonetic variants that an innovative—or conservative—language user finds to be especially salient
in perception will be correspondingly prominent in that individual’s own productions ». Nous
estimons que cette acception de la notion de saillance renvoie à une propriété du signal sonore que
le système perceptif est en mesure de détecter et dont il fait usage, à un trait auquel le système
perceptif est sensible sans que ne soient impliqués (ni exclus) un jugement social de la part de
l’auditeur ou sa conscience du phénomène. Cette définition de la notion de saillance diffère
sensiblement de celle à laquelle nous sommes parvenue au terme de la section précédente (2.3.2);
ainsi nous continuerons à faire référence aux ormes auxquelles l’auditeur est sensible pour rendre
compte de cette nouvelle acception.

En appui rétrospectif à la réflexion de Beddor (2015), une étude de Scott et Cutler (1984) fournit un
exemple éloquent du fait que le mécanisme de production d’un locuteur en situation d’acquisition
d’un R2 puise parmi les formes auxquelles il est sensible. Cette contribution porte sur l’utilisation

54
de consonnes occlusives, palatalisées et battues comme indices de la présence ou de l’absence de
frontières syntagmatiques en anglais américain. Considérons d’abord les énoncés suivants :

1. For those who’d like to eat, early lunch will be served.


2. For those who’d like to eat early, lunch will be served.
3. The last time we met, you sped up the process.
4. The last time we met you sped up the process.

À l’écrit, la différenciation sémantique des énoncés 1 et 2 repose sur la position relative de la


virgule et celle des énoncés 3 et 4, sur la présence ou l’absence de virgule. À l’oral, si aucune pause
marquant la frontière entre les syntagmes n’est insérée, la désambigüisation dépend de la manière
dont le /t/ final de eat et de met est produit. Si celui-ci coïncide avec la fin d’un syntagme comme
dans les énoncés 1 et 3, l’occlusive sourde [t] est produite. S’il n’est pas en fin de syntagme et qu’il
est suivi d’une voyelle ou d’une semi-voyelle comme dans les énoncés 2 et 4, les variantes battue
[ɾ] et palatalisée [ʧ], respectivement, sont produites. Cette règle s’applique aussi à la consonne /d/,
prononcée [d] en position finale de syntagme, et [ɾ] ou [ʤ] lorsque suivie, à l’intérieur d’un
syntagme, d’une voyelle ou d’une semi-voyelle18. Ce phénomène de l’anglais américain est absent
de l’anglais britannique, où les deux types de contextes exposés appellent à la production de [t] et
de [d].

Scott et Cutler (1984) se sont intéressées à la production et à la perception de ce phénomène par 36


témoins américains (11), britanniques (11) et britanniques vivant aux États-Unis (14). Ces
participants ont d’abord pris part à une tâche de production d’énoncés du même type que ceux
présentés ci-haut, dont la désambiguïsation sémantique était permise non pas par la ponctuation,
mais par une mise en contexte préalable. Ces mêmes participants ont également été soumis à un test
de perception, où ils choisissaient parmi deux énoncés écrits celui entendu. Ces énoncés ambigus
ont été produits par un locuteur natif de l’anglais américain ayant reçu la consigne explicite d’éviter
d’insérer des pauses aux frontières entre syntagmes. Sans surprise, les résultats des participants
américains et britanniques sont nettement distincts. Contrairement aux 11 Américains, les 11
Britanniques n’ont pas été en mesure de s’appuyer sur les différentes variantes pour désambiguïser
les énoncés entendus, pas plus qu’ils n’ont eu recours aux consonnes battues et palatalisées pour
marquer le contraste sémantique en production. Les 14 Britanniques installés aux États-Unis

18
Parmi les 12 énoncés ambigus utilisés par Scott et Cutler (1984 : 453), aucun ne comporte un /d/ suivi
d’une voyelle à l’intérieur d’un syntagme. Les contextes donnant potentiellement lieu à une variante battue ne
comportent ainsi que des /t/, possiblement en raison de la difficulté à distinguer auditivement et
acoustiquement [d] de [ɾ].

55
présentent quant à eux un profil plus nuancé. Leur comportement correspond à celui des
Britanniques pour ce qui est du phénomène de palatalisation : ils ne l’ont utilisé ni en production, ni
en perception pour désambiguïser les énoncés. Ils se sont toutefois avérés en mesure d’exploiter
l’opposition occlusive/battue lors de la tâche de perception. En production, alors qu’à l’intérieur de
syntagmes les Britanniques n’ont produit que des [t] sourds et aspirés, les Britanniques installés aux
États-Unis ont généré une vaste de gamme de variantes, dont des occurrences de [t] sourds et
aspirés, de [t] sans explosion, des variantes glottique [ʔ] et battue [ɾ], et même de la consonne
alvéolaire voisée [d]. Selon Scott et Cutler (1984 : 461), cette hétérogénéité laisse présumer que les
Britanniques installés aux États-Unis sont en processus d’acquisition de la règle régissant
l’apparition de la battue [ɾ] en anglais américain. Chez ces témoins, il semble donc que la présence
comme l’absence de changements se traduisent à la fois en perception et en production, ce qui
corrobore l’hypothèse de Beddor (2015) selon laquelle la majorité des locuteurs-auditeurs
reproduisent les caractéristiques du signal sonore auxquelles ils sont sensibles. Les résultats
concernant la palatalisation confirment en outre qu’un locuteur ne produit pas de formes auxquelles
il est insensible. Les résultats liés à la variante battue laissent par ailleurs penser que le changement
en perception pourrait avoir précédé le changement en production, ou être plus hâtivement arrivé à
terme. Les participants semblent effectivement avoir été en mesure de faire un usage efficace de
leurs nouvelles représentations perceptives à un moment où leurs productions étaient encore
caractérisées par la variabilité.

Une étude dont les résultats tendent à appuyer cette dernière hypothèse est celle menée par Bowie
(2001) auprès de 24 locuteurs anglophones originaires de Waldorf, au Maryland. Dans cette
localité, les voyelles /u/, /ʊ/ et /o/ précédant /l/, par exemple dans les mots pool, pull et pole, sont en
processus de fusion. Bowie (2001) examine les productions de 11 participants sédentaires ayant
toujours vécu à Waldorf et de 13 participants mobiles partis vivre ailleurs aux États-Unis depuis 2 à
14 ans. Il observe que la différence entre le taux de fusion vocalique des deux groupes est faible,
suggérant à première vue que la mobilité géographique n’a causé aucun changement. Cependant, en
vérifiant si les mêmes participants sont en mesure de distinguer les voyelles à l’étude, l’auteur
constate que les mobiles font nettement plus la distinction que les sédentaires. Le taux de fusion
vocalique à peine moins élevé des locuteurs mobiles n’apparaît plus aussi artéfactuel sachant qu’un
changement en perception a été initié.

Sur le plan méthodologique, l’étude du lien entre perception et production demeure délicate.
Watson et Clark (2013 : 302) invitent d’ailleurs à la prudence concernant la non-manifestation des
comportements attendus par le chercheur : « lack of evidence is not evidence of absence ». Par

56
exemple, Habib (2014) mène une enquête sur l’arabe parlé à Oyoun A-Wadi, un village syrien situé
près de la frontière avec le Liban, où les voyelles /a/ et /aː/ peuvent devenir, selon le contexte
morphophonologique, [e] et [eː] (règle complexe régionalement répandue) ou [o] et [oː] (règle
simple exclusivement locale). Dans les années précédant l’enquête, réalisée en 2010, soit avant la
guerre civile syrienne, Oyoun A-Wadi est le théâtre d’importantes migrations internes, accueillant
notamment des femmes originaires d’ailleurs en Syrie venues s’installer dans le village natal de leur
époux. Aussi bien les variantes nationales [a] et [aː], régionales [e] et [eː], que locales [o] et [oː]
font donc partie de l’arabe parlé au quotidien. Habib (2014) interroge 50 locuteurs âgés de 6 à 18
ans et constate au terme d’une analyse auditive qu’avant l’âge de 8 ans, les locuteurs produisent les
variantes nationales [a] et [aː]. Les variantes régionales et locales ne font leur apparition dans les
usages des participants qu’à partir de 8-9 ans, et la règle régionale complexe est bien maîtrisée.
L’auteure considère que ses résultats s’opposent à ceux de Payne (1980), puisqu’une règle
complexe a été acquise avec succès après l’âge de 8 ans.

En regard du thème traité dans cette section, l’interprétation de Habib (2014) apparaît toutefois
problématique. Puisque les enfants ont toujours vécu à Oyoun A-Wadi et que l’auteure insiste sur la
présence simultanée des différentes variantes dans les usages locaux, il est fort peu probable que
l’apparition de nouvelles formes chez les locuteurs de 8-9 ans soit attribuable à un changement subit
des usages auxquels ils sont exposés. Les règles pourraient ainsi avoir été maîtrisées, au moins
passivement, bien avant leur manifestation. En d’autres termes, pour reprendre les propos de Nycz
(2015 : 477) : « a lack of use does not clearly indicate a lack of acquisition ». Si l’étude de Habib
(2014) peut certes contribuer à documenter l’influence du contact avec les pairs, ou encore l’âge
auquel émerge la conscience sociolinguistique, considérer que l’acquisition d’un phénomène ne se
produit pas avant le moment où il est produit, et ce, sans tester explicitement la perception des
participants revient à prendre le raccourci inacceptable formulé par Watson et Clark (2013). Les
résultats obtenus par Ziliak (2012), Evans et Iverson (2007), Beddor (2015), Scott et Cutler (1984)
et Bowie (2001), dont les témoins ont tous été amenés à effectuer aussi bien des tâches de
perception que de production, ne laissent en aucun cas présumer que les deux mécanismes
entretiennent une relation de cause à effet simple et simultanée.

2.3.4 Synthèse
Trois volets des facteurs internes susceptibles de régir l’acquisition d’un R2 ont été abordés dans
cette section, soit les niveaux linguistiques en jeu, le rôle de la notion de saillance et le lien entre les
mécanismes de perception et de production de la parole. Sur le plan de la prononciation, il se
dégage de la section portant sur les niveaux linguistiques qu’une substitution phonétique simple est

57
plus aisée pour l’apprenant que l’assimilation d’une règle phonologique complexe (Chambers,
1992; Kerswill, 1996). Labov (1994 : 109-110) soutient lui aussi que le système phonologique d’un
locuteur adulte est remarquablement stable et que seules les formes de surface sont affectées par un
changement d’environnement lectal. Certaines études appellent toutefois à nuancer cette position
(Kwon, 2018; Nielsen, 2011), notamment en raison de l’inévitable interaction entre niveaux
linguistiques. Les changements sont en outre plus efficacement effectués lorsqu’ils affectent un
nombre élevé d’unités du lexique (Rys et coll., 2017; Rys et Bonte, 2006). Cette importance de la
régularité et de la récurrence est également mise de l’avant par Vousten et Bongaerts (1995), qui
observent que la maîtrise d’une règle du R2 par l’apprenant dépend dans une certaine mesure de la
régularité de l’input. Indépendamment de la fréquence et de la récurrence, il demeure que les
changements de prononciation chez les locuteurs mobiles demeurent loin de la catégoricité, quelle
que soit la partie du discours affectée (Miller, 2005; Foreman, 2003).

En ce qui concerne le rôle de la saillance d’une variable lors de l’acquisition d’un R2, rappelons que
la tentative d’Auer et coll. (1998) de distinguer saillance objective et saillance perceptive à l’aide de
critères issus de leurs propres travaux, de ceux de Schirmunski et de ceux de Trudgill (1986) s’est
avérée plus ou moins concluante. L’hypothèse des auteurs voulant que la saillance subjective soit la
conséquence de la saillance objective et par conséquent, que des critères linguistiques permettent de
rendre compte de cette notion, n’a pas été confirmée : la saillance subjective, fondée sur la
perception d’auditeurs naïfs, s’est trouvée mieux prédire l’acquisition d’un R2, les auteurs laissant
néanmoins entendre que la saillance, même subjective, ne permette pas à elle seule d’expliquer
intégralement le changement.

Pour ce qui est du lien entre perception et production, qui constitue en quelque sorte la poursuite du
questionnement d’Auer et coll. (1998), il subsiste bien entendu plusieurs interrogations, par
exemple les raisons exactes derrière le repli vers les formes du R1 lorsque les conditions d’écoute
sont altérées (Howell et coll., 2006). La mise en relation des conclusions qui se dégagent de travaux
d’horizons divers contribue tout de même à faire avancer la réflexion sur le sujet. D’abord, il
semble que le système perceptif ne réagisse pas de manière identique aux différentes sources de
variation avec lesquelles il entre en contact (Kraljic et coll., 2008). L’exposition à un R2 ne semble
d’ailleurs pas obligatoirement entraîner d’ajustement perceptif, même lorsqu’un changement en
production est observé (Evans et Iverson, 2007; Ziliak, 2012). D’un autre côté, Beddor (2015)
parvient à la conclusion que pour qu’un locuteur produise une caractéristique donnée, il est
impératif qu’il y soit sensible. Deux éléments doivent dès lors être considérés pour expliquer qu’un
changement en production survienne sans qu’un changement en perception ne soit observé.

58
Premièrement, le système perceptif est exposé à bien davantage que ce que ne laissent paraître les
formes produites; la sélection de nouvelles formes peut donc être effectuée parmi la gamme de
variantes auxquelles le locuteur-auditeur est déjà sensible. Deuxièmement, dans l’éventualité où un
ajustement perceptif s’avère néanmoins nécessaire, celui-ci pourrait atteindre complétion avant le
changement en production, une hypothèse qu’appuient les résultats de Scott et Cutler (1984) et de
Bowie (2001), ainsi que la remarque de Beddor (2015) à propos de ces auditeurs sensibles à des
formes qu’ils ne produisent pas.

2.4 Des facteurs externes qui influencent l’acquisition d’un


second régiolecte
La tradition variationniste initiée par Labov (1976, entre autres) vise à établir des corrélations entre
la variation linguistique et un ensemble prédéfini de variables démographiques, ou facteurs
externes, correspondant à la macro-organisation sociétale (Eckert, 2012 : 88). Ces facteurs externes,
parmi lesquels les plus courants sont la classe sociale, l’ethnicité, l’âge et le sexe (Wolfram,
1997 : 116), sont censés expliquer ou prédire les patrons de variation dans une communauté
linguistique, qui « se définit moins par un accord explicite quant à l’emploi des éléments du langage
que par une participation conjointe à un ensemble de normes » (Labov, 1976 : 187). À titre
d’exemple, en ce qui concerne la classe sociale, les formes jugées non standards ou évaluées
négativement sont typiquement plus fréquentes aux échelons inférieurs; dans plusieurs études, les
femmes sont enclines à adopter les formes novatrices plus rapidement que les hommes (Wolfram,
1997). Choisir de s’intéresser aux usages de locuteurs mobiles implique toutefois de se détacher du
modèle variationniste classique. Les migrants ne peuvent effectivement pas être considérés comme
membres à part entière de la communauté linguistique d’accueil telle que définie par Labov (1976),
car ils ne partagent pas les mêmes normes, et l’ensemble prédéfini de facteurs externes servant de
ligne directrice à l’étude de la variation dans une telle structure pourrait ne pas être parfaitement
adapté.

Deux structures d’analyse supplémentaires, issues de contributions faisant partie de ce qu’Eckert


(2012 : 91) identifie comme la deuxième vague d’études sociolinguistiques, se présentent aux
chercheurs abordant la question de la variation : les réseaux sociaux (Milroy, 1980, 2002b) et les
communautés de pratique (Eckert et McConnell-Ginet, 1992; Meyerhoff, 2002). L’une des
conséquences de l’examen approfondi de telles cellules plus restreintes et localement signifiantes a
été de mettre au jour le propre de la nature et de l’effet des facteurs externes qui conditionnent les
pratiques linguistiques des locuteurs qui font partie de ces structures. Par exemple, étudiant les
usages d’adolescents d’une école secondaire de Détroit, Eckert (1988, 1989) montre que

59
l’appartenance à des groupes spécifiques à cette tranche d’âge, les Jocks et les Burnouts, explique
mieux les patrons de variation observés que certains facteurs externes plus classiques comme la
classe sociale des parents. Dans une étude longitudinale sur la standardisation du suédois parlé à
Eskilstuna (Suède), Sundgren (2009 : 125) observe chez des hommes ayant connu une importante
ascension sociale un maintien, voire une augmentation de l’utilisation des variantes non standards
au cours du temps. Cette tendance apparemment contradictoire avec les prédictions habituelles
concernant la classe sociale s’explique par le réseau social des locuteurs : dans la communauté
investiguée, une forte intégration locale est davantage garante de promotions professionnelles qu’un
diplôme postsecondaire, ainsi les usages non standards ont été maintenus chez des locuteurs
fortement intégrés, dont le statut social n’est au final que corollaire. Au même titre qu’ils ne font
pas partie de la communauté linguistique d’accueil, les locuteurs migrants ne peuvent pas être tenus
pour membres de réseaux sociaux identiques à ceux des locuteurs natifs. Jusqu’à preuve du
contraire, ils ne peuvent non plus être considérés comme une communauté de pratique, puisque leur
point commun, c’est-à-dire la non-appartenance à la communauté d’accueil, n’implique pas
d’emblée un engagement conscient dans une activité partagée (Eckert et McConnell-Ginet,
1992 : 464). La littérature s’inscrivant dans la deuxième vague d’Eckert (2012), de par son
inspiration ethnographique, appelle néanmoins à ce que les facteurs externes susceptibles
d’influencer les pratiques d’un groupe aussi spécifique et atypique que les locuteurs mobiles soient
établis à l’issue d’une réflexion rigoureuse. Dans les prochaines sections, nous rendrons compte de
six de ces facteurs qui se dégagent de la littérature portant sur l’acquisition d’un R2.

2.4.1 Intégration sociale


Depuis l’étude de Milroy (1980) à Belfast, les réseaux sociaux dans lesquels évoluent les locuteurs
font l’objet d’une attention particulière en sociolinguistique. L’auteure constate que des réseaux
sociaux denses et multiplexes favorisent le maintien de certaines formes linguistiques, la densité
étant définie comme le nombre de liens entre les membres du réseau par rapport aux liens possibles,
et la plexité, comme le nombre de contacts de nature différente entre les membres (voir Milroy,
1980 : 49-52). Par exemple, un réseau où des liens unissent chacun des membres avec tous les
autres membres est dense, et un réseau dont les membres sont à la fois amis, voisins, collègues et
issus de la même famille est multiplexe. Des locuteurs possédant un réseau social moins dense (ou
ouvert) et uniplexe seraient à l’inverse plus enclins à l’innovation linguistique.

Dans cette perspective, Evans (2004) évalue l’impact du réseau social sur les usages de 28 locuteurs
âgés de 28 à 81 ans vivant à Ypsilanti, une ville industrielle du Michigan ayant connu des années
1940 aux années 1960 un important flux de migrants venus du sud des États-Unis pour travailler

60
dans ses usines de bombes, puis de moteurs. La vague d’immigration fut telle que même au moment
de la parution de l’article d’Evans (2004), « être du sud » revêtait encore une signification sociale, y
compris chez des locuteurs nés à Ypsilanti, et que des réseaux sociaux denses et multiplexes
composés exclusivement de locuteurs « du sud » étaient toujours en place. L’auteure s’intéresse à la
fermeture de la portion initiale du /æ/, phénomène phonétique identifié par Labov (1994 : 195)
comme instigateur du Northern Cities Shift (NCS). L’hypothèse mise à l’épreuve est que les
locuteurs évoluant dans un réseau social « du sud » participeront peu au NCS. La distance entre le
F1 du /ɛ/ et le F1 du /æ/ des productions analysées s’avère positivement corrélée à la densité et à la
plexité du réseau social, confirmant l’hypothèse d’Evans (2004), qui précise que le niveau socio-
économique des répondants n’a pas eu d’influence notable et que les jeunes locuteurs, dont le
réseau social est plus ouvert que celui de leurs aînés, semblent davantage participer au NCS.
S’intéressant plutôt au maintien des caractéristiques du R1, Hazen et Hamilton (2008) interrogent
six locuteurs originaires de Virginie occidentale établis au nord des États-Unis lors de la même
vague de migration économique. Ils constatent que deux des locuteurs les plus âgés, l’un de 66 ans
vivant depuis 62 ans à Détroit (Michigan) et l’autre de 69 ans vivant depuis 39 ans à Colombus
(Ohio), produisent autant de traits du régiolecte de Virginie occidentale que des locuteurs qui ne
l’ont jamais quittée. Même s’ils ont vécu au nord la majorité de leur vie, ces deux locuteurs ont
évolué dans des réseaux sociaux « du sud ».

Le fait que les témoins des études d’Evans (2004) et de Hazen et Hamilton (2008) aient intégré de
tels réseaux sociaux est le fruit d’une conjoncture spécifique et s’apparente davantage à de la
mobilité de masse qu’individuelle. Comme le souligne Auer (2007 : 112), il est plus courant pour
les migrants de devoir abandonner leur ancien réseau, puis, éventuellement, d’en joindre un
nouveau. L’issue de cette déconstruction-reconstruction risque fort d’avoir un impact important sur
les pratiques linguistiques des locuteurs migrants, sans que la modélisation des réseaux sociaux
proposée par Milroy (1980) ne soit tout à fait adaptée à ce contexte. La manière dont le réseau
social est appréhendé dans les études présentées ci-après diffère effectivement de la modélisation
traditionnelle et constitue un exemple éloquent de la spécificité des facteurs externes qui influencent
les usages des locuteurs en situation de mobilité géographique.

Amastae et Satcher (1993) mènent une étude longitudinale auprès de 13 étudiants universitaires
honduriens installés à El Paso, au Texas, où est établie une importante communauté hispanophone
originaire du nord du Mexique. Analysant auditivement la prononciation du /n/ en finale de mot de
ces 13 locuteurs, les auteurs cherchent à déterminer dans quelle mesure le contact avec des
hispanophones locaux a pu induire une diminution du taux de vélarisation de cette consonne,

61
caractéristique présente en espagnol hondurien (le mot pan prononcé [paŋ]) mais absente de
l’espagnol du nord du Mexique ([pan]). Amastae et Satcher (1993 : 80) observent qu’après 20 mois
passés à El Paso, tous les locuteurs présentent une diminution du taux de vélarisation du /n/ en
finale de mot, mais que la diminution est nettement plus marquée chez ceux qui rapportent être
considérablement en contact avec les hispanophones locaux. Les Honduriens qui ont peu de
contacts avec les résidents de leur milieu d’accueil, ou dont le nouveau réseau social est composé
d’anglophones, ont en revanche davantage conservé leurs usages d’origine.

Conn et Horesh (2002) se penchent sur le cas de deux locuteurs, un homme et une femme, âgés
respectivement de 43 et de 36 ans, originaires du Michigan et installés à Philadelphie depuis le
début de leurs études universitaires, c’est-à-dire vers l’âge de 18 ans. Au moment de l’étude, ces
deux locuteurs sont très impliqués au sein de leur nouvelle communauté : ils y ont fondé une
famille, ce sont des membres actifs d’organisations locales telles que l’église et le système de
surveillance du quartier, et ils sont tous deux travailleurs sociaux de profession. Conn et Horesh
(2002) comparent les productions de ces deux migrants avec celles de deux groupes-contrôles, l’un
composé de locuteurs vivant encore au Michigan et l’autre de locuteurs originaires de Philadelphie,
enregistrés en vue de la parution de l’ANAE (Labov et coll., 2006). L’une des différences entre les
deux régiolectes en cause concerne le noyau de la voyelle (ow), dont le timbre est plus antérieur à
Philadelphie. Une analyse acoustique indique que les productions du locuteur migrant masculin se
distinguent de celles des témoins demeurés au Michigan et s’approchent de celles des locuteurs de
sa communauté d’accueil. À l’inverse, les productions de la locutrice s’apparentent à celles du
groupe-contrôle du Michigan. Selon Conn et Horesh (2002 : 56), l’écart entre ces deux locuteurs au
profil pourtant similaire pourrait être attribuable au public fréquenté au travail. Alors que le locuteur
est en contact avec une clientèle hétérogène, la locutrice exerce ses fonctions auprès d’un public
majoritairement afro-américain, dont le noyau de (ow) n’est pas antériorisé. Le fait d’entretenir des
contacts fréquents avec un autre groupe social que celui attendu semble donc pouvoir influencer le
processus d’acquisition d’un R2.

De Decker (2006) procède quant à lui à une étude longitudinale de quatre locutrices anglophones
originaires de la municipalité de Tillsonburg, en Ontario, amenées à s’installer à Waterloo, à
Hamilton ou à Toronto pour entreprendre des études universitaires. L’auteur s’intéresse à la
postériorisation du /æ/, un phénomène moins avancé dans la municipalité d’origine des locutrices
que dans les trois autres centres urbains. L’estimation de la fréquence de F2 à 50 % de la durée
révèle que les voyelles produites à la fin des études secondaires des locutrices (T1) présentent un
degré de postériorisation similaire. Au terme de leurs études universitaires de premier cycle (T2),

62
trois d’entre elles présentent des changements substantiels, dont deux dans le sens attendu, alors que
la quatrième demeure stable. De Decker (2006 : 71) fait remarquer qu’entre le T1 et le T2, les
pratiques sociales des locutrices changent considérablement : leur réseau ne se restreint plus aux
locuteurs de leur milieu d’origine, leur cercle secondaire est composé de pairs et non d’adultes, et la
vie nocturne avec les pairs constitue désormais une activité sociale d’importance. Seule la locutrice
dont les usages n’ont pas changé rapporte avoir conservé les mêmes activités sociales qu’autrefois
et ne pas trouver d’intérêt dans la vie nocturne.

Pour sa part, Pesqueira (2008) analyse auditivement les productions de 12 locuteurs âgés de 28 à 70
ans originaires de Buenos Aires, en Argentine, installés à Mexico pour poursuivre des études ou une
carrière. L’auteure se concentre sur le taux d’utilisation de la variante mexicaine [j] dans des mots
comme ya et pollo (déjà et poulet), les locuteurs de Buenos Aires produisant dans de tels contextes
les variantes fricatives [ʒ] ou [ʃ]. Parmi les 1380 occurrences relevées, tous locuteurs confondus,
environ un tiers de variantes mexicaines ont été produites. Pesqueira (2008) note que le taux
d’utilisation de la variante mexicaine n’est pas dénué de lien avec l’intégration des locuteurs à leur
milieu d’accueil, intégration évaluée en fonction de trois volets : la nationalité du conjoint, la
fréquence de contacts avec des Argentins et la perspective de s’établir de manière permanente à
Mexico. Il s’avère que les locuteurs produisant le plus de variantes mexicaines ont un conjoint
mexicain (par rapport à ceux dont le conjoint est argentin et ceux qui n’en ont pas), rapportent ne
pas être fréquemment en contact avec des Argentins (au-delà du conjoint) et sont établis pour de
bon à Mexico ou envisagent de le faire.

Tout comme chez les enfants, dont l’acquisition du R2 tend à s’intensifier au contact de pairs
(Tagliamonte et Molfenter, 2007) ou à être freinée par une intégration difficile (Berthele, 2002), les
contacts sociaux revêtent une importance majeure lors du processus d’acquisition des locuteurs
adultes. À quelques exceptions près (Evans, 2004; Hazen et Hamilton, 2008), les principes de
densité et de plexité des réseaux sociaux ne sont toutefois pas en jeu. Nous choisissons d’assigner à
cet ensemble de facteurs spécifiques l’étiquette intégration sociale. Une intégration positive, qui
peut se traduire par la fréquentation d’un cercle social local (Amastae et Satcher, 1993; Conn et
Horesh, 2002) et le partage de ses activités (De Decker, 2006), une diminution de la fréquence de
contact avec les locuteurs de son milieu d’origine et la perspective de s’installer de manière
permanente dans son milieu d’accueil (Pesqueira, 2008), semble ainsi favoriser l’acquisition d’un
R2. Rappelons que Reubold et Harrington (2015, 2018) constatent que la période au cours de
laquelle Alistair Cooke adopte des traits de l’anglais américain correspond à une époque de forte
intégration sociale : demande de citoyenneté, mariage avec une Américaine, etc. (voir section 2.2).

63
À l’inverse, l’acquisition se voit freinée par une intégration négative, qui peut se traduire par
l’absence de contacts avec la population du milieu d’accueil ou la fréquentation d’un autre réseau
que celui attendu (Amastae et Satcher, 1993; Conn et Horesh, 2002), une absence d’intérêt pour des
activités communes (De Decker, 2006), le maintien de forts liens avec le milieu d’origine et la
perspective de retourner s’y établir (Pesqueira, 2008).

2.4.2 Prestige
Le prestige associé à un régiolecte ou à certaines de ses variantes provient de l’évaluation qu’en
font les locuteurs naïfs. Wolfram (1997 : 120) résume cette notion en ces termes : « [s]ocially
prestigious variants are those forms that are positively valued through their association with high
status groups as linguistic markers of status, whereas socially stigmatized variants carry a stigma
through their association with low-status groups » (en italiques dans le texte original). Dans la
mesure où, en règle générale, les locuteurs cherchent davantage à adopter des traits prestigieux que
stigmatisés, certains auteurs se sont intéressés aux tendances se dégageant du processus
d’acquisition d’un R2 chez des locuteurs dont les régiolectes de départ et d’arrivée ne sont pas
réputés jouir du même prestige.

Alshangiti et Evans (2011) amènent 12 locutrices britanniques âgées de 18 à 36 ans à participer à


une tâche interactive en dyades afin d’évaluer la convergence phonétique menant éventuellement à
des changements à long terme. Ces locutrices sont originaires à parité du nord et du sud de
l’Angleterre, où sont parlés des régiolectes dont l’inventaire phonétique et le prestige présentent des
différences substantielles. Onze auditeurs expérimentés évaluent la prononciation (accent rating)
des locutrices avant, pendant et après la tâche interactive, qui réunit au sein de chaque dyade une
locutrice originaire du sud et une locutrice originaire du nord. Les résultats indiquent que les seules
locutrices qui convergent vers les usages de leur partenaire sont originaires du nord, une tendance
qu’Alshangiti et Evans (2011 : 227) attribuent au prestige relatif des deux régiolectes, celui du sud
étant évalué plus positivement.

Dans une enquête menée à la Southern Illinois University Carbondale (SIUC), Bigham (2010)
analyse acoustiquement les productions de sept jeunes adultes originaires du sud de l’Illinois qui
fréquentent la SIUC, postulant que même s’ils ne se trouvent pas en situation de mobilité
géographique, ils seront amenés à adopter le régiolecte de Chicago (nord de l’Illinois) au cours de
leurs études, en raison de la présence nombreuse de locuteurs originaires de Chicago à la SIUC,
mais surtout du statut plus prestigieux du régiolecte de cette ville. Selon Bigham (2010 : 197), que

64
les locuteurs du sud choisissent de demeurer au sud ou de s’installer ailleurs, notamment à Chicago,
au terme de leurs études, ils ont tout à gagner à adopter les traits du nord :

[…] if a Southern Illinois local moves to Chicagoland after graduation, the accommodation to
Northern speech will ease his or her acceptance into the community; if he or she stays in
Southern Illinois, the accommodation to Northern speech will more likely be positively
evaluated as “proper English” or “educated speech” […]

Il s’avère que les voyelles /u o æ ɔ/ produites en contexte /hVd/ ou /bVt/ par les sept locuteurs à
l’étude présentent effectivement des différences avec celles produites par un groupe-contrôle de 32
locuteurs du sud et un groupe-contrôle de 13 locuteurs du nord fréquentant la SIUC, des résultats
qui appuient l’hypothèse selon laquelle les locuteurs du sud étudiant à la SIUC sont en cours
d’acquisition du régiolecte de Chicago. Se fondant sur une série d’entretiens formels et informels
auprès des 13 locuteurs de Chicago étudiant à la SIUC, Bigham (2010) présume que ceux-ci sont
pour leur part peu susceptibles de modifier leurs usages, car une fois diplômés, ils souhaitent tous
retourner dans leur ville natale, où le régiolecte du sud est perçu négativement. L’examen visuel des
données provenant des productions de ces 13 locuteurs appuie effectivement l’hypothèse selon
laquelle ils ne sont pas engagés dans le changement au même titre que les locuteurs du sud.
Méthodologiquement, on peut néanmoins s’interroger sur l’absence de comparaison entre les
productions de ces locuteurs du nord installés au sud au moment de l’enquête et celles d’un groupe
vivant encore à Chicago.

Dans le cadre d’une série de travaux sur la sociolinguistique de l’urbanisation en Norvège, Kerswill
(1993) s’intéresse à un groupe de 38 locuteurs originaires de la communauté rurale de Stril installés
dans le centre urbain de Bergen. L’auteur analyse auditivement le timbre de schwas pré-pausaux
produits lors d’entretiens formels et de conversations informelles auprès des migrants et d’un
groupe-contrôle de locuteurs natifs de Bergen. Dans le lecte de Bergen, le schwa pré-pausal tend à
s’ouvrir et à s’antérioriser en contexte informel, non standard. De fait, l’auteur constate que les
locuteurs natifs de Bergen produisent moins de schwas ouverts et antériorisés en entretien formel
qu’en conversation informelle; chez les migrants, étonnamment, le rapport s’inverse. Ces résultats
pourraient refléter le fait qu’adopter le lecte de Bergen permet de projeter une image d’urbanité, et
que cette image est perçue si favorablement par les migrants et leurs compatriotes demeurés à Stril
que le statut sociolinguistique des variantes adoptées pour y arriver importe peu. Autrement dit,
« [f]or many (but not all) of the migrants, sounding like a city-dweller, even a low-status one, has a
positive value » (Kerswill, 1993 : 50).

65
Sprowls (2014) analyse les productions de 9 adultes anglophones vivant à Pittsburgh (Pennsylvanie)
depuis au moins 10 ans et originaires d’ailleurs aux États-Unis (8) et de l’Ontario (1). Deux
caractéristiques de l’anglais de Pittsburgh sont à l’étude : la fusion en [ɔ] des voyelles /ɑ/ et /ɔ/; la
monophtongaison de /aw/ en [a] devant liquides et nasales. Si le phénomène de fusion ne véhicule
pas de valeurs précises, la monophtongaison de /aw/ est stigmatisée. En plus de tâches de lecture de
texte et de mots servant à mesurer les deux premiers formants à 50 % de la durée de /ɑ/ et de /ɔ/ et à
20 % et 80 % de la durée de /aw/, un entretien explicitement axé sur l’anglais parlé à Pittsburgh
permet d’évaluer l’attitude des locuteurs à l’égard du régiolecte de leur ville d’accueil. Sprowls
(2014 : 93) constate que les 5 locuteurs de son échantillon n’ayant adopté aucune des deux
caractéristiques entretiennent une opinion négative des usages de Pittsburgh, une participante
affirmant même corriger la « mauvaise » prononciation de ses collègues. Pour ce qui est de ceux qui
produisent des caractéristiques de Pittsburgh, un locuteur a adopté la fusion des voyelles /ɑ/ et /ɔ/
seulement (ses attitudes ne sont pas rapportées), un a adopté la monophtongaison de /aw/ seulement
et deux ont adopté les deux caractéristiques. Parmi les trois qui ont acquis le /aw/ monophtongué,
un locuteur n’a pas noté de différences de prononciation à Pittsburgh et par conséquent, n’entretient
aucune opinion à ce sujet, un a orienté l’entretien de manière à discuter de l’origine historique des
spécificités de l’anglais parlé à Pittsburgh, sans émettre d’opinion, et le troisième a étonnamment
formulé des remarques négatives à propos du /aw/ monophtongué. Ainsi, à une exception près, pour
que la caractéristique stigmatisée soit acquise, l’absence d’attitude négative à son égard s’est avérée
nécessaire.

En fonction de ce qui se dégage des travaux rapportés dans cette section, le prestige associé à un
régiolecte est un facteur externe qui peut conditionner son adoption : les locuteurs semblent
davantage enclins à adopter un régiolecte prestigieux qu’un régiolecte qui l’est moins (Alshangiti et
Evans, 2011; Bigham, 2010), parfois même au point de ne pas se conformer aux règles d’usage des
variantes (Kerswill, 1993). Nous estimons cependant qu’interpréter des données au moyen de ce
facteur doit faire l’objet de précautions. D’abord, la notion de prestige est appelée à évoluer : par
exemple, certains usages peuvent gagner en légitimité au cours du temps lorsque les conditions
politiques sont favorables (Lappin, 1981). Il s’agit également d’une notion ancrée dans les pratiques
et opinions consensuelles d’une communauté linguistique composée de locuteurs natifs. Pour des
locuteurs migrants, le prestige (implicitement) véhiculé dans la communauté d’accueil peut donc
être méconnu (Labov, 1976 : 338, note 40). Par exemple, nous pourrions réinterpréter les tendances
mises au jour par Kerswill (1993) concernant l’utilisation d’une variante non standard par les
locuteurs migrants comme résultant de leur évaluation erronée ou incomplète des usages en cours

66
chez les natifs de Bergen. Il semble également que deux des trois participants de Sprowls (2014)
ayant adopté le /aw/ monophtongué n’étaient pas au fait de la stigmatisation de cette caractéristique.
Par ailleurs, la littérature sur l’acquisition d’un R2 fait état de cas où le prestige, connu ou inconnu,
est supplanté par d’autres facteurs. Par exemple, Munro et coll. (1999 : 387) mentionnent que s’il
n’en tenait qu’au prestige, les Canadiens anglophones établis en Alabama participant à leur étude
n’auraient vraisemblablement pas adopté le régiolecte alabamien (voir section 2.4.6). Rauter (2016)
parvient à une conclusion semblable dans une étude exploratoire sur l’acquisition de l’anglais
appalachien par des New-Yorkais. Or, dans les deux cas, la volonté de s’intégrer dans la
communauté semble l’avoir emporté sur une éventuelle réticence à adopter des usages peu
prestigieux. De même, Bigham (2010) présume que les locuteurs de Chicago n’adopteront pas le
régiolecte du sud de l’Illinois en raison de son manque de prestige; il est cependant difficile de
distinguer l’influence réelle de ce facteur de celle de l’intégration sociale, les locuteurs de Chicago
entendant tous retourner dans leur ville natale au terme de leurs études.

2.4.3 Intégrité et fidélité


En lien direct avec la notion abordée dans la section précédente, il convient d’établir une distinction
entre le prestige apparent et le prestige latent. Le prestige apparent correspond à la légitimité
accordée aux formes officiellement approuvées par la communauté linguistique et par les instances
langagières, tandis que le prestige latent peut être décrit en ces termes : « hidden values associated
with non-standard speech » (Trudgill, 1972 : 183). Poursuivant le questionnement entrepris dans la
section précédente, on peut donc s’interroger sur le processus d’acquisition de locuteurs pour qui
adopter des traits au prestige apparent signifie abandonner des traits au prestige latent. Dans un
même ordre d’idées, certains auteurs signalent qu’acquérir un R2 peut avoir des conséquences
négatives pour le locuteur migrant, notamment lorsqu’il est amené à retourner dans son milieu
d’origine, que ce soit de manière permanente ou temporaire. Si une perte d’intégrité est perçue chez
le locuteur, ou si une certaine pression est exercée pour qu’il demeure fidèle à ses origines, peut-être
l’acquisition d’un R2 risque-t-elle d’être plus limitée.

Dans une étude sur la sociolinguistique de l’urbanisation en Finlande, Nuolijärvi (1994) examine
l’acquisition du lecte d’Helsinki par 48 locuteurs originaires à parité des zones rurales
d’Ostrobotnie (ouest) et de Savonie (est). L’auteur précise que les lectes de l’ouest, y compris celui
d’Ostrobotnie, sont considérés comme les formes les plus archaïques du finnois. Au moment de
l’étude, le statut des locuteurs de ces deux zones rurales différait également dans l’imaginaire
collectif national. La Savonie était perçue comme une région isolée et ses locuteurs, comme un
peuple déraciné et déprécié. Les Ostrobotniens étaient plutôt considérés comme indépendants,

67
confiants, courageux et prospères. Ciblant 23 variables phonologiques et morphologiques,
Nuolijärvi (1994) constate que le plus important abandon de variantes du R1 s’est produit chez les
locuteurs originaires de Savonie. Il attribue le maintien plus important de formes du R1 des
Ostrobotniens au prestige latent dont leur lecte bénéficie, celui-ci étant certes archaïque, mais
néanmoins le fait d’individus indépendants, confiants, courageux et prospères.

Comme nous l’avons mentionné en résumant l’étude d’Alshangiti et Evans (2011), le régiolecte du
nord de l’Angleterre est considéré moins prestigieux que le régiolecte du sud. Parmi les différences
qui les opposent, on note la voyelle de STRUT et la voyelle de TRAP, prononcées [ʊ] et [æ] au nord,
et [ʌ] et [ɑː] au sud. D’après Trudgill (1986 : 18), « Northerners moving to the South and
accommodating to Southern speech usually modify butter /bʊtə/ to /bʌtə/ or at least to /bətə/, but
much less rarely modify /dæns/ to /daːns/. Many Northerners, it seems, would rather drop dead than
say /daːns/ ». Ces propos se voient corroborés par l’étude menée par Evans et Iverson (2007) auprès
d’une vingtaine de jeunes adultes originaires du nord de l’Angleterre fréquentant différentes
universités britanniques, lieux propices au contact entre régiolectes. Rappelons que les participants
ont été enregistrés avant le début de leurs études (T1), puis après trois mois (T2), un an (T3) et deux
ans (T4) de scolarité. La durée et la fréquence des deux premiers formants de voyelles extraites de
mots cibles insérés dans des phrases porteuses révèlent, pour les mots bud et cud (la voyelle de
STRUT), le processus de centralisation attendu. Pour le mot bath (voyelle de TRAP), une légère
tendance à l’ouverture et à la postériorisation au cours du temps est observée, mais aucune
modification de la durée, le paramètre qui différencie le plus les voyelles du nord et du sud. Les
auteurs exposent que les locuteurs du nord n’accordent pas de signification sociale particulière au
timbre de la voyelle de STRUT mais qu’une voyelle courte dans TRAP symbolise l’appartenance au
nord. Selon Evans et Iverson (2007 : 3814), leurs locuteurs ont donc modifié la première pour
s’intégrer et conservé la seconde pour manifester leur allégeance.

Dans le cadre d’un projet sur le nivellement régiolectal à Milton Keynes, une ville située à 67 km au
nord-ouest de Londres, fondée en 1967 et marquée par une explosion démographique (39,2 %
d’augmentation de la population entre 1981 et 1991) attribuable à l’immigration, Kerswill et
Williams (2000b : 4) s’intéressent à une éventuelle standardisation des usages chez 16 adolescents
issus de familles migrantes. Les auteurs font valoir que l’immigration signifie en quelque sorte
recommencer à neuf, tant socialement que linguistiquement, et qu’à Milton Keynes, l’adoption des
traits de la received pronunciation (RP), c’est-à-dire le standard, ne devrait pas être contrainte par
des idées préconçues typiquement véhiculées au sein de réseaux sociaux fermés. En dépit de ces
prédictions, Kerswill et Williams (2000b : 12) observent chez les adolescents issus de la classe

68
ouvrière une réticence à se conformer à la RP, perçue comme une prononciation trop chic (posh).
Malgré l’ouverture des réseaux sociaux en contexte d’immigration et l’opportunité de s’affranchir
de conceptions héritées de son milieu d’origine, la désapprobation explicite de certains usages peut
donc persister, se transmettre et faire obstacle à leur adoption.

Stanford (2008) examine quant à lui les contacts lectaux qui ont lieu chez les Sui, une minorité
ethnique du sud-ouest de la Chine, dont l’une des coutumes traditionnelles est d’unir des époux
appartenant à des clans différents. Les femmes quittent alors leur clan natal pour s’installer avec
celui de leur mari. Les membres de ces clans parlent des régiolectes qui varient finement entre eux,
notamment en ce qui a trait aux tons lexicaux. Analysant acoustiquement les productions de 11
locutrices prenant part à une tâche d’identification lexicale au moyen d’illustrations et d’objets,
Stanford (2008 : 445) constate que 10 d’entre elles ont conservé les traits de leur régiolecte
d’origine avec une très grande exactitude, malgré le fait qu’elles étaient toutes mariées depuis au
moins 10 ans. L’auteur explique que les Sui ridiculisent ouvertement les locuteurs qui sont tentés de
modifier leur prononciation; il est attendu qu’un locuteur issu d’un clan donné demeure fidèle à ses
origines, ainsi une résistance active et consciente est opposée à une éventuelle tendance à l’adoption
d’autres traits.

Les études présentées dans cette section mettent en évidence que le souci de conserver son intégrité
et de demeurer fidèle à ses origines constitue un facteur externe défavorable à l’adoption d’un R2.
Dans l’étude de Nuolijärvi (1994), le prestige latent associé à un régiolecte archaïque jugule son
abandon. Chez les locuteurs d’Evans et Iverson (2007), la fidélité à ses origines se traduit par le
maintien d’une variante spécifique, alors que d’autres variables sont plus volontiers appelées à
changer. Chez Kerswill et Williams (2000b), une perception négative de la RP qui persiste dans les
familles de la classe ouvrière bride la standardisation de l’anglais parlé par des adolescents évoluant
dans un contexte social pourtant très différent de celui de leurs parents. Quant à l’étude de Stanford
(2008), nous reconnaissons le caractère exceptionnel du cadre socioculturel dans lequel elle se situe,
mais nous estimons que les tendances qui s’en dégagent constituent un témoignage convaincant de
l’impact que peuvent avoir la désapprobation explicite du changement et un engagement conscient à
demeurer fidèle à ses origines19. La remarque suivante de Gerstenberg et Voeste (2015 : 7) résume
bien ce qui ressort de cette section concernant l’adoption (ou non) de traits possédant une certaine

19
À notre avis, les propos de Bigham (2010 : 197) concernant les locuteurs du sud de l’Illinois qui ne peuvent
que tirer profit de l’acquisition du régiolecte de Chicago doivent donc être nuancés, car l’adoption de traits
associés à une « prononciation éduquée » n’est pas systématiquement bien perçue par la communauté
d’origine.

69
valeur : « cultural conditions may take the lead: language norms may tie and constrain linguistic
choices; or individual freedom and latitude may be exploited ». Bien entendu, nous estimons
qu’interpréter des résultats au moyen du facteur que nous étiquetons intégrité et fidélité doit faire
l’objet de tout autant de précautions que le facteur prestige, en particulier dans la mesure où un
certain degré de conscience de la variation et du changement pourrait être impliqué.

2.4.4 Saillance (subjective)


Dans la section portant sur les facteurs internes régissant l’acquisition d’un R2, nous sommes
parvenue à la conclusion que la saillance d’une variable reposait davantage sur l’évaluation
d’auditeurs naïfs que sur des critères linguistiques et qu’en conséquence, il s’agissait d’un facteur
externe (2.3.2). La contribution d’Auer et coll. (1998) a déjà permis d’établir que la saillance
(subjective) d’une variable permettait de prédire, jusqu’à un certain point du moins, si elle était
sujette à changement chez les locuteurs mobiles. Trudgill (1986) s’appuie lui aussi sur des
observations empiriques pour affirmer que les variantes adoptées lors du contact entre régiolectes
doivent être saillantes. Bowie (2000) observe d’ailleurs parmi différentes variables analysées que la
plus propice aux modifications chez des locuteurs mobiles du Maryland est celle en cours de
changement dans leur R1, c’est-à-dire une variable que Trudgill (1986) définit comme saillante.
Parmi les études faisant état d’un effet du prestige ou du souci d’intégrité sur l’acquisition d’un R2,
celles d’Evans et Iverson (2007) et de Kerswill (1993) mettent en exergue le rôle de la saillance de
certaines variantes, de l’opinion qu’entretiennent consciemment les auditeurs par rapport à
différents traits du R1 ou du R2. En regard de ces points de vue convergents, l’objectif de la
présente section n’est donc pas de contester l’idée consensuelle voulant que les variables saillantes
soient propices au changement chez les locuteurs migrants, mais bien de vérifier si la saillance est
un facteur d’une absolue nécessité.

Flege et Hammond (1982) amènent 50 locuteurs monolingues de l’anglais américain à prendre part
à une tâche d’imitation en différé (delayed mimicry) d’un accent étranger. Plus précisément, ces
locuteurs lisaient des phrases porteuses en imitant un accent hispanophone sans y avoir été
préalablement exposés en laboratoire. L’hypothèse des auteurs était que les locuteurs procéderaient
à certaines substitutions segmentales audibles caractérisant la prononciation d’hispanophones
s’exprimant en anglais, comme un /z/ dévoisé dans un mot comme cheese ou un /ɪ/ tendu dans un
mot comme pig. Les auteurs ont également pris soin de mesurer le VOT des /t/ produits lors de la
tâche d’imitation, le VOT des occlusives sourdes étant plus court en espagnol qu’en anglais, bien
que cette différence ne soit pas réputée être distinctive et consciente chez des locuteurs naïfs et
monolingues. En plus des substitutions segmentales attendues, Flege et Hammond (1982) constatent

70
que les VOT produits par les locuteurs imitant l’accent hispanophone sont plus courts de 30 ms en
moyenne que ceux produits par les locuteurs anglophones d’un groupe-contrôle. Les variables
établies comme conscientes ont donc été modifiées, mais le phénomène est allé bien au-delà (sur la
convergence inconsciente sur le VOT, voir également Nielsen, 2011 [section 2.3.1] et Shockley et
coll., 2004).

Dans une étude sur la convergence phonétique, Delvaux et Soquet (2007) ont proposé à quatre
locutrices belges, originaires à parité de Bruxelles et de Liège, de lire oralement des phrases
porteuses contenant les mots pot et dix. Ce choix était motivé par le fait que les régiolectes de ces
deux villes s’opposent notamment quant au timbre du /o/ de pot et à la durée du /i/ de dix,
prononcés [po] et [dis] à Bruxelles, et [pɔ] et [diːs] à Liège, les deux variables possédant le statut de
marqueur dans le second régiolecte (Delvaux et Soquet, 2007 : 151). Ces quatre locutrices ont
ensuite répété l’expérience deux semaines plus tard, mais cette fois, après avoir produit une phrase,
une voix transmise par un haut-parleur en produisait une également. Cette voix appartenait à l’une
des deux locutrices qui n’étaient pas originaires de la même ville que la participante impliquée. En
plus des différences attendues, l’analyse acoustique des productions des quatre locutrices révèle une
différence significative sur la durée de /o/, plus longue chez les Liégeoises. Lorsqu’exposées au
régiolecte de Bruxelles, les locutrices de Liège ont diminué la durée de leurs /o/, et inversement
pour les locutrices de Bruxelles exposées au régiolecte de Liège. Comme le soulignent Delvaux et
Soquet (2007 : 158), le phénomène de convergence a donc pu être observé sur d’autres dimensions
acoustiques que celles possédant le statut de marqueur.

Dans son étude sur le lien entre perception et production en contexte de mobilité géographique,
Ziliak (2012) analyse acoustiquement des voyelles impliquées dans le Northern Cities Shift (NCS)
produites par des locuteurs sédentaires de Jasper (Indiana) et de Chicago, ainsi que des locuteurs
mobiles originaires de Jasper installés à Chicago. Dans le NCS, les voyelles /ɛ ʌ/ sont en cours de
postériorisation, le corrélat acoustique habituellement pris en compte par les chercheurs qui s’y
intéressent étant donc F2. Ziliak (2012) prend toutefois soin de mesurer F1 également et constate que
cet indice est plus élevé chez les locuteurs sédentaires de Chicago que chez ceux de Jasper, une
différence inattendue. Quant aux locuteurs mobiles, ils présentent une valeur de F2 suggérant que
l’acquisition du NCS est en cours, mais surtout, une valeur de F1 semblable aux locuteurs de
Chicago. Ils se sont ainsi adaptés simultanément aux différences acoustiques documentée et non
documentée.

71
Pardo et coll. (2012) abordent la question de la convergence phonétique à long terme entre
colocataires sur un campus universitaire américain. Cinq paires de locuteurs masculins âgés de 19 à
21 ans ont été enregistrés individuellement à quatre reprises : à la fin du mois d’août, avant de se
connaître (T1); à la fin du mois d’octobre, soit au bout de deux mois de colocation (T2); en
décembre, à la fin du semestre (T3); en janvier, au retour des vacances de Noël (T4). Lors de
chaque séance, ces 10 locuteurs ont entre autres été amenés à lire deux énoncés contenant plusieurs
caractéristiques sujettes à variation régionale en anglais américain : She had your dark suit in
greasy wash water all day et Don’t as me to carry an oily rag li e that. Quatre séquences de mots
(dark suit, greasy, oily rag et wash water) ont été extraites des énoncés produits lors des différentes
séances d’enregistrement, puis utilisées pour mettre au point un test AXB, auquel ont participé 30
auditeurs naïfs. Chaque stimulus AXB était composé de trois occurrences d’une même séquence et
la tâche des auditeurs consistait à déterminer si l’occurrence X présentait davantage de similitudes
avec l’occurrence A ou avec l’occurrence B. L’occurrence X correspondait à la production d’un
locuteur donné au T2, au T3 ou au T4, et les occurrences A et B, à celles de son colocataire lors du
même enregistrement (T2, T3 ou T4), ainsi qu’au T1. De cette manière, si une forme de
convergence entre colocataires survenait au cours du temps, l’occurrence jugée la plus similaire à
l’occurrence X ne serait pas celle produite au T1.

Dans l’ensemble, les auditeurs ont perçu que les locuteurs convergeaient au cours du temps, dans
des proportions modestes mais significativement au-dessus du seuil du hasard pour quatre des cinq
paires de colocataires. Pardo et coll. (2012 : 193-194) expliquent que la séquence dark suit a été
sélectionnée parce que certains régiolectes de l’anglais américain s’opposent quant à la présence ou
à l’absence du /r/ postvocalique de dark. Cependant, avant de se connaître, les 10 locuteurs
produisaient déjà tous un /r/ dans cette séquence, laissant les auteurs présumer qu’aucune
convergence ne serait perçue, puisque qu’aucune convergence n’avait lieu d’être. Les auditeurs ont
malgré tout décelé la présence de convergence au sein de la séquence dark suit chez deux paires de
locuteurs. La séquence greasy a quant à elle été sélectionnée parce que le /s/ peut être voisé dans
certains régiolectes de l’anglais américain. Pardo et coll. (2012 : 194) constatent que deux locuteurs
appartenant à des paires de colocataires différentes produisent effectivement une variante voisée.
Selon eux, aucun locuteur issu des deux paires concernées ne modifie pour autant sa prononciation
du /s/ entre le T1 et le T4. Pour l’une de ces deux paires, les auditeurs ont néanmoins perçu la
présence de convergence au cours du temps. Que ce soit pour la séquence dark suit ou pour greasy,
il semble s’être produit une forme de convergence qui affecte d’autres caractéristiques phonétiques

72
que celles bien audibles et largement documentées auxquelles Pardo et coll. (2012) ont limité leur
analyse.

Également dans une étude sur la convergence phonétique, Babel (2010) amène 42 locuteurs néo-
zélandais à participer à une tâche de répétition de stimuli (shadowing task) produits par un locuteur-
contrôle australien. Deux conditions expérimentales sont mises en place, la moitié des participants
étant assignés à chacune : une condition où les participants sont valorisés par le locuteur-contrôle, et
une condition où ils sont dévalorisés. L’auteure évalue également si hors laboratoire, les témoins
entretiennent une opinion positive de l’Australie. Babel (2010) explique que les différences les plus
importantes entre l’anglais néo-zélandais et l’anglais australien concernent le timbre des voyelles de
TRAP, de KIT et de DRESS, mais que selon la littérature, seules les deux premières sont saillantes,
conscientes, chez les Néo-Zélandais. En calculant, dans un espace F1/F2, la distance euclidienne
entre les productions du locuteur-contrôle et celles des participants lors d’un pré-test et lors de la
tâche de répétition, l’auteure observe que tous les locuteurs convergent vers la parole australienne,
quoiqu’à des degrés divers. Alors que la condition expérimentale n’affecte pas les résultats, les
locuteurs qui entretiennent hors laboratoire une opinion positive de l’Australie montrent une
convergence plus importante. Babel (2010) constate en outre que le degré de convergence n’est pas
le même pour toutes les variables vocaliques analysées. La voyelle suscitant la plus importante
convergence chez les locuteurs néo-zélandais est celle qui n’est pas réputée être saillante, c’est-à-
dire la voyelle de DRESS.

MacLeod (2014), qui rappelons-le, émet des réserves à propos des listes de critères visant à établir
la saillance des variables (section 2.3.2), se tourne vers une approche expérimentale pour ce faire.
Trois locutrices originaires de Buenos Aires (Argentine) vivant à Madrid (Espagne) depuis 3 mois à
1 an, ainsi que trois locutrices ayant toujours vécu à Madrid, ont pris part à une série de quatre
tâches. La première consistait en la lecture d’une liste de mots, la seconde en un test de perception,
la troisième en une tâche interactive où chaque locutrice de Buenos Aires était jumelée à une
locutrice de Madrid, et la quatrième en une nouvelle lecture de la liste de mots. Dans le cadre du
test de perception, dont l’objectif était d’établir la saillance de quatre variables consonantiques, les
participantes ont été amenées à écouter 108 paires de mots, dont 57 contenaient les variables à
l’étude. Les mots ont été produits par des locuteurs hispanophones de Buenos Aires (BA) et de
Madrid (M) et étaient présentés selon les combinaisons suivantes : BA-M, M-BA, BA-BA et M-M.
Les participants devaient alors repérer le(s) mot(s) de la paire correspondant à la norme dans leur
régiolecte d’origine et disposaient de cinq choix de réponses : le premier mot, le deuxième mot, les
deux mots, aucun mot et « je ne sais pas ». Le postulat sous-jacent à cette procédure était que les

73
mots contenant des variables saillantes seraient plus fréquemment associés au régiolecte attendu que
ceux contenant des variables moins saillantes ou n’en contenant pas (les 51 distracteurs). De fait, les
réponses des participantes ne diffèrent pas du seuil du hasard pour les distracteurs. En ce qui
concerne les quatre variables à l’étude, deux ont entraîné davantage de réponses correctes et sont
ainsi établies comme plus saillantes : l’alternance M-BA [θ]-[s] dans des mots comme caza et
cerdo; l’alternance M-BA [ʝ]-[ʃ] dans des mots comme pollo et yerba. Les deux différences moins
saillantes sont l’articulateur de /s/ dans des mots comme salud et casa, apical pour M et laminal
pour BA; le lieu d’articulation de /x/ dans des mots comme mujer et Mexico, uvulaire pour M et
vélaire pour BA.

Ces bases jetées, MacLeod (2014) vérifie si des changements ont eu lieu dans les productions des
six locutrices de la première à la seconde lectures de mots, séparées par le test de perception et une
tâche suscitant une interaction entre les locutrices de Madrid et celles de Buenos Aires. Des mesures
acoustiques telles que l’intensité relative ([θ]-[s] et [ʝ]-[ʃ]), le centre de gravité (/s/) et la valeur de F2
à l’établissement de la voyelle suivante (/x/) ont permis d’évaluer la magnitude des éventuels
changements consonantiques, de même que leur direction (convergence ou divergence par rapport
au régiolecte de l’interlocutrice). Les résultats témoignent de la présence de changements pour les
quatre variables. Les deux moins saillantes, /s/ et /x/, ont suscité la convergence, tandis que les deux
plus saillantes, [θ]-[s] et [ʝ]-[ʃ], ont suscité la divergence.

En conclusion, rappelons que l’objectif de cette section n’était pas de mettre en doute le fait que la
saillance d’une variable pouvait influencer son acquisition. D’ailleurs, les études de Flege et
Hammond (1982), de Delvaux et Soquet (2007), de Ziliak (2012) et de Babel (2010) font bel et bien
état de modifications apportées à des variables audibles, saillantes, conscientes. Néanmoins, une
différence de VOT difficilement consciente aux côtés de substitutions segmentales (Flege et
Hammond, 1982), de la convergence automatique et un changement sur des différences phonétiques
inattendues et non documentées (Delvaux et Soquet, 2007; Ziliak, 2012), de la convergence à long
terme perçue par des auditeurs naïfs sur des paramètres phonétiques autres que ceux ciblés par les
expérimentateurs (Pardo et coll., 2012), un degré de convergence supérieur pour des variables
réputées non saillantes (Babel, 2010), ou encore une tendance à la divergence sur les variables plus
saillantes et à la convergence sur les variables moins saillantes (MacLeod, 2014) laissent penser que
ce facteur n’est pas indispensable au processus d’acquisition d’un R2. Pour reprendre les termes de
Nycz (2016 : 65), il ne s’agit pas, selon toute apparence, d’un pré-requis au changement. Le
discours de certains auteurs par rapport au rôle de la saillance gagnerait donc à être nuancé,
notamment celui de Siegel (2010 : 133), qui tient les propos suivants : « in order to be acquired, a

74
variant must be salient enough to be noticed ». Si le choix de s’en tenir à des variables saillantes,
audibles, conscientes et documentées présente des avantages méthodologiques indéniables, il peut
aussi mener à sous-estimer les changements que la prononciation des locuteurs mobiles est
susceptible de subir. De même, à la lumière des tendances qui se dégagent des analyses
instrumentales présentées dans cette section, nous nous interrogeons sur la potentielle circularité
induite par les analyses strictement auditives, nombreuses parmi les études fondatrices. Peut-être a-
t-on longtemps pensé que les locuteurs migrants procédaient strictement à des modifications
audibles tout simplement parce que certains changements n’étaient pas perçus par les chercheurs.

2.4.5 Sujet de conversation


L’effet du sujet de conversation sur les pratiques linguistiques est documenté dans la littérature au
moins depuis l’étude fondatrice de Labov (2006 : 70-71 [1966]), qui use de ce facteur pour accéder
au « vernaculaire » des locuteurs. L’auteur observe effectivement que les témoins sont enclins à
produire des variantes non standards, en dépit de la formalité induite par l’entretien avec un
expérimentateur, lorsqu’ils s’expriment sur des sujets tels qu’un épisode de leur vie où ils se sont
sentis en danger de mort. Hay et Foulkes (2016) constatent que lors d’un changement en cours,
aborder un sujet récent ou ancien peut causer une alternance intra-individuelle : la variante en cours
de remplacement est davantage produite si le sujet porte sur le passé, c’est-à-dire à une époque où
cette variante était majoritaire. De manière similaire, en contexte d’acquisition d’un R2, le sujet de
conversation mène à une potentielle alternance entre le premier et le second régiolectes du locuteur
mobile. Ce facteur externe se distingue ainsi de ceux évoqués précédemment, en ce sens qu’il ne
favorise ou défavorise pas nécessairement l’acquisition. Nous jugeons néanmoins pertinent d’en
rendre compte puisque plusieurs auteurs émettent des remarques, au moins brèves, à ce propos,
entre autres en lien avec l’importance méthodologique dont ce facteur peut être investi.

Rappelons d’abord l’étude de Kobayashi (1981) à propos d’une locutrice japonaise de huit ans, qui
utilise le patron accentuel de Tokyo avec ses parents (R1) et celui de Kyoto avec ses pairs (R2). Au
cours d’une conversation avec sa mère, la locutrice adopte soudainement son R2 lorsque le sujet de
l’échange glisse sur des activités effectuées avec les pairs. Dans son étude sur l’acquisition de la
variante mexicaine [j] par des locuteurs de Buenos Aires, Pesqueira (2008 : 179) fait remarquer que
l’enchâssement de certains termes ou expressions dans un contexte régional donné peut
conditionner leur prononciation. L’auteure observe effectivement que la locution typiquement
argentine qué sé yo est très majoritairement produite avec l’une des variantes de Buenos Aires
(36/37 occurrences), alors que des toponymes et autres mots d’usage exclusivement mexicain,
comme tortilla ou quesadilla, sont généralement produits avec la variante mexicaine. Sankoff

75
(2004) effectue pour sa part un examen longitudinal des productions de deux locuteurs masculins
enregistrés tous les sept ans à partir de l’âge de sept ans dans le cadre de la série documentaire Up.
Ces deux locuteurs originaires du nord de l’Angleterre expérimentent une mobilité sociale et
géographique substantielle quoique très différente pendant cette période. Alors que Sankoff (2004)
note un maintien du timbre et de la durée de la voyelle de TRAP, la voyelle de STRUT tend à se
centraliser au cours du temps, conformément aux observations de Trudgill (1986) et d’Evans et
Iverson (2007). L’auteure observe néanmoins chez l’un des locuteurs un retour au timbre
caractéristique du nord de l’Angleterre de la voyelle de STRUT lorsqu’il aborde un sujet associé à
son passé.

Love et Walker (2013) amènent neuf Britanniques vivant aux États-Unis (Ohio) à discuter de soccer
et de football américain afin de vérifier l’effet du sujet de conversation (européen ou américain) sur
la rhoticité. L’anglais britannique est considéré comme un régiolecte non rhotique, au contraire de
l’anglais américain, et la présence de rhoticité se traduit acoustiquement par une diminution de la
valeur du F3 des voyelles concernées. Les auteures constatent que les productions des locuteurs
britanniques présentent un F3 résolument plus élevé que celui des productions de 11 locuteurs
américains également interrogés, confirmant le statut de « locuteurs non rhotiques » des
Britanniques. Ces derniers s’avèrent néanmoins produire des occurrences dont le F3 est moins élevé
de 60 Hz en moyenne lorsque la discussion porte sur le football américain, une différence
statistiquement significative et récurrente parmi les participants.

En somme, les brèves remarques formulées par ces différents auteurs, dont la variation phonétique
en fonction du sujet de conversation n’est pas, sauf pour Love et Walker (2013), le principal objet
d’étude, révèlent une influence de ce facteur sur la prononciation de locuteurs ayant acquis un R2.
Si ce facteur externe ne conditionne pas l’acquisition en tant que telle, il semble posséder un
potentiel d’activation des usages. Puisque la tâche proposée aux participants peut ainsi favoriser ou
inhiber l’utilisation d’un R2, le facteur sujet de conversation doit être soigneusement contrôlé lors
de l’élaboration de la méthodologie d’études portant sur ce phénomène et pris en compte lors de
l’analyse de données conversationnelles.

2.4.6 Âge et temps de résidence


L’âge est certainement l’un des facteurs externes les plus fréquemment exploités en
sociolinguistique variationniste, se trouvant notamment au cœur des principes de temps apparent et
de gradation d’âge (Labov, 1994 : 83). D’entrée de jeu, il convient de distinguer l’âge en tant que
facteur externe de l’âge en tant que facteur biologique. Dans le second cas, les chercheurs

76
s’intéressent par exemple à l’acquisition du langage en fonction de l’âge de l’enfant, ou à l’effet du
vieillissement sur les fonctions cognitives et le langage (Bowie, 2014). Laissant de côté le facteur
biologique, nous nous concentrerons ici sur l’âge en tant que facteur externe et de son influence sur
l’adoption d’un R2 par des locuteurs adultes. Au moins deux mesures d’âge peuvent être effectuées
auprès des locuteurs mobiles : l’âge au moment de l’expérimentation et l’âge au moment de la
migration. Obtenir ces deux types de renseignements permet ensuite d’évaluer le temps de résidence
des locuteurs dans leur milieu d’accueil, puis de vérifier si le temps de résidence et le taux
d’acquisition du R2 sont corrélés.

Munro et coll. (1999) mènent une étude sur la perception des auditeurs naïfs du processus
d’acquisition d’un R2. Deux groupes d’auditeurs, l’un originaire d’Edmonton (Alberta) et l’autre de
Birmingham (Alabama), sont amenés à évaluer la prononciation de 30 locuteurs anglophones sur
une échelle de 1 (prononciation très canadienne) à 9 (prononciation très américaine). Parmi ces
locuteurs, 10 sont originaires de l’Alabama et 20 sont originaires du Canada, parmi lesquels 10 y
vivent encore et 10 vivent désormais en Alabama. Ces 10 locuteurs migrants sont installés aux
États-Unis depuis 1 à 23 ans et y sont tous arrivés après l’âge de 18 ans afin de poursuivre une
carrière. L’évaluation de la prononciation des locuteurs par les deux groupes d’auditeurs laisse
entrevoir une polarisation des Alabamiens et des Canadiens sédentaires vers les échelons supérieurs
et inférieurs, respectivement. Quant aux Canadiens établis en Alabama, leur prononciation est
évaluée à 4,0 en moyenne par les auditeurs canadiens et à 5,8 en moyenne par les auditeurs
américains, c’est-à-dire au centre de l’échelle de 1 à 9 utilisée et à mi-chemin entre les deux groupes
de locuteurs natifs. Analysant le profil individuel des 10 locuteurs migrants, Munro et coll.
(1999 : 393) cherchent à vérifier si le score obtenu par chacun d’entre eux est lié à son temps de
résidence aux États-Unis. Au premier coup d’œil, certaines données vont en ce sens : les deux
locuteurs dont la prononciation a été jugée la plus américaine vivaient aux États-Unis depuis 10,5 et
23 ans; le locuteur dont la prononciation a été jugée la plus canadienne n’était établi en Alabama
que depuis un an et demi. Cependant, la prononciation d’un locuteur vivant aux États-Unis depuis
10 ans a été jugée nettement plus canadienne que celle d’un locuteur qui n’y était que depuis 3 ans,
et deux locuteurs vivant à Birmingham depuis à peine un an n’ont pas obtenu le score le moins
élevé. Munro et coll. (1999) parviennent à la conclusion que le temps de résidence n’est pas un
facteur qui permette une explication systématique de l’acquisition plus ou moins importante d’un
R2 par les locuteurs mobiles.

Shockey (1984) procède à une analyse auditive du remplacement de la variante battue [ɾ] par les
variantes occlusives [t] et [d] en position intervocalique (later, tidy) chez quatre locuteurs

77
américains installés au Royaume-Uni. Ces quatre locuteurs, deux hommes et deux femmes, sont
tous arrivés dans leur communauté d’accueil à l’âge adulte afin d’enseigner dans une université, et
la durée de leur séjour au moment des enregistrements va de 8 à 27 ans. L’auteure observe que la
variante américaine cède progressivement la place aux variantes britanniques chez tous les
locuteurs, bien que le processus d’acquisition soit marqué par une importante variabilité inter-
individuelle. Sans fournir de précisions supplémentaires quant au profil démographique des
témoins, Shockey (1984 : 90) affirme qu’il n’existe aucune corrélation entre le taux de suppression
de la variante battue et les facteurs suivants : âge au moment de l’enquête, âge d’arrivée au
Royaume-Uni, temps de résidence et sexe.

Pour sa part, von Essen (2016) rapporte les résultats préliminaires d’une étude menée auprès de 22
locuteurs hispanophones, parmi lesquels 4 avaient toujours vécu à Buenos Aires (Argentine),
5 avaient toujours vécu à Málaga (Espagne) et 13 étaient originaires de Buenos Aires et vivaient à
Málaga depuis au moins 8 ans. En plus de tâches de lecture, les participants mobiles ont effectué
deux entrevues chacun : l’une avec un interlocuteur argentin, l’autre avec un interlocuteur espagnol.
L’auteure se concentre sur quatre variantes possibles de la consonne /ʝ/, soit [j], [ʝ], [ʒ] et [ʃ]. Sa
classification auditive des productions des locuteurs est complémentée par des mesures de durée, de
voisement et de fréquence des passages par zéro de l’onde sonore, la valeur de ce dernier indice
étant élevée pour la fricative non voisée [ʃ], moyenne pour les fricatives voisées [ʝ] et [ʒ] et faible
pour l’approximante [j]. Les résultats révèlent dans un premier temps que la distribution des
variantes est mutuellement exclusive chez les locuteurs sédentaires, les Espagnols produisant [j]
(74,2 %) et [ʝ] (25,8 %), les Argentins [ʒ] (9,2 %) et [ʃ] (90,8 %). Les locuteurs mobiles produisent
pour leur part les quatre variantes, dont les proportions d’utilisation témoignent notamment d’un
important abandon de la variante la plus fréquente en espagnol argentin : 24,8 % de [j], 2,8 % de [ʝ],
40 % de [ʒ] et 32,3 % de [ʃ]. L’auteure observe par ailleurs que la nationalité de l’interlocuteur
semble avoir un impact sur les variantes produites, mais en raffinant son analyse, constate que ce
n’est pas le cas chez tous les participants. Seuls ceux âgés de moins de 25 ans et qui ont effectué au
moins une partie de leur scolarité à Málaga utilisent des variantes espagnoles avec l’interlocuteur
espagnol, et des variantes argentines avec l’interlocuteur argentin. Les locuteurs âgés de plus de
25 ans, parmi lesquels aucun n’a été scolarisé en Espagne, demeurent stables d’un interlocuteur à
l’autre. Les locuteurs arrivés plus jeunes en Espagne sont donc en mesure d’alterner entre les lectes
et jugent approprié de le faire, car il s’agit selon eux d’un vecteur d’intégration. Les modifications
semblent au contraire plus décisives chez les locuteurs plus âgés, et ce, indépendamment du nombre
d’années passées à Málaga.

78
Dans une étude sur la sociolinguistique de l’urbanisation en Suède, Ivars (1994) prend en note l’âge
de ses 32 témoins au moment de l’expérimentation et au moment de la migration. L’auteure
rapporte que parmi ces 32 locuteurs originaires de Närpes, une communauté rurale suédophone de
Finlande, installés dans la ville d’Eskilstuna, en Suède, les 16 locuteurs âgés au moment de l’étude
de 28 à 40 ans ont davantage adopté les traits du lecte d’Eskilstuna que les 16 locuteurs âgés de 40 à
76 ans. L’auteure fait remarquer qu’il ne ressort pas de ses données de corrélation entre le temps de
résidence et le taux d’acquisition du R2 : les locuteurs qui ont passé le plus de temps dans leur
milieu d’accueil sont les plus âgés, c’est-à-dire ceux qui ont le moins adopté de traits du lecte
d’Eskilstuna. Ivars (1994) présume que les tendances qui se dégagent de son étude sont liées à l’âge
d’arrivée des témoins en Suède, les locuteurs plus jeunes étant arrivés plus jeunes, sans toutefois
procéder à une vérification plus systématique de son hypothèse.

Également dans une étude sur la sociolinguistique de l’urbanisation, prenant place celle-là en
Norvège, Omdal (1994) s’intéresse à l’acquisition du lecte de la ville de Kristiansand par des
locuteurs originaires de la communauté rurale de Setesdal en fonction de leur âge au moment de
l’enquête. Parmi les 24 locuteurs ayant pris part à l’étude, les huit locuteurs âgés de 31 à 39 ans ont
nettement moins acquis les traits du lecte de Kristiansand que les huit locuteurs âgés de 42 à 48 ans
et que les huit locuteurs âgés de 56 à 75 ans. Omdal (1994) attribue cette tendance au changement
d’attitude national à l’égard des régiolectes ruraux s’étant produit au moment où les locuteurs les
plus jeunes se sont installés en ville : ceux-ci auraient moins senti la nécessité de se conformer aux
usages urbains que leurs aînés. Les résultats de cette étude laissent entrevoir que des spécificités
conjoncturelles peuvent l’emporter sur le temps de résidence.

De la même manière, lorsque Hazen et Hamilton (2008) interrogent six témoins originaires de
Virginie occidentale ayant vécu ou vivant encore dans le nord des États-Unis pour des raisons
économiques, ils constatent que les deux locuteurs les plus âgés ont conservé tous les traits du
régiolecte de la Virginie occidentale. Rappelons que ces deux locuteurs, âgés de 66 et de 69 ans et
vivant au nord depuis 62 et 39 ans, ont évolué dans des réseaux sociaux fermés composés
exclusivement de locuteurs originaires du sud. En revanche, le locuteur le plus jeune de
l’échantillon, âgé de 34 ans au moment de l’enquête, est celui qui présente le moins de traits du
régiolecte de la Virginie occidentale, bien qu’en réalité, il s’y soit réétabli au terme de ses études
universitaires. Or, il s’agit du seul locuteur interrogé à avoir poursuivi des études postsecondaires,
les autres ayant été forcés d’intégrer le marché du travail très tôt en raison des conditions
économiques difficiles.

79
Une étude de Hernández et Maldonado (2012) sur l’acquisition d’un R2 par des migrants
salvadoriens prend également place dans un contexte politique particulier. Trois groupes de
locuteurs adultes d’origine salvadorienne ont pris part à des entretiens sociolinguistiques : un
groupe vivant à San Sebastián (El Salvador), un groupe vivant dans un quartier de Houston (Texas)
majoritairement peuplé de Mexicains et un groupe temporairement installé dans la ville frontalière
de Brownsville (Texas). Les locuteurs de Brownsville correspondent à la définition de
transmigrants (transmigrantes, Hernández et Maldonado, 2012 : 47), c’est-à-dire qu’ils viennent
tout juste d’arriver aux États-Unis après une traversée illégale du Mexique et souhaitent atteindre
une autre ville américaine. La variable à l’étude est le /s/ en position de coda (dos, tres), réalisé [s]
en espagnol mexicain et « affaibli » [h] ou supprimé en espagnol salvadorien. Les locuteurs
sédentaires interrogés à San Sebastián produisent majoritairement les variantes salvadoriennes
(72,8 %), tel qu’attendu. Chez les locuteurs installés à Houston (temps de résidence non précisé
dans l’article), l’inverse est observé : la variante mexicaine est majoritaire (84,7 %). Les
transmigrants se situent entre les deux autres groupes, à 62,9 % d’utilisation des variantes
salvadoriennes. Si l’écart entre les productions des locuteurs de San Sebastián et de Brownsville
semble faible (9,9 %), Hernández et Maldonado (2012) précisent que le changement a eu lieu
pendant le transit en sol mexicain, au cours d’un séjour de seulement 2 à 5 semaines, où les
transmigrants ont dû user de tous les moyens possibles pour dissimuler leur nationalité et leur statut
irrégulier, et ainsi éviter la déportation. Lorsque les conditions sont réunies, un très court laps de
temps est donc nécessaire pour qu’un changement soit initié.

On note que l’âge a été exprimé jusqu’ici de manière numérique et linéaire, parfois en fonction de
regroupements plus ou moins arbitraires visant la représentativité (voir Milroy et Gordon,
2003 : 24-30). Par exemple, Ivars (1994) postule que son échantillon contient deux groupes, l’un de
16 locuteurs âgés de 28 à 40 ans, et l’autre de 16 locuteurs âgés de 40 à 76, sans que la frontière
établie à 40 ans ne soit pourtant justifiée. De la même manière, Omdal (1994) répartit ses 24
locuteurs en trois groupes de huit, dont ceux âgés de 42 à 48 ans. On peut s’interroger sur la
pertinence de ces regroupements de toute évidence post hoc, sur ce qu’ils représentent réellement à
l’échelle de la société et de la vie du locuteur. Car il est une manière différente d’appréhender le
facteur âge, qu’Eckert (1997 : 151) résume en ces termes : « a person’s place at a given time in
relation to the social order: a stage, a condition, a place in history ». Dans cette optique, l’âge est
moins exprimé de manière linéaire et d’après des regroupements arbitraires supposément
représentatifs qu’en fonction d’étapes dans la vie d’un locuteur.

80
2.4.6.1 L’émergence de l’âge adulte
En Occident, trois grandes étapes de la vie (life stages) sont généralement identifiées : l’enfance,
l’adolescence et l’âge adulte (Bigham, 2008 : 64). Ce macro-découpage comporte quelques
subdivisions supplémentaires : l’âge adulte, par exemple, se répartit entre les jeunes adultes, les
adultes moyens et les adultes âgés (young, middle, late adulthood). Qu’il s’agisse de littérature
scientifique ou d’imaginaire collectif, la conception occidentale des grandes étapes de la vie adulte
est majoritairement liée au travail : premier emploi à temps plein, promotions professionnelles,
réorientations de carrière, mentorat, retraite, etc. (Gerstenberg et Voeste, 2015 : 2; Buchstaller et
Wagner, 2018 : 3). Le passage de l’une à l’autre des étapes de la vie ne correspond donc pas à une
borne fixe et immuable sur l’échelle linéaire du temps : on peut par exemple concevoir la catégorie
des adultes âgés comme étant constituée de retraités, sans que l’âge réel des individus importe. Les
étapes de la vie et le passage de l’une à l’autre peuvent également varier en fonction du contexte
culturel et historique, ou encore de l’individu même, et donner lieu à des phases de transition plus
ou moins importantes.

Traditionnellement, on considère que la catégorie des jeunes adultes est constituée des individus
âgés d’environ 18 à 40 ans, qu’on oppose aux adolescents par la participation au marché du travail
bien sûr, mais également par la vie de couple et la parentalité (Arnett, 2007 : 68-69). Récemment,
constatant que la phase de transition entre l’adolescence et le jeune âge adulte tendait à se
prolonger, et doutant du fait que de nos jours, les individus âgés de 18 à 40 ans en soient réellement
au même stade, Arnett (2000) émet l’hypothèse qu’une nouvelle étape de la vie a fait son apparition
dans les sociétés industrialisées et post-industrialisées actuelles. Cette nouvelle étape, que l’auteur
désigne sous le terme d’émergence de l’âge adulte (emerging adulthood), regroupe les individus
d’environ 18 à 25 ans, pour qui les jalons traditionnels d’entrée dans l’âge adulte, comme la fin des
études et l’obtention d’un emploi stable, le mariage ou la vie de couple durable et la naissance du
premier enfant, sont franchis plus tard qu’autrefois20. Il ne s’agit pas, selon Arnett (2007 : 70),
d’une simple phase de transition, étant donné l’empan important couvert par cette période, qui
s’avère finalement aussi longue que l’adolescence (10-17 ans). Il ne s’agit pas non plus du simple
prolongement de l’adolescence, les individus de cette tranche d’âge bénéficiant par rapport à leurs
parents d’une liberté et d’une indépendance nettement supérieures (Arnett, 2004 : 4). Ainsi, l’auteur
définit l’émergence de l’âge adulte comme une étape :
20
Ces changements découlent d’une transformation de la société occidentale dans la seconde moitié du XXe
siècle : les conditions économiques moins précaires et la diminution du nombre d’enfants par famille
permettent aux parents de subvenir aux besoins de leurs enfants plus longtemps, la religion subit un recul
d’influence, l’espérance de vie augmente, ce qui, comme l’avance Arnett (2000 : 478-479), rend possible de
consacrer quelques années à l’exploration identitaire, etc.

81
1) d’exploration identitaire;
2) d’instabilité;
3) d’égocentrisme;
4) d’entre-deux;
5) de tous les possibles (Arnett, 2004 : 8).

Il insiste en outre sur son caractère hétérogène, attribuable à l’absence d’un ensemble de normes
établies qui régissent le mode de vie, à l’instar de celles qui rythment typiquement l’adolescence
(vie avec les parents, fréquentation de l’école secondaire, orientation vers les pairs) et le jeune âge
adulte (travail, vie de couple, parentalité). Selon Arnett (2000 : 477), « this heterogeneity makes
emerging adulthood an especially rich, complex, dynamic period of life to study ».

La théorie de l’émergence de l’âge adulte a rapidement fait son chemin au sein de la communauté
scientifique, Arnett (2007) proposant déjà, sept ans après l’article fondateur, un bilan rétrospectif de
ses avancées et applications, recensant au moins 17 champs de recherche l’ayant mise à l’épreuve 21.
À notre connaissance, Bigham (2008) est le premier linguiste (et possiblement le seul; Buchstaller
et Wagner, 2018 : 5) à exploiter le concept dans le cadre de sa thèse de doctorat. Dans un
argumentaire en faveur de la prise en compte de la théorie de l’émergence de l’âge adulte dans les
études en sociolinguistique, Bigham (2012) soutient que les cinq caractéristiques qu’Arnett (2004)
attribue aux locuteurs de ce groupe d’âge sont promptes à affecter leurs pratiques linguistiques et
appellent à reconsidérer certaines catégories d’analyse traditionnelles. Par exemple, puisque par
définition, il s’agit de l’âge de tous les possibles, les ambitions personnelles des locuteurs sont
davantage propices à conditionner leurs usages que ce qui caractérise leur mode de vie antérieur,
comme la classe sociale de leurs parents (voir également Chambers, 2009 : 190). En ce qui
concerne le facteur sexe, Bigham (2012 : 540) rappelle que le statut de la femme a rapidement
changé ces dernières décennies, une évolution qui se manifeste de manière très évidente chez les
jeunes Occidentales, dont l’accès à l’éducation, les perspectives d’emploi, l’indépendance
financière, le réseau social, les responsabilités familiales, etc., sont radicalement différents de ceux
de leurs aînées et ne se distinguent plus autant qu’autrefois de ceux des hommes, si bien que le rôle
qui est traditionnellement reconnu aux locutrices en sociolinguistique, notamment en ce qui
concerne le changement, mérite d’être revisité. Peut-on effectivement tenir pour acquis que de
jeunes femmes universitaires occidentales actuellement âgées de 18 à 25 ans tendent à user de

21
Arnett (2007 : 68) note parmi les disciplines représentées lors de la Third Conference on Emerging
Adulthood (Tucson, Arizona, 2007) la psychologie, la psychiatrie, la sociologie, l’anthropologie, l’éducation,
l’épidémiologie, les sciences de la santé, le développement humain, la géographie, les sciences infirmières, le
travail social, la philosophie, la pédiatrie, les études sur la famille, le journalisme et le droit.

82
formes linguistiques symboliques pour pallier leur importance moindre au sein de la structure
sociale ? Au-delà de telles considérations, Bigham (2012) fait remarquer que les bouleversements
rapides et profonds qui marquent la vie des locuteurs de cette tranche d’âge et qui se traduisent par
un éventail de changements (emploi, domaine d’études, lieu de résidence, fréquentations sociales,
etc.) sont fort susceptibles d’influencer les pratiques linguistiques. Dans cette optique, chez des
locuteurs occidentaux âgés d’environ 18 à 25 ans, le facteur externe âge apparaît favorable au
changement linguistique et à l’acquisition d’un R2.

2.4.6.2 Un second régiolecte en contexte universitaire


Que l’on adhère à l’idée d’une nouvelle étape de la vie ou que l’on considère que les 18-25 ans
traversent une simple phase de transition, à l’instar de certains opposants à la théorie de
l’émergence de l’âge adulte (voir Arnett, 2007), les bouleversements qui marquent indéniablement
la vie des individus appartenant à cette tranche d’âge en font une population particulièrement
intéressante pour les chercheurs qui s’intéressent à la variation et au changement linguistiques.
Récemment, les études ciblant de jeunes locuteurs acquérant un R2 en contexte universitaire ont
d’ailleurs connu une percée notable : depuis 2006, au moins six contributions portant sur ce sujet
spécifique ont été publiées (De Decker, 2006; Evans et Iverson, 2007; Bigham, 2010; Pardo et coll.,
2012; Wagner, 2012; Campbell-Kibler et coll., 2014). Quatre d’entre elles ayant déjà été résumées
au sein de l’une ou l’autre des sections de cette revue des écrits, nous nous limiterons à en rappeler
les grandes lignes, à la suite de quoi nous rendrons compte de manière plus exhaustive des deux
études supplémentaires qu’il nous a été donné de consulter.

De Decker (2006) observe le degré d’avancement d’un changement en cours chez quatre locutrices
ontariennes qui entreprennent des études universitaires dans un centre urbain d’importance. Au bout
de trois ans de scolarité, la seule locutrice dont les productions ne présentent aucun changement est
celle qui a conservé ses habitudes de vie antérieures. Evans et Iverson (2007) étudient l’acquisition
de deux variantes du régiolecte du sud de l’Angleterre par une vingtaine d’étudiants universitaires
originaires du nord de l’Angleterre. Des changements en production sont observés après trois mois,
un an et deux ans de scolarité pour une variable socialement neutre, mais assez peu pour une
variable à haute valeur symbolique. Ces changements en production ne sont pas accompagnés de
changements analogues en perception. Bigham (2010) constate chez sept locuteurs originaires du
sud de l’Illinois qui poursuivent des études dans une université de leur région d’origine fréquentée
par des locuteurs originaires de Chicago (nord de l’Illinois) une tendance à l’acquisition du
régiolecte de cette ville. L’auteur attribue le changement au prestige relatif des régiolectes en cause,
alors que les perspectives d’avenir de ces sept locuteurs, qui souhaitent pour la plupart s’établir à

83
Chicago au terme de leurs études, pourraient également favoriser l’acquisition. Pardo et coll. (2012)
s’intéressent à la convergence phonétique entre cinq paires de colocataires universitaires se
produisant sur une période d’environ cinq mois. Des auditeurs naïfs perçoivent que les colocataires
tendent bel et bien à converger au cours du temps, et ce, même s’ils sont enregistrés
individuellement. Les variables ciblées par les auteurs ne permettent pas toujours de justifier la
convergence perçue.

Wagner (2012) effectue pour sa part un examen longitudinal des productions de 13 locutrices
originaires de Philadelphie enregistrées pendant leur dernière année d’études secondaires (T1), puis
un an plus tard, alors qu’elles ont entrepris un programme universitaire (T2). Son analyse auditive
porte sur la variable (ing), qui présente un patron de variation stable au sein de la communauté
linguistique étudiée. Au T1, le taux d’utilisation des variantes standard [ɪŋ] et non standard [ɪn] est
conditionné par l’origine ethnique des locutrices. Les participantes de descendance irlandaise
produisent davantage de [ɪn] que les locutrices de descendance italienne. L’auteure fait remarquer
que si cette distinction ethnique est empreinte de signification à l’échelle locale, il pourrait en être
autrement au-delà des murs de l’école secondaire. De fait, au T2, cette différence en fonction de
l’origine ethnique des locutrices s’estompe. Un nouveau facteur conditionnant l’utilisation des
variantes standard et non standard fait son apparition : le type d’établissement universitaire
fréquenté. Alors qu’en moyenne, le taux d’utilisation de la variante standard [ɪŋ] augmente entre le
T1 et le T2, les locutrices qui fréquentent une université dont la clientèle est locale utilisent moins la
variante standard que les locutrices qui fréquentent une université dont la clientèle est nationale,
potentiellement plus hétérogène et prestigieuse. Selon Wagner (2012), lors de la transition vers les
études postsecondaires, les jeunes adultes sont donc susceptibles d’abandonner certaines pratiques
locales, en particulier si leur nouveau milieu de vie et d’études s’y prête.

Campbell-Kibler et coll. (2014) exploitent une partie des enregistrements récoltés dans le cadre du
projet OhioSpeaks, qui vise à familiariser les étudiants universitaires de premier cycle avec la
recherche en sociolinguistique en leur proposant de s’auto-enregistrer lors d’une tâche de lecture
oralisée. La parole de 109 locuteurs, tous étudiants à l’Ohio State University, originaires de cet État
et représentant dans des proportions similaires les trois régiolectes (nord, centre, sud) de l’Ohio
identifiés par Labov et coll. (2006), a été retenue pour les fins d’une analyse acoustique visant à
documenter les changements phonétiques susceptibles de se produire chez les jeunes universitaires.
Les locuteurs ont fourni divers renseignements démographiques, y compris le nombre d’années de
scolarité complétées au moment de l’enregistrement, ainsi qu’un bref compte-rendu de leurs
principales activités sociales, précisant notamment l’origine géographique des individus avec qui ils

84
étaient le plus fréquemment en contact. Campbell-Kibler et coll. (2014) analysent dans un premier
temps la voyelle de TRAP produite par les locuteurs du centre et du nord de l’Ohio, voyelle dont le
timbre est fermé et antériorisé dans le second régiolecte. Elles constatent que les locuteurs chez qui
cette caractéristique est la plus marquée sont originaires du nord et possèdent un réseau social de
locuteurs du nord, comparativement aux locuteurs du nord fréquentant un autre réseau social et aux
locuteurs du centre. Elles s’intéressent ensuite à la voyelle de PRICE, monophtonguée dans le
régiolecte du sud. Parce qu’il s’agit d’une caractéristique fortement stigmatisée, les auteures
prédisent que les locuteurs du nord et du centre seront peu enclins à l’adopter. Par conséquent, elles
limitent leur analyse aux productions des locuteurs du sud. Au sein de ce groupe, les locuteurs dont
le réseau social est composé de locuteurs du sud produisent davantage de voyelles considérées
monophtonguées que les locuteurs fréquentant un autre réseau social. De même, la
monophtongaison est plus importante chez les locuteurs qui en sont à leur troisième ou quatrième
année de scolarité, comparativement aux locuteurs de première ou de deuxième année. Selon
Campbell-Kibler et coll. (2014 : 27), cette dernière tendance suggère que l’identité régionale des
locuteurs du sud pourrait s’être accentuée en cours de scolarité. L’effet du réseau social, à première
vue sans équivoque, doit par ailleurs être nuancé. Puisque les participants ont eux-mêmes fourni des
indications à ce propos, il n’est pas impossible que ceux fortement attachés à leur région d’origine
aient surestimé le caractère régional de leur réseau, et que ce soient plutôt des facteurs identitaires
qui aient eu un impact sur leurs usages phonétiques (Campbell-Kibler et coll., 2014 : 27). Il
demeure que les productions des locuteurs dont le nouveau réseau social est ouvert sont moins
régionalement marquées, confirmant que des changements phonétiques sont susceptibles de se
produire chez les jeunes universitaires dont les habitudes de vie évoluent22.

Ces six études portant sur de jeunes locuteurs évoluant en contexte universitaire mettent en
évidence la disposition au changement linguistique qui semble les caractériser. Chaque voie
empruntée, de l’adhésion à de nouvelles habitudes de vie (De Decker, 2006), aux fréquentations
sociales (Pardo et coll., 2012; Campbell-Kibler et coll., 2014), à l’affirmation identitaire (Evans et
Iverson, 2007; Campbell-Kibler et coll., 2014) et aux perspectives d’avenir (Bigham, 2010;

22
Méthodologiquement, on peut s’interroger sur le choix des auteures d’utiliser une méthode d’extraction des
valeurs formantiques entièrement automatisée, sans correction manuelle aucune, considérant qu’elles
prétendent à l’analyse de variation phonétique fine dans un contexte où le matériel et les conditions
d’enregistrement n’ont pas été contrôlés (microphone d’un téléphone cellulaire, environnement
potentiellement bruité, etc.) et que les données sont vraisemblablement de qualité inégale. D’autre part,
restreindre l’analyse de phénomènes phonétiques à certains groupes de locuteurs sur la base d’a priori tels
que le statut des variantes nous semble un pari risqué dans le cadre d’une analyse cherchant à dégager l’effet
du réseau social sur les pratiques linguistiques des jeunes universitaires.

85
Wagner, 2012), peut mener à un profil linguistique différent. Comme le fait valoir Wagner
(2012 : 185), les changements phonétiques susceptibles de survenir pendant cette période de la vie
sont démesurément plus importants que ne le laisse présumer le court laps de temps sur lequel ils se
produisent. Mentionnons également qu’à l’exception de la contribution de Campbell-Kibler et coll.
(2014), les différentes études portant sur l’acquisition d’un R2 en contexte universitaire ont en
commun de proposer une analyse détaillée de la trajectoire individuelle d’un nombre restreint de
locuteurs. Wagner (2012 : 180) justifie une telle approche de la manière suivante : « [w]hat is lost at
the level of generalization is compensated for by a better view of the social and attitudinal factors
that might affect individuals’ linguistic change in that portion of the life span. This opens the door
to comparable studies of the same life span period ». L’hétérogénéité des profils se voit ainsi mise
en valeur et en perspective, plutôt que traitée comme du bruit.

En résumé, le facteur externe âge ne semble pas constituer un obstacle majeur à l’acquisition d’un
R2 par les adultes, comme en témoignent les nombreuses études citées dans cette section.
L’influence de ce facteur externe apparaît néanmoins complexe. Chez les locuteurs analysés par von
Essen (2016), un âge d’arrivée plus tardif se traduit par une moins grande adaptation à
l’interlocuteur, alors que les plus jeunes perçoivent l’alternance entre les régiolectes comme une
manière de s’intégrer. L’âge est également amené à interagir avec différents aspects socio-
historiques du contexte migratoire : un changement de perception nationale en cours (Omdal, 1994),
ou un niveau de scolarité et un réseau social tributaires du contexte socio-économique de l’époque
de la migration (Hazen et Hamilton, 2008) peuvent conditionner le degré d’acquisition du R2. De
plus, bien qu’intuitivement, l’on puisse supposer qu’un temps d’exposition minimal est nécessaire
pour qu’un changement s’amorce chez les locuteurs migrants, l’effet du facteur temps de résidence
n’est pas aussi simple qu’il n’y paraît. Munro et coll. (1999) observent bien de macro-tendances,
mais aucune véritable régularité n’émerge de leurs résultats, ni d’ailleurs de ceux de Shockey
(1984) ou d’Ivars (1994). L’absolue nécessité du changement mène par ailleurs les locuteurs de
Hernández et Maldonado (2012) à modifier leurs usages en seulement 2 à 5 semaines. Quant à
l’hypothèse de Bigham (2012) voulant que les adultes émergents, eux aussi le fruit d’une
conjoncture socio-historique spécifique (voir la note 20), soient particulièrement propices à
modifier leur prononciation en raison des changements et de l’instabilité caractérisant leur groupe
d’âge, elle semble appuyée par un nombre croissant d’études portant sur le changement phonétique
chez les jeunes universitaires (De Decker, 2006; Evans et Iverson, 2007; Bigham, 2010; Pardo et
coll., 2012; Wagner, 2012; Campbell-Kibler et coll., 2014). Confrontés à une multitude d’horizons

86
appelant à ce que de nombreux choix soient effectués, ces locuteurs effectuent également des choix
linguistiques.

2.4.7 Synthèse
L’acquisition d’un R2 par les locuteurs mobiles est un phénomène régi par un ensemble de facteurs
externes quelque peu différents de ceux pris en compte dans les travaux fondateurs de la
sociolinguistiques variationniste. Du traditionnel quatuor « classe sociale, ethnicité, âge et sexe »
(Wolfram, 1997), seul l’âge est fréquemment évoqué dans la littérature portant sur l’acquisition
d’un R2, alors que des facteurs moins courants et plus spécifiques tels que l’intégration sociale, le
prestige, l’intégrité et la fidélité, la saillance (subjective) et le sujet de conversation apparaissent
influents. Plus précisément, l’acquisition peut être favorisée par une bonne intégration sociale et le
statut prestigieux du régiolecte à acquérir, et défavorisée par une intégration sociale plus limitée, le
prestige moindre du régiolecte à acquérir et le souci de conserver son intégrité et de demeurer fidèle
à ses origines. Les variables saillantes sont susceptibles d’être modifiées par les locuteurs migrants,
bien qu’un ensemble d’études instrumentales suggèrent que l’acquisition ne se limite pas à ce type
de variables. Le sujet de conversation semble pour sa part détenir un potentiel d’activation de l’un
ou l’autre des régiolectes. Quant au temps de résidence dans la communauté d’accueil, il ne s’agit
pas d’un facteur qui permette d’expliquer de manière systématique le degré d’acquisition du R2.
L’âge, possiblement le facteur externe dont l’influence est la plus complexe, ne semble pas
empêcher l’acquisition chez les locuteurs adultes et pourrait même, selon la théorie de l’émergence
de l’âge adulte (Arnett, 2000) et son application en sociolinguistique (Bigham, 2012), favoriser le
changement chez les locuteurs âgés d’environ 18 à 25 ans. Adultes émergents ou jeunes adultes en
transition, les locuteurs qui entreprennent des études universitaires semblent effectivement propices
au changement phonétique.

2.5 Synthèse générale


Nous avons proposé dans ce chapitre une revue des connaissances actuelles sur le phénomène
d’acquisition d’un R2 afin de trouver réponse à nos deux questions de recherche initiales. Dans la
première partie (2.1), consacrée au processus d’acquisition chez l’enfant, il est apparu que les
usages de la communauté avaient un effet important sur ceux des jeunes locuteurs, bien que leur
trajectoire individuelle diffère et que l’input parental demeure non négligeable. La deuxième partie
du chapitre (2.2), consacrée à un ensemble d’études longitudinales documentant les usages
d’adultes confrontés à un environnement linguistique changeant, a permis de mettre en évidence
que les locuteurs étaient encore aptes au changement phonétique après l’adolescence, mais qu’une
importante variabilité inter- et intra-individuelle semblait la norme. Dans les troisième (2.3) et

87
quatrième parties (2.4), nous avons inventorié des facteurs internes et externes potentiellement
explicatifs du phénomène d’acquisition « à la carte » observé chez l’adulte (Nycz, 2015 : 470).
Dans les grandes lignes, les facteurs qui influencent l’acquisition chez l’enfant trouvent parallèle
chez l’adulte. En particulier, la complexité du système auquel les locuteurs mobiles sont exposés,
notamment la régularité de l’input, ainsi que différentes facettes de l’utilisation d’une langue en
contexte, comme la valeur consensuellement accordée aux traits, ou encore le degré d’intégration
sociale d’un locuteur, peuvent conditionner l’acquisition d’un R2. Il semble ainsi qu’un pan
important de ce processus soit attribuable au contact entre individus, plus précisément au contact
entre le locuteur en situation de mobilité géographique et la population locale. Dans le prochain
chapitre, nous présenterons ainsi des cadres théoriques qui proposent différentes conceptualisations
et interprétations des mécanismes en jeu lors du contact entre interlocuteurs.

88
Chapitre 3 : Cadres théoriques
3.1 Théorie de l’accommodation
3.2 Théorie H&H
3.3 L’effet caméléon ou la convergence automatique
3.4 Théorie des exemplaires
3.5 Synthèse

La parole est d’abord et avant tout un acte social, qui se produit lorsque des individus entrent en
contact. Bon nombre des phénomènes qui affectent la parole tirent leur origine de ce contact, y
compris, comme nous le proposons, le phénomène d’acquisition d’un R2 en situation de mobilité
géographique. L’interlocuteur doit donc être considéré comme une potentielle source de variation
intra-individuelle. Dans ce chapitre, nous tracerons les grandes lignes de quatre cadres théoriques
qui permettent de prendre en compte cet effet de l’interlocuteur sur les usages phonétiques du
locuteur, et qui offrent des points de vue différents sur la question, car issus de domaines différents :
la théorie de l’accommodation, la théorie H&H, l’effet caméléon et la théorie des exemplaires.

3.1 Théorie de l’accommodation


La théorie de l’accommodation est un courant de pensée influent en psychologie sociale du langage
développé à partir des années 1970 par Howard Giles et ses collaborateurs. Dans ses premières
moutures, cette théorie se veut une critique de la potentielle circularité contenue dans l’étude
fondatrice de Labov (2006 [1966]) dans le Lower East Side new-yorkais. Selon Giles (1973 : 88-
89), il n’est pas impossible qu’une partie de la variation qui y est observée relève moins du style de
parole ou de la classe socio-économique du locuteur, comme Labov (2006 [1966]) le propose, que
d’une réponse aux changements que l’expérimentateur a lui-même (inconsciemment) apportés à ses
usages. Giles (1973) estime probable que l’expérimentateur, guidé par ses hypothèses de recherche,
a rendu plus ou moins formelle sa parole lorsqu’il attendait de ses témoins une parole plus ou moins
formelle, ceux-ci s’adaptant en conséquence. En somme, le postulat central sur lequel se fonde cette
critique est que le locuteur procède à un ajustement de ses productions en fonction de son
interlocuteur.

Dans la première étude empirique à alimenter directement la réflexion au centre de ce qui sera
nommé rétrospectivement la speech accommodation theory (SAT, Gallois et coll., 2005 : 122),
Giles (1973) propose qu’un locuteur dispose d’un répertoire d’usages composant un continuum dont
l’une des extrémités est occupée par une forme prestigieuse, dénuée de caractéristiques régionales et
l’autre extrémité, par une forme moins prestigieuse, très régionalement marquée. Le locuteur peut
alors faire preuve de mobilité sur le continuum à sa disposition en dépouillant sa parole de

89
caractéristiques régionales ou en les accentuant. Ultimement, le moteur de cette mobilité est la
convergence ou la divergence par rapport à l’interlocuteur.

La notion de convergence repose essentiellement sur le principe de similarité-attraction (Byrne,


1961). Dans son expression la plus simple, ce principe renvoie au fait que plus les attitudes,
croyances et comportements d’un individu A sont similaires à ceux d’un individu B, plus l’individu
B sera attiré par l’individu A. Les individus sont alors susceptibles d’augmenter la similarité entre
eux, un comportement qui peut refléter un désir d’approbation sociale, et la convergence
linguistique constitue l’une des stratégies possibles pour atteindre une plus grande similarité. La
notion de divergence repose quant à elle sur le principe de la distinction intergroupe, issu de la
théorie de l’identité sociale (Tajfel, 1974; Tajfel et Turner, 1986). Cette théorie propose que
lorsqu’ils entrent en contact, des individus appartenant à des groupes différents s’évaluent
mutuellement en fonction de ce qui les distingue. Ces éléments distinctifs qui constituent la
spécificité d’un groupe sont favorablement perçus et par conséquent, tendront à être préservés, mis
de l’avant, voire accentués. Sur le plan linguistique, un phénomène de divergence peut se produire
lorsque des locuteurs d’un lecte minoritaire cherchent à manifester leur spécificité en présence de
locuteurs du lecte majoritaire. Giles et Powesland (1975) ajoutent que le maintien des usages, quels
que soient ceux de l’interlocuteur, est également possible, une stratégie dont les motivations sont
similaires à celles de la divergence. Selon Coles-Harris (2017 : 12), la prise en charge intégrale de
la divergence dès les premières versions de la théorie de l’accommodation demeure un avantage du
modèle comparativement à certains autres, qui ne rendent compte que de la convergence (voir
section 3.3).

L’étude de Giles (1973) porte sur la parole de 13 locuteurs masculins âgés de 17 ans en moyenne,
originaires de Bristol (Royaume-Uni), enregistrés à leur insu alors qu’ils sont invités à s’exprimer
sur des questions relatives à la loi et à la peine de mort. Ces locuteurs sont interrogés une première
fois en présence de l’auteur, c’est-à-dire un homme plus âgé qu’eux utilisant un lecte considéré
prestigieux (la received pronunciation ou RP), et une seconde fois en présence d’un homme de 17
ans comme eux, issu de la classe ouvrière et s’exprimant, selon l’auteur, avec un fort accent de
Bristol. L’évaluation d’extraits de parole par 18 auditeurs naïfs suggère que les locuteurs ont
modifié leur prononciation de manière à la rapprocher de celle de l’interlocuteur en présence,
faisant ainsi acte de convergence. Giles (1973 : 90) précise que sur l’échelle sociale, cette
convergence est soit ascendante (vers la RP, le lecte le plus prestigieux), soit descendante (vers le
lecte le moins prestigieux, celui de Bristol).

90
Jusqu’ici, l’interlocuteur n’a été présenté que comme un allocutaire passif aux usages fixes. Giles
(1973) reconnaît cependant que lors d’une interaction, les deux locuteurs sont susceptibles de
modifier leurs usages. L’atteinte d’un juste équilibre pourrait effectivement résulter de la
convergence descendante d’un locuteur d’un lecte prestigieux et de la convergence ascendante d’un
locuteur d’un lecte moins prestigieux. Giles et Powesland (1975) suggèrent également que
l’auditeur évalue activement l’acte d’accommodation. Cette évaluation repose sur le principe
d’attribution causale (Kelley, 1973), qui propose que l’on interprète le comportement d’un individu
(voire cet individu même) en fonction de ce que l’on pense être les intentions et motivations
derrière son comportement. Dans cette perspective, l’acte d’accommodation est moins jugé pour
son résultat que pour ce qui l’a provoqué. Par exemple, si l’auditeur présume que le locuteur fait
volontairement l’effort de converger, l’acte d’accommodation sera positivement accueilli. S’il a des
raisons de penser que le locuteur converge sous la contrainte ou pour se moquer de lui, l’acte
d’accommodation sera perçu négativement. De la même manière, si l’auditeur perçoit que le
locuteur maintient ses usages par manque d’effort, l’interaction sera mal évaluée. Si le maintien se
voit plutôt justifié par une impossibilité du locuteur à converger, par exemple par manque de
compétences linguistiques dans un contexte inter-langues, l’interaction ne sera pas évaluée
négativement. Elle peut même être positivement perçue si en lieu et place de convergence, de
simples excuses de ne pas être en mesure de s’adapter sont exprimées (Giles et Powesland,
1975 : 161).

En regard de cette perception variable de l’acte d’accommodation et de la possibilité que celui-ci


résulte d’une convergence bilatérale visant un juste équilibre, Giles et Powesland (1975) formulent
l’hypothèse que l’accommodation n’ait pas à atteindre un seuil maximal, mais optimal. Cette idée
est en outre appuyée par un principe issu de la théorie des échanges sociaux (Homans, 1961 : 57-
61), selon lequel un locuteur doit tenir compte aussi bien des gains permis par l’acte
d’accommodation que des coûts encourus. Contrairement au principe de similarité-attraction, qui ne
prévoit que des bénéfices, la théorie des échanges sociaux reconnaît que l’accommodation peut
comporter des désavantages que le locuteur est tenu d’évaluer, comme un effort accru pour
s’exprimer ou une perte d’intégrité perçue. Giles et Smith (1979) s’attachent à mettre à l’épreuve
l’idée d’un seuil optimal dans la première contribution portant sur une situation d’accommodation
entre deux régiolectes : l’anglais canadien et l’anglais britannique. Il s’agit de la première étude à
explorer non plus l’accommodation verticale (impliquant des sociolectes), mais horizontale, où les
lectes en jeu jouissent du même prestige (Foreman, 2003 : 24).

91
Giles et Smith (1979) amènent un locuteur anglo-canadien à lire oralement un texte de 120 mots à
propos du système scolaire ontarien. Huit versions de ce texte sont produites : dans la première, le
locuteur fait mine de s’adresser à un auditoire nord-américain (condition sans accommodation); lors
des sept lectures suivantes, le locuteur prétend s’adresser à un auditoire britannique, pour lequel il
s’accommode de très peu (lecture 1) à beaucoup (lecture 7). Ces sept degrés d’accommodation
correspondent à différentes combinaisons d’ajustements par rapport à trois paramètres : le contenu,
la prononciation et le débit. Vingt-huit auditeurs britanniques, pensant que le locuteur cherche
réellement à expliquer à des Britanniques le fonctionnement du système scolaire ontarien, sont alors
amenés à évaluer les différentes lectures en fonction de cinq critères : l’efficacité du message,
l’effort d’accommodation, le degré de prise en compte de son auditoire par le locuteur, son
amabilité perçue et dans quelle mesure les auditeurs seraient enclins à coopérer avec lui. Les
résultats indiquent qu’une diminution du débit est l’acte d’accommodation le plus favorablement
perçu. De plus, appuyant l’hypothèse des auteurs, la lecture la plus accommodée (7) n’est pas la
plus favorablement perçue. En fait, la lecture la plus positivement évaluée est celle où il y a
accommodation sur le débit et le contenu, mais non sur la prononciation. Giles et Smith (1979 : 62)
interprètent ce résultat à la lumière du principe de distinction intergroupe : « [a]ccording to Tajfel’s
theory outlined earlier, English listeners may have felt that they were losing their cultural
distinctiveness as the Canadian adopted perhaps the most distinguishing linguistic attributes of their
group identity—a ‘British’ accent ». En plus de confirmer l’hypothèse d’un seuil optimal, cette
étude suggère que l’accommodation peut être envisagée comme un continuum multidimensionnel
comprenant divers degrés d’ajustement par rapport à différents paramètres linguistiques. Par
exemple, le locuteur est libre de converger vers son interlocuteur par rapport à certains éléments
pour gagner son approbation, tout en divergeant par rapport à d’autres éléments pour conserver son
intégrité ou accentuer sa spécificité.

Thakerar et coll. (1982) rapportent quant à eux une situation expérimentale où des infirmières de
statut supérieur interagissent avec des infirmières de statut inférieur, leur statut respectif étant
déterminé par l’ampleur de leur expérience professionnelle. Amenées à discuter d’une question
éthique relative à leur profession, puis à écouter l’enregistrement de leur interaction, les locutrices
rapportent avoir conscience de la différence de statut impliquée et considèrent que la forme de
l’échange est appropriée et légitime. Lorsque des auditeurs naïfs évaluent à leur tour les
enregistrements, ils reconnaissent qu’un changement linguistique s’opère chez les infirmières des
deux statuts : les infirmières de statut supérieur diminuent leur débit et utilisent un lecte perçu
moins standard, alors que les infirmières de statut inférieur augmentent leur débit et utilisent un

92
lecte perçu plus standard. Dans les faits, il résulte de ces échanges un phénomène de divergence.
Pourtant, le but poursuivi par les locutrices en modifiant leurs usages est de les rapprocher de ceux
de leur partenaire. Thakerar et coll. (1982 : 235) émettent l’hypothèse qu’en réalité, les locuteurs
convergent ou divergent moins par rapport aux usages réels de leur interlocuteur qu’à l’image ou au
stéréotype qu’ils en ont, accusant ainsi une rupture entre l’accommodation psychologique et
l’accommodation linguistique.

En outre, Thakerar et coll. (1982) ajoutent une nouvelle dimension à la théorie en introduisant une
distinction entre la fonction affective de l’accommodation et sa fonction cognitive. La fonction
affective, celle décrite jusqu’ici, qui propose que la convergence a pour but de gagner l’approbation,
et la divergence ou le maintien, d’accentuer la spécificité des groupes, est opposée à une fonction
qui viserait plutôt l’efficacité de la communication. La convergence est alors entrevue comme un
moyen de faciliter la compréhension, par exemple dans une situation de travail où un travailleur
plus expérimenté explique un nouveau concept à un collègue moins expérimenté. La divergence ou
le maintien sont plutôt utilisés pour éviter l’incompréhension. Par exemple, un locuteur s’exprimant
dans une langue seconde pourrait momentanément exagérer son accent étranger ou faire mine de
chercher ses mots pour rappeler à son interlocuteur que celui-ci doit conserver un code linguistique
approprié à la situation, avant de revenir à son accent étranger ou à sa rapidité d’accès lexical réels
(Gallois et coll., 2005 : 126).

Les études rapportées jusqu’ici s’inscrivent dans ce que Gallois et coll. (2005) identifient comme la
première phase de développement de la SAT. À l’origine, la théorie est conceptualisée dans le but
de rendre compte des mécanismes psycho-sociaux motivant le processus d’accommodation
linguistique. Ses développements subséquents témoignent du fait que la dimension psycho-sociale
de la théorie tend à se déployer, au détriment semble-t-il de la dimension linguistique. Par exemple,
Giles et Smith (1979) envisagent certes l’accommodation comme un continuum multidimensionnel
où se négocient les tensions entre différentes facettes de l’identité individuelle et sociale du locuteur
et de l’auditeur, mais sont fort avares de détails concernant les paramètres linguistiques impliqués
dans leur étude : on ne sait rien ni de l’ampleur des écarts caractérisant un paramètre donné, ni des
mesures utilisées, ni de l’habileté du locuteur à adopter des traits britanniques, quels que soient ces
traits, alors que des différences relatives au contenu, à la prononciation et au débit sont traitées sur
un pied d’égalité. Thakerar et coll. (1982 : 249) considèrent quant à eux que leur contribution donne
à la théorie de l’accommodation une perspective sur les faits de langue plus psycho-sociale que
jamais, car en plus de proposer un traitement séparé de l’accommodation psychologique et de
l’accommodation linguistique, cette dernière dimension se trouve réduite à une abstraction, à un

93
stéréotype issu de l’imaginaire du locuteur. Poursuivant la réflexion de Coupland (1984 : 50), qui
rappelle qu’une théorie sur l’accommodation linguistique ne saurait être complète sans une analyse
fine des éléments linguistiques qui sont manipulés, on peut s’interroger sur le futur que réserve la
SAT à la discipline qui lui a pourtant fourni son matériau originel.

Dans ce qui sera considéré comme l’une des applications parmi les plus détaillées et systématiques
de la théorie de l’accommodation à un objet d’étude linguistique (Trudgill, 1986 : 4; Foreman,
2003 : 26), Coupland (1984) propose une analyse auditive de l’accommodation d’une locutrice
britannique dans le cadre de son travail en fonction de quatre variables linguistiques bien définies :
(h), (t intervocalique), (ng) et (cluster consonantique). La présence de ces éléments est considérée
comme relevant d’un registre standard et leur absence, d’un registre non standard. Coupland (1984)
formule l’hypothèse que lors d’une relation employé-client, le principal acte d’accommodation qui
devrait avoir lieu est la convergence de la part de l’employé, afin de faciliter la transmission du
message (Thakerar et coll., 1982) et de gagner l’approbation du client23 (Byrne, 1961). Pour son
analyse, l’auteur dispose d’enregistrements d’interactions de deux à dix minutes entre une agente de
voyage et 51 de ses clients, tous originaires de Cardiff, au Royaume-Uni. La locutrice savait être
enregistrée, mais pensait que seules les productions de ses clients seraient analysées. Conformément
à l’hypothèse de départ, une forte corrélation positive est observée entre les usages de l’employée et
ceux de ses clients, les coefficients de corrélation allant de 0,76 pour la variable (cluster
consonantique) à 0,90 pour la variable (ng). L’auteur cherche également à déterminer si
l’accommodation repose sur une correspondance directe, variable par variable, des formes
linguistiques (direct linguistic matching), ou sur l’idée que se fait la locutrice des usages de son
interlocuteur avant même de lui avoir adressé la parole, de son interprétation de l’échange en cours
et de l’image sociale qu’elle souhaite projeter (interpretive). Une analyse plus approfondie de
certaines interactions révèle la présence de ces deux types d’accommodation. Dans un passage, la
convergence de la locutrice constitue effectivement une réponse aux usages de l’interlocuteur et
concerne une variable isolée. Dans un autre passage, l’auteur note chez la locutrice une brusque
intensification de l’utilisation de variantes non standards lorsque la conversation glisse sur un sujet
rendant complices l’employée et ses clients, suivie d’un retour à la normale quand l’échange
reprend un aspect plus professionnel, changement de registre auquel les clients n’emboîtent pas le
pas.

23
Coupland (1984) précise que dans un tel contexte, ces deux finalités doivent être atteintes parce que
l’employé est rémunéré pour y arriver, et non parce qu’il cherche une forme de gratification sociale.

94
Cette contribution de Coupland (1984) montre tout le potentiel offert par la SAT en phonétique et
en linguistique de manière plus générale. Elle permet de confirmer ou de nuancer certains postulats,
par exemple l’hypothèse de Thakerar et coll. (1982), selon laquelle les locuteurs s’accommodent à
l’image qu’ils entretiennent de leurs interlocuteurs. L’auteur observe bel et bien ce qu’il nomme de
l’accommodation de type interpretive, mais il ne s’agit pas de la seule stratégie utilisée par la
locutrice, qui apparaît par moments sensible à l’utilisation de variantes linguistiques précises.
Coupland (1984 : 66) plaide également en faveur d’études spécifiquement consacrées à
l’accommodation de la prononciation, car selon lui, en raison de leur forte charge de signification
sociale, les variantes phonétiques et phonologiques ne sauraient être traitées au même niveau que
d’autres éléments propices à l’accommodation mais socialement moins signifiantes comme la
longueur des énoncés ou le débit.

Gallois et coll. (2005 : 130) signalent que l’année 1987 marque un tournant disciplinaire pour la
théorie de l’accommodation. Giles et coll. (1987 : 41) étendent alors la portée du cadre interprétatif
de la SAT en y intégrant un ensemble de phénomènes se rapportant aux dimensions discursives et
non verbales des interactions sociales, et proposent de nommer communication accommodation
theory (CAT) cette version du modèle théorique beaucoup plus globalisante que les précédentes. La
CAT constitue désormais « an integrated, interdisciplinary statement of relational processes in
communicative interaction », une interface entre langue, communication et psychologie sociale
(Giles et coll., 1991 : 2). Elle est alors mise à profit pour rendre compte de processus
communicationnels interpersonnels, interculturels, interethniques, intergénérationnels, ayant lieu en
milieu de travail, en contexte éducatif, dans les médias, au sein de communautés virtuelles, etc.
(Giles et coll., 1991; Gallois et coll., 2005; Hordila-Vatamanescu et Pana, 2010; Soliz et Giles,
2014 : 114).

Après le virage transdisciplinaire de la CAT, contrairement à ce que souhaitait Coupland (1984), les
études consacrées spécifiquement à la prononciation et mettant à profit ce cadre d’analyse sont
virtuellement inexistantes; celui-ci est plutôt exploité pour rendre compte de phénomènes comme
« bilingual speech behaviour and paralinguistic phenomena such as intonation patterns, utterance
length, speech rate, pause length, back-channelling, turn-taking » (Foreman, 2003 : 26), « posture,
gesture, eye contact and amount of joking » (Siegel, 2010 : 70). Par ailleurs, certaines des
possibilités d’analyse désormais offertes par la CAT l’exposent à la critique. On lui reproche
notamment de permettre d’attribuer tout type de motivation à tout type de comportement. Un
exemple rapporté par Foreman (2003 : 26) est celui d’un locuteur faisant une blague qui offense son
partenaire. Dans le cadre de la CAT, un chercheur pourrait interpréter cet acte comme la mise en

95
place d’une stratégie de contrôle interpersonnel, c’est-à-dire une manière pour le locuteur de
prendre le contrôle du rôle que sera amené à jouer son partenaire dans l’interaction. Cependant,
cette blague offensante pourrait simplement résulter du sens de l’humour inhabituel du locuteur ou
d’une mésinterprétation de la situation en raison d’un manque d’habiletés sociales. Siegel
(2010 : 73) illustre pour sa part cet état de fait en rappelant que la CAT prédit que lors d’un échange
impliquant un rapport de pouvoir comme celui entre un employeur et un employé, l’individu au
statut inférieur convergera vers l’individu au statut supérieur… à moins que des facteurs personnels
ou situationnels ne viennent renverser la tendance. Dès lors, dans la mesure où « virtually anything
a speaker does or says can be labelled as a form of accommodation », Foreman (2003 : 26)
s’interroge sur la validité d’une théorie apparemment non réfutable.

Au-delà de telles critiques et de quelques cas où le recours à la CAT est jugé abusif ou erroné par
Meyerhoff (1998), la théorie de l’accommodation demeure influente en linguistique, entre autres
après que Trudgill (1986), dans un ouvrage phare portant sur les conséquences du contact entre
régiolectes, notamment dans une perspective historique, s’inspire de la SAT pour introduire le
principe d’accommodation à long terme24. Selon l’auteur, l’accommodation à long terme est le
mécanisme à la base du changement linguistique amené à se produire lors du contact entre locuteurs
de régiolectes mutuellement intelligibles. Dans la pensée de Trudgill (1986), l’accommodation à
long terme est le fruit d’une accumulation d’actes d’accommodation à court terme comme ceux
envisagés dans le cadre de la théorie originale, et le changement est considéré effectif lorsque le
locuteur mobile adopte des variantes du R2 même en l’absence de locuteurs de ce régiolecte.
Autrement dit, si l’accommodation d’un locuteur face à un régiolecte donné survient de manière
suffisamment fréquente, alors l’accommodation peut devenir permanente, particulièrement, comme
le précise Trudgill (1986 : 39), si des facteurs attitudinaux positifs sont à l’œuvre.

Que l’acte d’accommodation puisse mener au changement constitue certainement la plus importante
différence entre la SAT et la thèse de Trudgill (1986), l’accommodation étant considérée dans la
théorie originale comme un acte temporaire et réversible, ajusté lors de chaque interaction. Pour le
reste, l’accommodation à court et à long termes reposent essentiellement sur les mêmes assises, la
seconde théorie bénéficiant parfois de légers ajustements. Par exemple, des deux grands principes –
convergence et divergence – que comporte la SAT, la théorie de l’accommodation à long terme ne

24
On attribue à Trudgill (1986) l’élaboration théorique du principe d’accommodation à long terme comme
source de changement individuel en situation d’acquisition d’un R2, mais Auer et Hinskens (2005 : 336)
soulignent qu’un tel scénario pour expliquer le changement phonétique existe de longue date et citent à ce
sujet le linguiste allemand Hermann Paul (1870), figure du mouvement néogrammairien.

96
prend en compte que la convergence. On note également que l’auteur considère que la convergence
est favorisée par des facteurs attitudinaux positifs, ce qui n’est pas incompatible avec le principe de
similarité-attraction au cœur des premières modélisations de la SAT. L’hypothèse selon laquelle le
locuteur converge vers l’image de son interlocuteur, proposée par Thakerar et coll. (1982), trouve
également écho dans la théorie de l’accommodation à long terme. Trudgill (1986 : 11) ne prétend
effectivement pas qu’un locuteur acquérant un R2 adopte absolument tous les usages de son
interlocuteur; au contraire, pour être adoptés, les traits doivent revêtir une certaine valeur
symbolique. Selon l’auteur, ce sont les variantes qui possèdent le statut sociolinguistique de
marqueur (Labov, 1976 : 419) qui seront adoptées. De plus, l’accommodation à long terme est
envisagée comme un processus parfois bilatéral, parfois unilatéral. Lorsqu’un locuteur
individuellement mobile s’installe au sein d’une nouvelle communauté, il est fort probable que ce
soit lui qui s’adapte aux usages de la majorité plutôt que l’inverse : il y a donc convergence
unilatérale. Lorsqu’il s’agit de mobilité de masse, sans qu’il n’y ait d’usages majoritaires, par
exemple en situation de colonisation, alors l’accommodation peut être bilatérale. Enfin, bien qu’il
considère que la source du changement est avant tout attitudinale, Trudgill (1986 : 21-23) admet la
possibilité que la fonction cognitive de l’accommodation proposée par Thakerar et coll. (1982) soit
parfois en jeu. Par exemple, dans son analyse des productions de locuteurs américains installés au
Royaume-Uni, Shockey (1984) observe qu’en position intervocalique, les occlusives [t] et [d]
remplacent peu à peu la battue [ɾ] du système original des locuteurs afin d’éviter les quiproquos, les
auditeurs britanniques s’attendant à ce que des mots comme putting et pudding soient distincts.

En résumé, la théorie de l’accommodation initialement élaborée en psychologie sociale du langage


devient à partir de 1987 une interface multidisciplinaire axée sur les processus communicationnels.
Les contributions de Giles et coll. (1987) et de Giles et coll. (1991) permettent un redéploiement du
cadre interprétatif de la théorie de l’accommodation dans des domaines aussi divers que les
échanges intergénérationnels et les médias, et aussi actuels que les communautés virtuelles.
Néanmoins, qu’il s’agisse de la SAT ou de la CAT, la visée centrale de ces théories n’est
résolument pas linguistique. Il n’est donc pas très étonnant que certains chercheurs de ce domaine
aient appelé à ce que soient menées des analyses du processus d’accommodation plus sophistiquées
sur le plan linguistique (Coupland, 1984 : 50; Trudgill, 1986 : 3) et qu’au final, la théorie y ait
connu un développement parallèle. Entre autres, s’inscrivant dans le prolongement de la SAT,
Trudgill (1986) propose le principe d’accommodation à long terme, une hypothèse fréquemment
mise de l’avant dans différentes études ultérieures portant sur l’acquisition d’un R2 (Siegel,
2010 : 19). Dans cette perspective, le changement linguistique survenant en situation de mobilité

97
géographique résulte d’une accumulation d’actes de convergence généralement motivés par des
facteurs attitudinaux positifs.

3.2 Théorie H&H


La théorie H&H (hypo- and hyper- speech theory) de Lindblom (1990) aborde la question des
conséquences linguistiques du contact entre individus selon un angle avant tout phonétique. Cette
théorie s’inscrit dans le vif débat qui, à l’époque, anime les phonéticiens autour du problème de
l’invariance. Se détachant des réflexions issues de la théorie motrice (Liberman et Mattingly, 1985),
de la théorie quantique (Stevens, 1989) et de la perspective réaliste directe (Fowler, 1986), qui
postulent que la clé de l’invariance est contenue dans le signal, Lindblom (1990 : 430) propose un
modèle où l’information devant indispensablement être véhiculée par le signal dépend en grande
partie de l’information hors signal et des exigences de la situation de communication immédiate.
Selon la théorie H&H, le locuteur ajuste ses productions en fonction de ces contraintes (ou de
l’interprétation qu’il s’en fait), afin de leur assurer un potentiel discriminant suffisant pour
permettre à l’auditeur l’accès au lexique. Par conséquent, le locuteur adapte constamment sa parole,
l’étendue des formes produites composant un continuum dont les extrémités sont constituées de
formes hypoarticulées (hypospeech) et hyperarticulées (hyperspeech). Ces extrêmes peuvent être
définis au moyen des principes illustrés par la Figure 5.

Hypoarticulation Hyperarticulation
Principe moteur économie plasticité
accès au lexique
Focalisation système sortie (output )
Bénéficiaire locuteur auditeur
Figure 5 : Continuum de l’hypoarticulation à l’hyperarticulation. Figure inspirée de la
contribution de Lindblom (1990)

L’hypoarticulation implique le principe d’économie, dont bénéficie surtout le locuteur, et la


primauté est accordée à l’aspect systémique de la parole. À l’inverse, l’hyperarticulation fait appel à
la plasticité du système moteur et à son caractère prospectif, anticipatoire, orienté vers la sortie
(output), dont le principal bénéficiaire est l’auditeur. Concrètement, la théorie H&H prédit qu’en
situation d’hyperarticulation, la durée et l’amplitude des gestes articulatoires augmentent, réduisant
de ce fait leur chevauchement temporel. Sur le plan acoustique, si l’on prend l’exemple du système
vocalique d’un locuteur, l’hyperarticulation entraînera son extension dans l’espace acoustique, et
l’hypoarticulation, sa réduction (à ce propos, voir également Harmegnies et Poch-Olivé, 1992).
L’étude du clear speech, qui s’inscrit dans le prolongement de la théorie H&H, constitue encore
aujourd’hui un champ de recherche actif (Smiljanić et Bradlow, 2009).

98
En ce qui concerne la modélisation du changement phonétique à la lumière de la théorie H&H,
Lindblom et coll. (1995) proposent un scénario où l’innovation résulte de la sélection, parmi
l’étendue de la variation, de formes en fonction de contraintes. Les formes compatibles avec les
contraintes sont davantage susceptibles de « survivre ». D’inspiration darwinienne, cette conception
rappelle également certains éléments du modèle d’Ohala (1981, 1989, etc.), pour qui le changement
est issu de la variation synchronique et résulte d’une confusion du bruit et du signal par l’auditeur.
Pour Lindblom et coll. (1995), le locuteur comme l’auditeur ont un rôle à jouer dans le processus de
changement phonétique. En effet, selon la théorie H&H, le locuteur ajuste constamment ses
productions, exposant l’auditeur à un signal hautement variable. L’auditeur possède quant à lui
deux modes de traitement du signal : l’un axé sur le contenu (le mode quoi) et l’autre, sur la
manière (le mode comment). Si le locuteur parvient à un ajustement optimal de ses productions sur
le continuum H&H, le locuteur accède seulement au mode quoi. Mais si l’information hors signal
sur laquelle se fonde le locuteur pour ajuster ses productions est, pour une raison ou pour une autre,
inhibée ou rendue redondante, alors l’auditeur accède au mode comment et le terrain est propice au
changement. Dès lors qu’une nouvelle forme est reproduite par le locuteur-auditeur, elle est évaluée
par la communauté linguistique en fonction de sa pertinence sociale, communicationnelle,
articulatoire et lexico-systémique (Lindblom et coll., 1995 : 19). Si la forme est pertinente, elle
devrait n’enclencher que le mode quoi et pourra éventuellement être intégrée de manière
permanente, que ce soit à l’échelle de la communauté ou, selon notre interprétation, du locuteur.

Si un problème d’intercompréhension était sous-jacent à l’interprétation de la variation dans le


cadre de la théorie initiale, l’introduction de l’évaluation par la communauté linguistique de la
pertinence des nouvelles formes ouvre la voie à une application de la théorie H&H aux situations
d’acquisition d’un R2. En effet, un locuteur migrant pourrait être justifié d’abandonner certaines de
ses anciennes formes parce qu’elles ne sont pas favorablement reçues, et non parce qu’elles sont
incomprises. Les mécanismes d’évaluation et de rétroaction impliqués dans le changement, au-delà
des cas explicites d’incompréhension, sont toutefois peu définis par Lindblom et coll. (1995). Il est
possible que ce soit pour cette raison que la théorie H&H n’a pas joué un rôle aussi prépondérant
dans l’étude de l’acquisition d’un R2 que la théorie de l’accommodation, qui elle, met l’accent sur
l’évaluation socio-psychologique de la variation par les interlocuteurs.

3.3 L’effet caméléon ou la convergence automatique


L’hypothèse voulant que la convergence lors d’une interaction relève plutôt d’un automatisme
trouve sa source dans des modèles initialement proposés en psychologie et en psycholinguistique.
L’une des observations à la base de tels modèles est que les primates, incluant l’être humain, sont

99
portés à imiter les gestes de ceux avec lesquels ils interagissent, une inclination parfois désignée
sous le terme de synchronie interactionnelle (Giles et coll., 1991 : 2). Chartrand et Bargh
(1999 : 907) avancent l’hypothèse que ce phénomène puisse reposer sur l’existence d’un lien étroit
entre la perception des gestes d’autrui et leur (re)production, disposition qu’ils nomment effet
caméléon, c’est-à-dire « behavior tendencies generated nonconsciously from the perceived behavior
of one’s interaction partner ». Au terme d’une série d’expériences en laboratoire visant à tester
l’effet de différents facteurs sur la propension à l’imitation de l’expression faciale et des gestes, les
auteurs constatent que ce comportement se manifeste même entre inconnus, sans qu’un gain social
ne soit en jeu, et de manière inconsciente. Chartrand et Bargh (1999) admettent que l’effet
caméléon pourrait favoriser la souplesse des rapports sociaux, mais insistent sur le fait qu’il s’agit
d’un automatisme et que la création ou le maintien de relations harmonieuses n’est pas un but
explicitement poursuivi par les interactants. Les motivations et les mécanismes de l’effet caméléon
sont donc identiques (Coles-Harris, 2017 : 3).

Fruit par excellence du contact entre individus, la parole ne devrait donc pas faire exception à ce
phénomène. Pickering et Garrod (2004) défendent cette idée en mettant de l’avant un modèle
psycholinguistique qui rend compte du caractère mécanique de la langue employée lors d’un
dialogue, nommé processus d’alignement automatique. Selon les auteurs, la perception des usages
linguistiques, par exemple lexicaux, d’un locuteur entraîne leur adoption par l’auditeur lors de son
tour de parole; l’alignement lexical entre les partenaires est alors effectif. Par effet de percolation,
l’alignement d’un niveau linguistique donné occasionne automatiquement l’alignement des autres
niveaux linguistiques : dans cet exemple, l’alignement lexical initial provoque l’alignement
sémantique, syntaxique, phonologique et phonétique25. Puisque l’alignement ayant lieu en présence
d’un interlocuteur ou à l’égard d’un sujet de conversation peut être subséquemment récupéré en
mémoire sans devoir, chaque fois, être entièrement conceptualisé, le processus d’alignement
interactif est moins coûteux cognitivement qu’il n’y paraît et peut être tenu responsable d’une
routinisation menant à des pratiques récurrentes au sein d’une communauté linguistique. Pickering
et Garrod (2004 : 188) ajoutent que certaines avancées scientifiques récentes sont autant d’appuis à
leur modèle :

The discovery of mirror neurons provides a reason to expect certain forms of imitation to be
straightforward, and the finding that the same areas of the brain (Brodmann’s Areas 44 and 45)
are involved in imitation as in language use [...] provides support for the assumption that
alignment constitutes a fundamental aspect of language use.

25
Pour visualiser une schématisation de cet alignement, voir Pickering et Garrod (2004 : 176).

100
Dans une version subséquente du modèle, Pickering et Garrod (2013) attribuent un rôle important
aux attentes. Lors d’une interaction, le locuteur-auditeur entretiendrait certaines attentes par rapport
à ses productions et à celles de l’interlocuteur. Dans la mesure où l’interaction se déroule
conformément à ce qui est attendu, aucun ajustement n’est nécessaire. En revanche, lorsque les
productions du locuteur-auditeur ou celles de son interlocuteur rompent avec les attentes (erreurs,
mots nouveaux, etc.), « l’alerte » est donnée et le locuteur-auditeur s’aligne (Campbell-Kibler,
2016 : 139).

Néanmoins, Pardo (2006) fait valoir que l’alignement hypothétisé par Pickering et Garrod (2004,
2013) ne présente pas la même facilité d’interprétation à tous les niveaux linguistiques. Par
exemple, il est relativement aisé d’identifier si deux locuteurs parviennent à un consensus implicite
sur l’utilisation d’une unité lexicale donnée pour désambigüiser un concept. Au niveau phonétique,
la réalité est tout autre : « it is unlikely that two productions of the same word match at an acoustic-
phonetic level. Indeed, phonetic imitation may be impossible to achieve in purely acoustic terms »
(Pardo, 2006 : 2382). Sans prendre position par rapport à la validité du modèle psycholinguistique
de Pickering et Garrod (2004, 2013), l’auteure propose tout de même qu’en sciences phonétiques,
l’on tente d’évaluer la convergence entre interlocuteurs plutôt que l’alignement ou l’imitation.
Précisons que dans ce paradigme, la convergence phonétique se distingue de la convergence définie
dans le cadre de la théorie de l’accommodation en ce qu’elle n’est pas considérée comme un acte
motivé par des facteurs attitudinaux.

L’un des premiers arguments empiriques en faveur de la convergence phonétique automatique


provient sans doute de Lieberman (1967 : 45-46), qui rapporte le cas de deux enfants âgés de 10 et
de 13 mois, chez qui un changement de f0 en fonction de l’« interlocuteur » est observé : les deux
enfants se sont effectivement avérés babiller avec une f0 plus élevée en présence de leur mère
(390 Hz) qu’en présence de leur père (340 et 290 Hz)26. Cet exemple dénote la présence de
convergence sans qu’un calque acoustique ne soit atteint, en plus de pouvoir difficilement être
considéré comme une manifestation précoce d’accommodation telle que définie par Howard Giles
et ses collaborateurs.

Pardo (2006) choisit d’évaluer l’éventuelle convergence phonétique résultant d’interactions en


dyades au moyen d’un test de perception. Douze locuteurs ont d’abord été amenés à lire
individuellement des phrases porteuses contenant différents mots cibles. Ceux-ci ont permis

26
Voir également Kuhl et Meltzoff (1996), qui interprètent toutefois le phénomène dans le cadre théorique
des aimants perceptifs (Kuhl, 1991).

101
d’établir que tous les locuteurs de l’expérience produisaient des voyelles distinctes dans les paires
marry/merry, cot/caught et pen/pin, sujettes à fusion dans certains régiolectes de l’anglais
américain. La f0 moyenne des locuteurs a ensuite été calculée afin de constituer des paires de
participants de même sexe et de f0 similaire, sans que leur origine géographique ne soit contrôlée
(l’auteure mentionne que certaines paires de participants diffèrent quant à leur origine régiolectale,
sans précision supplémentaire). Les six paires de participants ainsi formées ont ensuite effectué une
tâche interactive où un locuteur expliquait à son partenaire comment se rendre, sur une carte, d’un
point de départ à un point d’arrivée en fonction de repères géographiques (un garage, un champ de
blé, un lac, etc.), qui constituaient les mêmes mots cibles que ceux contenus dans les phrases
porteuses. Finalement, tous les locuteurs ont répété la tâche de lecture individuelle une fois la tâche
interactive terminée. Trente auditeurs ont ensuite été soumis à un test de discrimination de type
AXB où les triades étaient composées, en X, d’une occurrence produite pendant la tâche par un
locuteur; en A et en B, des occurrences produites avant, pendant ou après la tâche par son
partenaire. Il s’avère que les auditeurs ont jugé plus similaires les occurrences produites pendant et
après la tâche qu’avant, tendance suggérant une convergence perceptible entre les locuteurs par
suite de leur interaction. Les résultats indiquent également que le degré de convergence entre les
locuteurs augmente comme la tâche interactive progresse et se maintient une fois celle-ci terminée,
lors de la lecture individuelle de phrases porteuses.

Dans leur étude sur la convergence phonétique en français belge, Delvaux et Soquet (2007) ont pour
leur part cherché à vérifier si ce phénomène pouvait se manifester en l’absence d’interaction
sociale. Pour ce faire, ils ont proposé à des locutrices du français belge des tâches de production en
laboratoire avec et sans parole ambiante. Rappelons que dans un premier temps, quatre locutrices
lisaient oralement des phrases porteuses contenant les mots pot et dix. Elles étaient originaires à
parité de Bruxelles et de Liège, où sont parlés des régiolectes différents, qui s’opposent notamment
quant au timbre du /o/ de pot et à la durée du /i/ de dix, prononcés [po] et [dis] à Bruxelles, et [pɔ] et
[diːs] à Liège. Deux semaines plus tard, les quatre mêmes locutrices ont répété l’expérience, mais
cette fois, après qu’elles avaient produit une phrase, une voix transmise par un haut-parleur en
produisait une également. Cette voix appartenait à l’une des deux locutrices originaires d’une autre
ville que la participante en question. La comparaison de la durée, de la fréquence des trois premiers
formants et de 20 coefficients cepstraux (MFCC) relevés au premier tiers de la durée des segments
produits lors des deux tâches témoignent d’une convergence vers la parole ambiante, et ce, même
en l’absence de véritable interaction sociale. Les locutrices n’avaient pourtant pas reçu comme
consigne d’imiter de quelque façon la voix entendue, et un entretien informel suivant l’expérience

102
laisse présumer qu’aucune des locutrices n’a convergé vers la parole ambiante de manière
consciente ou délibérée. Delvaux et Soquet (2007) ont ensuite répliqué leur expérience auprès de
huit locutrices originaires de Mons, où est parlé le même régiolecte qu’à Bruxelles, exposées à la
parole d’une locutrice de Liège. Cette fois, les auteurs ont pris soin de conduire un post-test afin de
vérifier si la convergence phonétique se maintiendrait. Les résultats de ce post-test indiquent que la
convergence persiste un certain temps mais de manière variable selon les participantes, et qu’elle
s’estompe plus graduellement qu’elle ne s’active. Delvaux et Soquet (2007 : 167) en déduisent que
le phénomène de convergence phonétique ne se résume pas à une réaction par rapport à un stimulus
impliquant seulement la mémoire à court terme.

Émettant l’hypothèse que la convergence phonétique automatique pourrait tout de même être plus
importante en contexte social que dans une situation expérimentale totalement dénuée d’interaction,
Babel (2012) propose à une centaine de locuteurs une tâche de répétition de stimuli produits par
deux locuteurs-contrôles dont la photo est visible pour la moitié des participants. En calculant la
distance euclidienne séparant les productions des participants de celles des locuteurs-contrôles
(dans un espace F1/F2, où les valeurs formantiques sont normalisées en scores-z), l’auteure note une
convergence phonétique supérieure chez les témoins exposés aux photos. De plus, la convergence
apparaît plus importante pour les voyelles /æ ɑ/ que pour les voyelles /i u o/. Selon Babel
(2012 : 186), cette tendance pourrait être attribuable au fait que les voyelles /æ ɑ/ sont davantage
sujettes à variation régionale en anglais américain, idiome natal des participants. Parce qu’on peut
supposer qu’avant la tâche, les voyelles /æ ɑ/ produites par les participants différaient sensiblement
de celles produites par les locuteurs-contrôles, les participants disposaient, lors de l’expérience,
d’un espace acoustico-phonétique suffisant pour permettre le changement.

Que la convergence phonétique comporte une part d’automatisme, tel que mis en évidence dans les
travaux de Pardo (2006), de Delvaux et Soquet (2007) et de Babel (2012), suggère un fort lien entre
la perception et la production de la parole. Cependant, ces auteurs rejettent l’idée d’un lien
perception-production entièrement automatisé et dénué d’intermédiaires. Babel (2012) estime que la
modélisation du traitement cognitif de la parole doit nécessairement prendre en compte le potentiel
médiateur de facteurs phonétiques et sociaux, notamment sur l’ampleur de la convergence (voir
également Walker et Campbell-Kibler, 2015; Nielsen, 2011). Les post-tests de Pardo (2006) et de
Delvaux et Soquet (2007) révèlent en outre que la convergence tend à se maintenir un certain temps
après l’exposition, suggérant, d’une part, la possibilité de changements à plus long terme, et d’autre
part, la nécessité de tenir compte de l’impact d’événements phonétiques récents sur le traitement
cognitif de la parole.

103
3.4 Théorie des exemplaires
La théorie des exemplaires27 pourrait constituer une piste de solution intéressante pour l’intégration
des différentes contraintes susmentionnées au sein d’un modèle unifié. Les modèles à exemplaires
reposent sur l’hypothèse selon laquelle les auditeurs accumulent en mémoire l’ensemble de leurs
expériences linguistiques. Ces expériences sont encodées de manière très détaillée, aussi bien en ce
qui concerne leurs propriétés acoustiques, les caractéristiques du locuteur les ayant produites, les
circonstances plus générales entourant leur production, etc. Thomas (2011 : 265) signale que
l’avènement de tels modèles marque une importante rupture avec la tradition générativiste
(Chomsky et Halle, 1968). L’une des différences majeures entre ces deux courants de pensée réside
dans la quantité de mémoire allouée au traitement linguistique. Les exemplaristes, parmi lesquels
Johnson (1997 : 147), soulignent que même si de tels modèles semblent nécessiter des facultés
mémorielles irréalistes, un ensemble de travaux expérimentaux relativement récents révèlent que les
capacités de mémorisation, notamment lexicales, de l’humain sont nettement supérieures à ce que
l’on présumait auparavant. Une autre différence substantielle entre la théorie des exemplaires et la
théorie générativiste est que la première est fondée sur la variation, tandis la seconde tend à en faire
abstraction (Thomas, 2011 : 266). Devant l’aptitude remarquable des auditeurs à tirer du sens d’un
signal hautement variable, les travaux s’inscrivant dans la théorie des exemplaires cherchent à
expliquer de quelle manière cette variabilité est exploitée et manipulée (Hay, Nolan et coll.,
2006 : 352).

Les modèles à exemplaires se distinguent également des théories faisant appel à la notion de
prototype (Kuhl, 1991) ou à la normalisation, notamment en ce qui a trait au traitement des
nouvelles expériences linguistiques : celles-ci ne sont ni comparées avec un prototype catégoriel
abstrait, ni épurées lors de leur acquisition (Johnson, 1997 : 146). Au contraire, on postule que les
exemplaires détaillés mémorisés par le locuteur sont rassemblés en catégories en fonction des
caractéristiques qu’ils partagent. Lorsqu’une nouvelle expérience linguistique survient et qu’une
classification doit s’opérer, les caractéristiques de la nouvelle occurrence sont comparées avec
celles des exemplaires de catégories existantes; les caractéristiques partagées sont alors activées et
la catégorie comportant la plus importante somme d’activations se présente comme celle à laquelle
le nouvel exemplaire doit se joindre (Johnson, 1997 : 147). Au fil de l’accroissement de
l’expérience linguistique du locuteur, des patrons émergent de ses représentations et forment des

27
Bien que le titre de cette section fasse référence à une théorie au singulier, il en existe plusieurs
déclinaisons. Rys et coll. (2017 : 270) en recensent trois : les modèles reposant sur l’analogie, ceux fondés sur
la mémorisation (memory-based) et ceux fondés sur l’usage (usage-based). Les contributions citées dans cette
section appartiennent à la dernière catégorie.

104
proéminences dans l’espace acoustico-phonétique, ce que Foulkes et Docherty (2006 : 427)
illustrent en ces termes : « exemplars with similar phonetic properties cluster together in memory,
and as a result the distribution of phonetic forms develops peaks and valleys ». Quant à la manière
dont ce modèle perceptif peut se concrétiser en production, Johnson (1997 : 154) émet l’hypothèse
que les occurrences produites par le sujet lui-même feraient aussi partie de son inventaire
d’exemplaires et que ces « égo-exemplaires » comporteraient de l’information relative à leurs
propriétés articulatoires. Néanmoins, Foulkes et Docherty (2006 : 430) soulignent que la
conceptualisation du lien perception-production demeure un défi de taille pour les exemplaristes.

La théorie des exemplaires exerce une influence montante dans différents secteurs de recherche en
linguistique (voir Gahl et Yu, 2006), un essor qui coïncide notamment avec l’intensification des
travaux s’inscrivant dans le courant de la sociophonétique (Jannedy et Hay, 2006). De fait, l’une des
visées poursuivies par cette discipline, soit lier variation phonétique fine et facteurs
extralinguistiques, va réellement de pair avec l’orientation donnée à certains des modèles à
exemplaires. Parmi les sociophonéticiens qui se sont attachés à mettre en évidence la validité
empirique de la théorie, Hay, Nolan et coll. (2006) et Hay et Drager (2010) montrent que
l’exposition à un concept particulier lors d’un test de perception peut influencer le comportement
des participants. Dans ces deux expériences, des auditeurs néo-zélandais sont amenés à identifier
parmi six choix de réponses la voyelle synthétique dont le timbre est le plus similaire à celui d’une
voyelle naturelle contenue dans un mot monosyllabique inséré dans une phrase porteuse produite
par un locuteur néo-zélandais. Les six /ɪ/ synthétiques proposés varient en fonction de la valeur de
F1 et de F2 et visent à reproduire un continuum allant d’une variante fermée caractéristique de
l’anglais australien à une variante centralisée caractéristique de l’anglais néo-zélandais. Selon que
les auditeurs sont exposés pendant la tâche au concept de l’Australie ou de la Nouvelle-Zélande au
moyen d’un mot (Australian ou New Zealander) en en-tête d’une feuille-réponse (Hay, Nolan et
coll., 2006) ou d’un animal en peluche (koala/kangourou ou kiwi) dans la pièce (Hay et Drager,
2010), ils tendent à choisir des stimuli synthétiques correspondant davantage à l’anglais australien
ou néo-zélandais respectivement, bien qu’ils écoutent très exactement les mêmes stimuli naturels et
qu’à une exception près, tous pensent que le locuteur entendu est néo-zélandais28. Les chercheurs
proposent que lorsque les auditeurs entrent en contact avec le concept correspondant à l’un ou
l’autre des pays, les exemplaires auxquels ce concept est associé sont automatiquement activés.
Leur niveau d’activation étant alors élevé, un « biais perceptif » en leur faveur survient (Hay, Nolan

28
Dans une contribution récente, Walker et coll. (2018 : 266) nuancent toutefois les résultats obtenus par Hay,
Nolan et coll. (2006) et Hay et Drager (2010), n’excluant pas qu’ils puissent être attribuables au hasard et en
conséquent, non réplicables.

105
et coll., 2006 : 371). Une telle tendance ne se restreint cependant pas à l’origine géographique,
comme le montrent Hay, Warren et coll. (2006) dans une étude portant sur la perception variable
d’un phénomène de fusion vocalique en anglais néo-zélandais en fonction d’autres caractéristiques
sociales que les auditeurs associent aux locuteurs, telles que l’âge et la classe socio-économique.
Pour que de telles expériences d’activation fonctionnent, il est cependant essentiel que les
catégories et les liens existent déjà chez l’auditeur (Campbell-Kibler, 2016 : 141). L’expérience en
soi ne les crée pas et ne produirait pas l’effet escompté sur n’importe quelle population.

Si une catégorie correspond à l’ensemble des exemplaires partageant des caractéristiques


communes et formant une proéminence dans l’espace acoustico-phonétique, le nombre de
catégories composant la représentation mentale du locuteur n’est ni absolu, ni fixe, puisque celles-ci
se forment graduellement, à force d’exposition et de mémorisation (Pierrehumbert, 2006 : 519).
Ainsi, les exemplaires vocaliques mémorisés par deux individus unilingues de langue maternelle
différente ne seront assurément pas catégorisés de manière identique. En contexte expérimental, il
convient d’être vigilant à cet égard, les représentations des usagers n’offrant pas nécessairement une
correspondance parfaite avec celles de l’analyste. De plus, un changement dans les pratiques
auxquelles un individu est exposé, par suite de mobilité géographique par exemple, peut aboutir à
une réorganisation de ses catégories, à la réaffectation de certains de ses exemplaires, puisque ses
représentations bénéficient d’une continuelle mise à jour (Pierrehumbert, 2006 : 523).

L’un des facteurs influençant tout particulièrement cette mise à jour est la fréquence. Selon
Pierrehumbert (2006 : 524), les catégories les plus fréquentes acquièrent une représentation
cognitive plus substantielle, puisque par définition, les auditeurs se trouvent fréquemment en
contact avec ces catégories. À l’inverse, une fréquence faible mène éventuellement à leur
détérioration (Hay, Nolan et coll., 2006 : 371; Drager et Kirtley, 2016 : 6). Ce paramètre de
détérioration est susceptible d’affecter l’exemplaire lui-même ou certaines de ses caractéristiques,
conséquence de l’imperfection de la mémoire, mais également d’un tri fondé sur la pertinence. Si,
au moment de l’acquisition, un lien est établi entre un exemplaire et une caractéristique mais que ce
lien n’est jamais confirmé lors d’expériences subséquentes, il peut être dissous parce que non
pertinent. Hay, Nolan et coll. (2006 : 371-372) donnent l’exemple d’un auditeur qui, dans
l’immédiat, mémoriserait le fait qu’une occurrence donnée a été produite par une locutrice portant
une robe verte. Si le lien entre la caractéristique « robe verte » et les propriétés acoustiques de
l’exemplaire ne se voit jamais confirmé, il risque fort d’être supprimé. Drager et Kirtley (2016 : 17)
expliquent que si une telle caractéristique renvoie au contraire à une pratique sociale signifiante

106
associée de manière récurrente et fréquente à certains types d’exemplaires, le lien sera renforcé et
conservé.

Un autre facteur à prendre en compte est la récence des exemplaires. D’après Sancier et Fowler
(1997 : 432), « recent past experience in memory, if it is very recent, exerts a disproportionately
stronger impact on current perception and behavior than more distant past experiences »29. D’une
part, selon Johnson (1997 : 150), le niveau d’activation des exemplaires récents est élevé, ce qui
cause un biais en leur faveur. D’autre part, les exemplaires récents sont moins susceptibles d’avoir
été affectés par le paramètre de détérioration que les exemplaires plus anciens (Hay et coll.,
2010 : 452), bien que Hay et Foulkes (2016 : 304) doutent de la disparition totale des
représentations anciennes. Hay et coll. (2009, 2010) formulent d’ailleurs une mise en garde
méthodologique concernant l’influence que peuvent exercer les usages de l’expérimentateur sur les
réponses des participants. Comme une exposition récente peut augmenter l’activation d’une partie
de leurs représentations, qu’un expérimentateur dont le régiolecte diffère de celui des témoins ou
que plusieurs expérimentateurs soient impliqués dans une étude est susceptible de provoquer
l’apparition de certains patrons dans les résultats. Les post-tests conduits par Pardo (2006) et par
Delvaux et Soquet (2007) révélant un maintien de la convergence phonétique quelque temps après
l’exposition à d’autres usages corroborent cette mise en garde.

C’est donc grâce au facteur de récence que, selon Hay et coll. (2010 : 464), la théorie des
exemplaires est apte à prendre en charge le phénomène d’accommodation. En effet, puisque de
l’information concernant l’interlocuteur est encodée à même les exemplaires mémorisés, ceux-ci
sont déjà activés lors de l’interaction parce que socialement pertinents. Puisqu’ils sont en outre
récents, leur niveau d’activation est démesurément élevé et un fort biais en leur faveur, tant en
perception qu’en production, survient (Hay et coll., 2010 : 452). Quant au phénomène
d’accommodation à long terme tel que conceptualisé par Trudgill (1986), il pourrait s’expliquer par
un effet combiné de la récence et de la fréquence des exemplaires. Johnson (1997 : 150) fait
effectivement remarquer que récence et fréquence ne sont pas mutuellement exclusives : les
exemplaires fréquents sont plus souvent qu’à leur tour récents (l’inverse n’étant cependant pas
assuré). De tels exemplaires possèdent un très haut niveau d’activation, ainsi les expériences
linguistiques récentes et fréquentes d’un locuteur en situation de mobilité géographique, issues

29
Sancier et Fowler (1997 : 433-434) observent chez une locutrice bilingue (portugais L1 et anglais L2) une
fluctuation de la valeur de ses VOT comme conséquence de séjours prolongés dans son milieu d’accueil ou
d’origine. Bien que les auteures évoquent la possibilité d’un effet perceptif lié à la récence, elles préfèrent
interpréter leurs résultats dans une perspective articulatoire, au moyen de la théorie de la fonction potentielle.

107
selon Trudgill (1986) d’actes d’accommodation répétés, sont susceptibles de mener à la
réorganisation des catégories dans l’espace acoustico-phonétique, provoquant éventuellement le
changement. Le modèle admettant également qu’une gamme d’information non linguistique soit
jointe aux exemplaires mémorisés, la réorganisation des catégories peut se voir consolidée par
l’activation, lors d’une interaction, d’information sociale pertinente partagée par les exemplaires
nouvellement répartis. Il permet en outre d’expliquer que certains facteurs externes interviennent
lors des processus de convergence automatique, comme le suggère Babel (2012), et d’acquisition
d’un R2.

Walker (2018), Love et Walker (2013) et Nycz (2013) s’intéressent à l’actualisation de la théorie
des exemplaires dans le contexte spécifique de la mobilité géographique. Walker (2018) fait valoir
qu’acquérir un R2 en réorganisant ses catégories pourrait se faire au détriment du R1. Pour tester
cette hypothèse, l’auteure fait appel à 90 participants anglophones et les soumet à une tâche de
transcription de phrases dans le bruit. De ce nombre, 54 sont sédentaires, soit 32 Américains vivant
aux États-Unis et 22 Britanniques vivant au Royaume-Uni. Les autres sont mobiles, à raison de 18
Américains installés au Royaume-Uni depuis 12 ans en moyenne et de 18 Britanniques installés aux
États-Unis depuis 15 ans en moyenne. Les phrases à transcrire sont hautement prévisibles (The
mouse ran down the hole, Watermelons have lots of seeds, etc.) et ont été produites par 16 locuteurs
sédentaires originaires à parité du Royaume-Uni et des États-Unis. Walker (2018) constate que les
auditeurs sédentaires commettent moins d’erreurs en transcrivant les phrases produites par des
locuteurs de la même origine. Par exemple, les auditeurs britanniques obtiennent de meilleurs
résultats lorsque les phrases ont été produites par des locuteurs britanniques que lorsqu’elles ont été
produites par des locuteurs américains. Pour ce qui est des auditeurs mobiles, ils se révèlent
supérieurs aux sédentaires pour ce qui est de transcrire les phrases produites dans leur R2 (par
exemple, des auditeurs britanniques transcrivant de l’anglais américain), mais ils ne leur sont pas
significativement inférieurs dans le R1. Puisqu’il semble ainsi que la perception du R2 puisse être
améliorée sans nuire à celle du R1, Walker (2018 : 171) propose une interprétation n’impliquant pas
la réorganisation de l’espace acoustico-phonétique des auditeurs mobiles : « rather than modifying a
singular representation of words and sounds, listeners are able to access different dialectal forms as
appropriate ». Dans cette optique, les représentations de l’usager demeurent intactes, mais
pourraient désormais être étiquetées « R1 » ou « R2 », ce qui constituerait de surcroît une
explication intéressante du phénomène de bilectalisme.

Pour ce qui est de Love et Walker (2013), rappelons qu’elles amènent neuf Britanniques vivant aux
États-Unis (Ohio) à discuter de soccer et de football américain afin de vérifier l’effet du sujet de

108
conversation (européen ou américain) sur la rhoticité, l’anglais britannique étant considéré comme
un régiolecte non rhotique, au contraire de l’anglais américain. L’hypothèse des auteures est que
l’un ou l’autre des sujets de conversation tendra à activer des exemplaires plus ou moins rhotiques.
Elles constatent effectivement qu’en moyenne, les voyelles produites lorsque la conversation porte
sur le football américain sont plus rhotiques (diminution de F3 de 60 Hz). Deux locuteurs s’avèrent
toutefois nettement moins rhotiques que les autres, alors que le sujet de conversation ne semble pas
provoquer chez eux l’effet attendu. Love et Walker (2013) mentionnent que ces deux témoins
manifestent peu d’intérêt à l’égard du football américain. Une augmentation de la rhoticité
signifierait donc une plus grande intégration culturelle, sportive comme linguistique, c’est-à-dire
l’adoption, dans une certaine mesure, d’une identité américaine. Pour qu’un sujet à résonnance
culturelle soit en mesure de faire varier les exemplaires activés, il pourrait donc s’avérer essentiel,
selon Love et Walker (2013 : 454), que le locuteur possède différentes « identités » entre lesquelles
alterner : « it may not be sufficient to prime a topic to see a production shift; an identity may also
need to be primed ».

Nycz (2013) s’intéresse quant à elle à l’acquisition du régiolecte de New York par 17 Canadiens
anglophones s’y étant installés après l’âge de 21 ans. Analysant des données issues de conversations
portant sur le passé canadien des locuteurs et la réalité d’être immigrants à New York, l’auteure
observe que le timbre de la diphtongue /ɑʊ/, fermée en anglais canadien (Canadian raising), et des
voyelles /ɑ/ et /ɔ/, fusionnées en anglais canadien mais distinctes en anglais new-yorkais, est sujet à
une importante variabilité inter-individuelle chez les témoins interrogés. Étonnamment, les
locuteurs ayant davantage acquis la distinction new-yorkaise entre /ɑ/ et /ɔ/ sont aussi ceux qui
produisent le plus de diphtongues fermées caractéristiques de l’anglais canadien. L’auteure explique
que les diphtongues fermées sont très fortement associées à l’identité canadienne, voire
stigmatisées, mais que la fusion de /ɑ/ et /ɔ/ ne revêt pas de signification sociale particulière. En
activant l’identité canadienne des témoins à travers le sujet abordé lors de l’entretien, les
exemplaires auxquels est jointe cette caractéristique sociale, c’est-à-dire les diphtongues fermées,
ont été sélectionnés. La fusion de /ɑ/ et /ɔ/ étant un phénomène phonétique socialement neutre, les
exemplaires correspondants ne possèdent pas l’étiquette de l’identité canadienne parce qu’elle n’est
pas pertinente et par conséquent, ils ne sont pas activés. Ce raisonnement ne permet pourtant pas
d’expliquer que les locuteurs qui ont peu adopté la distinction new-yorkaise entre /ɑ/ et /ɔ/ n’ont pas
augmenté leur utilisation de diphtongues fermées lors d’un entretien censé activer l’identité
canadienne. Nycz (2013 : 60) propose alors d’ajouter au modèle une nouvelle composante : la
sensibilité linguistique. Cette composante s’inspire de la notion de sensibilité conversationnelle

109
décrite par Daly et Diesel (1992 : 412-413), qui rend compte du fait que tous les individus ne sont
pas identiquement sensibles à la dynamique des conversations, que ce soit en termes d’habileté à
détecter l’ironie, le sarcasme et les doubles sens, à faire preuve de tact, à évaluer les affinités entre
certains locuteurs, à retenir l’information échangée, etc.

LS [linguistic sensitivity], as proposed here, incorporates these macro-aspects of conversational


sensitivity while also including sensitivity to the patterning of smaller units which linguists are
used to studying; speakers may vary in their sensitivity to nuances of relationship as well as
people’s use of socially indexed linguistic variables or fine-grained phonetic variation. LS
would not constitute an object of the usage-based model in the way that an exemplar or a
category label. Rather it would be a parameter of the model. Set the parameter high and
speakers will readily incorporate new exemplars and deploy socially appropriate tokens; turn
the sensitivity down low and speakers will be slower to learn new forms as well as less likely to
respond to context. (Nycz, 2013 : 60)

Dans cette perspective, les locuteurs mobiles possédant un niveau de sensibilité linguistique élevé
ont rapidement acquis la distinction entre /ɑ/ et /ɔ/ une fois établis à New York, mais sont plus
enclins à produire des variantes canadiennes de /ɑʊ/ lorsque le contexte s’y prête. Les locuteurs
dont le niveau de sensibilité est moins élevé adoptent plus lentement, s’ils l’adoptent, la distinction
entre /ɑ/ et /ɔ/, et se montrent moins réceptifs aux éléments conversationnels susceptibles d’activer
leur identité canadienne30.

Les modèles à exemplaires se sont récemment imposés comme cadre interprétatif dans bon nombre
d’études alliant variation phonétique et facteurs externes, notamment dans le domaine de la
sociophonétique. Parce qu’ils portent un regard unifié sur un éventail de phénomènes généralement
appréhendés séparément, tels que la convergence, l’accommodation et le changement phonétiques,
les modèles à exemplaires font partie intégrante des plus récentes analyses du processus d’adoption
d’un R2. Le poids important accordé à la fréquence et à la récence des exemplaires, la possibilité
soit d’une réorganisation des catégories, soit d’une sélection contextuelle (Walker, 2018), ainsi que
les propositions d’adaptation du modèle formulées par Love et Walker (2013) et par Nycz (2013)
consolident encore davantage l’ascendant de ce cadre théorique sur les travaux abordant pareil
thème. Néanmoins, aussi convaincants soient certains argumentaires en faveur de la prise en compte
des modèles à exemplaires, Thomas (2011 : 271) rappelle leur caractère hypothétique. Certains
aspects restent également à clarifier, notamment la modélisation du lien perception-production, dont
nous avons déjà fait mention. L’unité de base des exemplaires continue aussi à susciter des
30
L’une des principales différences entre les modèles à exemplaires et l’approche de Beddor (2015) (voir la
section 2.3.3) est la suivante : les exemplaristes postulent qu’un auditeur conserve en mémoire l’ensemble de
ses expériences linguistiques, alors que Beddor (2015) suggère qu’il ne dispose que de ce à quoi il est
sensible. La proposition de Nycz (2013) d’ajouter aux modèles à exemplaires un paramètre de sensibilité
linguistique rapproche considérablement les deux perspectives.

110
questions. Pour Goldinger (1998), il s’agit sans conteste du mot, mais Shockley et coll. (2004) et
Nielsen (2011) insistent sur le fait que la convergence peut être activée par des caractéristiques
sous-lexicales, dans ce cas précis par le VOT. Des unités plus grandes, comme le syntagme, ont
également été proposées (voir Drager et Kirtley, 2016 : 4-5). À ce jour, la représentation véhiculaire
en sociophonétique semble être celle du mot, auquel sont adjoints des détails phonétiques
(Pierrehumbert, 2016). Finalement, les modèles à exemplaires ont percé en rejetant le caractère
abstrait supposé aux représentations phonologiques dans les théories précédentes, mais l’idée d’une
forme d’abstraction tend à refaire surface (Thomas, 2011; Pierrehumbert, 2006, 2016). Selon
Nielsen (2011 : 133), la question n’est donc plus de savoir si les représentations sont abstraites ou
épisodiques, mais à quel point elles le sont.

3.5 Synthèse
Les quatre cadres théoriques exposés dans cette section cherchent notamment à rendre compte des
effets du contact avec autrui sur les usages linguistiques d’un locuteur. La théorie de
l’accommodation, issue du domaine de la psychologie sociale du langage (Giles, 1973) puis
largement embrassée par les travaux en communication (Giles et coll., 1991), repose sur l’idée que
la convergence, la divergence et le maintien des usages sont des stratégies mises en place par le
locuteur pour négocier ses identités individuelle et collective lors d’interactions. Aboutissement
d’une série d’actes de convergence motivés par l’opinion positive qu’entretient un locuteur migrant
à l’égard des usages de sa communauté d’accueil, l’accommodation à long terme est la manière
dont Trudgill (1986) conceptualise le processus menant à l’acquisition d’un R2. La théorie H&H de
Lindblom (1990), une référence importante en sciences phonétiques dans les années 1990, postule
que le locuteur ajuste ses productions en fonction des exigences de la situation de communication
immédiate, toujours dans l’optique d’optimiser l’accès au lexique chez l’auditeur. La pertinence
sociale, communicationnelle, articulatoire et lexico-systémique des formes ainsi produites, par
ailleurs toujours différentes, est évaluée par la communauté (Lindblom et coll., 1995). Dans cette
perspective, un locuteur migrant dont les productions recevraient une évaluation négative pourrait
être appelé à modifier ses usages. L’effet caméléon (Chartrand et Bargh, 1999) et le modèle
d’alignement automatique (Pickering et Garrod, 2004, 2013) attribuent à un automatisme l’imitation
entre interlocuteurs. Un parfait alignement acoustique étant cependant impossible (Pardo, 2006), le
processus qui survient au niveau phonétique peut davantage être considéré comme de la
convergence. En admettant ce point de vue, l’acquisition (au moins partielle) d’un R2 par les
locuteurs migrants peut être interprétée comme un phénomène inévitable qui ne dépend pas d’une
opinion entretenue à l’égard de la communauté d’accueil. Désormais incontournables dans plusieurs

111
champs de recherche, les modèles à exemplaires postulent que les auditeurs accumulent en mémoire
l’ensemble de leurs expériences linguistiques (Johnson, 1997). En raison de leur fréquence et de
leur récence, les exemplaires auxquels sont exposés les individus évoluant dans une nouvelle
communauté linguistique sont susceptibles d’être sélectionnés en production (Pierrehumbert, 2006).
Un tel cadre théorique présente l’avantage de rendre compte de comportements phonétiques fins qui
comportent une part d’automatisme, mais qui peuvent néanmoins être régis par certains facteurs
internes ou externes.

112
Chapitre 4 : Objectifs
Depuis la contribution fondatrice de Payne (1980), le nombre d’études traitant de l’acquisition d’un
R2 a considérablement crû. Parmi les nombreux travaux synthétisés dans les chapitres précédents,
on note toutefois l’absence de migrants de langue française. À notre connaissance, seulement deux
contributions faisant appel à des témoins francophones se rattachent plus ou moins étroitement au
sujet : une enquête atypique du projet PFC (Phonologie du français contemporain, Durand et coll.,
2009) menée par Sobotta (2006) auprès de migrants aveyronnais vivant à Paris et l’ouvrage de
Gendron (1966) concernant 17 Québécois eux aussi installés à Paris. Dans son étude préliminaire,
Sobotta (2006) note que parmi ses 40 participants, les 19 Aveyronnais de Paris constituent un
groupe linguistique plus hétérogène que les 21 locuteurs vivant encore dans l’Aveyron, du moins en
ce qui concerne le taux de production des schwas finaux (par exemple, dans « pâtes italiennes »), et
considérant que l’âge des participants semble également en cause. Cependant, ne sont précisés dans
l’article ni la méthode d’analyse des caractéristiques de prononciation, ni le temps de résidence à
Paris des locuteurs mobiles, parmi lesquels deux sont en fait d’origine étrangère (Arménie et
Espagne). Du côté de Gendron (1966 : 1), l’objectif de son ouvrage est d’offrir une première
description de la « prononciation de la classe instruite canadienne-française[, laquelle] se trouve
partagée entre deux pôles d’attraction : entre le français populaire canadien et la norme du langage
soigné de Paris ». En menant une enquête auprès de Québécois établis en France, l’auteur ne
cherche donc pas à décrire les effets de la mobilité géographique, mais à accéder à une variété
socialement prestigieuse. Or, Gendron (1966 : 106) est constamment confronté au succès relatif des
témoins dans leur entreprise de « correction orthophonique » : diverses remarques ponctuant son
volume suggèrent une importante variabilité inter- et intra-individuelle, les locuteurs oscillant entre
le phonétisme du français parisien, leur prononciation initiale et des formes intermédiaires31.

Ces observations de Sobotta (2006) et de Gendron (1966), en cohérence avec celles provenant
d’autres contextes linguistiques, soulignent le potentiel d’étudier l’acquisition d’un R2 en langue
française. Si le sujet n’a virtuellement jamais été approfondi, il ne s’agit pas, au demeurant, d’une
situation d’exception : les locuteurs francophones sont en général peu représentés dans les études
sociophonétiques (Candea et Trimaille, 2015). Concernant plus spécifiquement le contexte
québécois, les changements de prononciation susceptibles de se produire chez des francophones

31
Dans une critique du volume, Delattre (1968 : 852) note : « we would expect a dialect such as [Cultivated
Canadian French] to show a high degree of instability and disagreement. As a matter of fact, the native
subjects who were used in this work did not repeat utterances with very much consistency, and each subject
spoke much in his own way ».

113
géographiquement mobiles n’ont plus été investigués depuis Gendron (1966), dont il ne s’agissait
pas, du reste, de l’objectif de recherche réellement poursuivi. Il va sans dire que les changements
prompts à s’opérer chez des migrants interrégionaux, c’est-à-dire des locuteurs du français
québécois déménageant d’une région à l’autre de la province, demeurent totalement inexplorés.

L’objectif principal de cette recherche est d’étudier l’éventuelle acquisition d’un R2 chez des
migrants interrégionaux québécois.

Si la question des conséquences phonétiques de la mobilité interrégionale au Québec n’a jamais été
abordée, la cause n’en est pas que cette réalité contemporaine épargne la province. Au contraire,
selon un rapport sociodémographique de St-Amour (2018 : 1-2), de 1998 à 2017, le taux de
migration interrégionale annuel se situe entre 2,4 % et 3 %. Pour cette même période, la mobilité la
plus importante est observée au sein de la population âgée de 20 à 29 ans : bon an mal an, le taux de
changement de région de résidence de cette tranche d’âge est deux à trois fois supérieur à la
moyenne nationale, soit entre 6 % et 7,5 % environ. D’après St-Amour (2018 : 1), cette tendance
s’explique en partie par le fait que plusieurs jeunes adultes sont amenés à déménager pour
entreprendre des études universitaires. En raison de leur mobilité importante, les jeunes
universitaires dans la vingtaine apparaissent ainsi comme les candidats indiqués pour une première
étude sur les conséquences phonétiques de la mobilité géographique au Québec.

Cette importante mobilité des jeunes Québécois dans la vingtaine suggère par ailleurs qu’ils
pourraient traverser la phase identifiée par Arnett (2000) comme l’émergence de l’âge adulte. Que
l’âge des femmes à la naissance du premier enfant soit passé de 25 ans en 1975 à 29 ans en 2017
(Girard et Binette Charbonneau, 2018 : 2), et que l’âge au premier mariage soit passé chez les
femmes de 23,5 ans en 1971 à 31,9 ans en 2016, et chez les hommes de 25,6 ans à 33,4 ans pour la
même période (Binette Charbonneau, 2017 : 2), appuient également cette idée. Selon Bigham
(2012), les adultes émergents seraient particulièrement propices à modifier leurs usages
linguistiques, et ce, en raison des multiples bouleversements qui caractérisent cette étape de la vie.
Toutefois, rappelons que le concept demeure encore à ce jour très peu exploité en linguistique
(Buchstaller et Wagner, 2018 : 5). En conséquence, le postulat de Bigham (2012) n’a été sciemment
mis à l’épreuve dans aucun autre contexte que sa propre thèse (Bigham, 2008), qui présente le
problème de ne pas permettre de faire la part entre les effets de l’émergence de l’âge adulte et ceux
d’autres facteurs, notamment de la mobilité géographique. Dans le but de faire avancer la réflexion
à ce sujet, nous nous proposons de faire appel à de jeunes universitaires sédentaires en plus des

114
mobiles, d’évaluer dans quelle mesure ils peuvent être étiquetés adultes émergents, et de tester le
lien entre cette étiquette et leurs usages phonétiques.

Le second objectif de cette recherche est de mettre à l’épreuve l’hypothèse selon laquelle les jeunes
universitaires québécois traversant la phase socio-psychologique d’émergence de l’âge adulte sont
sujets à modifier leurs usages phonétiques.

Dans la revue des écrits présentée au Chapitre 2, nous avons fait valoir que certaines contraintes de
nature linguistique pesaient sur le processus d’acquisition d’un R2, notamment la complexité et la
régularité des règles de correspondance entre les variantes du R1 et du R2 (Rys et Bonte, 2006; Rys
et coll., 2017). En ce qui concerne la variation régionale en FQ, déjà Rivard (1914 : 27) évoquait à
son époque la remarquable uniformité phonétique du « franco-canadien ». Près d’un siècle plus tard,
Morin (2002 : 50) soutient toujours que les régiolectes québécois ne s’opposent que par « de toutes
petites différences » phonétiques. Dans ces circonstances, nous choisissons d’éluder la question des
effets de la complexité et de la régularité des règles de correspondance lors de l’acquisition d’un R2
du FQ. D’autre part, puisqu’il s’agira à notre connaissance de la première étude sur le sujet en FQ,
nous nous limiterons à établir si des changements en production se produisent chez les locuteurs
migrants; chercher à aborder le problème du lien entre les mécanismes de perception et de
production avant même d’avoir vérifié cette première condition nous semblerait prématuré. Les
facteurs internes qui régulent le processus d’acquisition d’un R2 n’occuperont donc pas un rôle
central dans cette étude.

Étant donné l’orientation sociophonétique adoptée, les facteurs externes seront quant à eux
davantage explorés. La revue des écrits présentée au Chapitre 2 a fait ressortir la spécificité des
facteurs externes qui influencent le processus d’acquisition d’un R2 et l’importance particulière de
l’intégration sociale, du prestige, de la fidélité à ses origines, du sujet de conversation et de l’âge.
Mentionnons qu’à l’heure actuelle, une étude portant sur l’acquisition d’un R2 du FQ est confrontée
aux savoirs lacunaires à propos de sa « géolinguistique phonétique » (Dolbec et Ouellon, 1999 : 17),
ce dont nous rediscuterons en Méthodologie (Chapitre 5). Par conséquent, les attitudes manifestées
par les locuteurs à l’égard des éventuelles caractéristiques phonétiques qui différencient les régions
du Québec demeurent inconnues. Dans un tel contexte, l’influence du prestige, apparent ou latent,
semble difficile à évaluer. En ciblant de jeunes étudiants universitaires, le facteur âge contribue
quant à lui à délimiter la population enquêtée, mais il ne sera pas analysé dans une perspective
comparative. Enfin, en raison de certains choix méthodologiques qui seront décrits dans le prochain
chapitre, nous ne nous attarderons pas systématiquement à la variation en fonction du sujet de

115
conversation, même si nous chercherons autant que possible à contrôler les effets de ce facteur.
Restent donc les différents volets de l’intégration sociale à sa communauté d’accueil, ainsi que le
souci d’intégrité et de fidélité à ses origines.

Pour atteindre notre second objectif de recherche, rappelons que de jeunes universitaires sédentaires
seront également sollicités. S’il ne semble pas pertinent, a priori, de s’interroger sur leur souci
d’intégrité et de fidélité, certains aspects de leur intégration sociale appellent néanmoins notre
attention. Les sédentaires ne changent pas de lieu de résidence à proprement parler, mais il n’en
demeure pas moins que la possibilité de se constituer un nouveau cercle social, centré sur le milieu
universitaire, s’offre à eux, et qu’ils en sont à se projeter dans l’avenir au même titre que les
mobiles.

Le troisième objectif de cette recherche est d’évaluer l’influence des facteurs externes que sont
l’intégration sociale et la fidélité à ses origines sur l’éventuelle acquisition d’un R2 par les jeunes
migrants interrégionaux québécois, ainsi que celle de l’intégration sociale sur les usages
phonétiques des jeunes universitaires sédentaires.

116
Chapitre 5 : Méthodologie
5.1 Lieux d’enquête
5.2 Temporalité
5.3 Participants
5.4 Corpus
5.4.1 La parole de laboratoire
5.4.2 Choix des variables
5.4.3 Analyse acoustique
5.5 Facteurs et indices externes
5.5.1 Le questionnaire
5.5.2 Catégorisation et quantification des facteurs et indices externes
5.5.2.1 Questionnaire démographique et facteur MOBILITÉ
5.5.2.2 Indice INTÉGRATION
5.5.2.3 Indice ÉMERGENCE
5.5.2.4 Indice FIDÉLITÉ
5.5.2.5 Synthèse
5.6 Analyses statistiques
5.6.1 Analyses statistiques sur les indices acoustiques
5.6.2 Analyses statistiques sur les indices INTÉGRATION et ÉMERGENCE
5.7 Synthèse générale

Dans ce chapitre, nous détaillerons l’approche méthodologique adoptée pour atteindre nos trois
objectifs de recherche. Dans un premier temps, nous justifierons la sélection du terrain d’enquête de
notre étude. Nous expliquerons ensuite de quelle manière l’aspect temporel a été manipulé. Nous
enchaînerons avec une brève description de l’échantillon investigué. Dans la section 5.4, nous
détaillerons la conception de notre corpus, du type de parole utilisée aux variables récoltées, ainsi
que les techniques d’analyse acoustique adoptées. Nous exposerons par la suite comment les
facteurs externes à l’étude ont été mesurés. Ce chapitre se terminera par une description des
analyses statistiques appliquées aux données.

5.1 Lieux d’enquête


Bien qu’essentielle, la nécessité de délimiter un terrain d’enquête pour notre étude peut paraître
paradoxale, la notion de lieu ayant d’entrée de jeu été présentée comme relative, et le rapport au lieu
entretenu par les individus, en bouleversement. De manière plus pratique, une difficulté que pose
l’atteinte de notre principal objectif de recherche est celle de former un échantillon cohérent de
locuteurs mobiles (Nycz, 2015 : 476). Plusieurs études présentées dans les sections précédentes sont
effectivement fondées sur un échantillon couvrant d’importants empans d’âge, d’âge d’arrivée et de
temps de résidence (Munro et coll., 1999; Bowie, 2001; Shockey, 1984; etc.), sans compter la
présence potentielle de plusieurs autres facteurs susceptibles d’avoir influencé la trajectoire
d’individus n’ayant, au final, aucun autre point commun que leur ville de résidence ou d’origine. De
plus, Nycz (2015) mentionne que dans l’idéal, les locuteurs mobiles devraient être suivis
longitudinalement à partir du moment où ils changent d’environnement, mais qu’il peut s’avérer

117
difficile de repérer et de recruter dans la population générale des individus sur le point de quitter
leur ville d’origine ou fraîchement établis dans leur ville d’adoption, et qui comptent y rester un
certain temps. Par conséquent, les établissements universitaires constituent un bassin de recrutement
privilégié pour les études sur l’acquisition d’un R2, le début des cours attirant invariablement et à
date fixe son lot de nouveaux étudiants, soit un groupe d’individus d’âge similaire, arrivés au même
moment, pour la même raison, et qui resteront dans leur ville d’accueil au moins quelques années,
le temps d’obtenir leur diplôme. Andersson et Thelander (1994 : 56) identifient quatre grands
patrons migratoires rencontrés dans les études sur la mobilité géographique : a) plusieurs origines
vers plusieurs milieux d’accueil; b) une origine commune vers plusieurs milieux d’accueil;
c) plusieurs origines vers un milieu d’accueil commun; d) une origine commune vers un milieu
d’accueil commun. Le recrutement dans un établissement universitaire peut correspondre à l’un ou
l’autre des deux derniers patrons; en ce qui nous concerne, il s’agit de c).

Nous avons sélectionné pour cette étude l’Université Laval, à Québec, d’une part pour des raisons
de commodité, puisque nous y sommes étudiante (accès aux listes de diffusion électronique et aux
installations telles que la chambre anéchoïque, par exemple). D’autre part, il s’agit de
l’établissement universitaire québécois comptant le plus important effectif étudiant à l’extérieur de
Montréal : en 2016-2017, 33 649 étudiants fréquentaient à temps plein l’Université Laval32. Il s’agit
également d’un pôle d’attraction pour les candidats de partout dans la province, ainsi une forte
concentration de jeunes migrants interrégionaux s’y retrouve. En effet, à l’automne 2014, on
dénombrait 11 951 nouvelles inscriptions à un programme de 1er cycle33. Parmi les nouveaux
inscrits de 2014, 54,11 % de ceux qui vivaient au Québec au moment de leur demande d’admission
étaient domiciliés hors de la région de la Capitale-Nationale34. Ces quelques caractéristiques
démographiques de la population étudiante de l’Université Laval, de même que la vocation
francophone de l’établissement, en font un lieu à haut potentiel de recrutement pour notre étude.

32
Prévisions de l’e ecti étudiant à l’université publiées par le ministère de l’Éducation et de l’Enseignement
supérieur du Québec. Adresse URL (en date du 21 décembre 2018) :
http://www.education.gouv.qc.ca/references/publications/resultats-de-la-recherche/detail/article/previsions-
de-leffectif-etudiant-a-luniversite/
33
Séries statistiques publiées à l’intention du personnel par le Bureau du registraire de l’Université Laval,
auxquelles nous avons accédé par l’intermédiaire de notre directrice de recherche.
34
Comment la culture à l’Université Laval peut-elle contribuer à la réussite de l’étudiant tout au long de sa
formation ? Avis publié par la Commission des affaires étudiantes de l’Université Laval. Adresse URL (en
date du 21 décembre 2018) :
https://www.ulaval.ca/fileadmin/developpement_durable/documents/Avis-CAE-Culture-Mai2016.pdf
Cette proportion inclut les étudiants de Chaudière-Appalaches, donc de Lévis.

118
Par ailleurs, un postulat sous-jacent à l’étude de l’acquisition d’un R2 au Québec est qu’il existe
différents régiolectes dans la province, ou à tout le moins certaines caractéristiques phonétiques qui
varient d’un endroit à l’autre. Le terrain d’enquête sélectionné devrait ainsi présenter des
spécificités régiolectales susceptibles d’être acquises par les locuteurs mobiles. En synchronie
toutefois, la situation est loin d’être aussi limpide.

Dolbec et Ouellon (1999 : 18) identifient trois types d’études effectuées sur la géographie
phonétique du FQ au cours du XXe siècle. Les études du premier type visent à fournir un aperçu des
caractéristiques phonétiques partagées par la majorité des locuteurs québécois et à identifier celles
qui distinguent le FQ d’autres français, en particulier du français parisien (Gendron, 1966). De
telles études mettent de l’avant des phénomènes phonétiques comme l’affrication des consonnes /t/
et /d/ devant /i y j ɥ/ ou le relâchement des voyelles fermées en syllabe fermée par une consonne
non allongeante, mais adoptent un point de vue homogénéisant sur le FQ. Les études du second type
se limitent à une aire géographique plus restreinte (village, ville, région) et visent à documenter les
caractéristiques phonétiques qui y sont en usage : Paradis (1985) à Chicoutimi/Jonquière, Lorent
(1977) en Beauce, Deshaies-Lafontaine (1974) à Trois-Rivières, etc. Il est cependant difficile de
déterminer si les usages ainsi décrits sont propres aux locuteurs de cette aire géographique ou s’ils
ont cours sur un territoire plus vaste, à moins qu’une comparaison avec les résultats issus
d’enquêtes similaires effectuées ailleurs ne soit possible. Les études du troisième type ont pour
objectif de fournir une description détaillée de phénomènes phonétiques spécifiques, la question de
leur conditionnement social ou géographique étant parfois également abordée (voir Paradis et
Dolbec, 1998 pour une synthèse par phénomène). De telles études ne permettent malheureusement
pas la mise en relation des différents phénomènes phonétiques du FQ. Lorsque vient le temps de
dresser un portrait de la variation interrégionale au Québec, à l’esquisse hétéroclite résultant de ces
trois types d’enquêtes s’ajoutent les problèmes de la multiplicité des méthodologies utilisées et de la
relative ancienneté des études sur le sujet. En l’état, toute description du phonétisme du FQ
contemporain et de la variation interrégionale actuelle demeure parcellaire35.

La ville de Québec constituait le cœur de l’aire régiolectale de l’Est à l’époque où la province


pouvait être divisée en fonction de « l’isoglosse du ʀ » (Dulong et Bergeron, 1980; Dolbec et
Ouellon, 1999), un tracé répartissant les locuteurs du FQ en utilisateurs des variantes dorsales
[ʁ]/[ʀ] à l’est et en utilisateurs de la variante apicale [r] à l’ouest. Québec tenait également lieu de

35
Des progrès sur ce terrain sont à prévoir avec l’exploitation de la base de données Québec Phone 2016 de
Sigouin (en préparation) et le projet PFC (Durand et coll., 2009) qui poursuit son déploiement à l’échelle de la
francophonie. Mentionnons également que les problèmes soulevés par Dolbec et Ouellon (1999) ne sont pas
exclusifs au FQ (voir Hinskens, 1998 : 159).

119
« ville » par rapport aux régions avoisinantes lors de descriptions s’inscrivant dans un paradigme
ville/région. Ainsi, des caractéristiques comme l’aspiration de /ʃ ʒ/ ou la palatalisation de /t d k ɡ/
ont été associées aux « parlers ruraux » de régions comme le Saguenay–Lac-Saint-Jean ou la
Beauce, par opposition aux usages citadins de Québec (Dolbec et Ouellon, 1999; Paradis et Dolbec,
1998). Remysen (2016a : 52) suggère que cette macro-division ville/région est encore d’actualité,
bien que les résultats de l’enquête de dialectologie perceptive rapportée par l’auteur ne permettent
pas, pour l’instant du moins, d’isoler les caractéristiques phonétiques à l’origine d’une telle
catégorisation. Notons toutefois que la généralisation des variantes dorsales [ʁ]/[ʀ] observée
pendant la seconde moitié du XXe siècle (voir entre autres Sankoff et Blondeau, 2007) a fragilisé les
assises d’une distinction phonétique Est-Ouest et que l’opposition ville/région présente le problème
de relever autant de facteurs socio-économiques et situationnels que géographiques. Récemment,
certaines pratiques phonétiques des locuteurs de Québec ont été dépeintes dans le cadre du projet
Caractéristiques acoustiques des voyelles orales québécoises (désormais CAVOQ), qui contribue
notamment à mettre au jour des différences entre les usages contemporains de jeunes étudiants
universitaires originaires des centres urbains de Québec et de Saguenay (pour plus de détails sur ce
projet, voir Arnaud et Roy, 2016 : 176-177 et la section 5.4.2). Cependant, puisque le reste de la
province n’y est pas représenté, ces différences ne peuvent ni dépasser les limites du cadre
comparatif entre les deux centres urbains, ni permettre de statuer sur l’existence d’un régiolecte de
Québec ou de variantes propres à cette ville.

En regard de notre objet d’étude, il ne s’agit toutefois pas d’une difficulté insurmontable. D’abord,
en recrutant des participants dans un établissement universitaire, rien n’assure que leur input
quotidien proviendra bel et bien de locuteurs de Québec. Nycz (2015 : 476) l’exprime en ces
termes : « students may interact with local residents to some extent, but are more likely to spend
time with other students who may also be from other regions ». Les changements phonétiques
susceptibles de se produire ne se limitant donc pas à l’adoption de caractéristiques locales, nous
nous intéresserons à la trajectoire des participants, telle que définie dans la section suivante, sans
nécessité de délimiter un régiolecte d’arrivée et un régiolecte de départ. De toute manière, la
conclusion à laquelle nous sommes parvenue au terme de la section 2.4.4, qui portait sur le rôle de
la saillance (subjective) lors de l’acquisition d’un R2, était que s’en tenir à des variables saillantes,
audibles, conscientes et documentées présente certainement des avantages méthodologiques, mais
mène à sous-estimer les changements qui se produisent chez les locuteurs mobiles.

Finalement, rappelons que nos deuxième et troisième objectifs de recherche impliquent de faire
appel à de jeunes universitaires sédentaires en plus des mobiles. Le recrutement de ces participants

120
originaires de Québec et y vivant encore pouvait également avoir lieu à l’Université Laval, qui
selon les statistiques rapportées précédemment, comptait parmi les nouvelles inscriptions de 2014 la
proportion non négligeable de 46,89 % d’étudiants établis dans la région de la Capitale-Nationale
au moment de leur demande d’admission, sans compter ceux de Lévis. Le concours de participants
sédentaires permet de surcroît d’isoler les effets du facteur MOBILITÉ et de constituer un corpus de
référence. En l’absence de connaissances théoriques précises au sujet du régiolecte de Québec, nous
pourrons effectivement traiter les productions des participants sédentaires comme le reflet des
caractéristiques phonétiques actuellement en usage dans cette ville, auxquelles nous pourrons
comparer celles des locuteurs provenant d’ailleurs dans la province.

5.2 Temporalité
Contrairement aux chercheurs qui exploitent des données provenant de documents écrits, ceux qui
s’intéressent au changement phonétique n’ont pas toujours l’opportunité de s’appuyer sur des
données empiriques pour rendre compte des usages antérieurs d’une communauté linguistique
(Sankoff, 2005). L’absence d’enregistrements effectués à une époque antérieure, réalité prégnante
avant les années 1960, a suscité la réflexion entourant les façons possibles de reconstituer
l’évolution temporelle des usages phonétiques. Nombre d’études qui portent un regard diachronique
sur cet aspect de la langue sont ainsi fondées sur le principe de temps apparent (Bailey, 2002;
Labov, 1994 : 43-72). Ce concept-clé en sociolinguistique consiste à comparer les productions de
locuteurs de différents groupes d’âge à un moment déterminé; si elles sont différentes, il est
possible qu’un changement soit en cours dans la communauté étudiée. Bien qu’il s’agisse d’un
succédané de temporalité dont la validité méthodologique, en l’absence totale d’enregistrements
antérieurs, est reconnue (Bailey, 2002 : 312), le concept de temps apparent tend à être critiqué en
raison de la difficulté à distinguer ce qui relève réellement du changement de ce qui ne constitue
qu’un phénomène de gradation d’âge (age grading), mais aussi parce qu’il fait abstraction des
modifications que le système phonétique d’un locuteur est susceptible de subir en cours de vie. En
postulant que les usages d’une génération plus âgée représentent un état antérieur de la langue, le
principe de temps apparent fait fi de l’influence des changements en cours dans la communauté,
ceux-là mêmes qui sont scrutés par les chercheurs, sur le système de l’adulte (Sankoff et Blondeau,
2007, 2013; MacKenzie et Sankoff, 2010; Nahkola et Saanilahti, 2004; Bowie, 2005, 2015;
Harrington et coll., 2000, et seq.; voir la section 2.2). Le problème est d’autant plus grand lorsque
l’environnement linguistique du locuteur subit une transformation aussi substantielle qu’un
changement régiolectal, sachant en outre que le principe de temps apparent a été conceptualisé pour
rendre compte de la dynamique du changement au sein de communautés linguistiques, dont les

121
locuteurs mobiles ne peuvent être considérés comme membres à part entière. Mentionnons tout de
même la tentative de Campbell-Kibler et coll. (2014 : 23) d’adapter le principe de temps apparent à
une situation d’acquisition d’un R2 chez de jeunes universitaires de l’Ohio : les auteures
considèrent avoir recours à une variante de ce principe lorsqu’elles comparent les productions de
locuteurs en première et deuxième années d’études à celles de locuteurs en troisième et quatrième
années d’études.

Comme le souligne toutefois Sankoff (2018a : 43), « [i]n studying language change, nothing can
replace real time ». Ainsi, certains travaux sur le changement phonétique recourent plutôt à la
comparaison en temps réel, qui se décline en trois versions : l’utilisation de données préexistantes,
l’étude transversale (cross-sectional ou trend study) et l’étude longitudinale (panel study) (Bailey,
2002; Sankoff, 2005). L’utilisation de données préexistantes consiste à comparer les usages de
locuteurs appartenant au même groupe d’âge, mais à des époques différentes. Par exemple, un
chercheur récoltant des données actuelles auprès d’adolescents d’une communauté linguistique
donnée pourrait les comparer avec celles récoltées 30 ans auparavant auprès d’adolescents de la
même communauté. Cette technique permet d’éluder le problème du phénomène de gradation
d’âge, mais la possibilité d’accéder à un corpus oral antérieur comparable, en particulier sur le plan
méthodologique, n’est pas chose commune. Une variante de cette technique présente dans la
littérature portant sur l’acquisition d’un R2 consiste à utiliser un corpus comparatif composé des
productions de locuteurs issus non pas d’une autre époque, mais des communautés linguistiques de
départ (R1) et d’accueil (R2) du locuteur mobile. Ses productions sont comparées avec celles des
groupes-contrôles composés de locuteurs sédentaires, ce qui permet d’évaluer le changement qui
s’est produit chez le locuteur depuis qu’il a quitté son milieu d’origine (Conn et Horesh, 2002; von
Essen, 2016; Ziliak, 2012).

Les études transversales et longitudinales, autrefois exceptionnelles selon Sankoff (2005 : 1003),
sont devenues moins rares à partir des années 1990, lorsqu’ont commencé à paraître des études de
suivi de communautés étudiées dans les années 1960 ou 1970. Au Québec, par exemple, les corpus
Montréal 84 (Thibault et Vincent, 1990) et Montréal 1995 (Vincent et coll., 1995) représentent de
tels suivis de la communauté étudiée lors de la constitution, en 1971, du corpus Sankoff-Cedergren
(Sankoff et Cedergren, 1971). Les études transversales consistent à réexaminer les usages de
locuteurs similaires à ceux initialement considérés, mais sans contacter les mêmes participants une
seconde fois. Par exemple, si l’étude originale porte sur un échantillon de locuteurs âgés de 30 ans,
une étude de suivi survenant 20 ans plus tard portera sur un échantillon de locuteurs de 50 ans,
identiquement stratifiés, et sélectionnés dans la même communauté linguistique. Les études

122
longitudinales consistent quant à elles à récolter de nouvelles données auprès des locuteurs qui ont
pris part à l’enquête initiale. Entrent dans cette catégorie aussi bien les suivis de cohorte, qui
impliquent plusieurs participants, que les études de cas, qui habituellement n’en comptent qu’un
(Buchstaller et Wagner, 2018 : 2).

Puisque de telles techniques permettent de porter un regard inédit sur les rouages du changement
phonétique, leur relative rareté peut surprendre, ce que Gerstenberg et Voeste (2015 : 4) attribuent
en partie à la raison suivante : « the major practical difficulty of empirical longitudinal studies
(encompassing the lifespan as a whole) is that they conflict with an increased interest in quick
results – and with the established practice of short-term project funding ». Certaines de leurs limites
inhérentes doivent également être rappelées. D’abord, en plus de nécessiter des ressources
considérables, elles s’étendent sur une période parfois si vaste qu’une même équipe de recherche
n’est pas nécessairement en mesure d’assurer le suivi de sa propre enquête. Les études
longitudinales présentent également le problème de la « mortalité de l’échantillon » (Blais et
Durand, 2009 : 459), ou attrition. Il s’agit de l’ensemble des facteurs qui pourraient faire en sorte
que certains témoins ayant pris part à la première expérience ne participent pas à la seconde : décès
en tant que tel de certains, impossibilité pour l’équipe de recherche de reprendre contact avec
d’autres, déménagement, refus de coopérer à nouveau. À titre d’exemple, parmi les 120 locuteurs
composant le corpus Sankoff-Cedergren de 1971, la moitié a été réenregistrée 13 ans plus tard
(Thibault et Vincent, 1990; Sankoff, 2018a). L’attrition rapportée par Sundgren (2009), dont les
deux temps d’enquête sont séparés de 29 ans, est encore plus importante : des 83 locuteurs
enregistrés en 1967, seuls 13 étaient encore vivants et résidents du lieu d’enquête en 1996. Enfin,
parvenir à isoler le facteur temps, à ce que toutes choses soient égales par ailleurs, n’est pas toujours
un objectif réaliste dans le cadre d’une étude longitudinale, en raison des facteurs multiples et de
toutes natures susceptibles de s’interposer d’une expérimentation à l’autre (Sankoff, 2018a;
Gerstenberg et Voeste, 2015). Les données longitudinales sont donc, par essence, idiosyncrasiques
(Wagner et Tagliamonte, 2018 : 229).

Par rapport aux autres techniques décrites, l’approche longitudinale présente toutefois plusieurs
avantages pour l’étude de l’acquisition d’un R2. D’une part, l’aspect fondamentalement
idiosycrasique de cette approche ne peut qu’être pertinente pour l’étude d’un processus aussi
variable et hétérogène que l’acquisition d’un R2. Elle permet, d’autre part, de rendre compte des
changements phonétiques affectant le système d’un locuteur donné, que celui-ci fasse partie ou non
des structures d’analyse traditionnelles, contrairement par exemple aux études transversales, qui
s’insèrent dans une interprétation du changement phonétique fondée sur le concept de communauté

123
linguistique, dont les locuteurs migrants ne font pas partie. Bowie (2005 : 46) rappelle qu’un
individu est toujours comparable à lui-même : sans qu’il n’ait à être catégorisé comme locuteur
typique d’un régiolecte précis, sans qu’il n’ait à partager toutes les caractéristiques phonétiques de
son R1 ou de son R2, seul importe le fait qu’il change ou non ses productions, quelles qu’elles
soient et peu importe leur représentativité, d’une expérimentation à l’autre.

Puisque nous connaissons peu les caractéristiques et la répartition géographique des potentiels
régiolectes du FQ, que les usages locaux ne constituent pas nécessairement le principal input des
étudiants universitaires mobiles et qu’en conséquence, les changements susceptibles de se produire
ne se limitent pas à l’adoption de caractéristiques locales, l’analyse de trajectoires entre deux
expérimentations semblait la mieux adaptée à notre objet d’étude. Nous avons ainsi mis à profit
l’approche longitudinale et récolté des données auprès de nos participants à deux reprises : au tout
début de leur baccalauréat (T1), puis au bout d’un an de scolarité (T2). Nycz (2015 : 476)
mentionne que ne prendre en considération qu’un si court temps de résidence constitue l’un des
désavantages de recruter parmi la population étudiante. Cependant, différents travaux portant sur
l’acquisition d’un R2 et le changement phonétique en contexte universitaire (Evans et Iverson,
2007; Pardo et coll., 2012; Wagner, 2012) montrent que même un temps de résidence réduit peut
s’avérer suffisant pour que certaines modifications aient lieu. Selon la classification opérée
notamment par Nardy et coll. (2014) et Sonderegger et coll. (2017), il s’agit d’un suivi à moyen
terme, à différencier du court (heures, jours) et du long (plusieurs années) termes.

5.3 Participants
La technique d’échantillonnage non probabiliste dite « de volontaires » (voluntary sample) a été
privilégiée pour le recrutement des participants. Fréquente en sciences humaines et dans tout projet
de recherche où l’on ne peut « imposer une expérimentation » aux sujets (Beaud, 2009 : 263), cette
technique consiste à récolter des données auprès de tous ceux qui veulent bien collaborer, en autant
qu’ils répondent aux critères de sélection établis par le chercheur. L’une des principales limites de
cette technique d’échantillonnage concerne la disposition psychologique des individus se portant
volontaires. Selon l’objet d’étude, ils peuvent chercher à plaire, à se mettre en valeur, à s’informer,
à obtenir de l’aide, etc. À titre d’exemple, en sciences phonétiques, les volontaires pourraient être
tentés de surveiller à outrance leur prononciation afin d’offrir une bonne performance. De plus, le
chercheur ne peut contrôler en amont si les volontaires recrutés permettront de constituer un
échantillon suffisamment représentatif. Il peut donc devoir le faire en aval, par exemple en opérant
une sélection parmi les participants, ou encore en redressant l’échantillon, c’est-à-dire en procédant
à une seconde vague de recrutement ciblant exclusivement des témoins dont le profil permettra

124
d’atteindre la représentativité voulue. Nonobstant ces limites, Beaud (2009 : 264) considère que les
échantillons de volontaires constituent un outil économique qui génère des résultats valides, dès lors
que le chercheur l’exploite en toute connaissance de cause.

La notion de représentativité dont nous venons de faire mention est investie d’une importance toute
particulière en sociolinguistique variationniste (Milroy et Gordon, 2003 : 24-30). En cherchant à
décrire des faits de langue dont l’existence même relève de la différenciation sociale, en s’extrayant
de l’idiosyncrasique pour saisir le généralisable, les variationnistes font face à la nécessité d’étudier
un échantillon dont la stratification réplique celle de la communauté. Cependant, plus un échantillon
prétend à la représentativité, plus il comprend de paramètres, plus le nombre de participants doit
être élevé, et plus le profil de chacun d’entre eux doit être spécifique. Le danger qui guette alors le
chercheur est la contre-productivité (Milroy et Gordon, 2003 : 29), menant potentiellement à
l’épuisement des ressources, notamment financières, en cours d’échantillonnage. Le chercheur doit
ainsi composer avec certains choix méthodologiques, par exemple la diminution du nombre de
paramètres pris en compte, laissant entrevoir le caractère relatif de la notion de représentativité.
Avec l’avènement de la deuxième vague d’études sociolinguistiques (Eckert, 2012), le souci de
représentativité acquiert une nouvelle dimension dans ce domaine de recherche. On tâche alors de
décrire les pratiques de locuteurs appartenant à des cellules plus restreintes mais signifiantes,
d’identifier les facteurs spécifiques qui conditionnent leurs usages, de répliquer le protocole auprès
d’autres cellules semblablement restreintes et signifiantes, et d’obtenir une vision d’ensemble en
colligeant les résultats de ces différents travaux. C’est dans une telle approche que s’inscrivent les
études portant sur l’acquisition d’un R2 en contexte universitaire citées précédemment (voir la
section 2.4.6.2), études qui exhortent à la tenue d’autres analyses de la trajectoire de locuteurs d’âge
similaire, en contexte similaire, en fonction de facteurs similaires (Wagner, 2012 : 180). Dans cette
perspective, notre échantillon se veut comparable à celui exploité dans des études semblables à la
nôtre, plutôt que représentatif de la communauté en général.

Notre objectif était de recruter des étudiants universitaires âgés de 18 à 25 ans, possédant le FQ
comme langue maternelle et commençant un premier baccalauréat dans les mois suivant la fin de
leurs études collégiales. Aussi bien des témoins mobiles que sédentaires étaient requis. Les
sédentaires sont définis comme des individus nés dans leur ville de résidence ou y étant arrivés
avant l’âge de deux ans et y ayant passé la très grande majorité de leur vie. Le profil des individus
dits mobiles est semblable, à l’exception que peu avant l’expérimentation, ils ont quitté leur ville
d’origine pour s’installer à Québec afin d’entreprendre un baccalauréat. Le recrutement initial (T1)
a eu lieu en septembre 2016 et s’est effectué de manière électronique : l’appel à participation

125
reproduit en Annexe 1 a été diffusé par courriel aux membres d’une liste de distribution regroupant
l’ensemble des étudiants de l’Université Laval inscrits au 1er cycle à l’automne 2016. Pour la
seconde partie de l’étude (T2), tenue à l’automne 2017, les participants ont été recontactés
personnellement par courriel.

Parmi les 54 étudiants qui ont répondu à l’appel initial36, nous en avons ipso facto écarté quatre.
Deux avaient des parents d’origine française, étaient nés en France ou y avaient séjourné de manière
prolongée (quelques années) et présentaient, selon nos impressions auditives lors de
l’enregistrement, des traits phonétiques européens, tels qu’une affrication faible, un maintien de la
tension des voyelles fermées en syllabe fermée par une consonne non allongeante et un système de
voyelles nasales à trois timbres. Les deux autres témoins écartés avaient fait preuve d’une mobilité
importante au cours de leur vie et avaient eux-mêmes de la difficulté à déterminer d’où ils étaient
originaires. L’un d’eux entreprenait en outre son troisième baccalauréat à l’Université Laval. Dix-
sept participants n’ont quant à eux pas pris part à la seconde partie de l’étude, l’un d’entre eux en
raison d’un nouvel appareil dentaire ayant, selon ses dires, modifié sa prononciation de manière
perceptible, les autres n’ayant pas répondu au courriel de reprise de contact en septembre 2017. Le
taux d’attrition atteint ainsi 34 % (17/50) et notre échantillon comprend au final 33 participants,
dont voici quelques caractéristiques.

Ce sont tous des étudiants universitaires âgés de 18 à 22 ans au T1 (x = 19,7; Md = 20; Mo = 19),
possédant le FQ comme langue maternelle et vivant à Québec (incluant Lévis) au moment des
enregistrements. Précisons qu’une participante est née aux États-Unis de parents francophones et est
arrivée à Québec à l’âge d’un an. Quinze locuteurs (8 femmes et 7 hommes) possèdent le profil
sédentaire : ils sont nés à Québec ou à Lévis, y ont grandi et y vivent encore, bien que certains
d’entre eux aient effectué des séjours de quelques mois hors de la province (Ouest canadien,
Amérique latine, par exemple) dans le cadre de voyages personnels ou d’échanges étudiants. Dix-
huit locuteurs (15 femmes et 3 hommes) possèdent pour leur part le profil mobile : ils sont nés
ailleurs dans la province qu’à Québec ou à Lévis et n’ont pas fait preuve de mobilité substantielle
au cours de leur vie, à l’exception de courts séjours hors de la province ou de périodes plus ou

36
À l’origine, un volet de notre enquête devait avoir lieu à l’Université du Québec à Chicoutimi. Les
différentes démarches de recrutement entreprises à l’UQAC (envoi d’un courriel à l’ensemble de la
communauté étudiante, annonce publiée sur la page Facebook de l’établissement et dans l’infolettre du
Département des sciences fondamentales, visite de trois classes [cours de chimie, d’intervention plein air et de
grammaire] pour une annonce orale) ont mené à l’enregistrement de 8 participants, dont aucun ne possédait le
profil mobile attendu. Nous avons décidé d’interrompre l’enquête à l’UQAC. Les 8 participants qui y ont été
enregistrés au T1 ne sont pas pris en compte dans cette étude.

126
moins prolongées passées dans des villes et villages de leur région d’origine (par exemple, une
participante originaire de Dolbeau-Mistassini a vécu trois ans dans le village de Sainte-Jeanne-
d’Arc, 20 km à l’est). Parmi ces 18 participants mobiles, 16 se sont installés à Québec dans les
2 semaines à 3 mois précédant la première partie de notre enquête, dans le but d’entreprendre un
baccalauréat à l’Université Laval en septembre 2016. Les deux autres locuteurs vivaient à Québec
depuis un an, car ils y avaient effectué une partie de leurs études collégiales37. La répartition des 18
locuteurs mobiles en fonction de leur origine géographique est présentée dans le Tableau 3.

Tableau 3 : Origine géographique des 18 participants mobiles, regroupés par régions


administratives québécoises
Nombre de locuteurs
Région Villes représentées
(n=18)
- Amos
4
Abitibi-Témiscamingue - La Sarre
(2 hommes)
- Val-d’Or
3 - Rimouski
Bas-St-Laurent
(1 homme) - Rivière-du-Loup
- St-Léonard-d’Aston
Centre-du-Québec 3
- Victoriaville
Estrie 1 - Sherbrooke
Gaspésie 1 - Ste-Anne-des-Monts
- St-Élie-de-Caxton
Mauricie 2
- Trois-Rivières
Montérégie 1 - Contrecœur
Outaouais 1 - Plaisance
- Dolbeau-Mistassini
Saguenay–Lac-Saint-Jean 2
- Jonquière

5.4 Corpus
5.4.1 La parole de laboratoire
Le choix du type de parole récoltée lors d’une expérimentation constitue à la fois un élément
déterminant de l’analyse phonétique et un objet de débat dans la communauté scientifique. Comme
le rappelle Thomas (2011 : 3), il s’agit de l’une des pommes de discorde traditionnelles entre
sociolinguistes et phonéticiens. Pour Labov (1976 : 289), la parole produite par un locuteur varie
sur un continuum unidimensionnel qui traduit l’attention qu’il porte à son discours, la forme la
moins surveillée, dite vernaculaire, fournissant « les données les plus systématiques, nécessaires à
l’analyse de la structure linguistique ». Très tôt, l’idéal du vernaculaire est confronté au paradoxe de
l’observateur : lorsqu’un témoin se sait à l’examen, il augmente l’attention portée à son discours,

37
Nous avons choisi de ne pas exclure de l’échantillon ces deux locuteurs en raison du taux d’attrition déjà
élevé (34 %).

127
rendant l’observation scientifique du vernaculaire problématique. La difficulté n’est pourtant pas
insurmontable, selon Labov (1976 : 290), seulement faut-il savoir amener le locuteur à baisser la
garde pendant l’entrevue, technique de collecte de données privilégiée, en lui demandant par
exemple de relater un épisode de sa vie où il s’est senti en danger de mort. Au-delà de l’enjeu
initial, c’est-à-dire l’accès au vernaculaire, les moyens mis en place pour susciter chez le locuteur
une augmentation ou une diminution de l’attention portée à son discours engendrent toute une
réflexion entourant la variation stylistique. Progressivement, l’enjeu change : les sociolinguistes
portent un intérêt aux styles de parole pour ce qu’ils sont, sans en favoriser un en particulier, et
cherchent à dégager des patrons de variation en fonction de ce paramètre, qui devient partie
intégrante du canevas variationniste (Milroy et Gordon, 2003 : 50). L’un des moyens employés dans
la littérature sociolinguistique pour susciter la variation stylistique est d’intégrer lors d’une même
expérience plus d’une modalité de parole : l’entretien traditionnel avec les témoins, qui génère de la
parole dite spontanée, est souvent complémenté par différentes tâches de lecture (Thomas,
2011 : 3).

Les phonéticiens sont plutôt réputés miser sur une parole hautement contrôlée, typiquement issue de
tâches de lecture oralisée en laboratoire, un choix méthodologique motivé par le souci d’isoler les
variables à l’étude et d’assurer que le protocole expérimental puisse être répliqué (Thomas,
2011 : 3; Wagner et coll., 2015 : 3-4). Du point de vue des variationnistes, une trop grande
importance est accordée à une parole extirpée de tout contexte social (Jannedy et Hay, 2006 : 406),
c’est-à-dire à une parole qui en elle-même, n’existe pas. Xu (2010 : 329) fait valoir que la
perception de cette « parole de laboratoire » (lab speech) est en réalité hautement stéréotypée,
même au sein de la communauté scientifique. On l’associe volontiers à la stricte production de
syllabes ou de voyelles isolées (comme dans l’étude de Peterson et Barney, 1952, notamment), alors
que la gamme de procédés déployés par les chercheurs est en réalité beaucoup plus vaste et
diversifiée, et qu’une définition plus juste de la parole de laboratoire serait la suivante : « speech
sampled under experimental control » (Xu, 2010 : 329). Cependant, en acceptant cette définition, la
frontière entre paroles spontanée et de laboratoire se brouille, puisque toute récolte scientifique de
parole est nécessairement encadrée par un protocole expérimental. Xu (2010 : 329) donne l’exemple
d’une expérience où un locuteur serait amené à fournir oralement des directives d’utilisation d’un
produit à un auditoire hypothétique, sans recourir à un texte préétabli. Bien que l’issue de ce
protocole puisse être catégorisée comme de la parole spontanée étant donné l’absence de script, il
demeure que les conditions expérimentales mises en place exercent un certain contrôle sur le
lexique, les structures syntaxiques, voire le patron prosodique employés par le locuteur, et que

128
l’étiquette « parole de laboratoire » apparaît tout aussi appropriée. Prenant appui sur de nombreuses
études empiriques, Xu (2010) s’attache également à réfuter différents mythes entourant la parole de
laboratoire (lenteur du débit, manque de naturel et de variation prosodique, absence de fonctions
communicatives, interactionnelles et émotionnelles) en soutenant qu’à l’aide d’un protocole
expérimental soigneusement conçu, aucun phénomène n’est impossible à observer, et invite à ne
pas sous-estimer le potentiel d’une consigne explicite. Enfin, l’auteur souligne que l’une des
réserves les plus fréquemment exprimées à l’égard de la parole de laboratoire concerne sa
spécificité, ou l’impossibilité à observer les tendances qui s’en dégagent dans un contexte de
production plus écologique. À cela, Xu (2010 : 332) objecte que tout contexte écologique de
production est influencé par un nombre si important de variables qu’il est tout aussi spécifique que
la parole de laboratoire et que les tendances qui s’en dégagent ne sont pas davantage généralisables.

Dans une perspective phonétique, on ne peut passer sous silence la tâche titanesque que représente
l’analyse de la parole spontanée (Milroy et Gordon, 2003 : 51). Xu (2010 : 332) fait valoir que le
simple fait de repérer une paire minimale qui réponde à tous les critères établis par le chercheur
peut s’avérer un processus fastidieux, en raison des nombreux facteurs linguistiques qui sont
susceptibles de s’interposer (structure syllabique, effets coarticulatoires, accentuation, prosodie,
etc.). Étant donné nos objectifs de recherche, nous sommes particulièrement sensible à ce problème.
En effet, puisque notre but premier est de repérer des changements attribuables à la mobilité
géographique, nous devons nous assurer que les éventuelles différences observées entre le T1 et le
T2 sont bien la conséquence de ce facteur, et non celle de l’impossibilité à repérer deux contextes
de production identiques au T1 et au T2. Notre priorité étant donc de répliquer le protocole
expérimental élaboré, notre choix s’est porté vers la parole de laboratoire, plus particulièrement vers
la lecture. L’utilisation d’un script préétabli a en outre permis d’exercer un contrôle relatif sur le
contenu sémantique des productions, le sujet abordé par les locuteurs mobiles ayant des
conséquences potentiellement importantes sur leurs usages (Love et Walker, 2013; Nycz, 2013;
Sankoff, 2004; voir sections 2.4.5 et 3.4).

Trois tâches de lecture ont été conçues. La première consistait en la lecture de 96 mots cibles en
finale de phrases porteuses différentes et sémantiquement signifiantes (tâche 1)38. La seconde
consistait en la lecture des mêmes mots cibles insérés dans la phrase porteuse « Je pense au mot X
très fort » (tâche 2). La troisième consistait en la lecture isolée des mots cibles déjà présentés deux
fois (tâche 3). Proposer aux participants trois tâches différentes (plutôt qu’une seule tâche répétée

38
Ces mots sont présentés en Annexe 2 et seront justifiés dans la section suivante (5.4.2). Les phrases
porteuses de la tâche 1 sont quant à elles reproduites en Annexe 3.

129
trois fois) visait d’abord et avant tout à éviter qu’ils ne considèrent l’expérience trop répétitive et
qu’ils s’en désintéressent, l’une des causes possibles de la mortalité de l’échantillon (Blais et
Durand, 2009 : 459). Par ailleurs, nous considérons que les trois contextes de production possèdent
des avantages comme des désavantages, aussi les mettre à profit conjointement constitue en quelque
sorte un compromis. En ce qui concerne la tâche 1, l’insertion des mots cibles dans une phrase
sémantiquement signifiante permet de réduire le risque d’erreurs de production dues à une
confusion lexicale, notamment entre unités à orthographe similaire (par exemple, jeune [ʒœn] vs
jeûne [ʒøn]). Cependant, la potentielle influence de la phrase porteuse sur les occurrences peut non
seulement se faire sentir, mais jamais de manière identique. Les productions cibles sont certes sous
accent, mais la position finale peut donner lieu à différents phénomènes rendant l’analyse
acoustique difficile, en particulier la voix craquée et la voix soufflée. La tâche 2, qui consiste à lire
des mots cibles insérés dans une phrase porteuse fixe, assure que l’éventuelle influence de la phrase
porteuse est toujours la même. L’insertion des occurrences cibles au cœur de la phrase porteuse
mais en fin de syntagme permet d’obtenir des productions accentuées tout en réduisant le risque que
certaines d’entre elles soient acoustiquement inanalysables comme en position finale. Les
confusions lexicales sont cependant plus probables et la production à répétition d’une même
séquence peut mener à une prosodie redondante. Quant à la tâche 3, soit la lecture de mots isolés,
elle présente l’avantage d’être complétée beaucoup plus rapidement que les deux autres et permet
d’extraire les mots cibles à l’influence de quelque phrase porteuse. Le risque d’un « effet de liste »,
c’est-à-dire une prosodie hautement répétitive attribuable à la lecture d’une liste de mots, est
cependant bien présent, même si les occurrences ont été présentées une à la fois, et non sous forme
de liste en tant que telle. Le risque de confusion lexicale est également à son niveau le plus élevé,
mais tous les mots en étaient à leur troisième apparition, et aucun élément impossible à
désambigüiser sans contexte (par exemple, fils [fɪl] vs fils [fɪs]) n’a été introduit à dessein.

Les participants ont été enregistrés individuellement en chambre anéchoïque au format numérique
(44 100 Hz, 16 bits) à l’aide d’un appareil enregistreur Zoom H4n au T1 et Tascam DR-100 MKIII
au T2. Au T1 comme au T2, ils ont pris part aux trois tâches de lecture oralisée décrites ci-haut,
ainsi qu’à une courte phase d’entraînement préalable (voir Annexe 3) pendant laquelle ils pouvaient
se familiariser avec les différents volets du protocole proposé et le matériel d’enregistrement. En
contexte ou isolées, toutes les occurrences étaient présentées une à la fois sur l’écran d’une tablette
électronique, à un rythme que nous contrôlions. Les participants recevaient la consigne explicite de
lire le matériel le plus naturellement possible et étaient informés qu’en cas d’erreur (inversion ou

130
omission de mots, par exemple), ils n’avaient qu’à rectifier le tir en relisant la phrase ou le mot39. Ils
étaient également conscients du fait que notre étude portait sur les changements de prononciation,
mais pensaient que ceux-ci étaient strictement causés par les multiples bouleversements qui
marquent le début de l’âge adulte, la mobilité géographique n’ayant été mentionnée dans aucun
document ou conversation40.

5.4.2 Choix des variables


À plus d’une reprise, nous avons mentionné que les changements phonétiques qui se produisent en
situation de mobilité géographique ne se limitent pas à des spécificités régionales saillantes et
documentées. Il demeure qu’utiliser de telles variables comme lignes directrices pour concevoir un
corpus présente certains avantages méthodologiques. Les résultats d’études issues du projet
CAVOQ, qui mettent en exergue des traits phonétiques opposant Québec et Saguenay, ont donc
servi de point de départ pour l’ébauche de notre corpus, de même que quelques autres travaux
suggérant l’existence de différences entre les usages de locuteurs originaires de Québec et d’ailleurs
dans la province. Bowie (2000 : 136) mentionne en outre que les caractéristiques phonétiques en
cours de changement dans le R1 sont sujettes à modification chez les locuteurs en situation de
mobilité géographique, aussi notre sélection de variables s’est également inspirée d’études
rapportant de potentiels changements en cours en FQ.

Le corpus du projet CAVOQ est composé des productions de 40 locuteurs âgés de 20 à 29 ans
fréquentant l’UQAC ou l’Université Laval au moment des enregistrements, qui ont eu lieu de 2010
à 2012. Dans chacune des deux villes, 10 hommes et 10 femmes ont été amenés à effectuer une
tâche de lecture oralisée de plus de 500 phrases porteuses contenant, en position finale d’énoncé, un
mot cible. Après simulation d’une incompréhension de la part de l’expérimentatrice au terme de
chaque énoncé, les locuteurs devaient répéter le mot cible de manière isolée. Un tel protocole a
permis de récolter des voyelles accentuées, dans un même contexte prosodique, soustraites à
l’influence de la phrase porteuse, tout en évitant un effet de liste.

39
De telles relectures sont survenues fréquemment, mais la plupart du temps, sur l’initiative des locuteurs.
Nous ne leur demandions pas de se reprendre s’ils ne semblaient pas douter de leur prononciation, seulement
lorsque des phénomènes ponctuels comme un bruit extérieur ou une parole rieuse se produisaient.
40
Au T1, nous expliquions aux participants que leur parole serait transformée en chiffres et que nous ne nous
attendions pas à des différences audibles. Nous ne pensons donc pas que leur connaissance partielle de notre
objet d’étude ait pu influencer leurs productions. Quant à la mobilité géographique, les participants ont été
informés de cet aspect de l’étude une fois celle-ci terminée, conformément aux exigences des Comités
d’éthique de la recherche avec des êtres humains de l’Université Laval.

131
Exploitant les productions de la moitié des témoins enregistrés dans le cadre du projet CAVOQ (10
locuteurs dans chaque ville, hommes et femmes à parité) et répliquant le protocole expérimental
auprès de 5 locuteurs et de 5 locutrices originaires de Rouyn-Noranda, Sigouin (2013) propose une
analyse acoustique des voyelles /i y u/ en syllabe ouverte (V# : qui, par exemple), en syllabe fermée
par une consonne non allongeante (VK : coude) et en syllabe fermée par une consonne allongeante
(VR : pur). Deux principales différences régionales émergent des résultats : la fréquence du F1 de la
variante allongée (VR) est plus élevée (donc, timbre moins fermé) à Québec et à Rouyn-Noranda
qu’à Saguenay; la différence de durée entre les variantes tendue (V#) et relâchée (VK) est plus
importante à Saguenay qu’à Rouyn-Noranda et qu’à Québec.

Dans le cadre de notre projet de maîtrise (Riverin-Coutlée, 2014), nous avons pu observer une
différence régionale très marquée quant au timbre de la voyelle /ɛ/ en finale de mot (épais, lait,
etc.). L’analyse acoustique des voyelles extraites de la finale de 12 mots produits par les 40
locuteurs du projet CAVOQ révèle que les productions des locuteurs de Saguenay présentent un F1
plus élevé et un F2 moins élevé que celles des locuteurs de Québec. Cinq juges expérimentés
appelés à se prononcer sur le timbre des occurrences ont également permis de mettre en lumière une
certaine propension à la fermeture du /ɛ/ en finale de mot chez les locuteurs de Québec. Ces
résultats acoustiques et auditifs soulèvent bien entendu la question du timbre des voyelles
adjacentes /a/ et /e/ en finale de mot à Saguenay et à Québec (Riverin-Coutlée et Arnaud, 2014).

D’après les impressions auditives de différents auteurs (Dumas, 1972, 1978; Martin, 1998a; Côté,
2012), en syllabe fermée par /ʁ/, les voyelles /ɑ/ et /ɔ/ sont sujettes à fusion en FQ. Une étude
acoustique à laquelle nous avons pris part (Arnaud et Riverin-Coutlée, 2014), dont l’objectif était
d’évaluer quantitativement cette éventuelle fusion des voyelles /ɑ/ et /ɔ/ en syllabe fermée par /ʁ/, a
permis de mettre au jour une différence régionale supplémentaire entre Québec et Saguenay. Les
voyelles extraites de 14 mots formant 7 paires minimales41 produits par les 40 locuteurs du projet
CAVOQ ont été sélectionnées pour l’analyse acoustique. La valeur des deux premiers formants à
25 %, 50 % et 75 % de la durée de ces voyelles a été relevée, puis utilisée comme ensemble de
prédicteurs lors d’analyses discriminantes. Le pourcentage d’occurrences incorrectement classées
dans leur catégorie d’appartenance (/ɑ/ et /ɔ/) a été interprété comme une approximation du taux de
fusion entre /ɑ/ et /ɔ/. Les résultats suggèrent une tendance supérieure à la fusion chez les locuteurs
de Québec.

41
Ces 7 paires minimales sont : bar/bord, dard/dort, lard/l’or, part/port, phare/fort, quart/corps, tard/tort.

132
Hors CAVOQ, mais faisant également appel à des locuteurs de Québec et de Saguenay, Leblanc
(2012) s’intéresse au profil acoustique des voyelles perçues diphtonguées en FQ. Dix témoins
masculins, âgés de 18 à 26 ans et originaires à parité de Saguenay et de Québec, ont été enregistrés
lors de la production de mots de type CV ou CVC, où la voyelle était l’une des 11 suivantes :
/i y u e ø o ɛ œ ɔ a ɑ/. Autant que possible dans les limites du lexique français, chaque voyelle était
produite en finale de mot (V#), devant consonne non allongeante (VK) et devant consonne
allongeante (VR). Au total, ce sont 2759 occurrences, soit 92 mots répétés à trois reprises par
chacun des 10 locuteurs, qui ont été soumises à trois juges expérimentés. Parmi ces occurrences,
488 (soit 17,69 % du corpus) ont été majoritairement perçues diphtonguées et retenues pour
l’analyse acoustique subséquente. Sans que la variation régionale ne constitue son principal objet
d’étude, Leblanc (2012) mentionne tout de même au passage que le taux de diphtongaison moyen
est plus élevé chez les locuteurs de Québec (21,09 %) que chez ceux de Saguenay (14,09 %).
Chaque voyelle a systématiquement été perçue diphtonguée plus fréquemment à Québec qu’à
Saguenay, l’écart entre les deux groupes de locuteurs étant parfois minime (0,67 % pour /u/),
parfois plus important (16,29 % pour /o/; 15,55 % pour /e/).

Pour sa part, Martin (1998b) mentionne qu’en syllabe pénultième (non accentuée), le timbre des
voyelles /e/ et /ɛ/ tend à se neutraliser, par exemple dans des mots comme descente et décembre.
L’impression auditive de l’auteur est que la neutralisation prend plus souvent la forme d’une
fermeture du /ɛ/ en [e] que d’une ouverte du /e/ en [ɛ]. Son analyse des productions de 40 étudiants
universitaires provenant de différentes régions du Québec l’amène à considérer que ce phénomène
de neutralisation pourrait être plus fréquent chez les locuteurs originaires de Québec que chez ceux
originaires du sud-ouest de la province ou du Saguenay–Lac-Saint-Jean.

Ostiguy et Tousignant (1996) cherchent à vérifier empiriquement si les voyelles en syllabe ouverte
en finale de mot sont sujettes à diphtongaison en FQ, comme le suggèrent différentes remarques
anecdotiques relevées par les auteurs. Le corpus utilisé est composé des productions de 142 élèves
de 5e année (10-11 ans) et de 3e secondaire (14-15 ans) originaires de la Mauricie et de 85 élèves
des mêmes niveaux originaires de Montréal s’exprimant en contexte formel, par exemple lors d’un
exposé oral devant la classe. L’analyse auditive des auteurs révèle qu’en syllabe ouverte en finale
de mot, les seules voyelles diphtonguées par les locuteurs sont /e/ et / /, variantes transcrites
[ e]/[ ɪ] et [ ], soit un timbre initialement centralisé, arrondi et oral qui tend par la suite à se
fermer. La fréquence de F1 et de F2 des segments oraux perçus diphtongués a également été estimée
en quatre ou cinq points : en début de voyelle, au début de sa « phase milieu », en son centre
(optionnel), à la fin de sa « phase milieu » et à sa toute fin. Les résultats de cette analyse acoustique

133
appuient les impressions auditives des auteurs en ce qui a trait aux changements de degrés
d’aperture et d’antéropostériorité en cours d’émission. Ostiguy et Tousignant (1996 : 214) précisent
que tout contexte consonantique de gauche permet le libre cours de la diphtongaison de /e/ et / / en
finale de mot. Si le phénomène demeure relativement marginal en Mauricie, seulement 25 des 142
locuteurs de cette région l’ayant produit, il est totalement absent des enregistrements effectués
auprès des jeunes Montréalais. Or, une quinzaine d’années plus tard, Leblanc (2012) observe une
tendance à la diphtongaison de /e/ en finale de mot chez de jeunes adultes de Québec et, dans une
moindre mesure, de Saguenay. Deux explications sont alors possibles : soit qu’il s’agit d’une
caractéristique de l’Est présente jusqu’en Mauricie, soit qu’elle s’est propagée au cours des années
séparant les deux études. Spécificité régionale ou changement en cours, /e/ et / / en finale de mot
constituent des variables d’intérêt dans le cadre de notre étude.

Plus globalement, la diphtongaison au sens large était autrefois présumée moins présente dans l’Est
du Québec que dans l’Ouest (Dolbec et Ouellon, 1999)42. Au vu des résultats de Leblanc (2012), et
comme le suggèrent Dolbec et Ouellon (1999), il est cependant probable que la diphtongaison ait
gagné l’Est dans un passé plus ou moins lointain. L’écart entre les taux de diphtongaison observés à
Saguenay et à Québec pourrait ainsi témoigner du fait que les usages des locuteurs de Québec se
sont rapprochés de ceux des locuteurs de l’Ouest, ou encore qu’ils constituent un intermédiaire
entre l’Ouest et Saguenay. Quoi qu’il en soit, les productions vocaliques diphtonguées gagnent
potentiellement du terrain en FQ et par conséquent, constituent également des variables d’intérêt
pour notre étude.

Pour sa part, Mielke (2013) analyse des données conversationnelles récoltées auprès de 75 locuteurs
francophones originaires de l’Outaouais nés de 1893 à 1991 (deux corpus distincts). Il constate que
le timbre des voyelles / / et /œ/ en syllabe ouverte en finale de mot (bleu, brun) et /œ/ en syllabe
fermée par /ʁ/ (peur) tend à présenter un caractère rhotique, qui acoustiquement se traduit par une
baisse de F3 et une focalisation de F2 et de F3. Son analyse en temps apparent suggère un
changement en cours, les locuteurs qui présentent une tendance à la rhoticité étant tous nés après
1965 et F3 montrant une diminution graduelle inversement proportionnelle à l’année de naissance
des témoins, sans que la classe sociale et le sexe ne soient quant à eux des facteurs déterminants.
Puisque le phénomène avait déjà été relevé pour /ø/ en finale de mot par Dumas (1972 : 100) chez

42
Dolbec et Ouellon (1999) mentionnent toutefois que l’Ouest doit en partie cette réputation à une
diphtongaison « plus ostensible dans ses réalisations phonétiques », par exemple celle caractérisant la voyelle
accentuée des mots cave et garage, et dont la généralisation en FQ est peu probable.

134
des locuteurs montréalais, Mielke (2013 : 144) s’interroge sur la diffusion géographique de la
rhoticité en FQ.

Remysen (2016b) procède à l’analyse auditive par accord inter-juges du timbre de 1385 occurrences
de la voyelle nasale /ɑ/, produites par 94 locutrices originaires de Montréal et de Sherbrooke,
réparties en deux groupes d’âge : les 16-25 ans et les 40-60 ans. Il constate que les Montréalaises
tendent à produire des voyelles au timbre plus postérieur (transcrit [ɑ] ou [ ]) que les
Sherbrookoises. Alors qu’aucune différence n’est observée entre les deux groupes d’âge à
Sherbrooke, les jeunes locutrices de Montréal produisent plus de variantes postérieures que les
locutrices plus âgées de Montréal. L’auteur en déduit que le timbre de la voyelle nasale /ɑ/ est en
cours de postériorisation en FQ, le changement semblant avoir été initié à Montréal puisqu’il y est
plus avancé qu’à Sherbrooke, et émet l’hypothèse que l’ampleur du phénomène pourrait avoir été
sous-estimée étant donné que le volet montréalais de l’enquête a eu lieu en banlieue (Brossard) et
que le changement pourrait être plus avancé sur l’île même. Remysen (2016b : 155) appelle
finalement à ce que d’autres études soient consacrées aux réalisations phonétiques de la voyelle /ɑ/
chez des locuteurs d’ailleurs dans la province, notamment de Québec, afin de documenter la
progression du changement.

En somme, la durée et le timbre des voyelles /i y u/ dans certains contextes (Sigouin, 2013), le
timbre de la voyelle /ɛ/ en finale de mot (Riverin-Coutlée, 2014), le degré de fusion des voyelles /ɑ/
et /ɔ/ en syllabe fermée par /ʁ/ (Arnaud et Riverin-Coutlée, 2014), le taux de diphtongaison des
voyelles orales (Leblanc, 2012) et la neutralisation fermante de /e/ et /ɛ/ en syllabe pénultième
(Martin, 1998b) diffèrent entre les locuteurs de Québec et de Saguenay. En ce qui concerne les
phénomènes étudiés par Sigouin (2013), aucune différence n’est toutefois observée entre les
locuteurs de Québec et de Rouyn-Noranda, tandis que la neutralisation mise de l’avant par Martin
(1998b) oppose également Québec et le sud-ouest de la province. Le timbre des voyelles / / et /e/ en
finale de mot fait l’objet soit de variation régionale, soit d’un changement en cours (Ostiguy et
Tousignant, 1996; Leblanc, 2012), ce dernier mécanisme étant possiblement à l’œuvre en FQ sous
forme de progression de la diphtongaison en général (Dolbec et Ouellon, 1999), de rhotacisation des
voyelles /ø/ et /œ/ en syllabe ouverte en finale de mot et /œ/ en syllabe fermée par /ʁ/ (Mielke,
2013) et de postériorisation la voyelle nasale /ɑ/ (Remysen, 2016b).

La plupart de ces phénomènes peuvent être organisés en fonction du principe de classe vocalique
(ou classe de mots), que nous définissons de la manière suivante : l’ensemble des unités lexicales
partageant une même voyelle accentuée suivie d’un même contexte consonantique (Labov,

135
1994 : 164; Paradis, 1985 : 91; Arnaud, 2006 : 240). Comme le fait remarquer Yaeger (1979 : 27),
les consonnes du FQ sont généralement regroupées en fonction de l’effet qu’elles exercent sur les
voyelles adjacentes (ou plutôt, dirions-nous, sur les voyelles précédentes). Paradis (1985 : 88-91)
recense ainsi quatre principaux environnements consonantiques de droite qui conditionnent la
réalisation des voyelles accentuées du FQ : les consonnes non allongeantes (/p t k b d ɡ f s ʃ l/), les
consonnes allongeantes (/ʁ v z ʒ/ et le groupe /vʁ/), les consonnes nasales (/m n ŋ ɲ/) et l’absence de
consonne. Ainsi, quatre grandes classes vocaliques se présentent en FQ : la classe (VK), soit les
voyelles en syllabe fermée par une consonne non allongeante; la classe (VR), soit les voyelles en
syllabe fermée par une consonne allongeante; la classe (VN), soit les voyelles en syllabe fermée par
une consonne nasale; la classe (V#), soit les voyelles en syllabe ouverte. Yaeger (1979 : 57) propose
également de considérer que les voyelles étymologiquement ou historiquement longues en syllabe
fermée par tout type de consonne constituent une classe à part, notée (V), distinction adoptée
notamment par Leblanc (2012 : 35) en raison du taux de diphtongaison élevé susceptible de
caractériser les voyelles longues (contextuelles mais aussi historiques) en FQ.

A priori, les phénomènes phonétiques vocaliques mentionnés ci-haut43 peuvent être catégorisés de
la manière suivante :

- (VR) : diphtongaison de (iR), (yR), (uR), (oR), (ɛR), (œR), (ɔR) et (ɑR); timbre de (iR),
(yR) et (uR); fusion de (ɑR) et de (ɔR); rhoticité de (œR)
- (VK) : durée de (iK), (yK) et (uK); diphtongaison de (iK) et (œK)
- (V ) : diphtongaison de (e ), ( ) et ( #); timbre de (ɛ#) et (ɑ#); rhoticité de ( ) et (œ#)
- (V) : diphtongaison de (ɛ), ( ), (ô) et (ɑ)

Cette première classification comporte cependant des limites. D’abord, la fusion de /ɑ/ et /ɔ/ n’a été
examinée que devant /ʁ/; considérer que ce phénomène se produit « devant consonne allongeante »
nous semble aussi présomptueux qu’inexact. Par ailleurs, Côté (2010) estime que l’action
allongeante et diphtongante de /ʁ/ ne peut en aucun cas être traitée sur le même pied que celle de
/v z ʒ/, une impression auditive que tend à corroborer l’analyse acoustique de Sigouin et Arnaud
(2015), à tout le moins pour les voyelles /i y u/. Ces derniers montrent en effet que devant /v z ʒ/, le

43
Puisque la neutralisation rapportée par Martin (1998b) affecte la syllabe pénultième, donc non accentuée,
elle ne figure pas dans cette liste. La diphtongaison dont la progression est rapportée par Dolbec et Ouellon
(1999) englobe un faisceau de phénomènes assez vaste mais peu défini, en conséquence de quoi elle n’est pas
spécifiquement représentée dans la liste ci-haut, mais s’y retrouve probablement en partie. Enfin, Remysen
(2016b) s’intéresse aux /ɑ/ apparaissant aussi bien en syllabe finale accentuée qu’en syllabe initiale (non
accentuée) de mots bi- et trisyllabiques; dans tous les cas, il s’agit de syllabes ouvertes, aussi la liste ne
comprend que le phénomène affectant la catégorie (ɑ#).

136
F1 des voyelles /i y u/ atteint en cours d’émission la valeur du F1 des variantes tendues (V#); devant
/ʁ/, le F1 de ces voyelles n’atteint jamais une valeur aussi basse. Pour ces raisons, nous avons choisi
de subdiviser la traditionnelle classe (VR) entre (Vʁ) et (Vvzʒ).

La classe (VK), qui regroupe non moins de 10 consonnes différentes, pose également problème.
Dans son analyse acoustique des voyelles /i y u/ en contextes (V#), (VK) et (VR), Sigouin
(2013 : 49) prend soin de vérifier l’effet du voisement consonantique sur la durée des voyelles en
contexte (VK). Elle observe que les consonnes voisées ont un effet allongeant sur la voyelle
précédente, particulièrement chez les locuteurs de Saguenay, et suggère que les consonnes non
voisées pourraient en outre avoir un effet abrégeant. Il semble donc que la classe (VK) puisse déjà
être subdivisée en fonction du voisement, regroupant d’une part les consonnes /p t k f s ʃ/ et d’autre
part, les consonnes /b d ɡ l/. Nous avons opté pour deux divisions supplémentaires, choix davantage
exploratoires qu’appuyés par la littérature sur le FQ : la première au sein du premier groupe en
fonction du mode articulatoire, générant les classes (Vptk) et (Vfsʃ); la seconde isolant
l’approximante latérale /l/, qui ne partage avec /b d ɡ/ que le critère du voisement, aboutissant aux
classes (Vbdɡ) et (Vl).

Enfin, nous avons choisi d’éliminer la classe (V). En effet, en acceptant cette classe, une voyelle
historiquement longue comme /o/ devrait être classée (ô) dans tout contexte autre qu’en syllabe
ouverte. Les voyelles contenues dans des mots tels côte, pôle, fausse, etc. seraient ainsi toutes
classées (ô), alors que les classes (optk), (ol) et (ofsʃ) demeureraient vacantes. Puisque de cette
manière, le nombre réel de contextes dans lesquels se retrouve /o/ tend à être sous-estimé, nous
avons opté pour le classement (optk), (ol), (ofsʃ), etc., sachant en outre qu’il n’existe pas dans ces
contextes d’opposition phonémique entre le /o/ historiquement long et un éventuel /o/ court. Il en va
autrement de /ɛ/, pour lequel des paires minimales fondées sur la durée existent bel et bien en FQ,
par exemple dans les mots mettre (/ɛ/ court) et maître (/ɛ/ long et souvent diphtongué44). La
distribution n’étant pas, comme pour /o/, mutuellement exclusive, nous avons considéré qu’il
s’agissait de deux phonèmes distincts, transcrits /ɛ/ pour mettre et /ɛː/ pour maître (Martin, 1995),
qui s’opposent dans des contextes tels que (Vptk), (Vl), (VN), etc.

Au final, notre corpus est donc structuré en fonction de huit catégories : (V#), (VN), (Vʁ), (Vvzʒ),
(Vptk), (Vfsʃ), (Vbdɡ) et (Vl). Plutôt que de nous en tenir aux phénomènes décrits précédemment,

44
Dans l’étude de Leblanc (2012 : 48), le taux de diphtongaison perçue pour cette catégorie vocalique est de
92,22 %, soit 83 des 90 occurrences soumises à l’accord inter-juges. Il s’agit de la catégorie la plus
fréquemment perçue diphtonguée.

137
qui offrent un portrait pour l’heure incomplet des différences régionales et changements en cours en
FQ, nous avons récolté l’ensemble des voyelles du FQ dans les huit contextes susmentionnés, soit
les 12 voyelles orales et les quatre voyelles nasales suivantes : /i y u e ø o ɛ ɛː œ ɔ a ɑ ɔ œ/.
Chaque catégorie est représentée par une unité lexicale (voir l’Annexe 2), pour un total de 96 unités,
les contraintes du lexique français ne permettant pas que tous les contextes soient représentés.
Certaines voyelles ont effectivement une distribution limitée, /ɔ/ ne se retrouvant jamais en contexte
(V#), par exemple. Puisque nous avons évité les emprunts à l’anglais, la voyelle /e/ se retrouve
exclusivement en contexte (V#), des mots tels steak et ale n’ayant pas été utilisés. Le lexique
sélectionné correspond à un registre que nous jugeons standard en FQ, à l’exception possible du
mot gougoune, qui représente le contexte (uN). Cette catégorie est relativement fréquente en FQ,
mais correspond généralement à un registre moins standard (balloune, atchoum) ou provient
d’emprunts à l’anglais (clown, zoom); le mot gougoune, s’il n’est pas utilisé par les locuteurs de
toutes les régions, nous semblait assez neutre et assurément connu de tous45. Comme le constate
Martin (1995 : 36), le contexte (Vʁ) entraîne une neutralisation de /ɛ/ et de /ɛː/; seule la catégorie
(ɛʁ) a été incluse dans le corpus (dessert), bien que l’inverse eût été parfaitement possible. Suivant
Martin (1998b : 233), nous avons exclu le schwa, puisqu’en FQ, « il ne semble y avoir aucun
fondement perceptif réel à une distinction systématique entre [œ] et [ə] ». Le corpus contient
également quelques unités lexicales bisyllabiques dont la syllabe pénultième se termine par les
voyelles /e/ et /ɛ/ (école, défunte, descente, dessert, etc.), en vue d’une utilisation future. Le
phénomène de neutralisation fermante mentionné par Martin (1998b) ne sera effectivement pas
abordé dans le présent travail, non plus que le timbre des voyelles nasales, qui faisaient par
conséquent figure de distracteurs.

D’occasionnelles « erreurs » de production de la part des locuteurs ont entraîné une recatégorisation
ponctuelle de certaines voyelles. Le mot œu au singulier, attendu [œf], a été prononcé [ø] quelques
fois, passant ainsi de la catégorie (œfsʃ) à (ø#). Le mot fosse, attendu [fos], a été prononcé [fɔs],
passant de la classe (ofsʃ) à (ɔfsʃ). Quelques confusions entre jeune et jeûne ont entraîné le passage
de (œN) à (øN), et inversement. Le dernier mot de la phrase « Mon chat avait des puces » a été
produit [pʊs] plutôt que [pʏs], passant de (yfsʃ) à (ufsʃ). Nous nous attendions à ce que le mot
plaide soit prononcé [plɛd], mais [plɛːd] a fréquemment été produit (32 fois sur 198), certains
locuteurs alternant entre les deux formes et d’autres se montrant plus systématiques. Alternance ou
non, toutes les occurrences perçues [plɛːd] ont été catégorisées comme (ɛːbdɡ). De la même

45
Aucun locuteur n’a paru hésiter lors de la lecture du mot gougoune, mais certains l’ont mentionné après
l’expérience comme détonnant quelque peu par rapport au reste du lexique. D’autres mots ont semblé moins
familiers aux locuteurs, comme figue, élude, chétive, friche et ponce.

138
manière, quelques occurrences des mots brève et crèche, attendus [bʁɛv] et [kʁɛʃ], ont été produites
[bʁɛːv] et [kʁɛːʃ], passant respectivement de (ɛvzʒ) à (ɛːvzʒ), et de (ɛfsʃ) à (ɛːfsʃ). Bien que nous
ayons choisi d’inclure dans le corpus la catégorie (ɛʁ) plutôt que (ɛːʁ), une inspection visuelle des
spectrogrammes de dessert et de ceux des autres /ɛ/ nous a incitée à classer ce mot dans la catégorie
(ɛːʁ), en dépit de notre positionnement théorique initial. Nous avons en outre observé chez certains
locuteurs la production occasionnelle d’une composante vocalique finale s’apparentant à /ə/. Bien
entendu, un tel ajout a le potentiel de modifier la structure syllabique d’un mot et par le fait même,
le timbre de certaines voyelles. En FQ, dans un mot comme frite, le fait que la voyelle /i/ se
retrouve dans une syllabe ouverte plutôt que fermée par une consonne non allongeante peut faire en
sorte que son timbre soit tendu plutôt que relâché : [fʁɪt] vs [fʁi.tə]. En fonction de nos impressions
auditives lors des enregistrements et du traitement subséquent du signal sonore, nous avons
toutefois décidé de faire abstraction de ces composantes vocaliques additionnelles; dans l’exemple
précédent, la voyelle cible du mot frite serait ainsi demeurée dans la catégorie (iptk) plutôt que (i#).
Une remarque s’impose également concernant le timbre de la dernière voyelle du mot prépare,
attendu [a] mais souvent perçu postériorisé lors des enregistrements. Nous avons écouté chacune
des 198 occurrences de prépare afin de les assigner à l’une ou l’autre des catégories (aʁ) et (ɑʁ)46,
résultant en 95 (aʁ) et 103 (ɑʁ), le timbre attendu s’avérant minoritaire.

Enfin, en excluant du corpus les emprunts à l’anglais, nous nous assurions d’une distribution
mutuellement exclusive des variantes tendues et relâchées des voyelles fermées /i y u/, aucune paire
minimale translinguistique de type cool-coule [kul]-[kʊl] n’y figurant. Il ne semble donc pas
nécessaire, au premier abord, de distinguer les deux sortes de variantes : ce sont des occurrences de
/i/, de /y/ ou de /u/ apparaissant dans leurs contextes respectifs. Considérant la nature des analyses
effectuées sur les données récoltées, omettre de distinguer les variantes tendues et relâchées se
serait toutefois montré problématique. En effet, tel que décrit dans la prochaine section (5.4.3), nous
avons procédé à une analyse acoustique des voyelles de notre corpus. Or, le profil acoustique
différencié des variantes tendues et relâchées des voyelles fermées du FQ est désormais avéré
(Arnaud et coll., 2011; Sigouin, 2013). Lors de la présentation des résultats, au Chapitre 6, les
variantes tendues [i y u], produites en contexte (V#) et (Vvzʒ), seront ainsi distinguées des variantes

46
Le timbre des voyelles ouvertes /a/ et /ɑ/ peut être très difficile à positionner sur le continuum de l’antéro-
postériorité, aussi nous sommes consciente que le recours à notre seule perception comporte ses limites.
Excepté pour le mot prépare, nous nous en sommes d’ailleurs tenue aux catégories /a/ et /ɑ/ attendues.

139
relâchées [ɪ ʏ ʊ], produites en contexte (VN), (Vʁ)47, (Vptk), (Vfsʃ), (Vbdɡ) et (Vl). Aucun
positionnement théorique quant à un éventuel statut phonémique des variantes relâchées n’est
impliqué dans cette partition, opérée par strict souci d’exhausser la précision et l’interprétabilité des
résultats.

5.4.3 Analyse acoustique


Plusieurs des premières études sur l’acquisition d’un R2 sont fondées sur une analyse
exclusivement auditive (Payne, 1980; Kobayashi, 1981; Shockey, 1984; Chambers, 1992). Ce choix
méthodologique n’est probablement pas étranger à la relative difficulté d’accès aux techniques
instrumentales de cette époque, mais il n’est pas non plus dénué de lien avec l’idée que seules les
caractéristiques les plus saillantes sont modifiées par les locuteurs mobiles (Trudgill, 1986). Quoi
qu’il en soit, le recours à une analyse exclusivement auditive des changements phonétiques qui se
produisent chez les locuteurs mobiles peut poser problème. Par exemple, comme le rappelle
Thomas (2002), la variation et le changement phonétiques se caractérisent par leur richesse et leur
gradation. Dans le cas spécifique des voyelles, cette riche gradation peut se traduire par un nombre
important de variantes au timbre intermédiaire difficiles à étiqueter, à catégoriser. Dans son examen
longitudinal des productions de deux locuteurs enregistrés dans le cadre de la série documentaire
Up, Sankoff (2004) est précisément confrontée à ce problème : plusieurs occurrences de la voyelle
de STRUT présentent un timbre se situant entre [ʌ] et [ʊ]. Par ailleurs, les différentes études
rapportées dans la section consacrée au rôle de la saillance subjective lors de l’acquisition d’un R2
(2.4.4) mettent en exergue l’importance de procéder à une analyse instrumentale pour éviter la
potentielle circularité induite par les analyses exclusivement auditives (Flege et Hammond, 1982;
Delvaux et Soquet, 2007; Ziliak, 2012; Pardo et coll., 2012; Babel, 2010). Des études comme celles
de De Decker (2006) et de Love et Walker (2013) font même abstraction de la perceptibilité de la
variation pour se concentrer sur sa description acoustique. En regard des limites de l’audition et des
avantages des techniques instrumentales, notre choix se porte vers une analyse acoustique des
voyelles orales de notre corpus.

L’analyse acoustique des voyelles repose très fréquemment sur l’estimation de la fréquence des
formants, la robustesse du lien entre les fréquences formantiques et le timbre ayant été mise en
évidence à maintes reprises. Au milieu du xxe siècle, les premiers travaux en acoustique de la parole
contribuent à la diffusion d’un paradigme d’analyse fondé sur l’estimation de la fréquence des deux

47
Il a été déterminé que les voyelles fermées produites en contexte (Vʁ) seraient traitées comme des relâchées
au terme d’une analyse statistique telle que celles décrites dans la section 5.6.1. Statistiquement, le contexte
(Vʁ) se distingue plus fréquemment de (V#) et de (Vvzʒ) que des autres contextes.

140
premiers formants (Delattre, 1948; Delattre et coll., 1952; Joos, 1948). F1 est effectivement
considéré comme le corrélat acoustique du degré d’aperture et F2, du degré d’antéropostériorité :
plus la fréquence de F1 est élevée, plus la voyelle est ouverte, et plus la fréquence de F2 est élevée,
plus la voyelle est antérieure. Projetée dans un diagramme bidimensionnel, la valeur de ces deux
indices permet de visualiser une représentation hautement pédagogique de l’espace vocalique, à
défaut de constituer une paramétrisation exhaustive du signal sonore. Il s’agit de l’analyse
privilégiée en sociolinguistique depuis que Labov et coll. (1972) ont montré sa pertinence pour
l’étude de la variation et du changement phonétiques (Thomas, 2011 : 41). La contribution de F3 à
la caractérisation acoustique de plusieurs voyelles est également largement reconnue. En langue
française, F3 permet de distinguer acoustiquement les voyelles arrondies et non arrondies :
l’arrondissement se traduit par une chute de la valeur de F3, parfois accompagnée d’une chute de la
valeur de F2 (Lindblom et Sundberg, 1971; Schwartz et coll., 1993). En langue anglaise, F3 est
utilisé pour rendre compte de la rhoticité : les voyelles rhotiques se caractérisent par une chute de
F3, menant à la focalisation de F2 et de F3 (Peterson et Barney, 1952). Lors de son analyse de la
rhoticité en FQ, Mielke (2013) observe cette même tendance. La prise en compte des formants
supérieurs à F3 est toutefois moins courante. Même lorsque le signal sonore est de bonne qualité,
leur fréquence peut être difficile à estimer. Par exemple, Hillenbrand et coll. (1995 : 3101)
rapportent avoir été dans l’impossibilité de mesurer F4 pour 15,6 % des 1668 occurrences analysées
dans le cadre de leur étude. En français, F4 est principalement reconnu pour sa contribution à la
distinction entre les voyelles /i/ et /y/, la proéminence perceptive créée par leur focalisation
formantique respective se situant à des fréquences différentes : focalisation de F2-F3 pour /y/, et de
F3-F4 pour /i/ (Ménard, 2002; Gendrot et coll., 2008).

Bien entendu, les fréquences formantiques ne sont pas les seuls indices acoustiques considérés par
les chercheurs lors de l’étude de la variation et du changement vocaliques. L’un des principaux
paramètres qui complémentent généralement l’analyse formantique est la durée. Elle peut varier en
fonction du phonème, qu’un changement de timbre soit impliqué ou non. Par exemple, dans les
langues du monde, les voyelles ouvertes tendent à posséder une durée plus longue que les voyelles
fermées (Maddieson, 1997 : 623). En français suisse, les locuteurs établissent une distinction entre
ami [ami] et amie [amiː] à l’aide de la durée de la voyelle finale (Grosjean et coll., 2007). Toutes
choses étant égales par ailleurs, la durée des voyelles peut aussi varier d’un régiolecte à l’autre, y
compris en FQ (Sigouin, 2013).

Mesurer la durée vocalique consiste à déterminer le temps écoulé entre l’établissement (onset) et la
queue (offset) de la voyelle. Parmi les indices acoustiques mentionnés jusqu’ici, il s’agit selon

141
Thomas (2011 : 139) du plus simple à évaluer, la seule difficulté potentiellement rencontrée par
l’analyste étant d’identifier le début et la fin des segments. Au contraire, la paramétrisation des
formants présente de nombreuses possibilités et nécessite de prendre position sur le plan théorique.
La méthode la plus répandue consiste à relever ces indices en une section temporelle unique
(comme Peterson et Barney, 1952, entre autres). Cette prise de mesure peut être effectuée lorsque
les formants atteignent un état jugé stable (steady state) par l’expérimentateur. Pour éviter de devoir
statuer sur l’état stable, il est possible de décider d’un point de mesure fixe, par exemple à 50 % de
la durée vocalique, ou après un nombre déterminé de millisecondes, par exemple 30 ms après
l’établissement. Une autre méthode, utilisée notamment par Labov et coll. (1972), consiste à relever
les fréquences formantiques lors de l’atteinte de la valeur maximale de F 1, là où la coarticulation se
fait le moins sentir, les consonnes précédentes et suivantes étant censées faire diminuer la valeur de
cet indice. Watson et Harrington (1999 : 461) proposent de mesurer les formants lors de l’atteinte
de minima ou de maxima fréquentiels, selon la classification phonologique des voyelles. Par
exemple, la prise de mesure pour une voyelle ouverte est effectuée lorsqu’en cours d’émission, F1
atteint sa valeur maximale, et pour une voyelle fermée, lorsque F 1 atteint sa valeur minimale. Bien
entendu, chacune de ces méthodes comporte certaines limites. D’abord, la localisation d’un état
stable est sujette à une importante variabilité inter-analystes. Une prise de mesure à 50 % de la
durée résout ce problème, mais revient à postuler, tout comme la première technique, que
l’information la plus pertinente contenue dans les voyelles se situe en leur centre, lorsqu’elles sont
stabilisées. L’estimation des fréquences formantiques après un nombre déterminé de millisecondes
est confrontée à la durée variable des voyelles : la prise de mesure peut survenir à un moment
radicalement différent de l’évolution des segments, ou être tout simplement impossible si la durée
est très courte. La méthode de Labov et coll. (1972) est difficilement applicable lorsque
l’occurrence analysée est adjacente à une voyelle au F1 plus élevé, produite isolément, ou en syllabe
ouverte. Relever la fréquence des formants lors de l’atteinte d’une valeur minimale ou maximale
repose entièrement sur une classification et une description phonologiques des voyelles et fait
abstraction de leur multidimensionnalité. Dans l’exemple proposé précédemment, la prise de
mesure est effectuée en fonction de la valeur de F1 en raison du degré d’aperture des voyelles, mais
on ne saurait oublier que celles-ci sont également caractérisées par leur position relative sur le
continuum de l’antéropostériorité, qu’elles peuvent être arrondies ou non, rhotiques ou non, orales
ou nasales. En dépit de leurs limites, toutes ces méthodes sont simples à implémenter, nécessitent
un temps d’analyse réduit et peuvent s’avérer tout à fait pertinentes et suffisantes selon l’objet
d’étude (Thomas, 2011 : 150).

142
Très tôt, il est apparu qu’une seule prise de mesure posait problème pour l’étude de diphtongues ou
de voyelles diphtonguées, qui par définition possèdent deux timbres distincts (Lehiste et Peterson,
1961 : 277). L’analyse en plus d’un point de mesure s’est alors imposée et les différentes techniques
décrites précédemment ont été adaptées : localisation de deux états stables plutôt qu’un seul, deux
prises de mesure à intervalles fixes (par exemple, à 25 % et à 75 % de la durée, ou 30 ms après
l’établissement et 30 ms avant la queue). Aux limites déjà exposées de ces techniques s’ajoute le
problème de l’absence potentielle d’état stable de la première, de la seconde ou des deux portions
d’une diphtongue (Lehiste et Peterson, 1961). Concernant la méthode de Labov et coll. (1972), pour
une diphtongue comme /ai/ (PRICE), où le F1 maximal est atteint dans la première portion, il a été
proposé de rendre compte de la seconde en fonction de l’atteinte de la valeur maximale de F 2. Cette
stratégie pose cependant problème si la seconde portion de la diphtongue entraîne une diminution
de F1 et de F2, par exemple dans /au/ (MOUTH). Enfin, l’adaptation de la méthode des minima et
maxima fréquentiels à l’étude des diphtongues implique de multiplier les considérations théoriques
liées à leur classification et à leur description phonologiques. Par exemple, pour la diphtongue /au/,
on pourrait choisir de prendre une première mesure lorsque F1 atteint son maximum dans la section
/a/, puis une seconde lorsqu’il atteint son minimum dans la section /u/, mais encore faut-il décider si
/u/ est plus adéquatement décrit en fonction de son degré d’antéropostériorité, auquel cas la prise de
mesure dans la seconde section pourrait davantage être guidée par l’atteinte du minimum de F2.

L’idée de prendre en considération plusieurs points de mesure lors de l’évolution temporelle des
voyelles ne s’est cependant pas limitée à l’étude de la diphtongaison. En particulier, depuis une
trentaine d’années, certains chercheurs mettent de l’avant l’hypothèse selon laquelle toutes les
voyelles, monophtonguées et diphtonguées, possèdent une dynamique spectrale inhérente et
résistante à la coarticulation, dont il faut tenir compte lors de leur description acoustique (Morrison
et Assmann, 2013). Nommé VISC (vowel inherent spectral change) depuis Nearey et Assmann
(1986), ce phénomène devenu paradigme expérimental a notamment été exploré en FQ, dans le
cadre du projet CAVOQ. La modélisation de base utilisée pour l’étude de la dynamique spectrale
des voyelles est celle de la double cible, qui correspond à la prise de mesure à intervalles fixes, par
exemple à 25 % et à 75 % de la durée vocalique. À partir de ces deux indices et de la durée, certains
chercheurs procèdent également à différents calculs qui visent à décrire d’autres aspects des
changements spectraux, comme leur vitesse et leur direction (voir Nearey et Assmann, 1986; Fox et
Jacewicz, 2009). La modélisation peut être encore raffinée, Fox et Jacewicz (2009) utilisant par
exemple cinq points de mesure, Sóskuthy et coll. (2018) onze, Zahorian et Jagharghi (1993) des
transformées en cosinus discrètes (discrete cosine transform ou DCT).

143
Que l’on reconnaisse ou non l’importance de la dynamique spectrale pour la description des
voyelles du français (voir Gottfried, 1984 pour une critique), la prise en compte de plus d’un point
de mesure pour toutes les voyelles, telle que proposée par les défenseurs du VISC, évite au
chercheur de devoir statuer sur le caractère plus ou moins diphtongué des occurrences analysées. En
FQ, où la diphtongaison est un phénomène davantage phonétique que phonémique, dont l’incidence
peut dépendre de facteurs externes tels que l’origine géographique des locuteurs (Leblanc, 2012) ou
la formalité de la situation de communication (Reinke, 2005 : 38-39), une telle stratégie permet
d’éviter la fastidieuse opération de la catégorisation auditive. En revanche, Thomas (2011 : 150) fait
remarquer que la représentation graphique des occurrences peut perdre en convivialité et
l’interprétabilité, être compromise : « [w]ith a larger number of points, […] the formant
measurements can wander in seemingly erratic directions through the course of the vowel, making
comparisons between tokens difficult ». Notre étude reposant sur la comparaison entre les
occurrences produites au T1 et au T2, une modélisation excessivement fine des changements
spectraux pouvait potentiellement nous mener à l’impasse. Comme décrit ci-après, nous avons ainsi
opté pour un compromis entre exhaustivité de la paramétrisation acoustique et clarté des
comparaisons entre occurrences et avec les résultats issus d’autres études. Le choix de nous limiter
à des indices acoustiques dont la robustesse a été éprouvée (durée et trois premiers formants) est
également motivé par de telles considérations.

Les voyelles orales récoltées ont d’abord été segmentées afin d’en mesurer la durée (logiciel Praat,
Boersma et Weenink, 2018). La segmentation a été effectuée manuellement; les frontières marquant
le début et la fin des voyelles ont été établies selon la meilleure combinaison des indices
acoustiques suivants : de l’apparition à la disparition de la périodicité et d’une structure formantique
en basses fréquences, et d’une hausse à une chute de l’intensité. Parmi les 15 048 voyelles orales de
notre corpus (76 mots × 3 tâches × 2 expérimentations × 33 locuteurs)48, 35 ont été jugées
impossibles à segmenter ou à analyser subséquemment (0,23 %). En grande majorité, il s’agissait de
voyelles fermées, en syllabe ouverte, précédées d’une consonne fricative (vie, fou, déchu) et
produites lors de la tâche 1.

La fréquence des trois premiers formants a été estimée à intervalles fixes, soit à 25 %, à 50 % et à
75 % de la durée. La prise de mesure centrale constitue la valeur de référence pour un formant
donné et pour la suite de cette contribution, lorsque nous évoquerons la valeur d’un formant sans en
préciser le point de mesure (par souci d’alléger le texte), nous ferons par défaut référence à

48
En réalité, 96 mots sont compris dans notre corpus, mais nous n’avons pas analysé les 19 mots comportant
l’une des voyelles nasales / ɔ œ/, ni le mot même, dont la voyelle était souvent entièrement nasalisée.

144
l’estimation de sa fréquence à 50 % de la durée. En ce qui concerne les points de mesure à 25 % et à
75 % de la durée, nous en avons tiré la dynamique formantique, modélisée comme la différence
entre la valeur d’un formant donné à 25 % de la durée et sa valeur à 75 %. Par exemple, pour une
voyelle dont le F1 aurait une fréquence de 500 Hz à 25 % et une fréquence de 510 Hz à 75 %, la
dynamique de F1 serait de 10 Hz. Si la valeur à 75 % était plutôt de 490 Hz, la dynamique de F1
serait de -10 Hz. La différence entre la valeur estimée des fréquences formantiques à 25 % et à
75 % de la durée vocalique sera désormais évoquée sous le terme de dynamique.

En ce qui concerne les paramètres de détection des formants, ceux compris dans la liste ci-dessous
sont demeurés fixes pendant toute l’analyse :

- Méthode : Burg
- Pré-emphase à partir de : 50,0 Hz
- Largeur de la fenêtre : 0,025 s
- Intervalle dynamique : 30,0 dB

Le seuil maximal de détection et le nombre de formants à détecter dans l’intervalle ont quant à eux
été optimisés pour chaque occurrence, plus d’une configuration étant parfois nécessaire. En dépit de
ces précautions, certaines valeurs sont manquantes, en particulier le F3 de /o/ et de /u/ sur une partie
ou la totalité de la durée, représentant 0,71 % de l’ensemble des mesures formantiques possibles et
1,98 % des mesures de F3 possibles.

La durée et la fréquence des trois premiers formants à 25 %, à 50 % et à 75 % de la durée ont été


relevées automatiquement au moyen d’un script Praat reproduit en Annexe 4. La valeur brute des
indices acoustiques relevés, exprimée en hertz ou en secondes, a été utilisée pour nos
représentations et analyses. Nous reviendrons brièvement sur ce choix de ne pas normaliser les
données dans la section décrivant les analyses statistiques (5.6.1).

5.5 Facteurs et indices externes


Au-delà de leurs productions phonétiques, nous avons récolté auprès de nos participants de
l’information relative aux facteurs externes que nous souhaitions explorer dans le cadre de cette
étude. Pour ce faire, nous avons eu recours au questionnaire, outil fréquent en sciences humaines
décrit dans la section 5.5.1. Les différentes parties de la section 5.5.2 constituent un compte-rendu
plus détaillé de la manière dont nous avons exploité cet outil dans le cadre de notre étude.

145
5.5.1 Le questionnaire
Le questionnaire est un instrument de mesure fondé sur la réponse fournie par les participants à une
série de questions établies par le chercheur (Blais et Durand, 2009 : 446). Il ne vise pas à récolter
des données sur la forme des réponses (par exemple, la prononciation des locuteurs), mais sur leur
contenu (ce qui est dit). Les questions y sont standardisées, c’est-à-dire que leur formulation est fixe
et identique pour tous les participants, au contraire de celles qui guident un entretien semi-dirigé. Le
questionnaire permet d’obtenir des renseignements rapidement sur des sujets divers. En particulier,
il s’agit de la seule méthode possible pour obtenir de l’information relative à des comportements
privés, que l’expérimentateur ne peut observer directement (Blais et Durand, 2009 : 447). Les
questionnaires peuvent être administrés oralement par un expérimentateur, ou autoadministrés,
auquel cas les participants fournissent eux-mêmes des réponses écrites (sur support papier ou
électronique). Selon Blais et Durand (2009 : 462), lorsque le chercheur souhaite obtenir des
renseignements sur des sujets privés, délicats, ou qui nécessitent un certain temps de réflexion, « le
mode autoadministré est le plus approprié pour assurer une transmission fidèle de l’information ».
Trois types de variables peuvent être mesurées par le questionnaire : des variables d’état (âge, sexe,
occupation), des variables de comportement (nombre d’heures de sommeil, sports pratiqués) et des
variables d’attitudes (goûts, opinions). Ces dernières sont particulièrement sujettes au problème de
la fiabilité des réponses, la perception des informateurs s’éloignant parfois de leurs comportements
réels. Si l’expérimentateur peut difficilement prévenir ce type de discordance entre attitudes réelles
et rapportées, un aspect méthodologique à sa portée est celui de la formulation : des questions
claires, précises, concises, ne laissant place ni à interprétation, ni à ambigüité, peuvent favoriser une
transmission plus fidèle de l’information.

Un autre aspect méthodologique auquel prêter attention afin de favoriser l’interprétabilité des
résultats est le format des réponses dans les questionnaires autoadministrés. Un ensemble de
réponses fermé aboutit sans aucun doute à une interprétation rapide et sans détours. Dollinger
(2015) fait toutefois remarquer que ce choix peu exploratoire nécessite de la part du chercheur une
conception précise de l’ensemble des réponses possibles à une question donnée, à défaut de quoi les
participants seront contraints de sélectionner la réponse la moins erronée plutôt que la plus
appropriée. Les questions ouvertes, à l’inverse, donnent davantage de latitude aux participants, mais
la catégorisation des réponses peut se révéler un véritable casse-tête pour le chercheur. Un
compromis intéressant, selon Dollinger (2015 : 244-245), est le choix mixte, c’est-à-dire une liste
de réponses déjà formulées suivies de l’option « autre » avec demande de précision. De cette
manière, le chercheur s’assure que la majorité des réponses sera facilement classifiable, mais qu’un

146
participant dont la réalité ne serait pas représentée ne se contentera pas de répondre au hasard, faute
de mieux.

Dans le cadre de cette étude, nous avons administré aux participants deux questionnaires (voir
Annexe 5 et Annexe 6). Le premier était un questionnaire oral ponctuel portant sur des variables
d’état (âge, lieux de naissance et de résidence, programme d’études universitaires, etc.). Ce
questionnaire démographique a été administré au T1, au tout début de la rencontre, afin d’établir un
premier contact avec chacun des participants et de les catégoriser comme étant mobiles ou
sédentaires. Nous avons également eu recours au questionnaire autoadministré afin de récolter des
renseignements que nous jugions relever de la vie privée des participants, ou que nous estimions
nécessiter davantage de réflexion et d’introspection. Y était abordés des sujets tels que :
l’intégration des locuteurs dans le milieu universitaire et, pour les mobiles, dans le nouveau lieu de
résidence; les perspectives d’avenir sur les plans personnel et professionnel; l’indépendance par
rapport aux parents et autres indicateurs de l’émergence de l’âge adulte; chez les mobiles, le souci
d’intégrité linguistique. Ce questionnaire est longitudinal, c’est-à-dire qu’il a été administré aux
participants au T1 et au T2, dans le but d’observer si leur profil changeait au cours du temps (Blais
et Durand, 2009 : 459-460). Par souci de cohérence, la formulation de certaines questions a été
modifiée entre le T1 et le T2, de même qu’entre les questionnaires distribués aux mobiles et aux
sédentaires (d’où la nécessité de les catégoriser sur-le-champ à l’aide du questionnaire
démographique). Ce questionnaire a été administré en fin de rencontre, après les enregistrements,
puisque certaines questions pouvaient donner des indications aux participants quant à l’objet
d’étude. Or, plusieurs contributions citées précédemment rapportent un potentiel effet des sujets
récemment abordés sur les productions des participants, notamment des sujets susceptibles d’activer
une identité comme le milieu d’origine ou le milieu d’accueil (Love et Walker, 2013; Nycz,
2013)49. Quelques distracteurs ont également été utilisés, et aussi bien des formats de réponses
fermé, ouvert et mixte ont été proposés.

5.5.2 Catégorisation et quantification des facteurs et indices externes


La section 5.5.2.1 décrit le questionnaire démographique administré oralement aux participants au
début du T1, ainsi que la manière dont les réponses ont été traitées. Ce questionnaire, qui peut être
visualisé en Annexe 5, est composé de questions ouvertes servant trois desseins : vérifier

49
Blais et Durand (2009 : 460) ajoutent que « [l]e seul fait de répondre à un questionnaire peut sensibiliser un
individu à certaines questions et modifier ses comportements ou ses attitudes », ce qui peut se traduire à court
terme, c’est-à-dire pendant l’expérience même, ou à plus long terme, c’est-à-dire lors de l’expérience
suivante, surtout si l’intervalle entre les deux est très court. Les auteurs ne précisent cependant pas ce qu’ils
entendent par un court intervalle.

147
l’admissibilité du participant, le catégoriser par rapport au facteur externe MOBILITÉ et récolter à
son sujet des renseignements complémentaires auxquels recourir au besoin. Le questionnaire
longitudinal autoadministré, dont les différentes versions sont reproduites en Annexe 6, aborde trois
autres éléments que nous souhaitions mettre en lien avec la présence ou l’absence de changements
phonétiques chez les participants : l’intégration sociale, le degré d’appartenance à la phase
d’émergence de l’âge adulte et la fidélité à ses origines. Bien qu’ils aient été nommés jusqu’ici
facteurs externes, ces éléments correspondent à un comportement mesurable de l’individu. En
d’autres termes, ils peuvent être envisagés comme des variables dépendantes au même titre que les
indices acoustiques relevés. D’un autre côté, si l’objectif est de les mettre en relation avec les
productions phonétiques des participants, ils peuvent aussi être considérés comme des variables
indépendantes. Nous reviendrons sur les implications de cette hybridité dans la section sur les
analyses statistiques (5.6), mais nous désignerons désormais sous le terme d’indices ces facteurs
externes pouvant être traités comme variables dépendantes. Ainsi, la section 5.5.2.2 détaillera les
questions liées à l’indice INTÉGRATION et la manière dont les réponses ont été codées. La section
5.5.2.3 traitera des questions et réponses composant l’indice ÉMERGENCE, soit le degré
d’appartenance des participants à la phase d’émergence de l’âge adulte. Finalement, l’indice
FIDÉLITÉ sera abordé dans la section 5.5.2.4.

5.5.2.1 Questionnaire démographique et facteur MOBILITÉ


En ce qui concerne les questions entourant l’admissibilité, précisons qu’un certain nombre de
critères de sélection (c’est-à-dire les constantes de notre échantillon : âge, niveau d’études, langue
maternelle et, par défaut, établissement fréquenté) avaient déjà été formulés dans l’appel à
participation et que de manière générale, les candidats les ont respectés. L’appel à participation ne
faisait cependant pas mention de l’histoire résidentielle et l’administration du questionnaire a
parfois révélé que certains témoins ne pouvaient être considérés ni comme sédentaires, ni comme
mobiles de fraîche date, ayant vécu dans plusieurs régions du Québec au cours de leur vie. Lorsque
tel était le cas, l’expérience avait tout de même lieu, mais les candidats n’étaient pas recontactés au
T2. Nous estimons que poser nous-même les questions démographiques aura permis d’approfondir
les réponses et d’en augmenter la fiabilité, en particulier en ce qui a trait à l’admissibilité. Par
exemple, un témoin pouvait indiquer avoir vécu ailleurs qu’à Québec et qu’en son lieu de naissance
et a priori, se voir déclarer inadmissible car trop mobile. En l’amenant à en dire plus, nous
constations que le lieu d’origine rapporté était en réalité la ville où se situait l’hôpital à la naissance
et que « l’autre » lieu de résidence devait être considéré, dans le cadre de cette étude, comme son
lieu d’origine. Les questions démographiques qui permettaient de vérifier l’admissibilité des
participants étaient donc les suivantes :

148
- âge;
- programme d’études actuel, programme d’études au collégial et Cégep fréquenté (les
locuteurs devaient entreprendre un premier baccalauréat dans les mois suivant la fin de
leurs études collégiales, ce que la discussion autour de ces trois questions permettait de
dégager);
- date d’arrivée approximative dans la ville actuelle et autres lieux de résidence.

Le questionnaire démographique servait également à déterminer si les participants se rangeaient


parmi les mobiles ou les sédentaires, ce qui, rappelons-le, devait être effectué séance tenante afin
d’administrer la version appropriée du second questionnaire. Les questions ouvertes portant sur la
ville de naissance et la date d’arrivée approximative dans la ville actuelle ont donc servi à classer
les participants parmi l’une ou l’autre des catégories nominales (mobiles ou sédentaires) du facteur
MOBILITÉ. Étant donné l’origine géographique diversifiée des participants mobiles (15 villes
différentes pour 18 locuteurs), ils n’ont pas été reclassés en sous-catégories, par exemple par région
administrative comme dans le Tableau 3, trop peu d’individus se retrouvant dans chacune d’entre
elles.

Les questions visant à récolter des renseignements complémentaires mais non systématiquement
exploités abordaient les thématiques suivantes :

- origine géographique et profil socio-économique des parents (ville d’origine, niveau de


scolarité complété et emploi occupé);
- connaissance d’autres langues;
- emploi occupé par le participant.

En ce qui concerne la connaissance d’autres langues, nous demandions aux témoins s’ils parlaient
d’autres langues au point de se considérer bilingues. Nous avons pu constater que la définition naïve
du bilinguisme était pour le moins variable. Pour certains, comprendre une série télévisée en anglais
est synonyme de bilinguisme, pour d’autres, une maîtrise écrite et orale absolument équivalente des
deux langues est nécessaire, et tout un continuum existe entre les deux. En l’absence de réel test de
compétences linguistiques, les réponses à cette question s’avèrent donc inutilisables.

5.5.2.2 Indice INTÉGRATION


L’indice INTÉGRATION regroupe différents sous-indices rendant compte du degré d’engagement du
locuteur mobile par rapport à son nouveau milieu de vie, et chez les sédentaires, de l’ampleur des
changements sociaux entraînés par le début des études universitaires. Ces sous-indices composant
l’indice INTÉGRATION sont le cercle social fréquenté, les activités partagées avec autrui, les
perspectives d’avenir et, chez les migrants seulement, l’intensité des contacts maintenus avec le

149
milieu d’origine. Chacun des sous-indices a d’abord été évalué sur une échelle ordinale distincte,
puis les différentes échelles résultantes ont été regroupées en un indice chiffré unique rendant
compte de l’INTÉGRATION. Une valeur d’indice élevée traduit une intégration sociale positive, c’est-
à-dire un ensemble de comportements censés favoriser le changement phonétique.

Le sous-indice du cercle social fréquenté a été évalué en explorant des thèmes tels que les
fréquentations en contexte universitaire, les relations amicales et les contacts quotidiens. Nous
décrirons d’abord les questions posées au T1 et la quantification des réponses obtenues, avant
d’expliquer le suivi effectué au T2.

Le premier thème abordé, celui des fréquentations en contexte universitaire, a fait l’objet des
questions suivantes au T1 :

- Y a-t-il des personnes dans votre programme que vous connaissiez déjà (amis, collègues,
connaissances du Cégep ou du secondaire, etc.) ? (Oui/Non)
- Depuis le début de la session, avez-vous fait la connaissance de nouveaux étudiants de votre
programme ? (Oui/Non)

Il va de soi qu’une réponse positive à la seconde question est signe d’intégration positive; la réponse
« Oui » a donc été codée 1 et la réponse « Non », 0. En ce qui concerne la première question, nous
avons considéré que l’absence de relations antérieures amenait davantage les étudiants à rencontrer
de nouvelles personnes, ainsi une réponse négative a été codée 1 et une réponse positive, 0.

Le thème des relations amicales a fait l’objet des questions suivantes :

- Si vous pensez aux 5 ou 10 personnes que vous fréquentez le plus souvent en ce moment,
de quelle(s) ville(s) viennent-elles ? (Réponse ouverte)
- Est-ce qu’il s’agit des mêmes personnes que vous fréquentiez le plus quand vous étiez au
Cégep ? (Oui/Non)

La ville d’origine des participants a servi de base pour quantifier la réponse ouverte à la première
question. En effet, si un témoin rapportait fréquenter exclusivement des personnes originaires de sa
propre ville ou région, 0 lui était attribué. S’il énumérait différents endroits incluant sa ville
d’origine, 1 lui était attribué. Un participant n’énumérant que des endroits différents de sa ville
d’origine se voyait attribuer 2. Les réponses plus évasives comme « Un peu partout au Québec » ont
été codées 1 ou 2, selon que la ville d’origine du locuteur était mentionnée ou non (cet exemple a
été codé 2). Pour ce qui est de la deuxième question, nous avons codé une réponse négative 1 et une
réponse positive, 0. Certains participants ont répondu à la fois « Oui » et « Non », ce que nous
avons interprété comme une diversification au moins partielle des relations amicales et codé 1.

150
Le thème des contacts quotidiens ciblait plutôt les personnes avec qui les participants interagissent
dans l’intimité de leur foyer. La principale question en lien avec ce thème était la suivante, à
laquelle les participants pouvaient donner autant de réponses que nécessaire :

- Présentement, avec qui vivez-vous ? (Parent[s] / Seul / Conjoint[e] / Colocataire[s] / Autre)

Si les participants choisissaient les options « Conjoint(e) » ou « Colocataire(s) », ils devaient en


outre préciser l’âge, l’occupation et la ville d’origine des personnes concernées, en plus d’indiquer
depuis combien de temps ils connaissaient leurs éventuels colocataires. L’option « Autre » était
également accompagnée d’une demande de précision, mais tous les participants l’ayant sélectionnée
l’ont fait pour mentionner vivre avec la fratrie en plus de leur(s) parent(s), ce que nous avons traité
identiquement à la seule réponse « Parent(s) ».

Nous avons attribué 0 aux participants vivant seuls ou avec leurs parents. Pour les témoins qui ont
rapporté vivre avec un conjoint ou des colocataires, nous nous sommes à nouveau fondée sur leur
ville d’origine pour la quantification. Ainsi, ceux qui ont rapporté vivre avec leur conjoint se sont
vu attribuer 0 si ce dernier était originaire du même endroit qu’eux, et 1 s’il était originaire d’un
autre endroit. Pour ce qui est des colocataires, 0 a été attribué lorsque participant et colocataire(s)
étaient originaires du même endroit, et 2 lorsqu’ils étaient originaires d’endroits différents. Un
témoin rapportant vivre avec au moins un colocataire de la même origine et au moins un colocataire
d’origine différente se voyait attribuer 1.

En somme, au T1, le sous-indice du cercle social fréquenté a été évalué sur une échelle à 8 degrés
(résultats de 0 à 7), où un maximum de 2 points pouvaient être obtenus pour le thème des
fréquentations en contexte universitaire, 3 pour celui des relations amicales et 2 pour celui des
contacts quotidiens. Cette échelle, ensuite ramenée sur 1, est identique pour les participants mobiles
et sédentaires.

En ce qui concerne les changements apportés aux questionnaires au T2, le thème des fréquentations
universitaires a été évalué à l’aide d’une seule question, pour laquelle une réponse positive a été
codée 1 et une réponse négative, 0 :

- Est-ce que vous vous entendez bien avec les autres étudiants de votre programme ?
(Oui/Non)

De plus, si le thème des relations amicales faisait à nouveau l’objet de deux questions, dont l’une
identique au T1 (Si vous pensez aux 5 ou 10 personnes que vous fréquentez le plus souvent en ce

151
moment, de quelle[s] ville[s] viennent-elles ?), l’autre faisait allusion aux fréquentations de l’année
précédente plutôt qu’à celles de l’époque du Cégep :

- Globalement, s’agit-il des mêmes personnes que vous fréquentiez à pareille date l’an
passé ? (Oui/Non)

Une réponse négative, de même qu’une double réponse (Oui et Non), ont été codées 1, puisqu’un
changement au moins partiel des relations amicales a eu lieu durant l’année. Cependant, avant
d’attribuer 0 à la réponse « Oui », nous avons d’abord vérifié la réponse fournie l’année précédente.
Si au T1, le participant avait rapporté un changement au moins partiel de relations amicales, alors
une réponse positive au T2 a été codée 1. Si au contraire, le participant n’avait pas diversifié ses
relations amicales au T1, une réponse positive au T2 a été codée 0.

Au T2, le sous-indice du cercle social fréquenté a ainsi été évalué sur une échelle à 7 degrés
(résultats de 0 à 6) plutôt que 8 au T1, un seul point pouvant être obtenu pour le thème des
fréquentations en contexte universitaire. À nouveau, l’échelle a été ramenée sur 1 et était la même
pour les participants mobiles et sédentaires.

En mesurant le sous-indice des activités partagées avec autrui, nous souhaitions évaluer si les
participants avaient conservé leurs habitudes de vie antérieures et s’ils trouvaient un intérêt à
partager des activités avec leurs pairs. Ce sous-indice faisait l’objet des trois questions suivantes,
posées aux participants mobiles et sédentaires, au T1 comme au T2, toutes appelant des réponses de
type Oui/Non, ainsi que des précisions occasionnelles :

- Faites-vous des activités sociales avec ces collègues à l’extérieur des cours ? Si oui,
lesquelles ?
- Vous impliquez-vous autrement à l’université qu’en allant à vos cours ? Si oui, comment ?
- Depuis que vous avez commencé l’université, faites-vous les mêmes activités qu’avant ? Si
oui, précisez. Sinon, qu’est-ce qui a changé ?

La réponse à ces questions a été quantifiée de manière à ce qu’un résultat élevé témoigne d’un
partage d’activités avec les pairs et de modifications des habitudes de vie, conditions propices au
changement phonétique. Dans les deux premiers cas, une réponse positive a ainsi été codée 1 et une
réponse négative, 0. La quantification de la troisième question s’est avérée nettement plus délicate
en raison de la diversité des réponses fournies. Nous avons d’abord choisi d’attribuer 0 à un
participant ne rapportant aucun changement, en raison des tendances ressortant de la littérature (De
Decker, 2006). Toute déclaration de changement a en revanche été codée 1, y compris lorsque les
participants fournissaient une double réponse (Oui et Non). Nous avons ensuite vérifié les

152
précisions apportées aux déclarations de changement afin de leur accorder un score
supplémentaire : 0 lorsque le bilan des activités était négatif et 1 lorsqu’il était positif. Plus
précisément, un bilan négatif a été assigné aux participants ne rapportant que la cessation d’activités
antérieures. Un bilan positif a en revanche été assigné à ceux ayant commencé de nouvelles
activités, qu’ils en aient cessé d’anciennes ou non. Nous n’avons cependant pas tenu compte de la
nature plus ou moins sociale de ces activités lors du codage. Le sous-indice des activités partagées
avec autrui a donc été évalué à l’aide d’une échelle à 5 degrés (résultats de 0 à 4), ensuite ramenée
sur 1.

Le sous-indice des perspectives d’avenir comporte deux thèmes : les perspectives par rapport au
milieu de vie, et celles par rapport à l’occupation après le baccalauréat. Dans le premier cas, les
participants étaient interrogés sur l’endroit où ils envisageaient vivre et travailler une fois leurs
études terminées. Les sédentaires disposaient de deux choix de réponses : Québec et ailleurs; les
mobiles disposaient de trois : Québec, ailleurs et région d’origine.

- Après vos études, laquelle des options suivantes est la plus probable ? (Vivre et travailler
ici. / Vivre et travailler ailleurs. / [Retourner vivre et travailler dans ma région.])

La question et les choix de réponses visant à dégager les perspectives par rapport à l’occupation
après le baccalauréat étaient identiques dans les questionnaires distribués aux mobiles et aux
sédentaires. En plus de pouvoir choisir entre la poursuite de leurs études et l’intégration au marché
du travail, les participants étaient libres de demeurer indécis :

- Quels sont vos plans après le baccalauréat ? (Poursuivre mes études. / Intégrer le marché du
travail. / Je ne sais pas encore.)

Les réponses à ces questions ont permis de constituer une échelle de perspectives allant des plus
locales aux plus cosmopolites. Bien que nous proposions de ces deux derniers termes une définition
adaptée à notre objet d’étude, ils ne sont pas étrangers aux théories sociolinguistiques (voir par
exemple Milroy, 1980) et l’effet que nous leur présumons sur les pratiques des locuteurs suit les
mêmes lignes directrices. L’orientation locale se présente comme l’intégration à un milieu de vie
homogène, à la fois en termes d’origine géographique des personnes le composant, et d’occupations
quotidiennes plus routinières et rythmées par le contact avec les mêmes individus. Ainsi, la
perspective de vivre dans son milieu d’origine et celle d’intégrer le marché de l’emploi dès la fin du
baccalauréat définissent l’orientation locale. À l’inverse, l’orientation cosmopolite est caractérisée
par la perspective de s’établir ailleurs, mais aussi de poursuivre des études, qui signifient que les

153
témoins concernés continueront encore quelques années à fréquenter un milieu hétérogène,
perméable, propice aux rencontres et par le fait même, aux changements phonétiques.

Pour les témoins sédentaires, souhaiter vivre et travailler à Québec a été codé 0, et souhaiter vivre et
travailler ailleurs a été codé 1. Pour ce qui est des mobiles, qui disposaient d’un choix de réponse
supplémentaire, la perspective de retourner s’établir en région a été codée 0, tandis que celles de
rester à Québec et de vivre et travailler ailleurs ont toutes deux été codées 1. Quant à l’occupation
après le baccalauréat, la perspective d’intégrer le marché du travail a été codée 0 et celle de
poursuivre des études codée 2, l’indécision étant considérée comme une orientation intermédiaire et
codée 1. Le sous-indice des perspectives d’avenir a donc été évalué sur une échelle à 4 degrés
(résultats de 0 à 3), aussi bien chez les sédentaires que chez les mobiles, au T1 comme au T2. Cette
échelle a ensuite été ramenée sur 1, un résultat élevé témoignant de perspectives plus cosmopolites
et plus propices au changement.

En ce qui concerne le sous-indice des contacts maintenus avec le milieu d’origine, évalué chez les
mobiles seulement, nous avons mis au point une échelle où un faible résultat témoigne du maintien
de forts contacts avec le milieu d’origine, condition peu favorable au changement phonétique. Les
participants ont d’abord été interrogés sur la fréquence de leurs visites dans le milieu d’origine entre
les deux expérimentations, sous forme de réponses ouvertes prospective au T1 et rétrospective au
T2 :

- Dans la prochaine année, à quelle fréquence pensez-vous retourner chez vous pour des
visites ?
- À quelle fréquence êtes-vous retourné chez vous pour des visites dans la dernière année ?

Nous avons choisi de n’exploiter que la réponse rétrospective, probablement plus représentative de
la réalité. Quant à la quantification des réponses fournies, nous les avons réparties en fréquences de
contacts faible, moyenne et élevée, codées respectivement 2, 1 et 0. Plus précisément, une
fréquence faible correspond à des visites seulement lors de longs congés (Action de Grâces, Pâques,
semaines de lecture, vacances de Noël) et d’événements spéciaux (funérailles, rendez-vous
médicaux, etc.). Une fréquence moyenne correspond à des visites à tous les mois. Une fréquence
élevée correspond à des visites à toutes les semaines ou aux deux semaines.

Les témoins ont également été interrogés sur l’endroit où ils avaient majoritairement passé l’été
précédant la seconde expérimentation :

- Où avez-vous passé la majorité de l’été ?

154
S’ils déclaraient être retournés passer l’été dans leur région d’origine, la réponse était codée 0. S’ils
rapportaient plutôt avoir passé l’été à Québec ou dans un lieu tiers (Baie James, Colombie-
Britannique, par exemple), la réponse était codée 1. Les résultats aux deux questions précédentes
ont ensuite été additionnés, générant une échelle à 4 degrés (résultats de 0 à 3) ensuite ramenée
sur 1. Précisons que puisque la dernière question n’a été posée qu’au T2 et que seule la réponse
rétrospective à la première question a été considérée, le sous-facteur des contacts maintenus avec le
milieu d’origine a été évalué seulement chez les participants mobiles, et seulement au T2.

Pour résumer, la valeur de l’indice INTÉGRATION constitue la somme de la mesure de différents


sous-indices, certains sous-indices comportant eux-mêmes différents thèmes, comme l’illustre le
Tableau 4. Quelle que soit l’échelle, un résultat élevé signifie une intégration sociale positive,
susceptible d’entraîner le changement phonétique. Puisque le résultat correspondant à chaque sous-
indice a été ramené sur 1, les participants ont obtenu un score global d’INTÉGRATION allant, pour les
sédentaires, de 0 à 3, et pour les mobiles, de 0 à 3 au T1 et de 0 à 4 au T2. Afin de rendre
comparable aux autres ce score sur 4 obtenu par les mobiles au T2, en particulier sur le plan
statistique, nous l’avons ramené sur 3.

Tableau 4 : Échelles ordinales construites pour mesurer les sous-indices qui composent l’indice
INTÉGRATION
Sous-indice thème échelle Échelle sous-indice
fréquentations en 0-2 (T1)
contexte universitaire 0-1 (T2) 0-7 (T1)
Cercle social fréquenté
relations amicales 0-3 0-6 (T2)
contacts quotidiens 0-2
Activités partagées avec autrui 0-4
milieu de vie 0-1
Perspectives d’avenir occupation après le 0-3
0-2
baccalauréat
Intensité des contacts avec le
0-3 (mob. T2)
milieu d’origine

5.5.2.3 Indice ÉMERGENCE


Une autre série de questions a servi à construire un indice de l’émergence de l’âge adulte (indice
ÉMERGENCE). Contrairement à l’INTÉGRATION, évaluée à l’aide de questions et d’échelles de notre
cru, l’ÉMERGENCE a été mesurée à l’aide d’outils déjà disponibles dans la littérature et adaptés à nos
besoins. En particulier, nous nous sommes inspirée de la contribution de Baggio et coll. (2015), qui
proposent dans un premier temps de vérifier à quel point les étapes d’entrée dans l’âge adulte ont
déjà été franchies. Ces étapes sont au nombre de cinq (parentalité, relation de couple stable,

155
indépendance financière, âge, situation sur le marché de l’emploi); un individu au stade d’adulte
émergent devrait n’en avoir franchi que peu ou aucune.

Baggio et coll. (2015 : 248) choisissent d’attribuer un score binaire à chacune de ces étapes : 0 si
elle n’est pas franchie et 1 si elle l’est, pour un total possible de 5. En ce qui concerne notre
échantillon, tous les témoins ont obtenu 0 pour l’âge et pour la situation sur le marché de l’emploi,
puisqu’aucun n’a dépassé 25 ans et que tous sont étudiants50 (constantes). Les trois autres étapes ont
été évaluées à l’aide des questions suivantes :

- Avez-vous des enfants ou êtes-vous sur le point d’en avoir ? (Oui/Non)


- Présentement, avec qui vivez-vous ? (Choix de réponses incluant « Conjoint(e) »)
- À quel point êtes-vous financièrement indépendant de vos parents ? (Échelle de Likert à
4 degrés allant de « Tout à fait indépendant » à « Pas du tout indépendant »)

Une réponse positive à la première question a été codée 1, de même que la sélection de la réponse
« Conjoint(e) » à la deuxième question. La troisième s’est avérée plus problématique. À titre
d’exemple, un participant a indiqué être tout à fait indépendant financièrement de ses parents, tout
en rapportant vivre dans la maison familiale. L’ampleur des responsabilités financières de l’adulte,
notamment celle, non négligeable, impliquée dans la nécessité de se loger, semble dans ce cas avoir
été sous-estimée. Bien qu’il s’agisse d’un témoignage éloquent du fait que le participant concerné
n’a pas encore franchi l’étape de l’indépendance financière, nous avons dû prendre certaines libertés
lors du codage des réponses. Ainsi, les trois échelons autres que « Tout à fait indépendant » ont été
codés 0, mais avant d’attribuer 1 à la réponse « Tout à fait indépendant », nous l’avons contre-
vérifiée avec la situation résidentielle du participant (questions « Présentement, avec qui vivez-
vous ? » et « Présentement, dans quel type d’habitation demeurez-vous ? »).

Au-delà de ces jalons marquant l’entrée dans l’âge adulte, l’émergence de l’âge adulte peut être
évaluée à l’aide du questionnaire IDEA (Inventory of the Dimensions of Emerging Adulthood),
développé par Reifman et coll. (2007) et disponible en libre accès. Cet outil sert à faire ressortir des
différences inter-individuelles potentiellement explicatives d’écarts entre les comportements de
participants préalablement identifiés comme adultes émergents. La version originale du
questionnaire comporte 31 items évaluant à quel degré les répondants s’auto-identifient aux
différentes composantes qui définissent l’émergence de l’âge adulte (exploration identitaire,

50
À nouveau, nous adoptons le codage de Baggio et coll. (2015 : 248) par rapport à la situation sur le marché
de l’emploi : « coded 1 if participants worked, 0 otherwise (e.g., students), with participants who both studied
and worked recorded as students because their education was not yet complete ».

156
instabilité, égocentrisme, entre-deux, étape de tous les possibles; Arnett, 2004). Reconnaissant les
contraintes de temps et d’espace éprouvées par certains chercheurs, Baggio et coll. (2015) ont
développé et mis à l’épreuve une version écourtée du questionnaire qui comprend seulement 8 items
(IDEA-8) et que nous avons choisi d’exploiter. Nous avons nous-même procédé à sa traduction,
aucune version française n’étant disponible au moment de la sélection de nos outils de mesure51.
Nous avons également adapté la mise en contexte proposée aux participants, qui dans la version
originale, est ainsi formulée (Reifman et coll., 2007) :

First, please think about this time in your life. By “time in your life,” we are referring to the
present time, plus the last few years that have gone by, and the next few years to come, as you
see them. In short, you should think about a roughly five-year period, with the present time
right in the middle.

Notre propre question est allégée et ne fait pas référence à une période de cinq ans. Enfin, Reifman
et coll. (2007) proposent que les différents items soient évalués sur une échelle de Likert à 4 degrés
allant de « Strongly agree » à « Strongly disagree », avec les degrés intermédiaires de « Somewhat
agree » et « Somewhat disagree ». Nous avons plutôt utilisé la formulation « Tout à fait ma vie » et
« Pas du tout ma vie » pour les degrés extrêmes et laissé vierges les degrés intermédiaires. La
Figure 6 illustre notre version du questionnaire IDEA-8, telle qu’administrée aux locuteurs mobiles
au T1.

Figure 6 : Adaptation du questionnaire IDEA-8 (Reifman et coll., 2007; Baggio et coll., 2015)

51
Depuis, l’équipe du laboratoire LEDSEA de l’UQÀM a mis au point une version française du questionnaire
IDEA-31 (Lanctot et Poulin, 2018; traduction non incluse dans l’article).

157
Quant à la quantification des réponses fournies, nous avons suivi les recommandations de Reifman
et coll. (2007) et assigné un score de 1 à 4 (où 4 correspond à « Tout à fait ») à chacun des items,
pour un total possible de 32. La valeur de l’indice ÉMERGENCE résulte de la combinaison du résultat
sur 5 des marqueurs de l’âge adulte et de celui sur 32 provenant du questionnaire IDEA-8, le
résultat sur 5 ayant été soustrait à celui sur 32. Plus les individus sondés présentent des
caractéristiques de l’émergence de l’âge adulte, plus l’indice est élevé, reflétant une forte
identification aux items d’IDEA-8 et une faible proportion (donc peu de points soustraits) d’étapes
d’entrée dans l’âge adulte franchies.

5.5.2.4 Indice FIDÉLITÉ


Le souci d’intégrité et de fidélité à ses origines est un facteur qui, selon la littérature, peut freiner
l’acquisition d’un R2 (Nuolijärvi, 1994; Evans et Iverson, 2007; Kerswill et Williams, 2000b;
Stanford, 2008; section 2.4.3). Le souci de fidélité peut trouver sa source chez le locuteur lui-même,
mais il peut aussi résulter de la désapprobation explicite d’interlocuteurs faisant partie de la
communauté d’origine ou d’accueil. De plus, dans toutes les études citées, la résistance au
changement semblait impliquer une certaine conscience des différences entre le R1 et le R2,
conscience induite par la sensibilité linguistique du locuteur, les remarques d’autrui, ou les deux.

Étant donné nos choix méthodologiques, nous avons dû tenter d’évaluer l’indice FIDÉLITÉ sans
aborder le sujet explicitement au cours d’un entretien, sans nous engager dans une étude sur les
attitudes manifestées à l’égard de stimuli, et sans sonder directement les communautés d’accueil et
d’origine. Nous avons ainsi élaboré, à l’intention exclusive des locuteurs mobiles, une série de
questions réparties entre le T1 et le T2 et visant à vérifier dans quelle mesure une prise de
conscience d’éventuelles différences linguistiques s’était produite chez les participants depuis leur
récente installation à Québec (T1), si des changements dans leurs usages avaient été perçus et, le cas
échéant, si une évaluation négative ou positive s’ensuivait (T2).

Précisons d’emblée que si ces différentes questions appellent toutes des réponses de type Oui/Non,
elles requièrent aussi des explications ou des exemples, ce qui a inévitablement donné lieu à un
éventail de réponses plus ou moins précises et anecdotiques, à des commentaires tels que « aucun
exemple précis en tête », parfois à des abstentions. De plus, que les questions comportent des
termes spécifiques comme « accent » (T1) ou plus généraux comme « façon de parler » (T2), les
participants ne les ont pas tous interprétés de la même manière, l’hétérogénéité de leurs réponses en
faisant foi (voir ci-après). En conséquence, nous avons jugé l’indice FIDÉLITÉ inquantifiable et
avons choisi de l’exploiter de manière qualitative et post hoc.

158
Les questions sur la prise de conscience posées au T1 abordaient la sensibilité du locuteur lui-même
d’une part, et la conscience induite par autrui d’autre part, l’une n’excluant pas l’autre :

- Trouvez-vous que les gens ici ont un accent différent ? Si oui, avez-vous des exemples ?
(Oui/Non)
- Depuis que vous êtes arrivé ici, est-ce que quelqu’un vous a dit que vous aviez un accent ?
(Oui/Non)

La demande d’exemples à la première question a engendré une gamme de réponses hétéroclites,


allant d’observations assez précises (« davantage de [ɛ] que de [e] », formulée par un étudiant en
sciences du langage suivant un cours de phonétique) à très vastes (« les femmes de cette ville ont
toutes des intonations/voix similaires »), en passant par des phénomènes phonétiques lexicalement
restreints, voire des spécificités morphologiques (prononciation du mot crabe : [a] vs [ɑ]; « la bus »,
exemple formulé quelques fois tant en raison du genre féminin que de la production d’un [ʏ] plutôt
que d’un [ɔ] dans le nom). D’autres participants ont plutôt mentionné qu’une multitude d’accents
pouvaient être entendus à Québec, contrairement à leur région d’origine, confirmant de ce fait que
l’input des étudiants universitaires ne provient pas nécessairement de la communauté locale (Nycz,
2015). Quelle que soit la nature des exemples, nous avons estimé qu’en avoir formulé témoignait
d’une prise de conscience de la différence, de même qu’une réponse positive à la seconde question.

La perception d’éventuels changements dans les usages des locuteurs au T2 a été abordée selon le
point de vue de trois actants : celui de la communauté d’accueil, celui de la communauté d’origine
et celui du locuteur lui-même. Si ce dernier rapportait que des changements étaient perçus par les
communautés d’accueil et d’origine, il devait décrire brièvement leur attitude face à ces
changements. Si le participant percevait des changements dans ses propres usages, il était amené à
fournir des exemples, mais s’il n’en percevait pas, il devait tenter une explication.

- Les gens d’ici vous font-ils remarquer que vous avez changé votre façon de parler depuis
que vous êtes arrivé ? Si oui, quelle est leur réaction ? (ex. : contents, fâchés, fiers)
- Quand vous retournez dans votre région, les gens de là-bas vous font-ils remarquer que
vous avez changé votre façon de parler depuis que vous avez déménagé ? Si oui, quelle est
leur réaction ? (ex. : contents, fâchés, fiers)
- Personnellement, pensez-vous avoir changé certaines choses dans votre façon de parler ? Si
oui, avez-vous des exemples (de nouveaux mots, de nouvelles expressions, de nouvelles
façons de prononcer, etc.) ? Sinon, comment expliquez-vous cela (ex. : il n’y avait rien à
changer parce que je n’ai pas vraiment d’accent, j’ai consciemment fait un effort pour ne
rien changer, etc.) ?

Aucun participant n’a rapporté que les gens de Québec (d’ici) avaient signalé un changement, ainsi
aucune réaction n’a été décrite. Pour ce qui est du milieu d’origine (de là-bas), le peu de participants

159
qui ont répondu à l’affirmative n’ont parfois rapporté aucune réaction, ou encore les réactions sont
difficiles à considérer comme positives ou négatives (exemple : « ils étaient surpris »), et donc
susceptibles de favoriser ou de freiner le changement. La demande d’exemples à la troisième
question a donné lieu à des réponses aussi diverses que le mot asseoir désormais prononcé [aswɑʁ]
au lieu de [asɪʁ] (une étudiante en enseignement du français au secondaire), l’emprunt
d’expressions aux nouveaux amis, l’acquisition d’un vocabulaire technique lié aux études,
l’influence sur le lexique d’un séjour d’immersion en anglais, voire un changement dans le contenu
du discours en tant que tel, un participant expliquant qu’autrefois, il cherchait à faire rire les gens
mais qu’à présent, il s’évertuait à les conscientiser.

En somme, au sein de l’indice FIDÉLITÉ, les participants mobiles ont été classés comme conscients
ou non conscients de la variation au T1. Ensuite, ils ont été classés en fonction de la perception d’un
changement, quel qu’il soit, par le participant lui-même ou par son milieu d’origine au T2
(rappelons qu’aucun changement perçu par le milieu d’accueil n’a été rapporté). Dans la mesure du
possible, les participants ont été classés en fonction de la présence de réactions positives ou
négatives au changement, soit de leur part, soit de la part du milieu d’origine (aucune réaction
positive chez l’un et négative chez l’autre n’a été rapportée). Ces différentes composantes de
l’indice FIDÉLITÉ seront abordées lors de l’analyse des résultats, au chapitre suivant (section 6.3), et
fourniront des pistes de réflexion sur des thèmes connexes dans la Discussion (Chapitre 7).

5.5.2.5 Synthèse
Pour résumer, l’utilisation de questionnaires a permis de vérifier l’admissibilité des participants
(âge, langue maternelle, degré de mobilité, etc.), de recueillir de l’information complémentaire à
leur sujet (emploi occupé, profil socioéconomique des parents, etc.) et de récolter des
renseignements servant à évaluer le facteur externe MOBILITÉ et les indices INTÉGRATION,
ÉMERGENCE et FIDÉLITÉ. Les locuteurs ont été classés dans l’une des deux catégories nominales du
facteur MOBILITÉ. Si l’INTÉGRATION et l’ÉMERGENCE se présentent sous forme d’indices chiffrés,
la FIDÉLITÉ est de nature qualitative, l’hétérogénéité des réponses des participants n’ayant pas
permis de la quantifier. Quant au facteur externe SEXE (variable exclusivement indépendante au
même titre que la MOBILITÉ), nous n’avons pas explicitement interrogé les témoins à ce propos et
les avons nous-même catégorisés en fonction de ce qui nous apparaissait être leur sexe biologique
(échelle nominale binaire).

Finalement, deux distracteurs abordant le thème des études universitaires ont été utilisés dans
chaque version du questionnaire autoadministré. Les deux premiers items de la liste suivante

160
correspondent aux distracteurs du T1 et les deux derniers, à ceux du T2, tous proposés avec un
choix de réponses de type Oui/Non et parfois, une demande de précision.

- Le programme dans lequel vous étudiez actuellement était-il votre premier choix lors de
votre demande d’admission à l’université ?
- Trouvez-vous que les enseignants dans votre programme utilisent un vocabulaire technique
approprié pour des étudiants de première année ? Sinon, pourquoi ?
- Depuis que vous avez commencé le baccalauréat, avez-vous changé de programme ou avez-
vous songé à le faire ? Si oui, pour quel autre programme ?
- Avez-vous appris un vocabulaire technique lié à votre domaine depuis le début de vos
études ?

Les réponses à ces questions n’ont pas été exploitées.

5.6 Analyses statistiques


Les analyses statistiques décrites dans cette section ont été conçues en collaboration avec une
professionnelle du Service de consultation statistique de l’Université Laval. Le logiciel SAS version
9.4 a été utilisé pour la rédaction du script original, que nous avons ensuite adapté à nos besoins et
exécuté dans SAS University Edition52. Les données ont principalement été analysées à l’aide de
modèles mixtes à mesures répétées (procédure MIXED). Deux séries d’analyses différentes ont été
réalisées, l’une portant sur les indices acoustiques et l’autre centrée sur les indices INTÉGRATION et
ÉMERGENCE.

5.6.1 Analyses statistiques sur les indices acoustiques


La procédure MIXED de SAS permet de tester l’effet, sur une variable dépendante, de facteurs
fixes et de facteurs aléatoires, en plus d’intégrer une matrice de covariance prenant en charge les
données corrélées. Dans notre modèle, l’individu a été traité comme facteur aléatoire, le TEMPS de
l’expérimentation (T1 ou T2), comme mesure répétée, et le fait qu’un même individu a produit des
voyelles dans différents CONTEXTES consonantiques a été pris en compte. En ce qui concerne les
indices acoustiques testés (les variables dépendantes), leur valeur correspondait aux moyennes
individuelles par voyelle, contexte et temps. Par exemple, pour un locuteur donné, le F1 de ses trois
productions de la voyelle /ɑ/ en contexte (Vptk) au T1 (soit le mot Pâques lu à trois reprises) a été
moyenné, de même que le F1 de ses trois (ɑptk) au T2. Les analyses ont ainsi été effectuées sur sept
variables dépendantes, soit :

- la valeur de F1, de F2 et de F3 (estimée à 50 % de la durée);

52
Version en libre accès de SAS, à des fins académiques seulement.

161
- la dynamique de F1, de F2 et de F3 (différence entre les estimations à 25 % et à 75 % de la
durée);
- la durée.

Cinq variables indépendantes devaient être prises en compte dans notre première série d’analyses :
les facteurs externes MOBILITÉ et SEXE, le TEMPS de l’expérimentation, ainsi que la nature de la
VOYELLE et le CONTEXTE consonantique de droite. Autrement dit, les analyses devaient nous
indiquer si la moyenne estimée des indices acoustiques considérés variait en fonction de l’un ou
l’autre de ces cinq facteurs. Les variables MOBILITÉ, SEXE et TEMPS possèdent deux modalités
chacune, alors que la VOYELLE en comporte 1553 et le CONTEXTE, 8. Si dans l’idéal, toutes ces
variables indépendantes auraient été incluses dans un modèle unique et sept analyses, une par indice
acoustique, auraient été effectuées, nous avons dû composer avec certaines contraintes et tenter de
concilier au mieux interprétabilité des résultats et réduction du risque d’erreurs de type I.

Dans l’optique du modèle unique, deux possibilités s’offraient à nous :

A) Modèle unique comprenant le facteur VOYELLE et le facteur CONTEXTE


B) Modèle unique intégrant un facteur combiné VOYELLE-CONTEXTE

La différence entre les modélisations A et B réside dans la gestion des interactions et des
comparaisons multiples subséquentes. Le modèle A donne la possibilité à la VOYELLE et au
CONTEXTE d’être en interaction avec d’autres facteurs, mais également entre eux. Avec
respectivement 15 et 8 modalités, les comparaisons multiples impliquant ces deux facteurs
risquaient fort d’être ininterprétables. La création d’un facteur combiné54 en B constitue une
tentative de réduction du nombre d’interactions potentielles et de comparaisons multiples, dans le
but de faciliter l’interprétation. Quoi qu’il en soit, que l’on opte pour deux facteurs séparés ou un
seul facteur combiné comportant 76 modalités, l’analyse semblait vouée à l’échec, l’estimation des
degrés de liberté avec la méthode de Kenward-Roger, entre autres, s’avérant impossible. Nous
avons dû nous résoudre à effectuer plusieurs analyses séparées sur une même variable dépendante,
les deux principales possibilités étant :

53
Comme précisé précédemment (5.4.2), les variantes tendues et relâchées des voyelles fermées /i y u/ ont été
traitées de manière distincte, portant à 15 le nombre de catégories vocaliques à l’étude.
54
Même si chaque VOYELLE-CONTEXTE comprend théoriquement un seul mot, celui-ci ne pouvait être utilisé
en raison de la manière dont les productions inattendues ont été traitées dans la base de données (voir section
5.4.2). Par exemple, le mot œu prononcé [ø] est demeuré classé sous le mot œu , mais a été recatégorisé
comme appartenant à la combinaison VOYELLE-CONTEXTE (ø#), le mot prépare se retrouve aussi bien dans la
catégorie (aʁ) que (ɑʁ), et ainsi de suite. Utiliser le mot n’aurait pas réduit le nombre de modalités.

162
C) Plusieurs modèles intégrant la VOYELLE comme variable indépendante, chacun appliqué à
un CONTEXTE
D) Plusieurs modèles intégrant le CONTEXTE comme variable indépendante, chacun appliqué à
une VOYELLE

Un désavantage des modélisations C et D par rapport aux deux autres est qu’en augmentant le
nombre d’analyses, on augmente les risques d’erreurs de type I, c’est-à-dire le rejet de l’hypothèse
nulle alors qu’elle aurait dû être acceptée, ce que Laporte et Cucherat (2006 : 184) nomment
« inflation du risque alpha ». Le modèle C implique effectivement 8 analyses différentes par
variable dépendante et le modèle D, 15. Une exploration préliminaire des données a permis de
constater que leur distribution semblait davantage suivre la loi normale lorsqu’elles étaient
rassemblées par voyelle (modèle D) que par contexte (modèle C). Nous pouvions ainsi anticiper que
l’utilisation du modèle D permettrait plus fréquemment de respecter le postulat de distribution
normale des résidus. De plus, moins les facteurs comportent de modalités, plus l’interprétabilité des
résultats, notamment ceux des interactions, s’en trouve favorisée. La prise en compte du CONTEXTE
en D (8 modalités) présentait donc un certain avantage par rapport à la VOYELLE en C
(15 modalités). Pour ces raisons, nous avons au final sélectionné le modèle D, qui comporte les
variables indépendantes MOBILITÉ, SEXE, TEMPS et CONTEXTE. Quinze analyses différentes, soit
une par voyelle, ont été effectuées pour chacune des sept variables dépendantes, pour un total de
105 analyses.

Concernant le risque alpha impliqué dans le choix du modèle D, Laporte et Cucherat (2006)
rappellent que lors de l’analyse d’une variable dépendante, en adoptant un seuil de signification de
α = 0,05, fréquent en sciences humaines, le risque qu’encourt l’analyste de tirer une conclusion
erronée est de 5 %. Cependant, en effectuant sur une variable dépendante donnée deux analyses
statistiques plutôt qu’une, le risque double et atteint 10 %. En en effectuant trois, le risque de
conclusion erronée est porté à 15 %, et ainsi de suite. Une solution proposée par les auteurs est de
diviser le seuil de signification que souhaite adopter le chercheur par le nombre d’analyses
effectuées. Ainsi, avec deux analyses au seuil de 0,025 ou trois au seuil de 0,01 , le risque alpha
total demeure de 5 %.

En ce qui nous concerne, effectuer sur chaque indice acoustique 15 analyses au seuil de 0,05
mènerait à un risque de conclure erronément à une différence significative de 75 %. Pour atteindre
un risque alpha total de 5 %, le seuil de la signification devrait être abaissé à 0,00 . Cependant, en
théorie, nous aurions pu envisager utiliser un modèle mixte où les sept indices acoustiques auraient
été traités comme mesures répétées et ainsi effectuer une seule analyse sur toutes nos données. Dans

163
cette perspective, nous devrions considérer avoir procédé à 105 analyses au lieu d’une et utiliser un
seuil de signification de 0,00047. Bien entendu, ce modèle aurait autant été voué à l’échec qu’A et
B, en plus de générer des résultats ininterprétables. Nous avons néanmoins opté pour un compromis
et établi le seuil de la signification à α = 0,001. En ce qui concerne les comparaisons multiples
impliquées dans l’analyse des interactions et des effets du facteur CONTEXTE (plus de deux
modalités), pour lesquelles existent des méthodes d’ajustement tenant compte de la multiplicité des
analyses, nous avons utilisé celle de Tukey-Kramer et fixé le seuil de la signification à α = 0,05.

Notre choix de ne pas normaliser les données provient de ce que le SEXE a été traité comme effet
fixe et l’individu, comme effet aléatoire. Nous considérons que de cette manière, la part de
variabilité individuelle comprise dans les données est prise en charge par le modèle. D’après Drager
et Hay (2012 : 75), une telle modélisation peut servir de substitut aux techniques de normalisation
usuelles lorsque l’objet d’étude est un comportement individuel au sein d’un groupe. Pour illustrer
leurs propos, les auteures donnent l’exemple de travaux antérieurs où leur équipe cherchait à
vérifier si le sujet de conversation avait un effet sur les usages phonétiques intra-individuels et si cet
effet était systématique parmi les individus du groupe. Nos propres objectifs de recherche
présentent des similitudes évidentes avec cet exemple, aussi nous conserverons comme matériau
d’analyse les données acoustiques brutes récoltées.

Comme nous y avons fait allusion ci-avant, le respect des postulats statistiques de base que sont
l’indépendance des variables explicatives, l’homogénéité de la variance et la distribution normale
des résidus a été vérifié, et ce, à l’aide d’histogrammes, de diagrammes de dispersion et de tests
statistiques tel celui de Shapiro-Wilk. Pour chaque analyse effectuée, en cas de non-respect du
postulat de distribution normale des résidus, nous avons procédé à l’élimination d’occurrences
problématiques. Parfois, l’exclusion d’une ou de quelques moyennes individuelles a suffi à ce que
les résidus suivent la loi normale, d’autres fois, laisser de côté un contexte entier ou toutes les
occurrences produites par un locuteur a été nécessaire (voir les tableaux de l’Annexe 9, qui font état
des exclusions opérées). Ce n’est qu’après cette étape franchie que les effets significatifs ont été
notés et le cas échéant, les comparaisons multiples appropriées effectuées. Enfin, la structure de
covariance CS (compound symetry) était spécifiée par défaut, mais nous avons vérifié que la valeur
du critère d’information d’Akaike (AIC) ne se trouvait pas réduite par l’utilisation d’une autre
structure.

164
5.6.2 Analyses statistiques sur les indices INTÉGRATION et ÉMERGENCE
Comme mentionné précédemment, les indices INTÉGRATION et ÉMERGENCE ont un statut hybride,
c’est-à-dire qu’ils peuvent aussi bien être envisagés comme des variables dépendantes
qu’indépendantes : dépendantes puisqu’il s’agit de comportements mesurables de l’individu et
indépendantes si nous souhaitons les mettre en relation avec les indices acoustiques relevés. Dans
un premier temps, nous les avons traités comme variables dépendantes et avons effectué des
analyses similaires à celles décrites dans la section précédente. Les variables indépendantes incluses
dans le modèle étaient la MOBILITÉ, le SEXE et le TEMPS, l’individu a été traité comme effet
aléatoire et le TEMPS, comme mesure répétée. Précisons que la VOYELLE et le CONTEXTE ont été
exclus du modèle puisque l’INTÉGRATION et l’ÉMERGENCE ne sont pas des indices de nature
acoustique et que leur valeur demeure la même pour toutes les voyelles produites dans tous les
contextes. Une analyse par variable dépendante a été effectuée et le seuil de signification statistique
adopté est de α = 0,05.

Par la suite, le lien entre la valeur des indices acoustiques et celle des indices ÉMERGENCE et
INTÉGRATION a été exploré au moyen de régressions linéaires à mesures répétées (procédure
MIXED). Les variables dépendantes correspondaient dans ce cas à la valeur moyenne, par individu
et par temps d’enquête, des sept indices acoustiques à l’étude. Comme précédemment, l’individu a
été inclus comme facteur aléatoire et le TEMPS, comme mesure répétée. Une première série de sept
régressions incluait comme variables indépendantes le TEMPS et l’indice INTÉGRATION, ce qui
revenait à tester l’effet de ce dernier indice sur la valeur moyenne estimée de chacun des indices
acoustiques, quel que soit le TEMPS d’enquête. Une seconde série de sept régressions construites sur
le même modèle permettaient cette fois de tester l’effet de l’indice ÉMERGENCE sur la valeur
estimée des indices acoustiques, peu importe le TEMPS. Pour ces dernières analyses, le seuil de
signification adopté est de α = 0,05.

5.7 Synthèse générale


Pour cette étude, 33 locuteurs natifs du français québécois, âgés de 18 à 22 ans et qui entreprenaient
en septembre 2016 un baccalauréat à l’Université Laval, ont été recrutés. Parmi eux, 15 avaient
toujours vécu dans la ville de Québec (sédentaires) et 18 étaient originaires d’ailleurs dans la
province mais s’étaient installés à Québec pour leurs études (mobiles). À l’automne 2016 (T1) et à
l’automne 2017 (T2), ces 33 participants ont été enregistrés lors de tâches de lecture en chambre
anéchoïque, au cours desquelles ils ont produit à trois reprises 76 mots distincts comportant, en
position accentuée, l’une des 12 voyelles orales /i y u e ø o ɛ ɛː œ ɔ a ɑ/ dans l’un des 8 contextes
(V#), (VN), (Vl), (Vptk), (Vbdɡ), (Vfsʃ), (Vvzʒ) et (Vʁ). Ils ont également rempli des

165
questionnaires permettant de mesurer des indices d’INTÉGRATION sociale, d’appartenance à la phase
d’ÉMERGENCE de l’âge adulte et pour les mobiles, de FIDÉLITÉ à leurs origines. Des analyses
statiques ont permis de vérifier de quelle manière les indices acoustiques récoltés au sein des
voyelles produites variaient en fonction des facteurs MOBILITÉ, SEXE, TEMPS et CONTEXTE, ainsi
que des indices chiffrés INTÉGRATION et ÉMERGENCE.

166
Chapitre 6 : Résultats
6.1 Résultats acoustiques
6.1.1 Survol général
6.1.2 Facteur TEMPS
6.1.2.1 Effets du TEMPS sur F1, F2 et F3
6.1.2.2 Effets du TEMPS sur la dynamique de F1, de F2 et de F3
6.1.2.3 Interactions impliquant le TEMPS
6.1.3 Facteur MOBILITÉ
6.1.4 Facteur SEXE
6.2 Indices INTÉGRATION et ÉMERGENCE
6.3 Retour sur les objectifs

Ce chapitre, consacré à la présentation et à l’analyse des résultats obtenus, s’organise en trois


grandes sections. Dans un premier temps, le volet acoustique de nos résultats sera exposé (section
6.1). Nous offrirons d’abord un aperçu général des caractéristiques acoustiques des occurrences
analysées (6.1.1). Nous traiterons ensuite des effets du facteur TEMPS sur les productions des
participants (6.1.2), puis de ceux du facteur MOBILITÉ (6.1.3), et finalement de ceux du facteur
SEXE (6.1.4). Seule une présentation sommaire des résultats statistiques est proposée dans ce
chapitre afin de ne pas alourdir outre mesure le texte, mais des résultats plus détaillés peuvent être
consultés en Annexe 10. Pour cette même raison, les effets du facteur CONTEXTE (qui comporte,
rappelons-le, 8 modalités) ne sont pas abordés explicitement, mais un tableau récapitulatif de ses
effets significatifs sur les indices acoustiques analysés est reproduit en Annexe 11, de même que des
représentations visuelles de ses interactions avec les autres facteurs en Annexe 12. Dans la seconde
partie du chapitre (6.2), nous présenterons les résultats relatifs aux indices INTÉGRATION et
ÉMERGENCE, évalués à l’aide de questionnaires. La dernière section (6.3) vise à faire le point sur les
trois objectifs de recherche formulés au Chapitre 4.

6.1 Résultats acoustiques


Dans cette section consacrée à l’analyse des résultats acoustiques de notre étude, la sous-section
6.1.1 dresse un portrait général des voyelles contenues dans notre corpus. Une fois ces bases jetées,
les résultats seront analysés de plus près en tenant compte de l’influence des facteurs TEMPS,
MOBILITÉ et SEXE. Au début de chacune des sous-sections 6.1.2, 6.1.3 et 6.1.4, un tableau
récapitulatif des effets significatifs du facteur concerné sur les indices acoustiques pris en compte
dans l’analyse sera présenté. Différentes représentations visuelles seront ensuite proposées, d’abord
celles faisant état des effets simples, puis celles impliquant des interactions entre facteurs, excepté
les interactions qui concernent le CONTEXTE, pour lesquelles des représentations visuelles sont
disponibles en Annexe 12. Comme précisé en Méthodologie (5.6.1), à des fins statistiques, les
indices acoustiques prélevés dans les trois répétitions des différentes combinaisons voyelle-contexte

167
produites par un locuteur lors d’une expérimentation ont été moyennés (par exemple, le F1 des trois
[ɑptk] produits au T1 par un locuteur donné). Il s’agit également de l’unité à laquelle nous ferons
référence sous l’appellation d’occurrence, et qui a été utilisée pour les graphiques de dispersion et
le calcul des statistiques descriptives. Rappelons que pour l’ensemble de la section 6.1, le seuil de
signification des effets et interactions principaux a été fixé à α = 0,001, et celui des comparaisons
multiples, à α = 0,05.

6.1.1 Survol général


Les 33 participants de notre étude ont été amenés à produire les voyelles /i y u e ø o ɛ ɛː œ ɔ a ɑ/
dans un ou plusieurs des contextes (V#), (Vptk), (Vbdɡ), (Vfsʃ), (Vvzʒ), (Vʁ), (Vl) et (VN), pour un
total de 76 combinaisons voyelle-contexte différentes. Sept indices acoustiques ont été mesurés ou
calculés à partir d’autres indices, soit la fréquence de F1, de F2 et de F3, la dynamique de F1, de F2 et
de F3, et la durée.

La Figure 7 présente la distribution des occurrences dans les espaces acoustiques F1/F2 et F2/F3 des
femmes (haut) et des hommes (bas). Les diagrammes biformantiques F1/F2, qui offrent une
correspondance visuelle bien connue avec le trapèze vocalique de l’API55, montrent que les
catégories vocaliques à l’étude occupent grosso modo le positionnement relatif attendu, bien que
quelques particularités méritent d’être soulignées. Chez les femmes, l’ellipse englobant les
occurrences de /e/ se superpose presque entièrement à celle des [i]56, la mi-fermée /e/ se présentant
ainsi comme particulièrement tendue. Chez les deux sexes, on observe également sur l’axe F1 la
suite [i]-/e/-[ɪ], alors qu’au sein du trapèze vocalique de l’API, /ɪ/ est positionné à mi-chemin entre
/i/ et /e/ en termes d’aperture. Pour ce qui est de la voyelle /ɛː/, réputée longue et diphtonguée, la
valeur de ses deux premiers formants à 50 % de la durée la situe entre /ɛ/ et /a/ dans les diagrammes
F1/F2, rappelant la position de /æ/ dans le trapèze de l’API. Les occurrences de la voyelle mi-fermée
antérieure arrondie /ø/ occupent une vaste plage sur l’axe F1, mais ce qui attire surtout l’attention est
leur valeur de F2 particulièrement basse, qui positionne l’ellipse en plein centre du trapèze. En ce
qui concerne les voyelles postérieures, les [ʊ] et les /o/ semblent davantage se distinguer sur l’axe
de l’antéropostériorité que de l’aperture. Comparativement aux /o/ et aux /ɑ/ adjacents, les /ɔ/
semblent animés d’une tendance à la centralisation (ou à l’antériorisation). Leur F2 s’approche de
celui de /œ/ et s’éloigne de la périphérie de l’espace acoustique. La centralisation des /ɔ/ et leur

55
La plus récente version : https://www.internationalphoneticassociation.org/content/full-ipa-chart
56
Les variantes tendues et relâchées des voyelles fermées /i y u/ ont été traitées séparément, mais nous ne
postulons pas qu’il s’agit de phonèmes distincts (5.4.2). Elles sont donc présentées entre crochets,
contrairement aux autres catégories, placées entre barres obliques. Dans ce cas, les crochets ne signifient pas
qu’il s’agit de transcriptions phonétiques fines.

168
chevauchement partiel avec les /ɑ/ laissent une plage fréquentielle vacante entre /o/ et /ɑ/
particulièrement évidente chez les hommes.

Figure 7 : Diagrammes F1/F2 et F2/F3 présentant la dispersion des occurrences produites par les femmes
(haut, n=23) et les hommes (bas, n=10), TEMPS et MOBILITÉ confondus. Les ellipses regroupent 75 %
des occurrences d’une catégorie

Les diagrammes F2/F3, certes moins conviviaux, permettent néanmoins de constater que les voyelles
antérieures non arrondies [i], [ɪ], /e/ et /ɛ/ possèdent les F2 et F3 les plus élevés. Chez les locutrices,
les catégories [i] et /e/ se différencient de manière plus évidente sur l’axe F 3 qu’elles ne le faisaient
sur F1 et F2. Toutes les paires de voyelles qui se distinguent par le trait d’arrondissement, soit
[i]-[y], [ɪ]-[ʏ], /e/-/ø/ et /ɛ/-/œ/, affichent une différence visible par rapport à la valeur de F3, celle
entre /ɛ/ et /œ/ étant cependant plus ténue chez les hommes. Si la fréquence du F3 de [y] (et dans
une certaine mesure, de [ʏ]), voyelle reconnue pour ses F2 et F3 focalisés (Schwartz et coll., 1993),
est sans surprise peu élevée, elle s’avère particulièrement basse pour /ø/. Il n’est pas impossible que

169
cette tendance soit liée au phénomène de rhotacisation de /ø/ noté par Mielke (2013), dont les
principales conséquences acoustiques sont une chute de F3 et une focalisation de F2-F3. La faible
valeur de cet indice pourrait donc expliquer celle également surprenamment basse de F2 dont nous
avons préalablement fait mention.

Au-delà de ces représentations statiques, des mesures dynamiques des trois premiers formants ont
également été récoltées. Rappelons que la modélisation de la dynamique formantique adoptée
consiste à soustraire à la valeur à 75 % d’un formant sa valeur à 25 %. Un résultat positif traduit une
augmentation de la valeur de l’indice en cours d’émission de la voyelle et une valeur négative, une
diminution. La Figure 8 illustre la dynamique moyenne des deux premiers formants des voyelles
analysées et la Figure 9, celle de F2 et de F3. Ces deux graphiques57 se présentent comme des plans
cartésiens comportant quatre quadrants (Q1 à Q4).

Figure 8 : Plan cartésien présentant la dynamique moyenne du F 1 et du


F2 des occurrences produites par l’ensemble des participants (n=33)

En ce qui concerne la Figure 8, on constate que Q1 et Q2 sont inoccupés, ce qui signifie qu’en
moyenne, le premier formant d’aucune de ces voyelles n’augmente en cours d’émission. Toutes
tendraient donc à se fermer. Précisons cependant que les indices acoustiques ont été moyennés sans
considération pour le contexte consonantique de droite. Ainsi, il n’est pas exclu que certains
induisent le mouvement contraire, ce qui vaut également pour la dynamique de F2 et de F3. Cela dit,
les variantes relâchées [ɪ], [ʏ] et [ʊ] présentent la diminution la plus faible (-7, -2 et -6 Hz
57
Ces graphiques présentent des valeurs moyennes, car tenter de projeter chacune des occurrences comme
pour la Figure 7 les rendait illisibles.

170
respectivement). La diminution moyenne du F1 de la majorité des voyelles se situe donc entre 0 et
-100 Hz, celle de /ɛː/ étant toutefois nettement plus importante, avec une valeur moyenne de -200 Hz.

Quant à la dynamique de F2, elle peut aussi bien être positive que négative, les Q3 et Q4 étant tous
deux occupés. Son amplitude est similaire à celle de F1 pour la plupart des voyelles, soit d’environ
±10 à ±120 Hz. /ɛː/ se distingue à nouveau, avec une augmentation moyenne en cours d’émission de
415 Hz. Les relâchées [ɪ], [ʏ] et [ʊ], dont la diminution de F1 était quasi-nulle, possèdent une
dynamique de F2 plus importante : avec une variation moyenne de respectivement -100, -66 Hz et
139 Hz, ces variantes se centralisent en cours d’émission. Les voyelles /ø/, /o/ et /ɛː/ affichent pour
leur part la dynamique la plus importante sur F1 et sur F2 simultanément, rendant probable que leur
timbre soit diphtongué. La dynamique opposée des deux premiers formants de [u], soit une chute de
F1 et une hausse de F2, suggère leur « défocalisation » en cours d’émission. Il ne ressort pas de
tendance systématique quant au mouvement de F2 par rapport au degré d’antéro-postériorité des
voyelles. Néanmoins, en excluant [y] et /ɛː/, on constate que pour un degré d’aperture donné, les
voyelles antérieures et postérieures présentent une dynamique de F2 opposée : négative pour [i], [ɪ]
et [ʏ], positive pour [u] et [ʊ]; positive pour /e/ et /ø/, négative pour /o/; négative pour /ɛ/ et /œ/,
positive pour /ɔ/; positive pour /a/, négative pour /ɑ/. Les voyelles fermées et mi-ouvertes
afficheraient ainsi un mouvement d’attraction et les voyelles mi-fermées et ouvertes, de répulsion.

Figure 9 : Plan cartésien présentant la dynamique moyenne du F2 et du


F3 des occurrences produites par l’ensemble des participants (n=33)

La Figure 9 reprend en abscisse la dynamique moyenne de F2. En ordonnée, on constate que la


dynamique moyenne de F3 peut être positive ou négative, celle de /ɔ/, de /ø/ et de [ʊ] étant par

171
ailleurs quasi-nulle (1,5, 1 et -3 Hz respectivement). En règle générale, l’amplitude de la dynamique
de F3 semble plus réduite que celle des deux premiers formants, les valeurs moyennes les plus
importantes étant de 97 Hz pour [y] et de 71 Hz pour [ʏ]. Similairement à ce qui était observé pour
les deux premiers formants de la voyelle focale [u], la dynamique combinée des deuxième et
troisième formants de [y] suggère leur défocalisation en cours d’émission. En effet, le F 2 et le F3 de
cette voyelle augmentent en cours d’émission, mais la hausse de F3 est plus importante que celle de
F2 (97 Hz comparativement à 38 Hz). La voyelle /ɛː/, qui se distinguait par une importante
dynamique de F1 (-200 Hz) et de F2 (415 Hz), présente sur F3 une augmentation plus modeste de
68 Hz.

Figure 10 : Diagrammes boîtes à moustaches de la durée des


occurrences produites par l’ensemble des participants (n=33). Les
valeurs éloignées sont incluses dans les moustaches

La Figure 10 rend compte de la durée des occurrences produites par les participants, tous contextes
consonantiques de droite confondus. Sans surprise, la voyelle /ɛː/ possède la durée moyenne la plus
longue (0,221 s), suivie de /ɑ/, /o/ et /ø/. Rappelons que /ɛː/, /o/ et /ø/ sont également les voyelles
dont la dynamique de F1 et de F2 est la plus importante (voir Figure 8). Quant à la dispersion des
données, celles qui s’éloignent de l’étendue interquartile tendent à présenter une durée importante
plutôt que faible, les moustaches supérieures étant sensiblement plus longues que les moustaches
inférieures. Comparativement aux autres, les boîtes correspondant aux catégories [i], [y] et [u]
paraissent étendues. Notre distinction entre variantes tendues et relâchées étant fondée sur le timbre,
les catégories [i], [y] et [u] sont composées d’occurrences produites dans des contextes appelant des
durées très différentes : en syllabe ouverte, (V#), et devant consonne allongeante, (Vvzʒ). La

172
voyelle /e/, qui présente la distribution la plus concentrée et la moyenne la plus basse (0,119 s), a
été produite dans un seul contexte, soit (V#).

Les descriptions proposées dans cette section se voulaient un compte-rendu global des principales
caractéristiques acoustiques des voyelles produites par les participants. Jusqu’ici, nous n’avons tenu
compte d’aucun des facteurs influençant potentiellement la valeur des indices acoustiques relevés, à
l’exception du SEXE, pris en considération lors de la projection des occurrences dans des espaces
F1/F2 et F2/F3 (Figure 7). Connaissant désormais le portrait acoustique général des données
récoltées, nous investiguerons à présent de quelle manière les indices varient en fonction des
facteurs TEMPS, MOBILITÉ et SEXE.

6.1.2 Facteur TEMPS


L’analyse du facteur TEMPS vise à mettre au jour la stabilité et l’instabilité des productions des
locuteurs du T1 au T2. Précisons qu’un effet significatif de ce facteur signale que les productions
des participants ont changé au cours du temps. Dans le Tableau 5 comme dans les suivants, une
case vide signale l’absence d’effet significatif du facteur à l’étude, isolé ou en interaction. Les cases
remplies mais non subdivisées indiquent que le facteur est significatif seulement en isolation (par

Tableau 5 : Différences significatives entre le T1 et le T2 par voyelle et indice acoustique. Les nombres
correspondent aux différences entre les moyennes estimées par le modèle. Une valeur positive traduit une
augmentation de la valeur estimée des formants, de la durée ou de l’ampleur de la trajectoire formantique
au cours du temps. Les interactions sont signalées par un astérisque suivi du ou des facteurs en interaction
avec le TEMPS
Dynamique Dynamique Dynamique
F1 (Hz) F2 (Hz) F3 (Hz) Durée (s)
F1 (Hz) F2 (Hz) F3 (Hz)
[i]
[ɪ] 15 - 32
*sexe
[y]
19
[ʏ] 19 31 - 39
[u] 20
*sexe*mobilité
[ʊ] *contexte - 76
29
/e/
/ø/ 25 - 51
*sexe*mobilité
/o/ - 21 - 55
30
/ɛ/ 11 - 29 - 22 - 58
/ɛː/ - 28 36 - 69 *mobilité
/œ/ 13 - 21 36 - 51
/ɔ/ 11 - 25 - 67
/a/ 43 - 64
/ɑ/ *sexe - 58 - 29

173
exemple, l’effet du TEMPS sur le F1 de [ɪ] dans le Tableau 5), ou strictement en interaction (dans le
même tableau, l’interaction TEMPS*CONTEXTE sur la dynamique du F1 de [ʊ]). Une case subdivisée
indique que le facteur est impliqué dans une interaction significative, mais que pris en isolation, son
effet est également significatif. Par exemple, le TEMPS et l’interaction TEMPS*SEXE sont
significatifs en ce qui a trait au F1 de [y]. Le Tableau 5 montre que toutes les voyelles autres que [i]
et /e/ ont vu au moins un de leurs paramètres significativement modifiés au cours du temps.

6.1.2.1 Effets du TEMPS sur F1, F2 et F3


En ce qui concerne le F1 des voyelles à l’étude, les effets significatifs du facteur TEMPS sur leur
valeur sont illustrés à la Figure 11. Dans cette figure comme dans les suivantes, les voyelles pour
lesquelles le facteur concerné est également impliqué dans une interaction significative sont
identifiées par les pointillés. Ici, le F1 de [y], de [ʊ] et de /o/ varie significativement en fonction du
facteur TEMPS, mais également en fonction d’une interaction TEMPS*SEXE pour [y] et d’une triple
interaction TEMPS*SEXE*MOBILITÉ pour [ʊ] et /o/.

Figure 11 : Valeur moyenne estimée du F1 des voyelles


[ɪ y ʏ u ʊ] /ø o ɛ œ ɔ/, en fonction du facteur TEMPS

La Figure 11 et le Tableau 5 montrent que les changements affectant significativement F1 au cours


du temps sont de faible magnitude, son augmentation n’étant par exemple que de 11 Hz pour /ɛ/ et
/ɔ/. Néanmoins, les changements significatifs se traduisent systématiquement par une augmentation
de la valeur de F1 au cours du temps. Les voyelles [i], /e/ et /ɛː/ présentent également une tendance à
l’augmentation (14 Hz, 25 Hz et 8 Hz respectivement), quoique non significative. Les voyelles
ouvertes /a/ et /ɑ/ tendent pour leur part à diminuer (-7 Hz et -10 Hz respectivement) de manière
non significative.

174
Figure 12 : Valeur moyenne estimée du F2 des voyelles
[ʏ] /ɛː œ a/, en fonction du facteur TEMPS

La Figure 12 représente les changements significatifs affectant F2 au cours du temps. À l’instar de


ce qui se dégage pour F1, les différences significatives se traduisent toutes par une augmentation
relativement modeste de la valeur de l’indice entre le T1 et le T2. Parmi les voyelles dont le F 2 ne
change pas de manière significative au cours du temps, [i], [u], /e/ et /o/ présentent une tendance à
la diminution, et [ɪ], [y], [ʊ], /ø/, /ɛ/, /ɔ/ et /ɑ/, une tendance à l’augmentation.

Figure 13 : Valeur moyenne estimée du F3 des voyelles


[ɪ ʏ ʊ] /ø o ɛ ɛː œ ɔ a ɑ/, en fonction du facteur TEMPS

Pour ce qui est de F3, 11 voyelles changent de manière significative au cours du temps. Tous les
changements se traduisent par une diminution de la valeur de l’indice, tel qu’illustré à la Figure 13.

175
Le F3 des voyelles [i], [y], [u] et /e/, pour lesquelles le changement n’est pas significatif, connaît une
diminution respective de 42, 42, 46 et 40 Hz, en cohérence avec les autres voyelles.

Figure 14 : Diagrammes F1/F2 (haut) et F2/F3 (bas) des voyelles produites au


T1 (cercles) et au T2 (triangles). Toutes les différences entre les valeurs
estimées, significatives ou non, sont représentées

Pour résumer les tendances observées par rapport à F1, F2 et F3, au moins un de ces indices a subi un
changement significatif au cours du temps pour 13 des 15 voyelles à l’étude. Les modifications

176
significatives affectant un indice acoustique donné sont systématiques : augmentation de F1 et de F2
et diminution de F3. La Figure 14, qui permet de visualiser les différences entre les voyelles
produites au T1 et au T2 au sein d’espaces biformantiques F1/F2 et F2/F3, montre qu’une
compression de l’espace vocalique tend à prendre place sur l’axe F1. Les voyelles qui se situent
dans la partie supérieure du premier graphique de la Figure 14 sont celles qui contribuent le plus au
mouvement de compression. Sur l’axe F2, la plupart des voyelles laissent également entrevoir une
réduction de l’espace vocalique, par exemple [i], [y], [ʏ], [ʊ], /e/, /ø/, /ɔ/ et /ɑ/. La trajectoire
empruntée par d’autres va à l’encontre de ce modèle, en particulier [u] et /o/. Les voyelles affichent
par ailleurs un mouvement généralisé d’élévation sur l’axe F3 (c’est-à-dire une diminution de la
valeur de l’indice), qui ne reflète à première vue ni une réduction, ni une extension de l’espace
vocalique.

6.1.2.2 Effets du TEMPS sur la dynamique de F1, de F2 et de F3


La Figure 15 fait état des changements significatifs s’étant produits entre le T1 et le T2 par rapport à
la dynamique du F1 des voyelles à l’étude. On y constate que la dynamique du F1 des voyelles /o/,
/ɛ/, /ɛː/, /œ/ et /ɔ/ est toujours négative, au T1 comme au T2. Autrement dit, la valeur du F 1 de ces
voyelles tend à diminuer en cours d’émission, c’est-à-dire qu’elles exhibent une trajectoire
fermante, ce que nous remarquions également en visualisant la Figure 8. La dynamique de /ɛː/
apparaît particulièrement importante, ce qui s’avère cohérent en regard du fait que cette voyelle se
présente fréquemment comme une diphtongue fermante (Leblanc, 2012 : 70). Cela étant dit, quelle

Figure 15 : Valeur moyenne estimée de la dynamique du F1 des voyelles


/o ɛ ɛː œ ɔ/, en fonction du facteur TEMPS. Une valeur négative traduit
une diminution de l’indice en cours d’émission. Plus la valeur est proche
de 0, moins le mouvement formantique est important

177
que soit l’ampleur de la dynamique du F1 des voyelles, elle tend à se réduire au cours du temps. La
diminution des fréquences formantiques en cours d’émission est effectivement moins importante au
T2 qu’au T1, ce qui signifie que les voyelles se ferment encore, mais de manière moins marquée. Il
est intéressant de constater que l’ouverture généralisée des voyelles au cours du temps
(augmentation de F1 statique) n’est pas compensée par une fermeture plus importante en cours
d’émission.

Que les voyelles à l’étude présentent des changements spectraux plus réduits suggère une
dynamique articulatoire moindre au T2, une hypothèse appuyée par la compression de l’espace
vocalique décrite ci-avant prenant place sur l’axe F1 et, dans une certaine mesure, sur l’axe F2. Les
changements significatifs affectant la dynamique de F2 et de F3 au cours du temps, représentés à la
Figure 16 et à la Figure 17, sont en nombre plus limité, mais appuient eux aussi cette hypothèse.

Figure 16 : Valeur moyenne estimée de la dynamique du F2 de /ɛ/, en


fonction du facteur TEMPS. Une valeur négative traduit une diminution
de l’indice en cours d’émission. Plus la valeur est proche de 0, moins le
mouvement formantique est important

Comme en témoigne la Figure 16, seule la dynamique du F2 de la voyelle /ɛ/ change du T1 au T2.
Aux deux temps d’enquête, la valeur de l’indice est négative, ce qui signifie qu’elle diminue en
cours d’émission, la voyelle tendant à se postérioriser. À l’instar de ce qui a pu être observé par
rapport à la dynamique de F1, la dynamique de F2 est moins importante au T2, suggérant une
réduction du mouvement articulatoire. De manière similaire, la Figure 17 montre que la seule
voyelle dont la dynamique de F3 est significativement influencée par le facteur TEMPS présente une
réduction de dynamique spectrale. En effet, le F3 de /ɑ/ augmente en cours d’émission aux deux

178
temps d’enquête, mais de manière presque nulle au T2 (4 Hz), une différence significative avec
l’augmentation de 33 Hz mesurée au T1. Comme pour F1, il semble que les changements observés
au cours du temps pour F2 et F3 ne soient pas compensés par une modification de la dynamique.

Figure 17 : Valeur moyenne estimée de la dynamique du F3 de /ɑ/, en


fonction du facteur TEMPS. Une valeur positive traduit une
augmentation de l’indice en cours d’émission. Plus la valeur est proche
de 0, moins le mouvement formantique est important

Hors interaction, aucun changement significatif au cours du temps n’est observé pour la durée.

6.1.2.3 Interactions impliquant le TEMPS


Le facteur TEMPS est impliqué dans quelques interactions significatives, dont deux sont des
interactions TEMPS*SEXE. Celle affectant le F1 de [y], représentée à la Figure 18, montre que les
productions féminines et masculines sont statistiquement distinctes aux deux temps d’enquête, les
fréquences formantiques des occurrences produites par les femmes étant plus élevées. Le F 1 des [y]
produits par les locutrices tend toutefois à augmenter de manière significative au cours du temps
(42 Hz), alors que celui des [y] produits par les hommes diminue de manière non significative
(4 Hz). Hors interaction, aussi bien l’effet du TEMPS que celui du SEXE sont significatifs (voir la
Figure 11 et la Figure 26).

L’interaction TEMPS*SEXE affectant le F2 de /ɑ/, illustrée à la Figure 19, offre un portrait similaire.
Au T1 comme au T2, les productions vocaliques des femmes possèdent des fréquences
formantiques significativement plus élevées que celles des hommes. À nouveau, l’interaction
provient du fait que le changement affectant le F2 de /ɑ/ au cours du temps est inverse chez les deux
sexes et d’ampleur différente : augmentation significative de la valeur de l’indice chez les femmes

179
(43 Hz) et diminution non significative chez les hommes (20 Hz). L’effet isolé du facteur TEMPS
n’est pas significatif, mais celui du facteur SEXE l’est, tel que rapporté à la Figure 27.

Figure 18 : Valeur moyenne estimée du F1 de [y], en fonction


des facteurs TEMPS et SEXE

Figure 19 : Valeur moyenne estimée du F2 de /ɑ/, en fonction


des facteurs TEMPS et SEXE

Le facteur TEMPS est également impliqué dans une interaction significative TEMPS*MOBILITÉ
affectant la durée de /ɛː/, comme l’illustre la Figure 20. Chez les mobiles comme chez les
sédentaires, l’indice varie de manière réduite au cours du temps, à raison d’une augmentation non
significative de 0,005 s chez les mobiles et d’une diminution significative de 0,011 s chez les

180
sédentaires. Les productions des deux groupes deviennent ainsi plus similaires au cours du temps :
au T2, la différence entre les mobiles et les sédentaires n’est pas significative, alors qu’elle l’était
tout juste au T1 (t(31) = -2,64, p = 0,044). Aucun des deux facteurs n’est significatif hors
interaction.

Figure 20 : Valeur moyenne estimée de la durée de /ɛː/ au T1 et


au T2, en fonction du facteur MOBILITÉ

Les Figure 21 et Figure 22 illustrent quant à elles la triple interaction entre les facteurs MOBILITÉ,
TEMPS et SEXE affectant le F1 de [ʊ] et le F1 de /o/. D’abord, concernant la Figure 21, à un temps
d’enquête donné, les femmes mobiles et sédentaires ne se distinguent pas entre elles, ni d’ailleurs

Figure 21 : Valeur moyenne estimée du F1 de [ʊ] au T1 et au


T2, en fonction des facteurs MOBILITÉ et SEXE

181
les hommes entre eux. Aux deux temps d’enquête, les fréquences formantiques féminines
demeurent significativement plus élevées que les fréquences masculines. Le F1 des [ʊ] produits par
les quatre groupes de locuteurs augmente au cours du temps, seule l’augmentation observée chez les
hommes sédentaires (13 Hz, en jaune) n’étant pas significative. Celle des hommes mobiles est en
revanche si importante (42 Hz, en vert) que la valeur estimée du F1 de leurs [ʊ] est supérieure à
celle des hommes sédentaires au T2, alors qu’elle lui était inférieure au T1. Hors interaction, l’effet
des facteurs SEXE (Figure 26) et TEMPS (Figure 11) est significatif, mais non celui de la MOBILITÉ.

À la Figure 22, on constate qu’aussi bien les femmes que les hommes et les mobiles que les
sédentaires présentent une augmentation de la valeur du F1 de /o/ au cours du temps. Seule celle des
hommes sédentaires (15 Hz, en jaune) se révèle non significative, identiquement à ce qui était
observé pour le F1 de [ʊ]. Au T1 comme au T2, les productions des deux groupes d’hommes ne se
distinguent pas entre elles, ni celles des deux groupes de femmes. Cependant, l’importante
augmentation au cours du temps du F1 des femmes sédentaires (51 Hz, en rouge) fait en sorte
qu’elles se différencient significativement des deux groupes d’hommes au T2, alors qu’elles ne se
différenciaient que des hommes mobiles au T1. Les femmes mobiles (en noir) demeurent quant à
elles distinctes des deux groupes d’hommes au T1 comme au T2. Hors interaction, les facteurs
TEMPS (Figure 11) et SEXE (Figure 26) sont significatifs, mais non le facteur MOBILITÉ.

Figure 22 : Valeur moyenne estimée du F1 de /o/ au T1 et au


T2, en fonction des facteurs MOBILITÉ et SEXE

Pour résumer ce qui se dégage de la section 6.1.2, de nombreux changements se sont produits au
cours du temps chez les participants de notre étude. Les modifications en nombre suffisant pour que

182
se dessine un portrait cohérent affectent essentiellement les trois premiers formants et la dynamique
de F1. On assiste notamment à une réduction de l’espace vocalique au cours du temps, possiblement
liée à des mouvements articulatoires moindres, affectant principalement la valeur de F1 à 50 % de la
durée et sa dynamique, mais également, dans une moindre mesure, F2. La dynamique de F2 et de F3
ne change que pour une voyelle chacune, mais dans les deux cas, sous forme de réduction de la
dynamique. Quant à F3, les voyelles affichent une tendance généralisée à la diminution de l’indice
au cours du temps, incluant celles pour lesquelles la diminution n’est pas significative. Les
interactions présentent moins de régularité, mais celles modulant le F1 de [y], de [ʊ] et de /o/
(Figure 18, Figure 21 et Figure 22) laissent entrevoir que les locutrices changent davantage au cours
du temps. Les hommes sédentaires apparaissent les plus stables, du moins en ce qui concerne le F1
de [ʊ] et de /o/.

6.1.3 Facteur MOBILITÉ


Le second facteur dont l’effet sur les indices acoustiques a été testé est la MOBILITÉ. Le Tableau 6
fait état des indices acoustiques pour lesquels les participants mobiles et sédentaires sont
statistiquement distincts. En observant ce tableau, il apparaît que contrairement au TEMPS, la
MOBILITÉ est rarement un facteur d’influence : hors interactions, son effet n’est significatif que sur
la dynamique du F2 de [ʏ] et de /œ/ et sur la durée de [i].

Tableau 6 : Différences significatives entre les mobiles et les sédentaires par voyelle et indice
acoustique. Les nombres correspondent aux différences entre les moyennes estimées par le modèle. Un
nombre positif signifie que la valeur estimée du formant, de la durée ou de l’ampleur de la dynamique
formantique est plus importante chez les mobiles. Les interactions sont signalées par un astérisque suivi
du ou des facteurs en interaction avec la MOBILITÉ
Dynamique Dynamique Dynamique
F1 (Hz) F2 (Hz) F3 (Hz) Durée (s)
F1 (Hz) F2 (Hz) F3 (Hz)
[i] - 0,025
[ɪ]
[y]
[ʏ] 43
[u]
[ʊ] *sexe*temps
/e/
/ø/ *contexte
/o/ *sexe*temps
/ɛ/
/ɛː/ *temps
/œ/ 47 *contexte
/ɔ/
/a/ *contexte *contexte
/ɑ/

183
La Figure 23 permet de visualiser de quelle manière se concrétisent les différences significatives sur
la dynamique du F2 de [ʏ] et de /œ/. Chez les mobiles comme chez les sédentaires, le F2 des deux
voyelles affiche une trajectoire négative, c’est-à-dire une tendance à la postériorisation en cours
d’émission. L’indice diminue toutefois de manière plus importante chez les mobiles, et ce, pour les
deux voyelles : -87 Hz pour [ʏ] et -53 Hz pour /œ/, comparativement à -43 Hz et -6 Hz chez les
sédentaires. En somme, les mobiles présentent une tendance supérieure à la postériorisation de ces
deux voyelles en cours d’émission, la trajectoire estimée du F2 des occurrences produites par les
sédentaires étant plus réduite.

Figure 23 : Valeur moyenne estimée de la dynamique du F2 de [ʏ] /œ/, en


fonction du facteur MOBILITÉ. Une valeur négative traduit une
diminution de l’indice en cours d’émission. Plus la valeur est proche
de 0, moins le mouvement formantique est important

L’effet significatif de la MOBILITÉ sur la durée de [i] est illustré à la Figure 24. On y observe que
les participants sédentaires produisent des voyelles dont la durée est significativement plus longue
(0,168 s) que les mobiles (0,143 s). Le caractère unique de cet effet et l’absence de relation évidente
avec ceux affectant la dynamique du F2 de [ʏ] et de /œ/ rendent toutefois difficile d’en tirer quelque
conclusion.

En ce qui concerne les interactions, celle entre la MOBILITÉ et le TEMPS affectant la durée de /ɛː/ et
celles entre la MOBILITÉ, le TEMPS et le SEXE modulant le F1 de [ʊ] et de /o/ ont été abordées dans
la section précédente (voir en particulier les Figure 20, Figure 21 et Figure 22). Les autres
interactions impliquent plutôt le contexte consonantique de droite (voir le point 2 de l’Annexe 12).
Dans aucune de ces situations le facteur MOBILITÉ en lui-même n’a d’effet significatif.

184
Figure 24 : Valeur moyenne estimée de la durée de [i], en
fonction du facteur MOBILITÉ

Que les participants mobiles et sédentaires ne se distinguent à peu près jamais n’implique pas
nécessairement que leurs productions soient en tous points similaires. Les locuteurs mobiles, en
particulier, proviennent de neuf régions administratives, alors que les sédentaires sont tous
originaires de Québec. Dans la mesure où cette hétérogénéité géographique des locuteurs mobiles
pourrait être reflétée par une hétérogénéité des productions, il convient de s’interroger sur la
dispersion des données récoltées auprès des deux groupes. Dans cette perspective, la Figure 25
présente les écarts-types calculés à partir de la valeur des deux premiers formants des occurrences
produites par les participants, séparés par MOBILITÉ et par SEXE. Le choix de présenter séparément
les productions féminines et masculines est motivé par le fait que les données n’ont pas été
normalisées. Les graphiques de la Figure 25 sont présentés à titre indicatif seulement, dans le but
d’illustrer notre propos, aussi ceux des autres indices acoustiques analysés sont reproduits en
Annexe 8, de même qu’un tableau relatant l’ensemble des moyennes et écarts-types (Annexe 7).

Les écarts-types correspondant aux occurrences produites par les femmes suggèrent une plus grande
dispersion des données chez les mobiles. À la Figure 25, par exemple, l’écart-type des femmes
mobiles est plus élevé que celui des femmes sédentaires pour 13 des 15 catégories vocaliques à
l’étude sur F1 et pour 12 d’entre elles sur F258. Chez les hommes, la tendance s’inverse et paraît plus
nuancée. L’écart-type des hommes mobiles est plus élevé que celui des hommes sédentaires pour le
F1 de 7 voyelles et le F2 de 6 voyelles. Avant d’en tirer quelque conclusion, on ne saurait toutefois

58
Si nous ne rapportons cette tendance que pour F1 et F2, elle ne s’y limite pas. Elle apparaît récurrente parmi
les indices acoustiques analysés, au même titre que celle rapportée pour les hommes.

185
ignorer le nombre de participants appartenant à chaque groupe. Chez les deux sexes, le groupe qui
présente les écarts-types les plus élevés est également celui qui comporte le plus grand nombre de
participants : 15 femmes mobiles par rapport à 8 femmes sédentaires; 7 hommes sédentaires par
rapport à 3 hommes mobiles. En raison de cet important déséquilibre d’effectifs, il nous semble
délicat de pousser plus avant notre analyse de la dispersion des données et de statuer sur ses causes.

Figure 25 : Comparaison entre les écarts-types de F1 et de F2 chez les femmes (haut) et les hommes
(bas) en fonction du facteur MOBILITÉ, T1 et T2 confondus

En résumé, les productions des participants varient très peu en fonction du facteur MOBILITÉ. Hors
interactions, ce facteur n’est significatif que sur la dynamique du F2 de [ʏ] et de /œ/ et sur la durée
de [i], des effets trop isolés pour que se dessine de tendance robuste. L’observation de la dispersion
des données ne permet pas davantage de faire ressortir d’éventuels patrons de production
différenciés en fonction du facteur MOBILITÉ, et ce, en raison d’une limite de notre échantillon,
c’est-à-dire le nombre très inégal d’hommes et de femmes mobiles et sédentaires.

186
6.1.4 Facteur SEXE
Le Tableau 7 constitue un sommaire des différences significatives en fonction du facteur SEXE et de
ses interactions avec d’autres facteurs. Rappelons brièvement que puisque les fréquences
formantiques n’ont pas été normalisées, des différences d’origine physiologique entre les
occurrences produites par les locuteurs et les locutrices sont attendues. De plus, les participants ont
été classés d’après ce qui nous semblait être leur sexe biologique, ainsi ce que nous pouvons inférer
de cette section se limite à cette classification binaire, sans considération pour la question du genre.
Le Tableau 7 montre que la fréquence des trois premiers formants est bel et bien influencée par les
différences d’origine physiologique entre les hommes et les femmes. Les quatre indices acoustiques
dont la valeur n’est pas directement tributaire des dimensions du conduit vocal, soit la durée et la
dynamique des trois premiers formants, sont quant à eux rarement modulés par le SEXE hors
interactions : seule la valeur de la dynamique du F1 de [i] et de [y] est significativement influencée
par ce facteur.

Tableau 7 : Différences significatives entre les hommes et les femmes par voyelle et indice acoustique.
Les signes + indiquent que la valeur moyenne estimée du formant, de la durée ou de l’ampleur de la
dynamique formantique est significativement plus élevée chez les femmes. Les interactions sont
signalées par un astérisque suivi du ou des facteurs en interaction avec le SEXE
Dynamique Dynamique Dynamique Durée
F1 (Hz) F2 (Hz) F3 (Hz)
F1 (Hz) F2 (Hz) F3 (Hz) (s)
[i] + + + +
[ɪ] + + +
*temps
[y]
+ + + +
[ʏ] + + +
[u] +
*mobilité*temps *contexte
[ʊ]
+ +
*contexte +
/e/ + + +
/ø/ + + +
*mobilité*temps
/o/
+ +
/ɛ/ + + +
*contexte
/ɛː/ + + +
*contexte
/œ/ + +
+
*contexte
/ɔ/ + + + *contexte

/a/ + + +
*temps
/ɑ/ + + +

187
Comme en témoignent le Tableau 7 et la Figure 26, la fréquence du premier formant de 14 des 15
voyelles à l’étude est plus élevée chez les femmes que chez les hommes. La seule voyelle pour
laquelle l’effet n’atteint pas le seuil de la signification est [u] (F(1, 29) = 9,70, p = 0,0041), mais la
tendance demeure la même : la valeur estimée des fréquences formantiques féminines est plus
élevée que celle des fréquences masculines. Il est à noter que les valeurs estimées de [ɪ] et de [ʏ]
sont très semblables et que leurs symboles respectifs sont presque entièrement superposés dans la
Figure 26. En ce qui concerne le F1 de [y], de [ʊ], de /o/ et de /œ/, le SEXE est à la fois impliqué
dans des interactions et significatif lorsque considéré en isolation (pour visualiser ces interactions,
voir les Figure 18, Figure 21 et Figure 22 et le point 3 de l’Annexe 12).

Figure 26 : Valeur moyenne estimée du F1 des voyelles


[i ɪ y ʏ ʊ] /e ø o ɛ ɛː œ ɔ a ɑ/, en fonction du facteur SEXE

Pour ce qui est des différences sur F2, illustrées à la Figure 27, le portrait est identique : les
fréquences formantiques féminines sont plus élevées chez les femmes que chez les hommes. Les
deux voyelles dont le F2 n’est pas significativement modulé par l’effet du SEXE, soit [u]
(F(1, 29) = 2,32, p = 0,1383) et /o/ (F(1, 29) = 8,27, p = 0,0075), affichent néanmoins la même
tendance. Le deuxième formant de [ʊ], de /ɔ/ et de /ɑ/ est influencé par des interactions doubles
(voir la Figure 19 et le point 3 de l’Annexe 12) et par le facteur SEXE isolé.

L’effet du SEXE sur le troisième formant, reproduit à la Figure 28, est également systématique. La
valeur estimée des fréquences formantiques féminines s’avère significativement plus élevée pour
les 15 catégories vocaliques à l’étude. Le F3 de /ɛː/ est à la fois conditionné par une interaction
SEXE*CONTEXTE (voir le point 3 de l’Annexe 12) et par le facteur SEXE en lui-même.

188
Figure 27 : Valeur moyenne estimée du F2 des voyelles
[i ɪ y ʏ ʊ] /e ø ɛ ɛː œ ɔ a ɑ/, en fonction du facteur SEXE

Figure 28 : Valeur moyenne estimée du F3 des voyelles


[i ɪ y ʏ u ʊ] /e ø o ɛ ɛː œ ɔ a ɑ/, en fonction du facteur SEXE

La Figure 29 consiste en un récapitulatif des différences entre les fréquences formantiques statiques
des occurrences produites par les hommes et les femmes. Les seules différences non significatives
contenues dans ces diagrammes biformantiques concernent, rappelons-le, le F1 et le F2 de [u] et le
F2 de /o/. La proximité du coin supérieur droit des trapèzes vocaliques féminin et masculin est
d’ailleurs évidente dans le diagramme F1/F2. En plus de ne pas occuper les mêmes plages
fréquentielles, l’espace vocalique féminin est en outre plus vaste, une tendance récurrente dans la
littérature (Simpson, 2009). Le positionnement relatif des voyelles dans les espaces acoustiques
féminins et masculins est très similaire, à l’exception possible du /e/. Chez les femmes, /e/ occupe

189
une position plus extrême que [i] sur l’axe F2, tandis que sur l’axe F1, les deux voyelles sont plus
rapprochées que chez les hommes, une observation qui émergeait d’ailleurs des diagrammes de
dispersion présentés en début de chapitre (Figure 7).

Figure 29 : Diagrammes F1/F2 (gauche) et F2/F3 (droite) représentant la moyenne estimée des
occurrences produites par les hommes (n=10) et les femmes (n=23), TEMPS et MOBILITÉ confondus

Le Tableau 7 révélait deux effets supplémentaires du SEXE sur des indices autres que les trois
premiers formants. La Figure 30 montre que la dynamique du F1 de [i] et de [y] est négative chez
les locuteurs des deux sexes, c’est-à-dire que les voyelles se ferment en cours d’émission, un

Figure 30 : Valeur moyenne estimée de la dynamique du F1 des voyelles


[i y], en fonction du facteur SEXE. Une valeur négative traduit une
diminution de l’indice en cours d’émission. Plus la valeur est proche
de 0, moins le mouvement formantique est important

190
phénomène discuté antérieurement (Figure 8). La diminution de l’indice est cependant
significativement plus faible chez les hommes. La dynamique fermante des [i] et des [y] produits
par les hommes est donc plus réduite que celle des [i] et des [y] produits par les femmes.

Que la valeur estimée de la trajectoire formantique des catégories vocaliques à l’étude soit si
sporadiquement modulée par le facteur SEXE ne va pas sans nous surprendre. En soustrayant la
fréquence à 25 % de la durée d’un formant à celle à 75 %, nous pensions conserver les différences
d’origine physiologique entre les productions féminines et masculines. Plus précisément, nous
présumions que la trajectoire de fréquences formantiques plus élevées (celles des femmes) serait
plus importante que celle de fréquences plus basses, pour lesquelles il y a moins « place » à
variation, en raison notamment de l’impact perceptif plus décisif d’un écart donné en basses
fréquences. C’est d’ailleurs ce que nous observons pour la dynamique du F1 de [i] et de [y], mais cet
effet du SEXE est si ponctuel qu’il ne peut solidement appuyer notre hypothèse initiale.

Les différences mises en évidence dans cette section sont cohérentes avec ce qui est attendu de
données non normalisées. La fréquence des trois premiers formants des occurrences produites par
les femmes est plus élevée et s’étend sur une plage plus large. Dès lors qu’une métrique autre que
les valeurs brutes en hertz est utilisée, les différences en fonction du SEXE se raréfient En effet,
seulement deux effets significatifs du SEXE hors interaction ressortent des analyses statistiques sur
la dynamique du premier formant, et aucune de celles sur la durée et la dynamique de F 2 et de F3.
Nous en déduisons que les écarts observés en fonction du facteur SEXE sont essentiellement
attribuables aux différences physiologiques entre les hommes et les femmes, et si nos données
varient en fonction du genre des participants, la classification binaire adoptée, fondée sur le sexe
biologique, n’est pas nécessairement apte à en rendre compte.

6.2 Indices INTÉGRATION et ÉMERGENCE


Les indices INTÉGRATION et ÉMERGENCE se distinguent des précédents en ce qu’ils ne sont pas de
nature acoustique, mais ont plutôt été mesurés en quantifiant les réponses à des questionnaires
administrés aux participants. Rappelons brièvement que l’indice INTÉGRATION a été évalué à l’aide
de questions et d’un codage des réponses de notre cru. Des thèmes tels que la diversification des
contacts sociaux et l’intensité des contacts avec le milieu d’origine ont servi à construire l’indice.
Comme quelques questions variaient du T1 au T2 et entre les mobiles et les sédentaires, la valeur de
l’indice a été ramenée sur 3 pour tous les participants, aux deux temps d’enquête. L’ ÉMERGENCE
correspond quant à elle au degré d’appartenance des participants à la phase d’émergence de l’âge
adulte. L’indice a été mesuré au moyen d’un outil pré-établi, le questionnaire IDEA-8 (Baggio et

191
coll., 2015), qui consiste en huit questions dont les réponses sont codées de 1 à 4. Le score maximal
au questionnaire IDEA-8 est ainsi de 32 et le score minimal, de 8. Puisque nous avons soustrait aux
résultats obtenus par les participants 1 point pour chacune des étapes d’entrée dans l’âge adulte
franchies autres que l’âge et le fait d’être encore aux études (constantes), le score minimal théorique
pour l’indice ÉMERGENCE est de 5. Dans un premier temps, nous traiterons les indices INTÉGRATION
et ÉMERGENCE comme des variables dépendantes, et dans un deuxième temps, ils seront envisagés
dans leur relation avec les indices acoustiques. Le seuil de signification statistique adopté pour
l’ensemble de la section 6.2 est de α = 0,05.

Figure 31 : Scores à l’indice INTÉGRATION au T1 (haut) et au T2


(bas). Les moyennes estimées correspondent aux lignes verticales
pleines et les intervalles de confiance, aux lignes pointillées

192
Les scores à l’indice INTÉGRATION, tous locuteurs et temps d’enquête confondus, vont de 0,33 à
2,50 (x = 1,49 s = 0,53). Les hommes et les femmes ne se distinguent pas entre eux (F(1, 29) = 0,18,
p = 0,675). En observant la Figure 31, on constate toutefois que les participants mobiles et
sédentaires semblent se répartir différemment sur la plage couverte par l’ensemble des scores. Au
T1, les mobiles se concentrent davantage dans la partie supérieure de l’échelle et les sédentaires,
dans la partie inférieure. Le score d’INTÉGRATION moyen des mobiles est de fait plus élevé (1,48)
que celui des sédentaires (1,24). Au T2, l’écart entre les moyennes estimées s’amenuise (1,53 et
1,61) et les deux groupes de participants se répartissent plus uniformément sur l’échelle. Ces
différences en fonction de la MOBILITÉ ne sont toutefois pas significatives (F(1, 29) = 0,70,
p = 0,410). D’autre part, la Figure 31 suggère une plus grande occupation de la partie supérieure de
l’échelle au T2. Les résultats de l’analyse statistique indiquent que cette augmentation du score
d’INTÉGRATION au cours du temps est, elle, significative (F(1, 29) = 5,64, p = 0,024). Il est possible
que la légère différence entre les participants sédentaires et mobiles au T1 provienne du fait que ces
derniers ont été poussés à entamer plus tôt leur intégration au milieu universitaire que les
sédentaires, c’est-à-dire dès leurs premières semaines dans la ville de Québec et à l’Université
Laval. Les sédentaires semblent avoir emboîté le pas aux mobiles pendant l’année et chez les deux
groupes de participants, l’intégration au milieu universitaire est plus forte en deuxième année de
baccalauréat qu’en première.

Pour ce qui est de l’indice ÉMERGENCE, la Figure 32 montre que les résultats des participants se
rapprochent beaucoup plus du score théorique maximal de 32 que du score minimal de 5, suggérant
qu’ils se situent bel et bien dans la phase d’émergence de l’âge adulte. Le score moyen estimé des
mobiles est légèrement plus élevé au T1 (25,43) qu’au T2 (24,46), alors que les sédentaires
affichent la trajectoire opposée (24,87 au T1 et 25,15 au T2). Tous participants confondus, le score
moyen diminue faiblement du T1 (25,15) au T2 (24,81). Les résultats de l’analyse statistique
indiquent que l’indice ÉMERGENCE ne varie significativement ni en fonction de la MOBILITÉ
(F(1, 29) = 0,01 p = 0,932), ni en fonction du TEMPS (F(1, 29) = 0,50 p = 0,484), ni en fonction du
SEXE (F(1, 29) = 0,62 p = 0,436). En d’autres termes, si les participants peuvent être identifiés
comme adultes émergents, ils ne le sont ni plus ni moins au début de leur baccalauréat qu’un an
plus tard, et le fait d’être une femme ou un homme, ou encore d’avoir déménagé pour entreprendre
des études ou au contraire d’être resté dans sa ville natale pour ce faire, ne semblent pas être des
facteurs favorisant ou inhibant l’appartenance à cette catégorie socio-psychologique proposée par
Arnett (2000).

193
Figure 32 : Scores à l’indice ÉMERGENCE au T1 (haut) et au T2 (bas).
Les moyennes estimées correspondent aux lignes verticales pleines et
les intervalles de confiance, aux lignes pointillées

La relation entre les scores d’INTÉGRATION et d’ÉMERGENCE et les sept indices acoustiques pris en
compte dans cette étude a été explorée au moyen de régressions linéaires à mesures répétées, dont
les résultats sont présentés dans le Tableau 8. Les deux colonnes intitulées estimé correspondent à la
variation prédite de l’indice acoustique lorsque les indices INTÉGRATION (gauche) et ÉMERGENCE
(droite) augmentent de 1. Par exemple, lorsque le score d’INTÉGRATION augmente de 1, F1
augmente de 6,804 Hz, et lorsque l’indice ÉMERGENCE augmente de 1, F1 diminue de 0,079 Hz.
Précisons que le score d’INTÉGRATION varie sur une plage plus restreinte que le score
d’ÉMERGENCE, c’est-à-dire que le premier couvre un empan de 2,18 points (0,33 à 2,50) et le
second, de 10 points (20 à 29). Il est donc logique qu’une différence de 1 à l’indice INTÉGRATION

194
entraîne une variation estimée de l’indice acoustique plus élevée qu’une différence de 1 à l’indice
ÉMERGENCE, significativité mise à part.

Tableau 8 : Résultats de régressions linéaires à mesures répétées rendant compte de la relation


entre les indices acoustiques et les indices INTÉGRATION et ÉMERGENCE. L’estimé correspond à la
variation prédite de l’indice acoustique lorsque la valeur de l’INTÉGRATION (gauche) ou de
l’ÉMERGENCE (droite) augmente de 1
INTÉGRATION ÉMERGENCE
estimé err. std d.d.l. valeur t valeur p estimé err. std d.d.l. valeur t valeur p
F1 6,804 8,67 664 0,78 0,4328 -0,079 1,70 1819 -0,05 0,9632
F2 2,375 27,48 654 0,09 0,9311 -1,155 5,40 1795 -0,21 0,8307
F3 38,998 14,29 4530 2,73 0,0064 -0,366 2,68 4897 -0,14 0,8912
F1 dynamique 3,700 3,54 73 1,04 0,2999 -0,591 0,82 149 -0,72 0,474
F2 dynamique 6,399 5,64 45,9 1,13 0,2624 0,513 1,42 67,6 0,36 0,719
F3 dynamique -1,388 5,68 119 -0,24 0,8074 -0,787 1,23 288 -0,64 0,5232
durée -0,0003 0,0031 1004 -0,09 0,9278 0,0005 0,0006 2492 0,87 0,3848

Le Tableau 8 montre que sur les 14 régressions effectuées, la seule qui génère un résultat
significatif est celle croisant l’INTÉGRATION et F3. La première colonne estimé du Tableau 4 indique
que lorsque l’INTÉGRATION augmente de 1, F3 augmente d’environ 39 Hz. En d’autres termes, plus
l’indice d’INTÉGRATION des locuteurs est élevé, plus leur F3 l’est également. Cette relation est
illustrée à la Figure 33.

Figure 33 : Droites de régression résultant de l’analyse sur les indices INTÉGRATION et F3. Une équation
ajustée est présentée par temps d’enquête, puisque le modèle prédit des coordonnées à l’origine
différentes au T1 et au T2

195
Les équations ajustées reproduites montrent que la valeur de F3 peut être prédite en tenant compte
de la valeur de l’estimé (pente) et d’une ordonnée à l’origine (intercept). Dans ce cas précis, le
modèle prédit que la coordonnée à l’origine est moins élevée au T2 (2626,4 Hz) qu’elle ne l’est au
T1 (2626,4 + 72,84 Hz). Autrement dit, aux deux temps d’enquête, F3 augmente de 39 Hz lorsque
l’INTÉGRATION augmente de 1, mais les valeurs de F3 sont moins élevées au T2, ce qui ressortait
d’ailleurs des résultats présentés à la section 6.1.2.1 (Figure 13 et Figure 14).

En résumé, le score d’INTÉGRATION, censé traduire le degré de diversification des contacts sociaux
des nouveaux étudiants et leur appartenance au milieu universitaire, a significativement augmenté
au cours du temps. Les hommes et les femmes, ainsi que les mobiles et les sédentaires, présentent à
ce chapitre un comportement similaire. Leurs scores d’ÉMERGENCE, un indice évaluant dans quelle
mesure les participants peuvent être étiquetés adultes émergents, suggèrent qu’ils pourraient
effectivement traverser cette phase. Les scores demeurent toutefois similaires au T1 et au T2, chez
les mobiles et les sédentaires, et chez les hommes et les femmes. Quant au lien entre les deux scores
et les indices acoustiques, une relation significative existe entre l’ INTÉGRATION et F3 : plus la valeur
estimée de l’un est élevée, plus celle de l’autre l’est également, indépendamment du TEMPS
d’enquête.

6.3 Retour sur les objectifs


Trois objectifs principaux ont été formulés dans le cadre de cette contribution (Chapitre 4). La
présente section vise à faire le point sur ce que nos résultats indiquent par rapport à ces objectifs de
recherche. Le premier et principal était d’étudier l’éventuelle acquisition d’un R2 chez des migrants
interrégionaux québécois. En d’autres termes, au moyen d’une analyse acoustique de voyelles
produites à un an d’intervalle par de jeunes universitaires géographiquement mobiles, nous
cherchions à vérifier si le fait d’avoir déménagé avait induit des changements phonétiques. Nos
résultats confirment que certaines caractéristiques acoustiques des voyelles se sont modifiées au
cours du temps. En particulier, la fréquence de F1 et de F2 a eu tendance à augmenter, celle de F3 à
diminuer, et la dynamique de F1 à se réduire. Ces modifications sont de faible magnitude, mais elles
semblent néanmoins robustes puisqu’elles affectent plusieurs des catégories vocaliques à l’étude.
D’autres modifications, plus ponctuelles, confirment dans le meilleur des cas ce qui peut être
observé sur d’autres paramètres, par exemple la réduction de la dynamique de F2 et de F3, mais leur
singularité freine les tentatives de généralisation. En nous fondant sur un rétrécissement apparent de
l’espace acoustique des participants et sur une dynamique formantique de moindre amplitude, nous
avons émis l’hypothèse d’une réduction des mouvements articulatoires au cours du temps.

196
Les changements ont toutefois été observés chez tous les participants, indistinctement de leur
mobilité géographique. S’ils avaient été le fait des mobiles, ils se seraient traduits, statistiquement,
par des interactions TEMPS*MOBILITÉ. En effet, de telles interactions auraient indiqué que la
relation entre les productions des mobiles et des sédentaires évoluait différemment d’un TEMPS
d’enquête à l’autre. Les productions des sédentaires auraient pu, par exemple, demeurer fixes au
cours du temps et celles des mobiles, changer. Or, il ressort des analyses acoustiques que les seuls
indices acoustiques dont la valeur soit influencée par la combinaison de ces facteurs sont le F 1 de
[ʊ] et de /o/ (interactions triples TEMPS*MOBILITÉ*SEXE, Figure 21 et Figure 22) et la durée de /ɛː/
(interaction double TEMPS*MOBILITÉ, Figure 20). Dans les deux premiers cas, le F1 des voyelles
produites par les deux groupes de locuteurs évolue de manière similaire : il augmente au cours du
temps, seulement dans des proportions différentes. En ce qui concerne la durée de /ɛː/, celle des
voyelles produites par les mobiles augmente au cours du temps et celle des sédentaires diminue,
rendant leur valeur plus similaire au T2. La magnitude du changement est cependant faible et il
n’est corroboré par aucun autre du même genre. En somme, il semble que nous ayons été en mesure
de capter une forme de changement phonétique, mais non l’acquisition d’un R2 par des migrants
interrégionaux. Différentes explications, exposées plus en détails dans la Discussion (Chapitre 7),
peuvent être avancées pour justifier ce phénomène : temps de résidence réduit, changements
affectant d’autres dimensions que celles investiguées, locuteurs mobiles traités statistiquement
comme un groupe linguistique au même titre que les sédentaires, etc.

Le second objectif de cette recherche était de mettre à l’épreuve l’hypothèse selon laquelle les
jeunes universitaires québécois traversant la phase socio-psychologique d’émergence de l’âge
adulte étaient sujets à modifier leurs usages phonétiques. Pour cette partie de l’étude, les locuteurs
sédentaires étaient sous la loupe en soi et constituaient moins un groupe contrôle dont les usages
étaient présumés fixes. D’abord, l’évaluation de l’appartenance des témoins à la phase d’émergence
de l’âge adulte a été effectuée en quantifiant les réponses au questionnaire IDEA-8 et le
franchissement d’étapes d’entrée dans l’âge adulte. En traitant ensuite l’indice ÉMERGENCE
résultant comme une variable dépendante, nous avons constaté qu’il ne variait significativement ni
en fonction de la MOBILITÉ, ni en fonction du SEXE, ni en fonction du TEMPS. Il est important de
souligner que l’un des objectifs des questionnaires IDEA et IDEA-8 est de faire ressortir des
différences individuelles entre sujets préalablement identifiés comme adultes émergents, dans le but
éventuel d’expliquer des comportements différenciés. Les scores d’ÉMERGENCE relativement élevés
suggèrent donc que nos participants traversent cette phase, mais l’absence de différences
statistiquement significatives indique que les résultats individuels au score d’ÉMERGENCE ne sont

197
pas explicables par la stratification de notre échantillon : la mobilité géographique et le sexe
biologique n’expliquent pas l’appartenance plus ou moins forte des participants à la phase
d’émergence de l’âge adulte, non plus que le fait d’être en première ou en deuxième années de
baccalauréat. Il n’est pas exclu que d’autres variables non considérées dans cette étude soient de
meilleurs indicateurs, par exemple le milieu socio-économique familial.

Il est également apparu que la valeur de l’indice ÉMERGENCE ne permettait pas de prédire celle des
indices acoustiques. Autrement dit, il n’existe pas de lien systématique entre leur valeur respective,
une augmentation d’une part ne permettant pas de prédire une augmentation ou une diminution
d’autre part. Ce résultat indique que les différences individuelles au score d’ ÉMERGENCE ne sont
pas corrélées aux différences individuelles en production. Nous ne pouvons toutefois ni exclure, ni
confirmer que le fait de traverser la phase d’émergence de l’âge adulte induise des changements
phonétiques. Pour y voir plus clair, il serait essentiel de pouvoir comparer les productions de nos
participants avec celles de locuteurs dont le score d’ÉMERGENCE serait significativement différent.
Nos résultats suggèrent néanmoins que la période post-adolescence n’en est pas nécessairement une
de stabilisation (Chambers, 2009 : 190), du moins sur le plan acoustique.

Le troisième objectif de cette recherche était d’évaluer l’influence des facteurs externes que sont
l’intégration sociale et la fidélité à ses origines sur l’éventuelle acquisition d’un R2 par les jeunes
migrants interrégionaux québécois, ainsi que celle de l’intégration sociale sur les usages
phonétiques des jeunes universitaires sédentaires. D’abord, en ce qui concerne l’INTÉGRATION,
élément commun aux deux groupes de locuteurs, un indice sur 3 a été calculé en quantifiant les
réponses à une série de questions variant quelque peu entre les mobiles et les sédentaires et entre le
T1 et le T2. En utilisant cet indice comme variable dépendante, nous avons observé que sa valeur
estimée augmentait significativement au cours du temps. En regard de la technique de codage des
réponses utilisée (voir le Tableau 4), cette augmentation signifie que les participants étaient
davantage intégrés au T2. Cette plus grande INTÉGRATION peut se traduire par un changement ou
une diversification du cercle social fréquenté et des activités non académiques, ou encore par des
perspectives d’avenir tant personnelles que professionnelles plus cosmopolites. Chez les mobiles,
une faible fréquence des contacts avec le milieu d’origine pendant l’année écoulée entre les deux
enquêtes peut également être en cause. Le score d’INTÉGRATION des participants, en revanche, n’est
pas explicable par leur MOBILITÉ ou leur SEXE.

Le degré d’intégration sociale d’un témoin permet de prédire la valeur moyenne du F3 de ses
voyelles. Plus son score d’INTÉGRATION est élevé, plus la valeur estimée de son F3 l’est également.

198
Il existe donc un lien entre les usages phonétiques d’un locuteur et son degré d’ INTÉGRATION; ce
dernier, de même que les indices acoustiques, changent au cours du temps; mais on ne peut pas
présumer que le degré d’INTÉGRATION soit lié aux changements phonétiques. En effet, la valeur du
F3 de toutes les catégories vocaliques tend à diminuer au cours du temps, alors qu’en parallèle,
l’INTÉGRATION augmente et qu’une valeur élevée de cet indice est associée à un F3 élevé. L’indice
INTÉGRATION tel que nous l’avons mesuré n’est donc pas lié aux changements phonétiques
observés chez les participants, mais apparemment à certains aspects de leurs usages,
indépendamment du TEMPS d’enquête. Nous ne pouvons toutefois ni exclure que des dimensions de
l’intégration sociale non couvertes dans nos questionnaires puissent mieux expliquer les
changements et usages phonétiques de nos témoins, ni avancer que le poids relatif accordé à ceux
pris en compte soit parfaitement approprié, ce dont nous rediscuterons au Chapitre 7.

Initialement, la FIDÉLITÉ se voulait un indice mesuré au moyen de questions exclusivement


destinées aux participants mobiles et réparties entre le T1 et le T2. Le fondement de sa prise en
compte était que le souci de demeurer fidèle à ses origines pouvait freiner l’acquisition d’un R2.
Des différences individuelles à l’indice FIDÉLITÉ avaient ainsi le potentiel d’expliquer des
différences individuelles en production. Cependant, il est rapidement apparu que le format des
questions posées et des réponses fournies ne permettrait pas d’en tirer un indice chiffré et que son
exploitation serait qualitative.

Des 18 participants mobiles, 11 ont manifesté une conscience de la variation dès le T1, soit parce
qu’ils avaient perçu des différences chez les locuteurs de Québec, soit parce que le campus leur
paraissait un environnement linguistiquement diversifié, soit parce qu’on leur avait fait remarquer
qu’ils avaient un « accent ». Au T2, ils étaient 17 à avoir perçu des différences ou à être conscients
d’avoir modifié leur « façon de parler ». Seulement deux témoins ont fourni des réponses indiquant
clairement la présence d’attitudes susceptibles de freiner le changement. Chez l’une, la résistance
provenait visiblement d’elle-même, comme en témoigne le commentaire « J’essaie de ne pas
changer ma prononciation ». Le second participant avait conscience d’avoir modifié ses usages; les
gens de sa région d’origine aussi, mais ils ne semblaient pas voir la chose d’un bon œil : « ils
prennent pour acquis [sic] que c’est la ville qui m’a changé ». À l’inverse, une participante a
rapporté que ses parents étaient « fiers » des changements perçus dans sa façon de parler. Il s’agit
des trois seules réponses qui nous informent réellement sur ce que nous cherchions à évaluer grâce à
l’indice FIDÉLITÉ.

199
En somme, la quasi-totalité des participants mobiles (17/18) ont soit modifié leur façon de parler,
soit pris conscience de différences entre leurs usages linguistiques et ceux des locuteurs fréquentés
depuis leur arrivée à Québec, soit les deux. Seulement deux locuteurs vivent une sorte de pression
pour demeurer fidèles à leurs origines, c’est-à-dire une raison de freiner délibérément le
changement, parmi lesquels un est conscient d’avoir changé malgré tout. Ces remarques demeurent
qualitatives, mais sachant désormais que les productions des participants sédentaires ont elles aussi
subi des modifications du T1 au T2, il appert que leur poser certaines des questions destinées aux
mobiles aurait pu être instructif. En particulier, on peut s’interroger sur leur conscience de la
variation linguistique dans le milieu universitaire et sur leur perception d’éventuels changements
apportés à leur prononciation, toutes deux répandues parmi les locuteurs mobiles.

200
Chapitre 7 : Discussion
7.1 Résumé de l’étude
7.2 Les changements au cours du temps
7.3 Les effets de la MOBILITÉ
7.4 INTÉGRATION, ÉMERGENCE et FIDÉLITÉ
7.5 Français québécois, phonétique et corpus : perspectives

Nous commencerons ce chapitre de discussion par un résumé de l’étude effectuée. Dans les sections
suivantes, nous avancerons quelques hypothèses qui pourraient expliquer les changements
phonétiques mesurés au cours du temps (7.2), ainsi que les tendances qui se dégagent de la
comparaison des voyelles produites par les participants mobiles et sédentaires (7.3). Nous
proposerons ensuite une discussion critique sur les facteurs et indices externes considérés (7.4).
Dans la dernière section, il sera question de résultats complémentaires qui ressortent de notre
analyse et de quelques possibilités offertes par l’exploitation de notre corpus.

7.1 Résumé de l’étude


Le principal objet d’étude de cette contribution est l’acquisition d’un second régiolecte (R2).
Inauguré selon plusieurs par les travaux de Payne (1980) sur l’acquisition de l’anglais philadelphien
par des enfants exposés à d’autres systèmes phonologiques, ce champ de recherche tarde néanmoins
à se tailler une place. Même chez les chercheurs se consacrant à la variation, le locuteur de choix
demeure stable : stable dans son lieu de résidence et sa position sociale, stable dans les usages
auxquels il est exposé, stable jusque dans ce qu’il a de variable. Le déploiement progressif, au XXIe
siècle, de la recherche sur l’acquisition d’un R2 fait du phonétisme de ces individus de plus en plus
nombreux à adapter leurs usages à un milieu de vie changeant un objet d’étude à part entière.

Il se dégage de la revue des écrits présentée au Chapitre 2 que l’acquisition d’un R2 est caractérisée
par l’hétérogénéité. Chez l’enfant comme chez l’adulte, le processus est effectivement influencé par
une multitude de facteurs. Certains d’entre eux sont de nature linguistique. Par exemple, le niveau
phonétique est marqué par des changements plus tardifs et moins catégoriques que le niveau lexical.
La régularité et la simplicité du conditionnement des variantes du R2 rendent leur acquisition plus
probable que des règles d’apparition plus opaques. D’autres facteurs influents sont plutôt externes.
Le degré d’intégration sociale au nouveau milieu de vie, le prestige relatif des régiolectes à l’étude,
le souci de fidélité à ses origines, le temps passé dans le nouveau lieu de résidence et ce que l’âge
de l’apprenant entraîne comme position dans la structure sociale sont tous des éléments susceptibles
de conditionner le degré d’acquisition d’un R2. Pour ajouter à la complexité du processus, la
relation qu’entretiennent les mécanismes de perception et de production de la parole pendant

201
l’acquisition n’en est pas une de simultanéité ou de simple cause à effet. Il s’agit là d’un épineux
problème dans une perspective plus large, au même titre, par exemple, que celui de circonscrire la
notion de saillance. On pressent son importance, mais encore faudrait-il la définir.

Le fait de déménager implique que les interactions quotidiennes d’un individu changent
minimalement, aussi les modifications phonétiques observables chez les locuteurs mobiles sont
vraisemblablement la conséquence de leur utilisation de la langue avec de nouveaux interlocuteurs.
Les conséquences phonétiques d’interactions avec des interlocuteurs ont été envisagées, tour à tour,
selon différents angles théoriques. Dans le cadre de la théorie de l’accommodation (Giles, 1973;
Giles et coll., 1991), le locuteur ajuste ses productions lors de chaque interaction, l’acquisition d’un
R2 résultant d’une accumulation d’actes d’accommodation à court terme, plus spécifiquement
d’actes de convergence (Trudgill, 1986). La théorie H&H (Lindblom, 1990) propose que le locuteur
ajuste constamment sa parole sur un continuum allant de formes hypoarticulées à hyperarticulées; le
changement phonétique proviendrait de l’évaluation positive de nouvelles formes par les auditeurs
(Lindblom et coll., 1995). La convergence phonétique lors d’une interaction peut également être
vue comme un automatisme (Pickering et Garrod, 2004), au même titre que l’imitation de la
gestuelle ou de l’expression faciale (Chartrand et Bargh, 1999). Dans ce cas, les motivations et les
mécanismes de la convergence sont identiques (Coles-Harris, 2017). Au contraire, dans les modèles
à exemplaires (Johnson, 1997; Pierrehumbert, 2006), le fait qu’à chaque forme phonétique
mémorisée soit jointe de l’information extra-linguistique implique que la sélection de formes lors
d’une interaction soit au moins minimalement modulée par les caractéristiques extra-linguistiques
qui leur sont associées (Coles-Harris, 2017). Puisque des exemplaires fréquents, récents et
contextuellement pertinents sont susceptibles d’être sélectionnés pour la production, le locuteur
reproduit éventuellement les formes du R2 en usage dans son nouveau milieu.

Au terme de notre revue des écrits sur l’acquisition d’un R2, il est apparu que les locuteurs
francophones étaient encore largement sous-représentés dans ce champ de recherche en pleine
expansion. En conséquence, nous nous sommes proposé de mener une première étude sur
l’acquisition d’un R2 en FQ. Au-delà de cet objectif général, nous nous sommes intéressée de plus
près à la population estudiantine, particulièrement mobile sur le plan géographique certes, mais
également en pleine transition entre la fin de l’adolescence et une vie rythmée par le travail,
l’autonomie financière, la vie de couple et la parentalité, nommée émergence de l’âge adulte
(Arnett, 2000, 2004). Nous avons tâché de vérifier si cette strate de la population québécoise
caractérisée par une mobilité plurielle changeait ses usages phonétiques au cours du temps. Nous
inspirant de la littérature, nous avons également voulu tester l’effet de l’intégration sociale sur les

202
usages des participants et, chez ceux qui étaient géographiquement mobiles, du souci de fidélité à
leurs origines.

Trente-trois locuteurs natifs du français québécois, âgés de 18 à 22 ans, ont été recrutés parmi les
nouveaux inscrits à l’Université Laval en septembre 2016 (T1). Dix-huit d’entre deux (15 femmes
et 3 hommes) s’étaient tout juste installés dans la ville de Québec afin d’entreprendre leurs études et
avaient préalablement vécu dans une autre région de la province. Les 15 autres (8 femmes et
7 hommes) étaient originaires de Québec ou de Lévis et y vivaient toujours. Ils ont effectué une
série de tâches de lecture en chambre anéchoïque au cours desquelles ont été produits 76 mots
différents contenant en position accentuée une voyelle orale. Ce protocole a été répliqué auprès des
33 mêmes participants en septembre 2017 (T2), soit un an après le début de leurs études
universitaires. Les voyelles récoltées ont fait l’objet d’analyses acoustiques, puis statistiques. Les
réponses des participants à des questionnaires distribués aux deux temps d’enquête ont également
permis de construire des indices chiffrés reflétant leur degré d’intégration au milieu universitaire et
l’intensité vécue de la phase d’émergence de l’âge adulte, ainsi qu’un indice qualitatif évaluant le
souci des participants mobiles de demeurer fidèles à leurs origines.

Les résultats indiquent que les usages phonétiques des participants ont connu des changements au
cours de leur première année universitaire. Le premier formant des voyelles [ɪ y ʏ u ʊ] /ø o ɛ œ ɔ/ a
augmenté de manière significative du T1 au T2, à raison de 11 à 30 Hz. La fréquence du deuxième
formant de [ʏ] /ɛː œ a/ a également augmenté de 31 à 43 Hz. F3 a subi une baisse significative de 32
à 76 Hz pour les voyelles [ɪ ʏ ʊ] /ø o ɛ ɛː œ ɔ a ɑ/. La dynamique formantique de certaines voyelles
s’est réduite au cours du temps, soit celles du F1 de /o ɛ ɛː œ ɔ/, du F2 de /ɛ/ et du F3 de /ɑ/, la
réduction allant de 21 à 29 Hz. Ce sont donc 13 des 15 catégories vocaliques à l’étude, soit toutes
sauf [i] et /e/, qui ont vu un ou plusieurs de leurs paramètres acoustiques significativement modifiés
du T1 au T2. Ces effets du facteur TEMPS ont eu lieu chez tous les participants indistinctement,
c’est-à-dire que le fait d’avoir déménagé ou non n’a pas eu d’effet particulier, ou alors des effets
très isolés. Par exemple, la durée des /ɛː/ produits par les sédentaires a diminué au cours du temps,
alors que celle des mobiles a augmenté. Le F1 de [ʊ] /o/ a augmenté du T1 au T2 chez les hommes
et les femmes mobiles et sédentaires, mais dans des proportions différentes. Sans considération pour
le TEMPS, les mobiles ne se distinguent des sédentaires que par une dynamique du F2 de [ʏ] et de
/œ/ de plus grande ampleur et une durée de [i] plus courte. Pour ce qui est du facteur SEXE, les
hommes ont produit des voyelles aux fréquences formantiques significativement moins élevées que
les femmes, un phénomène attendu chez des locuteurs au conduit vocal de dimensions différentes.
Parmi les paramètres acoustiques autres que les trois premiers formants, seule la dynamique du F 1

203
de [i y] a significativement été affectée par le facteur SEXE, les trajectoires masculines étant plus
réduites.

Le score d’INTÉGRATION des participants a significativement augmenté au cours du temps. Au T2,


leurs fréquentations et activités s’étaient ainsi diversifiées, leurs perspectives d’avenir étaient plus
cosmopolites, ou chez les mobiles, la fréquence des contacts avec leur milieu d’origine était faible.
Le score d’INTÉGRATION est également lié à F3 : plus un locuteur possède un score d’INTÉGRATION
élevé, plus la fréquence de ses F3 tend à être élevée. Ni le SEXE, ni la MOBILITÉ ne permettent de
prédire le score d’INTÉGRATION, ni d’ailleurs celui d’ÉMERGENCE. Ce dernier demeure en outre
stable au cours du temps, et les écarts individuels ne sont liés à aucun phénomène acoustique précis.
Parmi les 18 locuteurs mobiles, 17 ont manifesté une conscience de la variation ou des changements
apportés à leur façon de parler au cours du temps. Une participante a rapporté une réaction positive
de son entourage par rapport aux changements perçus et deux, des réactions négatives passibles
d’induire une forme de résistance.

7.2 Les changements au cours du temps


Les changements acoustiques qui se sont produits au cours du temps sont de faible magnitude. Que
le F1 de /ɔ/, entre autres, passe de 569 à 558 Hz n’est vraisemblablement pas perceptible. De plus,
des changements comme ceux observés sur F3, qui affectent l’ensemble des voyelles et non des
groupes spécifiques (par exemple, les voyelles arrondies, celles susceptibles d’être rhotacisées,
etc.), sont difficiles à attribuer à des facteurs phonétiques précis. Ils ne semblent pas davantage se
limiter à des phénomènes de variation régionale, et les facteurs extralinguistiques considérés dans
cette étude (MOBILITÉ, SEXE, INTÉGRATION et ÉMERGENCE) ne se sont pas non plus révélés aptes à
les justifier. Comment expliquer, alors, les changements observés au cours du temps, ainsi que leur
récurrence d’une catégorie vocalique à l’autre ?

Techniquement, on ne peut parler de convergence, puisque statistiquement, les usages des


participants mobiles et sédentaires étaient indistincts au T1 et ne se sont donc pas rapprochés au
cours du temps, exception faite de la durée de /ɛː/ (Figure 20). Nos résultats présentent néanmoins
des similitudes avec les travaux s’inscrivant dans le paradigme de la convergence phonétique : les
propriétés acoustiques des voyelles produites par les participants ont évolué de concert dans une
direction donnée et les changements sont si fins que rien ne permet de penser qu’ils sont audibles ou
délibérés. Des tendances comparables ont été obtenues, entre autres, par Delvaux et Soquet (2007).
Dans cette étude, les locutrices s’alignent sur de la parole enregistrée projetée par des haut-parleurs
sans y avoir été incitées et sans en avoir conscience, y compris sur une variable ne possédant pas le

204
statut de marqueur. Exposés à des VOT modifiés, les locuteurs enregistrés par Shockley et coll.
(2004) et Nielsen (2011) tendent également à converger vers la parole entendue, en autant que les
contrastes phonémiques ne soient pas compromis (Nielsen, 2011). Hors paradigme de la
convergence phonétique, Flege et Hammond (1982) observent aussi de subtiles modifications de
VOT lors d’une tâche d’imitation en différé. Ziliak (2012) mesure chez des locuteurs mobiles, en
plus d’une différence attendue sur F2, une modification de F1 non documentée dans la littérature.
Love et Walker (2013) déduisent qu’un sujet de conversation américain amène des participants
britanniques à produire des voyelles avec un plus grand degré de rhoticité, mais la diminution de F3
relevée n’est que de 60 Hz en moyenne.

Coles-Harris (2017) divise en deux camps les points de vue sur les motivations sous-jacentes à la
convergence phonétique : les automatistes postulent un lien perception-réaction direct (effet
caméléon), tandis que les interventionnistes considèrent qu’une panoplie de facteurs favorisent ou
inhibent une réaction suivant la perception (théories de l’accommodation et des exemplaires). En ce
qui nous concerne, puisque des changements imperceptibles ont été mesurés lors de tâches de
lecture non interactives, nous pourrions présumer d’un processus automatique. Cependant, selon
Coles-Harris (2017 : 13), plus la convergence est observée dans un cadre expérimental socialement
dépouillé, plus il est facile d’y voir un automatisme. Dans les faits, il est toutefois impossible
d’éliminer tout facteur social d’une expérience faisant appel à des êtres humains. Pour reprendre la
formule de Coles-Harris (2017 : 13-14), il existe donc un « spectre de la socialité », et dans le cadre
expérimental mis en place, et dans l’importance attribuée à l’intervention de facteurs sociaux dans
la production de la parole. La question qu’il convient alors de se poser consiste à savoir quel aspect
de ce spectre pourrait avoir induit les changements acoustiques observés dans notre étude, si ni le
fait d’avoir déménagé, ni les volets de l’intégration sociale mesurés, ni les différences individuelles
à l’indice ÉMERGENCE ne permettent de les expliquer.

Nous avons émis l’hypothèse d’une réduction des mouvements articulatoires au cours du temps,
menant à une plus grande proximité acoustique des catégories vocaliques. En effet, l’espace
acoustique occupé par les voyelles se compresse sur l’axe F1. Les voyelles fermées, mi-fermées et
mi-ouvertes présentent une augmentation de la valeur de l’indice. Celle des fermées et des mi-
fermées, dont le F1 est plus bas, est en général plus importante que celle des mi-ouvertes. Les
voyelles ouvertes, dont le F1 est le plus élevé, présentent à l’inverse une diminution de l’indice au
cours du temps, quoique non significative. La tendance n’est pas aussi évidente sur F2, mais en le
combinant à F1 pour envisager l’espace acoustique sous forme de trapèze, celui-ci tend à couvrir
une aire plus restreinte au T2. En appui à cette hypothèse d’une réduction des mouvements

205
articulatoires, tous les changements significatifs de dynamique formantique au cours du temps se
traduisent par une valeur plus proche de zéro au T2. Autrement dit, que l’indice acoustique
augmente ou diminue en cours d’émission de la voyelle, sa dynamique se réduit au cours du temps.

Une cause possible de la réduction des contrastes acoustiques entre catégories vocaliques est
l’augmentation du débit de parole (Lindblom, 1963). Nous n’avons pas procédé à un calcul formel
du débit, mais l’absence de différences significatives de la durée entre le T1 et le T2 rend cette
première cause peu probable. Le style de parole d’un individu peut également avoir un effet sur son
espace acoustico-phonétique. Harmegnies et Poch-Olivé (1992), par exemple, montrent que la
parole lue donne lieu à des contrastes inter-classes plus marqués et à une dispersion intra-classe plus
réduite que la parole conversationnelle. Pour reprendre les termes de la théorie H&H (Lindblom,
1990), la parole lue serait hyperarticulée et la parole conversationnelle, hypoarticulée. En ce qui a
trait à nos propres résultats, nous ne pouvons considérer que le style de parole a changé du T1 au
T2 : les trois tâches de lecture qui ont servi à récolter le matériel analysé ont très exactement été
répliquées. Cependant, il n’est pas impossible que le contexte de l’expérience ait été perçu comme
moins formel au T2. Les locuteurs en étaient effectivement à leur seconde participation et
connaissaient donc les lieux, le protocole et l’expérimentatrice. Ils ne cherchaient plus non plus,
comme au T1, à s’assurer que leur comportement était conforme à ce qui était attendu. Il est
également possible que ce soit le rapport des locuteurs aux situations de communication formelles
qui ait changé, car rappelons que le temps écoulé entre les deux expérimentations correspond à leur
première année d’université. Il est probable que cette période ait été l’occasion de s’exprimer plus
fréquemment dans des situations formelles et que les locuteurs les appréhendent désormais avec une
plus grande aisance. Les participants confirment d’ailleurs que le fait de fréquenter l’université a
occasionné des changements linguistiques allant dans le sens d’une utilisation accrue de formes
formelles. En réponse aux questions relatives à l’indice FIDÉLITÉ, des participants affirment
désormais employer un « langage plus professionnel » et un « vocabulaire plus varié et plus
soutenu ». Ainsi, le fait de percevoir différemment le contexte expérimental dans lequel la parole a
été produite pourrait être à la source de la réduction des contrastes acoustiques observée sur F1 et F2.

Le troisième formant des occurrences appartenant aux 15 catégories vocaliques à l’étude a quant à
lui diminué au cours du temps, bien que la différence ne soit pas toujours significative. Cette chute
généralisée de F3 ne permet pas de conclure à une réduction de l’espace acoustique F2/F3, les
catégories vocaliques ne se rapprochant pas l’une de l’autre comme dans l’espace F 1/F2. Elle
n’affecte pas non plus exclusivement des groupes de voyelles partageant des caractéristiques dont le
corrélat acoustique est F3. Il est peu plausible que toutes les voyelles aient subi un ou plusieurs

206
changements d’arrondissement, de rhoticité ou de nasalité au cours du temps. La seule piste
d’interprétation qui nous semble tenir la route consisterait à considérer la distance entre les
formants. Syrdal et Gopal (1986) suggèrent de rendre compte du degré d’antéropostériorité des
voyelles au moyen de la distance entre F2 et F3 convertis en Bark. Thomas et Kendall (2007) font de
même, en plus d’opter pour une modélisation du degré d’aperture reposant sur la distance entre F1 et
F3 convertis en Bark59. En adoptant cette technique, nous pourrions vérifier si nos observations
fondées sur la valeur absolue de F1 et de F2 se maintiennent. Si tel était le cas, la prise en compte de
F3 n’apporterait cependant pas d’information supplémentaire sur les productions des participants et
leurs changements au cours du temps. On peut par ailleurs s’interroger sur les formants supérieurs à
F3, que nous avons choisi d’ignorer en raison des difficultés techniques que pose leur analyse
(5.4.3). Le quatrième formant a-t-il lui aussi subi un changement fréquentiel récurrent du T1 au
T2 ? Hormis pour la voyelle /i/, qui se distingue par une proéminence perceptive résultant de la
focalisation de F3 et de F4 (Ménard, 2002; Gendrot et coll., 2008), le rôle que joue le quatrième
formant en français demeure toutefois méconnu, aussi notre réflexion ne s’en trouverait pas
forcément éclairée. Le fait qu’une augmentation de l’indice INTÉGRATION permette de prédire une
augmentation de la fréquence de F3 se heurte aux mêmes obstacles interprétatifs. Il est difficile de
concevoir les raisons pour lesquelles un locuteur plus intégré produirait des voyelles moins
arrondies, moins rhotacisées ou plus nasalisées, sachant en outre qu’elles seraient néanmoins plus
arrondies, plus rhotacisées ou moins nasalisées au T2, alors que le locuteur serait, lui, plus intégré.
Paradoxalement donc, les changements affectant F3 sont les plus récurrents, mais les moins
transparents.

Dans un autre ordre d’idées, dans le cadre des questions à propos de l’indice FIDÉLITÉ, 17 des 18
locuteurs mobiles ont manifesté, sur papier, une conscience de la variation. Quant au dix-huitième,
un commentaire métalinguistique formulé lors d’une tâche de lecture au T2 nous amène à le
considérer comme conscient de la variation au même titre que les autres. En effet, dans un échange
reproduit à la section suivante (7.3), le locuteur rapporte que sa prononciation a fait l’objet de
remarques métalinguistiques depuis son arrivée à Québec. On peut alors s’interroger sur le rôle de
la conscience linguistique dans le processus de changement phonétique. Dans ce cas, il s’agirait
moins d’une conscience d’éléments saillants bien définis telle que postulée dans le cadre de la
théorie de l’accommodation (Trudgill, 1986), ou encore d’une conception très précise des
changements, que d’une sensibilité individuelle exacerbée par le contact avec la variation, dans la
lignée du paramètre que Nycz (2013 : 60) propose d’ajouter aux modèles à exemplaires (voir

59
Syrdal et Gopal (1986) utilisent plutôt la distance entre la f0 et F1 pour rendre compte du degré d’aperture.

207
section 3.4). Puisque les locuteurs sédentaires ont également changé au cours du temps, il serait
cependant nécessaire de posséder des données sur leur conscience de la variation pour pousser plus
avant la réflexion.

7.3 Les effets de la MOBILITÉ


Qu’il soit question de changement ou de stabilité, les participants mobiles et sédentaires se
distinguent peu. Si dans la section précédente, nous avons tenté d’expliquer ce qui avait pu causer
les fins changements phonétiques observés entre le T1 et le T2, nous tenterons à présent de
déterminer les raisons derrière le fait que les participants mobiles n’ont pas davantage modifié leur
prononciation que les sédentaires. D’abord, rappelons que le facteur MOBILITÉ n’influence
significativement que trois indices acoustiques : la dynamique du F2 de [ʏ] et de /œ/ et la durée de
[i]. Les occurrences produites par les mobiles présentent une dynamique postériorisante plus
marquée et une durée plus courte que celles des sédentaires. Le seul indice acoustique modulé par
une interaction MOBILITÉ*TEMPS est la durée de /ɛː/. Celle des mobiles change davantage au cours
du temps (diminution significative de 0,011 s) que celle des sédentaires (augmentation non
significative de 0,005 s). Le F1 de [ʊ] et de /o/ est également influencé par une interaction
MOBILITÉ*TEMPS*SEXE. Dans les deux cas, les hommes sédentaires présentent l’augmentation de
la valeur de l’indice la plus faible. Celle des femmes sédentaires est en revanche substantielle,
dépassant l’augmentation des femmes mobiles pour [ʊ] et celle des hommes et des femmes mobiles
pour /o/. Les quelques interactions impliquant les facteurs MOBILITÉ et TEMPS ne se traduisent donc
pas nécessairement par des changements plus importants chez les mobiles que chez les sédentaires.

Une première explication du peu d’effets de la MOBILITÉ pourrait être le temps de résidence réduit
dans la ville de Québec. Dans la littérature, les conséquences de ce facteur ne sont pas
systématiques : certaines études rapportent qu’un très court temps de résidence est suffisant pour
observer des changements, alors que d’autres en postulent un sensiblement plus long. Il ne suffit
que de quelques semaines pour que s’enclenchent des modifications phonétiques chez les témoins
interrogés par Hernández et Maldonado (2012), mais ce sont des migrants illégaux motivés par
l’absolue nécessité. Dans l’étude de Pardo et coll. (2012), des auditeurs perçoivent des changements
chez les locuteurs au bout de quelques mois seulement. Étant donné la méthodologie adoptée, il est
cependant impossible de déterminer avec certitude ce sur quoi les auditeurs se sont fondés pour
poser un jugement. Chez Evans et Iverson (2007), quelques changements en production sont
observés après trois mois, mais les plus importants sont mesurés au bout de 2 ans. Sept ans sont
nécessaires, en revanche, pour que les participants de Bowie (2001) manifestent un changement.
Kwon (2018) observe que Noam Chomsky a adopté des traits de l’anglais de Boston 54 ans après

208
s’y être installé, mais dans le premier enregistrement analysé, le locuteur pratique encore le
régiolecte philadelphien alors qu’il n’y vit plus depuis 15 ans. L’intervalle d’un an entre le T1 et le
T2, choisi dans l’optique de mener l’étude à terme dans le temps imparti à un cursus doctoral,
pourrait donc avoir été insuffisant pour que des changements phonétiques importants surviennent
chez les locuteurs mobiles.

Une seconde explication potentielle concerne notre stratégie d’analyse. Le choix de prendre en
considération non moins de 7 indices acoustiques récoltés au sein de 12 voyelles produites dans 8
contextes consonantiques était motivé par l’aspect exploratoire de notre étude : en l’absence de
connaissances précises sur la variation régionale en FQ et de ce qui était susceptible d’être modifié
par les participants mobiles, cette stratégie permettait de ratisser large. Paradoxalement, notre
approche peut malgré tout être perçue comme peu exploratoire et être en cause dans l’absence
apparente de changements plus importants chez les mobiles. MacLeod (2014 : 360) fait
effectivement remarquer qu’une analyse acoustique se limite aux paramètres sélectionnés en amont
par l’expérimentateur. S’il y a changement sur d’autres dimensions, par exemple le timbre des
voyelles nasales, les segments consonantiques, la fréquence fondamentale, les propriétés
prosodiques, etc., notre méthode n’est pas à même d’en rendre compte.

Parvenant à la même constatation et jugeant que les mesures acoustiques offrent un portrait
inconstant d’un phénomène déjà hétérogène, Pardo et coll. (2018) préconisent une approche
holistique fondée sur la perception d’auditeurs naïfs, inspirée des travaux de Goldinger (1998) et
exploitée par Pardo (2006) et Pardo et coll. (2012), notamment. Les auteurs estiment effectivement
que la convergence et, par extension, le changement phonétiques gagnent à être mesurés au moyen
de tâches AXB, au cours desquelles les auditeurs doivent évaluer la similarité d’extraits de parole
ne se limitant pas à quelques variables ou paramètres isolés. L’approche holistique est ainsi à même
de rendre compte, selon Pardo et coll. (2018 : 3), de la multidimensionnalité du phénomène de
convergence. Dans une perspective acoustique, considérant que la parole est infiniment plus
complexe que les quelques paramètres auxquels on la réduit généralement, l’argument de Pardo et
coll. (2018) résonne. Néanmoins, l’une des difficultés que pose l’approche holistique est
l’identification subséquente de facteurs révélateurs de cohésion parmi les réponses des participants,
soit l’inverse complet de ce qui est reproché à l’analyse acoustique.

Au même titre que nous ne pouvons statuer sur d’éventuels changements phonétiques se traduisant
autrement que par des fréquences et trajectoires formantiques et une durée différenciées, notre souci
de comparabilité des données au T1 et au T2 a fait en sorte que nous ne pouvons nous prononcer sur

209
les productions des participants hors lecture de script en laboratoire. Il n’est pas exclu que d’autres
changements aient eu lieu, mais que la nature de l’expérience n’ait pas permis de les saisir. De
surcroît, notre étude se concentre exclusivement sur la dimension phonétique, qui n’est pas
nécessairement le niveau linguistique subissant les changements les plus importants, réguliers ou
rapides (2.3.1). Le Principe 1 de Chambers (1992) stipule que lors de l’acquisition d’un R2, ce sont
les substitutions lexicales qui surviennent en premier. En réponse aux questions visant à mesurer
l’indice FIDÉLITÉ au T2, neuf participants mobiles mentionnent d’ailleurs que l’année écoulée a
donné lieu à des changements lexicaux ou relatifs aux « expressions ». Il n’est donc pas exclu que
les mobiles apportent éventuellement des modifications plus substantielles à leur prononciation,
mais que pendant la période couverte par l’expérience, ils en étaient principalement au stade des
substitutions lexicales.

Les commentaires de certains participants qui rapportent avoir changé des mots et expressions
laissent par ailleurs entrevoir que la population locale ne constitue pas la plus importante influence
linguistique. Des locuteurs originaires de Montréal, de Gatineau et de la France sont mentionnés
comme instigateurs du changement, alors que ceux de Québec ne le sont qu’une fois.
Conformément à ce que fait remarquer Nycz (2015), une bonne partie des contacts sociaux des
étudiants ont donc lieu sur le campus même. Par ailleurs, le fait que les interlocuteurs de Québec ne
soient pas perçus comme la source du changement mène à nous interroger sur les spécificités
régiolectales effectives. À quel point y a-t-il un « accent de Québec » qui ne se limite pas à des
phénomènes ponctuels comme [labʏs] ? En d’autres termes, à quel point les locuteurs mobiles
avaient-ils un R2 à acquérir ? Nos connaissances lacunaires à propos de la variation régionale
actuelle en FQ ne permettent pas de répondre à cette interrogation, qui par ailleurs, en soulève une
encore plus délicate, soit celle de la pertinence du lien prononciation-lieu présupposé. Dans quelle
mesure la variation phonétique en FQ, et conséquemment l’impression qu’en ont les usagers, est-
elle de nature géographique ? On peut se demander si une dichotomie ville-région (Remysen,
2016a) cooccurrente à une hiérarchisation socio-économique, ou encore si une stratification en
fonction de l’âge, pourraient être plus signifiantes pour les locuteurs du FQ. En supposant qu’une
prononciation différente soit perçue à Québec, peut-être est-elle envisagée comme un régiolecte
seulement parce qu’un questionnaire a induit cette vision. Incidemment, peut-être existe-t-il parmi
les étudiants universitaires québécois une mobilité plus signifiante que celle de nature géographique
ou celles mesurées par l’indice ÉMERGENCE. S’il nous est difficile de comprendre ce qui s’est
produit entre le T1 et le T2, si nous ne pouvons qu’émettre des hypothèses pour justifier les fins
changements phonétiques qui ont eu lieu chez tous les participants et l’absence de modifications

210
d’envergure chez les mobiles, c’est que nous connaissons mal ce qui a cours en FQ. Selon Sankoff
(2018a : 44), pour tirer du sens d’une trajectoire individuelle, il est essentiel de comprendre ce qui
se passe à l’échelle de la communauté.

En admettant qu’il y ait bel et bien des différences phonétiques régiolectales, on peut se demander
si elles ont été perçues par les locuteurs mobiles et conséquemment, réfléchir au rôle de la saillance
(2.4.4) dans le changement phonétique en FQ. En réponse aux questions relatives à l’indice
FIDÉLITÉ, cinq participants mobiles ont fait mention de la prononciation parmi les changements
auto-perçus. Un seul exemple concret a été fourni, à savoir le mot baleine désormais prononcé par
une Trifluvienne comme « un ami de la Rive-Sud de Montréal », ce que nous déduisons être
[balaɛn]. De plus, lors de la première tâche de lecture au T2, nous avons eu l’échange suivant avec
un participant mobile lorsqu’il a été amené à produire la phrase C’est manger du crabe qu’ils
veulent :

Participant : C’est manger du…


silence de 1,25 seconde
[kʁɑɔb] (faible intensité)
qu’ils veulent (intensité habituelle).
silence de 2,5 secondes
J’ai hésité parce que… je me le suis fait dire… D’où ce que je viens c’est [kʁɑɔb].
JRC : Ah ouais ?
Participant : Mais ici c’est [kʁab].
JRC : Tu veux tu la dire… naturellement ?
Participant : C’est manger du [kʁɑɔb] qu’ils veulent.

Ce participant est « le dix-huitième », celui qui sur papier, n’a manifesté aucune conscience de la
variation au T1, n’a pas rapporté avoir modifié sa façon de parler au cours de sa première année
d’université et n’a pas tenté de fournir d’explication. Des commentaires explicites entre le T1 et le
T2 ont manifestement porté la différence à son attention, et même s’il juge naturelle la
prononciation [kʁɑɔb], son hésitation laisse penser qu’un changement a été initié et qu’en d’autres
circonstances, il aurait pu produire [kʁab], ce pour quoi nous avons mentionné dans la section
précédente (7.2) considérer que tous les participants mobiles étaient conscients de la variation.

Crabe faisait partie de la phrase porteuse mais ne constituait pas un mot cible à l’étude, non plus
que le mot baleine mentionné par une participante. Si nous avons choisi de ne pas accorder
d’attention à de tels items, c’est en raison de leur rôle de schibboleths en FQ, de leur saillance. Or,

211
pour anecdotiques qu’ils soient, ce sont les seuls qui font l’objet de commentaires métalinguistiques
de la part des participants. Une première explication possible à cet état de fait est que l’acquisition
d’un R2 du FQ se limite à de tels éléments saillants et audibles (Siegel, 2010), ainsi le processus à
l’œuvre dans les fins changements acoustiques observés au cours du temps doit être envisagé
comme un phénomène complètement différent de l’acquisition d’un R2. Une seconde explication
est que l’acquisition et la variation que les locuteurs sont en mesure de décrire se limitent aux
éléments saillants et audibles, ainsi une vaste partie des changements phonétiques qui affectent leurs
productions leur échappe ou demeure hors de leur portée descriptive. Les remarques
métalinguistiques fragmentaires dont nous disposons et l’absence de telles données provenant des
sédentaires ne nous permettent cependant pas de nous aventurer plus loin sur ce terrain.

Par ailleurs, nos 18 participants mobiles ont été traités comme un groupe, une stratégie qui
permettait d’éviter une description essentiellement qualitative de comportements idiosyncrasiques,
tout en assurant un traitement statistique relativement simple mais robuste. Il aurait bien entendu été
possible d’adopter une tout autre approche. Sonderegger et coll. (2017), par exemple, s’intéressent à
la fluctuation quotidienne individuelle de la valeur de variables phonétiques et aux conséquences à
moyen terme de cette éventuelle fluctuation : changement ou stabilité. Les auteurs étudient un vaste
corpus de parole produite par 12 participants à la téléréalité britannique Big Brother. Le concept de
l’émission est que les locuteurs vivent ensemble, coupés du reste du monde, pour une période allant
jusqu’à trois mois, et presque quotidiennement, monologuent devant un écran omniscient orwellien.
Comme conséquence du contact intensif avec un groupe restreint de locuteurs, les auteurs proposent
que les occurrences produites lors des monologues puissent évoluer au jour le jour et au cours du
temps selon les quatre patrons schématisés à la Figure 34. Le patron A suppose stabilités quotidienne
et au cours du temps; le patron B correspond à une fluctuation quotidienne mais à la stabilité au
cours du temps; le patron C illustre un changement au cours du temps sans fluctuation quotidienne;
le patron D présente une fluctuation quotidienne menant à un changement au cours du temps.

Figure 34 : Quatre patrons possibles de l’évolution d’une


variable phonétique au quotidien et au cours du temps.
Figure adaptée de Sonderegger (2015 : 1)

212
Sonderegger et coll. (2017) ciblent 9 variables phonétiques : le VOT d’occlusives voisées et non
voisées (2), le taux de suppression des consonnes /t d/ en finale de mot, par exemple best prononcé
[bɛs] (1), et les deux premiers formants des voyelles de GOOSE, STRUT et TRAP (6). Pour chacune de
ces variables phonétiques, les auteurs choisissent d’abord, parmi un important lot de facteurs
potentiellement influents (lieu d’articulation du segment, voisement du segment suivant, durée,
fréquence lexicale, débit, genre du locuteur, analyste, etc.), ceux qu’il convient de prendre en
compte et ceux qui peuvent être exclus, au moyen d’un modèle mixte appliqué aux données de tous
les locuteurs. Ce choix de facteurs opéré, pour chacun des locuteurs (12) et chacune des variables
phonétiques (9), quatre modèles additifs généralisés à effets mixtes (GAMM)60 sont testés, chacun
correspondant à l’un des patrons A à D de la Figure 34. Le modèle le mieux ajusté aux données est
déterminé d’après le critère d’information d’Akaike (une valeur moindre est préférable). Les
auteurs constatent que les variables phonétiques varient majoritairement selon les patrons B et D.

Une modélisation semblable aurait permis un examen précis de la trajectoire individuelle de nos
participants au cours du temps, mais également d’une tâche de lecture à l’autre, sans nécessité de
moyenner les occurrences. Nous aurions ainsi pu évaluer la magnitude de la fluctuation intra-
individuelle à un temps d’enquête donné et la comparer à celle des changements au cours du temps.
Puisqu’une trajectoire temporelle aurait été obtenue pour chacun des locuteurs, il aurait également
été possible de repérer des spécificités individuelles ou régionales que le groupement des mobiles a
sans doute gommées. De surcroît, les usages des deux locuteurs mobiles installés à Québec depuis
un an au T1 puisqu’ils y avaient effectué une partie de leurs études collégiales (5.3) auraient pu être
mis en perspective. La technique de Sonderegger et coll. (2017) ne résout cependant pas tous les
problèmes auxquels nous avons été confrontée. Par exemple, les auteurs effectuent eux aussi six
analyses différentes pour les deux premiers formants de trois voyelles, ainsi adopter leur méthode
n’aurait pas mené à une réduction du nombre d’analyses effectuées. De plus, en supposant que
comme dans leur expérience, nous cherchions à tester quatre modèles pour chacune des variables
acoustiques (105) et chacun des locuteurs mobiles (18), 7 560 analyses en résulteraient. L’option
semble plus viable avec un jeu de variables phonétiques plus restreint que le nôtre. Similairement,
la sélection de facteurs fondée sur l’idée de parcimonie effectuée par Sonderegger et coll. (2017)

60
Les GAMM permettent d’inclure les facteurs choisis à l’aide du modèle mixte, ainsi qu’une fonction de
lissage (smoothing) s’ajustant à des données variant de manière apparemment arbitraire au cours du temps, ce
qui correspond ici aux patrons B et D. Nous référons le lecteur à Sonderegger et coll. (2017 : 611-612) pour
une introduction à ce type de modèles, ou à Wieling (2018) pour un tutoriel sur les GAM, conceptuellement
proches des GAMM.

213
n’est sans doute pas idéale dans une situation expérimentale qui comme la nôtre, comprend un
nombre très élevé de variables dépendantes et relativement peu de variables indépendantes.

7.4 INTÉGRATION, ÉMERGENCE et FIDÉLITÉ


Les indices INTÉGRATION, ÉMERGENCE et FIDÉLITÉ ont été évalués au moyen de questionnaires
autoadministrés. L’un des principaux inconvénients de cet outil est que la fiabilité des réponses des
participants est inconstante (Blais et Durand, 2009) : perceptions s’éloignant de la réalité,
interprétation des questions différant de celle du chercheur, réticence à fournir certains
renseignements, oubli momentané d’éléments pertinents, etc. À titre d’exemple, une question
comme « Si vous pensez aux 5 ou 10 personnes que vous fréquentez le plus souvent en ce moment,
de quelle(s) ville(s) viennent-elles ? » est loin de garantir un portrait représentatif de la réalité. Au-
delà de cette limite inhérente aux questionnaires, certaines difficultés rencontrées en cours d’étude
doivent être passées en revue.

L’indice INTÉGRATION est composé des sous-indices du cercle social fréquenté, des activités
partagées avec autrui, des perspectives d’avenir et, pour les participants mobiles, de l’intensité des
contacts avec le milieu d’origine. Plus l’indice est élevé sur l’échelle de 0 à 3 obtenue, plus les
locuteurs sont jugés intégrés et en théorie, propices au changement phonétique. Tous temps
d’enquête et locuteurs confondus, le score moyen est de 1,49, le minimum de 0,33 et le maximum
de 2,50. Les analyses statistiques incluant l’indice INTÉGRATION ont révélé que sa valeur estimée
augmentait de manière significative au cours du temps, mais que ni les mobiles et les sédentaires, ni
les hommes et les femmes ne se distinguaient entre eux. De plus, l’indice INTÉGRATION s’est avéré
apte à prédire la valeur de F3 : lorsqu’il augmente de 1, la fréquence de F3 augmente de 39 Hz, et ce,
indépendamment de la tendance de F3 à diminuer du T1 au T2. Nous en déduisons que si le score
d’INTÉGRATION entretient un certain lien avec les usages des participants, il ne peut être associé aux
changements acoustiques observés au cours du temps. Il n’est pas impensable que ce résultat plutôt
surprenant en regard des nombreuses contributions qui soulignent l’importance de l’intégration
sociale dans le processus d’acquisition d’un R2 (section 2.4.1) soit attribuable à la manière dont les
réponses des participants ont été traitées. En effet, nous avons choisi de faire de l’ INTÉGRATION un
indice chiffré et non strictement qualitatif afin de l’exploiter statistiquement, mais puisqu’il s’agit
d’une mesure composite inédite, elle serait certainement à raffiner.

D’abord, une réponse relative à un sujet aussi complexe que l’intégration sociale qui tienne en une
ligne ou qui se résume à oui ou non n’offre qu’un aperçu de la réalité. Inévitablement, ramener
ensuite cette réponse sur une échelle ordinale à quelques degrés en réduit une fois de plus la

214
profondeur. Un bon exemple est celui d’une question en apparence simple portant sur le thème des
fréquentations en contexte universitaire (sous-indice du cercle social fréquenté) posée au T1. Les
témoins devaient indiquer si certains étudiants de leur programme étaient des connaissances
antérieures (du Cégep, du secondaire, du travail, etc.). S’ils répondaient à la négative, ils obtenaient
un résultat de 1 puisque nous considérions que l’absence de telles connaissances était susceptible de
les amener à rencontrer de nouvelles personnes. Si leur réponse était positive, nous leur accordions
plutôt 0. La justesse de ce codage dépend toutefois de la relation entre le témoin et la personne de sa
connaissance. S’il s’agit d’amis très proches qui fréquentent le même cercle social, les conditions ne
sont effectivement pas particulièrement propices à de nouvelles rencontres. Par contre, si le témoin
retrouve un ami perdu de vue depuis longtemps, qui a entre-temps évolué dans un tout autre milieu
et qui l’introduit dans le cercle social qu’il s’est construit depuis, considérer qu’une connaissance
antérieure n’amène pas le témoin à diversifier son réseau est inexact et le résultat de 0 est erroné. En
supposant qu’une telle information soit disponible et que le témoin obtienne 1, il faudrait alors
s’interroger sur les implications de coder identiquement le fait de ne connaître personne dans son
nouveau programme et celui d’y avoir revu un ami perdu de vue. Adopter une échelle à plus de
deux degrés serait peut-être nécessaire, mais encore faudrait-il statuer sur les subtilités différenciant
ses échelons et amener les participants à fournir des réponses encore plus détaillées afin de les y
situer.

Dans une perspective similaire, lors de l’évaluation du sous-indice des contacts maintenus avec le
milieu d’origine, les mobiles ont été amenés à estimer la fréquence de leurs visites dans leur milieu
d’origine pendant l’année écoulée entre le T1 et le T2. Nous avons réparti leurs réponses en
fréquences de contact élevée (2), moyenne (1) et faible (0). Il aurait bien entendu été possible
d’évaluer ce sous-indice de manière beaucoup plus approfondie, par exemple en interrogeant
également les témoins sur la fréquence des conversations à distance (téléphone, logiciels comme
Skype), sur les personnes fréquentées lors des visites (famille seulement, quelques amis, réseau
social dense), ainsi que sur les raisons des visites et l’affect qui leur est associé. Dans cet exemple
comme dans le précédent, la complexité de la situation dépasse largement ce qu’il est possible de
récolter comme information au moyen d’un questionnaire couvrant plusieurs thématiques et
remplissable en un temps raisonnable.

Un autre exemple de limite de l’indice INTÉGRATION est fourni par le thème de l’occupation après
le baccalauréat (sous-indice des perspectives d’avenir). L’échelle construite va de perspectives
locales à cosmopolites, ces dernières étant censées favoriser le changement phonétique. À la
question sur leurs plans après le baccalauréat, les participants répondant qu’ils souhaitaient intégrer

215
le marché du travail ont obtenu un score de 0 (orientation locale), notre point de vue étant que leur
environnement serait plus stable et homogène que s’ils poursuivaient des études. Ce n’est cependant
pas vrai de toutes les professions. Intégrer une firme internationale, enseigner, devenir journaliste
ou encore être travailleur autonome sont loin d’assurer un environnement homogène, y compris sur
le plan linguistique. Nous aurions ainsi pu envisager un codage différent selon le programme
d’études, ou encore tenir compte de la réponse fournie par quelques participants à l’emploi projeté,
et à ce compte-là, accorder un score différent aux participants pensant poursuivre leurs études en
fonction du domaine projeté. Nous nous serions cependant vue contrainte de réduire à nouveau un
continuum complexe à une échelle à quelques degrés, et ainsi troquer une limite contre une autre.

Un autre problème potentiel réside dans le fait que les différents thèmes et sous-indices ne sont pas
complètement indépendants. Par exemple, un témoin qui déclarerait vivre avec son conjoint le
considérera normalement comme l’une des 5 à 10 personnes les plus souvent fréquentées. Si le
conjoint est en outre originaire d’un endroit différent de celui du témoin, celui-ci obtiendra un score
d’INTÉGRATION élevé puisqu’il aura déclaré vivre avec un conjoint (1 point au thème des contacts
quotidiens) et fréquenter des personnes ne provenant pas du même milieu que lui (1 point ou 2 au
thème des relations amicales). Or, une seule et même personne est à l’origine du codage positif sur
deux échelles différentes, dont une consacrée aux relations amicales.

De plus, les sous-indices du cercle social fréquenté, des activités partagées avec autrui, des
perspectives d’avenir et, le cas échéant, de l’intensité des contacts avec le milieu d’origine ont été
regroupés en un seul indice. Il n’est donc pas impossible que l’augmentation observée du score
d’INTÉGRATION au cours du temps soit davantage attribuable à l’un ou l’autre des sous-indices, que
l’augmentation de l’un ait compensé la diminution de l’autre, etc. Il est également permis de penser
que certains constituent des mesures plus sensibles ou varient davantage entre les mobiles et les
sédentaires. Chacun des sous-indices s’est vu attribuer un poids égal dans la composition de l’indice
INTÉGRATION, ce qui n’est pas nécessairement conforme à la réalité, ni uniforme d’un locuteur à
l’autre. Dans l’éventualité d’une analyse par modèles ajustés à l’individu comme celle de
Sonderegger et coll. (2017), chacun des sous-indices pourrait être testé séparément et l’indice
INTÉGRATION, se voir optimisé.

Par ailleurs, soulignons la tentative comparable de Walker (2014, 2018) de lier les patrons de
production et de perception de locuteurs mobiles à un indice d’intégration construit pour les besoins
de la cause. Ses participants britanniques installés aux États-Unis et américains vivant au Royaume-
Uni se sont vu accorder un score d’intégration rendant compte de leur nationalité et de celle de leurs

216
conjoint, enfant(s) et parents, de leur emploi et de leur appartenance à une communauté de pratique
fondée sur la nationalité, l’échelle résultante comportant 13 degrés. Ce score d’intégration ne
permet toutefois d’expliquer aucun des patrons de production et de perception observés. On peut se
demander si ce résultat provient réellement de ce que l’intégration n’a aucun effet, ou si c’est
l’indice tel qu’il a été construit qui est en cause. Cette incertitude trouve parallèle dans notre étude,
puisque comme Walker (2014, 2018), nous avons tenté d’atteindre deux objectifs simultanément :
celui de tester l’importance d’un facteur externe et celui de développer un outil pour le quantifier.
En l’absence de questionnaire standardisé propre à notre objet d’étude, en élaborer un nous
permettait de récolter de l’information spécifique, mais utiliser un outil non éprouvé impliquait que
certains volets soient moins précis. Les résultats obtenus peuvent donc témoigner tout à la fois de la
justesse de l’instrument de mesure et de l’importance de l’intégration sociale pour expliquer les
usages phonétiques.

L’indice ÉMERGENCE, au contraire, a été mesuré au moyen d’outils déjà disponibles et éprouvés
(Reifman et coll., 2007; Baggio et coll., 2015). Le questionnaire IDEA-8, composé de huit
questions évaluant à quel point les adultes émergents s’identifient comme tels, a été proposé à tous
les participants aux deux temps d’enquête. Différentes questions ont également permis de vérifier
s’ils avaient franchi les étapes d’entrée dans l’âge adulte que sont l’autonomie financière, la vie de
couple stable et la parentalité, sachant qu’aucun n’avait dépassé 25 ans et que tous étaient encore
aux études (constantes). Le score d’ÉMERGENCE obtenu par les participants tend à confirmer qu’ils
traversent la phase d’émergence de l’âge adulte, le résultat moyen de 24,8 s’approchant davantage
du maximum possible de 32 que du minimum de 5. Aucune tendance significative ne ressort
toutefois des analyses statistiques : l’indice ne varie pas en fonction du TEMPS, de la MOBILITÉ ou
du SEXE. Il ne permet pas non plus de prédire, contrairement à l’INTÉGRATION, la valeur de quelque
indice acoustique.

Comme mentionné précédemment (6.3), les questionnaires IDEA et IDEA-8 ont été conçus dans
l’optique de faire ressortir des différences individuelles parmi des témoins préalablement identifiés
comme adultes émergents afin de rendre compte de comportements différenciés (Baggio et coll.,
2015 : 247). Il semble ainsi que les tendances individuelles au score d’ÉMERGENCE ne permettent
pas d’expliquer les spécificités individuelles en production. N’observer aucune différence
significative entre les scores d’ÉMERGENCE des participants n’implique toutefois pas qu’il n’y ait
aucune différence entre eux. Simplement, leur sexe biologique, leur mobilité géographique et le
temps d’enquête ne permettent pas de justifier leur score, alors que d’autres facteurs que nous
n’avons pas pris en compte pourraient peut-être le faire. Que la première année d’université n’ait

217
pas causé de bouleversement majeur aux scores d’ÉMERGENCE suggère que les participants vivaient
déjà cette phase au T1, ce qui laisse supposer qu’elle s’entame, chez les jeunes Québécois, pendant
les études collégiales (Moulin, 2012). Par ailleurs, le fait de vivre ou non avec ses parents, une
distinction systématique entre les mobiles et les sédentaires, ne semble avoir aucune influence sur
l’appartenance plus ou moins grande à cette phase.

À notre connaissance, seul Bigham (2008) a explicitement cherché à interpréter des résultats
phonétiques en exploitant le cadre théorique de l’émergence de l’âge adulte. L’auteur reproduit dans
sa thèse des commentaires de ses participants qui constituent des signes évidents d’appartenance à
cette étape de la vie, bien qu’aucun questionnaire en tant que tel n’ait été utilisé. Parallèlement, il
observe chez sept étudiants universitaires sédentaires du sud de l’Illinois une tendance à l’adoption
de l’anglais de Chicago, qu’il associe au prestige du régiolecte, au contact avec des locuteurs de
Chicago sur le campus et au fait que les locuteurs traversent la phase d’émergence de l’âge adulte.
En somme, le postulat général de Bigham (2008, 2012) est que les nombreux bouleversements
psychosociaux qui marquent cette phase devraient se traduire par des changements linguistiques.
Accepter cette possibilité implique de ne pas considérer la post-adolescence comme une période de
stabilisation des usages (Labov, 1981; Chambers, 2009), ce qui a bien entendu des conséquences
sur l’interprétation de résultats fondée sur le principe de temps apparent (Wagner, 2012) et incite à
la réflexion sur le recours aux jeunes universitaires comme groupe de référence dans nombre
d’études (Gerstenberg et Voeste, 2015). Cependant, l’argumentaire de Bigham (2012) repose
davantage sur des possibilités théoriques que sur des résultats empiriques, aussi nous cherchions
dans le cadre de cette étude à alimenter la discussion.

Buchstaller et Wagner (2018 : 5) notent à propos de l’émergence de l’âge adulte : « there is no


consensus as to the relevance of this life stage on speakers’ trajectories ». Force est de constater que
les résultats de notre étude ne constituent pas un argument en faveur de sa pertinence. Rien ne
permet d’affirmer que les fins changements phonétiques observés chez nos participants, ou encore
leurs usages de manière plus générale, sont liés de quelque manière à leur statut d’adultes
émergents. Il s’agit d’une étiquette socio-psychologique qu’on peut leur accoler, mais qui n’a pas
forcément de conséquences sur leurs pratiques phonétiques. En revanche, nos locuteurs présentent
des scores d’ÉMERGENCE élevés et semblables. Ainsi, avant de déclarer hors de tout doute que cette
étape de la vie n’a pas d’impact sur la trajectoire linguistique d’un individu, il faudrait être à même
de comparer les productions de nos témoins à celles de locuteurs au profil semblable, soit de jeunes
adultes québécois âgés de 18 à 22 ans, qui obtiendraient un score d’ÉMERGENCE significativement
différent. Puisque nos participants étaient tous des étudiants universitaires, une possibilité aurait été

218
de les comparer à un groupe ayant déjà intégré le marché du travail et dont le score serait
vraisemblablement plus faible. Il est cependant fort probable qu’une panoplie de facteurs soient
impliqués dans l’appartenance différenciée à la phase d’émergence de l’âge adulte d’individus de
même âge et de même origine et que le score d’ÉMERGENCE ne soit pas, en réalité, isolable. En
l’état, nos résultats ne fournissent guère d’appui empirique à la réflexion théorique de Bigham
(2008, 2012), mais ils ne la discréditent pas non plus. Chose certaine, ils laissent penser que les
usages phonétiques des jeunes universitaires ne sont pas fixes.

Quant à l’indice FIDÉLITÉ, nous avons tenté, comme pour l’indice INTÉGRATION, de le mesurer au
moyen d’une série de questions inédites. Il a finalement été exploité de manière qualitative, puisque
nous avons jugé inquantifiables les réponses aux questions posées pour l’évaluer. Parmi les
problèmes rencontrés, l’interprétation de termes comme « accent » ou « façon de parler » s’est
révélée très variable d’un participant à l’autre, comme en témoignent certaines réponses reproduites
en Méthodologie (5.5.2.4). À quelques reprises, les demandes d’exemples ou de justifications sont
demeurées lettre morte. Dans certains cas, la réponse des participants semblait conforme à la réalité,
mais elle ne concordait pas avec nos attentes, par exemple l’expression de la surprise face aux
changements perçus dans la façon de parler alors que nous cherchions à vérifier la présence de
réactions positives ou négatives. Nous avons tout de même été en position de dégager un indicateur
des questions initialement formulées dans le but de mesurer l’indice FIDÉLITÉ : la conscience de la
variation. En croisant les réponses fournies au T1 par rapport à la perception d’un accent différent à
Québec et à la prise de conscience induite par les remarques d’autrui, les changements perçus par
les participants dans leur façon de parler depuis leur entrée à l’université et un commentaire
métalinguistique à propos du mot crabe formulé pendant une tâche de lecture, nous en sommes
venue à la conclusion que tous les participants mobiles avaient conscience de la variation. Bien
entendu, le terme variation est ici à interpréter de manière très large : il couvre aussi bien la
prononciation des mots crabe et baleine que [labʏs], les nombreux accents qu’il est possible
d’entendre sur le campus et « l’intonation » des femmes de Québec. Pour le reste, nous avons
dégagé une réaction clairement positive au changement d’accent perçu et deux réactions suggérant
plutôt la présence d’incitatifs à la fidélité, l’une provenant apparemment de la locutrice elle-même
et l’autre, du milieu d’origine du locuteur.

Vérifier, au T1, si les participants mobiles percevaient un accent à Québec et si depuis leur arrivée,
quelqu’un leur avait mentionné qu’ils en avaient un visait à établir s’ils avaient conscience de
différences phonétiques entre leur R1 et le R2, puisque dans toutes les études citées à ce propos
(2.4.3), la résistance au changement impliquait une telle conscience sociophonétique : il semble

219
falloir percevoir pour juger. À propos des mécanismes de cognition sociolinguistique, Campbell-
Kibler (2016 : 128-129) note :

The sociolinguistic abilities of individuals are complex and embedded in larger, even more
complex systems, but may roughly be categorized into three main types: the production of
sociolinguistically meaningful forms; the comprehension (linguistic and social) of such forms;
and metapragmatic behaviors which create, negotiate, and reaffirm meaning-form links. Note
that in practice comprehension can only be observed through metalinguistic acts or further
production […]

Au moyen des deux questions posées aux locuteurs mobiles au T1, nous cherchions à accéder à leur
compréhension des formes phonétiques, dans l’éventualité où leurs productions seraient des objets
sociolinguistiquement signifiants tributaires de cette compréhension. Recourir au questionnaire pour
aborder une question aussi complexe n’était pas, de toute évidence, la méthode la plus appropriée.

À la base, si nous avons songé à sonder les participants à ce sujet, c’est que nous ne disposions pas
d’information précise sur le statut sociolinguistique des formes phonétiques auxquelles nos
participants seraient confrontés, et ce, parce que nous ne savions pas à quelles formes phonétiques
ils seraient confrontés. Connaissant peu ce qui, en FQ, est sensible, nous avons tenté de voir si les
individus eux-mêmes l’étaient. Un autre moyen d’y arriver aurait été de conduire des entretiens. Les
baleine et crabe auraient émergé, mais nous aurions pu amener les participants à en dire plus et à
préciser certaines réponses qui sur papier, demeurent brèves et vagues, ce qui est d’ailleurs
compréhensible de la part de témoins ne disposant pas de connaissances et de vocabulaire
linguistiques poussés. De même, nous aurions pu mieux jauger l’interprétation qu’ont faite les
participants de termes comme « accent » et « façon de parler », et éventuellement, rectifier le tir afin
d’obtenir des réponses axées sur la prononciation. Quelques incertitudes entourant les questions
posées au T2 par rapport aux réactions positives ou négatives face aux changements perçus auraient
pu être résolues, par exemple la connotation contextuelle d’une réaction comme la surprise. En
somme, nous ne souhaitions pas, dans le cadre de cette thèse, nous engager dans une enquête
sociolinguistique en bonne et due forme, mais ne pas le faire impliquait que nous ne pussions
exploiter pleinement un facteur sociolinguistique comme le souci de fidélité. Néanmoins, en
supposant que nous eussions conduit des entretiens, rien n’indique qu’il aurait davantage été
possible d’en tirer un indice chiffré statistiquement exploitable, les réponses ouvertes étant
notoirement ardues à catégoriser et conséquemment, à quantifier (Dollinger, 2015).

L’INTÉGRATION, l’ÉMERGENCE et la FIDÉLITÉ ne sont que des facteurs parmi d’autres qu’il était
possible d’investiguer. En plus de ceux spécifiques à l’acquisition d’un R2 couverts au Chapitre 2
que nous avons choisi de ne pas exploiter, quelques renseignements supplémentaires récoltés au

220
moyen des questionnaires auraient pu présenter un intérêt. Par exemple, le niveau de scolarité des
parents des participants a été consigné. On pourrait ainsi chercher à comparer les productions des
locuteurs dont les parents ont complété des études supérieures à celles des universitaires de
première génération. Un autre aspect à considérer aurait pu être l’expérience linguistique hâtive des
témoins. Dès l’enfance, les auditeurs en contact étroit avec la diversité linguistique montrent une
capacité supérieure à la discrimination ou à la catégorisation de régiolectes (Evans, 2017; Jeffries,
2016), une tendance qui semble persister dans le temps (Clopper et Pisoni, 2004) mais dont les
conséquences en production demeurent incertaines. Le questionnaire démographique a permis de
consigner l’origine géographique des parents de nos participants, ainsi la question pourrait être
abordée61.

7.5 Français québécois, phonétique et corpus : perspectives


Même s’il ne s’agissait pas d’un objectif explicitement poursuivi par cette étude, la description du
phonétisme du FQ peut néanmoins en bénéficier. En particulier, nous estimons que nos résultats
acoustiques contribuent à éclairer le statut encore incertain du /ɛː/. Bien que nous l’ayons traité
comme un phonème dans le cadre de cette contribution, ce choix ne fait pas nécessairement
l’unanimité. Pourtant, déjà Santerre (1974 : 123) observait entre les voyelles de faite et de fête « une
distinction de timbre et de durée » dominée, selon lui, par le timbre, car celui-ci s’avère résistant à
la coarticulation alors que la durée varie en fonction du contexte consonantique de droite. Par
exemple, si le timbre des deux voyelles de la paire quasi-minimale lève-rêve demeure distinct,
l’action allongeante de /v/ rend leur durée similaire. Santerre (1974) préfère d’ailleurs substituer au
symbole /ɛː/ celui de /ɜ/ pour rendre compte de la primauté du timbre sur la durée dans la voyelle de
fête et de rêve (voir aussi Côté, 2012 : 240). L’auteur signale que les /ɜ/ ne sont pas toujours
diphtongués, mais que leur signature spectrale demeure néanmoins distincte de celle de /ɛ/. En effet,
si seul le « sujet populaire » de l’étude de Santerre (1974 : 137-138) produit des voyelles perçues
diphtonguées, les spectrogrammes tirés des occurrences produites par le « sujet cultivé » présentent
les mêmes caractéristiques acoustiques, seulement d’ampleur différente : le /ɜ/ de fête et de rêve est
caractérisé par la divergence des deux premiers formants en cours d’émission (chute de F 1 et hausse
de F2), tandis que ceux du /ɛ/ de faite et de lève convergent (hausse de F1 et chute de F2).

61
Notre tentative de récolter de l’information à propos des langues parlées autres que le français s’inscrivait
dans cette même perspective d’évaluation de l’expérience linguistique, mais comme mentionné
précédemment (5.5.2.1), la définition du bilinguisme s’est avérée trop variable pour que nous puissions
exploiter les réponses fournies.

221
Analysant les spectrogrammes de voyelles produites par quatre étudiants universitaires, Martin
(1995) observe quant à lui que le /ɛː/ long perçu monophtongué présente essentiellement les mêmes
caractéristiques spectrales que le /ɛ/ court, c’est-à-dire des fréquences formantiques semblables et
une légère réduction de l’écart entre F1 et F2 entre le premier et le deuxième tiers de la voyelle.
Quant au /ɛː/ long et perçu diphtongué, conformément à ce que notait Santerre (1974), ses deux
premiers formants divergent. Surtout, la plus grande proximité de F1 et de F2 au premier tiers de la
durée mène Martin (1995 : 44) à affirmer que « c’est assurément le caractère compact du rapport
F2/F1 […] au 1er tiers (sorte de [a]) qui caractérise avant tout la diphtongue étudiée ».

Pour notre part, nous constatons que contrairement à Santerre (1974), les deux premiers formants du
/ɛ/ court diminuent en cours d’émission, mais que comme Martin (1995), l’écart entre les deux tend
à se réduire, puisque la diminution de F2 (-66 Hz) est plus importante que celle de F1 (-18 Hz; voir
Figure 8). En ce qui concerne /ɛː/, comme les deux auteurs, nous observons une trajectoire
divergente, soit une diminution de F1 et une augmentation de F2. Cependant, comparativement à la
trajectoire spectrale de toutes les autres catégories vocaliques à l’étude, celle de /ɛː/ est d’une telle
magnitude que ce pourrait aussi bien être ce qui la caractérise que sa portion initiale compacte. De
plus, si à l’époque de Santerre (1974), la diphtongaison de /ɛː/ était le fait de « sujets populaires »,
au milieu des années 1990, Martin (1995 : 43) signale que « la diphtongaison est la norme actuelle
d’usage chez les jeunes universitaires québécois », tandis que Leblanc (2012 : 48) rapporte pour
cette voyelle un taux de diphtongaison perçue de 92 %. Le /ɛː/ long mais monophtongué, décrit par
Santerre (1974) comme acoustiquement semblable au /ɛː/ long diphtongué, et par Martin (1995)
comme similaire au /ɛ/ court, semble absent de notre corpus : soit que la voyelle est longue et
diphtonguée, soit qu’elle est courte et monophtonguée. L’assignation de la voyelle du mot plaide,
sujette à variation parmi nos locuteurs, à l’une ou l’autre des catégories (ɛbdɡ) et (ɛːbdɡ) n’a
d’ailleurs donné lieu à aucune hésitation.

À la lumière de cette description acoustique, nous pensons que le /ɛː/ long devrait non seulement
être traité comme un phonème du FQ, mais comme une diphtongue. Considérant que son timbre se
ferme et s’antériorise en cours d’émission, et qu’à 50 % de la durée, il se situe à mi-chemin entre /a/
et /ɛ/, nous proposons de le transcrire /aɛ/. Nous n’excluons pas que l’amplitude de la trajectoire
spectrale de ce phonème varie en fonction de facteurs comme l’origine géographique du locuteur,
ou encore la formalité de la situation de communication (Reinke, 2005). Sa distribution lexicale
pourrait également être sujette à variation en FQ, par exemple en ce qui a trait au mot plaide dans
notre corpus, ou dans des unités comme arrête, connaisse ou baleine. Quant à une éventuelle

222
prédominance du timbre ou de la durée, il serait nécessaire d’effectuer des tests de perception pour
pousser plus avant la réflexion.

Au moment de constituer notre corpus, nous avons choisi le mot prépare pour représenter la
catégorie (aʁ). Lors des enregistrements et d’écoutes subséquentes des fichiers sonores, nous avons
toutefois remarqué que la voyelle était fréquemment postériorisée. Comme précisé en Méthodologie
(5.4.2), nous avons alors assigné chacune des 198 occurrences aux catégories (aʁ) ou (ɑʁ), selon le
timbre perçu. La Figure 35 présente la répartition des occurrences de prépare étiquetées [a] et [ɑ]
dans l’espace F1/F2, comparativement aux ellipses de dispersion correspondant aux mots face, part
et porc, qui représentent les catégories (afsʃ), (ɑʁ) et (ɔʁ) respectivement.

Figure 35 : Diagrammes F1/F2 présentant la répartition des 198 occurrences du mot prépare selon le
timbre perçu : les 95 [a] sont en rouge et les 103 [ɑ], en noir; les productions des hommes sont à gauche
et celles des femmes, à droite. L’ellipse de dispersion des voyelles des mots face, part et porc est donnée
comme référence

La Figure 35 montre que les occurrences de la voyelle finale de prépare se répartissent dans les
espaces occupés aussi bien par les catégories (afsʃ), (ɑʁ) que (ɔʁ). Au-delà du fait que l’étiquetage
de certaines voyelles aurait sans doute bénéficié d’un accord inter-juges, ces graphiques illustrent
clairement que le timbre de la voyelle finale du mot prépare est fortement sujet à variation en FQ. Il
y a maintenant trois décennies, Dumas (1987 : 139) indiquait que la voyelle des mots à finale en
/aʁ/ était habituellement postériorisée, [ɑʁ], en FQ, mais que quelques unités lexicales comme gare,
guitare, cigare, bagarre et tare faisaient figure d’exception et étaient prononcées [aʁ]. En
sélectionnant prépare, nous estimons avoir choisi un mot se rangeant parmi les exceptions évoquées
par Dumas (1987), ce que confirme d’ailleurs Côté (2012 : 248), qui qualifie même prépare de
« arguably the most deeply entrenched /a/-form ». En regard de la présence importante de [ɑ] et du

223
fait que 9 locuteurs ont alterné entre [a] et [ɑ] d’une tâche de lecture à l’autre, il semble donc qu’un
changement soit en cours en FQ et que les exceptions en [aʁ] tendent à disparaître au profit de la
forme [ɑʁ]. Côté (2012) formule également cette hypothèse, mais dans le cadre de son analyse
auditive du corpus PFC récolté à Trois-Rivières, la postériorisation de la voyelle accentuée du mot
prépare semble plus marginale (1 locuteur sur 12) que ce que nous observons (plus de la moitié des
occurrences). La voyelle finale d’autres mots (bulgare, guitare, sépare…) est plus volontiers
postériorisée, mais l’auteure signale que le phénomène demeure le fait des jeunes locuteurs de son
corpus, les plus âgés produisant exclusivement des variantes antérieures. Ce vraisemblable
changement, cela va de soi, gagnera à être documenté par l’analyse auditive et acoustique de plus de
données, notamment des mots exacts nommés par Dumas (1987).

La Figure 35 montre par ailleurs un chevauchement substantiel entre les catégories (ɑʁ) et (ɔʁ).
Dans une étude précédente (Arnaud et Riverin-Coutlée, 2014, 2016), nous observions bien une
tendance à la fusion entre les deux catégories, mais qui visuellement, n’atteignait pas celle illustrée
ici. À première vue, nous pourrions donc supposer que la fusion de (ɑʁ) et de (ɔʁ) a progressé en
FQ depuis l’enregistrement du corpus CAVOQ (2010-2012). Cependant, nous constations
également dans le cadre de cette étude que les locuteurs de Québec présentaient un taux de fusion
supérieur à celui des locuteurs de Saguenay, mais il nous était impossible de déterminer qui, des
locuteurs de Québec ou de Saguenay, présentait des usages spécifiques, et qui présentait des usages
plus répandus. D’après nos résultats, il semble que la fusion soit moins importante à Saguenay
qu’elle ne l’est ailleurs au Québec, ce qui devra bien entendu être confirmé par l’étude d’un corpus
plus exhaustif que le nôtre, qui ne comprend qu’une paire minimale (ɑʁ)-(ɔʁ) produite par
seulement un à quatre locuteurs provenant de neuf régions administratives autres que la Capitale-
Nationale.

Un angle d’analyse qui demeurera à exploiter est celui de l’effet, sur les fréquences et trajectoires
formantiques et sur la durée, du CONTEXTE consonantique de droite. À l’origine, nous avons choisi
de constituer un corpus organisé en fonction de huit contextes plutôt que quatre ou cinq comme
dans la littérature antérieure sur le FQ (Yaeger, 1979; Paradis, 1985; Leblanc, 2012) afin de mieux
rendre compte de certaines réalités acoustiques récemment décrites (Sigouin et Arnaud, 2015;
Arnaud et Riverin-Coutlée, 2014, 2016), ou à titre exploratoire, par exemple en ce qui concerne la
distinction entre (Vbdɡ) et (Vl). En exploitant les résultats des analyses statistiques effectuées sur le
facteur CONTEXTE, nous pourrons mettre à jour le concept de classe vocalique en FQ : soit que la
classification antérieure demeurera la plus pertinente, soit que de nouveaux regroupements pourront

224
être proposés. En termes de modélisation de la proximité entre contextes consonantiques, des
analyses par regroupements hiérarchiques pourraient représenter une option intéressante.

Nous sommes toutefois consciente de la complexité de la question. La seule facette que nous ayons
déjà explorée, c’est-à-dire la classification de (Vʁ) parmi les contextes appelant des variantes
tendues ou parmi ceux appelant des variantes relâchées des voyelles /i y u/ (voir note 47), s’est
avérée délicate. En tenant compte de l’ensemble des analyses statistiques effectuées, (Vʁ) se
distinguait davantage de (Vvzʒ) et (V#) que des autres contextes, ce qui nous a menée à le
considérer, aux côtés de (VN), (Vptk), (Vfsʃ), (Vbdɡ) et (Vl), comme un contexte appelant des
variantes relâchées. Cette classification n’est cependant pas apparue pertinente pour tous les indices
acoustiques analysés. En termes de durée, les voyelles produites en contexte (Vʁ) se rapprochent
davantage de celles produites en contexte (Vvzʒ) que de celles produites dans tous les autres
contextes. De la même manière, le regroupement (V#)-(Vvzʒ) est valide dans la mesure où la valeur
des deux premiers formants est concernée, mais il n’est pas empreint de la plus grande cohérence
lors de l’analyse de la durée (voir Figure 10).

Le concept de classe vocalique est donc susceptible de varier en fonction de l’indice acoustique
analysé, entre autres facteurs (à ce propos, voir Arnaud, 2006 : 240). De plus, les huit classes de
notre étude sont fondées sur le mode, le voisement et la nasalité des consonnes, laissant en suspens
la question des effets de la labialité, de l’organe et du lieu d’articulation sur la voyelle précédente.
En français, la coda de la syllabe accentuée n’est par ailleurs pas toujours aussi simple que dans
notre corpus, où apparaît une consonne au maximum. Enfin, l’influence potentielle du contexte
consonantique de gauche demeure à creuser. Dans le cadre de notre étude sur les caractéristiques
acoustiques de (ɛ#), les fréquences formantiques à 25 % et à 50 % de la durée sont apparues
sensibles à certains contextes consonantiques de gauche, particulièrement /ɡ/, mais également, dans
une moindre mesure, /ʁ/ (Riverin-Coutlée, 2014 : 141). Récemment, St-Gelais et coll.
(2018 : 520-521) ont eux aussi évoqué une possible influence du /ʁ/ antéposé sur le F2 de /ɔ/ à 50 %
de la durée.

Nous avons extrait de chaque voyelle plus d’un ensemble de mesures des fréquences formantiques :
en plus des mesures centrales habituelles, nous en avons relevé à 25 % et à 75 % de la durée
vocalique. Ce choix était appuyé, d’une part, par la présence potentielle de voyelles diphtonguées,
dont la caractérisation acoustique nécessite une paramétrisation plus exhaustive que le seul relevé
des fréquences formantiques à l’état stable (Lehiste et Peterson, 1961). En ne limitant pas la prise de
mesures multiple aux voyelles diphtonguées, une étape de classification auditive préalable à

225
l’analyse acoustique était évitée. D’autre part, une littérature développant l’hypothèse du VISC
(Nearey et Assmann, 1986; Morrison et Assmann, 2013), selon laquelle les voyelles possèdent une
dynamique inhérente et indépendante du contexte consonantique, met également de l’avant l’intérêt
d’une paramétrisation acoustique plus riche.

Nos prises de mesures à 25 % et à 75 % de la durée ont permis de constater, tel que discuté ci-avant,
que la trajectoire des deux premiers formants des 15 catégories vocaliques analysées plaçait /aɛ/
dans une classe à part. D’autres voyelles présentaient également une trajectoire formantique plus
importante que les autres, qui combinée à une durée également plus élevée, laissait présumer un
timbre diphtongué n’atteignant pas nécessairement l’ampleur de /aɛ/. Nous avons cependant signalé
que la trajectoire formantique des voyelles avait été moyennée sans tenir compte du contexte
consonantique de droite. Dans l’optique d’une exploration future des effets du facteur CONTEXTE,
une observation plus détaillée de son impact sur les trajectoires formantiques pourrait contribuer à
la réflexion sur la validité, en FQ, de l’un des postulats du VISC : la résistance de la dynamique
spectrale à la coarticulation.

Dès lors que plusieurs points de mesure sont en jeu, différents volets de l’analyse se complexifient.
Comme le souligne Thomas (2011 : 150), la représentation graphique perd en convivialité. La
corrélation entre les différentes mesures en cours d’évolution d’un formant doit être prise en charge
par le modèle statistique élaboré. Si une procédure de normalisation est utilisée, disons la
transformation en scores-z (Lobanov, 1971), fréquente dans l’étude de la variation (Adank et coll.,
2004), il faut choisir entre : calculer l’écart-type à partir de la moyenne des fréquences formantiques
en un seul point de mesure (50 % par exemple); moyenner tous les points de mesure; ou traiter
indépendamment chacun des points de mesure, c’est-à-dire calculer une moyenne et des écart-types
pour chacun d’entre eux, comme s’ils n’avaient aucun lien avec les autres. Une paramétrisation
particulièrement sophistiquée peut également isoler l’étude, c’est-à-dire rendre ses résultats
incomparables.

En soustrayant la valeur des fréquences formantiques à 25 % de celle à 75 %, nous obtenions une


mesure unique de trajectoire spectrale certes très simple, mais qui permettait d’éviter certaines des
embûches mentionnées. L’indice résultant de la soustraction s’apparente si peu à la valeur des
fréquences formantiques à 50 % de la durée que les traiter comme deux objets complètement
distincts sur le plan statistique est conceptuellement acceptable. De plus, les trajectoires
formantiques des hommes et des femmes ne se sont révélées significativement différentes qu’au
terme de deux analyses statistiques sur les 45 effectuées (dynamique du F1 de [i] et de [y]). Sans

226
affirmer que notre modélisation possède un potentiel normalisateur, il demeure que les écarts entre
les fréquences formantiques brutes attribuables aux différences physiologiques entre les hommes et
les femmes ne se reflètent pas dans les indices dynamiques calculés. En termes de projection
graphique, les plans cartésiens (Figure 8 et Figure 9) souffrent sans doute de l’absence de
correspondance visuelle avec les représentations biformantiques usuelles, mais constituent
néanmoins une option interprétable et apte à mettre en relief l’amplitude et la direction des
trajectoires. Dans le cadre de notre étude, les occurrences étaient cependant nombreuses, et à
l’exception de /aɛ/, les différentes catégories vocaliques possédaient une trajectoire de valeur
relativement semblable. Elles étaient ainsi si rapprochées l’une de l’autre dans les plans cartésiens
qu’il aurait été impensable d’y projeter l’ensemble des occurrences à la manière des diagrammes de
dispersion F1/F2 et F2/F3. La validité des plans cartésiens se limite donc à la représentation de
valeurs moyennes et, à la rigueur, d’ellipses de dispersion sans occurrences individuelles, ou encore
à un nombre plus limité de catégories.

Un paramètre acoustique dont nous n’avons pas tenu compte dans cette étude mais qui aurait pu se
révéler instructif est la fréquence fondamentale (f0), dont le corrélat perceptif est la hauteur de la
voix. Plus la f0 est élevée, plus la voix est perçue aigüe. Dans les langues du monde, la f 0 a
également été associée à l’aperture des voyelles : sa valeur tend à être plus élevée pour les voyelles
fermées que pour les voyelles ouvertes (Whalen et Levitt, 1995; Maddieson, 1997). En
conséquence, le degré d’aperture vocalique peut être exprimé par la différence entre F1 et la f0
(convertis en Bark), où une valeur élevée indique une grande aperture, plutôt que par la valeur
absolue de F1 (Syrdal et Gopal, 1986; Ménard et coll., 2002). Considérant que le premier formant de
toutes les voyelles de notre corpus excepté /a/ et /ɑ/ a augmenté au cours du temps, on peut
s’interroger sur l’évolution parallèle de la f0. La distance entre les deux indices est-elle restée la
même, s’est-elle plutôt accrue ou réduite ? En supposant qu’elle se soit réduite ou qu’elle soit
demeurée identique, cela impliquerait une augmentation de la fréquence fondamentale du T1 au T2,
c’est-à-dire une voix plus aigüe au T2. Chez de jeunes adultes de 18 à 22 ans, ce scénario ne serait
pas le plus évident à lier à des facteurs physiologiques. La prise en compte de la f0 permettra
éventuellement de le confirmer, mais d’emblée, il apparaît ainsi peu probable que les différences
observées entre T1 et le T2 soient la conséquence d’une croissance inachevée. Le calcul du rapport
entre la f0 et F1 permettrait néanmoins de valider ce que nous observons sur F1 seulement ou sur la

227
distance entre F1 et F362 et pourrait offrir des indications préliminaires sur la perceptibilité des
changements acoustiques observés.

Ce que nous avons exploité dans le cadre de cette contribution ne représente à vrai dire que la partie
émergée des possibilités offertes par notre corpus. Nous avons déjà fait mention, parmi ce qu’il
serait possible de traiter, de l’effet du contexte consonantique. Les points de mesure à 25 % et à
75 % de la durée pourraient également être utilisés pour tester d’autres paramétrisations de la
dynamique spectrale que celle utilisée (Nearey et Assmann, 1986 : 1303). Tenir compte de la
fréquence fondamentale pourrait permettre une investigation indirecte de la perceptibilité des
changements vocaliques observés du T1 au T2. Par ailleurs, chaque tâche de lecture amenait les
locuteurs à produire, en plus des 76 voyelles orales analysées dans le cadre de cette contribution, 20
voyelles nasales encore inexploitées : / / apparaissant dans sept contextes consonantiques, /ɔ/ et / /
dans cinq contextes, /œ/ dans deux contextes et le /aɛ/ nasalisé du mot même. Le corpus comprend
en outre 13 mots cibles bisyllabiques dont la syllabe pénultième possède comme noyau les voyelles
/e/ ou /ɛ/, inclus dans le but éventuel d’explorer davantage le phénomène de neutralisation
mentionné par Martin (1998b) et Walker (1984). Pour cette étude, les données provenant des
voyelles produites dans les trois tâches de lecture ont été moyennées, mais il ne serait pas
impensable de les envisager de manière comparative. Nous ne nous sommes concentrée que sur les
segments vocaliques, mais de nombreuses consonnes figurent également dans le corpus, soit dans
les mots cibles eux-mêmes ou dans les phrases porteuses des tâches 1 et 2. D’ailleurs, lesdites
phrases porteuses pourraient être mises à profit : celle de la tâche 2 est répétée 96 fois par chacun
des locuteurs à chaque temps d’enquête, alors que celles de la tâche 1 sont lexicalement
diversifiées. Enfin, nous avons exclusivement tenu compte des productions des 33 locuteurs qui ont
participé au volet longitudinal de l’étude. En réalité, le corpus récolté au T1 est composé de la
parole de 60 locuteurs du FQ : 52 étudiants de l’Université Laval et 8 de l’UQAC. Toutes les
données exploitées dans le cadre de cette contribution, c’est-à-dire la durée et la fréquence des trois
premiers formants à 25 %, à 50 % et à 75 % de la durée extraites de 228 voyelles orales, sont
également disponibles pour les 19 étudiants de l’Université Laval enregistrés au T1 seulement.

62
Comme mentionné précédemment (7.2), Thomas et Kendall (2007) expriment le degré d’aperture des
voyelles par la différence entre F1 et F3 convertis en Bark. Dans l’éventualité où nous explorerions la question
de la distance inter-formantique, la distance entre la f0 et F1 pourrait être comparée à celle entre F1 et F3.

228
Conclusion
Bilan
Limites générales
L’acquisition d’un second régiolecte : tendances actuelles et futures
Apports interdisciplinaires

Bilan
Dans le cadre de cette thèse, nous nous sommes intéressée à l’acquisition d’un R2 et au changement
phonétique chez les jeunes universitaires francophones québécois. Notre objectif de recherche
principal était de déterminer si des migrants interrégionaux acquerraient un R2 du FQ au cours de
leur première année de baccalauréat à l’Université Laval. À la lumière de notre analyse des
résultats, nous sommes parvenue à la conclusion qu’un tel phénomène ne s’était pas produit. Les
participants mobiles de notre étude ne semblent pas avoir modifié leur prononciation de manière à
adopter des usages phonétiques en cours dans la ville de Québec et différents de ceux de leur milieu
d’origine. Il est possible que le temps de résidence réduit à Québec soit à l’origine de cette
observation, mais aussi que le principal input linguistique des participants provienne moins de la
population locale que des autres étudiants, dont l’origine géographique est variée (Nycz, 2015).
Nous sommes également consciente qu’en axant le traitement statistique sur le groupe plutôt que
sur l’individu et en réduisant la complexité du signal de parole à quelques paramètres acoustiques,
nous avons possiblement passé outre certains changements. Non seulement des modifications ont
pu affecter d’autres dimensions du signal sonore, mais aussi d’autres niveaux linguistiques, le
lexique, en particulier, étant réputé changer le premier (Chambers, 1992). Cette possibilité soulève à
son tour une question plus fondamentale : la variation phonétique en FQ est-elle suffisamment
structurée sur le plan géographique pour que des migrants interrégionaux aient un R2 à acquérir ?
Une réponse plus claire que celle dont nous disposons actuellement serait nécessaire pour bien
comprendre les raisons pour lesquelles les participants mobiles de notre étude n’ont apparemment
pas acquis de R2.

Répercussion de la transformation des sociétés occidentales au XXe siècle, les attentes envers les
jeunes adultes, les responsabilités qui leur incombent et leur profil psychologique ont changé. La
phase de bouleversements multiples et intenses résultante, nommée émergence de l’âge adulte
(Arnett, 2000), était au cœur de notre second objectif de recherche, qui consistait à vérifier si
traverser cette étape disposait les jeunes universitaires québécois à modifier leur prononciation,
indépendamment de leur mobilité géographique. Nos résultats n’offrent qu’une réponse mitigée.
Les locuteurs ont effectivement modifié leur prononciation au cours de leur première année
d’université, et ce, qu’ils soient mobiles ou sédentaires. L’idée de fixité des usages post-adolescence

229
est donc à nuancer et les chercheurs qui choisissent des méthodes impliquant ce postulat doivent en
être conscients. Cependant, bien que tous nos participants semblent traverser la phase d’émergence
de l’âge adulte et que tous aient changé leurs usages, nous ne pouvons conclure à un lien entre les
deux phénomènes. Il serait essentiel, pour ce faire, de parvenir à la constatation que les usages de
locuteurs ne traversant pas la phase d’émergence de l’âge adulte mais au profil autrement similaire
demeurent fixes. Nos résultats ne permettent pas cette observation, et à notre connaissance, nous ne
pouvons établir de parallèle avec d’autres études portant sur le phonétisme du FQ et exploitant le
concept d’émergence de l’âge adulte. En l’état, notre analyse n’indique donc pas que cette étape de
la vie est déterminante dans le parcours linguistique d’un locuteur, mais elle ne permet pas
davantage de rayer cette possibilité.

D’autres facteurs ont été considérés dans le but d’expliquer les potentiels usages et changements
phonétiques différenciés des participants. Notre troisième objectif consistait effectivement à
évaluer, d’une part, le rôle de l’intégration sociale des locuteurs dans la production de patrons
phonétiques. D’autre part, ciblant exclusivement la part de notre échantillon composée de locuteurs
mobiles, nous avons tenté de vérifier s’ils étaient exposés à des incitatifs à ne pas adopter un R2.
Nous avons constaté que plus un participant était intégré, plus la fréquence du troisième formant de
ses voyelles était élevée. Le ou les corrélats articulatoires de F3 n’étant pas aussi univoques et
documentés que ceux de F1 et de F2, il nous est cependant difficile de proposer une interprétation
phonétique plausible de cette tendance acoustique. Les participants présentaient en outre un indice
d’intégration plus élevé au deuxième temps d’enquête qu’au premier, un changement qui ne semble
cependant pas lié aux modifications phonétiques mesurées en parallèle. Puisque nous avons utilisé
un outil inédit pour évaluer l’intégration, d’inévitables imperfections telles que les stratégies de
quantification des réponses et la pondération des différents sous-indices pourraient justifier que
l’intégration soit aussi peu explicative des usages phonétiques des participants. De plus, nous
n’avons pas pu aller plus loin dans notre investigation du potentiel souci des participants mobiles de
demeurer fidèles à leurs origines que de déduire que tous avaient conscience de différences entre
leurs usages linguistiques et ceux en cours dans leur nouvel environnement.

Limites générales
Notre étude comporte différentes limites qu’il convient de souligner. D’abord, comme mentionné en
Méthodologie (5.3), nous souhaitions mener une étude comparable aux autres travaux effectués sur
le changement phonétique en contexte universitaire (Evans et Iverson, 2007; Bigham, 2010; Pardo
et coll., 2012; Wagner, 2012; De Decker, 2006; Campbell-Kibler et coll., 2014). Dans cette
perspective, un échantillon composé de 33 locuteurs âgés de 18 à 22 ans, dont 18 mobiles, semble

230
approprié. En revanche, notre étude ne peut être considérée représentative ni du phonétisme du FQ
à l’échelle de la population, ni des conséquences d’un déménagement sur la prononciation du FQ.
L’empan temporel d’un an a été choisi à la fois parce qu’il était comparable à celui considéré dans
les autres études en contexte universitaire, et parce qu’il s’insérait dans le temps imparti à la
complétion d’études doctorales. Nous avons toutefois émis l’hypothèse que cet intervalle réduit
puisse expliquer que les témoins mobiles n’ont pas davantage modifié leur prononciation (7.3).
Nycz (2015 : 476) mentionne qu’il s’agit de l’un des inconvénients de toute investigation du
changement phonétique en contexte universitaire : même si le chercheur n’a pas de contrainte de
temps, il n’est guère possible d’envisager une étude qui couvre une période plus importante que les
trois à quatre ans habituellement nécessaires pour obtenir un diplôme de premier cycle. Les travaux
sur le changement en contexte universitaire ne portent donc pas forcément sur une mobilité
représentative, ainsi les modifications observées ne sont pas assurées d’être celles qui surviennent
dans d’autres contextes ou sur une période plus vaste. Une autre spécificité de la population
universitaire est qu’elle n’est pas nécessairement stratifiée de la même manière que la société en
général. En particulier, la classe socio-économique et ses effets sont très difficiles à évaluer au sein
d’une population adulte de même niveau de scolarité et dont la principale occupation n’est pas un
emploi rémunéré. La courbe d’âge n’est pas du tout identique non plus. Ainsi, les macro-catégories
du canevas variationniste de la première vague (Eckert, 2012) peuvent difficilement être utilisées en
contexte universitaire, mais peut-être y retrouve-t-on néanmoins des facteurs de stratification
spécifiques qu’il aurait été pertinent pour nous de prendre en compte. Nous avons par exemple
évoqué la possibilité d’une comparaison entre les étudiants de première génération et ceux dont les
parents détiennent un diplôme universitaire (7.4).

Nous avons opté pour une méthode d’échantillonnage reposant sur la participation de volontaires
(Beaud, 2009) et n’avons pas procédé à un redressement subséquent, des choix qui n’assuraient pas
un échantillon équilibré. L’attrition relativement importante (34 %) a ensuite opéré une coupe non
ciblée. L’échantillon final avec lequel nous avons dû composer est donc la conséquence combinée
de nos choix initiaux et d’une attrition sur laquelle nous n’avions aucun contrôle. Le nombre de
locuteurs (10) et de locutrices (23) s’avère inégal, un déséquilibre essentiellement attribuable aux
mobiles (3 hommes et 15 femmes)63. Rappelons néanmoins que cette catégorisation repose sur le

63
Au T1, le nombre d’hommes et de femmes mobiles était déjà déséquilibré (7 et 24), mais le nombre
d’hommes mobiles et sédentaires était comparable (7 et 8). Cela dit, la population de l’Université Laval n’est
elle-même pas tout à fait équilibrée : bon an mal an, les étudiantes représentent environ 60 % des inscriptions
au premier cycle (d’après les Séries statistiques publiées à l’intention du personnel par le Bureau du
registraire de l’Université Laval, citées à la note 33).

231
sexe biologique apparent des participants, laissant en suspens la question des effets du genre auquel
ils s’identifient. Nos méthodes et critères de recrutement ont également mené à la composition d’un
groupe de locuteurs mobiles provenant de nombreuses villes et régions du Québec. Un échantillon
mieux équilibré et d’origine plus homogène aurait sans doute été plus facile à analyser. Par ailleurs,
nous avons choisi de faire appel à des participants âgés de 18 à 25 ans afin de mettre à l’épreuve
l’hypothèse de Bigham (2012) concernant l’émergence de l’âge adulte, mais ne recruter que des
universitaires de cette tranche d’âge n’aura finalement pas permis une analyse comparative.

Dans le cadre de cette étude, nous avons exclusivement tenu compte du changement de nature
phonétique. Bien entendu, ce que les locuteurs produisent, incluant ce qui est susceptible de changer
en un an, ne se limite pas à la prononciation (Chambers, 1992; Kerswill, 1996). Dans sa réflexion
sur la notion de dialecte, Harris (1990) émet d’ailleurs des réserves quant à la séparabilité des
niveaux linguistiques. De plus, le matériel phonétique analysé se limite aux voyelles orales
accentuées provenant de 76 mots sélectionnés parce que nous les jugions courants en FQ, sans
motifs théoriques plus précis. Inévitablement, les variables ciblées ne rendent pas toute la
complexité du signal de parole, bien que nous ayons choisi des indices acoustiques robustes et
éprouvés. Puisque nous effectuions une étude pionnière de l’acquisition d’un R2 en FQ, nous nous
sommes concentrée sur les potentiels changements en production, laissant de côté la perception.
Nous n’avons tenu compte d’aucune autre forme de parole que celle produite lors de la lecture de
scripts en laboratoire. Comme mis en exergue par les arguments de Xu (2010), ce choix n’est pas
problématique en soi, mais nous sommes consciente du fait qu’il ne s’agit pas de la seule manière
de produire et de récolter de la parole, et que nous ne pouvons induire que nos observations
s’appliquent intégralement aux autres contextes.

Nous avons fait état, dans la section 7.4, de quelques obstacles posés par les questions utilisées pour
mesurer les indices INTÉGRATION et FIDÉLITÉ. Par exemple, le codage des réponses aurait pu être
plus nuancé, les sous-échelles ne sont pas parfaitement indépendantes, certains renseignements sont
plus difficiles à récolter en utilisant des questionnaires autoadministrés, etc. Ces quelques difficultés
proviennent de ce qu’entreprendre une étude sur un sujet ne découlant pas d’une longue tradition de
recherche implique de ne pas disposer d’outils standardisés éprouvés. Ainsi, nous avons mis au
point des questions adaptées à notre objet d’étude, mais des améliorations pourraient certainement
leur être apportées. Idéalement, l’indice INTÉGRATION serait également à tester par ailleurs. Nous
sommes en outre parvenue à établir que tous les mobiles étaient conscients de la variation et
conséquemment, nous sommes interrogée sur le rôle de ce facteur lors d’un changement
phonétique. Il n’a pas été possible de développer davantage notre réflexion parce que les questions

232
qui nous ont permis d’évaluer la conscience de la variation ont été posées aux participants mobiles
seulement. Il semble donc qu’il eût été bénéfique d’interroger les témoins sédentaires sur leur
conscience de la variation sur le campus et des changements apportés à leur prononciation,
puisqu’eux aussi ont modifié leurs usages au cours du temps. De surcroît, comme les mobiles
mentionnent que certains de leurs usages ont changé au contact de locuteurs ne provenant pas de
Québec (7.3), sonder les sédentaires sur le sujet aurait également permis de dégager dans quelle
mesure les changements pouvaient avoir été initiés par la fréquentation du milieu universitaire
plutôt que de la population locale.

L’acquisition d’un second régiolecte : tendances actuelles et


futures
Il est possible d’anticiper, d’après ce qui se dégage de la littérature récente, certaines des directions
qu’empruntera à court ou à moyen termes l’étude du changement phonétique à l’âge adulte, de
l’acquisition d’un R2 et de la variation sociophonétique de manière plus générale. La manière dont
notre étude a été conçue ne permet pas nécessairement de l’inscrire dans les différents enjeux
émergents qui seront abordés dans cette section, mais nous tâcherons de montrer en quoi ils
contribuent à la cohésion et à une meilleure compréhension des résultats issus d’études portant sur
l’acquisition d’un R2.

L’un des enjeux actuels concerne le rôle de la fréquence lexicale dans le changement phonétique,
une dimension que nous n’avons pas contrôlée lors de la conception de notre corpus mais que nous
pourrions explorer. Testant un modèle d’acquisition d’un R2 par règles (plutôt qu’au mot à mot),
Rys et Bonte (2006) constatent que la fréquence des unités lexicales auxquelles s’applique une règle
est positivement corrélée au succès de son acquisition. Pour leur part, Hay et Foulkes (2016)
constatent qu’un changement en anglais néo-zélandais, soit le remplacement de l’occlusive [t] en
position intervocalique par les variantes voisées [d]/[ɾ], est mené par les unités lexicales fréquentes.
Nycz (2013) observe un patron d’acquisition de l’anglais américain similaire chez des Canadiens
anglophones vivant aux États-Unis. À la lumière des modèles à exemplaires (3.4), cette tendance
s’explique par le fait que la représentation mentale d’une unité lexicale fréquente est plus souvent
mise à jour et est ainsi plus susceptible de s’aligner sur la parole ambiante qu’une unité moins
fréquente, à laquelle l’auditeur n’a pas nécessairement été exposé dans un passé récent. Les
expériences récentes auraient donc un impact disproportionné (Sancier et Fowler, 1997; Johnson,
1997; Hay et coll., 2010). Cependant, Reubold et Harrington (2018) observent que lors du repli
phonétique d’Alistair Cooke, les unités fréquentes sont affectées en premier lieu, alors que la parole
ambiante, dont dépend la mise à jour des exemplaires, n’a pas changé. Les auteurs rappellent alors

233
que les unités fréquentes bénéficieraient de représentations cognitives plus robustes (Pierrehumbert,
2006), ainsi dans ce cas précis, l’effet de la récence serait supplanté par celui de la fréquence. Les
anciennes représentations seraient moins sujettes à détérioration et demeureraient accessibles à
l’occasion d’un repli comme celui d’Alistair Cooke, ou encore lorsqu’il y a perturbation, ce qui
expliquerait que les auditeurs de Howell et coll. (2006) reprennent des traits de leur R1 dans des
conditions d’écoute altérées (Reubold et Harrington, 2018 : 146). De la même manière, bien que les
auditeurs mobiles de Walker (2018) aient de meilleures capacités que les sédentaires à comprendre
dans le bruit des phrases produites dans leur R2, ils ne perdent pas pour autant leurs habiletés
perceptives en R1. La situation se complexifie néanmoins dès lors que la notion de saillance entre
en jeu : Nycz (2013) constate effectivement que l’acquisition des unités fréquentes est plus rapide,
dans la mesure où elles ne sont pas également saillantes, auquel cas elles sont moins propices au
changement. Ces quelques exemples illustrent, d’une part, qu’en raison de l’omniprésence de la
notion de saillance et du fort impact qu’on lui attribue, il est crucial d’en améliorer notre
compréhension et notre définition (Campbell-Kibler, 2016; MacLeod, 2014; Watson et Clark,
2013), et d’autre part, que la discussion entourant le rôle de la fréquence des unités lexicales dans le
changement phonétique est loin d’être terminée.

Si la notion de saillance et des concepts comme ceux de marqueur, d’indicateur et de stéréotype


(Labov, 1976 : 419) ciblent ce qui est sensible dans le discours et à l’échelle d’une communauté
linguistique, des chercheurs tâchent actuellement de repérer les individus plus ou moins flexibles,
conscients ou sensibles afin de justifier l’hétérogénéité des patrons d’acquisition et d’usages
phonétiques. Une stratégie mise en place pour y arriver est de corréler les patrons linguistiques
observés chez les participants à des traits de leur personnalité, tels que définis au moyen de tests
standardisés développés dans des secteurs de recherche connexes comme la psychologie,
similairement à ce que nous avons tenté d’effectuer avec le questionnaire IDEA-8 (Reifman et coll.,
2007; Baggio et coll., 2015).

Yu et coll. (2013) suscitent la convergence phonétique en exposant des participants anglophones à


de la parole avec VOT allongés et les soumettent à une batterie de tests évaluant, entre autres,
certains traits de personnalité, comme le BFI (Big Five Inventory, John et coll., 2008) et le test AQ
(Autism-Spectrum Quotient, Baron-Cohen et coll., 2001). Concernant ce dernier, Yu et coll.
(2013 : 3) précisent que les troubles du spectre de l’autisme sont caractérisés par des déficits de la
flexibilité interactionnelle, communicationnelle et comportementale. Administrer le test AQ à un
échantillon non clinique comme celui prenant part à l’étude de Yu et coll. (2013) vise à corréler le
degré de convergence phonétique à la flexibilité relative d’un locuteur, l’hypothèse générale étant

234
qu’un individu moins flexible pourrait être sensible aux détails phonétiques, mais pourrait ne pas
être en mesure de les réutiliser au moment opportun. Les résultats indiquent que deux traits de
personnalité permettent de prédire le degré de convergence des participants. Le premier, issu du
BFI, est l’ouverture aux nouvelles expériences et le degré d’engagement envers l’information
perceptive, sensorielle et abstraite rencontrée, où une plus grande ouverture est liée à une
convergence supérieure. Le second, provenant du test AQ, est le changement d’attention (attention
switching). Les participants qui sont en mesure de focaliser leur attention sur une cible unique
tendent davantage à converger que ceux qui divisent leur attention entre plusieurs cibles.
L’hypothèse des auteurs selon laquelle les individus moins flexibles d’un échantillon non clinique
ne reproduiraient pas les détails phonétiques au moment opportun même s’ils y sont sensibles n’est
donc pas appuyée par les résultats64.

S’inspirant de la contribution précédente, Wagner et Hesson (2014) tentent de corréler des traits de
personnalité à la sensibilité des auditeurs envers la fréquence de variantes linguistiques. Cette
sensibilité envers la fréquence serait modulée par un processus cognitif abstrait que Labov et coll.
(2011) nomment sociolinguistic monitor. Les traits de personnalité des auditeurs sont mesurés par
un autre questionnaire que ceux utilisés par Yu et coll. (2013), soit le BAPQ (Broad Autism
Phenotype Questionnaire, Hurley et coll., 2007), où sont abordés trois aspects de la personnalité
d’un individu : le comportement social, le comportement routinier et les aptitudes
communicationnelles. Les auteures constatent que le seul de ces aspects qui soit corrélé à la
sensibilité envers la fréquence de variantes linguistiques est celui qui concerne directement
l’utilisation de la langue, soit le troisième. Plus un individu est en mesure de prendre le pouls de la
situation de communication et de s’y adapter, plus il est sensible à la fréquence des variantes.
Wagner et Hesson (2014) ne se prononcent cependant pas sur les conséquences potentielles en
production.

Dans une étude sur la convergence phonétique lors d’une tâche interactive en dyades, Aguilar et
coll. (2016) évaluent la sensibilité au rejet de leurs participantes à l’aide du RSQ (Rejection
Sensitivity Questionnaire, Downey et Feldman, 1996). Les auteurs précisent que ce questionnaire
vise à évaluer la réaction d’un individu à une situation où l’acceptation d’une personne estimée est
incertaine. Pour évaluer le degré de convergence, l’approche holistique fondée sur la perception
d’auditeurs naïfs est exploitée. L’hypothèse d’Aguilar et coll. (2016) se voit confirmée : plus la
sensibilité au rejet est forte, c’est-à-dire plus un individu ressent de l’anxiété face à la possibilité de

64
Le déficit de flexibilité caractérisant les troubles du spectre de l’autisme se traduit notamment par une forte
focalisation sur une cible unique (Baron-Cohen et coll., 2001).

235
ne pas être accepté par une personne estimée, plus un locuteur tend à converger vers les usages de
son interlocuteur. Dans les dyades composées de participants aux scores RSQ déséquilibrés, la
convergence perçue l’est donc également.

Urbatsch (2015) aborde quant à lui la question des traits de personnalité des individus migrant sur
une base volontaire. L’auteur précise que tous les migrants n’ont pas la même personnalité, mais
que des traits spécifiques pourraient disposer certains individus à choisir la migration, ainsi certains
traits de personnalité pourraient être surreprésentés parmi les migrants volontaires. Des cinq
dimensions mesurées par le BFI (John et coll., 2008), l’ouverture et la stabilité émotionnelle
seraient des traits fréquents chez de tels migrants. Confrontés aux usages linguistiques en cours
dans leur nouveau milieu, les individus ouverts seraient enclins à les adopter, puisque peu
conservateurs. La stabilité émotionnelle, quant à elle, s’oppose au névrosisme, dont les
conséquences sur les usages linguistiques sont ainsi décrites par Urbatsch (2015 : 374) : « Those
high in neuroticism often try to conform; with their lack of self-confidence, they hew to local
standards to attempt to avoid social missteps […] This predisposes neurotics against terms,
grammatical constructions, or pronunciations that are regarded as controversial or new-fangled ».
En somme, les mêmes traits de personnalité qui disposeraient les individus à migrer volontairement
les mèneraient à adopter plus volontiers les usages linguistiques en cours dans leur nouvelle
communauté.

La perspective d’Urbatsch (2015) est davantage théorique qu’empirique, et lexicale plutôt que
phonétique, mais elle rejoint néanmoins ce que Yu et coll. (2013) observent à propos du degré
supérieur de convergence phonétique chez les participants présentant une plus grande ouverture,
telle que mesurée par le BFI. Bien entendu, un long chemin reste à parcourir dans cette exploration
du lien entre la personnalité du locuteur et sa tendance à s’aligner sur la parole ambiante ou à y être
sensible. Quelques pistes sont fournies par les études citées, mais il reste à vérifier si les tendances
se maintiendront dans d’autres contextes et avec d’autres variables linguistiques. Yu et coll. (2013),
par exemple, traitent exclusivement du VOT, Wagner et Hesson (2014), des variantes de (ing) en
anglais américain, alors que la méthodologie d’Aguilar et coll. (2016) ne permet pas d’identifier
avec précision les sources de la convergence perçue entre interlocuteurs. De plus, Yu et coll. (2013)
observent que la convergence phonétique est liée à seulement deux aspects de la personnalité du
locuteur sur les 10 considérés. Les résultats de Wagner et Hesson (2014) n’en font émerger qu’un
sur les trois testés. À l’heure actuelle, le modus operandi demeure donc l’essai-erreur.

236
Un autre sujet d’actualité en recherche sur l’acquisition d’un R2 est celui de la variation stylistique.
Rappelons que Sankoff et Blondeau (2013) constatent qu’André, un locuteur du corpus Sankoff-
Cedergren enregistré en 1971, 1984 et 1995, crée un effet stylistique en manipulant ses productions
de la consonne /r/ : pour parler de la vie de tous les jours, il utilise la variante apicale [r], mais
lorsqu’il discute de ses années de théâtre, il produit plutôt les variantes [ʁ]/[ʀ]. En ce qui concerne
l’acquisition d’un R2, Nycz (2015 : 478) souligne que si les chercheurs se concentrent
habituellement sur le succès relatif du locuteur mobile à reproduire des caractéristiques du R2, on
en sait encore peu sur sa capacité à déployer les formes du R1 et du R2 au moment voulu afin de
créer un effet stylistique. Dans ce cas, on conçoit que le R2 cohabite avec le R1, sans le remplacer.

Dans une étude sur l’acquisition de fusions et de scissions vocaliques par des locuteurs mobiles,
Johnson et Nycz (2015) amènent 35 adultes à effectuer une série de tâches incluant un entretien et
la lecture de mots et de phrases. Qu’il soit question de fusion ou de scission, les auteurs notent que
les variantes du R2 tendent davantage à être produites pendant les entretiens qu’en lecture. Nycz
(2018) poursuit l’analyse en tenant compte du contenu sémantique des entretiens. Sélectionnant sept
entrevues réalisées auprès de Canadiens anglophones installés aux États-Unis, l’auteure observe que
les variables (oh) et (awT) peuvent être produites différemment lorsque la conversation porte sur un
lieu spécifique. Cependant, le fait de parler du Canada ou des États-Unis n’élicite pas
automatiquement des variantes canadiennes et américaines respectivement : c’est l’expression d’une
impression positive par rapport à l’un des lieux qui mène les locuteurs à produire les variantes du
régiolecte associé. Ainsi, l’expression de l’appartenance au lieu passerait par la sélection de
variantes du R1 ou du R2 et serait ajustée en temps réel aux besoins de la situation de
communication immédiate. Toutefois, pour que l’alternance entre les formes du R1 et du R2 se
produise, il est essentiel qu’elles soient socialement chargées, c’est-à-dire saillantes (voir également
Nycz, 2013). Puisque les locuteurs n’ont pas été interrogés avant leur arrivée aux États-Unis, Nycz
(2018 : 198) se demande si les locuteurs sédentaires ont eux aussi recours à une stratégie similaire
pour exprimer leur « canadianité » si besoin est, auquel cas la flexibilité manifestée par les locuteurs
mobiles ne serait pas strictement une conséquence de la migration.

Sharma (2018) étudie pour sa part des entrevues accordées par l’auteur et journaliste américain
d’origine indienne Fareed Zakari. Locuteur natif de l’anglais indien (R1), Zakari acquiert l’anglais
américain à partir de son arrivée aux États-Unis, à l’âge de 17 ans. Analysant auditivement des
variables phonétiques produites lors de six entrevues télédiffusées, Sharma (2018) constate que le
taux de production de variantes américaines du locuteur est de 59 à 80 % lorsque le public cible est
américain, et de 12 à 21 % lorsque le public est indien. Zakari semble donc puiser à sa guise dans

237
son répertoire régiolectal afin d’adapter sa parole à l’auditoire (Bell, 1984). En raffinant son
analyse, Sharma (2018) note cependant que toute perturbation à la focalisation du locuteur pendant
les entrevues, par exemple s’il est pris au dépourvu, s’il est confronté dans ses propos, ou s’il fait
une parenthèse rapide, cause une diminution de l’utilisation des variantes du R2, y compris lorsque
le public est indien et que le taux d’utilisation des variantes de l’anglais américain est déjà bas.
Sharma (2018 : 13) en conclut que les situations où l’attention du locuteur est divisée provoquent un
retour à de la parole plus facile à produire (« an ‘easier’ mode of speech »).

Dans les trois études citées, le processus d’acquisition est vu comme l’expansion du répertoire
régiolectal du locuteur mobile. En théorie, aussi bien les variantes du R1 que du R2 peuvent être
sélectionnées en production, mais dans les faits, les locuteurs n’y ont pas toujours accès. Certains
éléments qui se dégagent de ces travaux viennent confirmer ce que d’autres chercheurs observent
par ailleurs, révélant le potentiel d’étudier l’alternance stylistique lors de l’acquisition d’un R2. Par
exemple, lorsque l’attention de Fareed Zakari est divisée, il n’est plus en mesure d’adapter sa parole
à son auditoire et les formes de son R1 refont surface. Cette observation rejoint, d’une part,
l’hypothèse de Reubold et Harrington (2018) concernant le repli phonétique d’Alistair Cooke et le
retour au R1 des participants de Howell et coll. (2006) dans des conditions d’écoute altérées : les
formes du régiolecte d’origine bénéficieraient de représentations cognitives robustes peu sujettes à
détérioration et promptement accessibles (voir aussi Walker, 2018). D’autre part, diviser son
attention semble nuire à la production de formes contextuellement appropriées mais moins faciles
d’accès (Yu et coll., 2013).

En lien avec la variation stylistique, un autre thème d’actualité entoure le rôle de l’expérimentateur.
De fait, quelle que soit la position théorique adoptée, le processus d’acquisition d’un R2 est
envisagé comme une conséquence du contact entre individus (Chapitre 3). L’expérimentateur avec
qui les témoins entrent en contact ne fait pas figure d’exception. À titre d’exemple, dans ses travaux
portant sur des locuteurs argentins installés en Espagne, von Essen (2016) fait appel à deux
expérimentateurs, l’un argentin et l’autre espagnol, et constate que chez ses participants les plus
jeunes, il est de mise d’utiliser des variantes argentines avec l’expérimentateur argentin et des
variantes espagnoles avec l’expérimentateur espagnol. Il s’agit, dans l’étude de von Essen (2016),
d’une variable explicitement testée. Advenant que ce ne soit toutefois pas le cas, si plusieurs
expérimentateurs sont impliqués dans une même expérience ou si leur régiolecte diffère de celui des
participants, il s’agit de facteurs à considérer, notamment sur le plan statistique, étant donné leur
potentiel à moduler les résultats (Hay et coll., 2009, 2010; Walker et coll., 2018).

238
Par ailleurs, puisqu’il apparaît de plus en plus clairement que les usages des locuteurs doivent être
envisagés de manière dynamique, il serait injustifié de ne pas en faire autant de ceux de
l’expérimentateur. Examinant rétroactivement ses propres productions lors d’entretiens avec des
participants de Norwich, Trudgill (1986 : 5-9) constate effectivement qu’il tend à s’adapter à leurs
usages. Lorsque Shockey (1984 : 90) étudie le remplacement de la variante battue [ɾ] par les
variantes occlusives [t] et [d] en position intervocalique chez quatre locuteurs américains vivant au
Royaume-Uni, elle analyse également ses propres productions, étant elle-même une Américaine
installée au Royaume-Uni. Dans les six mois suivant son arrivée (T1), elle produit exclusivement la
variante battue; trois ans plus tard (T2), les variantes occlusives [t] et [d] sont produites dans 34 %
et 23 % des cas. Ainsi, dans la mesure où une composante longitudinale est incluse dans le canevas
expérimental, la possibilité que la prononciation de l’enquêteur change au cours du temps doit être
prise en considération, notamment s’il est lui-même géographiquement mobile.

Lors d’une étude longitudinale, un autre effet potentiel de l’expérimentateur concerne l’évolution de
son rapport avec les participants. Wagner et Tagliamonte (2018 : 214) mentionnent en effet que le
lien qui unit les deux parties est inévitablement appelé à se transformer, et pour illustrer leurs
propos, citent le cas de Michael Apted, réalisateur de la série documentaire Up, exploitée à des fins
linguistiques par Sankoff (2004). Amené à rencontrer les participants tous les 7 ans depuis 1964, le
réalisateur observe, d’une part, une augmentation de la familiarité lors des échanges, qui il est vrai,
n’ont plus lieu entre purs inconnus. D’autre part, le réalisateur est de 15 ans l’aîné des participants.
L’écart paraissait immense lorsque les témoins en avaient 7 ou 14, mais une fois ceux-ci adultes, les
implications sociales de la différence d’âge se sont estompées. Incidemment, le rapport hiérarchisé
adulte-enfant s’est muté en relation plus égalitaire, avec tout ce que cette transformation implique
sur le plan communicationnel.

Il n’est pas nécessaire que l’intervalle temporel couvert soit aussi important pour que le degré de
familiarité et la distance sociale perçue changent. Du moment qu’a lieu une seconde
expérimentation, l’enquêteur et les participants ne sont plus des inconnus et une forme de
familiarité s’instaure naturellement. Pour sa part, Wagner (2012 : 198, note 10) souligne qu’au T1,
ses témoins fréquentaient l’école secondaire et percevaient probablement que l’expérimentatrice
appartenait à une catégorie sociale différente de la leur, à une catégorie « d’adultes » (« a category
of “grown-ups” »). Au T2, soit un an plus tard, les témoins poursuivaient des études universitaires
au même titre que l’expérimentatrice, et tendaient davantage à la percevoir comme une égale,
comme une collègue de l’université.

239
Wagner et Tagliamonte (2018) vont plus loin dans leur discussion et abordent la transformation du
lien entre enquêteur et participants à l’ère du numérique. Premièrement, il est courant, voire requis,
que les chercheurs entretiennent un profil professionnel en ligne. Cette transparence et cette
visibilité inédites de leurs champs d’activités peuvent porter à l’attention des participants des
éléments qui normalement, ne devaient pas être dévoilés avant la fin de l’enquête65. Bien sûr, tous
les témoins ne chercheront pas à s’informer, et il n’était pas impossible de le faire auparavant, mais
l’accès à l’information est certainement facilité. Wagner et Tagliamonte (2018) rapportent par
exemple le cas d’une locutrice affirmant avoir téléchargé la thèse de la première auteure entre deux
expérimentations afin de mieux comprendre les objectifs poursuivis par l’étude. La participante
estime ne pas en avoir pleinement saisi tous les enjeux en l’absence de formation en linguistique,
mais elle comprend très bien ceci : « Oh, she’s paying attention to how we speak » (Wagner et
Tagliamonte, 2018 : 224). Deuxièmement, dans l’éventualité où le chercheur choisirait de mettre à
profit son réseau social au moment de l’échantillonnage, il est probable qu’une partie au moins de
ce réseau soit virtuelle. Le chercheur titulaire d’un compte Facebook, par exemple, pourrait donc
tenter de recruter parmi ses amis virtuels, leurs amis virtuels, et ainsi de suite, et utiliser la
plateforme non seulement pour approcher les participants, mais également pour garder contact et
assurer le suivi aux autres temps d’enquête. En plus des implications susmentionnées par rapport à
la diffusion d’information relative à l’objet de recherche, le fait que les participants aient accès à
tout un pan de la vie plus ou moins privée de l’enquêteur entre deux expérimentations entraîne,
selon Wagner et Tagliamonte (2018 : 226-227), les conséquences suivantes :

We must also consider that even quite innocuous status updates—about food we cooked,
restaurants we visited, etc.—are markers of our general social status and not just our
momentary ‘status.’ These clues to lifestyle and income, as well as updates that hint at our
personality and opinions […] undermine our neutrality. We are no longer just avatars—
representatives of the academic world who appear from time to time to collect stories—but
human beings with personal lives.

Cette réalité a de déterminant qu’aucun précédent n’existe. Le rapport entre enquêteur et


participants est possiblement très différent de celui des études antérieures, mais on n’en connaît pas
les conséquences exactes sur la production de la parole.

Une solution possible aux incontournables limites induites par la présence de l’enquêteur est de le
supprimer. Par exemple, certains chercheurs tels Harrington et coll. (2000, et seq.), Reubold et
Harrington (2015, 2018) ou Bowie (2005, 2015) choisissent d’analyser des discours sans
interlocuteur direct. Il est également possible d’amener les participants à s’auto-enregistrer, comme
65
Jennifer Nycz et son équipe misent sur un dévoilement complet de leur objet d’étude en cherchant à recruter
en ligne des participants mobiles : https://www.dialectsonthemove.com/

240
c’est le cas de trois locuteurs du corpus Montréal 1995 (Vincent et coll., 1995) ou des étudiants
prenant part au projet OhioSpeaks (Campbell-Kibler et coll., 2014). La qualité du matériel à
analyser est bien entendu vouée à être inégale, entre autres limites de cette stratégie.

En ce qui concerne notre propre étude, nous avons évité le potentiel effet différencié
d’expérimentateurs multiples en effectuant nous-même tous les enregistrements. Nous ne pouvons
toutefois exclure que nos usages aient changé au cours du temps, considérant entre autres que nous
sommes une locutrice mobile66. Nous n’avons pas, comme Shockey (1984) et Trudgill (1986),
analysé nos productions lors des rencontres avec les participants, puisque nos interventions pendant
les tâches enregistrées étaient beaucoup plus limitées que celles de ces auteurs, qui recourent tous
deux à l’entretien. Quant à la possibilité d’effectuer les mêmes tâches de lecture que les participants
au T1 et au T2, puis d’évaluer les changements apportés à notre prononciation, il n’est pas assuré
que nos usages lors de ces tâches auraient reflété ceux employés pour nous adresser aux témoins.
Pour ce qui est de la familiarité et du rapport entretenu avec les participants, précisons d’emblée que
l’année écoulée entre le T1 et le T2 n’a donné lieu à aucun contact avec les témoins, sous quelque
forme que ce soit. Comme mentionné au chapitre précédent (7.2), nous avons néanmoins perçu de
leur part une plus grande aisance au T2, se traduisant notamment par la nature des questions posées.
Les participants ne vérifiaient plus si la parole produite correspondait à ce qui était attendu. Ils
cherchaient plutôt à en savoir plus sur nos travaux de recherche, s’informaient de ce que
représentaient les études supérieures, et nous interrogeaient même sur les étapes à franchir pour y
accéder. Il semble qu’au T1, nous correspondions à l’avatar ponctuel mentionné par Wagner et
Tagliamonte (2018), mais qu’au T2, nous étions une collègue qui pouvait discuter d’égale à égal(e)
d’une réalité qui deviendrait peut-être la leur (Wagner, 2012). Il n’est pas impossible que cette
transformation du lien expérimentatrice-participant ait contribué à modifier la perception qu’avaient
les témoins de la situation expérimentale, modification qui pourrait être en cause dans l’apparente
réduction des mouvements articulatoires au cours du temps. En l’état, ces observations demeurent
anecdotiques et leur impact sur la parole produite ne peut être vérifié hors de tout doute, mais elles
confirment l’impossibilité de contrôler tous les facteurs qui s’immiscent dans le parcours d’un
individu entre deux temps d’enquête, même rapprochés (Nycz, 2015; Gerstenberg et Voeste, 2015;
Sankoff, 2018a), et la nature éminemment imprévisible et idiosyncrasique de l’étude longitudinale
(Wagner et Tagliamonte, 2018).

66
Originaire de Saguenay, installée à Québec depuis deux ans et demi au T1.

241
Apports interdisciplinaires
Puisqu’aucun des facteurs considérés n’a pu fournir une explication convaincante des changements
acoustiques observés, nous proposons qu’une meilleure connaissance de l’environnement, du
protocole et des attentes, une gestion différente des situations formelles, ou une transformation du
rapport à l’expérimentatrice résultant entre autres de l’évolution des participants dans la structure
universitaire, aient pu changer la façon dont ils appréhendaient l’expérience et donc, leurs usages.
Dans la mesure où le phénomène posé résulte du simple passage du temps, les changements
acoustiques observés peuvent être interprétés comme une conséquence de l’approche longitudinale,
elle-même adoptée pour étudier le changement.

Buchstaller et Wagner (2018) font néanmoins valoir qu’en dépit de cette apparente circularité, les
études longitudinales sont essentielles à la progression des connaissances en linguistique et dans
d’autres domaines connexes. Les auteures rappellent que la parole des locuteurs adultes a longtemps
été considérée stable, héritage de l’hypothèse de la période critique (Lenneberg, 1967) bien entendu,
mais également en comparaison d’autres patrons sociaux plus volontiers appelés à changer, comme
certains aspects du mode de vie ou les idées politiques (Buchstaller et Wagner, 2018 : 3). En
abordant la question de front, les études longitudinales contribuent ainsi à mettre au jour les limites,
mais surtout l’étendue de la malléabilité propre au fait linguistique. Entre autres apports cruciaux de
la progression des connaissances à ce sujet, Buchstaller et Wagner (2018 : 4) soulignent celui
d’alimenter un vif débat en sciences développementales : « [t]he rate and the limits of
neuroplasticity ». Gerstenberg et Voeste (2015 : 2) ajoutent que les changements observables avec
l’avancée en âge sont la conséquence d’un enchevêtrement de facteurs cognitifs et sociaux en
apparence indissociables. Leurs conséquences sur le comportement d’un individu ne sont toutefois
pas vouées à être identiques. Sankoff (2018b : 399) argue que seules les études longitudinales
permettent de départager leur influence respective (voir par exemple Reubold et Harrington, 2018).
Puisque les études couvrant l’entièreté de la vie adulte demeurent et demeureront exceptionnelles
(Hazan, 2017 : 41), les travaux longitudinaux à échelle plus réduite constituent ainsi une ressource
non négligeable. Leur portée commune est bien plus vaste que ce que chaque étude isolée est à
même de dévoiler.

Par ailleurs, rappelons que la sociophonétique constitue un point de rencontres multidisciplinaires


perméable. S’inscrivant dans ce courant, l’étude de l’acquisition d’un R2 puise des ressources
méthodologiques et théoriques dans un éventail de secteurs de recherche. Le Chapitre 3 en
témoigne bien : le changement phonétique résultant d’interactions entre locuteurs a été interprété en
fonction de cadres théoriques provenant aussi bien de la psychologie sociale du langage, de la

242
phonétique, que de la psycholinguistique. Produit par excellence d’une interface, l’étude de
l’acquisition d’un R2 peut contribuer en retour aux disciplines dont elle s’inspire. Comme
mentionné ci-avant, les sciences cognitives bénéficient des avancées permises par les études
longitudinales sur la parole. De la même manière, investiguer l’acquisition d’un R2 à l’âge adulte,
ou encore de manière comparative en fonction de l’âge d’arrivée des locuteurs dans leur nouvelle
communauté, contribue à identifier les habiletés cognitives qui se maintiennent au cours du temps et
celles qui déclinent plus volontiers. Nycz (2015 : 477) souligne toutefois qu’avec l’avancée en âge,
la compréhension de la dynamique sociétale se précise et conséquemment, les tentatives
d’intervention pour la manipuler sont plus probables. En incorporant à l’analyse des facteurs
psychosociaux, l’étude de l’acquisition d’un R2 lève en partie le voile sur ce qui retourne de la
malléabilité réelle des usagers de la langue et de stratégies linguistiques délibérées.

Les situations d’acquisition d’un R2 peuvent être vues comme un laboratoire en accéléré de ce qui
se produit chez des locuteurs confrontés aux changements linguistiques affectant progressivement
leur communauté, tel que mis en évidence par Sankoff (2018b) et discuté à la section 2.2. Ces deux
phénomènes ne sont pas dénués de lien avec le domaine plus général de la linguistique de contact,
où des locuteurs de langues ou de lectes différents s’adaptent les uns aux autres à divers degrés
(Winford, 2003). Selon Nycz (2015 : 478), l’étude de l’acquisition d’un R2, en ce qu’elle aborde
directement les effets individuels à court, moyen et long termes du contact avec d’autres usages
linguistiques, constitue une étape importante de l’entreprise de compréhension et de modélisation
de l’émergence et du nivellement de systèmes linguistiques en situation de contact.

Nycz (2015) ajoute que l’étude de l’acquisition d’un R2 donne l’opportunité de valider des idées
théoriques, voire de tester empiriquement des théories concurrentes. Les huit principes de Chambers
(1992), par exemple, ont été formulés par suite d’observations auprès de locuteurs mobiles, mais
également d’après des écrits plus fondamentaux en linguistique. En postulant qu’une innovation
phonologique commence au mot à mot, le Principe 6 s’inscrit dans le cadre de la théorie de la
diffusion lexicale. À partir d’observations empiriques puis d’une modélisation du changement
fondée sur la diffusion au mot à mot, Rys et coll. (2017) amènent à nuancer la proposition de
Chambers (1992) et à adopter le point de vue de Kerswill (1996) sur les mécanismes d’acquisition
d’un R2 et de changement de manière plus générale : la nature d’une variable pourrait davantage
conditionner sa propagation qu’un processus unique (traits i, ix, x). Pour sa part, MacLeod (2014)
vérifie expérimentalement l’importance de la saillance dans le processus de convergence
phonétique et jette les bases d’une définition empirique du concept, menant éventuellement à la
validation de la position théorique de Trudgill (1986) à ce sujet. Concernant les modèles à

243
exemplaires, des travaux comme ceux de Shockley et coll. (2004) et de Nielsen (2011) sur la
convergence phonétique ont amorcé une réflexion sur l’unité de base des exemplaires. S’il s’agissait
indubitablement du mot dans la contribution influente de Goldinger (1998), les résultats issus des
deux études précitées ont mis en évidence que la convergence pouvait également survenir à des
niveaux sous-lexicaux, ce dont les versions plus récentes du modèle tiennent compte (voir par
exemple Drager et Kirtley, 2016). La réflexion théorique effervescente entourant actuellement les
modèles à exemplaires est ainsi constamment enrichie par de tels résultats empiriques.

Les quelques études sur l’acquisition d’un R2 qui abordent simultanément les volets perception et
production contribuent à une meilleure compréhension du lien entre les deux mécanismes, un enjeu
fondamental mais pourtant encore loin d’être résolu en sciences phonétiques. Les travaux d’Evans
et Iverson (2007), en particulier, montrent que changer ses productions phonétiques en L1 ne
nécessite pas nécessairement une réorganisation perceptive. La flexibilité en production est certes
plus facile à observer, mais elle ne saurait être utilisée comme méthode d’accès indirecte aux
mécanismes de perception. Le fait que dans des études comme celles de Scott et Cutler (1984) et de
Bowie (2001), les locuteurs-auditeurs mobiles manifestent des changements en perception avant
ceux en production témoigne de l’absence de cause à effet directe et simultanée, en discordance
avec la théorie de l’effet caméléon et de l’alignement automatique (Chartrand et Bargh, 1999;
Pickering et Garrod, 2004), où une réaction est enclenchée par la perception, sans intervention de
facteurs médiateurs (Coles-Harris, 2017). Davantage d’études focalisées sur les stades initiaux de
l’acquisition d’un R2 pourraient mener à une description plus détaillée du rapport apparemment
asynchrone entre la perception et la production de la parole en contexte de changement.

Dans une perspective appliquée, étudier les mécanismes d’acquisition spontanée (naturalistic) d’un
R2 est d’importance pour élaborer des stratégies d’enseignement explicite (educational),
notamment dans un cadre scolaire où les locuteurs doivent parvenir à maîtriser un standard national
différent de leur régiolecte, sociolecte ou ethnolecte d’origine (Siegel, 2010 : 157-191), ou encore
lorsque des locuteurs souhaitant décrocher un rôle ou un emploi le sollicitent (Siegel,
2010 : 192-198). L’identification de difficultés spécifiquement liées à la structure des lectes,
d’étapes préalables à la production observable de nouvelles variantes et de l’affect impliqué dans le
maintien ou le changement a ainsi une portée didactique. Cerner l’ampleur des changements de
prononciation susceptibles de se produire chez un adulte, les variables plus ou moins résistantes au
changement, ainsi que les formes intermédiaires ou plus sujettes à catégoricité peut également,
selon Nycz (2015 : 477-478), être précieux au domaine de la phonétique judiciaire. Également en
lien avec ce secteur, l’étude de l’acquisition d’un R2 peut contribuer à identifier les caractéristiques

244
qu’un locuteur doit modifier pour berner l’auditeur, qu’il s’agisse de masquer son origine ou d’en
laisser présumer une autre, et à cet égard, une étude perceptive comme celle de Munro et coll.
(1999) présente un intérêt particulier.

Ce dernier élément sous-tend que l’acquisition d’un R2 dépend au moins en partie du jugement de
l’auditeur (Harmegnies, 1998 : 9). C’est celui qui ultimement, détermine si un locuteur est d’ici ou
d’ailleurs, s’il appartient à la communauté linguistique ou non. Il est donc possible qu’un même
locuteur soit jugé différemment, selon que l’auditeur est originaire de la communauté d’origine ou
d’accueil. Plus précisément, un locuteur mobile pourrait n’avoir changé que quelques
caractéristiques de sa prononciation et être perçu comme appartenant désormais à une autre
communauté par son milieu d’origine, et en parallèle, ne pas avoir suffisamment changé pour que
les auditeurs de sa communauté d’accueil le perçoivent comme l’un des leurs. À preuve, aucun des
locuteurs mobiles de notre étude qui ont rapporté qu’eux-mêmes ou leur milieu d’origine avaient
perçu un changement dans leur façon de parler n’ont indiqué que le milieu d’accueil en avait fait
autant. Ainsi, on peut concevoir l’analyse scientifique de l’acquisition d’un R2 comme un processus
d’identification des caractéristiques linguistiques sur lesquelles les auditeurs fondent leur jugement,
mais celles-ci peuvent différer selon l’origine de l’auditeur et ne pas être en parfaite adéquation
avec les résultats de l’analyste. Le fait que l’acquisition d’un R2 soit, selon Siegel (2010 : 138), une
question de tout ou rien semble ainsi dépendre du récepteur.

L’imperfection perçue pourrait également provenir de ce que l’on conçoit que le R2 est acquis en
remplacement du R1 (1.2.2). La non-observation du R2 en situation expérimentale mène ainsi à une
interprétation de non-acquisition. Pourtant, la littérature est parsemée de mises en garde à ce sujet.
Au Chapitre 2, nous citions d’ailleurs les propos de Watson et Clark (2013 : 302), selon lesquels
l’absence de preuves n’est pas une preuve d’absence, ainsi que ceux de Nycz (2015 : 477), qui
rappelle que la production de variantes du R2 peut être interprétée comme un signe d’acquisition,
mais que ne pas les utiliser n’est pas synonyme de ne pas les avoir acquises. En ce sens, les résultats
des études sur le lien entre perception et production lors de l’acquisition d’un R2 sont également
fort clairs : l’ampleur de ce qui est perçu est sans comparaison avec ce qui est produit, et si le
locuteur-auditeur puise parmi les formes auxquelles il est sensible, il est sensible à bien plus de
formes que ne le laissent paraître ses productions (Beddor, 2015). Les travaux abordant la question
de la variation stylistique lors de l’acquisition d’un R2 constituent également des exemples
éloquents du fait qu’une situation de communication n’est pas représentative de toutes les autres, y
compris en ce qui a trait aux formes produites à cette occasion.

245
Ces différents éléments amènent à repenser les fondements du remplacement du R1 par le R2
(Walker, 2018). Si un locuteur est en mesure d’étendre ses connaissances linguistiques de manière à
maîtriser plus d’une langue, pourquoi ne serait-il pas apte à étendre le répertoire phonétique de sa
L1, sachant qu’il est de plus en plus indiscutable que l’adulte conserve une forme de flexibilité
linguistique ? On peut également s’interroger sur la terminologie même. Rys et coll. (2017 : 269)
laissent entrevoir qu’une partie des études sur l’acquisition d’un R2 pourraient être nommées
comme telles par tradition, même si le terme ne reflète pas tout à fait la réalité, et en ce qui les
concerne, le justifient notamment ainsi : « We decided to maintain the term “second dialect
acquisition”, however, because we want to fall in line with the studies we are starting from ». Il
serait peut-être plus juste, en regard de ce dont nous avons discuté dans le cadre de cette thèse et des
avenues anticipées de la recherche à ce sujet, d’envisager le phénomène comme l’extension du
répertoire (régio)lectal du locuteur, comme l’accroissement de sa compétence sociophonétique.

246
Bibliographie
Adank, Patti, Roel Smits et Roeland van Hout (2004), « A comparison of vowel normalization
procedures for language variation research », Journal of the Acoustical Society of America,
vol. 116, no 5, p. 3099-3107.
Aguilar, Lauren, Geraldine Downey, Robert Krauss, Jennifer Pardo, Sean Lane et Niall
Bolger (2016), « A dyadic perspective on speech accommodation and social connection: Both
partners’ rejection sensitivity matters », Journal of Personality, vol. 84, no 2, p. 165-177.
Alshangiti, Wafaa et Bronwen G. Evans (2011), « Regional accent accomodation in spontaneous
speech: Evidence for long-term accent change? », Proceedings of the XVIIth International
Congress of Phonetic Sciences, Hong Kong, Chine, p. 224-227.
Amastae, Jon et David Satcher (1993), « Linguistic assimilation in two variables », Language
Variation and Change, vol. 5, no 1, p. 77-90.
Andersson, Roger et Mats Thelander (1994), « Internal migration, biography formation and
linguistic change », dans Nordberg, Bengt (dir.), The Sociolinguistics of Urbanization: The Case
of the Nordic Countries, Berlin, New York, Walter de Gruyter, p. 51-86.
Arnaud, Vincent (2006), La dimension variationniste du français en usage à Saint-Claude (Haut-
Jura) : une étude acoustique des voyelles orales des « gens d’en haut », thèse de doctorat,
Université de Franche-Comté.
Arnaud, Vincent et Josiane Riverin-Coutlée (2014), « “Une barre d’or sur le bord du bar…” Une
étude acoustique des voyelles /ɑ/ et /ɔ/ et syllabe fermée par /ʁ/ », communication orale, Les
rançais d’ici V, Université de Moncton, Moncton, Canada.
― (2016), « De l’acoustique à la perception : la confusion des voyelles /ɑ/ et /ɔ/ en syllabe fermée
par /ʁ/ en français québécois », communication orale, Association for French Language Studies
Conference 2016, Queen’s University, Belfast, Royaume-Uni.
Arnaud, Vincent et Johanna-Pascale Roy (2016), « Un accent, des accents, à qui ressembles-tu ? »,
dans Francœur, Aline (dir.), Adaptation dans les espaces francophones : formes, expressions et
diffusion, Québec, Presses de l’Université Laval, p. 161-195.
Arnaud, Vincent, Caroline Sigouin et Johanna-Pascale Roy (2011), « Acoustic description of
Quebec French high vowels: First results », Proceedings of the XVIIth International Congress of
Phonetic Sciences, Hong Kong, Chine, p. 244-247.
Arnett, Jeffrey Jensen (2000), « Emerging adulthood: A theory of development from the late teens
through the twenties », American Psychologist, vol. 55, no 5, p. 469-480.
― (2004), Emerging Adulthood: The Winding Road from the Late Teens Through the Twenties,
Oxford, Oxford University Press.
― (2007), « Emerging adulthood: What is it, and what is it good for? », Child Development
Perspectives, vol. 1, no 2, p. 68-73.
Auer, Peter (2007), « Mobility, contact and accommodation », dans Llamas, Carmen, Louise
Mullany et Peter Stockwell (dir.), The Routledge Companion to Sociolinguistics, New York,
Routledge, p. 109-115.

247
Auer, Peter, Birgit Barden et Beate Grosskopf (1998), « Subjective and objective parameters
determining “salience” in long-term dialect accommodation », Journal of Sociolinguistics,
vol. 2, no 2, p. 163-187.
Auer, Peter et Frans Hinskens (2005), « The role of interpersonal accommodation in a theory of
language change », dans Auer, Peter, Frans Hinskens et Paul Kerswill (dir.), Dialect Change:
Convergence and Divergence in European Languages, Cambridge, Cambridge University Press,
p. 335-357.
Babel, Molly (2010), « Dialect divergence and convergence in New Zealand English », Language
in Society, vol. 39, no 4, p. 437-456.
― (2012), « Evidence for phonetic and social selectivity in spontaneous phonetic imitation »,
Journal of Phonetics, vol. 40, no 1, p. 177-189.
Baggio, Stéphanie, Katia Iglesias, Joseph Studer et Gerhard Gmel (2015), « An 8-item short form of
the Inventory of Dimensions of Emerging Adulthood (IDEA) among young Swiss men »,
Evaluation & the Health Professions, vol. 38, no 2, p. 246-254.
Bailey, Charles-James N. (1973), Variation and Linguistic Theory, Arlington, Center for Applied
Linguistics.
Bailey, Guy (2002), « Real and apparent time », dans Chambers, J. K., Peter Trudgill et Natalie
Schilling-Estes (dir.), The Handbook of Language Variation and Change, 1re édition, Oxford,
Blackwell, p. 312-332.
Baron-Cohen, Simon, Sally Wheelwright, Richard Skinner, Joanne Martin et Emma
Clubley (2001), « The Autism-Spectrum Quotient (AQ): Evidence from Asperger
syndrome/high-functioning autism, males and females, scientists and mathematicians », Journal
of Autism and Developmental Disorders, vol. 31, no 1, p. 5-17.
Bauer, Laurie (1985), « Tracing phonetic change in the received pronunciation of British English »,
Journal of Phonetics, vol. 13, no 1, p. 61-81.
Beaud, Jean-Pierre (2009), « L’échantillonnage », dans Gauthier, Benoît (dir.), Recherche sociale :
de la problématique à la collecte des données, 5e édition, Québec, Presses de l’Université du
Québec, p. 251-284.
Becker, Kara (2009), « /r/ and the construction of place identity on New York City’s Lower East
Side », Journal of Sociolinguistics, vol. 13, no 5, p. 634-658.
Beddor, Patrice Speeter (2015), « The relation between language users’ perception and production
repertoires », Proceedings of the XVIIIth International Congress of Phonetic Sciences, Glasgow,
Royaume-Uni, 9 p.
Bell, Allan (1984), « Language style as audience design », Language in Society, vol. 13, no 2,
p. 145-204.
Berthele, Raphael (2002), « Learning a second dialect: A model of idiolectal dissonance »,
Multilingua, vol. 21, no 4, p. 327-344.
Best, Catherine T. (1995), « A direct realist view of cross-language speech perception », dans
Strange, Winifred (dir.), Speech Perception and Linguistic Experience: Issues in Cross-
Language Research, Timonium, York Press, p. 171-204.

248
Bickerton, Derek (1983), « Comments on Valdman’s “Creolization and second language
acquisition” », dans Andersen, Roger W. (dir.), Pidginization and Creolization as Language
Acquisition, Rowley, Newbury House Publishers, p. 235-240.
Bigham, Douglas S. (2008), Dialect Contact and Accommodation Among Emerging Adults in a
University Setting, thèse de doctorat, University of Texas.
― (2010), « Mechanisms of accommodation among emerging adults in a university setting »,
Journal of English Linguistics, vol. 38, no 3, p. 193-210.
― (2012), « Emerging adulthood in sociolinguistics », Language and Linguistics Compass, vol. 6,
no 8, p. 533-544.
Binette Charbonneau, Anne (2017), « Les mariages au Québec en 2016 », Coup d’œil
sociodémographique, no 57, Institut de la statistique du Québec, Québec, 7 p.
Blais, André et Claire Durand (2009), « Le sondage », dans Gauthier, Benoît (dir.), Recherche
sociale : de la problématique à la collecte des données, 5e édition, Québec, Presses de
l’Université du Québec, p. 445-487.
Bloch, Bernard (1948), « A set of postulates for phonemic analysis », Language, vol. 24, no 1,
p. 3-46.
Boersma, Paul et David Weenink (2018), Praat: Doing Phonetics by Computer, version 5.3.x,
[logiciel], disponible au http://www.praat.org/
Bowie, David (2000), The Effect of Geographic Mobility on the Retention of a Local Dialect, thèse
de doctorat, University of Pennsylvania.
― (2001), « Dialect contact and dialect change: The effect of near-mergers », University of
Pennsylvania Working Papers in Linguistics, vol. 7, no 3, p. 17-26.
― (2005), « Language change over the lifespan: A test of the apparent time construct », University
of Pennsylvania Working Papers in Linguistics, vol. 11, no 2, p. 45-58.
― (2014), « Age: Methods and metadata », Language and Linguistics Compass, vol. 8, no 11,
p. 519-528.
― (2015), « Phonological variation in real time: Patterns of adult linguistic stability and change »,
dans Gerstenberg, Annette et Anja Voeste (dir.), Language Development: The Lifespan
Perspective, Amsterdam, John Benjamins, p. 39-58.
Britain, David (2013), « Space, diffusion and mobility », dans Chambers, J. K. et Natalie Schilling
(dir.), The Handbook of Language Variation and Change, 2e édition, Chichester, Wiley-
Blackwell, p. 471-500.
Buchstaller, Isabelle et Suzanne Evans Wagner (2018), « Introduction: Using panel data in the
sociolinguistic study of variation and change », dans Wagner, Suzanne Evans et Isabelle
Buchstaller (dir.), Panel Studies of Variation and Change, New York, Routledge, p. 1-18.
Byrne, Donn (1961), « Interpersonal attraction and attitude similarity », Journal of Abnormal and
Social Psychology, vol. 62, no 3, p. 713-715.
Campbell-Kibler, Kathryn (2016), « Towards a cognitively realistic model of meaningful
sociolinguistic variation », dans Babel, Anna M. (dir.), Awareness and Control in Sociolinguistic
Research, Cambridge, Cambridge University Press, p. 123-151.

249
Campbell-Kibler, Kathryn, Abby Walker, Shontael Elward et Katie Carmichael (2014), « Apparent
time and network effects on long-term cross-dialect accommodation among college students »,
University of Pennsylvania Working Papers in Linguistics, vol. 20, no 2, p. 20-29.
Candea, Maria et Cyril Trimaille (2015), « Introduction. Phonétique, sociolinguistique,
sociophonétique : histoires parallèles et croisements », Langage et société, no 151, p. 7-25.
Carmichael, Katie (2014), “I never thought I had an accent until the hurricane”: Sociolinguistic
Variation in Post-Katrina Greater New Orleans, thèse de doctorat, Ohio State University.
― (2017), « Displacement and local linguistic practices: R-lessness in post-Katrina Greater New
Orleans », Journal of Sociolinguistics, vol. 21, no 5, p. 696-719.
Chambers, J. K. (1992), « Dialect acquisition », Language, vol. 68, no 4, p. 673-705.
― (2002), « Dynamics of dialect convergence », Journal of Sociolinguistics, vol. 6, no 1,
p. 117-130.
― (2009), Sociolinguistic Theory: Linguistic Variation and Its Social Significance, 3e édition,
Chichester, Wiley-Blackwell.
Chambers, J. K. et Peter Trudgill (1998), Dialectology, 2e édition, Cambridge, Cambridge
University Press.
Chartrand, Tanya L. et John A. Bargh (1999), « The chameleon effect: The perception-behavior link
and social interaction », Journal of Personality and Social Psychology, vol. 76, no 6, p. 893-910.
Chomsky, Noam et Morris Halle (1968), The Sound Pattern of English, New York, Harper & Row.
Clark, Eve V. (2009), First Language Acquisition, 2e édition, Cambridge, Cambridge University
Press.
Clarke, Constance M. et Merrill F. Garrett (2004), « Rapid adaptation to foreign-accented
English », Journal of the Acoustical Society of America, vol. 116, no 6, p. 3647-3658.
Clopper, Cynthia G. et David B. Pisoni (2004), « Homebodies and army brats: Some effects of early
linguistic experience and residential history on dialect categorization », Language Variation and
Change, vol. 16, no 1, p. 31-48.
Coles-Harris, Evan Hugh (2017), « Perspectives on the motivations for phonetic convergence »,
Language and Linguistics Compass, vol. 11, no 12, e12268.
Conn, Jeff et Uri Horesh (2002), « Assessing the acquisition of dialect variables by migrant adults
in Philadelphia: A case study », University of Pennsylvania Working Papers in Linguistics,
vol. 8, no 3, p. 47-57.
Côté, Marie-Hélène (2010), « La longueur vocalique devant consonne allongeante en contexte final
et dérivé en français laurentien », dans LeBlanc, Carmen, France Martineau et Yves Frenette
(dir.), Vues sur les rançais d’ici, Québec, Presses de l’Université Laval, p. 49-75.
― (2012), « Laurentian French (Quebec): Extra vowels, missing schwas and surprising liaison
consonants », dans Gess, Randall, Chantal Lyche et Trudel Meisenburg (dir.), Phonological
Variation in French: Illustrations from Three Continents, Amsterdam, John Benjamins,
p. 235-274.
Coupland, Nikolas (1984), « Accommodation at work: Some phonological data and their
implications », International Journal of the Sociology of Language, vol. 1984, no 46, p. 49-70.

250
Crystal, David (2003), English as a Global Language, 2e édition, Cambridge, Cambridge University
Press.
― (2008), A Dictionary of Linguistics and Phonetics, 6e édition, Oxford, Blackwell.
Daly, John A. et Carol A. Diesel (1992), « Measures of communication‐ related personality
variables », Communication Education, vol. 41, no 4, p. 405-414.
Davis, Alva L. et Raven I. McDavid Jr. (1950), « Northwestern Ohio: A transition area »,
Language, vol. 26, no 2, p. 264-273.
De Decker, Paul (2006), « A real-time investigation of social and phonetic changes in post-
adolescence », University of Pennsylvania Working Papers in Linguistics, vol. 12, no 2, p. 65-76.
De Houwer, Annick (1996), « Bilingual language acquisition », dans Fletcher, Paul et Brian
MacWhinney (dir.), The Handbook of Child Language, Oxford, Wiley-Blackwell, p. 219-250.
Delattre, Pierre (1948), « Un triangle acoustique des voyelles orales du français », The French
Review, vol. 21, no 6, p. 477-484.
― (1968), « Tendances phonétiques du français parlé au Canada by Jean-Denis Gendron: Review »,
Language, vol. 44, no 4, p. 852-855.
Delattre, Pierre, Alvin M. Liberman, Franklin S. Cooper et Louis J. Gerstman (1952), « An
experimental study of the acoustic determinants of vowel colour », Word, vol. 8, no 3,
p. 195-210.
Delvaux, Véronique et Alain Soquet (2007), « The influence of ambient speech on adult speech
productions through unintentional imitation », Phonetica, vol. 64, no 2‑ 3, p. 145-173.
Deshaies-Lafontaine, Denise (1974), A Socio-Phonetic Study of a Québec French Community:
Trois-Rivières, thèse de doctorat, University College London.
Di Paolo, Marianna et Malcah Yaeger-Dror (dir.) (2010), Sociophonetics: A Student’s Guide,
London, Routledge.
Docherty, Gerard, Dominic Watt, Carmen Llamas, Damien Hall et Jennifer Nycz (2011),
« Variation in voice onset time along the Scottish-English border », Proceedings of the XVIIth
International Congress of Phonetic Sciences, Hong Kong, Chine, p. 591-594.
Dolbec, Jean et Conrad Ouellon (1999), « Peut-on distinguer des variétés phonétiques en français
québécois ? », Dialangue, vol. 10, p. 17-28.
Dollinger, Stefan (2015), The Written Questionnaire in Social Dialectology, Amsterdam, John
Benjamins.
Downey, Geraldine et Scott I. Feldman (1996), « Implications of rejection sensitivity for intimate
relationship », Journal of Personality and Social Psychology, vol. 70, no 6, p. 1327-1343.
Drager, Katie et Jennifer Hay (2012), « Exploiting random intercepts: Two case studies in
sociophonetics », Language Variation and Change, vol. 24, no 1, p. 59-78.
Drager, Katie et M. Joelle Kirtley (2016), « Awareness, salience, and stereotypes in exemplar-based
models of speech production and perception », dans Babel, Anna M. (dir.), Awareness and
Control in Sociolinguistic Research, Cambridge, Cambridge University Press, p. 1-24.
Dulong, Gaston et Gaston Bergeron (1980), Le parler populaire du Québec et de ses régions
voisines. Atlas linguistique de l’Est du Canada, Québec, Office de la langue française.

251
Dumas, Denis (1972), Le français populaire de Montréal : description phonologique, mémoire de
maîtrise, Université de Montréal.
― (1978), Phonologie des réductions vocaliques en français québécois, thèse de doctorat,
Université de Montréal.
― (1987), Nos façons de parler. Les prononciations en français québécois, Québec, Presses de
l’Université du Québec.
Durand, Jacques, Bernard Laks et Chantal Lyche (2009), « Le projet PFC (phonologie du français
contemporain) : une source de données primaires structurées », dans Durand, Jacques, Bernard
Laks et Chantal Lyche (dir.), Phonologie, variation et accents du français, Paris, Hermès,
p. 19-61.
Eckert, Penelope (1988), « Adolescent social structure and the spread of linguistic change »,
Language in Society, vol. 17, no 2, p. 183-207.
― (1989), Jocks and Burnouts: Social Categories and Identity in the High School, New York,
Teachers College Press.
― (1997), « Age as a sociolinguistic variable », dans Coulmas, Florian (dir.), The Handbook of
Sociolinguistics, Oxford, Blackwell, p. 151-167.
― (2012), « Three waves of variation study: The emergence of meaning in the study of
sociolinguistic variation », Annual Review of Anthropology, vol. 41, no 1, p. 87-100.
Eckert, Penelope et Sally McConnell-Ginet (1992), « Think practically and look locally: Language
and gender as community-based practice », Annual Review of Anthropology, vol. 21, no 1,
p. 461-488.
Escure, Geneviève (1997), Creole and Dialect Continua: Standard Acquisition Processes in Belize
and China (PRC), Amsterdam, John Benjamins.
Evans, Betsy (2004), « The role of social network in the acquisition of local dialect norms by
Appalachian migrants in Ypsilanti, Michigan », Language Variation and Change, vol. 16, no 2,
p. 153-167.
Evans, Bronwen G. (2017), « “No Mummy, it’s a b[ɑː]th not a b[æ]th!” The processing of accented
speech by monolingual and bilingual children », communication orale, 14th International
Congress for the Study of Child Language, Université Lyon 2, Lyon, France.
Evans, Bronwen G. et Paul Iverson (2007), « Plasticity in vowel perception and production: A study
of accent change in young adults », Journal of the Acoustical Society of America, vol. 121, no 6,
p. 3814-3826.
Flege, James E. (1987), « The production of “new” and “similar” phones in a foreign language:
Evidence for the effect of equivalence classification », Journal of Phonetics, vol. 15, no 1,
p. 47-65.
― (1995), « Second language learning: Theory, findings, and problems », dans Strange, Winifred
(dir.), Speech Perception and Linguistic Experience: Issues in Cross-Language Research,
Timonium, York Press, p. 233-277.
Flege, James E. et Robert M. Hammond (1982), « Mimicry of non-distinctive phonetic differences
between language varieties », Studies in Second Language Acquisition, vol. 5, no 1, p. 1-17.

252
Foreman, Annik (2003), Pretending to be Someone You’re Not: A Study o Second Dialect
Acquisition in Australia, thèse de doctorat, Monash University.
Foulkes, Paul et Gerard Docherty (2006), « The social life of phonetics and phonology », Journal of
Phonetics, vol. 34, no 4, p. 409-438.
Foulkes, Paul, James M. Scobbie et Dominic Watt (2010), « Sociophonetics », dans Hardcastle,
William J., John Laver et Fiona E. Gibbon (dir.), The Handbook of Phonetic Sciences, 2e édition,
Oxford, Wiley-Blackwell, p. 703-754.
Fowler, Carol A. (1986), « An event approach to the study of speech perception from a direct-realist
perspective », Journal of Phonetics, vol. 14, no 1, p. 3-28.
Fox, Robert Allen et Ewa Jacewicz (2009), « Cross-dialectal variation in formant dynamics of
American English vowels », Journal of the Acoustical Society of America, vol. 126, no 5,
p. 2603-2618.
Gahl, Susanne et Alan C. L. Yu (2006), « Introduction to the special issue on exemplar-based
models in linguistics », Linguistic Review, vol. 23, no 3, p. 213-216.
Gallois, Cindy, Tania Ogay et Howard Giles (2005), « Communication accommodation theory: A
look back and a look ahead », dans Gudykunst, William B. (dir.), Theorizing About Intercultural
Communication, Thousand Oaks, Sage Publications, p. 121-148.
Gendron, Jean-Denis (1966), Tendances phonétiques du français parlé au Canada, Québec, Presses
de l’Université Laval.
Gendrot, Cédric, Martine Adda-Decker et Jacqueline Vaissière (2008), « Les voyelles /i/ et /y/ du
français : focalisation et variations formantiques », Actes des XXVIIes Journées d’études sur la
parole, Avignon, France, p. 205-208.
Gerstenberg, Annette et Anja Voeste (2015), « Investigating the lifespan perspective », dans
Gerstenberg, Annette et Anja Voeste (dir.), Language Development: The Lifespan Perspective,
Amsterdam, John Benjamins, p. 1-8.
Giles, Howard (1973), « Accent mobility: A model and some data », Anthropological Linguistics,
vol. 15, no 2, p. 87-105.
Giles, Howard, Nikolas Coupland et Justine Coupland (1991), « Accomodation theory:
Communication, context, and consequence », dans Giles, Howard, Justine Coupland et Nikolas
Coupland (dir.), Contexts of Accommodation: Developments in Applied Sociolinguistics,
Cambridge, Cambridge University Press, p. 1-68.
Giles, Howard, Anthony Mulac, James J. Bradac et Patricia Johnson (1987), « Speech
accommodation theory: The first decade and beyond », Communication Yearbook, vol. 10,
p. 13-48.
Giles, Howard et Peter F. Powesland (1975), Speech Style and Social Evaluation, London,
Academic Press.
Giles, Howard et Philip Smith (1979), « Accomodation theory: Optimal levels of convergence »,
dans Giles, Howard et Robert N. St Clair (dir.), Language and Social Psychology, Oxford, Basil
Blackwell, p. 45-65.
Gilliéron, Jules et Edmond Edmont (1902-1910), Atlas linguistique de la France, Paris, Champion.

253
Girard, Chantal et Anne Binette Charbonneau (2018), « Les naissances au Québec et dans les
régions en 2017 », Coup d’œil sociodémographique, no 65, Institut de la statistique du Québec,
Québec, 6 p.
Goldinger, Stephen D. (1998), « Echoes of echoes? An episodic theory of lexical access »,
Psychological Review, vol. 105, no 2, p. 251-279.
Gottfried, Terry L. (1984), « Effects of consonant context on the perception of French vowels »,
Journal of Phonetics, vol. 12, no 2, p. 91-114.
Grosjean, François, Séverine Carrard, Coralie Godio, Lysiane Grosjean et Jean-Yves
Dommergues (2007), « Long and short vowels in Swiss French: Their production and
perception », Journal of French Language Studies, vol. 17, no 1, p. 1-19.
Habib, Rania (2014), « Vowel variation and reverse acquisition in rural Syrian child and adolescent
language », Language Variation and Change, vol. 26, no 1, p. 45-75.
Harmegnies, Bernard (1998), « Accent », dans Moreau, Marie-Louise (dir.), Sociolinguistique. Les
concepts de base, Bruxelles, Mardaga, p. 9-12.
Harmegnies, Bernard et Dolors Poch-Olivé (1992), « A study of style-induced vowel variability:
Laboratory versus spontaneous speech in Spanish », Speech Communication, vol. 11, no 4-5,
p. 429-437.
Harrington, Jonathan, Sallyanne Palethorpe et Catherine I. Watson (2000), « Monophthongal vowel
changes in Received Pronunciation: An acoustic analysis of the Queen’s Christmas broadcasts »,
Journal of the International Phonetic Association, vol. 30, no 1‑ 2, p. 63-78.
Harris, Roy (1990), « The dialect myth », dans Edmondson, Jerold A., Crawford Feagin et Peter
Mühlhäusler (dir.), Development and Diversity: Language Variation across Time and Space. A
Festschrift for Charles-James N. Bailey, Arlington, Summer Institute of Linguistics and
University of Texas, p. 3-19.
Hay, Jennifer et Katie Drager (2007), « Sociophonetics », Annual Review of Anthropology, vol. 36,
no 1, p. 89-103.
― (2010), « Stuffed toys and speech perception », Linguistics, vol. 48, no 4, p. 865-892.
Hay, Jennifer, Katie Drager et Paul Warren (2009), « Careful who you talk to: An effect of
experimenter identity on the production of the NEAR/SQUARE merger in New Zealand English »,
Australian Journal of Linguistics, vol. 29, no 2, p. 269-285.
― (2010), « Short-term exposure to one dialect affects processing of another », Language and
Speech, vol. 53, no 4, p. 447-471.
Hay, Jennifer et Paul Foulkes (2016), « The evolution of medial /t/ over real and remembered
time », Language, vol. 92, no 2, p. 298-330.
Hay, Jennifer, Aaron Nolan et Katie Drager (2006), « From fush to feesh: Exemplar priming in
speech perception », Linguistic Review, vol. 23, no 3, p. 351-379.
Hay, Jennifer, Paul Warren et Katie Drager (2006), « Factors influencing speech perception in the
context of a merger-in-progress », Journal of Phonetics, vol. 34, no 4, p. 458-484.
Hazan, Valerie (2017), « Speech communication across the life span », Acoustics Today, vol. 13,
no 1, p. 36-43.

254
Hazen, Kirk et Sarah Hamilton (2008), « A dialect turned inside out: Migration and the
Appalachian diaspora », Journal of English Linguistics, vol. 36, no 2, p. 105-128.
Hempl, George (1896), « American speech-maps », dans Dialect Notes, vol. 1, Norwood, American
Dialect Society, p. 315-318.
Hernández, José Esteban et Rubén Armando Maldonado (2012), « Reducción de /s/ final de sílaba
entre transmigrantes salvadoreños en el sur de Texas », Lengua y migración, vol. 4, no 2,
p. 43-67.
Hillenbrand, James M., Laura A. Getty, Michael J. Clark et Kimberlee Wheeler (1995), « Acoustic
characteristics of American English vowels », Journal of the Acoustical Society of America,
vol. 97, no 5, p. 3099-3111.
Hinskens, Frans (1998), « Variation studies in dialectology and three types of sound change »,
Sociolinguistica, vol. 12, no 1, p. 155-193.
Homans, George Caspar (1961), Social Behavior: Its Elementary Forms, New York, Harcourt,
Brace & World.
Hordila-Vatamanescu, Elena-Madalina et Andra-Dina Pana (2010), « The application of the
communication accommodation theory to virtual communities: A preliminary research on the
online identities », International Journal of Interdisciplinary Social Sciences, vol. 5, no 4,
p. 279-290.
Howell, Peter, William Barry et David Vinson (2006), « Strength of British English accents in
altered listening conditions », Perception & Psychophysics, vol. 68, no 1, p. 139-153.
Hurley, Robert S. E., Molly Losh, Morgan Parlier, J. Steven Reznick et Joseph Piven (2007), « The
Broad Autism Phenotype Questionnaire », Journal of Autism and Developmental Disorders,
vol. 37, no 9, p. 1679-1690.
Ivars, Ann-Marie (1994), « Bidialectalism and identity », dans Nordberg, Bengt (dir.), The
Sociolinguistics of Urbanization: The Case of the Nordic Countries, Berlin, New York, Walter
de Gruyter, p. 203-222.
Jannedy, Stefanie et Jennifer Hay (2006), « Modelling sociophonetic variation », Journal of
Phonetics, vol. 34, no 4, p. 405-408.
Jeffries, Ella (2016), Children’s developing awareness o regional accents: A socioperceptual
investigation of pre-school and primary school children in York, thèse de doctorat, University of
York.
John, Oliver P., Laura P. Naumann et Christopher J. Soto (2008), « Paradigm shift to the integrative
Big Five trait taxonomy: History, measurement, and conceptual issues », dans John, Oliver P.,
Richard W. Robins et Lawrence A. Pervin (dir.), Handbook of Personality: Theory and
Research, 3e édition, New York, Guilford Press, p. 114-158.
Johnson, Daniel Ezra et Jennifer Nycz (2015), « Partial mergers and near-distinctions: Stylistic
layering in dialect acquisition », University of Pennsylvania Working Papers in Linguistics,
vol. 21, no 2, p. 109-117.
Johnson, Keith (1997), « Speech perception without speaker normalization: An exemplar model »,
dans Johnson, Keith et John W. Mullennix (dir.), Talker Variability in Speech Processing, San
Diego, Academic Press, p. 145-165.

255
Johnstone, Barbara (2004), « Place, globalization, and linguistic variation », dans Fought, Carmen
(dir.), Sociolinguistic Variation: Critical Reflections, Oxford, Oxford University Press, p. 65-83.
Joos, Martin (1948), « Acoustic Phonetics », Language, vol. 24, no 2, p. 5-136.
Kelley, Harold H. (1973), « The processes of causal attribution », American Psychologist, vol. 28,
no 2, p. 107-128.
Kerswill, Paul (1993), « Rural dialect speakers in an urban speech community: The role of dialect
contact in defining a sociolinguistic concept », International Journal of Applied Linguistics,
vol. 3, no 1, p. 33-56.
― (1996), « Children, adolescents, and language change », Language Variation and Change, vol. 8,
no 2, p. 177-202.
Kerswill, Paul et Ann Williams (2000a), « Creating a new town koine: Children and language
change in Milton Keynes », Language in Society, vol. 29, no 1, p. 65-115.
― (2000b), « Mobility and social class in dialect levelling: Evidence from new and old towns in
England », dans Mattheier, Klaus J. (dir.), Dialect and Migration in a Changing Europe,
Frankfurt, Peter Lang, p. 1-13.
Knecht, Pierre (1998), « Dialecte », dans Moreau, Marie-Louise (dir.), Sociolinguistique. Les
concepts de base, Bruxelles, Mardaga, p. 120-124.
Kobayashi, Chieko (1981), « Dialectal variation in child language », dans Dale, Philip S. et David
Ingram (dir.), Child Language: An International Perspective, Baltimore, University Park Press,
p. 5-27.
Kraljic, Tanya, Susan E. Brennan et Arthur G. Samuel (2008), « Accommodating variation:
Dialects, idiolects, and speech processing », Cognition, vol. 107, no 1, p. 54-81.
Krashen, Stephen D. et Herbert W. Seliger (1975), « Maturational constraints on second dialect
acquisition », Language Sciences, no 38, p. 28-29.
Kuhl, Patricia K. (1991), « Human adults and human infants show a “perceptual magnet effect” for
the prototypes of speech categories, monkeys do not », Perception & Psychophysics, vol. 50,
no 2, p. 93-107.
Kuhl, Patricia K. et Andrew N. Meltzoff (1996), « Infant vocalizations in response to speech: Vocal
imitation and developmental change », Journal of the Acoustical Society of America, vol. 100,
no 4, p. 2425-2438.
Kwon, Soohyun (2018), « Phonetic and phonological changes of Noam Chomsky: A case study of
dialect shift », American Speech, vol. 93, no 2, p. 270-297.
Labov, William (1976), Sociolinguistique, Paris, Éditions de Minuit.
― (1981), « What can be learned about change in progress from synchronic descriptions », dans
Sankoff, David et Henrietta Cedergren (dir.), Variation Omnibus, Edmonton, Linguistic
Research, p. 177-199.
― (1994), Principles of Linguistic Change: Internal Factors, vol. 1, Oxford, Blackwell.
― (2006 [1966]), The Social Stratification of English in New York, 2e édition, Cambridge,
Cambridge University Press.

256
Labov, William, Sharon Ash et Charles Boberg (2006), The Atlas of North American English:
Phonetics, Phonology and Sound Change, Berlin, New York, Mouton de Gruyter.
Labov, William, Sharon Ash, Maya Ravindranath, Tracey Weldon, Maciej Baranowski et Naomi
Nagy (2011), « Properties of the sociolinguistic monitor », Journal of Sociolinguistics, vol. 15,
no 4, p. 431-463.
Labov, William, Mark Karen et Corey Miller (1991), « Near-merger and the suspension of
phonemic contrast », Language Variation and Change, vol. 3, no 1, p. 33-74.
Labov, William, Malcah Yaeger et Richard Steiner (1972), A Quantitative Study of Sound Change
in Progress, vol. 1, Philadelphie, The U.S. Regional Survey.
Lanctot, Joëlle et François Poulin (2018), « Emerging adulthood features and adjustment: A person-
centered approach », Emerging Adulthood, vol. 6, no 2, p. 91-103.
Laporte, Silvy et Michel Cucherat (2006), « Multiplicité des tests statistiques au cours d’un essai
clinique. Plus on cherche, plus on trouve… », Médecine thérapeutique, vol. 12, no 3, p. 183-188.
Lappin, Kerry (1981), « Évaluation de la prononciation du français montréalais », Revue québécoise
de linguistique, vol. 11, no 2, p. 93-112.
Leblanc, Guillaume (2012), Une étude acoustique des voyelles orales susceptibles d’être
diphtonguées en français québécois, mémoire de maîtrise, Université Laval.
Lehiste, Ilse et Gordon E. Peterson (1961), « Transitions, glides, and diphthongs », Journal of the
Acoustical Society of America, vol. 33, no 3, p. 268-277.
Lenneberg, Eric H. (1967), Biological Foundations of Language, New York, John Wiley and Sons.
Liberman, Alvin M. et Ignatius G. Mattingly (1985), « The motor theory of speech perception
revisited », Cognition, vol. 21, p. 1-36.
Lieberman, Philip (1967), Intonation, Perception, and Language, Cambridge, M.I.T. Press.
Lindblom, Björn E. F. (1963), « Spectrographic study of vowel reduction », Journal of the
Acoustical Society of America, vol. 35, no 11, p. 1773-1781.
― (1990), « Explaining phonetic variation: A sketch of the H&H theory », dans Hardcastle,
William J. et Alain Marchal (dir.), Speech Production and Speech Modelling, Dordrecht,
Kluwer, p. 403-439.
Lindblom, Björn E. F., Susan Guion, Susan Hura, Seung-Jae Moon et Raquel Willerman (1995),
« Is sound change adaptive? », Rivista di linguistica, vol. 7, no 1, p. 5-36.
Lindblom, Björn E. F. et Johan E. F. Sundberg (1971), « Acoustical consequences of lip, tongue,
jaw, and larynx movement », Journal of the Acoustical Society of America, vol. 50, no 4B,
p. 1166-1179.
Lisker, Leigh et Arthur S. Abramson (1964), « A cross-language study of voicing in initial stops:
Acoustic measurements », Word, vol. 20, no 3, p. 384-422.
Lobanov, Boris M. (1971), « Classification of Russian vowels spoken by different speakers »,
Journal of the Acoustical Society of America, vol. 49, no 2B, p. 606-608.
Lorent, Maurice (1977), Le parler populaire de la Beauce, Montréal, Leméac.
Love, Jessica et Abby Walker (2013), « Football versus football: Effect of topic on /r/ realization in
American and English sports fans », Language and Speech, vol. 56, no 4, p. 443-460.

257
MacKenzie, Laurel et Gillian Sankoff (2010), « A quantitative analysis of diphthongization in
Montreal French », University of Pennsylvania Working Papers in Linguistics, vol. 15, no 2,
p. 91-100.
MacLeod, Bethany (2014), « Investigating the effects of perceptual salience and regional dialect on
phonetic accommodation in Spanish », dans Côté, Marie-Hélène et Éric Mathieu (dir.), Variation
Within and Across Romance Languages, Amsterdam, John Benjamins, p. 351-378.
Maddieson, Ian (1997), « Phonetic universals », dans Hardcastle, William J. et John Laver (dir.),
The Handbook of Phonetic Sciences, 1re édition, Oxford, Blackwell, p. 619-639.
Martin, Pierre (1995), « L’opposition entre /ε/ (bref) et /εː/ (long) en français actuel du Québec »,
La Linguistique, vol. 31, no 2, p. 33-45.
― (1998a), « Dynamique vocalique en français du Québec », La Linguistique, vol. 34, no 2,
p. 67-76.
― (1998b), « Les voyelles d’aperture moyenne en français du Québec », Cahiers de l’Institut de
linguistique et des sciences du langage de l’Université de Lausanne, no 11, tome 2, p. 215-242.
Ménard, Lucie (2002), Production et perception des voyelles au cours de la croissance du conduit
vocal : variabilité, invariance et normalisation, thèse de doctorat, Université Stendhal
Grenoble III.
Ménard, Lucie, Jean-Luc Schwartz, Jean-Louis Boë, Sonia Kandel et Nathalie Vallée (2002),
« Auditory normalization of French vowels synthesized by an articulatory model simulating
growth from birth to adulthood », Journal of the Acoustical Society of America, vol. 111, no 4,
p. 1892-1905.
Meyerhoff, Miriam (1998), « Accommodating your data: The use and misuse of accommodation
theory in sociolinguistics », Language & Communication, vol. 18, no 3, p. 205-225.
― (2002), « Communities of practice », dans Chambers, J. K., Peter Trudgill et Natalie Schilling-
Estes (dir.), The Handbook of Language Variation and Change, 1re édition, Oxford, Blackwell,
p. 526-548.
Mielke, Jeff (2013), « Ultrasound and corpus study of a change from below: Vowel rhoticity in
Canadian French », University of Pennsylvania Working Papers in Linguistics, vol. 19, no 2,
p. 141-150.
Miller, Catherine (2005), « Between accomodation and resistance: Upper Egyptian migrants in
Cairo », Linguistics, vol. 43, no 5, p. 903-956.
Milroy, Lesley (1980), Language and Social Networks, Oxford, Basil Blackwell.
― (2002a), « Introduction: Mobility, contact and language change – Working with contemporary
speech communities », Journal of Sociolinguistics, vol. 6, no 1, p. 3-15.
― (2002b), « Social networks », dans Chambers, J. K., Peter Trudgill et Natalie Schilling-Estes
(dir.), The Handbook of Language Variation and Change, 1re édition, Oxford, Blackwell,
p. 549-572.
Milroy, Lesley et Matthew J. Gordon (2003), Sociolinguistics: Method and Interpretation, Oxford,
Blackwell.
Morin, Yves-Charles (2002), « Les premiers immigrants et la prononciation du français au
Québec », Revue québécoise de linguistique, vol. 31, no 1, p. 39-78.

258
Morrison, Geoffrey Stewart et Peter F. Assmann (dir.) (2013), Vowel Inherent Spectral Change,
Berlin, Heidelberg, Springer.
Mougeon, Raymond et Édouard Beniak (dir.) (1994), Les origines du français québécois, Sainte-
Foy, Presses de l’Université Laval.
Moulin, Stéphane (2012), « L’émergence de l’âge adulte : de l’impact des référentiels
institutionnels en France et au Québec », SociologieS, Théories et recherches, 19 p.
Muljačić, Žarko (1993), « Standardization in Romance », dans Posner, Rebecca et John N. Green
(dir.), Bilingualism and Linguistic Conflict in Romance, Berlin, Mouton de Gruyter, p. 77-116.
Munro, Murray J., Tracey M. Derwing et James E. Flege (1999), « Canadians in Alabama: A
perceptual study of dialect acquisition in adults », Journal of Phonetics, vol. 27, no 4,
p. 385-403.
Nahkola, Kari et Marja Saanilahti (2004), « Mapping language changes in real time: A panel study
on Finnish », Language Variation and Change, vol. 16, no 2, p. 75-92.
Nardy, Aurélie, Jean-Pierre Chevrot et Stéphanie Barbu (2014), « Sociolinguistic convergence and
social interactions within a group of preschoolers: A longitudinal study », Language Variation
and Change, vol. 26, no 3, p. 273-301.
Nearey, Terrance M. et Peter F. Assmann (1986), « Modeling the role of inherent spectral change in
vowel identification », Journal of the Acoustical Society of America, vol. 80, no 5, p. 1297-1308.
Nielsen, Kuniko (2011), « Specificity and abstractness of VOT imitation », Journal of Phonetics,
vol. 39, no 2, p. 132-142.
Nuolijärvi, Pirkko (1994), « On the interlinkage of sociolinguistic background variables », dans
Nordberg, Bengt (dir.), The Sociolinguistics of Urbanization: The Case of the Nordic Countries,
Berlin, New York, Walter de Gruyter, p. 149-170.
Nycz, Jennifer (2013), « Changing words or changing rules? Second dialect acquisition and
phonological representation », Journal of Pragmatics, vol. 52, p. 49-62.
― (2015), « Second dialect acquisition: A sociophonetic perspective », Language and Linguistics
Compass, vol. 9, no 11, p. 469-482.
― (2016), « Awareness and acquisition of new dialect features », dans Babel, Anna M. (dir.),
Awareness and Control in Sociolinguistic Research, Cambridge, Cambridge University Press,
p. 62-79.
― (2018), « Stylistic variation among mobile speakers: Using old and new regional variables to
construct complex place identity », Language Variation and Change, vol. 30, no 2, p. 175-202.
Ohala, John J. (1981), « The listener as a source of sound change », dans Masek, Carrie S., Roberta
A. Hendrick et Mary Frances Miller (dir.), Papers from the Parasession on Language and
Behavior, Chicago, Chicago Linguistic Society, p. 178-203.
― (1989), « Sound change is drawn from a pool of synchronic variation », dans Breivik, Leiv Egil
et Ernst Håkon Jahr (dir.), Language Change: Contribution to the Study of its Causes, Berlin,
Mouton de Gruyter, p. 173-198.
Omdal, Helge (1994), « From the valley to the city: Language modification and language
attitudes », dans Nordberg, Bengt (dir.), The Sociolinguistics of Urbanization: The Case of the
Nordic Countries, Berlin, New York, Walter de Gruyter, p. 116-148.

259
Ostiguy, Luc et Claude Tousignant (1996), « La diphtongaison des voyelles accentuées [e] et [ ] en
finale absolue en français de la Mauricie : un cas étonnant de labialisation et d’antériorisation »,
Revue québécoise de linguistique théorique et appliquée (Mélanges linguistiques), vol. 13,
p. 203-224.
Paradis, Claude (1985), An Acoustic Study of Variation and Change in the Vowel System of
Chicoutimi and Jonquière (Québec), thèse de doctorat, University of Pennsylvania.
Paradis, Claude et Jean Dolbec (1998), PHONO : caractéristiques phonétiques du français parlé au
Québec, [site web], consulté le 21 décembre 2018 au http://phono.uqac.ca/
Pardo, Jennifer S. (2006), « On phonetic convergence during conversational interaction », Journal
of the Acoustical Society of America, vol. 119, no 4, p. 2382-2393.
Pardo, Jennifer S., Rachel Gibbons, Alexandra Suppes et Robert M. Krauss (2012), « Phonetic
convergence in college roommates », Journal of Phonetics, vol. 40, no 1, p. 190-197.
Pardo, Jennifer S., Adelya Urmanche, Sherilyn Wilman, Jaclyn Wiener, Nicholas Mason, Keagan
Francis et Melanie Ward (2018), « A comparison of phonetic convergence in conversational
interaction and speech shadowing », Journal of Phonetics, vol. 69, p. 1-11.
Payne, Arvilla C. (1980), « Factors controlling the acquisition of the Philadelphia dialect by out-of-
state children », dans Labov, William (dir.), Locating Language in Time and Space, New York,
Academic Press, p. 143-178.
Pesqueira, Dinorah (2008), « Cambio fónico en situaciones de contacto dialectal: el caso de los
inmigrantes bonaerenses en la ciudad de México », dans Martin Butragueño, Pedro et Esther
Herrera Zendejas (dir.), Fonología instrumental: patrones fónicos y variación, México, El
Colegio de México, p. 171-190.
Peterson, Gordon E. et Harold L. Barney (1952), « Control methods used in a study of the vowels »,
Journal of the Acoustical Society of America, vol. 24, no 2, p. 175-184.
Pickering, Martin J. et Simon Garrod (2004), « Toward a mechanistic psychology of dialogue »,
Behavioral and Brain Sciences, vol. 27, no 2, p. 169-190.
― (2013), « An integrated theory of language production and comprehension », Behavioral and
Brain Sciences, vol. 36, no 4, p. 329-347.
Pierrehumbert, Janet B. (2006), « The next toolkit », Journal of Phonetics, vol. 34, no 4, p. 516-530.
― (2016), « Phonological representation: Beyond abstract versus episodic », Annual Review of
Linguistics, vol. 2, no 1, p. 33-52.
Poplack, Shana et Anne St-Amand (2009), « Les Récits du français québécois d’autrefois : reflet du
parler vernaculaire du 19e siècle », Revue canadienne de linguistique, vol. 54, no 3, p. 511-546.
Rauter, Julian (2016), « City and country: Dialect acquisition in the Catskill Mountains of Upstate
New York », Lengua y migración, vol. 8, no 1, p. 7-28.
Reed, David W. et John L. Spicer (1952), « Correlation methods of comparing idiolects in a
transition area », Language, vol. 28, no 3, p. 348-359.
Reifman, Alan, Jeffrey Jensen Arnett et Malinda J. Colwell (2007), « Emerging adulthood: Theory,
assessment, and application », Journal of Youth Development, vol. 2, no 1, p. 39-50.
Reinke, Kristin (2005), « La langue à la télévision québécoise : aspects sociophonétiques », Suivi de
la situation linguistique, no 6, Office québécois de la langue française, Québec, 61 p.

260
Remysen, Wim (2016a), « Langue et espace au Québec : les Québécois perçoivent-ils des accents
régionaux ? », Lingue, culture, mediazioni, numéro spécial, Espaces réels et imaginaires au
Québec et en Acadie : enjeux culturels, linguistiques et géographiques, p. 31-57.
― (2016b), « Le “vent” dans les voiles à Montréal, ou la diffusion sociale et géographique de la
réalisation postérieure de la voyelle nasale ouverte /ɑ/ en français québécois », Cahiers
internationaux de sociolinguistique, no 10, p. 135-158.
Reubold, Ulrich et Jonathan Harrington (2015), « Disassociating the effects of age from phonetic
change: A longitudinal study of formant frequencies », dans Gerstenberg, Annette et Anja
Voeste (dir.), Language Development: The Lifespan Perspective, Amsterdam, John Benjamins,
p. 9-38.
― (2018), « The influence of age on estimating sound change acoustically from longitudinal data »,
dans Wagner, Suzanne Evans et Isabelle Buchstaller (dir.), Panel Studies of Variation and
Change, New York, Routledge, p. 129-151.
Rézeau, Pierre (2001), Dictionnaire des régionalismes de France : géographie et histoire d’un
patrimoine linguistique, Louvain-la-Neuve, De Boeck.
Rivard, Adjutor (1914), Études sur les parlers de France au Canada, Québec, Garneau.
Riverin-Coutlée, Josiane (2014), D’une ouverture de la voyelle /ɛ/ en inale absolue en rançais
québécois : analyse acoustique et perceptive, mémoire de maîtrise, Université du Québec à
Chicoutimi.
Riverin-Coutlée, Josiane et Vincent Arnaud (2014), « Portrait acoustique d’une variation régionale
en français québécois contemporain : l’ouverture de la voyelle /ɛ/ en finale de mot », Actes des
XXXes Journées d’études sur la parole, Le Mans, France, p. 585-593.
Rogers, Inge (1981), « The influence of Australian English intonation on the speech of two British
children », Working Papers of the Speech and Language Research Centre, Macquarie
University, vol. 3, p. 25-42.
Rys, Kathy et Dries Bonte (2006), « The role of linguistic factors in the process of second dialect
acquisition », dans Hinskens, Frans (dir.), Language Variation – European Perspectives,
Amsterdam, John Benjamins, p. 201-215.
Rys, Kathy, Emmanuel Keuleers, Walter Daelemans et Steven Gillis (2017), « Acquisition of
phonological variables of a Flemish dialect by children raised in Standard Dutch: Some
considerations on the learning mechanisms », dans De Vogelaer, Gunther et Matthias Katerbow
(dir.), Acquiring Sociolinguistic Variation, Amsterdam, John Benjamins, p. 267-304.
Sancier, Michele L. et Carol A. Fowler (1997), « Gestural drift in a bilingual speaker of Brazilian
Portuguese and English », Journal of Phonetics, vol. 25, no 4, p. 421-436.
Sankoff, Gillian (2004), « Adolescents, young adults, and the critical period: Two case studies from
“Seven Up” », dans Fought, Carmen (dir.), Sociolinguistic Variation: Critical Reflections,
Oxford, Oxford University Press, p. 121-139.
― (2005), « Cross-sectional and longitudinal studies in sociolinguistics », dans Ammon, Ulrich,
Norbert Dittmar, Klaus J. Mattheier et Peter Trudgill (dir.), Sociolinguistics: An International
Handbook of the Science of Language and Society, Berlin, Mouton de Gruyter, p. 1003-1013.
― (2018a), « Before there were corpora: The evolution of the Montreal French project as a
longitudinal study », dans Wagner, Suzanne Evans et Isabelle Buchstaller (dir.), Panel Studies of
Variation and Change, New York, Routledge, p. 21-51.

261
― (2018b), « Language change across the lifespan », Annual Review of Linguistics, vol. 4, no 1,
p. 297-316.
Sankoff, Gillian et Hélène Blondeau (2007), « Language change across the lifespan: /r/ in Montreal
French », Language, vol. 83, no 3, p. 560-588.
― (2013), « Instability of the [r] ~ [ʀ] alternation in Montreal French: An exploration of stylistic
conditioning in a sound change in progress », dans Spreafico, Lorenzo, Alessandro Vietti, Didier
Demolin et Wim Zonneveld (dir.), Rhotics. New Data and Perspectives, Bozen-Bolzano,
bu,press, p. 249-265.
Sankoff, Gillian et Henrietta Cedergren (1971), « Some results of a sociolinguistic study of
Montreal French », dans Darnell, Regna (dir.), Linguistic Diversity in Canadian Society,
Edmonton, Linguistic Research, p. 61-87.
Santerre, Laurent (1974), « Deux E et deux A phonologiques en français québécois : étude
phonologique, articulatoire et acoustique des oppositions de timbre et de durée », Cahier de
linguistique, no 4, p. 117-145.
― (1976), « Stabilité et variation des oppositions ɛ/ɜ et a/ɑ en français de Montréal », Logos
Semantikos, vol. 5, p. 375-384.
Saussure, Ferdinand de (1969 [1916]), Cours de linguistique générale, 3e édition, Paris, Payot.
Schwartz, Jean-Luc, Denis Beautemps, Christian Abry et Pierre Escudier (1993), « Inter-individual
and cross-linguistic strategies for the production of [i] vs. [y] contrast », Journal of Phonetics,
vol. 21, no 4, p. 411-425.
Scott, Donia R. et Anne Cutler (1984), « Segmental phonology and the perception of syntactic
structure », Journal of Verbal Learning and Verbal Behavior, vol. 23, no 4, p. 450-466.
Sebastián-Gallés, Núria (2005), « Cross-language speech perception », dans Pisoni, David B. et
Robert Ellis Remez (dir.), The Handbook of Speech Perception, Oxford, Blackwell, p. 546-566.
Sharma, Devyani (2018), « Style dominance: Attention, audience, and the “real me” », Language in
Society, vol. 47, no 1, p. 1-31.
Shockey, Linda (1984), « All in a flap: Long-term accommodation in phonology », International
Journal of the Sociology of Language, vol. 1984, no 46, p. 87-95.
Shockley, Kevin, Laura Sabadini et Carol A. Fowler (2004), « Imitation in shadowing words »,
Perception & Psychophysics, vol. 66, no 3, p. 422-429.
Siegel, Jeff (2010), Second Dialect Acquisition, Cambridge, Cambridge University Press.
Sigouin, Caroline (en préparation), Variation géophonétique en français québécois : une étude
acoustique et auditive, thèse de doctorat, Université Laval.
― (2013), Caractéristiques acoustiques des voyelles fermées tendues, relâchées et allongées en
français québécois, mémoire de maîtrise, Université du Québec à Chicoutimi.
Sigouin, Caroline et Vincent Arnaud (2015), « Quebec French close vowels in lenghtening
contexts: Tense, lax of diphtongised? An acoustic study », Proceedings of the XVIIIth
International Congress of Phonetic Sciences, Glasgow, Royaume-Uni, 4 p.
Simpson, Adrian P. (2009), « Phonetic differences between male and female speech », Language
and Linguistics Compass, vol. 3, no 2, p. 621-640.

262
Smiljanić, Rajka et Ann R. Bradlow (2009), « Speaking and hearing clearly: Talker and listener
factors in speaking style changes », Language and Linguistics Compass, vol. 3, no 1, p. 236-264.
Sobotta, Elissa (2006), « Continuum ou variétés? La classification des accents de migrants
aveyronnais à Paris », dans Krefeld, Thomas (dir.), Modellando lo spazio in prospettiva
linguistica, Frankfurt am Main, Peter Lang, p. 195-214.
Soliz, Jordan et Howard Giles (2014), « Relational and identity processes in communication: A
contextual and meta-analytical review of communication accommodation theory »,
Communication Yearbook, vol. 38, p. 107-143.
Sonderegger, Morgan (2015), « Trajectories of voice onset time in spontaneous speech on reality
TV », Proceedings of the XVIIIth International Congress of Phonetic Sciences, Glasgow,
Royaume-Uni, 4 p.
Sonderegger, Morgan, Max Bane et Peter Graff (2017), « The medium-term dynamics of accents on
reality television », Language, vol. 93, no 3, p. 598-640.
Sóskuthy, Márton, Paul Foulkes, Vincent Hughes et Bill Haddican (2018), « Changing words and
sounds: The roles of different cognitive units in sound change », Topics in Cognitive Science,
vol. 10, no 4, p. 787-802.
Sprowls, Lisa Marie (2014), Second-Dialect Acquisition in Southwestern Pennsylvania, mémoire de
maîtrise, University of Montana.
St-Amour, Martine (2018), « La migration interrégionale au Québec en 2016-2017 : la Gaspésie-
Îles-de-la-Madeleine parmi les régions gagnantes », Coup d’œil sociodémographique, no 63,
Institut de la statistique du Québec, Québec, 20 p.
Stanford, James N. (2008), « A sociotonetic analysis of Sui dialect contact », Language Variation
and Change, vol. 20, no 3, p. 409-450.
Starks, Donna et Donn Bayard (2002), « Individual variation in the acquisition of postvocalic /r/:
Day care and sibling order as potential variables », American Speech, vol. 77, no 2, p. 184-194.
Stevens, Kenneth N. (1989), « On the quantal nature of speech », Journal of Phonetics, vol. 17,
no 1/2, p. 3-45.
St-Gelais, Xavier, Christophe Coupé, François Pellegrino et Vincent Arnaud (2018), « Entre
Québec et France, qu’en est-il de l’antériorisation de /ɔ/ en français contemporain? », Actes des
XXXIIes Journées d’études sur la parole, Aix-en-Provence, France, p. 514-522.
Sundgren, Eva (2009), « The varying influence of social and linguistic factors on language stability
and change: The case of Eskilstuna », Language Variation and Change, vol. 21, no 1, p. 97-133.
Syrdal, Ann K. et Hundrai S. Gopal (1986), « A perceptual model of vowel recognition based on
the auditory representation of American English vowels », Journal of the Acoustical Society of
America, vol. 79, no 4, p. 1086-1100.
Tagliamonte, Sali A. et Sonja Molfenter (2007), « How’d you get that accent?: Acquiring a second
dialect of the same language », Language in Society, vol. 36, no 5, p. 649-675.
Tajfel, Henri (1974), « Social identity and intergroup behaviour », Social Science Information,
vol. 13, no 2, p. 65-93.

263
Tajfel, Henri et John C. Turner (1986), « The social identity theory of intergroup behavior », dans
Worchel, Stephen et William G. Austin (dir.), Psychology of Intergroup Relations, Chicago,
Nelson-Hall, p. 7-24.
Thakerar, Jitendra N., Howard Giles et Jenny Cheshire (1982), « Psychological and linguistic
parameters of speech accommodation theory », dans Fraser, Colin et Klaus R. Scherer (dir.),
Advances in the Social Psychology of Language, Cambridge, Cambridge University Press,
p. 205-255.
Thibault, André (2012), Dictionnaire suisse romand : particularités du français contemporain,
3e édition, Chêne-Bourg, Zoé.
Thibault, Pierrette et Diane Vincent (1990), Un corpus de français parlé. Montréal 84 : historique,
méthodes et perspectives de recherche, Québec, Université Laval, Département de langues et de
linguistique.
Thomas, Erik R. (2002), « Instrumental phonetics », dans Chambers, J. K., Peter Trudgill et Natalie
Schilling-Estes (dir.), The Handbook of Language Variation and Change, 1re édition, Oxford,
Blackwell, p. 168-200.
― (2011), Sociophonetics: An Introduction, Basingstoke, Palgrave Macmillan.
Thomas, Erik R. et Tyler Kendall (2007), NORM: The Vowel Normalization and Plotting Suite,
[logiciel en ligne], disponible au http://ncslaap.lib.ncsu.edu/tools/norm/
Trudgill, Peter (1972), « Sex, covert prestige and linguistic change in the urban British English of
Norwich », Language in Society, vol. 1, no 2, p. 179-195.
― (1986), Dialects in Contact, Oxford, Basil Blackwell.
― (2008), « Colonial dialect contact in the history of European languages: On the irrelevance of
identity to new-dialect formation », Language in Society, vol. 37, no 2, p. 241-254.
Urbatsch, Robert (2015), « Movers as early adopters of linguistic innovation », Journal of
Sociolinguistics, vol. 19, no 3, p. 372-390.
Vertovec, Steven (2007), « Super-diversity and its implications », Ethnic and Racial Studies,
vol. 30, no 6, p. 1024-1054.
Vincent, Diane, Marty Laforest et Guylaine Martel (1995), « Le corpus de Montréal 1995 :
adaptation de la méthode d’enquête sociolinguistique pour l’analyse conversationnelle »,
Dialangue, vol. 6, p. 29-45.
von Essen, María Clara (2016), « Variedades del español en contacto: acomodación sociolingüística
de una comunidad de inmigrantes argentinos en la ciudad de Málaga. Análisis acústico de las
variantes alofónicas de /ʝ/ », Lengua y migración, vol. 8, no 2, p. 7-43.
Vousten, Rob et Theo Bongaerts (1995), « Acquiring a dialect as L2: The case of the dialect of
Venray in the Dutch province of Limburg », dans Vierek, Wolfgang (dir.), Verhandlungen des
Internationalen Dialektologenkongresses Bamberg 1990, vol. 4, Stuttgart, Franz Steiner,
p. 299-313.
Wagner, Petra, Jürgen Trouvain et Frank Zimmerer (2015), « In defense of stylistic diversity in
speech research », Journal of Phonetics, vol. 48, p. 1-12.
Wagner, Suzanne Evans (2012), « Real-time evidence for age grad(ing) in late adolescence »,
Language Variation and Change, vol. 24, no 2, p. 179-202.

264
Wagner, Suzanne Evans et Ashley Hesson (2014), « Individual sensitivity to the frequency of
socially meaningful linguistic cues affects language attitudes », Journal of Language and Social
Psychology, vol. 33, no 6, p. 651-666.
Wagner, Suzanne Evans et Sali A. Tagliamonte (2018), « What makes a panel study work?
Researcher and participant in real time », dans Wagner, Suzanne Evans et Isabelle Buchstaller
(dir.), Panel Studies of Variation and Change, New York, Routledge, p. 213-232.
Walker, Abby (2014), Crossing Oceans with Voices and Ears: Second Dialect Acquisition and
Topic-Based Shifting in Production and Perception, thèse de doctorat, Ohio State University.
― (2018), « The effect of long-term second dialect exposure on sentence transcription in noise »,
Journal of Phonetics, vol. 71, p. 162-176.
Walker, Abby et Kathryn Campbell-Kibler (2015), « Repeat what after whom? Exploring variable
selectivity in a cross-dialectal shadowing task », Frontiers in Psychology, vol. 6, no 546, 18 p.
Walker, Abby, Jennifer Hay, Katie Drager et Kauyumari Sanchez (2018), « Divergence in speech
perception », Linguistics, vol. 56, no 1, p. 257-278.
Walker, Douglas C. (1984), The Pronunciation of Canadian French, Ottawa, University of Ottawa
Press.
Wardhaugh, Ronald (2010), An Introduction to Sociolinguistics, 6e édition, Chichester, Wiley-
Blackwell.
Watson, Catherine I. et Jonathan Harrington (1999), « Acoustic evidence for dynamic formant
trajectories in Australian English vowels », Journal of the Acoustical Society of America,
vol. 106, no 1, p. 458-468.
Watson, Kevin et Lynn Clark (2013), « How salient is the NURSE~SQUARE merger? », English
Language & Linguistics, vol. 17, no 2, p. 297-323.
Watt, Dominic (2002), « “I don’t speak with a Geordie accent, I speak, like, the Northern accent”:
Contact-induced levelling in the Tyneside vowel system », Journal of Sociolinguistics, vol. 6,
no 1, p. 44-63.
Weatherhead, Drew, Katherine S. White et Ori Friedman (2016), « Where are you from?
Preschoolers infer background from accent », Journal of Experimental Child Psychology,
vol. 143, p. 171-178.
Whalen, Douglas H. et Andrea G. Levitt (1995), « The universality of intrinsic F0 of vowels »,
Journal of Phonetics, vol. 23, no 3, p. 349-366.
Wieling, Martijn (2018), « Analyzing dynamic phonetic data using generalized additive mixed
modeling: A tutorial focusing on articulatory differences between L1 and L2 speakers of
English », Journal of Phonetics, vol. 70, p. 86-116.
Winford, Donald (2003), An Introduction to Contact Linguistics, 1re édition, Malden, Blackwell.
Wolfram, Walt (1997), « Dialect in society », dans Coulmas, Florian (dir.), The Handbook of
Sociolinguistics, Oxford, Blackwell, p. 107-126.
Xu, Yi (2010), « In defense of lab speech », Journal of Phonetics, vol. 38, no 3, p. 329-336.
Yaeger, Malcah (1979), Context-Determined Variation in Montreal French Vowels, thèse de
doctorat, University of Pennsylvania.

265
Yaeger-Dror, Malcah (1994), « Phonetic evidence for sound change in Quebec French », dans
Keating, Patricia A. (dir.), Phonological Structure and Phonetic Form: Papers in Laboratory
Phonology III, Cambridge, Cambridge University Press, p. 267-292.
Yu, Alan C. L., Carissa Abrego-Collier et Morgan Sonderegger (2013), « Phonetic imitation from
an individual-difference perspective: Subjective attitude, personality and “autistic” traits », PLoS
ONE, vol. 8, no 9, e74746.
Zahorian, Stephen A. et Amir Jalali Jagharghi (1993), « Spectral-shape features versus formants as
acoustic correlates for vowels », Journal of the Acoustical Society of America, vol. 94, no 4,
p. 1966-1982.
Ziliak, Zoe Lynn (2012), The Relationship between Perception and Production in Adult Acquisition
o a New Dialect’s Phonetic System, thèse de doctorat, University of Florida.

266
Annexe 1 : Courriel d’appel à participation

267
Annexe 2 : Mots cibles du corpus
Contextes
(V#) (Vptk) (Vbdg) (Vʁ) (Vvzʒ) (Vl) (Vfsʃ) (VN)
/i/ vie frite figue désir chétive pile friche frime
/y/ déchu flûte élude pur fuse cellule puce lune
/u/ fou soupe soude four rouge houle débouche gougoune
/e/ aller
/ø/ vœu creuse jeûne
/o/ peau rauque aube chose drôle fosse jaune
/ɛ/ passait bec plaide dessert brève belle crèche sème
Voyelles

/ɛː/ bête aide beige mêle caisse même


/œ/ le beurre neuve veulent œuf jeune
/ɔ/ bloc blogue porc toge école bosse pomme
/a/ fa flaque blague prépare page pédale face femme
/ɑ/ état Pâques part âge châle lâche âne
/ / quand descente tangue genre change ébranle France
/ɔ/ pont pompe tombe bronze ponce
/ / pain peinte Inde quinze rince
/œ/ brun défunte

268
Annexe 3 : Phrases porteuses de la tâche 1 et
phase d’entraînement
Tâche 1
À la campagne, l’air est pur. Il tente de sauver sa peau.
Anne brûle un feu rouge. J’hésiter à y aller.
Au soleil, on bronze. La lasagne est au four.
Avant de manger un raisin, je le rince. J’ignore où cette route débouche.
Boucles d’or goûte à la soupe. La piscine est creuse.
C’est gentil de sa part. Je mange du chocolat à Pâques.
Ça prend un jaune d’œuf. La soirée est encore jeune.
C’est la maison des fous. Je paie l’essence à la pompe.
Ces souliers sont en bon état. La vie est belle.
Cette nouvelle l’ébranle. Je rêve de partir pour l’Inde.
Colette ne fait pas son âge. Le bateau tangue.
Dans la poutine, il y a des frites. Je saute dans une flaque.
Son excuse est toujours la même. Marie met son châle.
Elle a besoin d’aide. Je vais en acheter une caisse.
Cette brebis est chétive. Le capitaine vomit à cause de la houle.
Elle a les yeux bruns. Jésus est dans la crèche.
C’est l’innocence qu’il plaide. L’enfant est privé de dessert.
Cette clôture doit être peinte. L’hiver, on sert nos gougounes.
Elle s’en fait trop avec la vie. Le champ est en friche.
En fin de semaine, j’ai cueilli des pommes. Maurice rêve d’une voiture neuve.
Cette fille est drôle. Le matin, j’ai l’air bête.
C’est le président déchu. Le cimetière est plein de tombes.
Gilles se promène à dos d’âne. On va manquer de pain.
Hier soir, j’ai perdu la face. Sa veste est beige.
C’est manger du crabe qu’ils veulent. Le métal, elle le soude.
Il faut changer les piles. Le microscope grossit les cellules.
Elle exprime ses plus chers désirs. On veut la parité hommes-femmes.
C’est par là qu’il passait. Le nouveau cours nous mêle.
Il faut faire un vœu. Sa voix est rauque.
Il ira, mais j’ignore quand. Le peuple honore la princesse défunte.
Elle fait fi de la question, elle l’élude. Les chiens attendent qu’on les lâche.
C’est pour se purifier qu’il jeûne. Quand on tousse, on se fait une ponce.
Il faut tourner la page. Les compliments fusent.
Il joue avec des blocs. Les loups-garous sortent à la pleine lune.
J’ai peur qu’elle change. Marilou tient un blogue.
Ils commencent déjà l’école. Les ornithorynques ont un bec.
C’est tellement mon genre. On boit du champagne dans une flûte.
Il m’a dit : « Fais-le ». Mon chat avait des puces.
J’ai pris plaisir à visiter la France. Obtenir son diplôme est une bonne chose.
La gamme commence par do, ré, mi, fa. Pierre élève des porcs.
J’ai réservé pour quinze. Pour monter la côte, elle pédale.
Il met ses skis pour la descente. Quand on gradue, on met une toge.
J’aime les dattes et les figues. Quasimodo a une bosse.
Il s’est couché à l’aube. Sa visite fut brève.
J’espère que c’est une blague. Tourne après le poteau jaune.

269
Une tempête se prépare. Il creuse une fosse.
Voici les graines qu’on sème. Le cuisinier abuse du beurre.
Le funambule traverse le pont. C’est juste de la frime.

Phase d’entraînement
Je lis des phrases tout haut.
On visite le Vermont.
Le moustique pique.
Son grand-père cuisine bien.
Il pleut encore.

Je pense au mot haut très fort.


Je pense au mot Vermont très fort.
Je pense au mot pique très fort.
Je pense au mot bien très fort.
Je pense au mot encore très fort.

haut
Vermont
pique
bien
encore

270
Annexe 4 : Script Praat de relevé des mesures
# Script Praat (5.3.x) qui permet de relever les 4 premiers formants et la f0 à 25%, 50% et 75% de la
durée, ainsi que la durée
# Fonctionne à partir de la fenêtre Editor
# F4 est mesuré et sort à la toute fin, au cas où
# Les paramètres de détection formantique (plafond + nombre de formants) sont inscrits après F4
# Le chemin du fichier de sortie (sortie$) doit être spécifié, le fichier .txt doit exister, mais le code
du locuteur n’a pas à être précisé

fichier$ = selected$ ("TextGrid")


locuteur$ = left$ (fichier$, 8)
voyelle$ = Get label of interval

sortie$ = "E:\Résultats\'locuteur$'_voyelles_T1.txt"

debut = Get start of selection


fin = Get end of selection
duree=(fin-debut)
onset=(debut+(duree*0.25))
milieu=(debut+(duree*0.5))
offset=(debut+(duree*0.75))

Move cursor to... onset


f0_onset = Get pitch
f1_onset = Get first formant
f2_onset = Get second formant
f3_onset = Get third formant
f4_onset = Get fourth formant

Move cursor to... milieu


f0_milieu = Get pitch
f1_milieu = Get first formant
f2_milieu = Get second formant
f3_milieu = Get third formant
f4_milieu = Get fourth formant

Move cursor to... offset


f0_offset = Get pitch
f1_offset = Get first formant
f2_offset = Get second formant
f3_offset = Get third formant
f4_offset = Get fourth formant

settings$ = Editor info


plafond = extractNumber (settings$, "Formant maximum formant: ")
nbpoles = extractNumber (settings$, "Formant number of poles: ")
nbformants=(nbpoles/2)

271
Select previous tier
mot$ = Get label of interval

resultats$ = "'locuteur$'" + tab$ + "'mot$'" + tab$ + "'voyelle$'" + tab$ + "'duree:3'" + tab$ +


"'f0_onset:0'" + tab$ + "'f1_onset:0'" + tab$ + "'f2_onset:0'" + tab$ + "'f3_onset:0'" + tab$ +
"'f0_milieu:0'" + tab$ + "'f1_milieu:0'" + tab$ + "'f2_milieu:0'" + tab$ + "'f3_milieu:0'" + tab$ +
"'f0_offset:0'" + tab$ + "'f1_offset:0'" + tab$ + "'f2_offset:0'" + tab$ + "'f3_offset:0'" + tab$ +
"'f4_onset:0'" + tab$ + "'f4_milieu:0'" + tab$ + "'f4_offset:0'" + tab$ + "'plafond'" + tab$ +
"'nbformants'" + newline$
resultats$ >> 'sortie$'

272
Annexe 5 : Questionnaire démographique

- Âge _____________________________________________________________________

- Ville de naissance __________________________________________________________

- Date d’arrivée approximative dans la ville actuelle (s’il y a lieu) ______________________

- Autres villes de résidence ____________________________________________________

- Programme d’études actuel ___________________________________________________

- Programme d’études au collégial ______________________________________________

- Cégep fréquenté ____________________________________________________________

- Ville d’origine du père _______________________________________________________

- Niveau de scolarité du père ___________________________________________________

- Emploi du père ____________________________________________________________

- Ville d’origine de la mère ____________________________________________________

- Niveau de scolarité de la mère _________________________________________________

- Emploi de la mère __________________________________________________________

- Connaissance d’autres langues ________________________________________________

- Emploi occupé (s’il y a lieu) __________________________________________________

273
Annexe 6 : Questionnaires autoadministrés
Mobiles T1

Questionnaire A – Automne 2016


Le questionnaire suivant sert à établir le profil universitaire des participants. Vous êtes libre de ne
pas répondre à certaines questions, mais vos réponses aideront grandement à faire avancer la
recherche. La confidentialité de vos réponses est assurée.
_____________________________________

1. Le programme dans lequel vous étudiez actuellement était-il votre premier choix lors de votre
demande d’admission à l’université ?
□ Oui
□ Non
2. Quels sont vos plans après le baccalauréat ? (Précisez lorsque demandé.)
□ Poursuivre mes études. Domaine : ____________________________________
□ Intégrer le marché du travail. Emploi projeté : ___________________________
□ Je ne sais pas encore.
3. Après vos études, laquelle des options suivantes est la plus probable ?
□ Vivre et travailler ici.
□ Retourner vivre et travailler dans ma région.
□ Vivre et travailler ailleurs. Préférence pour un lieu ? ________________________
4. Y a-t-il des personnes dans votre programme que vous connaissiez déjà (amis, collègues,
connaissances du Cégep ou du secondaire, etc.) ?
□ Oui
□ Non
5. Depuis le début de la session, avez-vous fait la connaissance de nouveaux étudiants de votre
programme ?
□ Oui
□ Non
6. Faites-vous des activités sociales avec les autres étudiants de votre programme à l’extérieur des
cours ? Si oui, lesquelles ? (exemples : groupes d’étude, sports, sorties diverses)
□ Oui : ________________________________________________________
□ Non
7. Vous impliquez-vous autrement à l’université qu’en allant à vos cours ? Si oui, comment ?
(ex. : comités, bénévolat)
□ Oui : ________________________________________________________
□ Non

274
8. Si vous pensez aux 5 ou 10 personnes que vous fréquentez le plus souvent en ce moment, de
quelle(s) ville(s) viennent-elles ?
______________________________________________________________

9. Est-ce qu’il s’agit des mêmes personnes que vous fréquentiez le plus quand vous étiez au Cégep ?
□ Oui
□ Non
10. Depuis que vous avez commencé l’université, faites-vous les mêmes activités qu’avant ?
Si oui, précisez. (ex. : sports, sorties)
Sinon, qu’est-ce qui a changé ? (ex. : j’ai arrêté le soccer, je vais davantage au restaurant)
□ Oui : ________________________________________________________
□ Non : ________________________________________________________
11. Présentement, dans quel type d’habitation demeurez-vous ?
□ Maison
□ Appartement
□ Chambre
□ Résidence
□ Autre : _______________________________________________________
12. Présentement, avec qui vivez-vous ? (Cochez autant de cases que nécessaire.)
□ Parent(s)
□ Seul
□ Conjoint(e)
□ Colocataire(s)
□ Autre : _______________________________________________________
13. À la question 12, si vous avez répondu Conjoint(e), précisez les éléments suivants.
Âge : __________________________________________________________
Occupation : ____________________________________________________
Ville d’origine : ___________________________________________________

14. À la question 12, si vous avez répondu Colocataire(s), précisez les éléments suivants.
Âge(s) : ________________________________________________________
Occupation(s) : __________________________________________________
Ville(s) d’origine : _________________________________________________
Avant d’emménager, nous nous connaissions depuis : ________________________

15. Trouvez-vous que les gens ici ont un accent différent ? Si oui, avez-vous des exemples ?
□ Oui : ________________________________________________________
□ Non
16. Depuis que vous êtes arrivé ici, est-ce que quelqu’un vous a dit que vous aviez un accent ?
□ Oui
□ Non

275
17. Trouvez-vous que les enseignants dans votre programme utilisent un vocabulaire technique
approprié pour des étudiants de première année ? Sinon, pourquoi ?
□ Oui :
□ Non : ________________________________________________________
18. Avez-vous des enfants ou êtes-vous sur le point d’en avoir ?
□ Oui
□ Non
19. Dans la prochaine année, à quelle fréquence pensez-vous retourner chez vous pour des visites ?
(ex. : toutes les semaines, tous les mois, seulement lors des longs congés)
______________________________________________________________

20. À quel point êtes-vous financièrement indépendant de vos parents ?


Tout à fait indépendant Pas du tout indépendant
□ □ □ □
21. Indiquez à quel point les phrases suivantes décrivent ce à quoi ressemble votre vie en ce
moment.

Tout à fait ma vie Pas du tout ma vie


Tout me semble possible. □ □ □ □
Ma vie est propice à
l’exploration. □ □ □ □
Ma vie est stressante. □ □ □ □
La pression est forte. □ □ □ □
Je suis en train de définir mon
identité. □ □ □ □
Mes décisions reposent sur
mes propres idées et valeurs. □ □ □ □
Je me sens adulte sur certains
aspects et moins sur d’autres. □ □ □ □
Je suis en train de devenir un
adulte. □ □ □ □

276
Mobiles T2

Questionnaire A2
Le questionnaire suivant permet d’assurer un suivi du profil universitaire des participants. Vous
êtes libre de ne pas répondre à certaines questions, mais vos réponses aideront grandement à faire
avancer la recherche. La confidentialité de vos réponses est assurée.
_____________________________________

1. Depuis que vous avez commencé le baccalauréat, avez-vous changé de programme ou avez-vous
songé à le faire ? Si oui, pour quel autre programme ?
□ Oui : ________________________________________________________
□ Non
2. Quels sont vos plans après le baccalauréat ? (Précisez lorsque demandé.)
□ Poursuivre mes études. Domaine : ____________________________________
□ Intégrer le marché du travail. Emploi projeté : ___________________________
□ Je ne sais pas encore.
3. Après vos études, laquelle des options suivantes est la plus probable ?
□ Vivre et travailler ici.
□ Retourner vivre et travailler dans ma région.
□ Vivre et travailler ailleurs. Préférence pour un lieu ? ________________________
4. Est-ce que vous vous entendez bien avec les autres étudiants de votre programme ?
□ Oui
□ Non
5. Faites-vous des activités sociales avec ces collègues à l’extérieur des cours ? Si oui, lesquelles ?
(exemples : groupes d’études, sports, sorties diverses)
□ Oui
□ Non
6. Vous impliquez-vous autrement à l’université qu’en allant à vos cours ? Si oui, comment ?
(ex. : comités, bénévolat)
□ Oui : ________________________________________________________
□ Non
7. Si vous pensez aux 5 ou 10 personnes que vous fréquentez le plus souvent en ce moment, de
quelle(s) ville(s) viennent-elles ?
______________________________________________________________

8. Globalement, s’agit-il des mêmes personnes que vous fréquentiez à pareille date l’an passé ?
□ Oui
□ Non

277
9. Depuis que vous avez commencé l’université, faites-vous les mêmes activités qu’avant ?
Si oui, précisez. (ex. : sports, sorties)
Sinon, qu’est-ce qui a changé ? (ex. : j’ai arrêté le soccer, je vais davantage au restaurant)
□ Oui : ________________________________________________________
□ Non : ________________________________________________________
10. Présentement, dans quel type d’habitation demeurez-vous ?
□ Maison
□ Appartement
□ Chambre
□ Résidence
□ Autre : _______________________________________________________
11. Présentement, avec qui vivez-vous ? (Cochez autant de cases que nécessaire.)
□ Parent(s)
□ Seul
□ Conjoint(e)
□ Colocataire(s)
□ Autre : _______________________________________________________
12. À la question 11, si vous avez répondu Conjoint(e), précisez les éléments suivants.
Âge : __________________________________________________________
Occupation : ____________________________________________________
Ville d’origine : ___________________________________________________

13. À la question 11, si vous avez répondu Colocataire(s), précisez les éléments suivants.
Âge(s) : ________________________________________________________
Occupation(s) : __________________________________________________
Ville(s) d’origine : _________________________________________________
Avant d’emménager, nous nous connaissions depuis : ________________________

14. Les gens d’ici vous font-ils remarquer que vous avez changé votre façon de parler depuis que
vous êtes arrivé ? Si oui, quelle est leur réaction ? (ex. : contents, fâchés, fiers, etc.)
□ Oui : ________________________________________________________
□ Non
15. Quand vous retournez dans votre région, les gens de là-bas vous font-ils remarquer que vous
avez changé votre façon de parler depuis que vous avez déménagé ? Si oui, quelle est leur
réaction ? (ex. : contents, fâchés, fiers, etc.)
□ Oui : ________________________________________________________
□ Non

278
16. Personnellement, pensez-vous avoir changé certaines choses dans votre façon de parler ? Si oui,
avez-vous des exemples (de nouveaux mots, de nouvelles expressions, de nouvelles façons de
prononcer, etc.) ? Sinon, comment expliquez-vous cela (ex. : il n’y avait rien à changer parce
que je n’ai pas vraiment d’accent, j’ai consciemment fait un effort pour ne rien changer, etc.) ?
□ Oui : ________________________________________________________
□ Non : ________________________________________________________
17. Avez-vous appris un vocabulaire technique lié à votre domaine depuis le début de vos études?
□ Oui
□ Non
18. Avez-vous des enfants ou êtes-vous sur le point d’en avoir ?
□ Oui
□ Non
19. À quelle fréquence êtes-vous retourné chez vous pour des visites dans la dernière année ?
(ex. : toutes les semaines, tous les mois, seulement lors des longs congés)
______________________________________________________________

20. Où avez-vous passé la majorité de l’été ?


______________________________________________________________

21. À quel point êtes-vous financièrement indépendant de vos parents ?


Tout à fait indépendant Pas du tout indépendant
□ □ □ □
22. Indiquez à quel point les phrases suivantes décrivent ce à quoi ressemble votre vie en ce
moment.

Tout à fait ma vie Pas du tout ma vie


Tout me semble possible. □ □ □ □
Ma vie est propice à
l’exploration. □ □ □ □
Ma vie est stressante. □ □ □ □
La pression est forte. □ □ □ □
Je suis en train de définir mon
identité. □ □ □ □
Mes décisions reposent sur
mes propres idées et valeurs. □ □ □ □
Je me sens adulte sur certains
aspects et moins sur d’autres. □ □ □ □
Je suis en train de devenir un
adulte. □ □ □ □

279
Sédentaires T1

Questionnaire B – Automne 2016


Le questionnaire suivant sert à établir le profil universitaire des participants. Vous êtes libre de ne
pas répondre à certaines questions, mais vos réponses aideront grandement à faire avancer la
recherche. La confidentialité de vos réponses est assurée.
_____________________________________

1. Le programme dans lequel vous étudiez actuellement était-il votre premier choix lors de votre
demande d’admission à l’université ?
□ Oui
□ Non
2. Quels sont vos plans après le baccalauréat ? (Précisez lorsque demandé.)
□ Poursuivre mes études. Domaine : ____________________________________
□ Intégrer le marché du travail. Emploi projeté : ___________________________
□ Je ne sais pas encore.
3. Après vos études, laquelle des options suivantes est la plus probable ?
□ Vivre et travailler ici.
□ Vivre et travailler ailleurs. Préférence pour un lieu ? ________________________
4. Trouvez-vous que les enseignants dans votre programme utilisent un vocabulaire technique
approprié pour des étudiants de première année ? Sinon, pourquoi ?
□ Oui :
□ Non : ________________________________________________________
5. Y a-t-il des personnes dans votre programme que vous connaissiez déjà (amis, collègues,
connaissances du Cégep ou du secondaire, etc.) ?
□ Oui
□ Non
6. Depuis le début de la session, avez-vous fait la connaissance de nouveaux étudiants de votre
programme ?
□ Oui
□ Non
7. Faites-vous des activités sociales avec les autres étudiants de votre programme à l’extérieur des
cours ? Si oui, lesquelles ? (exemples : groupes d’étude, sports, sorties diverses)
□ Oui : ________________________________________________________
□ Non
8. Vous impliquez-vous autrement à l’université qu’en allant à vos cours ? Si oui, comment ?
(ex. : comités, bénévolat)
□ Oui : ________________________________________________________
□ Non

280
9. Si vous pensez aux 5 ou 10 personnes que vous fréquentez le plus souvent en ce moment, de
quelle(s) ville(s) viennent-elles ?
______________________________________________________________

10. Est-ce qu’il s’agit des mêmes personnes que vous fréquentiez le plus quand vous étiez au Cégep ?
□ Oui
□ Non
11. Depuis que vous avez commencé l’université, faites-vous les mêmes activités qu’avant ?
Si oui, précisez. (ex. : sports, sorties)
Sinon, qu’est-ce qui a changé ? (ex. : j’ai arrêté le soccer, je vais davantage au restaurant)
□ Oui : ________________________________________________________
□ Non : ________________________________________________________
12. Présentement, dans quel type d’habitation demeurez-vous ?
□ Maison
□ Appartement
□ Chambre
□ Résidence
□ Autre : _______________________________________________________
13. Présentement, avec qui vivez-vous ? (Cochez autant de cases que nécessaire.)
□ Parent(s)
□ Seul
□ Conjoint(e)
□ Colocataire(s)
□ Autre : _______________________________________________________
14. À la question 13, si vous avez répondu Conjoint(e), précisez les éléments suivants.
Âge : __________________________________________________________
Occupation : ____________________________________________________
Ville d’origine : ___________________________________________________

15. À la question 13, si vous avez répondu Colocataire(s), précisez les éléments suivants.
Âge(s) : ________________________________________________________
Occupation(s) : __________________________________________________
Ville(s) d’origine : _________________________________________________
Avant d’emménager, nous nous connaissions depuis : ________________________

16. Avez-vous des enfants ou êtes-vous sur le point d’en avoir ?


□ Oui
□ Non
17. À quel point êtes-vous financièrement indépendant de vos parents ?
Tout à fait indépendant Pas du tout indépendant
□ □ □ □

281
18. Indiquez à quel point les phrases suivantes décrivent ce à quoi ressemble votre vie en ce
moment.

Tout à fait ma vie Pas du tout ma vie


Tout me semble possible. □ □ □ □
Ma vie est propice à
l’exploration. □ □ □ □
Ma vie est stressante. □ □ □ □
La pression est forte. □ □ □ □
Je suis en train de définir mon
identité. □ □ □ □
Mes décisions reposent sur
mes propres idées et valeurs. □ □ □ □
Je me sens adulte sur certains
aspects et moins sur d’autres. □ □ □ □
Je suis en train de devenir un
adulte. □ □ □ □

282
Sédentaires T2

Questionnaire B2
Le questionnaire suivant permet d’assurer un suivi du profil universitaire des participants. Vous
êtes libre de ne pas répondre à certaines questions, mais vos réponses aideront grandement à faire
avancer la recherche. La confidentialité de vos réponses est assurée.
_____________________________________

1. Depuis que vous avez commencé le baccalauréat, avez-vous changé de programme ou avez-vous
songé à le faire ? Si oui, pour quel autre programme ?
□ Oui : ________________________________________________________
□ Non
2. Quels sont vos plans après le baccalauréat ? (Précisez lorsque demandé.)
□ Poursuivre mes études. Domaine : ____________________________________
□ Intégrer le marché du travail. Emploi projeté : ___________________________
□ Je ne sais pas encore.
3. Après vos études, laquelle des options suivantes est la plus probable ?
□ Vivre et travailler ici.
□ Vivre et travailler ailleurs. Préférence pour un lieu ? ________________________
4. Avez-vous appris un vocabulaire technique lié à votre domaine depuis le début de vos études ?
□ Oui
□ Non
5. Est-ce que vous vous entendez bien avec les autres étudiants de votre domaine ?
□ Oui
□ Non
6. Faites-vous des activités sociales avec ces collègues à l’extérieur des cours ? Si oui, lesquelles ?
(exemples : groupes d’étude, sports, sorties diverses)
□ Oui : ________________________________________________________
□ Non
7. Vous impliquez-vous autrement à l’université qu’en allant à vos cours ? Si oui, comment ?
(ex. : comités, bénévolat)
□ Oui : ________________________________________________________
□ Non
8. Si vous pensez aux 5 ou 10 personnes que vous fréquentez le plus souvent en ce moment, de
quelle(s) ville(s) viennent-elles ?
______________________________________________________________

10. Globalement, s’agit-il des mêmes personnes que vous fréquentiez à pareille date l’an passé ?
□ Oui
□ Non

283
10. Depuis que vous avez commencé l’université, faites-vous les mêmes activités qu’avant ?
Si oui, précisez. (ex. : sports, sorties)
Sinon, qu’est-ce qui a changé ? (ex. : j’ai arrêté le soccer, je vais davantage au restaurant)
□ Oui : ________________________________________________________
□ Non : ________________________________________________________
11. Présentement, dans quel type d’habitation demeurez-vous ?
□ Maison
□ Appartement
□ Chambre
□ Résidence
□ Autre : _______________________________________________________
12. Présentement, avec qui vivez-vous ? (Cochez autant de cases que nécessaire.)
□ Parent(s)
□ Seul
□ Conjoint(e)
□ Colocataire(s)
□ Autre : _______________________________________________________
13. À la question 12, si vous avez répondu Conjoint(e), précisez les éléments suivants.
Âge : __________________________________________________________
Occupation : ____________________________________________________
Ville d’origine : ___________________________________________________

14. À la question 12, si vous avez répondu Colocataire(s), précisez les éléments suivants.
Âge(s) : ________________________________________________________
Occupation(s) : __________________________________________________
Ville(s) d’origine : _________________________________________________
Avant d’emménager, nous nous connaissions depuis : ________________________

15. Avez-vous des enfants ou êtes-vous sur le point d’en avoir ?


□ Oui
□ Non
16. À quel point êtes-vous financièrement indépendant de vos parents ?
Tout à fait indépendant Pas du tout indépendant
□ □ □ □

284
17. Indiquez à quel point les phrases suivantes décrivent ce à quoi ressemble votre vie en ce
moment.

Tout à fait ma vie Pas du tout ma vie


Tout me semble possible. □ □ □ □
Ma vie est propice à
l’exploration. □ □ □ □
Ma vie est stressante. □ □ □ □
La pression est forte. □ □ □ □
Je suis en train de définir mon
identité. □ □ □ □
Mes décisions reposent sur
mes propres idées et valeurs. □ □ □ □
Je me sens adulte sur certains
aspects et moins sur d’autres. □ □ □ □
Je suis en train de devenir un
adulte. □ □ □ □

285
Annexe 7 : Tableau des moyennes et écarts-types par voyelle et indice
acoustique
F1 dynamique F2 dynamique F3 dynamique
F1 (Hz) F2 (Hz) F3 (Hz) durée (s)
(Hz) (Hz) (Hz)

Écart-type

Écart-type

Écart-type

Écart-type

Écart-type

Écart-type

Écart-type
Moyenne

Moyenne

Moyenne

Moyenne

Moyenne

Moyenne

Moyenne
Mobilité
Voyelle

Temps
Sexe

T1 322 39 2614 221 3468 263 -45 22 -46 109 -6 209 0,162 0,042
Mob
T2 351 51 2535 193 3402 249 -40 40 -11 93 22 174 0,155 0,044
F
T1 335 42 2601 184 3448 198 -34 37 -52 122 -83 132 0,163 0,047
Sed
T2 366 38 2564 132 3431 183 -16 30 -2 83 25 179 0,153 0,045
[i]
T1 276 30 2114 211 2839 122 -1 9 17 118 35 64 0,130 0,032
Mob
T2 282 25 2079 128 2743 104 7 36 4 60 -44 105 0,124 0,037
M
T1 280 13 2079 122 2932 135 -7 22 23 86 -11 107 0,171 0,059
Sed
T2 271 23 2084 143 2944 131 -13 24 -4 78 -33 96 0,174 0,051
T1 450 58 2365 227 3115 194 -14 66 -123 210 -30 99 0,126 0,041
Mob
T2 458 53 2320 189 3075 236 8 52 -109 184 -18 99 0,126 0,045
F
T1 426 47 2445 198 3171 142 -19 56 -121 201 -63 81 0,123 0,047
Sed
T2 443 39 2449 165 3149 170 -10 38 -85 165 -35 110 0,120 0,041
[ɪ]
T1 352 40 1859 235 2623 113 -14 43 -89 193 13 98 0,106 0,031
Mob
T2 382 53 1895 161 2554 109 -9 42 -90 167 18 61 0,110 0,038
M
T1 367 42 1958 132 2649 129 -9 40 -69 151 10 86 0,134 0,043
Sed
T2 382 58 1980 130 2655 110 -4 50 -62 134 -2 73 0,130 0,042

286
F1 dynamique F2 dynamique F3 dynamique
F1 (Hz) F2 (Hz) F3 (Hz) durée (s)
(Hz) (Hz) (Hz)

Écart-type

Écart-type

Écart-type

Écart-type

Écart-type

Écart-type

Écart-type
Moyenne
Moyenne

Moyenne

Moyenne

Moyenne

Moyenne

Moyenne
Mobilité
Voyelle

Temps
Sexe

T1 343 44 2094 199 2595 238 -40 40 33 121 114 126 0,164 0,064
Mob
T2 376 54 2036 152 2509 202 -41 42 20 137 82 148 0,157 0,065
F
T1 332 41 2067 133 2582 186 -40 44 26 118 126 115 0,176 0,083
Sed
T2 380 43 2100 114 2536 158 -45 46 28 146 82 95 0,162 0,081
[y]
T1 284 29 1674 84 2159 125 1 26 55 109 18 109 0,132 0,053
Mob
T2 284 36 1714 100 2140 65 -11 27 81 132 95 94 0,123 0,059
M
T1 284 17 1704 129 2145 140 -18 32 73 108 102 105 0,167 0,064
Sed
T2 277 24 1741 141 2127 181 -29 23 50 113 110 118 0,170 0,078
T1 433 43 1921 175 2733 263 -6 53 -101 94 62 92 0,133 0,037
Mob
T2 449 40 1913 141 2649 239 10 39 -68 86 69 121 0,135 0,044
F
T1 411 36 1950 149 2744 215 -16 51 -41 75 67 99 0,134 0,041
Sed
T2 437 34 1997 110 2713 190 -10 32 -49 58 83 89 0,134 0,046
[ʏ]
T1 345 17 1549 110 2352 209 -2 25 -93 87 43 89 0,115 0,036
Mob
T2 367 30 1576 119 2318 176 -6 40 -80 86 87 58 0,119 0,035
M
T1 349 27 1593 114 2294 177 -3 27 -44 74 93 122 0,144 0,047
Sed
T2 364 33 1635 126 2284 171 6 34 -40 66 72 96 0,142 0,051
T1 304 38 751 84 2802 234 -40 50 146 135 -21 170 0,164 0,050
Mob
T2 351 58 740 73 2701 326 -61 48 106 122 -50 123 0,156 0,061
F
T1 321 44 793 115 2766 229 -38 58 116 124 -53 109 0,162 0,062
Sed
T2 351 44 745 78 2807 258 -49 41 75 68 -65 163 0,150 0,061
[u]
T1 298 20 765 74 2450 237 -26 20 131 110 33 83 0,141 0,040
Mob
T2 299 26 738 66 2384 112 -33 25 69 108 -9 164 0,123 0,045
M
T1 291 13 702 109 2329 100 -34 34 89 78 -27 110 0,174 0,056
Sed
T2 292 27 681 78 2292 159 -27 56 92 80 -41 115 0,166 0,064

287
F1 dynamique F2 dynamique F3 dynamique
F1 (Hz) F2 (Hz) F3 (Hz) durée (s)
(Hz) (Hz) (Hz)

Écart-type

Écart-type

Écart-type

Écart-type

Écart-type

Écart-type

Écart-type
Moyenne

Moyenne

Moyenne

Moyenne

Moyenne

Moyenne

Moyenne
Mobilité
Voyelle

Temps
Sexe

T1 417 48 1204 272 2827 230 -9 81 137 227 2 113 0,138 0,043
Mob
T2 442 43 1208 294 2737 211 -5 53 140 236 -8 108 0,140 0,046
F
T1 399 35 1207 271 2830 150 -17 64 164 204 -20 113 0,138 0,048
Sed
T2 434 32 1237 314 2749 178 -6 39 179 249 -22 113 0,131 0,040
[ʊ]
T1 337 25 1004 200 2438 159 -3 36 142 138 42 86 0,121 0,048
Mob
T2 378 39 1010 205 2365 107 2 32 128 161 13 90 0,118 0,043
M
T1 351 28 1026 218 2359 109 -6 46 101 152 17 94 0,150 0,050
Sed
T2 364 32 1030 231 2288 136 8 38 108 178 -8 90 0,149 0,052
T1 344 32 2636 191 3242 219 -102 42 120 119 79 98 0,131 0,021
Mob
T2 390 43 2530 131 3134 225 -92 52 110 109 59 87 0,115 0,020
F
T1 351 20 2656 173 3187 149 -67 41 35 95 71 128 0,125 0,020
Sed
T2 387 20 2618 163 3172 192 -78 20 115 84 77 88 0,106 0,022
/e/
T1 304 26 1866 199 2509 123 -40 44 149 52 -13 70 0,097 0,008
Mob
T2 317 15 1929 162 2487 69 -85 25 147 133 35 49 0,096 0,009
M
T1 328 21 2050 144 2662 99 -50 51 162 118 65 66 0,134 0,030
Sed
T2 333 38 2049 131 2647 107 -70 60 166 82 58 91 0,118 0,024
T1 508 101 1715 120 2431 305 -99 92 230 110 29 158 0,182 0,045
Mob
T2 506 95 1716 147 2372 261 -90 71 203 141 13 133 0,181 0,049
F
T1 446 52 1739 144 2415 178 -119 64 204 126 102 127 0,180 0,047
Sed
T2 479 51 1763 118 2344 207 -96 57 193 113 -6 117 0,176 0,048
/ø/
T1 388 80 1351 113 2079 180 -101 85 209 110 -89 159 0,154 0,032
Mob
T2 433 73 1367 117 2048 131 -76 50 219 127 -95 124 0,150 0,044
M
T1 392 59 1396 126 2108 195 -99 60 150 94 -54 180 0,191 0,054
Sed
T2 415 55 1423 137 2058 156 -94 67 154 93 -61 149 0,194 0,055

288
F1 dynamique F2 dynamique F3 dynamique
F1 (Hz) F2 (Hz) F3 (Hz) durée (s)
(Hz) (Hz) (Hz)

Écart-type

Écart-type

Écart-type

Écart-type

Écart-type

Écart-type

Écart-type
Moyenne

Moyenne

Moyenne

Moyenne

Moyenne

Moyenne

Moyenne
Mobilité
Voyelle

Temps
Sexe

T1 469 88 919 171 2908 229 -140 85 -103 174 -17 188 0,189 0,042
Mob
T2 486 83 902 165 2801 246 -108 61 -94 134 -27 169 0,184 0,042
F
T1 433 67 880 119 2923 163 -142 75 -87 159 -4 145 0,187 0,044
Sed
T2 478 55 863 88 2851 228 -101 49 -134 156 45 152 0,176 0,039
/o/
T1 357 40 754 65 2555 162 -97 46 -89 112 -6 151 0,148 0,032
Mob
T2 390 40 743 63 2505 148 -98 39 -48 123 -25 85 0,159 0,046
M
T1 391 48 801 92 2508 148 -129 69 -86 103 -21 102 0,205 0,047
Sed
T2 413 50 778 92 2371 183 -113 53 -109 112 -51 96 0,198 0,054
T1 593 64 2176 184 3030 175 -23 92 -100 194 -25 85 0,148 0,043
Mob
T2 591 59 2169 135 2965 184 6 63 -72 153 -22 95 0,141 0,038
F
T1 554 60 2236 162 3080 127 -55 84 -67 178 -40 87 0,145 0,045
Sed
T2 564 48 2259 129 3013 124 -18 55 -40 150 -9 90 0,138 0,041
/ɛ/
T1 467 48 1726 151 2558 104 -26 75 -124 139 -15 68 0,122 0,035
Mob
T2 491 41 1760 115 2487 81 4 52 -118 151 13 66 0,124 0,035
M
T1 505 56 1784 140 2581 98 -33 59 -19 125 7 74 0,152 0,045
Sed
T2 516 46 1827 112 2561 100 -13 53 -13 126 4 63 0,149 0,045
T1 694 81 1983 217 2891 156 -225 109 485 200 71 124 0,221 0,041
Mob
T2 706 78 1998 173 2809 144 -195 102 411 199 99 161 0,224 0,037
F
T1 698 73 1990 217 2916 140 -236 127 447 252 66 126 0,225 0,045
Sed
T2 704 59 2036 178 2823 124 -211 117 404 169 93 143 0,215 0,040
/ɛː/
T1 544 59 1581 193 2474 157 -207 84 400 195 89 137 0,175 0,031
Mob
T2 550 60 1628 194 2417 107 -186 98 418 185 74 108 0,183 0,048
M
T1 596 56 1621 172 2510 88 -167 97 329 167 17 106 0,240 0,039
Sed
T2 602 58 1650 199 2464 104 -138 84 339 207 8 83 0,229 0,041

289
F1 dynamique F2 dynamique F3 dynamique
F1 (Hz) F2 (Hz) F3 (Hz) durée (s)
(Hz) (Hz) (Hz)

Écart-type

Écart-type

Écart-type

Écart-type

Écart-type

Écart-type

Écart-type
Moyenne

Moyenne

Moyenne

Moyenne

Moyenne

Moyenne

Moyenne
Mobilité
Voyelle

Temps
Sexe

T1 600 83 1782 193 2792 202 -24 74 -49 160 -48 122 0,175 0,053
Mob
T2 600 71 1812 175 2716 204 -1 58 -33 150 -62 133 0,175 0,056
F
T1 564 85 1829 181 2796 148 -34 59 -22 134 -49 143 0,174 0,061
Sed
T2 578 79 1884 173 2752 138 -15 51 -4 134 -47 109 0,165 0,057
/œ/
T1 482 66 1454 122 2446 144 -18 61 -54 134 -31 101 0,154 0,049
Mob
T2 514 54 1476 133 2382 121 4 61 -54 134 -30 116 0,152 0,055
M
T1 510 58 1489 143 2435 76 -30 47 4 87 -28 133 0,186 0,061
Sed
T2 519 53 1521 163 2416 133 -11 52 8 105 -37 167 0,181 0,062
T1 616 72 1456 221 2817 180 -61 85 103 159 10 101 0,165 0,052
Mob
T2 616 60 1478 231 2734 170 -25 55 92 156 5 97 0,165 0,052
F
T1 586 54 1456 200 2810 151 -60 63 99 156 11 96 0,161 0,059
Sed
T2 598 44 1497 233 2721 149 -42 47 82 171 -7 70 0,153 0,053
/ɔ/
T1 500 47 1191 153 2479 154 -46 49 61 111 7 87 0,131 0,041
Mob
T2 530 32 1216 134 2421 124 -27 45 91 126 -33 85 0,138 0,047
M
T1 528 49 1214 144 2408 130 -50 70 68 101 2 79 0,177 0,063
Sed
T2 533 44 1205 160 2367 127 -20 39 50 114 -15 95 0,173 0,065
T1 813 56 1667 153 2799 182 -71 113 87 168 61 121 0,165 0,050
Mob
T2 802 63 1726 141 2718 140 -38 102 66 137 49 121 0,161 0,050
F
T1 841 72 1669 120 2837 136 -32 109 73 129 23 117 0,162 0,052
Sed
T2 820 69 1731 132 2751 137 -66 111 74 121 20 109 0,158 0,051
/a/
T1 635 47 1427 103 2437 143 -49 73 32 111 33 104 0,131 0,031
Mob
T2 642 33 1460 132 2381 102 -67 80 25 148 -11 82 0,134 0,040
M
T1 677 55 1420 125 2501 110 -31 94 87 113 38 109 0,176 0,055
Sed
T2 673 54 1449 146 2447 138 -33 82 81 109 3 95 0,173 0,058

290
F1 dynamique F2 dynamique F3 dynamique
F1 (Hz) F2 (Hz) F3 (Hz) durée (s)
(Hz) (Hz) (Hz)

Écart-type

Écart-type

Écart-type

Écart-type

Écart-type

Écart-type

Écart-type
Moyenne
Moyenne

Moyenne

Moyenne

Moyenne

Moyenne

Moyenne
Mobilité
Voyelle

Temps
Sexe

T1 764 79 1367 178 2852 197 -99 113 -25 131 44 114 0,207 0,046
Mob
T2 756 78 1388 212 2759 155 -68 87 -25 139 19 136 0,208 0,050
F
T1 771 69 1356 130 2917 184 -62 97 19 116 46 124 0,207 0,055
Sed
T2 758 67 1415 152 2841 170 -62 81 -8 119 14 98 0,194 0,046
/ɑ/
T1 600 52 1108 132 2489 211 -116 98 -50 81 42 86 0,167 0,036
Mob
T2 607 36 1109 154 2466 164 -90 89 -46 122 22 83 0,169 0,051
M
T1 647 55 1181 106 2569 114 -57 98 17 89 1 94 0,225 0,051
Sed
T2 626 66 1139 134 2509 151 -56 74 -2 115 -25 113 0,217 0,056

291
Annexe 8 : Graphiques des écarts-types par
voyelle et indice acoustique
Graphiques présentant les écarts-types du F1, du F2, du F3, de la dynamique de F1, de la dynamique de
F2, de la dynamique de F3 et de la durée des occurrences produites par les femmes, séparées en
fonction du facteur MOBILITÉ, T1 et T2 confondus

292
293
294
Graphiques présentant les écarts-types du F1, du F2, du F3, de la dynamique de F1, de la dynamique de
F2, de la dynamique de F3 et de la durée des occurrences produites par les hommes, séparés en fonction
du facteur MOBILITÉ, T1 et T2 confondus

295
296
297
Annexe 9 : Effets significatifs des facteurs pris en compte dans les
modèles mixtes et exclusions nécessaires pour atteindre une
distribution normale des résidus
Dans les tableaux de cette annexe, la présence dans une colonne donnée du nom d’un facteur indique qu’il est significatif. La présence du terme
interaction dans la colonne indique que le facteur concerné est impliqué dans une interaction significative. La dernière colonne fait état des
exclusions nécessaires à l’atteinte d’une distribution normale des résidus. Lorsque la normalité des résidus n’a pu être atteinte, les cases sont
surlignées en gris, mais l’analyse a néanmoins été effectuée. Seuil de signification adopté : α = 0,001.

Effets significatifs
Paramètres Contexte Temps Sexe Mobilité Interactions Exclusions
F1 Sexe
F1 dynamique Sexe
F2 Contexte Sexe
i F2 dynamique
F3 Contexte Sexe
F3 dynamique Contexte
Durée Contexte Mobilité Sed_F_27 (Vvzʒ)

298
Effets significatifs
Paramètres Contexte Temps Sexe Mobilité Interactions Exclusions
Tous locuteurs (VN)
F1 Contexte Temps Sexe Mob_F_17 (Vʁ)
Sed_F_14 (Vptk)
F1 dynamique Contexte
F2 Contexte Sexe
Mob_F_02 (Vʁ)

ɪ F2 dynamique Contexte
Mob_F_36 (VN)
Mob_F_37 (VN)
Sed_F_27 (Vl)
F3 Contexte Temps Sexe
F3 dynamique Contexte
Mob_F_25 (Vʁ)
Durée Contexte Sed_F_05 (Vʁ)
Sed_F_35 (Vʁ)

Effets significatifs
Paramètres Contexte Temps Sexe Mobilité Interactions Exclusions
Mob_F_24 (Vvzʒ)
F1 Contexte interaction interaction Sexe*Temps Mob_F_33 (V#)
Mob_F_33 (V#)
F1 dynamique Sexe Sed_F_34 (V#)
F2 Sexe
y F2 dynamique Contexte
F3 Sexe
F3 dynamique Contexte
Mob_F_17 (Vvzʒ)
Durée Contexte Sed_F_34 (Vvzʒ)

299
Effets significatifs
Paramètres Contexte Temps Sexe Mobilité Interactions Exclusions
Mob_F_17 (Vbdɡ), (Vʁ)
Mob_F_24 (Vʁ)
F1 Contexte Temps Sexe Mob_F_37 (Vptk)
Sed_F_14 (Vʁ)
F1 dynamique Contexte
Mob_F_06 (VN), (Vptk), (Vʁ)
Mob_F_23 (Vʁ)
F2 Contexte Temps Sexe Mob_F_24 (Vʁ)
ʏ Mob_F_44 (Vʁ)
Mob_M_38 (Vʁ)
F2 dynamique Contexte Mobilité Mob_F_33 (Vʁ)
Mob_F_06 (VN), (Vʁ)
F3 Contexte Temps Sexe Mob_F_23 (Vʁ)
Mob_F_24 (Vʁ)
F3 dynamique Contexte
Tous locuteurs (Vʁ)
Durée Contexte Sed_F_35 (Vbdɡ)

Effets significatifs
Paramètres Contexte Temps Sexe Mobilité Interactions Exclusions
F1 Contexte Temps
F1 dynamique Contexte
F2
u F2 dynamique
F3 Sexe
F3 dynamique Contexte
Durée Contexte

300
Effets significatifs
Paramètres Contexte Temps Sexe Mobilité Interactions Exclusions
Sexe*Mobilité*
F1 Contexte interaction interaction interaction Mob_F_24 (Vʁ)
Temps
Mob_F_17 (VN)
F1 dynamique interaction interaction Temps*Contexte Mob_F_44 (VN)
F2 interaction interaction Sexe*Contexte
F2 dynamique interaction interaction Sexe*Contexte
Mob_F_06 (VN), (Vʁ)
Mob_F_13 (Vʁ)
ʊ F3 Contexte Temps Sexe Mob_F_25 (VN)
Mob_F_44 (Vl)
Sed_F_34 (Vʁ)
Mob_F_11 (Vʁ)
Mob_F_25 (VN)
Mob_F_36 (VN)
F3 dynamique Contexte Sed_F_04 (Vl)
Sed_F_05 (Vl)
Sed_F_34 (Vʁ)
Sed_F_35 (Vfsʃ)
Durée Contexte

Effets significatifs
Paramètres Contexte Temps Sexe Mobilité Interactions Exclusions
F1 Sexe
F1 dynamique
F2 Sexe
e F2 dynamique s.o.
F3 Sexe
F3 dynamique Sed_F_35
Durée

301
Effets significatifs
Paramètres Contexte Temps Sexe Mobilité Interactions Exclusions
F1 interaction Temps Sexe interaction Mobilité*Contexte Mob_F_44 (VN)
Mob_F_02 (V#)
F1 dynamique Contexte Mob_F_13 (VN)
Mob_F_41 (VN)
F2 Contexte Sexe
ø F2 dynamique Contexte
Mob_F_13 (VN)
Mob_F_33 (Vvzʒ)
Mob_F_06 (V#)
F3 Contexte Temps Sexe Mob_F_32 (VN)
F3 dynamique Contexte
Durée Contexte

Effets significatifs
Paramètres Contexte Temps Sexe Mobilité Interactions Exclusions
Sexe*Mobilité*
F1 Contexte interaction interaction interaction Tous locuteurs (VN)
Temps
Tous locuteurs (VN)
F1 dynamique Contexte Temps Mob_F_17 (Vfsʃ)
Tous locuteurs (VN)
F2 Contexte Mob_F_25 (Vvzʒ)
Mob_F_02 (VN)
Mob_F_06 (Vvzʒ)
o Mob_F_25 (Vfsʃ)
F2 dynamique Contexte Mob_F_32 (VN)
Mob_F_37 (VN)
Sed_F_27 (Vvzʒ)
Tous locuteurs (VN)
F3 Temps Sexe Sed_F_18 (V#)
Tous locuteurs (VN)
F3 dynamique Contexte Mob_F_11 (Vfsʃ) T1
Durée Contexte

302
Effets significatifs
Paramètres Contexte Temps Sexe Mobilité Interactions Exclusions
Mob_F_23 (V#)
F1 Contexte Temps Sexe Sed_F_27 (Vfsʃ)
Mob_F_17 (V#) T1
F1 dynamique Contexte Temps Mob_F_23 (V#) T1
F2 Contexte Sexe
F2 dynamique Contexte Temps Sed_F_35 (Vvzʒ)
ɛ F3 Contexte Temps Sexe
F3 dynamique Contexte Mob_F_17 (Vptk)
Mob_F_06 (Vbdɡ)
Mob_F_17 (Vvzʒ)
Durée Contexte Sed_F_27 (Vvzʒ)
Sed_M_40 (Vl)

Effets significatifs
Paramètres Contexte Temps Sexe Mobilité Interactions Exclusions
F1 Contexte Sexe
F1 dynamique Contexte Temps Sed_F_34 (Vʁ)
F2 Contexte Temps Sexe Mob_F_06 (Vvzʒ)
F2 dynamique Contexte
ɛː F3 interaction Temps interaction Sexe*Contexte
Mob_F_17 (Vʁ)
Mob_F_25 (Vbdɡ), (Vfsʃ), (Vptk)
F3 dynamique Contexte Mob_F_44 (Vl)
Sed_F_34 (Vvzʒ)
Durée Contexte interaction interaction Mobilité*Temps

303
Effets significatifs
Paramètres Contexte Temps Sexe Mobilité Interactions Exclusions
F1 interaction Temps interaction Sexe*Contexte
F1 dynamique Contexte Temps Mob_F_23 (V#)
Mob_F_06 (V#), (Vl)
Mob_F_24 (Vʁ)
F2 Contexte Temps Sexe Mob_F_32 (Vʁ)
Mob_F_33 (Vʁ)
Sed_F_34 (Vfsʃ)
Mob_F_02 (Vʁ)
Mob_F_06 (Vl)
Mob_F_17 (Vʁ)
Mob_F_32 (Vʁ)
F2 dynamique Contexte Mobilité Mob_F_33 (Vʁ)
œ Mob_F_41 (Vʁ)
Sed_F_34 (Vʁ), (Vvzʒ)
Sed_M_54 (VN)
F3 Contexte Temps Sexe
Mob_F_17 (Vʁ)
Mob_F_36 (Vʁ)
F3 dynamique Contexte Sed_F_14 (Vʁ)
Sed_M_22 (VN)
Sed_M_28 (Vʁ)
Tous locuteurs (Vʁ)
Mob_F_32 (Vvzʒ)
Durée interaction interaction Mobilité*Contexte Mob_M_38 (Vvzʒ)
Sed_F_27 (Vvzʒ)

304
Effets significatifs
Paramètres Contexte Temps Sexe Mobilité Interactions Exclusions
Mob_F_23 (Vptk)
F1 Contexte Temps Sexe Mob_F_24 (VN)
Sed_F_18 (Vʁ)
Mob_F_06 (Vptk) T1
Mob_F_17 (VN) T1, (Vʁ) T1
F1 dynamique Contexte Temps Mob_F_23 (Vfsʃ) T1
Mob_F_44 (Vvzʒ) T1
Mob_F_24 (Vbdɡ)
F2 interaction interaction Sexe*Contexte Mob_F_46 (Vbdɡ)
Mob_F_32 (Vl)
Mob_F_33 (VN)
F2 dynamique Contexte Mob_F_37 (Vbdɡ)
Mob_F_44 (Vvzʒ)
ɔ Sed_F_34 (Vfsʃ), (Vl)
Mob_F_06 (VN)
F3 Contexte Temps Sexe Mob_F_46 (Vl)
Sed_F_27 (Vʁ)
Mob_F_06 (Vl)
Mob_F_24 (Vl)
Mob_F_36 (VN)
F3 dynamique interaction interaction Sexe*Contexte Mob_F_44 (VN)
Mob_F_46 (VN), (Vʁ)
Sed_M_54 (VN)
Tous locuteurs (Vʁ)
Mob_F_33 (Vl)
Durée Contexte Mob_F_44 (Vvzʒ)
Sed_F_35 (Vbdɡ)

305
Effets significatifs
Paramètres Contexte Temps Sexe Mobilité Interactions Exclusions
Tous locuteurs (Vʁ)
F1 Sexe Sed_F_34 (Vptk)
Tous locuteurs (Vʁ)
Mob_F_17 (V#)
F1 dynamique Contexte Sed_F_18 (VN)
Sed_F_34 (VN), (Vvzʒ)
Tous locuteurs (Vʁ)
Mob_F_23 (VN)
F2 interaction Temps Sexe interaction Mobilité*Contexte Mob_F_41 (Vfsʃ), (Vvzʒ)
Sed_F_34 (Vl), (Vfsʃ)
Tous locuteurs (Vʁ)
Mob_F_02 (Vptk)
Mob_F_17 (Vbdɡ), (Vptk)
a F2 dynamique Contexte Mob_F_25 (Vbdɡ)
Mob_F_33 (V#)
Mob_F_46 (Vptk)
Tous locuteurs (Vʁ)
Mob_F_06 (V ), (VN), (Vbdɡ), (Vfsʃ)
F3 Contexte Temps Sexe Mob_F_46 (VN)
Sed_M_54 (VN)
F3 dynamique Contexte Tous locuteurs (Vʁ)
Tous locuteurs (Vʁ)
Mob_F_02 (Vvzʒ)
Durée interaction interaction Mobilité*Contexte Mob_F_17 (Vvzʒ)
Sed_F_27 (Vvzʒ)
Sed_M_28 (V#)

306
Effets significatifs
Paramètres Contexte Temps Sexe Mobilité Interactions Exclusions
Mob_F_24 (VN)
Mob_F_32 (VN)
F1 Sexe Mob_F_33 (V#)
Sed_F_04 (VN), (Vʁ)
Mob_F_02 (tous contextes)
Mob_F_17 (V#), (Vptk)
F1 dynamique Contexte Sed_F_34 (Vvzʒ)
Sed_M_54 (Vfsʃ)
Sed_F_05 (Vʁ)
F2 Contexte interaction interaction Sexe*Temps Sed_F_27 (Vl)
Mob_F_02 (VN)
F2 dynamique Contexte
ɑ Mob_F_32 (VN)
Tous locuteurs (VN)
Mob_F_06 (V#)
F3 Contexte Temps Sexe Mob_F_44 (Vfsʃ), (Vl), (Vʁ)
Sed_F_27 (Vfsʃ), (Vptk)
Mob_F_02 (Vfsʃ), (Vl), (VN)
Mob_F_06 (Vptk)
Mob_F_17 (Vvzʒ)
F3 dynamique Temps Mob_F_32 (VN)
Mob_F_36 (VN)
Sed_M_22 (VN)
Durée Contexte

307
Annexe 10 : Résultats détaillés des effets fixes
Facteurs F1 F2 F3 F1 dynamique F2 dynamique F3 dynamique durée
F(1, 29) = 0,30 F(1, 29) = 28,29 F(1, 29) = 21,90 F(1, 29) = 12,53 F(1, 29) = 1,37 F(1, 29) = 46,42 F(1, 28,1) = 254,87
Contexte
p = 0,5894 p < 0,0001 p < 0,0001 p = 0,0014 p = 0,2516 p < 0,0001 p < 0,0001
F(1, 29) = 0,19 F(1, 29) = 0,00 F(1, 29) = 1,14 F(1, 29) = 0,12 F(1, 29) = 0,00 F(1, 29) = 0,88 F(1, 28,5) = 13,42
Mobilité
p = 0,6668 p = 0,9633 p = 0,2952 p = 0,7301 p = 0,9993 p = 0,3573 p = 0,0010
F(1, 29) = 0,53 F(1, 29) = 0,05 F(1, 29) = 0,83 F(1, 29) = 0,61 F(1, 29) = 0,99 F(1, 29) = 0,14 F(1, 28,1) = 8,07
Mobilité*Contexte
p = 0,4737 p = 0,8211 p = 0,3687 p = 0,4409 p = 0,3289 p = 0,7071 p = 0,0083
F(1, 58) = 5,07 F(1, 58) = 3,60 F(1, 58) = 3,33 F(1, 58) = 1,25 F(1, 58) = 0,37 F(1, 58) = 0,20 F(1, 57) = 1,97
Temps
p = 0,0281 p = 0,0627 p = 0,0731 p = 0,2672 p = 0,5461 p = 0,6536 p = 0,1660
F(1, 58) = 0,02 F(1, 58) = 0,73 F(1, 58) = 0,02 F(1, 58) = 1,80 F(1, 58) = 0,46 F(1, 58) = 0,76 F(1, 57) = 0,01
Temps*Contexte
p = 0,8940 p = 0,3949 p = 0,8846 p = 0,1845 p = 0,5007 p = 0,3867 p = 0,9192
F(1, 58) = 0,31 F(1, 58) = 1,17 F(1, 58) = 2,96 F(1, 58) = 0,00 F(1, 58) = 0,00 F(1, 58) = 2,98 F(1, 57) = 0,01
Mobilité*Temps
p = 0,5773 p = 0,2831 p = 0,0909 p = 0,9533 p = 0,9865 p = 0,0896 p = 0,9077
F(1, 58) = 0,45 F(1, 58) = 0,27 F(1, 58) = 0,51 F(1, 58) = 0,47 F(1, 58) = 0,42 F(1, 58) = 0,04 F(1, 57) = 0,19
Mobilité*Temps*Contexte
p = 0,5033 p = 0,6041 p = 0,4789 p = 0,4815 p = 0,5196 p = 0,8491 p = 0,6674
i Sexe
F(1, 29) = 31,30 F(1, 29) = 53,82 F(1, 29) = 64,66 F(1, 29) = 21,42 F(1, 29) = 2,62 F(1, 29) = 0,01 F(1, 28,5) = 2,66
p < 0,0001 p < 0,0001 p < 0,0001 p < 0,0001 p = 0,1165 p = 0,9314 p = 0,1142
F(1, 29) = 0,26 F(1, 29) = 1,30 F(1, 29) = 1,69 F(1, 29) = 0,86 F(1, 29) = 0,00 F(1, 29) = 5,95 F(1, 28,1) = 0,25
Sexe*Contexte
p = 0,6152 p = 0,2637 p = 0,2039 p = 0,3601 p = 0,9714 p = 0,0210 p = 0,6210
F(1, 29) = 0,52 F(1, 29) = 0,03 F(1, 29) = 1,01 F(1, 29) = 5,52 F(1, 29) = 0,00 F(1, 29) = 0,11 F(1, 28,5) = 8,32
Sexe*Mobilité
p = 0,4760 p = 0,8626 p = 0,3237 p = 0,0258 p = 0,9482 p = 0,7395 p = 0,0074
F(1, 29) = 1,92 F(1, 29) = 0,76 F(1, 29) = 0,08 F(1, 29) = 0,05 F(1, 29) = 1,18 F(1, 29) = 0,06 F(1, 28,1) = 2,78
Sexe*Mobilité*Contexte
p = 0,1765 p = 0,3899 p = 0,7846 p = 0,8256 p = 0,2873 p = 0,8117 p = 0,1064
F(1, 58) = 6,37 F(1, 58) = 1,29 F(1, 58) = 0,00 F(1, 58) = 0,93 F(1, 58) = 2,85 F(1, 58) = 8,95 F(1, 57) = 1,17
Sexe*Temps
p = 0,0144 p = 0,2606 p = 0,9793 p = 0,3393 p = 0,0967 p = 0,0041 p = 0,2833
F(1, 58) = 0,02 F(1, 58) = 1,08 F(1, 58) = 0,20 F(1, 58) = 0,47 F(1, 58) = 3,54 F(1, 58) = 0,08 F(1, 57) = 0,51
Sexe*Temps*Contexte
p = 0,9023 p = 0,3026 p = 0,6596 p = 0,4947 p = 0,0648 p = 0,7728 p = 0,4767
F(1, 58) = 0,50 F(1, 58) = 0,00 F(1, 58) = 0,43 F(1, 58) = 1,44 F(1, 58) = 0,15 F(1, 58) = 0,08 F(1, 57) = 0,91
Sexe*Mobilité*Temps
p = 0,4843 p = 0,9820 p = 0,5164 p = 0,2351 p = 0,7010 p = 0,7743 p = 0,3443
F(1, 58) = 0,15 F(1, 58) = 0,43 F(1, 58) = 0,35 F(1, 58) = 0,01 F(1, 58) = 0,47 F(1, 58) = 5,73 F(1, 57) = 0,27
Sexe*Mobilité*Temps*Contexte
p = 0,6988 p = 0,5156 p = 0,5577 p = 0,9128 p = 0,4964 p = 0,0199 p = 0,6086

308
Facteurs F1 F2 F3 F1 dynamique F2 dynamique F3 dynamique durée
F(4, 114) = 54,33 F(5, 145) = 48,84 F(5, 145) = 29,47 F(5, 145) = 38,18 F(5, 142) = 102,74 F(5, 145) = 9,34 F(5, 142) = 170,15
Contexte
p < 0,0001 p < 0,0001 p < 0,0001 p < 0,0001 p < 0,0001 p < 0,0001 p < 0,0001
F(1, 28,9) = 0,33 F(1, 29) = 3,10 F(1, 29) = 1,15 F(1, 29) = 0,30 F(1, 29,1) = 1,92 F(1, 29) = 2,03 F(1, 29) = 2,84
Mobilité
p = 0,5727 p = 0,0886 p = 0,2933 p = 0,5894 p = 0,1760 p = 0,1646 p = 0,1028
F(4, 114) = 1,37 F(5, 145) = 2,58 F(5, 145) = 1,47 F(5, 145) = 1,16 F(5, 142) = 1,47 F(5, 145) = 1,05 F(5, 142) = 1,45
Mobilité*Contexte
p = 0,2494 p = 0,0286 p = 0,2034 p = 0,3313 p = 0,2018 p = 0,3931 p = 0,2107
F(1, 143) = 34,67 F(1, 174) = 0,20 F(1, 174) = 12,41 F(1, 174) = 6,39 F(1, 170) = 1,35 F(1, 174) = 1,37 F(1, 171) = 0,04
Temps
p < 0,0001 p = 0,6593 p = 0,0005 p = 0,0124 p = 0,2473 p = 0,2438 p = 0,8452
F(4, 143) = 0,84 F(5, 174) = 0,40 F(5, 174) = 0,91 F(5, 174) = 3,54 F(5, 170) = 2,56 F(5, 174) = 1,94 F(5, 171) = 1,73
Temps*Contexte
p = 0,5005 p = 0,8457 p = 0,4727 p = 0,0045 p = 0,0293 p = 0,0898 p = 0,1295
F(1, 143) = 0,01 F(1, 174) = 0,76 F(1, 174) = 6,66 F(1, 174) = 0,72 F(1, 170) = 0,91 F(1, 174) = 0,00 F(1, 171) = 2,39
Mobilité*Temps
p = 0,9039 p = 0,3847 p = 0,0107 p = 0,3972 p = 0,3421 p = 0,9560 p = 0,1243
F(4, 143) = 0,89 F(5, 174) = 0,10 F(5, 174) = 0,68 F(5, 174) = 2,21 F(5, 170) = 2,12 F(5, 174) = 0,35 F(5, 171) = 1,10
Mobilité*Temps*Contexte
p = 0,4745 p = 0,9917 p = 0,6428 p = 0,6756 p = 0,0649 p = 0,8842 p = 0,3609
ɪ Sexe
F(1, 28,9) = 67,62 F(1, 29) = 71,11 F(1, 29) = 70,82 F(1, 29) = 0,00 F(1, 29,1) = 4,54 F(1, 29) = 12,62 F(1, 29) = 0,39
p < 0,0001 p < 0,0001 p < 0,0001 p = 0,9923 p = 0,0418 p = 0,0013 p = 0,5361
F(4, 114) = 0,68 F(5, 145) = 1,18 F(5, 145) = 0,73 F(5, 145) = 2,10 F(5, 142) = 2,57 F(5, 145) = 1,15 F(5, 142) = 1,05
Sexe*Contexte
p = 0,6094 p = 0,3223 p = 0,6022 p = 0,0691 p = 0,0295 p = 0,3370 p = 0,3924
F(1, 28,9) = 0,60 F(1, 29) = 0,01 F(1, 29) = 0,00 F(1, 29) = 2,16 F(1, 29,1) = 0,11 F(1, 29) = 0,26 F(1, 29) = 5,25
Sexe*Mobilité
p = 0,4454 p = 0,9126 p = 0,9905 p = 0,1523 p = 0,7449 p = 0,6169 p = 0,0294
F(4, 114) = 0,71 F(5, 145) = 1,22 F(5, 145) = 1,44 F(5, 145) = 1,02 F(5, 142) = 0,82 F(5, 145) = 0,14 F(5, 142) = 1,19
Sexe*Mobilité*Contexte
p = 0,5869 p = 0,3027 p = 0,2151 p = 0,4080 p = 0,5342 p = 0,9817 p = 0,3182
F(1, 143) = 0,05 F(1, 174) = 6,17 F(1, 174) = 0,00 F(1, 174) = 1,73 F(1, 170) = 0,73 F(1, 174) = 2,82 F(1, 171) = 0,01
Sexe*Temps
p = 0,8305 p = 0,0139 p = 0,9850 p = 0,1902 p = 0,3935 p = 0,0950 p = 0,9413
F(4, 143) = 1,12 F(5, 174) = 0,09 F(5, 174) = 0,14 F(5, 174) = 2,21 F(5, 170) = 0,29 F(5, 174) = 0,34 F(5, 171) = 0,75
Sexe*Temps*Contexte
p = 0,3518 p = 0,9944 p = 0,9828 p = 0,0557 p = 0,9191 p = 0,8872 p = 0,5854
F(1, 143) = 4,72 F(1, 174) = 2,51 F(1, 174) = 2,52 F(1, 174) = 0,66 F(1, 170) = 0,27 F(1, 174) = 1,26 F(1, 171) = 2,41
Sexe*Mobilité*Temps
p = 0,0315 p = 0,1148 p = 0,1141 p = 0,4159 p = 0,6046 p = 0,2639 p = 0,1222
F(4, 143) = 0,66 F(5, 174) = 0,30 F(5, 174) = 0,19 F(5, 174) = 0,44 F(5, 170) = 0,85 F(5, 174) = 1,15 F(5, 171) = 0,59
Sexe*Mobilité*Temps*Contexte
p = 0,6209 p = 0,9132 p = 0,9647 p = 0,8182 p = 0,5172 p = 0,3349 p = 0,7067

309
Facteurs F1 F2 F3 F1 dynamique F2 dynamique F3 dynamique durée
F(1, 26,9) = 35,23 F(1, 29) = 11,60 F(1, 29) = 4,01 F(1, 56) = 10,12 F(1, 58) = 57,66 F(1, 58) = 16,37 F(1, 28,7) = 233,58
Contexte
p < 0,0001 p = 0,0019 p = 0,0548 p = 0,0024 p < 0,0001 p = 0,0002 p < 0,0001
F(1, 28,2) = 0,32 F(1, 29) = 0,23 F(1, 29) = 0,00 F(1, 56) = 2,44 F(1, 58) = 0,02 F(1, 58) = 1,14 F(1, 29) = 5,52
Mobilité
p = 0,5733 p = 0,6348 p = 0,9631 p = 0,1240 p = 0,8875 p = 0,2896 p = 0,0259
F(1, 26,9) = 1,71 F(1, 29) = 0,43 F(1, 29) = 0,91 F(1, 56) = 0,23 F(1, 58) = 0,10 F(1, 58) = 1,61 F(1, 28,7) = 1,68
Mobilité*Contexte
p = 0,2024 p = 0,5185 p = 0,3471 p = 0,6351 p = 0,7475 p = 0,2102 p = 0,2050
F(1, 56) = 14,65 F(1, 58) = 0,54 F(1, 58) = 7,30 F(1, 56) = 4,69 F(1, 58) = 0,03 F(1, 58) = 0,01 F(1, 56) = 2,93
Temps
p = 0,0003 p = 0,4640 p = 0,0090 p = 0,0346 p = 0,8684 p = 0,9037 p = 0,0923
F(1, 56) = 0,65 F(1, 58) = 0,57 F(1, 58) = 2,54 F(1, 56) = 1,53 F(1, 58) = 0,97 F(1, 58) = 0,00 F(1, 56) = 8,00
Temps*Contexte
p = 0,4222 p = 0,4515 p = 0,1168 p = 0,2217 p = 0,3281 p = 0,9475 p = 0,0065
F(1, 56) = 0,02 F(1, 58) = 1,62 F(1, 58) = 0,41 F(1, 56) = 0,08 F(1, 58) = 0,37 F(1, 58) = 1,37 F(1, 56) = 0,76
Mobilité*Temps
p = 0,8788 p = 0,2077 p = 0,5220 p = 0,7827 p = 0,5458 p = 0,2465 p = 0,3880
F(1, 56) = 0,08 F(1, 58) = 2,33 F(1, 58) = 0,54 F(1, 56) = 0,11 F(1, 58) = 0,03 F(1, 58) = 0,34 F(1, 56) = 2,33
Mobilité*Temps*Contexte
p = 0,7744 p = 0,1322 p = 0,4669 p = 0,9788 p = 0,8551 p = 0,5606 p = 0,1324
y Sexe
F(1, 28,2) = 53,99 F(1, 29) = 55,33 F(1, 29) = 37,10 F(1, 56) = 14,85 F(1, 58) = 2,88 F(1, 58) = 0,59 F(1, 29) = 3,08
p < 0,0001 p < 0,0001 p < 0,0001 p = 0,0003 p = 0,0949 p = 0,4442 p = 0,0896
F(1, 26,9) = 15,80 F(1, 29) = 0,28 F(1, 29) = 0,14 F(1, 56) = 0,24 F(1, 58) = 0,03 F(1, 58) = 0,04 F(1, 28,7) = 1,07
Sexe*Contexte
p = 0,0005 p = 0,6036 p = 0,7110 p = 0,6243 p = 0,8614 p = 0,8499 p = 0,3094
F(1, 28,2) = 0,05 F(1, 29) = 0,01 F(1, 29) = 0,02 F(1, 56) = 0,66 F(1, 58) = 0,03 F(1, 58) = 0,69 F(1, 29) = 5,93
Sexe*Mobilité
p = 0,8184 p = 0,9227 p = 0,8816 p = 0,4210 p = 0,8728 p = 0,4085 p = 0,0213
F(1, 26,9) = 0,02 F(1, 29) = 0,58 F(1, 29) = 1,22 F(1, 56) = 0,06 F(1, 58) = 0,00 F(1, 58) = 0,81 F(1, 28,7) = 0,68
Sexe*Mobilité*Contexte
p = 0,8944 p = 0,4516 p = 0,2792 p = 0,8105 p = 0,9618 p = 0,3716 p = 0,4150
F(1, 56) = 20,79 F(1, 58) = 2,20 F(1, 58) = 2,34 F(1, 56) = 0,01 F(1, 58) = 0,08 F(1, 58) = 5,60 F(1, 56) = 0,69
Sexe*Temps
p < 0,0001 p = 0,1431 p = 0,1312 p = 0,9198 p = 0,7800 p = 0,0214 p = 0,4089
F(1, 56) = 0,21 F(1, 58) = 0,16 F(1, 58) = 1,12 F(1, 56) = 0,11 F(1, 58) = 0,26 F(1, 58) = 0,03 F(1, 56) = 0,07
Sexe*Temps*Contexte
p = 0,6502 p = 0,6933 p = 0,2943 p = 0,7362 p = 0,6130 p = 0,8712 p = 0,7957
F(1, 56) = 0,67 F(1, 58) = 1,84 F(1, 58) = 0,38 F(1, 56) = 0,13 F(1, 58) = 1,31 F(1, 58) = 0,70 F(1, 56) = 0,98
Sexe*Mobilité*Temps
p = 0,4161 p = 0,1805 p = 0,5411 p = 0,7200 p = 0,2565 p = 0,4077 p = 0,3253
F(1, 56) = 0,02 F(1, 58) = 0,27 F(1, 58) = 0,22 F(1, 56) = 2,03 F(1, 58) = 0,21 F(1, 58) = 1,89 F(1, 56) = 0,12
Sexe*Mobilité*Temps*Contexte
p = 0,8821 p = 0,6048 p = 0,6412 p = 0,1595 p = 0,6521 p = 0,1739 p = 0,7343

310
Facteurs F1 F2 F3 F1 dynamique F2 dynamique F3 dynamique durée
F(5, 140) = 20,31 F(5, 138) = 84,07 F(5, 140) = 144,79 F(5, 145) = 17,70 F(5, 144) = 16,70 F(5, 145) = 26,71 F(4, 115) = 90,52
Contexte
p < 0,0001 p < 0,0001 p < 0,0001 p < 0,0001 p < 0,0001 p < 0,0001 p < 0,0001
F(1, 28,7) = 0,97 F(1, 28,6) = 3,61 F(1, 28,2) = 0,00 F(1, 29) = 0,72 F(1, 29) = 14,44 F(1, 29) = 1,01 F(1, 28,9) = 3,01
Mobilité
p = 0,3322 p = 0,0676 p = 0,9506 p = 0,4023 p = 0,0007 p = 0,3233 p = 0,0934
F(5, 140) = 0,38 F(5, 138) = 4,04 F(5, 140) = 3,24 F(5, 145) = 1,10 F(5, 144) = 2,17 F(5, 145) = 2,22 F(4, 115) = 0,71
Mobilité*Contexte
p = 0,8624 p = 0,0019 p = 0,0084 p = 0,3648 p = 0,0602 p = 0,0553 p = 0,5861
F(1, 169) = 52,15 F(1, 167) = 18,99 F(1, 170) = 20,25 F(1, 174) = 3,99 F(1, 173) = 2,07 F(1, 174) = 2,35 F(1, 144) = 0,02
Temps
p < 0,0001 p < 0,0001 p < 0,0001 p = 0,0473 p = 0,1520 p = 0,1271 p = 0,8835
F(5, 169) = 0,99 F(5, 167) = 0,79 F(5, 170) = 1,24 F(5, 174) = 2,52 F(5, 173) = 1,48 F(5, 174) = 1,24 F(4, 144) = 2,31
Temps*Contexte
p = 0,4261 p = 0,5605 p = 0,2920 p = 0,0315 p = 0,1982 p = 0,2943 p = 0,0609
F(1, 169) = 0,12 F(1, 167) = 3,92 F(1, 170) = 4,37 F(1, 174) = 0,09 F(1, 173) = 3,08 F(1, 174) = 3,89 F(1, 144) = 1,01
Mobilité*Temps
p = 0,7348 p = 0,0493 p = 0,0381 p = 0,7634 p = 0,0811 p = 0,0503 p = 0,3173
F(5, 169) = 0,18 F(5, 167) = 0,66 F(5, 170) = 0,28 F(5, 174) = 1,80 F(5, 173) = 0,11 F(5, 174) = 0,70 F(4, 144) = 0,89
Mobilité*Temps*Contexte
p = 0,9696 p = 0,6520 p = 0,9252 p = 0,3634 p = 0,9907 p = 0,6255 p = 0,4746
ʏ Sexe
F(1, 28,7) = 82,84 F(1, 28,6) = 87,41 F(1, 28,2) = 73,63 F(1, 29) = 0,64 F(1, 29) = 0,02 F(1, 29) = 0,07 F(1, 28,9) = 0,45
p < 0,0001 p < 0,0001 p < 0,0001 p = 0,4308 p = 0,8925 p = 0,7883 p = 0,5061
F(5, 140) = 1,66 F(5, 138) = 0,58 F(5, 140) = 1,54 F(5, 145) = 1,33 F(5, 144) = 1,06 F(5, 145) = 0,62 F(4, 115) = 1,82
Sexe*Contexte
p = 0,1494 p = 0,7154 p = 0,1824 p = 0,2533 p = 0,3823 p = 0,6831 p = 0,1293
F(1, 28,7) = 1,19 F(1, 28,6) = 0,00 F(1, 28,2) = 1,18 F(1, 29) = 3,28 F(1, 29) = 0,01 F(1, 29) = 0,08 F(1, 28,9) = 5,49
Sexe*Mobilité
p = 0,2845 p = 0,9917 p = 0,2859 p = 0,0806 p = 0,9141 p = 0,7839 p = 0,0262
F(5, 140) = 2,44 F(5, 138) = 0,32 F(5, 140) = 0,87 F(5, 145) = 0,66 F(5, 144) = 0,30 F(5, 145) = 1,76 F(4, 115) = 1,70
Sexe*Mobilité*Contexte
p = 0,0376 p = 0,8974 p = 0,5032 p = 0,6540 p = 0,9096 p = 0,1242 p = 0,1546
F(1, 169) = 0,00 F(1, 167) = 0,40 F(1, 170) = 3,79 F(1, 174) = 1,52 F(1, 173) = 0,05 F(1, 174) = 0,00 F(1, 144) = 0,31
Sexe*Temps
p = 0,9729 p = 0,5279 p = 0,0531 p = 0,2191 p = 0,8226 p = 0,9980 p = 0,5794
F(5, 169) = 1,15 F(5, 167) = 0,92 F(5, 170) = 0,20 F(5, 174) = 1,80 F(5, 173) = 1,38 F(5, 174) = 3,19 F(4, 144) = 0,30
Sexe*Temps*Contexte
p = 0,3378 p = 0,4664 p = 0,9636 p = 0,1160 p = 0,2355 p = 0,0088 p = 0,8744
F(1, 169) = 2,88 F(1, 167) = 1,13 F(1, 170) = 0,50 F(1, 174) = 2,77 F(1, 173) = 1,30 F(1, 174) = 6,45 F(1, 144) = 1,31
Sexe*Mobilité*Temps
p = 0,0913 p = 0,2893 p = 0,4795 p = 0,0981 p = 0,2565 p = 0,0120 p = 0,2549
F(5, 169) = 0,07 F(5, 167) = 0,59 F(5, 170) = 0,79 F(5, 174) = 0,58 F(5, 173) = 2,33 F(5, 174) = 0,62 F(4, 144) = 0,95
Sexe*Mobilité*Temps*Contexte
p = 0,9962 p = 0,7075 p = 0,5598 p = 0,7164 p = 0,0446 p = 0,6871 p = 0,4374

311
Facteurs F1 F2 F3 F1 dynamique F2 dynamique F3 dynamique durée
F(1, 29) = 21,96 F(1, 29) = 10,11 F(1, 24,3) = 10,74 F(1, 58) = 32,61 F(1, 29) = 0,96 F(1, 50) = 34,82 F(1, 29) = 270,59
Contexte
p < 0,0001 p = 0,0035 p = 0,0032 p < 0,0001 p = 0,3358 p < 0,0001 p < 0,0001
F(1, 29) = 0,00 F(1, 29) = 0,59 F(1, 26,4) = 0,31 F(1, 58) = 0,13 F(1, 29) = 0,43 F(1, 50) = 0,99 F(1, 29) = 3,61
Mobilité
p = 0,9655 p = 0,4497 p = 0,5805 p = 0,7246 p = 0,5168 p = 0,3235 p = 0,0675
F(1, 29) = 0,96 F(1, 29) = 0,03 F(1, 24,3) = 0,48 F(1, 58) = 4,61 F(1, 29) = 2,37 F(1, 50) = 0,17 F(1, 29) = 3,84
Mobilité*Contexte
p = 0,3346 p = 0,8588 p = 0,4954 p = 0,0360 p = 0,1345 p = 0,6809 p = 0,0597
F(1, 58) = 12,42 F(1, 58) = 3,06 F(1, 42,2) = 2,96 F(1, 58) = 1,30 F(1, 58) = 3,85 F(1, 46,6) = 1,37 F(1, 58) = 9,36
Temps
p = 0,0008 p = 0,0858 p = 0,0928 p = 0,2588 p = 0,0546 p = 0,2474 p = 0,0033
F(1, 58) = 0,01 F(1, 58) = 2,42 F(1, 42,3) = 0,28 F(1, 58) = 0,27 F(1, 58) = 2,39 F(1, 46,6) = 0,74 F(1, 58) = 4,10
Temps*Contexte
p = 0,9377 p = 0,1250 p = 0,5977 p = 0,6025 p = 0,1277 p = 0,3933 p = 0,0474
F(1, 58) = 0,53 F(1, 58) = 0,28 F(1, 42,2) = 0,51 F(1, 58) = 0,78 F(1, 58) = 0,85 F(1, 46,6) = 0,44 F(1, 58) = 0,18
Mobilité*Temps
p = 0,4684 p = 0,6020 p = 0,4805 p = 0,3812 p = 0,3597 p = 0,5089 p = 0,6722
F(1, 58) = 0,92 F(1, 58) = 0,36 F(1, 42,3) = 0,61 F(1, 58) = 3,59 F(1, 58) = 1,13 F(1, 46,6) = 0,00 F(1, 58) = 0,07
Mobilité*Temps*Contexte
p = 0,3405 p = 0,5485 p = 0,4386 p = 0,6442 p = 0,2926 p = 0,9753 p = 0,7978
u Sexe
F(1, 29) = 9,70 F(1, 29) = 2,32 F(1, 26,4) = 33,91 F(1, 58) = 4,35 F(1, 29) = 0,27 F(1, 50) = 1,73 F(1, 29) = 0,65
p = 0,0041 p = 0,1383 p < 0,0001 p = 0,0415 p = 0,6101 p = 0,1938 p = 0,4258
F(1, 29) = 5,72 F(1, 29) = 1,74 F(1, 24,3) = 0,05 F(1, 58) = 2,12 F(1, 29) = 0,81 F(1, 50) = 0,43 F(1, 29) = 0,73
Sexe*Contexte
p = 0,0235 p = 0,1974 p = 0,8253 p = 0,1510 p = 0,3755 p = 0,5129 p = 0,4001
F(1, 29) = 0,42 F(1, 29) = 3,11 F(1, 26,4) = 1,03 F(1, 58) = 0,29 F(1, 29) = 0,12 F(1, 50) = 0,19 F(1, 29) = 5,40
Sexe*Mobilité
p = 0,5221 p = 0,0882 p = 0,3183 p = 0,5918 p = 0,7365 p = 0,6670 p = 0,0273
F(1, 29) = 0,14 F(1, 29) = 1,34 F(1, 24,3) = 0,01 F(1, 58) = 3,48 F(1, 29) = 0,08 F(1, 50) = 0,00 F(1, 29) = 1,02
Sexe*Mobilité*Contexte
p = 0,7147 p = 0,2570 p = 0,9354 p = 0,0673 p = 0,7855 p = 0,9693 p = 0,3198
F(1, 58) = 11,48 F(1, 58) = 0,03 F(1, 42,2) = 0,37 F(1, 58) = 1,27 F(1, 58) = 0,10 F(1, 46,6) = 0,07 F(1, 58) = 0,12
Sexe*Temps
p = 0,0013 p = 0,8651 p = 0,5452 p = 0,2652 p = 0,7520 p = 0,7979 p = 0,7268
F(1, 58) = 0,09 F(1, 58) = 0,00 F(1, 42,3) = 0,42 F(1, 58) = 3,59 F(1, 58) = 0,16 F(1, 46,6) = 1,46 F(1, 58) = 0,05
Sexe*Temps*Contexte
p = 0,7675 p = 0,9798 p = 0,5185 p = 0,0632 p = 0,6946 p = 0,2331 p = 0,8199
F(1, 58) = 0,57 F(1, 58) = 0,50 F(1, 42,2) = 0,29 F(1, 58) = 0,01 F(1, 58) = 0,89 F(1, 46,6) = 0,00 F(1, 58) = 0,79
Sexe*Mobilité*Temps
p = 0,4526 p = 0,4812 p = 0,5945 p = 0,9160 p = 0,3492 p = 0,9693 p = 0,3769
F(1, 58) = 0,07 F(1, 58) = 0,92 F(1, 42,3) = 0,36 F(1, 58) = 0,29 F(1, 58) = 0,29 F(1, 46,6) = 4,43 F(1, 58) = 0,48
Sexe*Mobilité*Temps*Contexte
p = 0,7915 p = 0,3424 p = 0,5524 p = 0,5945 p = 0,5943 p = 0,0407 p = 0,4897

312
Facteurs F1 F2 F3 F1 dynamique F2 dynamique F3 dynamique durée
F(5, 144) = 30,06 F(5, 145) = 273,86 F(5, 138) = 27,59 F(5, 140) = 45,56 F(5, 145) = 128,63 F(5, 138) = 25,45 F(5, 145) = 183,37
Contexte
p < 0,0001 p < 0,0001 p < 0,0001 p < 0,0001 p < 0,0001 p < 0,0001 p < 0,0001
F(1, 28,7) = 0,70 F(1, 29) = 0,27 F(1, 28,5) = 0,29 F(1, 26,2) = 0,05 F(1, 29) = 0,01 F(1, 28,6) = 1,96 F(1, 29) = 4,98
Mobilité
p = 0,4086 p = 0,6058 p = 0,5928 p = 0,8225 p = 0,9372 p = 0,1725 p = 0,0335
F(5, 144) = 1,47 F(5, 145) = 1,15 F(5, 138) = 0,27 F(5, 140) = 0,12 F(5, 145) = 0,87 F(5, 138) = 0,73 F(5, 145) = 1,86
Mobilité*Contexte
p = 0,2017 p = 0,3391 p = 0,9311 p = 0,9872 p = 0,5002 p = 0,6011 p = 0,1055
F(1, 173) = 102,50 F(1, 174) = 2,31 F(1, 166) = 59,63 F(1, 172) = 4,35 F(1, 174) = 0,07 F(1, 165) = 5,19 F(1, 174) = 1,84
Temps
p < 0,0001 p = 0,1302 p < 0,0001 p = 0,0386 p = 0,7975 p = 0,0240 p = 0,1762
F(5, 173) = 1,51 F(5, 174) = 3,94 F(5, 166) = 0,83 F(5, 172) = 5,36 F(5, 174) = 1,47 F(5, 165) = 2,38 F(5, 174) = 2,40
Temps*Contexte
p = 0,1890 p = 0,0021 p = 0,5294 p = 0,0001 p = 0,2028 p = 0,0405 p = 0,0388
F(1, 173) = 2,79 F(1, 174) = 0,70 F(1, 166) = 0,10 F(1, 172) = 1,32 F(1, 174) = 0,77 F(1, 165) = 0,69 F(1, 174) = 1,22
Mobilité*Temps
p = 0,0966 p = 0,4054 p = 0,7512 p = 0,2515 p = 0,3805 p = 0,4060 p = 0,2703
F(5, 173) = 0,59 F(5, 174) = 0,70 F(5, 166) = 0,83 F(5, 172) = 0,67 F(5, 174) = 0,51 F(5, 165) = 2,07 F(5, 174) = 0,87
Mobilité*Temps*Contexte
p = 0,7075 p = 0,6276 p = 0,5282 p = 0,6454 p = 0,7664 p = 0,0719 p = 0,5044
ʊ Sexe
F(1, 28,7) = 57,90 F(1, 29) = 32,17 F(1, 28,5) = 54,12 F(1, 26,2) = 2,80 F(1, 29) = 4,26 F(1, 28,6) = 3,84 F(1, 29) = 0,14
p < 0,0001 p < 0,0001 p < 0,0001 p = 0,1062 p = 0,0480 p = 0,0600 p = 0,7150
F(5, 144) = 0,65 F(5, 145) = 7,20 F(5, 138) = 0,87 F(5, 140) = 3,87 F(5, 145) = 5,46 F(5, 138) = 0,67 F(5, 145) = 0,75
Sexe*Contexte
p = 0,6609 p < 0,0001 p = 0,4999 p = 0,0026 p = 0,0001 p = 0,6473 p = 0,5901
F(1, 28,7) = 0,68 F(1, 29) = 0,01 F(1, 28,5) = 0,63 F(1, 26,2) = 0,25 F(1, 29) = 3,50 F(1, 28,6) = 0,58 F(1, 29) = 9,39
Sexe*Mobilité
p = 0,4155 p = 0,9393 p = 0,4343 p = 0,6197 p = 0,0714 p = 0,4535 p = 0,0047
F(5, 144) = 0,87 F(5, 145) = 0,22 F(5, 138) = 0,33 F(5, 140) = 2,10 F(5, 145) = 1,14 F(5, 138) = 0,31 F(5, 145) = 0,90
Sexe*Mobilité*Contexte
p = 0,5031 p = 0,9556 p = 0,8922 p = 0,0692 p = 0,3396 p = 0,9084 p = 0,4800
F(1, 173) = 0,19 F(1, 174) = 0,62 F(1, 166) = 0,31 F(1, 172) = 0,10 F(1, 174) = 0,39 F(1, 165) = 1,22 F(1, 174) = 0,02
Sexe*Temps
p = 0,6594 p = 0,4331 p = 0,5806 p = 0,7495 p = 0,5323 p = 0,2703 p = 0,8881
F(5, 173) = 3,40 F(5, 174) = 1,49 F(5, 166) = 0,76 F(5, 172) = 0,67 F(5, 174) = 0,37 F(5, 165) = 0,49 F(5, 174) = 0,30
Sexe*Temps*Contexte
p = 0,0059 p = 0,1963 p = 0,5787 p = 0,6502 p = 0,8663 p = 0,7859 p = 0,9149
F(1, 173) = 11,16 F(1, 174) = 0,83 F(1, 166) = 0,00 F(1, 172) = 0,01 F(1, 174) = 0,07 F(1, 165) = 0,30 F(1, 174) = 2,38
Sexe*Mobilité*Temps
p = 0,0010 p = 0,3622 p = 0,9515 p = 0,9419 p = 0,7972 p = 0,5846 p = 0,1250
F(5, 173) = 0,68 F(5, 174) = 0,42 F(5, 166) = 0,65 F(5, 172) = 0,73 F(5, 174) = 0,44 F(5, 165) = 3,03 F(5, 174) = 2,43
Sexe*Mobilité*Temps*Contexte
p = 0,6399 p = 0,8350 p = 0,6652 p = 0,6004 p = 0,8230 p = 0,0121 p = 0,0368

313
Facteurs F1 F2 F3 F1 dynamique F2 dynamique F3 dynamique durée
F(1, 29) = 1,36 F(1, 29) = 2,66 F(1, 29) = 1,10 F(1, 29) = 0,86 F(1, 29) = 0,12 F(1, 28) = 0,42 F(1, 29) = 2,25
Mobilité
p = 0,2527 p = 0,1138 p = 0,3037 p = 0,3607 p = 0,7296 p = 0,5200 p = 0,1444
F(1, 29) = 7,66 F(1, 29) = 1,24 F(1, 29) = 2,43 F(1, 29) = 2,05 F(1, 29) = 0,46 F(1, 28) = 0,52 F(1, 29) = 8,40
Temps
p = 0,0097 p = 0,2750 p = 0,1299 p = 0,1629 p = 0,5022 p = 0,4787 p = 0,0071
F(1, 29) = 0,27 F(1, 29) = 0,00 F(1, 29) = 0,94 F(1, 29) = 0,00 F(1, 29) = 0,85 F(1, 28) = 0,02 F(1, 29) = 1,06
Mobilité*Temps
p = 0,6079 p = 0,9507 p = 0,3409 p = 0,9534 p = 0,3641 p = 0,9030 p = 0,3123
e Sexe
F(1, 29) = 25,78 F(1, 29) = 101,40 F(1, 29) = 73,97 F(1, 29) = 2,56 F(1, 29) = 3,22 F(1, 28) = 0,90 F(1, 29) = 1,11
p < 0,0001 p < 0,0001 p < 0,0001 p = 0,1205 p = 0,0831 p = 0,3508 p = 0,3008
F(1, 29) = 0,96 F(1, 29) = 0,60 F(1, 29) = 1,38 F(1, 29) = 0,57 F(1, 29) = 0,65 F(1, 28) = 1,57 F(1, 29) = 5,76
Sexe*Mobilité
p = 0,3353 p = 0,4446 p = 0,2504 p = 0,4567 p = 0,4249 p = 0,2210 p = 0,0231
F(1, 29) = 3,11 F(1, 29) = 7,75 F(1, 29) = 0,71 F(1, 29) = 2,03 F(1, 29) = 0,43 F(1, 28) = 0,03 F(1, 29) = 1,05
Sexe*Temps
p = 0,0885 p = 0,0093 p = 0,4075 p = 0,1652 p = 0,5148 p = 0,8748 p = 0,3140
F(1, 29) = 0,00 F(1, 29) = 3,25 F(1, 29) = 0,70 F(1, 29) = F(1, 29) = 0,64 F(1, 28) = 1,64 F(1, 29) = 0,49
Sexe*Mobilité*Temps
p = 0,9509 p = 0,0820 p = 0,4107 p = 0,3214 p = 0,4299 p = 0,2106 p = 0,4914

314
Facteurs F1 F2 F3 F1 dynamique F2 dynamique F3 dynamique durée
F(2, 57,3) = 92,85 F(2, 58) = 28,78 F(2, 55) = 19,36 F(2, 54,9) = 43,25 F(2, 56,5) = 19,75 F(2, 58) = 10,00 F(2, 58) = 125,41
Contexte
p < 0,0001 p < 0,0001 p < 0,0001 p < 0,0001 p < 0,0001 p = 0,0002 p < 0,0001
F(1, 29) = 2,66 F(1, 29) = 1,18 F(1, 27,9) = 0,03 F(1, 27,1) = 0,89 F(1, 28,8) = 2,19 F(1, 29) = 0,71 F(1, 29) = 3,61
Mobilité
p = 0,1135 p = 0,2868 p = 0,8538 p = 0,3533 p = 0,1499 p = 0,4071 p = 0,0675
F(2, 57,3) = 9,62 F(2, 58) = 0,07 F(2, 55) = 0,99 F(2, 54,9) = 0,24 F(2, 56,5) = 1,38 F(2, 58) = 0,80 F(2, 58) = 4,12
Mobilité*Contexte
p = 0,0003 p = 0,9316 p = 0,3798 p = 0,7880 p = 0,2599 p = 0,4560 p = 0,0213
F(1, 86) = 22,12 F(1, 87) = 2,47 F(1, 85) = 13,69 F(1, 84) = 6,65 F(1, 85) = 0,19 F(1, 87) = 6,63 F(1, 87) = 0,33
Temps
p < 0,0001 p = 0,1193 p = 0,0004 p = 0,0117 p = 0,6617 p = 0,0117 p = 0,5682
F(2, 86) = 0,36 F(2, 87) = 0,62 F(2, 85) = 1,49 F(2, 84) = 2,39 F(2, 85) = 0,30 F(2, 87) = 0,15 F(2, 87) = 2,05
Temps*Contexte
p = 0,7022 p = 0,5398 p = 0,2315 p = 0,0980 p = 0,7396 p = 0,8602 p = 0,1347
F(1, 86) = 0,30 F(1, 87) = 0,65 F(1, 85) = 0,54 F(1, 84) = 0,15 F(1, 85) = 0,03 F(1, 87) = 3,10 F(1, 87) = 0,22
Mobilité*Temps
p = 0,5838 p = 0,4229 p = 0,4655 p = 0,6955 p = 0,8742 p = 0,0816 p = 0,6434
F(2, 86) = 0,62 F(2, 87) = 0,43 F(2, 85) = 0,10 F(2, 84) = 4,61 F(2, 85) = 0,67 F(2, 87) = 0,25 F(2, 87) = 1,06
Mobilité*Temps*Contexte
p = 0,5426 p = 0,6531 p = 0,9090 p = 0,4310 p = 0,5146 p = 0,7763 p = 0,3508
ø Sexe
F(1, 29) = 28,47 F(1, 29) = 76,64 F(1, 27,9) = 15,80 F(1, 27,1) = 0,87 F(1, 28,8) = 0,72 F(1, 29) = 8,98 F(1, 29) = 0,64
p < 0,0001 p < 0,0001 p = 0,0005 p = 0,3588 p = 0,4022 p = 0,0056 p = 0,4302
F(2, 57,3) = 0,92 F(2, 58) = 1,37 F(2, 55) = 2,17 F(2, 54,9) = 1,66 F(2, 56,5) = 1,05 F(2, 58) = 0,86 F(2, 58) = 0,55
Sexe*Contexte
p = 0,4029 p = 0,2625 p = 0,1239 p = 0,2001 p = 0,3574 p = 0,4283 p = 0,5809
F(1, 29) = 1,40 F(1, 29) = 0,03 F(1, 27,9) = 0,00 F(1, 27,1) = 0,03 F(1, 28,8) = 1,12 F(1, 29) = 0,01 F(1, 29) = 5,18
Sexe*Mobilité
p = 0,2469 p = 0,8551 p = 0,9444 p = 0,8581 p = 0,2990 p = 0,9157 p = 0,0304
F(2, 57,3) = 0,67 F(2, 58) = 1,30 F(2, 55) = 0,16 F(2, 54,9) = 2,60 F(2, 56,5) = 0,77 F(2, 58) = 1,52 F(2, 58) = 4,02
Sexe*Mobilité*Contexte
p = 0,5156 p = 0,2815 p = 0,8506 p = 0,0834 p = 0,4668 p = 0,2281 p = 0,0231
F(1, 86) = 2,89 F(1, 87) = 0,16 F(1, 85) = 0,53 F(1, 84) = 0,11 F(1, 85) = 1,08 F(1, 87) = 4,32 F(1, 87) = 0,06
Sexe*Temps
p = 0,0928 p = 0,6893 p = 0,4702 p = 0,7419 p = 0,3020 p = 0,0407 p = 0,8151
F(2, 86) = 0,33 F(2, 87) = 0,21 F(2, 85) = 2,13 F(2, 84) = 4,61 F(2, 85) = 1,93 F(2, 87) = 0,13 F(2, 87) = 0,31
Sexe*Temps*Contexte
p = 0,7179 p = 0,8111 p = 0,1247 p = 0,0126 p = 0,1514 p = 0,8776 p = 0,7314
F(1, 86) = 7,05 F(1, 87) = 0,08 F(1, 85) = 0,00 F(1, 84) = 1,22 F(1, 85) = 0,17 F(1, 87) = 2,87 F(1, 87) = 0,82
Sexe*Mobilité*Temps
p = 0,0094 p = 0,7794 p = 0,9708 p = 0,2726 p = 0,6850 p = 0,0940 p = 0,3677
F(2, 86) = 0,62 F(2, 87) = 0,18 F(2, 85) = 0,57 F(2, 84) = 5,40 F(2, 85) = 0,73 F(2, 87) = 1,09 F(2, 87) = 1,88
Sexe*Mobilité*Temps*Contexte
p = 0,5403 p = 0,8326 p = 0,5673 p = 0,0062 p = 0,4850 p = 0,3409 p = 0,1586

315
Facteurs F1 F2 F3 F1 dynamique F2 dynamique F3 dynamique durée
F(5, 145) = 25,60 F(5, 144) = 40,38 F(5, 143) = 4,28 F(5, 144) = 20,61 F(6, 169) = 18,09 F(5, 141) = 16,56 F(6, 174) = 70,81
Contexte
p < 0,0001 p < 0,0001 p = 0,0012 p < 0,0001 p < 0,0001 p < 0,0001 p < 0,0001
F(1, 29) = 0,40 F(1, 29) = 0,00 F(1, 29) = 0,32 F(1, 28,9) = 0,29 F(1, 29) = 0,38 F(1, 28,8) = 0,20 F(1, 29) = 4,54
Mobilité
p = 0,5312 p = 0,9808 p = 0,5760 p = 0,5954 p = 0,5426 p = 0,6578 p = 0,0418
F(5, 145) = 1,00 F(5, 144) = 0,62 F(5, 143) = 1,05 F(5, 144) = 0,30 F(6, 169) = 0,28 F(5, 141) = 0,42 F(6, 174) = 2,55
Mobilité*Contexte
p = 0,4189 p = 0,6818 p = 0,3893 p = 0,9144 p = 0,9478 p = 0,8335 p = 0,0216
F(1, 174) = 81,31 F(1, 173) = 1,87 F(1, 172) = 32,54 F(1, 173) = 20,08 F(1, 197) = 0,34 F(1, 166) = 0,21 F(1, 203) = 1,82
Temps
p < 0,0001 p = 0,1732 p < 0,0001 p < 0,0001 p = 0,5599 p = 0,6503 p = 0,1783
F(5, 174) = 0,57 F(5, 173) = 0,50 F(5, 172) = 0,45 F(5, 173) = 0,87 F(6, 197) = 3,23 F(5, 166) = 1,17 F(6, 203) = 0,71
Temps*Contexte
p = 0,7237 p = 0,7760 p = 0,8147 p = 0,5046 p = 0,0048 p = 0,3268 p = 0,6441
F(1, 174) = 0,79 F(1, 173) = 0,21 F(1, 172) = 0,16 F(1, 173) = 0,67 F(1, 197) = 7,27 F(1, 166) = 0,81 F(1, 203) = 7,60
Mobilité*Temps
p = 0,3760 p = 0,6481 p = 0,6866 p = 0,4144 p = 0,0076 p = 0,3705 p = 0,0064
F(5, 174) = 1,26 F(5, 173) = 2,21 F(5, 172) = 0,15 F(5, 173) = 0,26 F(6, 197) = 0,33 F(5, 166) = 0,89 F(6, 203) = 0,82
Mobilité*Temps*Contexte
p = 0,2836 p = 0,0554 p = 0,9804 p = 0,9598 p = 0,9211 p = 0,4899 p = 0,5542
o Sexe
F(1, 29) = 34,95 F(1, 29) = 8,27 F(1, 29) = 44,53 F(1, 28,9) = 2,18 F(1, 29) = 0,79 F(1, 28,8) = 1,02 F(1, 29) = 0,48
p < 0,0001 p = 0,0075 p < 0,0001 p = 0,1509 p = 0,3824 p = 0,3200 p = 0,4948
F(5, 145) = 0,63 F(5, 144) = 1,57 F(5, 143) = 0,75 F(5, 144) = 0,82 F(6, 169) = 1,52 F(5, 141) = 0,95 F(6, 174) = 0,97
Sexe*Contexte
p = 0,6805 p = 0,1734 p = 0,5848 p = 0,5363 p = 0,1735 p = 0,4484 p = 0,4461
F(1, 29) = 3,45 F(1, 29) = 0,95 F(1, 29) = 1,36 F(1, 28,9) = 1,35 F(1, 29) = 0,42 F(1, 28,8) = 0,75 F(1, 29) = 6,72
Sexe*Mobilité
p = 0,0734 p = 0,3367 p = 0,2536 p = 0,2553 p = 0,5222 p = 0,3950 p = 0,0148
F(5, 145) = 0,25 F(5, 144) = 0,57 F(5, 143) = 1,14 F(5, 144) = 0,18 F(6, 169) = 0,59 F(5, 141) = 0,47 F(6, 174) = 1,38
Sexe*Mobilité*Contexte
p = 0,9382 p = 0,7229 p = 0,3441 p = 0,9684 p = 0,7382 p = 0,7974 p = 0,2251
F(1, 174) = 3,35 F(1, 173) = 0,76 F(1, 172) = 0,07 F(1, 173) = 10,22 F(1, 197) = 1,96 F(1, 166) = 5,17 F(1, 203) = 5,79
Sexe*Temps
p = 0,0689 p = 0,3843 p = 0,7933 p = 0,0017 p = 0,1629 p = 0,0243 p = 0,0170
F(5, 174) = 0,75 F(5, 173) = 1,45 F(5, 172) = 0,40 F(5, 173) = 0,26 F(6, 197) = 1,07 F(5, 166) = 0,74 F(6, 203) = 0,34
Sexe*Temps*Contexte
p = 0,5881 p = 0,2080 p = 0,8501 p = 0,9341 p = 0,3798 p = 0,5939 p = 0,9151
F(1, 174) = 13,37 F(1, 173) = 0,86 F(1, 172) = 0,97 F(1, 173) = 0,04 F(1, 197) = 0,10 F(1, 166) = 0,47 F(1, 203) = 2,28
Sexe*Mobilité*Temps
p = 0,0003 p = 0,3539 p = 0,3258 p = 0,8345 p = 0,7520 p = 0,4955 p = 0,1327
F(5, 174) = 0,69 F(5, 173) = 0,57 F(5, 172) = 0,11 F(5, 173) = 0,41 F(6, 197) = 0,35 F(5, 166) = 1,19 F(6, 203) = 0,79
Sexe*Mobilité*Temps*Contexte
p = 0,6340 p = 0,7211 p = 0,9892 p = 0,8394 p = 0,9114 p = 0,3158 p = 0,5816

316
Facteurs F1 F2 F3 F1 dynamique F2 dynamique F3 dynamique durée
F(6, 176) = 74,18 F(6, 176) = 29,88 F(6, 176) = 5,89 F(6, 179) = 33,15 F(6, 179) = 100,46 F(6, 175) = 9,26 F(6, 176) = 136,34
Contexte
p < 0,0001 p < 0,0001 p < 0,0001 p < 0,0001 p < 0,0001 p < 0,0001 p < 0,0001
F(1, 29,3) = 0,00 F(1, 29) = 2,04 F(1, 29) = 0,72 F(1, 29,5) = 2,87 F(1, 29,6) = 10,60 F(1, 29,2) = 0,03 F(1, 29,2) = 2,86
Mobilité
p = 0,9772 p = 0,1639 p = 0,4041 p = 0,1008 p = 0,0028 p = 0,8547 p = 0,1014
F(6, 176) = 1,32 F(6, 176) = 1,20 F(6, 176) = 1,55 F(6, 179) = 0,46 F(6, 179) = 0,77 F(6, 175) = 0,49 F(6, 176) = 2,38
Mobilité*Contexte
p = 0,2509 p = 0,3078 p = 0,1644 p = 0,8391 p = 0,5966 p = 0,8151 p = 0,0307
F(1, 207) = 13,51 F(1, 208) = 8,63 F(1, 206) = 74,50 F(1, 209) = 39,57 F(1, 210) = 5,95 F(1, 206) = 3,62 F(1, 204) = 10,27
Temps
p = 0,0003 p = 0,0037 p < 0,0001 p < 0,0001 p = 0,0156 p = 0,0583 p = 0,0016
F(6, 203) = 2,36 F(6, 204) = 1,05 F(6, 202) = 1,31 F(6, 205) = 2,85 F(6, 205) = 0,53 F(6, 202) = 0,57 F(6, 200) = 2,27
Temps*Contexte
p = 0,0315 p = 0,3946 p = 0,2529 p = 0,0109 p = 0,7872 p = 0,7552 p = 0,0385
F(1, 207) = 0,00 F(1, 208) = 1,31 F(1, 206) = 4,60 F(1, 209) = 0,05 F(1, 210) = 0,20 F(1, 206) = 0,04 F(1, 204) = 0,81
Mobilité*Temps
p = 0,9443 p = 0,2539 p = 0,0331 p = 0,8259 p = 0,6579 p = 0,8447 p = 0,3686
F(6, 203) = 0,53 F(6, 204) = 0,47 F(6, 202) = 0,69 F(6, 205) = 1,45 F(6, 205) = 0,28 F(6, 202) = 0,38 F(6, 200) = 0,05
Mobilité*Temps*Contexte
p = 0,7883 p = 0,8316 p = 0,6615 p = 0,9900 p = 0,9441 p = 0,8929 p = 0,9995
ɛ Sexe
F(1, 29,3) = 46,93 F(1, 29) = 77,64 F(1, 29) = 72,12 F(1, 29,5) = 0,19 F(1, 29,6) = 0,01 F(1, 29,2) = 5,67 F(1, 29,2) = 1,21
p < 0,0001 p < 0,0001 p < 0,0001 p = 0,6648 p = 0,9412 p = 0,0240 p = 0,2802
F(6, 176) = 2,04 F(6, 176) = 3,07 F(6, 176) = 1,13 F(6, 179) = 3,77 F(6, 179) = 2,56 F(6, 175) = 1,46 F(6, 176) = 1,49
Sexe*Contexte
p = 0,0632 p = 0,0070 p = 0,3478 p = 0,0015 p = 0,0209 p = 0,1951 p = 0,1824
F(1, 29,3) = 7,57 F(1, 29) = 0,01 F(1, 29) = 0,00 F(1, 29,5) = 0,45 F(1, 29,6) = 2,62 F(1, 29,2) = 0,01 F(1, 29,2) = 4,06
Sexe*Mobilité
p = 0,0101 p = 0,9060 p = 0,9728 p = 0,5062 p = 0,1162 p = 0,9201 p = 0,0532
F(6, 176) = 0,58 F(6, 176) = 0,78 F(6, 176) = 0,58 F(6, 179) = 0,18 F(6, 179) = 0,40 F(6, 175) = 0,65 F(6, 176) = 0,45
Sexe*Mobilité*Contexte
p = 0,7497 p = 0,5884 p = 0,7459 p = 0,9818 p = 0,8809 p = 0,6910 p = 0,8446
F(1, 207) = 5,10 F(1, 208) = 4,58 F(1, 206) = 2,12 F(1, 209) = 0,75 F(1, 210) = 1,03 F(1, 206) = 0,23 F(1, 204) = 4,97
Sexe*Temps
p = 0,0249 p = 0,0335 p = 0,1473 p = 0,3874 p = 0,3104 p = 0,6302 p = 0,0270
F(6, 203) = 0,19 F(6, 204) = 0,61 F(6, 202) = 0,27 F(6, 205) = 1,45 F(6, 205) = 1,17 F(6, 202) = 0,50 F(6, 200) = 1,81
Sexe*Temps*Contexte
p = 0,9793 p = 0,7218 p = 0,9524 p = 0,1955 p = 0,3215 p = 0,8078 p = 0,0995
F(1, 207) = 6,35 F(1, 208) = 0,70 F(1, 206) = 4,03 F(1, 209) = 1,00 F(1, 210) = 0,01 F(1, 206) = 4,16 F(1, 204) = 0,39
Sexe*Mobilité*Temps
p = 0,0125 p = 0,4023 p = 0,0459 p = 0,3181 p = 0,9185 p = 0,0427 p = 0,5317
F(6, 203) = 0,34 F(6, 204) = 0,39 F(6, 202) = 0,75 F(6, 205) = 1,90 F(6, 205) = 1,11 F(6, 202) = 0,61 F(6, 200) = 0,65
Sexe*Mobilité*Temps*Contexte
p = 0,9156 p = 0,8867 p = 0,6108 p = 0,0828 p = 0,3563 p = 0,7241 p = 0,6865

317
Facteurs F1 F2 F3 F1 dynamique F2 dynamique F3 dynamique durée
F(5, 145) = 42,13 F(5, 144) = 122,0 F(5, 145) = 4,03 F(5, 144) = 71,51 F(5, 145) = 57,72 F(5, 139) = 21,65 F(5, 145) = 41,57
Contexte
p < 0,0001 p < 0,0001 p = 0,0019 p < 0,0001 p < 0,0001 p < 0,0001 p < 0,0001
F(1, 29) = 1,76 F(1, 29) = 0,24 F(1, 29) = 0,39 F(1, 28,9) = 0,24 F(1, 29) = 0,68 F(1, 28,9) = 1,66 F(1, 29) = 4,28
Mobilité
p = 0,1946 p = 0,6258 p = 0,5360 p = 0,6301 p = 0,4164 p = 0,2079 p = 0,0476
F(5, 145) = 1,16 F(5, 144) = 1,41 F(5, 145) = 0,82 F(5, 144) = 0,57 F(5, 145) = 2,25 F(5, 139) = 0,98 F(5, 145) = 0,78
Mobilité*Contexte
p = 0,3341 p = 0,2226 p = 0,5352 p = 0,7212 p = 0,0528 p = 0,4306 p = 0,5670
F(1, 174) = 3,13 F(1, 173) = 16,95 F(1, 174) = 80,84 F(1, 173) = 19,28 F(1, 174) = 3,13 F(1, 168) = 0,43 F(1, 174) = 1,28
Temps
p = 0,0784 p < 0,0001 p < 0,0001 p < 0,0001 p = 0,0785 p = 0,5106 p = 0,2588
F(5, 174) = 0,97 F(5, 173) = 0,20 F(5, 174) = 0,16 F(5, 173) = 0,57 F(5, 174) = 0,19 F(5, 168) = 0,61 F(5, 174) = 0,37
Temps*Contexte
p = 0,4364 p = 0,9608 p = 0,9782 p = 0,7212 p = 0,9664 p = 0,6909 p = 0,8668
F(1, 174) = 0,15 F(1, 173) = 0,04 F(1, 174) = 0,00 F(1, 173) = 0,14 F(1, 174) = 0,20 F(1, 168) = 0,00 F(1, 174) = 11,51
Mobilité*Temps
p = 0,6957 p = 0,8506 p = 0,9548 p = 0,7060 p = 0,6556 p = 0,9991 p = 0,0009
F(5, 174) = 0,72 F(5, 173) = 0,33 F(5, 174) = 0,72 F(5, 173) = 0,45 F(5, 174) = 0,25 F(5, 168) = 0,77 F(5, 174) = 0,63
Mobilité*Temps*Contexte
p = 0,6090 p = 0,8963 p = 0,6085 p = 0,9407 p = 0,9384 p = 0,5733 p = 0,6764
ɛː Sexe
F(1, 29) = 41,03 F(1, 29) = 43,94 F(1, 29) = 66,26 F(1, 28,9) = 2,35 F(1, 29) = 1,20 F(1, 28,9) = 1,23 F(1, 29) = 1,24
p < 0,0001 p < 0,0001 p < 0,0001 p = 0,1363 p = 0,2832 p = 0,2771 p = 0,2741
F(5, 145) = 1,51 F(5, 144) = 1,37 F(5, 145) = 4,64 F(5, 144) = 1,33 F(5, 145) = 0,55 F(5, 139) = 3,36 F(5, 145) = 0,43
Sexe*Contexte
p = 0,1910 p = 0,2407 p = 0,0006 p = 0,2567 p = 0,7398 p = 0,0068 p = 0,8264
F(1, 29) = 1,65 F(1, 29) = 0,00 F(1, 29) = 0,05 F(1, 28,9) = 1,12 F(1, 29) = 0,20 F(1, 28,9) = 1,49 F(1, 29) = 5,01
Sexe*Mobilité
p = 0,2085 p = 0,9601 p = 0,8229 p = 0,2991 p = 0,6611 p = 0,2321 p = 0,0331
F(5, 145) = 1,41 F(5, 144) = 3,41 F(5, 145) = 1,22 F(5, 144) = 1,03 F(5, 145) = 3,07 F(5, 139) = 0,98 F(5, 145) = 0,43
Sexe*Mobilité*Contexte
p = 0,2248 p = 0,0061 p = 0,3036 p = 0,4044 p = 0,0115 p = 0,4306 p = 0,8237
F(1, 174) = 0,11 F(1, 173) = 0,08 F(1, 174) = 5,43 F(1, 173) = 0,25 F(1, 174) = 8,26 F(1, 168) = 3,53 F(1, 174) = 0,29
Sexe*Temps
p = 0,7412 p = 0,7739 p = 0,0210 p = 0,6210 p = 0,0046 p = 0,0620 p = 0,5893
F(5, 174) = 0,62 F(5, 173) = 1,56 F(5, 174) = 0,14 F(5, 173) = 0,45 F(5, 174) = 0,43 F(5, 168) = 0,13 F(5, 174) = 0,95
Sexe*Temps*Contexte
p = 0,6871 p = 0,1744 p = 0,9833 p = 0,8142 p = 0,8264 p = 0,9864 p = 0,4515
F(1, 174) = 0,14 F(1, 173) = 1,62 F(1, 174) = 0,50 F(1, 173) = 0,03 F(1, 174) = 0,55 F(1, 168) = 0,10 F(1, 174) = 0,56
Sexe*Mobilité*Temps
p = 0,7066 p = 0,2042 p = 0,4811 p = 0,8524 p = 0,4577 p = 0,7532 p = 0,4539
F(5, 174) = 0,58 F(5, 173) = 0,08 F(5, 174) = 0,35 F(5, 173) = 0,28 F(5, 174) = 0,46 F(5, 168) = 0,05 F(5, 174) = 0,47
Sexe*Mobilité*Temps*Contexte
p = 0,7175 p = 0,9946 p = 0,8821 p = 0,9237 p = 0,8048 p = 0,9987 p = 0,8019

318
Facteurs F1 F2 F3 F1 dynamique F2 dynamique F3 dynamique durée
F(5, 145) = 126,25 F(5, 139) = 185,45 F(5, 145) = 33,86 F(5, 173) = 22,64 F(5, 136) = 100,09 F(5, 169) = 44,51 F(4, 114) = 121,84
Contexte
p < 0,0001 p < 0,0001 p < 0,0001 p < 0,0001 p < 0,0001 p < 0,0001 p < 0,0001
F(1, 29) = 0,23 F(1, 28,6) = 1,68 F(1, 29) = 0,11 F(1, 173) = 3,97 F(1, 27,4) = 17,47 F(1, 169) = 0,01 F(1, 29,5) = 4,50
Mobilité
p = 0,6320 p = 0,2056 p = 0,7433 p = 0,0480 p = 0,0003 p = 0,9303 p = 0,0423
F(5, 145) = 2,52 F(5, 139) = 0,81 F(5, 145) = 0,25 F(5, 173) = 1,27 F(5, 136) = 2,16 F(5, 169) = 1,82 F(4, 114) = 9,38
Mobilité*Contexte
p = 0,0322 p = 0,5463 p = 0,9409 p = 0,2779 p = 0,0626 p = 0,1107 p < 0,0001
F(1, 174) = 14,26 F(1, 168) = 48,60 F(1, 174) = 47,03 F(1, 173) = 18,62 F(1, 165) = 0,76 F(1, 169) = 0,49 F(1, 142) = 9,03
Temps
p = 0,0002 p < 0,0001 p < 0,0001 p < 0,0001 p = 0,3838 p = 0,4839 p = 0,0031
F(5, 174) = 1,39 F(5, 168) = 2,01 F(5, 174) = 0,64 F(5, 173) = 3,87 F(5, 165) = 0,94 F(5, 169) = 0,73 F(4, 142) = 1,70
Temps*Contexte
p = 0,2287 p = 0,0790 p = 0,6685 p = 0,0024 p = 0,4558 p = 0,6042 p = 0,1538
F(1, 174) = 0,32 F(1, 168) = 3,00 F(1, 174) = 6,58 F(1, 173) = 0,04 F(1, 165) = 0,18 F(1, 169) = 0,01 F(1, 142) = 0,50
Mobilité*Temps
p = 0,5718 p = 0,0852 p = 0,0112 p = 0,8420 p = 0,6701 p = 0,9235 p = 0,4793
F(5, 174) = 0,26 F(5, 168) = 0,76 F(5, 174) = 0,41 F(5, 173) = 0,73 F(5, 165) = 0,47 F(5, 169) = 0,70 F(4, 142) = 0,30
Mobilité*Temps*Contexte
p = 0,9326 p = 0,5818 p = 0,8431 p = 0,5505 p = 0,8013 p = 0,6244 p = 0,8751
œ Sexe
F(1, 29) = 38,24 F(1, 28,6) = 91,23 F(1, 29) = 52,80 F(1, 173) = 0,39 F(1, 27,4) = 0,46 F(1, 169) = 3,82 F(1, 29,5) = 0,94
p < 0,0001 p < 0,0001 p < 0,0001 p = 0,5342 p = 0,5011 p = 0,0524 p = 0,3409
F(5, 145) = 6,13 F(5, 139) = 3,83 F(5, 145) = 2,37 F(5, 173) = 0,40 F(5, 136) = 0,72 F(5, 169) = 2,06 F(4, 114) = 4,55
Sexe*Contexte
p < 0,0001 p = 0,0028 p = 0,0423 p = 0,8511 p = 0,6073 p = 0,0727 p = 0,0019
F(1, 29) = 3,21 F(1, 28,6) = 0,03 F(1, 29) = 0,01 F(1, 173) = 0,00 F(1, 27,4) = 0,76 F(1, 169) = 0,03 F(1, 29,5) = 7,50
Sexe*Mobilité
p = 0,0836 p = 0,8561 p = 0,9295 p = 0,9720 p = 0,3909 p = 0,8576 p = 0,0104
F(5, 145) = 0,82 F(5, 139) = 0,37 F(5, 145) = 0,38 F(5, 173) = 0,61 F(5, 136) = 0,38 F(5, 169) = 3,29 F(4, 114) = 2,32
Sexe*Mobilité*Contexte
p = 0,5340 p = 0,8714 p = 0,8600 p = 0,6928 p = 0,8621 p = 0,0074 p = 0,0616
F(1, 174) = 3,40 F(1, 168) = 3,24 F(1, 174) = 1,55 F(1, 173) = 0,00 F(1, 165) = 1,37 F(1, 169) = 0,05 F(1, 142) = 0,17
Sexe*Temps
p = 0,0669 p = 0,0738 p = 0,2150 p = 0,9616 p = 0,2433 p = 0,8171 p = 0,6777
F(5, 174) = 0,23 F(5, 168) = 1,72 F(5, 174) = 0,58 F(5, 173) = 0,73 F(5, 165) = 1,19 F(5, 169) = 0,75 F(4, 142) = 0,68
Sexe*Temps*Contexte
p = 0,9469 p = 0,1321 p = 0,7165 p = 0,6005 p = 0,3176 p = 0,5859 p = 0,6088
F(1, 174) = 6,34 F(1, 168) = 0,61 F(1, 174) = 0,21 F(1, 173) = 0,00 F(1, 165) = 0,03 F(1, 169) = 1,23 F(1, 142) = 0,32
Sexe*Mobilité*Temps
p = 0,0127 p = 0,4365 p = 0,6459 p = 0,9719 p = 0,8603 p = 0,2697 p = 0,5741
F(5, 174) = 0,33 F(5, 168) = 0,51 F(5, 174) = 0,68 F(5, 173) = 0,84 F(5, 165) = 0,22 F(5, 169) = 0,76 F(4, 142) = 0,51
Sexe*Mobilité*Temps*Contexte
p = 0,8968 p = 0,7717 p = 0,6364 p = 0,5236 p = 0,9528 p = 0,5766 p = 0,7276

319
Facteurs F1 F2 F3 F1 dynamique F2 dynamique F3 dynamique durée
F(6, 171) = 70,48 F(6, 172) = 183,94 F(6, 171) = 23,21 F(6, 172) = 19,27 F(6, 169) = 32,55 F(6, 167) = 11,58 F(5, 142) = 171,17
Contexte
p < 0,0001 p < 0,0001 p < 0,0001 p < 0,0001 p < 0,0001 p < 0,0001 p < 0,0001
F(1, 28,8) = 0,09 F(1, 28,9) = 0,04 F(1, 28,8) = 0,38 F(1, 28,1) = 0,33 F(1, 28,8) = 0,64 F(1, 28,1) = 0,03 F(1, 28,7) = 2,94
Mobilité
p = 0,7629 p = 0,8459 p = 0,5423 p = 0,5675 p = 0,4318 p = 0,8570 p = 0,0973
F(6, 171) = 0,71 F(6, 172) = 0,58 F(6, 171) = 2,12 F(6, 172) = 0,47 F(6, 169) = 1,41 F(6, 167) = 1,08 F(5, 142) = 3,01
Mobilité*Contexte
p = 0,6399 p = 0,7451 p = 0,0539 p = 0,8310 p = 0,2116 p = 0,3757 p = 0,0130
F(1, 200) = 13,02 F(1, 201) = 10,31 F(1, 200) = 82,88 F(1, 200) = 33,02 F(1, 197) = 1,37 F(1, 196) = 8,16 F(1, 171) = 0,16
Temps
p = 0,0004 p = 0,0015 p < 0,0001 p < 0,0001 p = 0,2438 p = 0,0047 p = 0,6896
F(6, 200) = 1,09 F(6, 201) = 2,19 F(6, 200) = 0,28 F(6, 200) = 2,47 F(6, 197) = 1,45 F(6, 196) = 1,18 F(5, 171) = 0,67
Temps*Contexte
p = 0,3675 p = 0,0452 p = 0,9447 p = 0,0251 p = 0,1964 p = 0,3191 p = 0,6468
F(1, 200) = 1,20 F(1, 201) = 0,34 F(1, 200) = 0,05 F(1, 200) = 0,08 F(1, 197) = 4,77 F(1, 196) = 0,44 F(1, 171) = 6,98
Mobilité*Temps
p = 0,2751 p = 0,5617 p = 0,8262 p = 0,7745 p = 0,0301 p = 0,5070 p = 0,0090
F(6, 200) = 0,25 F(6, 201) = 1,40 F(6, 200) = 0,29 F(6, 200) = 1,26 F(6, 197) = 0,53 F(6, 196) = 0,51 F(5, 171) = 0,94
Mobilité*Temps*Contexte
p = 0,9602 p = 0,2177 p = 0,9410 p = 0,1506 p = 0,7836 p = 0,8031 p = 0,4570
ɔ Sexe
F(1, 28,8) = 36,72 F(1, 28,9) = 37,05 F(1, 28,8) = 49,5 F(1, 28,1) = 2,70 F(1, 28,8) = 1,52 F(1, 28,1) = 1,59 F(1, 28,7) = 0,57
p < 0,0001 p < 0,0001 p < 0,0001 p = 0,1117 p = 0,2271 p = 0,2175 p = 0,4573
F(6, 171) = 1,37 F(6, 172) = 7,39 F(6, 171) = 1,15 F(6, 172) = 1,52 F(6, 169) = 1,49 F(6, 167) = 4,31 F(5, 142) = 0,48
Sexe*Contexte
p = 0,2290 p < 0,0001 p = 0,3363 p = 0,1755 p = 0,1830 p = 0,0005 p = 0,7907
F(1, 28,8) = 2,23 F(1, 28,9) = 0,00 F(1, 28,8) = 0,38 F(1, 28,1) = 0,67 F(1, 28,8) = 0,05 F(1, 28,1) = 0,71 F(1, 28,7) = 8,77
Sexe*Mobilité
p = 0,1465 p = 0,9619 p = 0,5418 p = 0,4185 p = 0,8240 p = 0,4070 p = 0,0061
F(6, 171) = 0,93 F(6, 172) = 1,54 F(6, 171) = 0,61 F(6, 172) = 2,33 F(6, 169) = 0,19 F(6, 167) = 0,81 F(5, 142) = 0,71
Sexe*Mobilité*Contexte
p = 0,4724 p = 0,1669 p = 0,7205 p = 0,0342 p = 0,9796 p = 0,5663 p = 0,6196
F(1, 200) = 5,02 F(1, 201) = 3,47 F(1, 200) = 5,73 F(1, 200) = 0,09 F(1, 197) = 4,53 F(1, 196) = 0,94 F(1, 171) = 1,87
Sexe*Temps
p = 0,0262 p = 0,0638 p = 0,0176 p = 0,7626 p = 0,0346 p = 0,3329 p = 0,1734
F(6, 200) = 0,20 F(6, 201) = 1,27 F(6, 200) = 0,78 F(6, 200) = 1,26 F(6, 197) = 0,33 F(6, 196) = 0,40 F(5, 171) = 0,81
Sexe*Temps*Contexte
p = 0,9754 p = 0,2721 p = 0,5841 p = 0,2754 p = 0,9203 p = 0,8787 p = 0,5415
F(1, 200) = 9,11 F(1, 201) = 5,11 F(1, 200) = 0,95 F(1, 200) = 2,34 F(1, 197) = 2,24 F(1, 196) = 2,05 F(1, 171) = 0,66
Sexe*Mobilité*Temps
p = 0,0029 p = 0,0249 p = 0,3311 p = 0,1281 p = 0,1361 p = 0,1539 p = 0,4177
F(6, 200) = 0,73 F(6, 201) = 0,62 F(6, 200) = 0,16 F(6, 200) = 2,02 F(6, 197) = 0,87 F(6, 196) = 0,37 F(5, 171) = 0,08
Sexe*Mobilité*Temps*Contexte
p = 0,6262 p = 0,7111 p = 0,9878 p = 0,0645 p = 0,5147 p = 0,8954 p = 0,9953

320
Facteurs F1 F2 F3 F1 dynamique F2 dynamique F3 dynamique durée
F(6, 173) = 1,84 F(6, 169) = 76,93 F(6, 167) = 16,67 F(6, 170) = 69,97 F(6, 168) = 79,67 F(6, 174) = 24,06 F(6, 170) = 185,29
Contexte
p = 0,0948 p < 0,0001 p < 0,0001 p < 0,0001 p < 0,0001 p < 0,0001 p < 0,0001
F(1, 29) = 2,43 F(1, 28,9) = 0,00 F(1, 27,8) = 1,70 F(1, 27,9) = 2,46 F(1, 28,5) = 7,52 F(1, 29) = 0,75 F(1, 29) = 6,44
Mobilité
p = 0,1302 p = 0,9528 p = 0,2036 p = 0,1283 p = 0,0104 p = 0,3932 p = 0,0168
F(6, 173) = 0,87 F(6, 169) = 4,98 F(6, 167) = 0,37 F(6, 170) = 0,82 F(6, 168) = 1,12 F(6, 174) = 2,97 F(6, 170) = 4,00
Mobilité*Contexte
p = 0,5181 p = 0,0001 p = 0,8948 p = 0,5568 p = 0,3513 p = 0,0087 p = 0,0009
F(1, 202) = 2,18 F(1, 198) = 62,66 F(1, 197) = 55,86 F(1, 199) = 0,51 F(1, 197) = 0,73 F(1, 203) = 6,66 F(1, 199) = 1,72
Temps
p = 0,1411 p < 0,0001 p < 0,0001 p = 0,4760 p = 0,3938 p = 0,0106 p = 0,1912
F(6, 202) = 0,40 F(6, 198) = 0,82 F(6, 197) = 0,67 F(6, 199) = 0,60 F(6, 197) = 0,83 F(6, 203) = 0,53 F(6, 199) = 3,44
Temps*Contexte
p = 0,8796 p = 0,5553 p = 0,6719 p = 0,7299 p = 0,5468 p = 0,7825 p = 0,0030
F(1, 202) = 1,18 F(1, 198) = 0,15 F(1, 197) = 0,06 F(1, 199) = 3,47 F(1, 197) = 0,36 F(1, 203) = 0,48 F(1, 199) = 0,82
Mobilité*Temps
p = 0,2777 p = 0,6973 p = 0,8063 p = 0,0640 p = 0,5467 p = 0,4873 p = 0,3670
F(6, 202) = 0,11 F(6, 198) = 0,76 F(6, 197) = 0,36 F(6, 199) = 0,34 F(6, 197) = 0,90 F(6, 203) = 1,73 F(6, 199) = 0,19
Mobilité*Temps*Contexte
p = 0,9957 p = 0,6038 p = 0,9052 p = 0,5287 p = 0,4990 p = 0,1162 p = 0,9794
a Sexe
F(1, 29) = 77,04 F(1, 28,9) = 62,69 F(1, 27,8) = 59,44 F(1, 27,9) = 0,14 F(1, 28,5) = 2,00 F(1, 29) = 2,13 F(1, 29) = 1,02
p < 0,0001 p < 0,0001 p < 0,0001 p = 0,7152 p = 0,1679 p = 0,1555 p = 0,3198
F(6, 173) = 1,45 F(6, 169) = 1,20 F(6, 167) = 0,46 F(6, 170) = 0,70 F(6, 168) = 0,86 F(6, 174) = 1,61 F(6, 170) = 0,95
Sexe*Contexte
p = 0,1989 p = 0,3063 p = 0,8342 p = 0,6505 p = 0,5253 p = 0,1483 p = 0,4630
F(1, 29) = 0,15 F(1, 28,9) = 0,01 F(1, 27,8) = 0,16 F(1, 27,9) = 0,44 F(1, 28,5) = 2,83 F(1, 29) = 2,76 F(1, 29) = 9,26
Sexe*Mobilité
p = 0,7019 p = 0,9105 p = 0,6903 p = 0,5142 p = 0,1034 p = 0,1072 p = 0,0049
F(6, 173) = 0,58 F(6, 169) = 1,48 F(6, 167) = 1,79 F(6, 170) = 1,46 F(6, 168) = 1,08 F(6, 174) = 1,86 F(6, 170) = 1,73
Sexe*Mobilité*Contexte
p = 0,7452 p = 0,1879 p = 0,1029 p = 0,1943 p = 0,3756 p = 0,0905 p = 0,1172
F(1, 202) = 2,92 F(1, 198) = 3,33 F(1, 197) = 3,72 F(1, 199) = 1,17 F(1, 197) = 0,07 F(1, 203) = 4,44 F(1, 199) = 4,49
Sexe*Temps
p = 0,0888 p = 0,0696 p = 0,0552 p = 0,2798 p = 0,7927 p = 0,0363 p = 0,0354
F(6, 202) = 0,21 F(6, 198) = 1,31 F(6, 197) = 0,08 F(6, 199) = 0,34 F(6, 197) = 0,78 F(6, 203) = 2,17 F(6, 199) = 0,65
Sexe*Temps*Contexte
p = 0,9724 p = 0,2525 p = 0,9979 p = 0,9135 p = 0,5881 p = 0,0468 p = 0,6887
F(1, 202) = 0,07 F(1, 198) = 0,14 F(1, 197) = 0,45 F(1, 199) = 11,02 F(1, 197) = 0,10 F(1, 203) = 0,01 F(1, 199) = 0,28
Sexe*Mobilité*Temps
p = 0,7984 p = 0,7073 p = 0,5028 p = 0,0011 p = 0,7561 p = 0,9064 p = 0,5973
F(6, 202) = 1,08 F(6, 198) = 0,46 F(6, 197) = 0,88 F(6, 199) = 1,14 F(6, 197) = 0,93 F(6, 203) = 1,22 F(6, 199) = 1,47
Sexe*Mobilité*Temps*Contexte
p = 0,3730 p = 0,8379 p = 0,5078 p = 0,3428 p = 0,4739 p = 0,2978 p = 0,1898

321
Facteurs F1 F2 F3 F1 dynamique F2 dynamique F3 dynamique durée
F(6, 169) = 2,40 F(6, 172) = 57,99 F(5, 139) = 10,71 F(6, 164) = 55,63 F(6, 172) = 25,78 F(6, 165) = 3,28 F(6, 174) = 124,84
Contexte
p = 0,0301 p < 0,0001 p < 0,0001 p < 0,0001 p < 0,0001 p = 0,0045 p < 0,0001
F(1, 28,9) = 0,59 F(1, 29) = 0,38 F(1, 28,9) = 1,45 F(1, 27,7) = 7,03 F(1, 28,6) = 3,38 F(1, 27,7) = 1,38 F(1, 29) = 4,88
Mobilité
p = 0,4480 p = 0,5443 p = 0,2390 p = 0,0131 p = 0,0762 p = 0,2501 p = 0,0352
F(6, 169) = 0,58 F(6, 172) = 2,84 F(5, 139) = 0,57 F(6, 164) = 0,55 F(6, 172) = 1,50 F(6, 165) = 0,53 F(6, 174) = 1,83
Mobilité*Contexte
p = 0,7447 p = 0,0115 p = 0,7226 p = 0,7680 p = 0,1806 p = 0,7837 p = 0,0950
F(1, 198) = 4,73 F(1, 201) = 2,33 F(1, 168) = 42,89 F(1, 192) = 2,78 F(1, 201) = 1,39 F(1, 195) = 12,77 F(1, 203) = 5,01
Temps
p = 0,0308 p = 0,1288 p < 0,0001 p = 0,0970 p = 0,2406 p = 0,0004 p = 0,0262
F(6, 198) = 0,60 F(6, 201) = 0,50 F(5, 168) = 0,80 F(6, 192) = 3,47 F(6, 201) = 1,00 F(6, 195) = 1,32 F(6, 203) = 0,78
Temps*Contexte
p = 0,7322 p = 0,8101 p = 0,5501 p = 0,0028 p = 0,4251 p = 0,2511 p = 0,5851
F(1, 198) = 5,94 F(1, 201) = 0,00 F(1, 168) = 1,12 F(1, 192) = 3,81 F(1, 201) = 2,06 F(1, 195) = 0,26 F(1, 203) = 6,80
Mobilité*Temps
p = 0,0157 p = 0,9643 p = 0,2906 p = 0,0523 p = 0,1531 p = 0,6116 p = 0,0098
F(6, 198) = 0,49 F(6, 201) = 0,26 F(5, 168) = 0,48 F(6, 192) = 2,45 F(6, 201) = 0,68 F(6, 195) = 2,54 F(6, 203) = 0,63
Mobilité*Temps*Contexte
p = 0,8162 p = 0,9538 p = 0,7930 p = 0,1473 p = 0,6673 p = 0,0216 p = 0,7078
ɑ Sexe
F(1, 28,9) = 35,00 F(1, 29) = 28,17 F(1, 28,9) = 39,50 F(1, 27,7) = 0,48 F(1, 28,6) = 0,27 F(1, 27,7) = 1,20 F(1, 29) = 0,83
p < 0,0001 p < 0,0001 p < 0,0001 p = 0,4921 p = 0,6075 p = 0,2821 p = 0,3708
F(6, 169) = 1,53 F(6, 172) = 1,20 F(5, 139) = 0,73 F(6, 164) = 1,89 F(6, 172) = 1,12 F(6, 165) = 0,96 F(6, 174) = 0,56
Sexe*Contexte
p = 0,1700 p = 0,3105 p = 0,5996 p = 0,0857 p = 0,3500 p = 0,4571 p = 0,7654
F(1, 28,9) = 0,37 F(1, 29) = 0,25 F(1, 28,9) = 0,03 F(1, 27,7) = 2,82 F(1, 28,6) = 0,38 F(1, 27,7) = 1,38 F(1, 29) = 8,23
Sexe*Mobilité
p = 0,5496 p = 0,6191 p = 0,8726 p = 0,1041 p = 0,5445 p = 0,2506 p = 0,0076
F(6, 169) = 1,01 F(6, 172) = 1,35 F(5, 139) = 0,56 F(6, 164) = 1,05 F(6, 172) = 0,36 F(6, 165) = 2,50 F(6, 174) = 0,96
Sexe*Mobilité*Contexte
p = 0,4174 p = 0,2394 p = 0,7330 p = 0,3960 p = 0,9025 p = 0,0244 p = 0,4532
F(1, 198) = 0,26 F(1, 201) = 18,43 F(1, 168) = 6,46 F(1, 192) = 0,89 F(1, 201) = 0,13 F(1, 195) = 0,06 F(1, 203) = 0,78
Sexe*Temps
p = 0,6097 p < 0,0001 p = 0,0119 p = 0,3474 p = 0,7222 p = 0,8126 p = 0,3793
F(6, 198) = 0,83 F(6, 201) = 0,46 F(5, 168) = 0,53 F(6, 192) = 2,45 F(6, 201) = 0,78 F(6, 195) = 0,90 F(6, 203) = 1,13
Sexe*Temps*Contexte
p = 0,5453 p = 0,8354 p = 0,7547 p = 0,0265 p = 0,5892 p = 0,4967 p = 0,3457
F(1, 198) = 0,40 F(1, 201) = 8,74 F(1, 168) = 2,85 F(1, 192) = 0,14 F(1, 201) = 0,02 F(1, 195) = 0,18 F(1, 203) = 0,34
Sexe*Mobilité*Temps
p = 0,5264 p = 0,0035 p = 0,0930 p = 0,7125 p = 0,8791 p = 0,6754 p = 0,5607
F(6, 198) = 0,61 F(6, 201) = 1,32 F(5, 168) = 0,79 F(6, 192) = 1,10 F(6, 201) = 0,36 F(6, 195) = 0,35 F(6, 203) = 0,67
Sexe*Mobilité*Temps*Contexte
p = 0,7229 p = 0,2515 p = 0,5618 p = 0,3637 p = 0,9023 p = 0,9095 p = 0,6703

322
Annexe 11 : Tableau synthèse des effets
significatifs du facteur CONTEXTE
Différences significatives selon le contexte consonantique de droite par voyelle et indice acoustique. Les
cercles noirs indiquent qu’au moins deux contextes se différencient significativement. Les interactions
sont signalées par un astérisque suivi du ou des facteurs en interaction avec le CONTEXTE. Les cases
subdivisées indiquent un effet significatif du facteur CONTEXTE hors interaction
Dynamique Dynamique Dynamique
F1 (Hz) F2 (Hz) F3 (Hz) Durée (s)
F1 (Hz) F2 (Hz) F3 (Hz)
[i] ● ● ● ●
[ɪ] ● ● ● ● ● ● ●
[y] ● ● ● ●
[ʏ] ● ● ● ● ● ● ●
[u] ● ● ● ●
*temps *sexe *sexe
[ʊ] ● ● ● ●
● ● ●
/e/ s.o.
*mobilité
/ø/ ● ● ● ● ● ●

/o/ ● ● ● ● ● ●
/ɛ/ ● ● ● ● ● ● ●
/ɛː/ ● ● ● ● *sexe ● ●
*sexe *mobilité
/œ/ ● ● ● ● ●
● ●
*sexe *sexe
/ɔ/ ● ● ● ● ●
● ●
*mobilité *mobilité
/a/ ● ● ● ●
● ●
/ɑ/ ● ● ● ● ●

323
Annexe 12 : Graphiques des interactions avec le
CONTEXTE
1) Interaction significative TEMPS*CONTEXTE :
- dynamique du F1 de [ʊ]

Interaction TEMPS*CONTEXTE sur la dynamique du F1 de [ʊ]

324
2) Interactions significatives MOBILITÉ*CONTEXTE :
- F1 de /ø/
- F2 de /a/
- durée de /œ/
- durée de /a/

Interaction MOBILITÉ*CONTEXTE sur le F1 de /ø/

Interaction MOBILITÉ*CONTEXTE sur le F2 de /a/

325
Interaction MOBILITÉ*CONTEXTE sur la durée de /œ/

Interaction MOBILITÉ*CONTEXTE sur la durée de /a/

326
3) Interactions significatives SEXE*CONTEXTE :
- F1 de /œ/
- F2 de [ʊ]
- F2 de /ɔ/
- F3 de /ɛː/
- dynamique du F2 de [ʊ]
- dynamique du F3 de /ɔ/

Interaction SEXE*CONTEXTE sur le F1 de /œ/

Interaction SEXE*CONTEXTE sur le F2 de [ʊ]

327
Interaction SEXE*CONTEXTE sur le F2 de /ɔ/

Interaction SEXE*CONTEXTE sur le F3 de /ɛː/

328
Interaction SEXE*CONTEXTE sur la dynamique du F2 de [ʊ]

Interaction SEXE*CONTEXTE sur la dynamique du F3 de /ɔ/

329

Vous aimerez peut-être aussi