Vous êtes sur la page 1sur 9

INTRODUCTION A LA METHODE VERBO-TONALE DE CORRECTION

PHONETIQUE – Raymond Renard

1. INTRODUCTION

Le système phonologique d’une langue comporte généralement deux ou trois douzaines


d’unités significatives dénommées phonèmes. Dort peu de chose au regard du système
mortpho-syntaxique ou du corpus lexical. Un pourcentage relativement faible de cet ensemble
est nécessaire au maniement courant de cette langue, lequel suppose cependant l’assimilation
de tout le système phonologique.
La méthode d’intégration phonétique dérive du système verbo-tonal de rééducation des
troubles de l’audition. Cette méthode, mise au point à l’Institut Zagreb par son directeur, Petar
Guberina, est partie intégrante de nombreux cours de langues relevant de la méthodologie
« structuro-globale audio-visuelle » (SGAV), conçus par des équipes de pédagogues et de
chercheurs sous la direction de P. Guberina et P. Rivenc.

Le problème est celui d’enseigner la prononciation d’une langue nouvelle à des personnes
qui disposent déjà d’un outil de communication orale : leur langue maternelle.

2. PERCEPTION ET (RE)PRODUCTION

2.1. Perception de la parole

La méthode verbo-tonale plonge ses racines dans la psycholinguistique. Le problème


posé est celui de la perception auditive. Celle-ci joue un rôle essentiel : il est reconnu que
l’apprentissage du langage se réalise chez l’enfant par approximations articulatoires
successives sous le contrôle de l’audition. Audition et phonation sont indissolublement
liées.
Les maxima d’énergie sont appelés formants.
La variété des sons de parole qui parviennent quotidiennement à l’oreille est donc
infinie. Il s’en faut cependant, et de beaucoup, que l’oreille perçoive toutes ces
différences.
« L’enfant passe, peu à peu, du soliloque spontané et sans but à un semblant de
conversation. Cherchant à se conformer à l’entourage, il apprend à reconnaître l’identité
du phénomène phonique qu’il entend et qu’il émet, qu’il garde dans sa mémoire et qu’il
reproduit à son gré. L’enfant le distingue des autres phénomènes phoniques entendus,
retenus et répétés, et cette distinction, sentie comme une valeur intersubjective et
constante, tend vers une signification. Au désir de communiquer avec autrui vient
s’ajouter la faculté de lui communiquer quelque chose » R. Jakobson.
Chaque langue possède sa propre combinatoire : l’anglais et le français possèdent en
commun les phonèmes /s/, / /, / /, /z/, /t/, /d/, /r/, mais normalement on ne trouve
pas /sr/ dans un mot anglais. De même, dans les mots français, on ne trouve pas les
groupes /t / ou /d /.
La fixation du système phonologique ne concerne pas que les phonèmes mais aussi
leur combinatoire. Celle-ci est solidement ancrée chez le jeune enfant. Dès l’âge de six
ans, même les mots qu’il invente sont conformes aux règles séquentielles de son système
linguistique.
L’enfant apprend à parler essentiellement par audition et imitation. La répétition du
phonème facilite l’apprentissage.
2.2. Le système (structuré et global)

Tout système phonologique résulte de l’organisation de données selon un nombre


d’unités phoniques (phonèmes). Ce nombre varie d’une langue à l’autre.
Troubetzkoy a appelé le « crible phonologique » le conditionnement au système
phonologique. Entendre un son du langage, ce n’est pas seulement le détecter, c’est
l’identifier, le décoder, c’est le situer exactement dans le système auquel il appartient,
c’est reconnaître sa fonction dans le système. De la détection au décodage, le son prend
place dans un ensemble chargé de signification : il devient phonème.
Il existe des zones d’interférences où les sons peuvent être confondus s’ils sont
présentés isolément.
Ainsi s’explique que nous ne puissions pas discriminer certains sons étrangers.
Lorsqu’ils apprennent le français, les Anglais confondent [y] et [u], [ ] et [o]. Il arrive
aussi que nous ne puissions discriminer des sons que cependant nous pouvons prononcer.
Les Espagnols confondent [z] et [s], ils ne sont pas conscients de leur différence car ces
variantes sonores n’ont en espagnol aucune valeur distinctive.
De sorte que l’adulte qui écoute une langue étrangère n’en capte pas les différents sons
comme le ferait un enfant, mais au travers d’un filtre, d’un « crible », conditionné par son
propre système phonologique.

2.3. Le système de fautes

Ainsi s’expliquent nos erreurs de prononciation lorsque nous voulons reproduire un


message en langue étrangère. Nous le reproduisions mal parce que nous le percevons mal :
cette mauvaise perception résulte d’une structuration des éléments informationnels inadéquate
car dictée par des habitudes sélectives propres à la perception de notre langue maternelle.
Etant donné que les deux langues (maternelle et étrangère) existent comme deux
systèmes bien définis et séparés, de leur confrontation naît un autre système : le système de
fautes.
Dans la méthodologie verbo-tonale, l’action portera toujours en priorité sur le système
plutôt que sur la « faute » isolée.

2.4. Complexité du phénomène de perception de la parole

La perception de la parole résulte de la combinaison de facteurs multiples captés


globalement. Ces facteurs sont les stimuli acoustiques comme la fréquence, l’amplitude, le
temps, la structure formantique, d’autres facteurs tels la prosodie (intonation, rythme), extra-
auditifs comme le geste, la mimique, l’entourage, le contexte…

3. EXAMEN DE DIVERSES METHODES DE CORRECTION PHONETIQUE

3.1. La méthode articulatoire

L’acte phonatoire implique une connaissance explicite de son fonctionnement.


Perfectionnement au fil du temps d’instruments de visualisation ou de description des
mouvements articulatoires.
Ces procédés n’exclue pas de graves imprécisions. Le procédé devient presque
impraticable lorsqu’il s’agit d’apprendre une langue dont le système phonologique est très
éloigné de la langue maternelle.
La méthode articulatoire néglige le facteur auditif. Nous avons déjà dit que les
Espagnols confondent [z] et [s], alors qu’ils savent les prononcer. Ces variantes sonores
n’ayant aucune valeur distinctive en espagnol, ils ne sont pas conscients de leur différence. Il
ne s’agit donc pas ici d’enseigner comment on produit un son donné différent d’un autre, mais
comment on le distingue d’un autre. Le problème ne se situe pas au niveau de la production,
mais à celui de la perception.
Pour la motor theory, l’auditeur reproduit mentalement le son entendu et c’est dans la
mesure où il réalise effectivement cette opération qu’il perçoit bien.
La méthode articulatoire traditionnelle néglige les effets de la phonétique
combinatoire. Alors que les sons s’influencent les uns les autres.
De plus, elle ignore les phénomènes de compensation. En effet, des procédés
articulatoires différents peuvent donner le même résultat acoustique.
Enfin, elle néglige le facteur prosodique, qui est pourtant partie intégrante du langage.
Un anglophone débutant dans l’apprentissage du français reproduira peut-être de façon plus
satisfaisante le [y] dans « C’est ta voiture ? » (prononcé avec une intonation « montante »)
que dans « Oui. C’est ma voiture » (prononcé avec une intonation « descendante »). On ne
saurait assez insister sur le fait qu’un son du langage ne peut être parfaitement défini s’il n’est
intégré dans la structure complexe qui le conditionne.
Pour un étranger, un son isolé mal prononcé n’est pas un cas en soi – une sorte de cas
pathologique – c’est en réalité l’illustration particulière d’habitudes linguistiques générales
propres à une structure phonique donnée.
En conclusion, la méthode articulatoire nuit à la spontanéité de l’expression par le fait
qu’elle s’attache à l’élément isolé plutôt qu’à la structure. Elle prétend traiter au niveau
conscient ce qui devrait s’organiser au niveau de l’inconscient.

3.2. Des machines plutôt que des hommes

Les procédés basés sur l’audition de modèles (patterns) à partir de machines se sont
développés dès l’invention du phonographe.
Ces méthodes reconnaissent la primauté de l’audio-oral et par là même forcent les
élèves à l’écoute attentive. Elles présentent des modèles valables de voix authentiques de
native speakers.
Cependant, l’apprentissage en cabine rend difficile l’évocation du contexte
situationnel.

3.3. La méthode des oppositions phonologiques

La méthode dite des oppositions phonologiques se fonde sur les conceptions de


Bloomfield, Jakobson et Halle qui classaient les phonèmes en fonction des traits distinctifs
permettant des oppositions de type binaire.
La méthode des oppositions phonologiques néglige le facteur prosodique, dans la
mesure même où elle poursuit un autre objectif, celui de permettre la production d’éléments
isolés, alors que la parole est un continuum. De plus, elle néglige l’éventail des allophones,
leur combinatoire distributionnelle, les effets séquentiels.

L’erreur fondamentale de la méthodologie traditionnelle de correction phonétique, c’est


de considérer la « faute » dans sa singularité. On offre des recettes pour corriger ou pour
enseigner chacun des sons sans se rendre compte que ces sons appartiennent à un système
riche d’une dynamique interne et qui peut réserver au professeur des surprises tant agréables
que désagréables : résurgence d’une erreur qu’on croyait corrigée ou facilitation imprévue
d’un progrès déterminé.

4. UNE APPROCHE NOUVELLE : DE LA PATHOLOGIE DE L’AUDITION A LA


PEDAGOGIE DES LANGUES

4.1. Critique des méthodes classiques d’audiométrie

L’appellation verbo-tonale s’est appliquée, à l’origine, à la méthode de réhabilitation


des déficients auditifs, créée par P. Guberina, elle-même née de la critique des techniques
classiques de mesure de l’audition : l’audiométrie tonale et l’audiométrie vocale.
L’audiométrie tonale compare la courbe d’audibilité du sujet à la courbe liminaire
moyenne du champ de l’audition. P. Guberina ne conteste évidemment pas la valeur
diagnostique de l’audiométrie tonale. Il lui reproche avant tout de tester l’oreille à partir de
sons purs qui ne correspondent aucunement à la réalité linguistique.
L’audiométrie vocale étudie les réactions de l’individu à la parole. Elle permet de
déceler les seuils de détection, de distinction et d’intelligibilité. Elle se fonde sur divers
stimuli : phonèmes isolés, syllabes sans signification (logatomes), mots monosyllabiques,
mots dissyllabiques, phrases. Le reproche fait par P. Guberina est qu’elle ne fournit pas
suffisamment de précision quant aux fréquences, en dépit de l’élaboration de listes de mots
« phonétiquement équilibrés ».

4.2. L’audiométrie verbo-tonale

D’où la recherche d’une audiométrie qui, tout en se servant de signaux de nature


linguistique (verbale) fournirait des indications de nature tonale sur les déficiences. Les
signaux choisis sont des logatomes prononcés par une voix naturelle. Les indications de
nature tonale sont des bandes d’octaves.
Les logatomes proposés sont fréquentiellement équilibrés.
L’hypothèse de départ est double. Il est normal que l’oreille malade ne perçoive pas le
logatome filtré sur la bande optimal d’intelligibilité de l’oreille saine ; le logatome non filtré
sera mieux perçu que le précédent par l’oreille malade, car elle « structure » différemment.
Ainsi, on parvient à déterminer le rôle (positif ou négatif) des diverses bandes d’octaves du
champ auditif, on voit dans quelle mesure l’oreille se comporte comme l’oreille normale et on
relève avec précision les bandes fréquentielles restées saines : ces bandes résiduelles sont
dites « de transfert » car ce sont elles exclusivement que la rééducation va stimuler afin que
puisse se constituer ou se reconstituer un système de codage correspondant au système
phonologique de la langue de communication. P. Guberina va éliminer les bandes déficientes
par filtrage et proposer une éducation du processus audio-phonatoire sur la base des seules
bandes demeurées saines. A cette fin, il a créé divers appareils : les Suvag (Système universel
verbo-auditif Guberina). Ces appareils accordent beaucoup d’importance aux bandes les plus
graves et aux infrasons. Ainsi, on ne joue pas sur l’intensité, mais sur le choix des fréquences
et sur la durée.

4.3. Les optimales

Les zones fréquentielles les plus intenses – les formants dans le cas des voyelles - ne
sont pas nécessairement déterminantes pour l’identification du son.
Au moyen de filtres électroniques, Guberina a cherché pour chaque son isolé la bande
d’octave optimale, c’est-à-dire quand il apparaît à l’oreille normale comme le moins déformé.
Si nous filtrons un [i] ou un [u] dans l’octave optimal de [ ], nous percevons [ ].
Autrement dit, si les sons et les mots sont transmis par des octaves non optimales, ils sont
perçus déformés : l’oreille les entend comme des sons différents.
La détermination des optimales chez un individu donné dépend de sa culture
linguistique. L’optimale de [i] ou de [u], deux sons universels, est différente selon qu’on la
cherche chez un Anglais, un Français, un Russe ou un Chinois. Chacun se constitue
graduellement et inconsciemment un « crible », un système structurant qui est fonction du
système phonologique de sa langue maternelle. Ceci explique l’existence d’un système
d’erreurs conditionné par la langue maternelle des apprenants. Le crible conditionne le
processus audio-phonatoire. Ce dernier peut se modifier ultérieurement en fonction de
l’apprentissage éventuel de celui ou de ceux d’une ou d’autres langues. L’apprentissage d’une
langue nouvelle constitue une gymnastique d’assouplissement de l’audition.

4.4. Eduquer l’oreille

Une personne qui apprend une nouvelle langue n’entend pas ou plutôt ce qu’il perçoit
est bruit au lieu de langage. Il est possible par un conditionnement adéquat de doter ces bruits
d’une valeur fonctionnelle.
Une série de facteurs ainsi que le « crible » (dû au système phonologique de la langue
maternelle) se fondent sur des éléments extra-acoustiques tels que le contexte, l’intelligibilité,
l’attente, la reproductibilité, l’information, et qui appartiennent à la culture et à la personnalité
de celui qui écoute. Il s’agit donc de faire sauter le crible, de l’assouplir et de le modeler par
un conditionnement adéquat.
Il n’est pas si paradoxal d’initier les professeurs de langue aux techniques de travail
avec les malentendants. Il faut « faire entendre ». On utilise la stimulation basse pour corriger
rythme et intonation. Mais pour ce faire, comment inspirer confiance, susciter une
collaboration active ? L’éducateur doit être patient, compréhensif. L’ambiance amical et
sereine entre le rééducateur et le patient est indispensable.
Il faut rechercher un conditionnement du processus audio-phonatoire qui se
caractérisera par une action portant non pas sur la production (expression orale), qui est
cependant son but essentiel et final, mais sur l’émission (stimulus, structure modèle). Le
travail portera sur l’émission et sera guidé et contrôlé par la production.
Le système verbo-tonal d’intégration phonétique met en œuvre une batterie de
procédés servant à réaliser ce conditionnement.

5. LA METHODE VERBO-TONALE D’INTEGRATION PHONETIQUE

5.1. Principes généraux

Le professeur recherchera toujours les stimulations les plus favorables du point de vue
de la perception auditive, parmi lesquelles la stimulation psychologique : la motivation.
La perception de l’adolescent ou de l’adulte se fonde sur des facteurs socio-culturels
extra-acoustiques tels que le contexte, la compréhension ou l’attente.
On peut à la rigueur et pour les besoins de l’apprentissage ne pas comprendre (d’une
manière analytique) ce que l’on répète (fait fréquent chez les enfants), cependant une fois que
l’on parle il faut savoir ce que l’on dit.
La correction phonétique opèrera mieux en liaison naturelle avec des stimulations
telles que l’intonation, le geste, le rythme, la mimique, l’affectivité. Guberina parle de
stimulations biologiques ou bio-physiologiques.
Il existe dans la méthodologie audio-visuelle une phase privilégiée, celle de la
répétition.

Il faudra bannir tout ce qui pourrait favoriser une certaine intellectualisation de la


matière phonétique. Cette intellectualisation suppose en effet une analyse, voire une
comparaison, qui, ainsi que nous l’avons dit à propos de la description des sons et de la
méthode articulatoire, nuit à la spontanéité de l’expression.
Il y a lieu de retarder l’étude de la langue écrite. L’écrit ne peut que gêner le professeur
dans ses efforts pour conditionner ses élèves à partir d’une sorte de déconditionnement de la
langue maternelle. Les pédagogues savent en effet que seule la vue des caractères connus
éveille la représentation psycho-auditive de leur énoncé sonore et déclenche chez les
débutants des réactions automatiques d’articulation en rapport avec leur langue maternelle ou
avec d’autres langues qu’ils auraient étudiées.
Le souci du respect de la structure implique que soit respectée la prosodie, c’est-à-dire
le schéma prosodique ainsi que l’alternance des accents d’intensité (ou de durée) et des
pauses. En deux mots : l’intonation et le rythme.
La relation entre les facteurs prosodiques et les aspects affectifs de la situation de
communication est très étroite. L’incertitude entraîne une modification dans la distribution du
tonus. La voix s’en trouve modifiée dans sa hauteur, son timbre, son débit, son intensité.
Ainsi, l’intonation informe. « C’est haut ! ». La tension créée par cette situation affective
contribue au mieux à la production correcte de l’expression et en particulier du [o]. De même,
on obtient des résultats appréciables auprès des élèves étrangers qui éprouvent des difficultés
à prononcer les nasales françaises lorsqu’on leur présente la situation affective (mécanisme
grammatical) : on y voit une dame affublée d’un chapeau assez comique. Les personnes à qui
elle demande : « Est-ce que mon chapeau vous plaît ? » répondent à l’unisson : « Non ! ».
D’où l’intérêt d’un recours régulier à des situations affectives pour favoriser la bonne
prononciation.
Le rythme consiste dans l’organisation dans le temps des pauses et des différentes
mises en évidence de hauteur, durée et/ou intensité, plus couramment appelées accents. Le
rythme informe. La voyelle se trouvant au sommet, c’est-à-dire à l’aboutissement d’une
intonation « montante » ou au départ d’une intonation « descendante », est perçue comme
plus claire et plus tendue. Dans le cas contraire, soit à la fin d’une intonation « descendante »
ou au début d’une intonation « montante », elle est perçue comme plus relâchée et plus
sombre.
L’élève qui concentre son esprit sur les facteurs prosodiques « débloque »
inconsciemment sa perception des autres éléments informationnels du message. En d’autres
termes, il ne fixe pas son attention sur le son difficile. D’où l’intérêt pour la didactique des
langues des chansons, des comptines et des logatomes
Pour rendre sensible à l’élève une différence qui n’est pas suffisante pour être perçue,
il y a lieu de l’exagérer en modifiant le modèle de telle sorte qu’on s’éloigne de la faute. On
ne peut agir sur la reproduction (de l’élève) qu’en agissant sur la transmission et sur
l’émission (le modèle). L’assimilation d’un système phonologique nouveau est une lutte âpre
et acharnée, avec des hauts et des bas. La persévérance se voit récompensée.

5.2. Procédés particuliers


Le respect des éléments prosodiques est essentiel. A partir de la faute, il faut apprécier
d’abord correctement l’écart par rapport à la norme. Le paramètre essentiel est le spectre.
Pour les voyelles c’est lui qui permet la différenciation des timbres, seuls facteurs distinctifs
en français ; pour les consonnes, il intègre le facteur temporel (durée, tension), qui joue un
rôle important pour la différenciation du mode articulatoire (occlusives : tendues, brèves ;
constrictives : relâchées, longues).

L’intonation comprend la hauteur tonale et la variation de hauteur. La hauteur tonale


modifie l’équilibre des fréquences à l’intérieur d’un timbre donné. Il y a plus de chance de
valoriser l’élément clair d’une voyelle avec un son aigu qu’avec un son grave. La variation de
hauteur est ce qui caractérise les intonations montantes ou descendantes. Le timbre des
voyelles sera toujours mieux défini en intonation variable : il sera clarifié en intonation
montante et assombri en intonation descendante.
En conséquence, lorsque le son est situé dans un creux mélodique, le timbre [i]
s’assombrit en [e] ou [y]. Par contre, lorsque le son se trouve à un sommet mélodique, [y]
s’éclaircit en [i], [u] en [y], [o] en [ ].

En français, l’accent vocalique se réalise par une variation de durée, d’intensité et/ou
de hauteur. L’accentuation permet une meilleure identification du timbre, plutôt qu’une
clarification de celui-ci. Par rapport aux voyelles toniques (plus tendues), les voyelles atones
(plus relâchées) tendent à se rapprocher du centre du trapèze vocalique, siège du schwa. Pour
les consonnes, un allongement, c’est-à-dire un ralentissement du rythme ou du temps favorise
le relâchement.

« Elle a ri ? »

« Qui est venu ? »

« Elle est ici ? »

« C’est ici ? »

Un son vocalique placé au sommet d’une intonation voit précisément se valoriser sa


tonalité claire. Le son sera donc mieux saisi dans cette situation. Au contraire, lorsque la faute
consistera en une prononciation trop tendue, le choix d’un son placé dans un creux intonatif
s’avèrera le plus efficace.
Doivent être considérées a priori comme « non optimales » les structures dont on
trouve l’équivalent dans la langue de l’élève, car elles seraient des pièges sur le plan
phonétique.
L’intonation montante tend la voyelle et souligne les fréquences aiguës. L’intonation
descendante contribue à relâcher le son et à en souligner l’élément grave. Le choix du
professeur est donc simple : haut-bas.

Le phénomène de la tension concerne à la fois : la hauteur, le timbre, la durée,


l’intensité. L’intensité (ou force sonore) est fonction de l’amplitude et de la fréquence (mais
l’amplitude peut être perçue comme durée ou comme hauteur). La durée est fonction du temps
(mais il peut être perçu comme intensité ou qualité). Le timbre est fonction du spectre des
fréquences, la hauteur est fonction de la fréquence fondamentale (mais la fréquence peut être
perçue comme durée).
La tension joue un rôle régulateur dans la production des phonèmes. L’hypotension
peut expliquer l’émission [baba] pour « papa » ; au contraire, une hypertension engendrera
[popo] pour « maman ».

Le recours à la prosodie est utile seulement pour la correction des sons vocaliques. Du
point de vue de la tension, il s’avère efficace de localiser à un sommet/creux mélodique ou
d’intensité les sons mal timbrés.
Le recours à la phonétique combinatoire : on localisera à l’initiale les consonnes
apparaissant comme trop relâchées, on les accompagnera d’une voyelle fermée antérieure ou
postérieure selon qu’il s’agit d’une palatale ou d’une vélaire.
Le recours à la prononciation nuancée est utile si l’élève a tendance à « relâcher » un
son. Dans ce cas il faudra lui présenter ce modèle avec un maximum de tension et
réciproquement.

La phonétique combinatoire nous apprend que les sons s’influencent les uns les autres
et que les effets séquentiels ne peuvent être sous-estimés. On mettra plus facilement en relief
le caractère sombre ou claire du timbre d’une voyelle en l’associant à une consonne
relativement grave ou aiguë. En d’autres termes, on vélarisera ou palatalisera selon qu’on
l’associera à une consonne vélaire ou palatale. La classification des voyelles et des consonnes
sur l’axe clair-sombre permet de déduire la règle générale de la phonétique combinatoire : il
faut associer ce qui se ressemble.
Influence des voyelles sur les consonnes :
Voyelles antérieures (i, y, e) palatalisation
Voyelles postérieures (u, o) vélarisation
Voyelles labiales (y, u) labialisation
Influence des consonnes sur les voyelles :
Labiales, vélaires, laryngées, R assombrissement du timbre
Nasales, sonores assombrissement du timbre
Alvéolaires, post-alvéolaires éclaircissement du timbre
Constrictives sourdes fermeture
Occlusives sourdes ouverture
j fermeture
arrondissement
Influence des consonnes entre elles :
Sonore précédant sourde assombrissement de la sonore
Sourde précédant sonore sonorisation de la sourde

5.3. Récapitulatif

Mise en condition du processus audio-phonatoire


Recours à la prosodie
Mise en condition de la phonation
Recours à la phonétique combinatoire
Mise en condition de la perception
Recours à la prononciation nuancée
CORRECTION DES VOYELLES
Pour assombrir le timbre :
- creux intonatif
- chuchotement
Pour éclaircir le timbre :
- sommet intonatif
- sommet d’intensité
o fin d’exclamation
o syllabe tonique
CORRECTION DES CONSONNES
Pour relâcher :
- position intervocalique ou finale
- consonne correspondante moins tendue
Pour tendre :
- position initiale
- consonne correspondante plus tendue
- contexte avec [i] [e]

Vous aimerez peut-être aussi