Académique Documents
Professionnel Documents
Culture Documents
RSUM
Voici un modle psycholinguistique informatique pour le franais. Il sappelle FN5 et simule la
reconnaissance humaine de mots parls, prsents seuls (dterminant, adjectif antpos, substantif)
ou en suites de deux mots (dterminant et substantif, adjectif antpos et substantif). Le modle
contient un lexique de 17 668 mots et cela dans deux versions, franaise et Suisse romande. Grce
une architecture connexionniste localiste trois niveaux (traits distinctifs, phonmes, mots) qui est
enrichie de plusieurs innovations cls (processeur de position, groupements de connexions, et point
disolation), le modle peut reconnatre la plupart des mots et des suites quon lui prsente (taux de
succs entre 83.6% et 99.7%), et en plus, il est capable de reproduire un grand nombre deffets
trouvs lors dtudes exprimentales (ex. frquence, longueur, effacement du schwa, liaison, etc.).
Le modle, qui possde une interface graphique, est tlchargeable, et utilisable la fois pour la
recherche et pour lenseignement.
ABSTRACT
FN5, a computational psycholinguistic model of spoken word recognition in French,
made available to researchers and teachers.
Here is a computational psycholinguistic model for French. It is called FN5 and simulates human
recognition of spoken words, presented either alone (determiner, prenominal adjective, noun) or in
two-word sequences (determiner and noun, prenominal adjective and noun). The model contains a
lexicon of 17,668 words, in a standard French and a Swiss French version. Owing to a localist
connectionist architecture of three levels (features, phonemes, words), enriched with several key
innovations (position processor, groups of connections, and isolation point), the model is able to
recognize most of the words and sequences presented to it (success rate between 83.6% and 99.7%),
and it can also replicate a large number of effects found in experimental studies (e.g. frequency,
length, schwa deletion, liaison, etc.). The model has a graphical interface, and can be downloaded
and used both for research and teaching.
MOTS-CLS :
KEYWORDS:
Introduction et motivation
Lexique du modle
2006) et les avons normaliss (de sorte quils stendent de 0 pour trs rare 1 pour trs frquent),
et nous avons bien sr fait vrifier lensemble de linformation linguistique prsente dans le lexique
(orthographe, transcription phontique et genre). Nous avons galement ajout des informations sur
les voyelles longues en finale de mot pour le franais de Suisse romande (ex. envie ) et sur les
consonnes de liaison des adjectifs antposs (ex. grand avec /t/, heureux avec /z/, etc.).
Enfin, aux mots qui contiennent un schwa (ex. fentre , souvenir , etc.), quil soit obligatoire
dans la prononciation, facultatif, ou interdit (2 190 mots en tout ; voir Racine et Grosjean, 2005),
nous avons associ des indices de prfrence de la variante avec et sans effacement du schwa.
Fonctionnement du modle
3.1
Mots
Phonmes
Traits distinctifs
Liens obligatoires
Liens optionnels
FIGURE 1 :
Architecture gnrale de FN5
Processeur de position
Afin de permettre la simulation de la reconnaissance dune suite de deux mots (ex. ta table
/tatabl/), nous avons prvu qu chaque cycle, un processeur de position aligne les mots du lexique
avec chaque position possible de la chane des phonmes en entre. Le modle aligne donc le dbut
du mot avec le dbut de la suite, savoir, dans lexemple /tatabl/, avec le /t/ initial en position 1,
mais galement avec le /a/ en position 2, avec le deuxime /t/ en position 3, etc. Il tablit pour
chacune des positions la somme combine des activations et inhibitions du mot, compare ces
sommes, et choisit la position qui produit la somme la plus leve pour ce mot. Cest cette position
qui est alors retenue et stocke avec le mot pour la suite de la simulation. Ce positionnement
optimal du mot est rpt chaque cycle dun phonme (il y a 16 cycles par phonme) et cela pour
chaque phonme de la chane phontique. Certes, la position du mot peut changer dun cycle
lautre, mais nous imposons au systme de nen avoir quune seule, pour chaque mot, chaque
cycle. Si plusieurs positions donnent exactement le mme rsultat, le processeur de position choisit
la position la plus rcente. Bien entendu, dans un traitement squentiel o les phonmes arrivent les
uns aprs les autres (dabord le premier phonme, ensuite le deuxime phonme, etc.), le processeur
de position ne peut placer un mot que dans la position 1 lors de larrive du premier phonme, et
aucune comparaison nest effectue ce moment-l. Cest larrive du deuxime phonme quil
peut placer le mot en position 1 ou en position 2 en comparant les deux sommes, et cest larrive
du troisime phonme quil compare les sommes des positions 1, 2 et 3, etc. De la sorte, lactivation
et la reconnaissance dun mot peuvent avoir lieu nimporte quel emplacement de la chane parle.
Lorsque nous comparons cette approche avec celle dautres modles qui simulent la reconnaissance
de deux ou plusieurs mots (ex. TRACE et Shortlist), nous y voyons plusieurs avantages runis en un
seul modle :
Lapproche fonctionne sans quil faille dupliquer les mots toutes les positions thoriquement
possibles : les mots nont quune seule position qui leur est attribue chaque cycle et ils
peuvent tre dplacs vers une autre position si le processeur de position le dcide.
Lapproche ne limite pas le nombre des mots-candidats qui sont pris en considration ; tous les
mots du lexique peuvent tre activs en parallle, et ce avec un niveau dactivation appropri
(forte lors dune bonne correspondance, moindre lors dune correspondance partielle, etc.).
Lapproche ne ncessite pas que la chane en entre soit segmente pralablement ; elle
sappuie plutt sur le fait que les frontires entre mots mergent souvent du processus normal
de la reconnaissance des mots.
3.2
Groupements de connexions
Pour les mots qui contiennent des phonmes qui peuvent tre effacs (ex. un schwa) et/ou ajouts
(ex. une consonne de liaison), et plus gnralement pour tous les mots avec plusieurs formes
(comme les adjectifs), nous faisons appel aux groupements de connexions. Chacune des
prononciations ralisables dun mot (ex. avec ou sans schwa, avec ou sans consonne de liaison,
masculin ou fminin, etc.) possde un groupement de connexions qui relient le mot avec les
phonmes en question. Par exemple, pour le substantif pelouse , il y a un groupement de
connexions pour la forme avec effacement du schwa (/pluz/) et un autre pour la forme sans
effacement (/pluz/). De mme, pour ladjectif grand , il existe un groupement pour la forme
fminine (/d/), un deuxime pour la forme masculine sans liaison (//), et un troisime pour la
forme masculine avec liaison (/t/).
Le processeur de position naligne donc pas seulement chaque mot avec chaque position possible
dans la chane des phonmes en entre, mais aussi, dans le cas de plusieurs groupements de
connexions, il tablit les sommes des activations et inhibitions pour chaque groupement, chaque
position, afin de trouver le groupement et la position qui donnent la somme la plus leve (ex. le
groupement qui correspond la forme masculine avec liaison, et cela pour la position 2). la fin de
la comparaison, les informations concernant le groupement et la position sont stockes avec le mot.
Le processus recommence chaque nouveau cycle et peut donc produire un rsultat diffrent, le
processeur de position ne retenant quun seul groupement et quune seule position pour chaque mot.
Notons que des informations numriques peuvent tre attaches aux groupements de connexions
afin de rendre compte de la prfrence, ou de la frquence, dun groupement donn chez ltre
humain (voir les mots avec schwa facultatif, par exemple, o il y a souvent une prfrence pour
lune ou lautre version).
3.3
Point disolation
Le point disolation (ou PI) est le moment, exprim en nombre de cycles, o le mot reconnatre
dpasse le niveau dactivation de tous les autres candidats possibles ; de plus, ce premier rang doit
tre maintenu jusqu la fin de la simulation. Cette mesure est calcule pour chaque mot de la suite
(dans le cas dune suite de mots), et elle est propose en nombre de cycles ainsi quen pourcentage
de la longueur du mot (neutralisant ainsi la longueur). Le PI est une mesure simple, mais fort utile
dans la simulation de la reconnaissance de mots parls.
Un exemple de simulation
Dans la figure 2, nous montrons la fentre principale de linterface utilisateur graphique du modle
qui comporte deux parties. Celle du haut, avec divers boutons, zones de texte, etc., sert rgler les
diffrentes composantes du modle et entrer les mots pour lesquels on veut simuler la
reconnaissance ; celle du bas, libelle Activation/Cycle , sert visualiser lactivation des mots.
valuation systmatique
On vient de constater que le modle est donc capable de reconnatre une suite de deux mots comme
second hameon , ce qui est, bien videmment, trs positif et gratifiant. Mais, comme on vient de
le remarquer galement, en outre du (simple) succs de reconnaissance, le modle nous permet de
dcouvrir bien dautres choses encore. laide du modle, nous tudions les mots-candidats qui
jouent un rle important pendant le processus de reconnaissance dun mot seul ou dune suite de
mots ; nous observons que certains mots, ou certaines suites de mots, sont reconnus plus vite, et
dautres plus lentement ; nous mesurons le temps que le modle prend pour reconnatre ces mots ou
ces suites ( savoir le nombre de cycles de simulation, en utilisant la mesure du PI) ; et nous
cherchons dcrire les raisons pour lesquelles le modle prouve de la facilit ou de la difficult.
Mme les checs de reconnaissance du modle, quils soient momentans ou complets (ces derniers
pas trop nombreux, esprons-le), peuvent donc tre utiles.
Dans ce qui suit, nous rsumons les principaux lments et rsultats de notre toute dernire
valuation systmatique du modle (voir Lwy, 2015, pour les dtails et les analyses statistiques).
Dans une premire partie de cette valuation, sur la reconnaissance gnrale du modle, nous avons
utilis 1 000 mots uniques (que nous avons tirs au hasard de notre lexique) ainsi que 1 000 suites
de deux mots (gnres par un programme pseudo-alatoire qui a toujours combin un dterminant
ou adjectif antpos avec un substantif, en observant laccord du genre et en faisant la liaison o
elle sapplique, mais en ignorant la smantique). Chaque mot aprs lautre, et chaque suite de mots
aprs lautre, ont t tests dans le modle (heureusement, nous avons accs des fonctions de
macro). Voici combien en sont reconnus par le modle :
997 des mots uniques sont reconnus si le modle peut savoir quil sagit dun mot unique, et
913 des mots uniques sont reconnus quand le modle ne doit pas le savoir ;
993 des suites sont reconnues si le modle peut savoir quil sagit dune suite de deux mots, et
836 des suites sont reconnues lorsquil ne doit pas le savoir.
Dans la deuxime partie de lvaluation, compose de plusieurs tudes paramtriques de simulation
avec FN5, nous nous sommes assurs que le modle peut rendre compte de certaines variables
propres au mot, ou propres une chane de mots, et de leurs effets sur la reconnaissance humaine.
Nous avons choisi des stimuli qui correspondent deux niveaux dune variable tester (les autres
variables tant contrles) ou nous avons adapt, lorsque cela tait possible, des stimuli tirs dune
tude psycholinguistique exprimentale. En les testant dans le modle, nous avons tabli quil est
capable de simuler les six effets suivants :
les mots courts sont reconnus plus rapidement que les mots longs (effet de la longueur) ;
les mots de haute frquence sont reconnus plus promptement que les mots de basse frquence
(effet de la frquence doccurrence) ;
les mots point dunicit prcoce sont reconnus plus vite que les mots point dunicit tardif
(effet du point dunicit) ;
les mots avec voyelle courte en finale sont reconnus plus tt que les mots avec voyelle longue
en finale (effet de la dure de la voyelle dans le franais de Suisse romande) ;
lorsque des mots sont prononcs avec schwa ils sont reconnus plus rapidement que lorsquils
sont prononcs sans schwa, si pour ces mots leffacement du schwa est facultatif ou interdit
mais non pas quand leffacement est obligatoire (effet de leffacement du schwa) ;
des mots qui se trouvent dans une suite enchane avec liaison sont reconnus plus lentement
que lorsquils se trouvent tout seuls, mais ils sont reconnus tout aussi vite quand ils se trouvent
dans une suite enchane sans liaison (effet de lenchanement avec liaison).
Le modle FN5 est mis disposition des fins de recherche et denseignement acadmiques. Il est
offert en combinaison avec BIMOLA (Lwy et Grosjean, 2008), un modle psycholinguistique
informatique de la reconnaissance des mots parls chez le bilingue, mais on peut se servir de lun ou
de lautre modle, indpendamment.
Notre logiciel tourne sous OS X. Il est tlchargeable sur le site http://www.bimola.ch et sinstalle
vraiment trs facilement et rapidement (contactez-nous si ce nest pas le cas). La seule petite
complication est quil fonctionne en tant quapplication XQuartz, et donc il vous faut tout dabord
installer XQuartz, si ce dernier nest pas dj prsent sur votre Mac ; voir http://www.xquartz.org.
Notons que linterface utilisateur du logiciel peut tre bascule entre le franais et langlais, en
appuyant sur un seul bouton. Par ailleurs, en suivant les quelques instructions qui sont donnes dans
la fentre de dmarrage du logiciel (lancer le modle, charger un lexique, taper le mot ou les mots
reconnatre, etc.), vous mettrez bientt en route vos toutes premires simulations avec FN5.
Pourquoi ne pas commencer par lexemple de second hameon dcrit ci-dessus ?
6.1
tant donn que FN5 est le premier et seul modle psycholinguistique informatique dcrire la
reconnaissance des mots parls chez lauditeur franais, nous esprons quil se rvlera comme un
bon nouvel instrument pour les recherches menes en psycholinguistique sur le franais. On voudra
peut-tre :
sappuyer sur le modle simplement dune manire thorique et lutiliser pour expliquer le
processus gnral de la reconnaissance des mots parls ;
se servir du modle pour interprter les rsultats dune tude exprimentale spcifique ;
chercher reproduire les rsultats dune tude exprimentale en la simulant dans le modle ;
explorer comment les stimuli dune tude se comportent avant mme de mener lexprience ;
valider le comportement du modle avec des tudes exprimentales nouvelles et cibles ;
tester le fonctionnement du modle en modifiant/branchant/bloquant certaines composantes du
modle et en examinant les consquences ;
gnrer de nouvelles prdictions laide du modle qui pourront ensuite tre examines dans
des tudes exprimentales auxquelles on na pas encore pens jusquici.
6.2
Grce sa vitesse et son interface utilisateur graphique, le modle se prte bien la dmonstration
en direct. Il peut donc servir de didacticiel dans des cours et sminaires en sciences du langage,
psycholinguistique, phontique, orthophonie, linguistique informatique, psychologie cognitive, etc.
Il est clair quun modle fonctionnant, prsent en cours dexcution et projet en grand sur un
tableau blanc, est un outil pdagogique trs parlant. Cest sans doute un grand avantage pour lusage
ducatif que ce modle concerne le franais, et que lon peut visualiser lactivation de phonmes et
de mots dans notre langue. Le lexique du modle (avec ses 17 668 mots) se compare trs
favorablement au lexique du fameux modle TRACE (qui navait que quelques centaines de mots).
On se sert, selon ses besoins, de la version franaise ou Suisse romande. On peut soi-mme ajouter
ce lexique tout mot ventuellement manquant que lon dsirerait faire reconnatre. Dans Lwy
(2015), on trouve diverses botes pratiques permettant de se familiariser avec le fonctionnement
dtaill du modle, ainsi que des exemples dont on peut sinspirer pour ses propres simulations.
Une dernire suggestion : laide du bouton Segm. (en haut droite dans linterface), on peut se
faire trouver toutes les manires possibles de segmenter une chane de phonmes en suites de mots
(tout en laissant de ct la syntaxe et smantique). On y voit combien est difficile la tche de
reconnaissance de mots parls !
Rfrences
CONTENT A., MOUSTY P., RADEAU M. (1990). Brulex : une base de donnes lexicales informatise
pour le franais crit et parl. LAnne psychologique 90, 551-566.
CROCKER M. (1996). Computational psycholinguistics: An interdisciplinary approach to the study
of language. Dordrecht, Pays-Bas : Kluwer Academic.
CUTLER A. (2012). Native listening: Language experience and the recognition of spoken words.
Cambridge, MA : MIT Press.
DIJKSTRA T., DE SMEDT K. (eds). (1996). Computational psycholinguistics: AI and connectionist
models of human language processing. Londres : Taylor & Francis.
GRAINGER J., JACOBS A. (eds.). (1998). Localist connectionist approaches to human cognition.
Mahwah, NJ : Erlbaum.
GROSSBERG S., MYERS C. (2000). The resonant dynamics of speech perception: Interword
integration and duration-dependent backward effects. Psychological Review 107, 735-767.
LWY N. (2015). Computational psycholinguistics and spoken word recognition in the bilingual
and the monolingual. Thse de doctorat, Universit de Neuchtel. https://doc.rero.ch/record/257161
LWY N. (2016). Simulating the recognition of isolated and connected words in spoken French:
The FN5 model. Manuscrit en prparation.
LWY N., GROSJEAN F. (2008). The Lwy and Grosjean BIMOLA model. In F. Grosjean, Studying
bilinguals, p. 201-210. Oxford, Angleterre : Oxford University Press.
LWY N., GROSJEAN F., GROSJEAN L., RACINE I., YERSIN C. (2005). Un modle psycholinguistique
informatique de la reconnaissance des mots dans la chane parle du franais. Journal of French
Language Studies 15, 25-48.
MCCLELLAND J., ELMAN J. (1986). The TRACE model of speech perception. Cognitive Psychology
18, 1-86.
NEW B. (2006). Lexique 3 : une nouvelle base de donnes lexicales. Actes de la 13e Confrence sur
le TALN (Traitement Automatique des Langues Naturelles), 892-900. Louvain, Belgique : ATALA.
NORRIS D. (1994). Shortlist: A connectionist model of continuous speech recognition. Cognition 52,
189-234.
NORRIS D., MCQUEEN J. (2008). Shortlist B: A Bayesian model of continuous speech recognition.
Psychological Review 115, 357-395.
RACINE I., GROSJEAN F. (2005). Le cot de leffacement du schwa lors de la reconnaissance des
mots en franais. Canadian Journal of Experimental Psychology 59, 240-254.