THAnneTORTEL Versionfinale

DOCTORAT Aix-Marseille Universit Universit de Provence U.F.R.
. LACS - Formation Doctorale : Cognition, Langage, Education Discipline : PHONETIQUE ANGLAISE N bibliothque : -------------------------------------------
THESE DOCTEUR DAIX-MARSEILLE UNIVERSITE

Prsente et soutenue publiquement le 7 dcembre 2009 par tel-00455248, version 1 - 9 Feb 2010 pour obtenir le grade de
Anne TORTEL
EVALUATION QUALITATIVE DE LA PROSODIE DAPPRENANTS FRANCAIS : APPORT DE PARAMETRISATIONS PROSODIQUES

sous la direction de
Monsieur Daniel HIRST

Directeur de recherche, CNRS, UMR 6057 Laboratoire Parole et Langage Universit de Provence ______________________________________________ JURY RAPPORTEURS : Monsieur Philip Carr, Professeur, Universit de Montpellier III Monsieur Jean-Yves Dommergues, Professeur, Universit de Paris VIII, St Denis EXAMINATEURS : Monsieur Nicolas Ballier, Professeur, Universit de Paris VII Madame Nadine Herry-Benit, Matre de confrences, Universit de Paris VIII, St Denis Monsieur Laurence White, Research fellow, Universit de Bristol, UK
tel-00455248, version 1 - 9 Feb 2010
DOCTORAT Aix-Marseille Universit - Universit de Provence U.F.R. LACS - Formation Doctorale : LANGAGE ET PAROLE Discipline : PHONETIQUE ANGLAISE
THESE DOCTEUR DAIX-MARSEILLE UNIVERSITE

Prsente et soutenue publiquement le 7 dcembre 2009 par pour obtenir le grade de
Anne TORTEL
tel-00455248, version 1 - 9 Feb 2010
EVALUATION QUALITATIVE DE LA PROSODIE DAPPRENANTS FRANCAIS : APPORT DE PARAMETRISATIONS PROSODIQUES
Monsieur Daniel HIRST

Directeur de recherche, CNRS, UMR 6057 Laboratoire Parole et Langage Universit de Provence ______________________________________________ JURY RAPPORTEURS : Monsieur Philip Carr, Professeur, Universit de Montpellier III Monsieur Jean-Yves Dommergues, Professeur, Universit de Paris VIII, St Denis EXAMINATEURS : Monsieur Nicolas Ballier, Professeur, Universit de Paris VII, Madame Nadine Herry-Benit, Matre de confrences, Universit de Paris VIII, St Denis Monsieur Laurence White, Research fellow, Universit de Bristol, UK 3
sous la direction de
tel-00455248, version 1 - 9 Feb 2010
A mon oncle, qui aurait srement aim voir a , A mes parents, A Chacha
Remerciements
Je tiens, parmi toutes les personnes qui ont contribu laboutissement de ce travail de thse, remercier tout particulirement : Les membres du jury, Jean-Yves Dommergues et Phil Carr, qui ont accept, en tant que rapporteurs, de lire et de juger ce travail dans un court dlai, en dpit du surplus de travail que cela implique ; Mes examinateurs, Nadine Herry-Bnit, Nicolas Ballier et Laurence White, pour avoir manifest leur intrt pour ce travail, et lavoir enrichi par de prcieux conseils ; Mon directeur, Daniel Hirst, dont la recherche a inspir ce travail. Merci pour tous tes conseils, ton soutien, ton coute et ton humour irremplaable qui mont accompagne pendant ces annes de recherche ;
tel-00455248, version 1 - 9 Feb 2010
Mes collgues, Membres du LPL et leur directeur Philippe Blache, pour mavoir accueillie au sein du laboratoire en moffrant des conditions de travail plus quidales. Merci tout particulirement : Alain, Stphane, Thierry, Robert, Isabelle, Jolle, Armelle, Bernard, pour votre aide et votre disponibilit de tous les instants ; Cyril et Sbastien, pour mavoir supporte pendant toutes ces heures denregistrements et pour avoir pris le risque de me laisser manipuler le matriel toute seule ! Merci pour laide indispensable que vous mavez apporte et le temps que vous mavez consacr ; La bande de joyeux lurons, mes chers doctorants, Amandine, Cline, Francesco, Ccile, Lo, Pauline, Vincent, Cline, Haydee, Jean-Phi, sans qui ce travail naurait pas la mme saveur ; et mes anglophones prfres, Kizzi et Oriana, un grand merci pour leur soutien ; Mes sujets, pour labngation avec laquelle ils ont prt leur corps la science ; Mes collgues du B106 ! Valrie, Sophie, Mireille, Gabor, Isabelle, Peter, Laetitia, Quelle belle exprience vous mavez offerte ! Vous mavez permis de raliser ma passion tout en me faisant confiance ; Les secrtaires du dpartement danglais, Monique, Sylvie, Sandrine, Jocelyne et leur boss Jean-Franois pour avoir accept trs courageusement de participer mes tests danglais ; Mes nouveaux collgues de Paris 8, pour laccueil chaleureux et lattention que jai reus dbarquant de ma Provence .
Laetitia et Lisa-Marie, les brunettes corses incontournables de mon parcours. Merci pour votre prsence (mme distance !) et votre soutien ; Mireille, pour ton coute, ton attention, et ces innombrables papotages merci pour ces nombreuses heures de sport qui nous ont permis de nous dfouler avec acharnement; Poupchou, miss script, pour ton aide toute preuve, tes bonnes soupes, et ces innombrables jus de fruits, rendez-vous immanquables de notre quotidien ! Amandine, mon allophone ! Il y en aurait tellement dire ! Et ce nest que le dbut ! fous rires, potins, colres, dprimes, joies, merci pour tous ces moments partags ; Mes amis, que jai grandement ngligs dernirement ; Didou, sans toi cette thse nexisterait pas. Tu es lessence de ce travail, mayant envoute de phontique ! Merci pour ton aide inestimable, tes conseils, ton soutien et pour mavoir transmis tellement de force et dondes positives. Tu as toujours gard un il sur moi ; tu as suivi chacun de mes pas depuis ces dix dernires annes. Merci pour ces changes si riches. Merci pour avoir toujours t l quand il le fallait ;
tel-00455248, version 1 - 9 Feb 2010
Et enfin, Mes frres & Mes parents, qui ont toujours cru en moi, qui ont toujours tout mis en uvre pour me permettre de russir. Votre dvotion et votre rconfort mont porte jusquau bout de ce travail. Vous avez fait bien plus que ce qui tait possible pour que jen sois ici aujourdhui.
Table des matires

REMERCIEMENTS ....................................................................................................................................... 5 TABLE DES MATIERES .............................................................................................................................. 7 TABLE DES FIGURES ................................................................................................................................ 13 TABLE DES TABLEAUX ............................................................................................................................ 15 AVANT-PROPOS ......................................................................................................................................... 16 INTRODUCTION ......................................................................................................................................... 18 CHAPITRE 1. INTRODUCTION A LA NOTION DE RYTHME & CLASSIFICATION RYTHMIQUE ............................................................................................................................................... 26 1.1 PRESENTATION GENERALE ............................................................................................................ 28
tel-00455248, version 1 - 9 Feb 2010
1.1.1 INTRODUCTION ET DEFINITION ............................................................................................................ 28 1.1.2 RYTHME : SYSTEME ORGANISATEUR DE LA PROSODIE ........................................................................ 30 1.1.3 LE RYTHME : LA BETE NOIRE DE LAPPRENANT ? ................................................................................ 32 1.2 LE RYTHME DE LA PAROLE ............................................................................................................ 34 1.2.1 ISOCHRONIE ........................................................................................................................................ 35 plus ou moins isochrone........................................................................................................ 36 Dune isochronie pure une isochronie subjective.................................................................. 37 1.2.2 CLASSIFICATION DES LANGUES : EVOLUTION DU CONCEPT ................................................................. 40 Thorie des langues isoaccentuelles/isosyllabiques ................................................................. 40 Variantes de la classification. .................................................................................................. 43 vers un continuum rythmique ................................................................................................ 44 Coexistence rythmique : tudes inter-dialectales ..................................................................... 47 1.2.3 PROPOSITIONS DE METRIQUES RYTHMIQUES ...................................................................................... 48 Ramus & al. (1999) .................................................................................................................. 48 Low & al. (2000) ...................................................................................................................... 50 Remarques comparatives et limites des deux tudes proposes ............................................... 55
Mtriques rythmiques et tempo: nouvelles propositions .......................................................... 56 Application des mtriques: discrimination L1/L2 .................................................................... 58 SYNTHESE.................................................................................................................................................... 62 CHAPITRE 2. ACQUISITION DUNE LANGUE .................................................................................... 65 2.1 INTRODUCTION GENERALE ............................................................................................................ 67 2.1.1 LANGAGE : DEFINITIONS ..................................................................................................................... 67 2.1.2 ORIGINE DU RYTHME DANS LE LANGAGE : HORLOGE INTERNE ........................................................... 68 2.2 ACQUISITION DE LANGLAIS LANGUE MATERNELLE (L1) ................................................... 69 2.2.1 INTRODUCTION GENERALE : LE STATUT DE LA PROSODIE DANS LACQUISITION DU LANGAGE ............ 69 2.2.2 ACQUISITION DU RYTHME DE LA LANGUE MATERNELLE ..................................................................... 70 Perception rythmique du ftus ................................................................................................. 71
tel-00455248, version 1 - 9 Feb 2010
Elments neurophysiologiques ..................................................................................................... 71 Approche exprimentale ............................................................................................................... 72
Emergences de structures sonores ........................................................................................... 73

Rythme dans les cris enfantins ...................................................................................................... 73 Perception du nouveau n ............................................................................................................. 74
Vocalisation et babillage .......................................................................................................... 77

Renforcement de la structure rythmique ....................................................................................... 77 Prosodie : structure daccueil ........................................................................................................ 79
Acquisition de la structure rythmique ...................................................................................... 79

Acquisition de laccent ................................................................................................................. 80 Indices prosodiques la structuration des noncs ....................................................................... 81
2.3 ACQUISITION DE LANGLAIS LANGUE SECONDE (L2) CHEZ LADULTE .......................... 82 2.3.1 INTRODUCTION GENERALE : LE STATUT DE LA PROSODIE DANS LAPPRENTISSAGE DUNE LANGUE
SECONDE
............................................................................................................................................ 82
2.4 ACQUISITION DU RYTHME DE LA LANGUE SECONDE ........................................................... 86
Analyse et constat ..................................................................................................................... 86 Approches pdagogiques dans lenseignement L2 ................................................................... 87

Approche acadmique .................................................................................................................. 87 Approche quasi traditionnelle ..................................................................................................... 87 Travail de la prononciation par le rythme ..................................................................................... 88 Approches non conventionnelles .................................................................................................. 89
2.5 PROBLEMES PARTICULIERS LIES A LAPPRENANT................................................................ 90 Contraintes extra-linguistiques ................................................................................................ 90 Contraintes physiologiques ...................................................................................................... 91
tel-00455248, version 1 - 9 Feb 2010
L1 source dinfluence de la L2 ................................................................................................. 92

Crible et Interfrence .................................................................................................................... 92 Transfert et Interlangue................................................................................................................. 93 Interlangue et transfert prosodique ............................................................................................... 96
Approches lectroniques non conventionnelles : la perception au cur du problme ............. 98

SUVAGs : Systme Universel-Verbo-Auditif-Guberina .............................................................. 99 Loreille lectronique ............................................................................................................ 100 I-LANG : approche neurolinguistique ........................................................................................ 101
SYNTHESE.................................................................................................................................................. 105 CHAPITRE 3. PROSODIE ET MULTIMEDIA : PROBLEMES DEVALUATION ......................... 107 3.1 LES LOGICIELS DAPPRENTISSAGE DE LA PROSODIE DE LANGLAIS ........................... 109 3.1.1 INTRODUCTION ................................................................................................................................. 109 3.1.2 CONSTAT .......................................................................................................................................... 110 Historique sommaire de lvolution de la visualisation de lintonation ................................. 110
Premires tentatives .................................................................................................................... 110 Visualisation de la courbe mlodique ......................................................................................... 111
Nouvelles technologies : phontique et multimdia.................................................................... 111
3.2 APPORTS DES LOGICIELS DE LANGUES .................................................................................... 124 Utilit dans lapprentissage de la prosodie ............................................................................ 124 Lapprenant au cur de loutil ............................................................................................... 125 Feedback pdagogique ........................................................................................................... 126 Limites de loutil multimdia .................................................................................................. 128 3.3 LEVALUATION PROSODIQUE EN L2 .......................................................................................... 129 Dfinitions et concepts ........................................................................................................... 129 propositions de critres ?................................................................................................... 131
tel-00455248, version 1 - 9 Feb 2010
La synthse de parole ............................................................................................................. 136 3.4 CONCLUSION ...................................................................................................................................... 136 SYNTHESE.................................................................................................................................................. 138 CHAPITRE 4. CONSTITUTION ET EXPLOITATION DUNE BASE DE DONNEES : ANGLISH 143 4.1 REMARQUES PRELIMINAIRES ...................................................................................................... 145 4.2 ORIGINE DU CORPUS ANGLISH .................................................................................................... 148 4.2.1 CORPUS DE BASE : EUROM 1 ............................................................................................................. 148 4.2.2 DESCRIPTION DU CORPUS EUROM 1 .................................................................................................. 148 Eurom 1 : corpus anglais ....................................................................................................... 149 4.2.3 ENRICHISSEMENT DU CORPUS EUROM 1 (CORPUS ANGLAIS) ............................................................. 149 Etat des lieux .......................................................................................................................... 149 Contributions personnelles : extension du corpus EUROM 1 ................................................ 150 4.4 ANGLISH : CREATION DUN CORPUS ANGLAIS L1 & L2 ....................................................... 152 4.4.1 CHOIX, REFLEXIONS ET EXIGENCES .................................................................................................. 152 ANGLISH : corpus, base de donnes ? .................................................................................. 152 Parole de laboratoire vs parole spontane vers parole naturelle .......................................... 154 Focus sur loral ...................................................................................................................... 155
10
Varits des genres ................................................................................................................. 156 Varits des niveaux dapprentissage des locuteurs .............................................................. 156 Qualit technique du corpus ................................................................................................... 156 4.4.2 ANGLISH : DESCRIPTION DU CORPUS ............................................................................................. 157 De Eurom 1 ANGLISH : choix des textes et prparation des stimuli .................................. 157 Contenu de la base de donnes............................................................................................... 159
Lecture ........................................................................................................................................ 159 Rptition ................................................................................................................................... 160 Monologue .................................................................................................................................. 161
tel-00455248, version 1 - 9 Feb 2010
Locuteurs ................................................................................................................................ 162 Codage du corpus ................................................................................................................... 163 Accessibilit du corpus ANGLISH .......................................................................................... 164 4.4.3 TRANSCRIPTIONS DU CORPUS............................................................................................................ 164 Transcription orthographique ................................................................................................ 164 Transcription phonmique...................................................................................................... 165 Alignement acoustique manuel ............................................................................................... 166 4.5 PERSPECTIVES ................................................................................................................................... 168 SYNTHESE.................................................................................................................................................. 170 CHAPITRE 5. ANALYSES EXPERIMENTALES ................................................................................. 172 5.1 PROBLEMATIQUE ET OBJECTIFS ................................................................................................ 173 5.2 METHODOLOGIE ............................................................................................................................... 175 5.2.1 BASE DE DONNEES ............................................................................................................................ 175 5.2.2 CALCUL ET OBTENTION DES METRIQUES ........................................................................................... 177 5.3 ANALYSES STATISTIQUES.............................................................................................................. 179 5.3.1 CARACTERISATION DES GROUPES DE 3 NIVEAUX .............................................................................. 179 5.3.2 ANALYSES DES METRIQUES RYTHMIQUES : DISTINCTION L1/L2 ....................................................... 182
11
V, C,%V (Ramus & al., 1999) .............................................................................................. 183 PVI (Grabe & Low, 2002) .......................................................................................................... 186 cvC,cvV (Dellwo, 2006 ; White & Mattys, 2007). ..................................................................... 189
5.3.3 ESSAI DE PARAMETRISATION RYTHMIQUE : RECHERCHE DE COMBINAISONS PAR SVM .................... 193
Analyse un facteur ................................................................................................................... 194 Analyse combinatoire deux facteurs ........................................................................................ 195 Analyse combinatoire trois facteurs ......................................................................................... 196 Analyse combinatoire quatre facteurs ...................................................................................... 197
5.4 DISCUSSION ET CONCLUSION ...................................................................................................... 198 5.4.1 INFLUENCE DE LA L1 SUR LA L2 ? .................................................................................................... 198
tel-00455248, version 1 - 9 Feb 2010
5.4.2 DISCRIMINATION A PARTIR DES CRITERES RYTHMIQUES ................................................................... 200 CONCLUSION ET PERSPECTIVES....................................................................................................... 205 RFRENCES ............................................................................................................................................ 211
12
Table des figures

Figure 1.Axe reprsentant le degr d'importance de l'accent dans diffrentes langues (Dauer, 1983:60) .................................................................................................................................................. 45 Figure 2. Valeurs du PVI pour les 18 langues (tir de Grabe & Low, 2002:22) .......................... 54 Figure 3. Illustration des appareils SUVAGs en 1961 puis 2000 ................................................... 99 Figure 4. Illustration des modalits de la communication et fonctionnement crbral............102 Figure 5. Exemple de reprsentation graphique propose dans le logiciel SaRP ......................113 Figure 6. Proposition de feedback par affichage de loscillogramme (Voicebook, 1998) ........116 tel-00455248, version 1 - 9 Feb 2010 Figure 7. Proposition de feedback par affichage de la courbe d'amplitude (Wincecil, 1997) ..116 Figure 8. Feedback visuel des mots present vs present avec comparaison des productions natif/apprenant selon les contours intonatifs. ................................................................................119 Figure 9. Feedback visuel des mots present vs present avec comparaison des productions natif/apprenant (rythme/intensit) ..................................................................................................119 Figure 10. Illustration du feedback explicatif des points saillants travailler par l'apprenant .120 Figure 11. Exemple de feedback visuel du logiciel Winpitch LTL, .............................................121 Figure 12. Exemple de feedback de la production d'un apprenant (en bas) compare celle d'un natif (en haut), http://www.lpl.univ-aix.fr/~lpldev/prosodia............................................122 Figure 13. Illustration d'une fentre du logiciel SWAMS ..............................................................123 Figure 14. Exemple de TextGrid d'annotation extrait dANGLISH effectu dans PRAAT ..167 Figure 15. Exemple de segmentation en CVC................................................................................177 Figure 16. Reprsentation graphique de l'analyse discriminante des 1260 phrases produites par les 63 locuteurs ....................................................................................................................................180
Figure 17. Visualisation des points de dispersion (gauche) et des erreurs-types (droite) selon le plan (V, C) .180 Figure 18. Visualisation des points de dispersion (gauche) et des erreurs-types (droite) selon le plan (%V,C) ..182 Figure 19. Visualisation des points de dispersion (gauche) et des erreurs-types (droite) selon le plan (rPVI_V, rPVI_C) 184 Figure 20. Visualisation des points de dispersion (gauche) et de erreurs-types (droite) selon le plan (nPVI_V,nPVI_C)..185 Figure 21. Visualisation des points de dispersion (gauche) et des erreurs-types (droite) selon le plan (rPVI_C,nPVI_V).186 tel-00455248, version 1 - 9 Feb 2010 Figure 22. Visualisation des points de dispersion (gauche) et des erreurs-types (droite) selon le plan (cvV,cvC)..187 Figure 23. Visualisation des points de dispersion (gauche) et des erreurs-types (droite) selon le plan (%V,cvV)..188 Figure 24. Visualisation des points de dispersion (gauche) et des erreurs-types (droite) selon le plan (%V, cvC )189 Figure 25. Visualisation des points de dispersions (gauche) et des erreurs-types (droite) selon le plan (C,cvC)..192
14
Table des tableaux

Tableau 1. Rcapitulation des principales diffrences des proprits structurelles rythmiques 34 Tableau 2. Classement des diffrentes langues selon leur classe rythmique................................. 44 Tableau 3. Langues tudies dans les travaux de Grabe & Low (tir de Grabe & Low (2002: 13): Traditional Rhythmic classifications of languages investigated in the present study ..... 51 Tableau 4. Rpartition des enregistrements des passages par locuteur (corpus EUROM 1) ..149 Tableau 5. Rcapitulation des diffrentes mtriques utilises pour notre tude ........................174 Tableau 6. Mthode de calcul des 9 paramtres rythmiques ........................................................178 tel-00455248, version 1 - 9 Feb 2010 Tableau 7. Extrait des donnes de sortie obtenues par le script "calculate_rhythm_metrics" 179 Tableau 8. Prsentation des rsultats des prdictions des diffrentes classes (FR1/FR2/GB), (en haut, valeurs brutes ; en bas, valeurs exprimes en pourcentage) .........................................181 Tableau 9. Prsentation des donnes de sortie d'une analyse SVM - une discrimination un paramtre..............................................................................................................................................194 Tableau 10. Prsentation des rsultats des meilleures combinaisons deux facteurs ..............195 Tableau 11. Prsentation des rsultats des meilleures combinaisons trois facteurs ...............196 Tableau 12. Prsentation des rsultats des meilleures combinaisons quatre facteurs ............197 Tableau 13. Rcapitulatif des diffrentes mtriques prsentes en fonction de la tche de discrimination vise ............................................................................................................................201 Tableau 14. Rcapitulatif des meilleures prdictions pour chacune des combinaisons factorielles ............................................................................................................................................202 Tableau 15. Prsentation des prdictions obtenues par l'analyse SVM des mtriques exposes dans la littrature .................................................................................................................................203
AVANT-PROPOS
Nous faisons ici une premire remarque concernant les conventions dcriture puis par la suite nous claircissons quelques notions cls utilises tout au long de ce travail. Au cours de cette rdaction, nous avons choisi, pour une question de lisibilit et de respect des conventions, de ne citer que le premier auteur dun travail ds lors que celui-ci impliquait plus de deux collaborateurs. La rfrence se prsente alors dans le texte sous la forme de 1er auteur et al. (date) []. La seconde dmarche de cet avant-propos consiste clarifier la terminologie communment utilise dans ce travail. tel-00455248, version 1 - 9 Feb 2010 Acquisition/ apprentissage Lorigine latine du mot acqurir renvoie acquaerere qui signifie ajouter ce qui existe dj (Le Robert, 2000 :28). Krashen (1981) distingue deux champs notionnels quil dsigne comme second-language acquisition et second-language learning . Il dfinit lacquisition comme le processus inconscient qui mne lutilisation spontane de la langue, et lapprentissage comme le processus conscient qui conduit la connaissance des rgles dune langue. A partir de cette distinction, nous utilisons le terme acquisition lorsque le contexte est celui de la langue maternelle ; en revanche, dans le cadre de lapprentissage dune langue trangre, nous utilisons respectivement les deux termes car nous pensons que les deux notions se rejoignent au niveau du rsultat obtenu, dans la mesure o lapprentissage (guid ou non guid) reprsente le moyen datteindre le stade dacquisition. Langue trangre/ langue seconde Dans ce travail de thse, les deux vocables sont utiliss pareillement. Nanmoins, notons que les termes langue trangre et langue seconde se distinguent lun de lautre et sutilisent selon un contexte prcis. Cuq (2003) dfinit la langue seconde comme une langue parle ltranger et possdant un statut particulier. Par exemple, pour langlais, on pourra citer le cas des pays africains o langlais nest pas la langue maternelle, mais son usage a une fonction principalement administrative, langlais ntant
ni la langue maternelle ni une langue trangre comme en France. Il en est de mme, par exemple, pour la langue franaise dans les pays du Maghreb. La langue seconde est utilise comme langue denseignement partir dun certain niveau et permet laccession un niveau social plus lev. Par contraste, la langue trangre est une langue non maternelle, apprise en milieu scolaire. Appliqu la situation des apprenants francophones adultes, lapprentissage est la fois guid (cadre scolaire, universitaire, associatif) et libre (discussions avec des natifs, visionnage de films en version originale etc.). La distinction entre ces deux termes nest pas pertinente. L1/L2 Nous utilisons les abrviations L1 et L2. L1 correspond la langue maternelle ou la langue premire, tandis que L2 est utilise pour rfrer la langue seconde, langue tel-00455248, version 1 - 9 Feb 2010 trangre ou encore la langue cible. Intelligibilit/comprhensibilit Nous distinguons les deux termes de la manire suivante : lintelligibilit reprsente la capacit reconnatre, distinguer un mot, une phrase, tandis que la comprhensibilit indique la capacit capter la signification de ce mot ou de cette phrase. Ainsi selon Field (2005), lintelligibilit est perue comme une qualit premire dune production dun apprenant L2, ncessaire afin datteindre un niveau ais de comprhensibilit du discours par linterlocuteur. Bien souvent, ces deux termes ne sont pas distingus et apparaissent comme synonymes. Dans cette tude, nous considrons que le terme intelligibilit est un facteur fondamental qui facilite la comprhensibilit du discours.
17
Introduction
Le but premier pour tout apprenant dune L2 est, bien videmment, de pouvoir sexprimer, mais surtout de se faire comprendre par les locuteurs natifs de cette langue. Or un accent tranger peut quelquefois faire entrave cet objectif. Plusieurs tudes (Anderson-Hsieh et al., 1992 ; Munro et Derwing, 1995, 1998 ; Jilka, 2000 ; Hardison, 2004) ont montr que la prosodie jouait un rle important dans lintelligibilit et la comprhensibilit du discours non natif. Cela ne semble pas surprenant car, comme le montre Konopczynski (1999) par son modle dIntonologie Dveloppementale Interactive (I.D.I.)1, toute imprgnation naturelle avec une langue trangre se fait dabord par ses lments prosodiques qui constituent une vritable structure daccueil de tous les autres tel-00455248, version 1 - 9 Feb 2010 lments de la parole (Konopczynski, 1999 :68). Le systme phonologique vient donc sorganiser lintrieur des schmas rythmiques et intonatifs. Cependant, avec leffet de lge, il devient difficile pour lapprenant que ses productions L2 ne soient pas influences par sa langue maternelle. La L1 apparat comme source dinfluence et provoque des interfrences auditives avec la L2. Le contact (Lado, 1957) entre les deux langues (L1 & L2) est rendu responsable des erreurs observables chez les apprenants, en raison des transferts quils oprent de la langue maternelle sur la langue cible. Ds lors, plus les mauvaises habitudes sont ancres, plus la tche dapprentissage de la prosodie devient ardue. Ces phnomnes tant inconscients, il est important de les extrioriser et de les rendre observables et accessibles pour lapprenant. Les technologies multimdia pourraient tre dune grande utilit dans la rducation prosodique ; elles semblent tre un outil adapt pour un travail de loral, alliant son et image, permettant lutilisateur de prendre conscience de ses diffrences de production avec celles dun natif. Bongaerts (1999) note plusieurs facteurs pouvant aider lamlioration des productions des locuteurs L2 : (i) une grande motivation pour raliser naturellement les accents lexicaux (ii) un accs illimit lcoute de la langue cible
Driv du concept dIntonologie Dveloppementale introduit par Crystal (1976), IDI introduit les aspects psycho-phonologiques et prosodiques de la conversation adulte-enfant dans une perspective dveloppementale. Cest une analyse qui prend en compte les productions de lenfant, de ladulte et leurs effets sur le comportement vocal et verbal de lenfant et sur son volution.
(iii) un entranement intense la perception et production de la L2.
Ces caractristiques conduisent de nouveau penser que les technologies multimdia constituent un moyen idal lentranement et lamlioration des productions L2 (Hincks & Edlund, 2009 ; Tanner & Landon, 2009).
Depuis quelques annes maintenant, les logiciels de langue sont en nombre croissant. Un intrt grandissant a t accord ces nouvelles mthodes multimdia grce aux progrs importants raliss dans les technologies de la parole. Nombreux sont les logiciels qui se focalisent sur lentranement de la prononciation au niveau segmental, mais un petit nombre accorde une place aux caractristiques prosodiques ainsi qu leur valuation. Les tches raliser se concentrent sur la syllabe, le syntagme, la phrase tant tel-00455248, version 1 - 9 Feb 2010 lunit maximale propose. La composante quest lvaluation reprsente le point central des critiques de ces nouveaux outils multimdia et peu dtudes ont t ralises ce sujet. En effet, lorsquon sintresse de prs ces logiciels, le premier constat est le manque vident de feedback, bas sur des critres acoustiques objectifs, qui pourrait aider lutilisateur progresser et corriger ses erreurs. Leur intrt pdagogique est alors vivement remis en question (Cazade, 1999 ; Santacroce, 2002), mettant en avant le manque dvaluation propose lapprenant qui se voit confront linterprtation doscillogrammes ou de courbes mlodiques difficilement interprtables sans laide dun spcialiste. Neri et al. (2002) observent quune majeure partie du problme vient du fait que, bien souvent, beaucoup de logiciels, produits commerciaux ont favoris et opt pour les nouveauts technologiques au dtriment de la valeur pdagogique. De nombreuses perspectives de recherche sont donc envisager afin de pallier labsence de feedback.
Problmatique : Cest ce manque dtudes portant sur lvaluation de critres prosodiques objectifs dans lapprentissage de langlais L2 par des apprenants franais qui a motiv le choix de cette recherche. Par ailleurs, une seconde motivation lorigine de ces travaux repose sur lide que la prosodie doit tre la base de lenseignement dune langue seconde, et non en arrire-plan, celle-ci tant le pivot du langage verbal. Lenseignement des structures 19
prosodiques doit se faire simultanment celui des traits segmentaux et ne devrait pas tre optionnel , contrairement ce qui se pratique lheure actuelle. Le but de la prsente thse est llaboration dun systme dvaluation des traits prosodiques des francophones qui parlent anglais afin den dgager des paramtres acoustiques objectifs intgrables dans un logiciel de langue. Si ce champ dtudes suscite de plus en plus dintrt (Dodane & Konopczynski, (2001) pour le FLE, Minematsu & al., (1999), entre autres pour les apprenants japonais), peu dtudes (Herry & Hirst, 2002 ; Poqulin, 2009) ont t menes concernant les francophones dont la L2 est langlais. Ce domaine ouvre la voie de nombreux travaux. Les travaux proposs dans cette recherche tentent de relier les recherches menes en prosodie avec lenseignement de celle-ci en L2. Afin de cibler les traits prosodiques errons des apprenants, il est indispensable dexploiter et dappuyer nos travaux sur une base de donnes orales comparatives de tel-00455248, version 1 - 9 Feb 2010 francophones parlant anglais et de natifs anglophones. Or, notre connaissance, une telle base de donnes ne semble pas exister ou est difficilement accessible librement par la communaut. Un premier problme se pose alors nous : constituer une telle base de donnes, suffisamment consquente, afin de pouvoir par la suite, partir des donnes recueillies, laborer des critres dvaluation prosodique. Objectifs : Les objectifs de cette recherche vont donc tre (i) en amont de propositions de critres valuatifs, llaboration dune importante base de donnes danglais L1 & L2, (ii) partir de laquelle pourra tre tablie la recherche de paramtres acoustiques prosodiques. Le cadre dtude pour cette recherche concerne donc la langue maternelle, le franais, et la langue en apprentissage, langlais, dans une situation o (i) le dsquilibre, entre le systme matris et le systme en construction, reste consquent (groupe dadultes de niveau faible) et (ii) lcart entre les deux systmes nest pas aussi important (groupe dapprenants universitaires anglicistes). La mthode utilise est une mthode comparative des traits prosodiques par la constitution dun groupe contrle de natifs anglophones. Le sujet dtude cible donc lapprenant francophone en parcours universitaire, ainsi que des franais adultes, dsireux de se remettre langlais. Lapprenant se situe au cur de cette recherche, car, sans lui ce travail naurait pas lieu dtre, mais cest aussi pour lui que
20
ce travail existe. En tant quenseignant, il est ais dobserver la difficult face laquelle lapprenant franais est confront lorsquil parle dans une autre langue. La gne et la honte qui sont prouves lide de sexprimer dans une langue trangre empchent bien souvent dtablir un change. La tche de lapprenant est dentrer dans une organisation prosodique trangre et dtre capable de se crer une infrastructure diffrente de celle utilise dans sa langue maternelle. Enfin, lobjet de cette recherche est la prosodie2, et plus particulirement le rythme des productions de francophones en anglais. Ltude des lments suprasegmentaux de la ralisation des apprenants permettra de cibler les infractions des traits prosodiques qui entranent une distorsion caractristique dun accent tranger, ou qui sont lorigine dune incomprhension dans le discours. Le choix des paramtres acoustiques rythmiques retenus, bass sur le dveloppement de nouvelles mtriques, est explicit dans le tel-00455248, version 1 - 9 Feb 2010 chapitre 1. Enfin, labsence de prise en compte des traits intonatifs dans ce travail ne signifie en aucun cas quils sont moins importants et ou quils sont tout simplement ignors. Au contraire, nous pensons que les structures intonatives et rythmiques (ainsi que les autres composants tels que les pauses, le tempo etc.) sont profondment associes pour former un tout quest la prosodie. Cependant, lintonation fait appel un autre niveau de structuration qui ne fait pas lobjet de cette recherche mais ncessite dtre galement exploite pour complter les paramtres valuatifs observables.
Plan de la thse : Ce travail de recherche se scinde en deux grandes parties : la section 1, qui traite des aspects thoriques de notre sujet et la section 2, qui prsente les tudes exprimentales menes ainsi que les rsultats obtenus.
La prosodie est dfinie comme une branche de la linguistique consacre la description (aspect phontique) et la reprsentation formelle (aspect phonologique) des lments de l'expression orale tels que les accents, les tons, l'intonation et la quantit, dont la manifestation concrte, dans la production de la parole, est associe aux variations de la frquence fondamentale (f0), de la dure et de l'intensit (paramtres prosodiques physiques), ces variations tant perues par l'auditeur comme des changements de hauteur (ou de mlodie), de longueur et de sonie (paramtres prosodiques subjectifs). La prosodie permet de distinguer loral de lcrit (Di Cristo, 2000).
21
Le chapitre 1 est consacr la notion de rythme, dans lequel sont proposes une dfinition et une description de cette notion. Puis, au travers des deux langues tudies, sont exposes une prsentation de lhistorique de la classification des langues ainsi que les dernires tudes menes dans ce cadre. Cela nous permet dtudier le fonctionnement des deux langues en question, mettant en avant les principales diffrences qui les opposent et les caractristiques propres chaque langue ; nous pourrons ainsi fonder les hypothses nonces dans lanalyse exprimentale. Le chapitre 2 prsente les diffrentes tapes de lacquisition du rythme de la langue maternelle dans la toute premire priode de vie du nourrisson, puis, dans une seconde partie nous aborderons les diffrents moyens mis en uvre dans le cadre de lenseignement de la prosodie, et particulirement du rythme. Ce chapitre permet dexposer lacquisition tel-00455248, version 1 - 9 Feb 2010 du systme prosodique de la langue maternelle et ses implications pour lapprentissage dune L2, et ainsi de comprendre les difficults auxquelles lapprenant est confront lors de lapprentissage dune autre langue. Le chapitre 3 propose un tat des lieux des diffrents outils multimdia disponibles actuellement, incluant les systmes dvaluation proposs lors de lutilisation de ces logiciels. Sont galement prsents les derniers travaux sur lvaluation de langlais, rcemment entrepris chez les apprenants non francophones. Cest partir du constat ngatif dun manque vident de feedback que la proposition des critres valuatifs objectifs est ncessaire. Le chapitre 4 dtaille les diffrentes tapes qui ont abouti la constitution dune base de donnes orales de langlais L1 & L2, nomme ANGLISH. Sont exposs le protocole dexprimentation ainsi que les diffrentes annotations et segmentations apportes aux donnes. Ce corpus dapprenants nous permet dvaluer les diffrences rythmiques entre les apprenants franais et les natifs anglophones. Le chapitre 5 dfinit le protocole exprimental des analyses des facteurs rythmiques bases sur les diffrentes mtriques (exposes dans le chapitre 1) et prsente les diffrents rsultats obtenus pour llaboration de paramtres valuatifs.
22
tel-00455248, version 1 - 9 Feb 2010
23
tel-00455248, version 1 - 9 Feb 2010
Section 1. Aspects thoriques
24
tel-00455248, version 1 - 9 Feb 2010
25
tel-00455248, version 1 - 9 Feb 2010
CHAPITRE 1. INTRODUCTION A LA NOTION DE

RYTHME & CLASSIFICATION RYTHMIQUE
Seul le rythme provoque le court-circuit potique et transmue le cuivre en or, la parole en verbe
Ethiopiques, Lopold Sdar Senghor (post-face, p.111, Seuil)
tel-00455248, version 1 - 9 Feb 2010
1991 by Chronicle Features, from Fromkin & Rodman (1998)
Ce premier chapitre est consacr au cadre gnral dans lequel sinscrit ce travail. La premire partie de ce chapitre propose une familiarisation la notion de rythme et tente de dgager une dfinition du rythme (la tche ntant pas aise tant donn les divergences de points de vue et la complexit du phnomne rendre compte) en indiquant par ailleurs sa place et fonction au sein de la prosodie. Dans un second temps, nous abordons le concept disochronie qui conduit au dbat de la classification des langues en fonction de leurs caractristiques rythmiques, fortement remis en question dans la littrature. Les approches alternatives rcentes sont alors dcrites et serviront de point dancrage la partie exprimentale.
27
1.1 Prsentation gnrale

Pour aborder cette notion de rythme, il est propos dans cette partie une prsentation gnrale en essayant de proposer une dfinition, de resituer la place du rythme au sein de la prosodie et enfin de dgager les principales fonctions de cet lment.
1.1.1 Introduction et dfinition

Le terme rythme est souvent attribu la notion de musicalit. Ainsi, il est frquent dentendre tu nes pas en rythme ou encore lexpression avoir le rythme dans la peau . Au-del de ces expressions et bien plus que la relation rythme/musique, il est facilement constatable que la notion de rythme est prsente tout autour de nous. En tel-00455248, version 1 - 9 Feb 2010 effet, le rythme se manifeste dans des multitudes dactivits chez ltre humain. Notre quotidien est rythm par le lever, une prise de nourriture trois fois par jour, le coucher ; organisation elle-mme rythme par un cycle rgulier du jour et de la nuit. Tous ces phnomnes, et bien dautres encore, sont structurs par un rythme, que ce soit au niveau artistique (musique, danse, posie), biologique (rythme cardiaque, respiratoire) ou mme linguistique. Handel (1989:383) remarque que le rythme existe de nombreux niveaux : Rhythmic organisation is an inherent part of all human activity. Rhythm energizes structures, creates, and expresses temporal quality. It is an important in hammering a nail, or playing basketball as it is in speech, music, or dancing. Time is not merely the passive medium within which events occur. Rather, time acts to shape and determine all phenomena. Moreover, rhythmic organisation exists at all levels of activity . Il vient dtre mis en vidence que le rythme est prsent sur diverses activits ou phnomnes comme si, sans rythme, ltre humain ne pouvait se raliser. Mais quentendon par rythme, comment dfinir le rythme et tout particulirement dans le domaine de la linguistique ? Etymologiquement parlant (Le Robert, Dictionnaire Historique de la Langue Franaise, 2000), le terme rythme vient du latin rythmus (mouvement, battement rgulier, mesure, cadence), terme lui-mme emprunt au grec rhuthmos qui fait rfrence des valeurs analogiques de proportions rgulires, dordonnancement symtrique, et par extension, de manire dtre, sappliquant la forme dune chose, une espce. Le mot est driv de rhein qui signifie couler et se rapporte ce qui est 28
mouvant, modifiable ou qui correspondrait un arrangement des parties . Aprs un emploi isol en musique jusquau XVIme sicle, le rythme est dfini comme un retour intervalles rguliers des temps forts et des temps faibles dans un vers (Larousse, 2003). Au sens figur, il est dcrit comme une alternance, succession plus ou moins rgulire que prsentent certains vnements : le rythme des saisons . Rapport la musique, le rythme est dfini comme leffet obtenu par la succession des temps forts et temps faibles . Dun point de vue biologique, lexemple du rythme respiratoire peut tre cit : il est dfini comme une succession des inspirations et expirations (Larousse, 2003). A partir de ces dfinitions, il devient alors possible de parler des rythmes et non plus du rythme tant donn son rle organisateur des divers phnomnes de la vie quotidienne. Un point commun se dgage entre toutes ces dfinitions : le rythme semble tel-00455248, version 1 - 9 Feb 2010 reposer sur une alternance dun phnomne qui se rpte selon le schma fort/faible. Lorsque lon se penche sur laspect linguistique, cette mme caractristique de rythmicit binaire se retrouve dans le langage. Daprs Liberman & Prince (1977), la parole serait rythme selon la caractristique du schma : un battement fort suivi dun battement faible (ou deux maximum) entre deux battements forts. Cest ce quils appellent le Principe dAlternance Rythmique ( Principle of Rhythmic Alternation ). Cependant, si nous nous en tenons cette dfinition, il faut alors conclure que le rythme de la parole est une simple alternance de syllabes accentues et inaccentues. Or, la notion d intervalles rguliers nest pas ngliger car elle introduit une caractristique temporelle importante. Platon lui-mme dfinissait le rythme comme lordre dans le mouvement et soutenait que le rythme tait une qualit intrinsque ltre humain, le diffrenciant de lanimal : [] alors que le sens de lordre en ces deux domaines chappe compltement aux autres tres vivants, seule la nature humaine peut lacqurir (Platon: 138) Ainsi Caelen-Haumont (1983) dfinit-elle le rythme comme une structuration des dures. Au travers des diffrentes propositions de dfinitions exposes dans la littrature, il est noter que les dimensions temporelles et accentuelles sont prises en compte. Ds lors, le rythme se base sur une structure temporelle sur laquelle se dveloppent les variations intensives et tonales (Fraisse, 1956). Malgr tout, certains auteurs tels que Dell (1984), expliquent que la structure rythmique est constitue seulement de schmes accentuels. Pour lauteur, le schme accentuel reprsente une structure abstraite qui sert de balisage 29
de la chane syllabique et dont le statut est similaire celui des barres de mesures de notation musicale. Cette dimension accentuelle amne siinterroger sur le lien rythme/accentuation ; en effet, est-ce le rythme qui entrane la production daccents ou sont-ce les accents qui imposent le rythme ? Selon Bolinger (1981), suivant la proposition de Pike (1945), il existe deux types de rythme : une rythmicit syllabique et une rythmicit accentuelle (dure, f0, intensit). Selon lauteur, le rythme apparat comme procd accentuel. Ce nest plus laccentuation qui est procd rythmique, contrairement la dfinition de Di Cristo (2002) qui parle du rythme comme tant lorganisation temporelle des syllabes mtriquement fortes et des syllabes mtriquement faibles . Le phnomne accentuel est alors directement li au rythme dans lequel le concept de mtrique est introduit. Di Cristo (2002) dcrit larchitecture prosodique comme un supra-systme phonique constitu de trois tel-00455248, version 1 - 9 Feb 2010 sous-systmes appels mtrique, tonal et temporel. Lauteur distingue alors mtre et rythme. Lorganisation mtrique correspond au niveau profond, cest--dire la structuration thorique des noncs qui est reprsente mentalement par le rythme. Dans ce travail, nous adoptons la dfinition propose par Di Cristo & Hirst (1997), selon laquelle le rythme est dcrit comme lorganisation temporelle des prominences . Ces prominences seraient les lments mis en relief par des moyens tonals, intensifs et temporels. Par cette dfinition, procds accentuel et temporel sont runis et le rythme devient rvlateur de prominences. Le rythme est donc un phnomne prosodique complexe qui agit comme principe gnrateur de structures ou de groupements plus ou moins rcurrents, par la rgularit ou lalternance dlments saillants (Di Cristo & Hirst, 1993).
1.1.2 Rythme : systme organisateur de la prosodie

La prosodie se compose de plusieurs lments, souvent qualifis de
suprasegmentaux, du fait qu'ils s'tendent sur une dure qui dpasse celle des segments (phonmatiques). Ces lments englobent, entre autres, lintonation, laccentuation, le tempo, les pauses ; le rythme en fait partie. Ce dernier est en relation troite avec de nombreux paramtres tels que le timbre, le dbit, etc. et est li la syntaxe, la smantique et la pragmatique (relations qui ont suscit de nombreux dbats mais dont nous ne traiterons pas ici, cela ntant pas lobjet de cette thse). Astsano (2001) souligne que le
30
rythme participe lagencement dunits dans le temps, qui peuvent tre phonmiques, syllabiques, pausales, accentuelles ou bien encore mlodiques (etc.). Il semble que la fonction majeure du rythme soit celle de la structuration de la chane parle. Imaginez des instruments qui jouent la mme harmonie, la mme suite de notes, mais espaces au got de chacun. Le rsultat est une cacophonie. Si ces musiciens ajoutent la notion de temporalit, nous obtenons une musique. Il en va de mme pour le langage. Fraisse (1956 :9) met en avant cette caractristique : [] lorganisation temporelle des prominences qui participent de la structuration prosodique des noncs . Handel (1983 :383) insiste sur la notion de temporalit, qui a pour fonction de crer et mettre en forme : tel-00455248, version 1 - 9 Feb 2010 Rhythm energizes structures, creates, and expresses temporal quality [] rather than, time acts to shape and determine all phenomena. Cest donc le rythme qui va structurer et permettre, avec lensemble des lments prosodiques, de mener la musicalit du langage. Le rythme met donc en forme ce qui pourrait tre cacophonie et amne lharmonisation des noncs. Myers (1984) considre le rythme comme une capacit du systme cognitif former et structurer linformation perue. Cette ide de structuration se retrouve galement chez Roach (1991 :10) qui met en vidence le rle primordial de la structuration rythmique pour le langage et la communication : [it] helps us to find our way through the confusing stream of continuous speech, enabling us to divide speech into words or other units, to signal changes between topic or speaker, and to spot which items in the message are the most important. Bolinger (1972) donne au rythme une fonction daide laccs au sens et linformation. Lauteur met en relation accent et information : dans un nonc propos, le mot portant laccent le plus fort porte linformation principale que le locuteur veut faire passer. Pour Beckman (1992), cest par laspect mtrique du rythme que va sorganiser la parole, en segmentant dans le continuum verbal des units permettant daccder au sens. Le rythme constitue donc un lment part entire de la prosodie. Un rle dorganisateur et daccs au sens lui est attribu. Quil soit dfini dun point de vue de la
31
structure ou de la rgularit, il peut tre convenu que llment commun qui sen dgage est bien loccurrence de squences dvnements.
1.1.3 Le rythme : la bte noire de lapprenant ?

Lorsque lon se penche sur les caractristiques rythmiques du franais et de langlais, un certain nombre de diffrences peuvent tre releves et pourraient expliquer les difficults auxquelles les francophones sont confronts lors de productions orales en anglais. Adams (1979) tudie auditivement et instrumentalement les productions en langue anglaise dapprenants de diverses nationalits et montre la difficult dacqurir le rythme de la L2. Elle met en avant diffrents facteurs lorigine de ces difficults, tels que linsuffisance de diffrence de dures entre les syllabes accentues et inaccentues, la non rduction des voyelles inaccentues, le manque de liaisons dans lenchanement du tel-00455248, version 1 - 9 Feb 2010 discours, les pauses inappropries, les dplacements daccent de mots. Lauteur montre par le biais de ces facteurs que les productions du rythme des apprenants sont influences par leur capacit acqurir les schmas rythmiques de la L2. Si lon applique les facteurs dAdams aux productions des apprenants, on constate rapidement quils sont tout fait vrifis et que les problmes de ralisations correctes du rythme de la langue cible, langlais, peuvent sexpliquer par plusieurs diffrences majeures de proprits structurelles rythmiques entre les deux langues. De fait, Delattre (1966) propose une liste comparative du fonctionnement des deux langues. Selon lauteur, les caractristiques articulatoires du franais influencent la production du rythme. Le mode tendu du franais justifie de la stabilit du timbre des sons au cours de larticulation et donne un rythme peru avec peu dingalit entre les syllabes, tandis que le mode relch explique la diphtongaison des voyelles et donc les glissements intra-vocaliques. Delattre note que laccentuation de langlais est marque par une augmentation de lintensit syllabique, alors que celle du franais est caractrise par une augmentation de la dure syllabique. Enfin, le franais a une structure syllabique simple (CV), langlais possde une syllabification ferme, une structure syllabique complexe (CVC). Wenk (1985) rend compte des diffrences majeures au niveau de laccentuation. En franais, laccent est plac en fin de groupe rythmique tandis quen anglais il est gnralement en tte de groupe rythmique. La ralisation de laccent est observe par une augmentation de lintensit en anglais contrairement une augmentation de dure en franais. Au niveau articulatoire, le franais garde une tension dans la production des 32
syllabes inaccentues, a contrario de langlais dont la tension est relche, ce qui permet une centralisation vocalique. Cela entrane labsence de distinction voyelles courtes/voyelles longues en franais, caractristique vocalique majeure de langlais. Par ailleurs, il est noter au niveau de laccent lexical que le franais aura tendance accentuer la dernire syllabe du mot tandis que langlais est une langue accent libre, laccent peut tre sur nimporte quelle syllabe du mot (ce qui lui attribue une fonction distinctive dans la mesure o la place de laccent permettra de distinguer une paire de mots, exemple : record (disque) /record (enregistrer)). Bolinger (1981) explique que la qualit vocalique est lorigine dune rythmicit diffrente entre les deux langues. Langlais a une tendance la rduction vocalique des syllabes inaccentues, ce qui entrane un certain type de rythme, tandis que le franais prsente une qualit constante des voyelles pleines, donnant limpression dun battement tel-00455248, version 1 - 9 Feb 2010 syllabique. Bolinger fait remarquer que cest bien la non rduction vocalique du franais qui entrane un caractre isosyllabique de la langue, responsable de cet aspect rythmique. Il illustre ce propos par lexemple de langlais hawaen qui est caractris par labsence de rduction vocalique, ce qui entrane une rythmicit syllabique.
A partir de ces diffrences structurelles, la langue maternelle va alors crer des interfrences rythmiques dans la production de la L2. Nicaise & Gray (1998) en listent quelques-unes, similaires aux ccritres exposs par Adams (prcdemment cits) :
-trop de force dans les syllabes accentues -syllabes inaccentues insuffisamment rduites -dplacement daccent sur la dernire syllabe du dernier mot du groupe rythmique -dplacement daccent lexical sur la dernire syllabe dun mot pluri-syllabique -absence de neutralisation vocalique des syllabes inaccentues Ces facteurs peuvent tre illustrs par lexemple suivant : / maRgAREt tatS9R/
Toutes ces diffrences (rpertories succinctement dans le tableau prsent cidessous) vont entraner un certain nombre de distorsions rythmiques dans la production des apprenants.
33
ANGLAIS structure syllabique complexe (CVC) distinction quantitative voyelles courtes vs. longues rduction vocalique
FRANCAIS structure syllabique Simple (CV) absence dopposition quantitative des voyelles
absence de rduction vocalique langue accent fixe isosyllabique
langue accent libre

tel-00455248, version 1 - 9 Feb 2010
isoaccentuelle
Tableau 1. Rcapitulation des principales diffrences des proprits structurelles rythmiques -anglais vs franais-
Les
facteurs
voqus
de
diffrenciation
de
dures
entre
syllabes
accentues/inaccentues, entre voyelles pleines/rduites, entre structures syllabiques simples/complexes amnent une diffrence traditionnelle entre les deux langues qui est celle de la classification des langues selon un caractre isosyllabique (franais) ou isoaccentuel (anglais), que lon peut noter la lecture de ce tableau en dernire position. En effet, cette notion dgalit/dingalit, de rgularit/dirrgularit du rythme ouvre le dbat vers une reprsentation traditionnelle des deux langues dont les tendances rythmiques tablies sont compltement opposes. Cette thmatique, qui est le point central de dpart de notre analyse exprimentale, fait lobjet dune prsentation diachronique dans la section suivante.
1.2 Le rythme de la parole

Il serait surprenant que cette notion de tendance gnrale la rgularit qui entoure notre univers ne se reflte pas dans le langage, car cest partir de cette rgularit rythmique quil semble intressant de confronter les deux langues choisies (anglais et franais), selon 34
leurs caractristiques rythmiques. Par ailleurs, Cruttenden (1986) suggre que le rythme est la base de tout systme prosodique apportant une contribution dterminante la fonction didentification des langues (Di Cristo & Hirst, 1993). Cest sur cette rgularit du rythme que va alors se baser une catgorisation scalaire des langues, mettant en opposition langlais et le franais. Cest au travers de cette typologie opposant les deux langues en question que peuvent tre expliques, en partie, les erreurs prosodiques produites par les apprenants francophones.
1.2.1 Isochronie
Une caractristique de la structuration rythmique, se situant au cur de la naissance dune dichotomisation des langues, est le concept disochronie des units rythmiques. tel-00455248, version 1 - 9 Feb 2010 Si lon sen rfre une dfinition traditionnelle populaire de lisochronie (du grec isochronos), on trouvera plutt les termes d isochronisme ou encore d isochrone ayant pour dfinition qui seffectue dans des intervalles de temps gaux (Larousse, 2003). En application dans le domaine du langage, le principe disochronie peut se dfinir comme une segmentation de la chane parle en un certain nombre dunits de dure gale. Deux types disochronie se distinguent3 : lisochronie syllabique (syllable-timing) -retour intervalles rguliers des syllabes- et lisochronie accentuelle (stress-timing) -retour intervalles rguliers des accents. Cette dualit serait ne de la traditionnelle comparaison faite entre langlais et le franais, langues utilises comme reprsentant de lune ou lautre tendance rythmique (Astsano, 2001). Cette notion disochronie introduite par Steele (1779) est reprise par Classe (1939) qui en questionnait lexistence. Classe analyse les dures entre les syllabes accentues de langlais au moyen dun kymographe. Il remarque une isochronie dans la parole, toutefois selon certaines conditions, cest--dire avec des structures phonmique et grammaticale similaires. Il conclut quune isochronie stricte serait rare en anglais dans la mesure o
On a galement dcrit un troisime type nomm isomoraque (mora-timed) mais nous ne dveloppons pas cette catgorie rythmique qui correspond aux langues tons et nentre donc pas dans notre tude.
35
plusieurs facteurs entrent en jeu et quelle serait le rsultat dun ensemble de concidences compliques. Le terme rapparat dans la dfinition du rythme donne par Pike (1945) reprise par Abercrombie (1967) et Halliday (1967). Lauteur parle de rcurrence isochrone dunits ; on voque alors lisochronie accentuelle ou disochronie syllabique, ce qui permettrait dattribuer aux langues un statut de langue isoaccentuel ou isosyllabique . Ainsi, selon Pike (1945) et Abercrombie (1967), langlais possde des intervalles entre les pieds qui sont de longueur peu prs gale. Cette langue a donc une tendance lisochronie accentuelle, cest--dire que les syllabes accentues (indpendamment du nombre de syllabes formant lunit rythmique) sont gales en dure. Cette isochronie est possible seulement si la dure de chaque syllabe nest pas gale. Cette dfinition suppose que les syllabes se trouvant dans les intervalles sont soit tires, soit compresses pour tel-00455248, version 1 - 9 Feb 2010 pouvoir obtenir au final une dure constante de lintervalle accentuel. Concernant le cas du franais, ce dernier est dcrit comme une langue isochronie syllabique, cest--dire que les syllabes se produisent intervalles de temps rguliers. Cependant, le principe disochronie appelle de nombreuses tudes car si les travaux mens ne rejettent pas cette notion, ils tentent plutt den apporter une justification par des preuves scientifiques, ce qui ne va pas forcment dans le sens dune isochronie parfaite. Les tudes de Faure, Hirst & Chafcouloff (1980), Roach (1982), Dauer (1983) sur langlais montrent que cest la perception des syllabes accentues et inaccentues qui mne une impression de rgularit des intervalles accentuels. Les travaux de Wenk & Wioland (1982) sur le franais montrent que la dure moyenne des syllabes semble diminuer quand deux syllabes accentues successives prsentent un intervalle trop important. Cependant leurs travaux montrent aussi que les dures syllabiques ne sont pas constantes en franais. Ces auteurs soulignent que lallongement de la syllabe finale du groupe rythmique nest pas pris en compte par lisochronie syllabique. Toutes ces tudes concluent que lisochronie nest pas relle. plus ou moins isochrone Que ce soit pour langlais ou pour le franais, le principe disochronie ne sest pas rvl convaincant. Sil est difficile de rassembler des preuves objectives de la tendance lisochronie, cette notion nest pas fondamentalement remise en cause. De plus, nous nous devons de souligner que, jusquici, lisochronie a t dcrite comme un phnomne 36
rigide avec des units gales en dure. Cependant, il est noter que les auteurs (Pike, 1945 ; Halliday, 1967) soutenant le principe disochronie parlent de dure dintervalles peu prs gale. En voici quelques exemples : Pike (1945 :33) (1945:35) Halliday (1967:23) [] somewhat uniform [] more or less evenly recurrent interval [] roughly regular
Lexprience de Halliday (1967) montre quil existe seulement une tendance vers une certaine rgularit. Lauteur a souhait mesurer le rapport de dures des pieds dune, deux et trois syllabes. Les rsultats du rapport ne prsentent pas des chiffres gaux mais plutt approximatifs (5 :6 :7), ce qui nempche pas une isochronie relative. tel-00455248, version 1 - 9 Feb 2010 Kohler (1991) remarque, quen allemand, la compression des syllabes se fait seulement dans les intervalles dune et deux syllabes. A partir de trois syllabes, il ny a plus de compression. Lauteur note aussi une tendance des intervalles accentuels tre de dure rgulire, car la dure de la syllabe inaccentue semble sajuster selon la dure de la syllabe accentue prcdente. Si une isochronie pure ne puise pas son existence sur des donnes objectives, si les recherches menes tout au long de ces annes nont pas men des rsultats concluants, nous pouvons supposer, au vu des travaux (Bolinger, 1965 ;OConnor et Tooley (1961), lexistence dune certaine rgularit ; le principe de compression cit ci-dessus abonde dans le sens dune recherche de rgularit dans les noncs. Mais cette absence de donnes objectives dans la qute de trace disochronie par des analyses acoustiques mne vers lhypothse selon laquelle la rgularit rythmique na dexistence qu un niveau perceptif et non un niveau physique. Des tudes (Lehiste, 1977 ; Couper-Kuhlen, 1993) ont montr que, de manire gnrale, lindividu peroit la parole comme rgulire, alors quacoustiquement elle ne lest pas. Dune isochronie pure une isochronie subjective Nombreux sont les chercheurs qui sont arrivs la conclusion que lisochronie ou la rythmicit devait tre considre comme un phnomne perceptif. Certains auteurs, tels que Meumann (1894), pensaient dj que le rythme tait le fruit dune activit cratrice de la personne : 37
Ce qui est essentiel dans le rythme, consiste en des actes intellectuels dont loccasion est fournie dans certaines conditions par une succession rapide de sensations dtermines (1894 : 272). Des dcennies plus tard, lide est toujours prsente. Selon le psycholinguiste Fraisse (1956), la rgularit rythmique ne serait relle quau niveau perceptif. Pour lauteur, cest le sujet lui-mme qui forme ou cre des groupements ; ainsi il y a perception du rythme lorsque le sujet forme des groupements de faon subjective ; ceux-ci seraient organiss en groupes de deux, trois ou quatre lorsquil y a une succession rgulire de sons identiques. vrai dire, il ny a jamais groupement, ou forme, que pour un sujet qui peroit ce groupement et, comme nous allons le voir plus loin, nous ne percevons de groupements que dans des limites psychophysiologiques inhrentes au mode de fonctionnement de nos sens et de nos centres nerveux. En ce sens toute tel-00455248, version 1 - 9 Feb 2010 rythmicit est subjective (1956 : 9). Le groupement est donc relatif un sujet percevant. De plus, lauteur ajoute que les structures rythmiques sont caractrises par deux principes rgis par des processus perceptifs: (i) le principe dassimilation et (ii) le principe de distinction. Le sujet rorganise les structures en utilisant ces deux principes pour obtenir une rythmicit ; Fraisse (1956) mne une exprience par une technique de reproduction de frappe quatre tapes (soit trois temps) selon la structure suivante : Le sujet rajuste la rythmicit de lnonc soit en sous-estimant la valeur entre deux temps (assimilation), soit en surestimant le temps (distinction). Fraisse remarque dans le cas prsent ci-dessus que lorsque le premier temps prend des valeurs croissantes, il est lgrement sous-estim, en mme temps que les deux temps longs sont de plus en plus surestims. Fraisse conclut : il y a en effet une interdpendance des temps telle que la modification de la dure dun des temps entrane une rorganisation de tous. [] Les rorganisations se font suivant deux principes. Lun, de distinction, accuse les diffrences insuffisantes. Lautre, dassimilation, cest--dire de relative galisation, tend supprimer ou tout au moins rduire les diffrences minimes (1956 : 58). Ces principes rappellent lillusion de Delboeuf (Delorme & Fluckiger, 2003) (cf. annexes, section 2): celui-ci explique quun cercle plac dans un autre cercle concentrique plus grand est lui-mme surestim (principe dassimilation) ; en revanche, si le cercle
38
lextrieur est bien plus grand, alors le cercle se trouvant lintrieur est sous-estim (principe de distinction). Ce mme type de phnomne est observ par Allen (1975) dans une exprience qui dmontre que les sujets sous-estiment la dure des intervalles longs et surestiment la dure des intervalles courts, do une impression de rgularit. Le paramtre de laccentuation est aussi pris en compte dans ltude de Fraisse sur la rythmicit subjective . Les caractristiques de laccentuation auraient des incidences sur le rythme ; Fraisse sappuie sur des considrations perceptives. Lauteur cite lexprience de Schmidt (1939) : les sujets doivent reproduire les groupes rythmiques (en les frappant) comme ils les peroivent. Les rsultats font ressortir deux dominantes de schma daccentuation selon lesquelles les sujets frappent plus fortement le premier ou le dernier lment du groupe rythmique. Deux dcennies plus tard, Fraisse (1974), par une srie dexpriences faites avec des sujets de groupes linguistiques divers, montre que la position perue de llment tel-00455248, version 1 - 9 Feb 2010 accentu varie selon lintensit et la hauteur de laccent. Ainsi, si laccent produit subit une augmentation dintensit ou de hauteur, il sera peru comme dbutant le groupement ; par contre, si llment qui porte laccent apparat plus long que les autres, il sera peru comme fin de groupe. Fraisse nest pas le seul prner une rythmicit apparaissant comme phnomne perceptif. Ce point de vue est aussi vivement exprim par Benguerel & DArcy (1986). Selon ces auteurs, une quelconque isochronie ou rythmicit ne se produirait qu un niveau perceptif et non au niveau de la ralisation acoustique4 : it seems surprising that anyone interested in finding evidence for perceptual regularity would expect measurements (no matter how careful) of the acoustic signal to provide such evidence In our view, if there exists any regularity or rhythmicity in speech, it is at the perceptual level, and possibly at the pre-production level, but not at the acoustic level (1986: 244).
Cependant notons quune exprience mene par Cummins & Fort (1998) dmontre quune
rythmicit accentuelle est tout fait observable partir de mesures acoustiques : ces auteurs dfinissent le rythme comme une organisation hirarchique des units prosodiques temporelles.
39
Ces auteurs soutiennent quil y a un contraste entre la phase de pr-production et la phase de production : une dviation entre le patron rgulier sous-jacent et la production irrgulire rsulte en partie de linfluence de diverses caractristiques intrinsques des contraintes articulatoires, rythmiques, contextuelles, des phonmes (etc.). Lors de la phase de production, une dformation se produit ; celle-ci engendre des noncs qui ne sont pas isochrones. Diverses expriences du type de celles de Fraisse sont menes afin de dmontrer le phnomne perceptif de lisochronie. Au cours dune exprience, Lehiste (1977) propose des sujets didentifier (par stimuli) les intervalles les plus courts et les plus longs. Les rsultats montrent quil faut diminuer de 30 100 ms un intervalle pour quil soit jug plus court et vice versa. Les sujets semblent plus ou moins compenser les changements de tel-00455248, version 1 - 9 Feb 2010 dure. Lauteur conclut quils peroivent une certaine rythmicit dans la parole qui na pas forcment ralit dtre et met en avant lincapacit des individus identifier les diffrences existantes. Le principe disochronie a donc ouvert la voie de nombreux dbats. Illusion perceptive ou ralit acoustique, la notion disochronie est directement associe la classification des langues. En effet, il semblerait que le rythme de la parole soit un bon moyen pour caractriser et classer les langues dans des catgories. Cest partir de cette hypothse disochronie quil serait possible, en mesurant les dures entre soit les syllabes, soit les accents, soit les mores, de dterminer lappartenance une classe rythmique dune langue. Cest ce que nous nous proposons de prsenter dans la partie suivante au travers dun bref historique.
1.2.2 Classification des langues : volution du concept

Thorie des langues isoaccentuelles/isosyllabiques La catgorisation des langues est ne daprs une impression (auditive) de rgularit dans la rythmicit des langues une rgularit qui se retrouve soit dans la syllabe, soit dans laccent. Lloyd James (1940) compare le son produit par certaines langues (prenons ici langlais comme exemple) au rythme produit par un message cod en morse morse code rhythm languages et le son produit par les autres langues (comme le franais) au rythme produit par le son dune mitraillette machine-gun rhythm . Cest sur 40
cette distinction observe par Lloyd James que Pike (1945) a puis son inspiration pour renommer ces deux diffrences rythmiques en deux catgories de langues montrant une certaine tendance rythmique. Ainsi, les premires hypothses concernant le rythme des langues rvlent une dichotomie qui permet de classer les langues selon deux catgories : (i) les langues dites rythmicit syllabique (ou syllable-timed ) : le rythme se base
sur les syllabes, cest--dire que ce sont les syllabes qui reviennent intervalles rguliers. Pike explique que les syllabes sont de dure quasi gale et que la dure des intervalles est proportionnelle au nombre de syllabes :
French syllables tend to come at more or less evenly recurrent intervals so that, as a result, phrases with extra syllables take proportionately more time (1945: 35)
tel-00455248, version 1 - 9 Feb 2010
(ii)
les langues dites rythmicit accentuelle (ou stress-timed ) : le rythme se base
sur les accents, cest--dire que ce sont les accents qui reviennent intervalles rguliers. Pike dcrit ces langues comme ayant une dure des intervalles accentuels quasi gale mais ne dpendant pas du nombre de syllabes dans lintervalle ; ce dernier est caractris par un certain degr de compression des syllabes. Abercrombie (1967) ajoute que toutes les langues possdent un rythme et ont obligatoirement leur place dans lune ou lautre des catgories. Lauteur rintroduit la notion disochronie (propose auparavant par Pike (1945): selon lui, le rythme des langues est donc bas soit sur une isochronie syllabique soit sur une isochronie accentuelle, lisochronie sappuyant sur un principe de dure gale des units rythmiques. Cest donc par ce principe disochronie que ces auteurs justifient une classification des langues. Cette isochronie saccompagne dun mouvement rgulier de contractions et relchements des muscles respiratoires, qui intervient soit sur la syllabe soit sur laccent produit. Abercrombie fonde ses hypothses sur des observations physiologiques. Selon lui, le rythme est une affaire de rythme musculaire concernant plus particulirement les muscles respiratoires. Lauteur choisit deux groupes de trois langues et considre que pour les
41
langues rythmicit syllabique telles que le franais, le tlougou5, et le yoruba6, chaque syllabe correspond des pulsations pulmonaires et que pour les langues rythmicit accentuelle, telles que langlais, le russe et larabe, les pulsations pulmonaires interviennent chaque accent produit : known as a syllable-timed rhythm, the periodic recurrence of movement is supplied by the syllableproducing process: the chest-pulses, and hence the syllables, recur at equal intervals of time-they are isochronous [] known as a stress-timed rhythm, the periodic recurrence of movement is supplied by the stress-producing process: the stress-pulses, and hence the stressed syllables, are isochronous [] (1967: 97). Nous nous retrouvons ainsi avec deux catgories strictes de langues que ces auteurs ont nommes : les langues isosyllabiques et les langues isoaccentuelles. tel-00455248, version 1 - 9 Feb 2010 Dans cette classification, seulement deux catgories rythmiques nous sont proposes. Or nous nous devons de souligner quil existe une troisime catgorie de langues, dont fait partie notamment le japonais, que lon appelle les langues rythmicit moraque. Bloch (1950) introduit cette troisime catgorie de langues et explique que ce type de rythme repose sur la more7. Dans ce type de catgorie, cest au niveau des mores que nous retrouvons une certaine isochronie. Par ailleurs, il est noter que par cette catgorisation, langlais et le franais sont formellement opposs, et semblent, selon nos auteurs, avoir des caractristiques rythmiques trs diffrentes. Ces deux langues apparaissent comme les prototypes de lune et lautre classe rythmique, trs souvent pris comme exemple pour illustrer lune ou lautre des catgories rythmiques. Trs rapidement, ce principe de catgorisation des langues suscite lintrt de nombreux linguistes et va entraner de nombreux travaux ce sujet.
Langue dravidienne (famille de langues du sud de lInde) parle dans ltat dAndhra Pradesh
(Inde). Langue originaire du sud ouest du Nigeria (Bnin) et dune petite partie du Togo, parle aussi au Brsil, Cuba, Amrique Latine, Carabes.
7 6
sous unit des syllabes suivant le schma CV (ma) ou (C)VV (aa) ou CVC (mam)
42
Variantes de la classification. Wenk & Wioland (1982) adoptent une position plus modre en utilisant les termes de trailer-timed (ou encore regulated group-finally) pour parler des langues dites isosyllabiques et de leader-timed (ou regulated group-initially ) pour les langues dites isoaccentuelles. Cependant, le mme type dopposition est prsent : dun ct les langues codachrones (trailer-timed languages) - comme le franais - dont la syllabe accentue se situe en finale de groupe rythmique, et de lautre les langues capochrones (leader-timed languages) comme langlais - dont la syllabe accentue se situe en initiale de groupe rythmique. Le mme principe se retrouve dans les travaux de Di Cristo & Hirst (1998) sauf que ces auteurs ne classent pas les langues dans une certaine catgorie mais constatent que les groupes rythmiques du franais se caractrisent par une structure de tte droite et les groupes rythmiques de langlais reposent sur une structure de tte tel-00455248, version 1 - 9 Feb 2010 gauche . Liberman & Prince (1977) se basent sur les diffrents niveaux de lorganisation rythmique des langues pour mettre en vidence la catgorisation des langues. Pour cela, les auteurs crent une grille mtrique utilisant un systme dastrisques placs au-dessus des noncs reprsentant diffrents niveaux daccentuation. Trois niveaux sont proposs : les syllabes, les lments prominents, laccent principal (du mot). Beckman (1992) propose de justifier cette dichotomie des langues par le biais de la priodicit . Elle oppose les langues accentuelles comme langlais aux langues de frontire comme le franais. Selon lauteur, langlais possde une priodicit marque par laccentuation, contrairement au franais qui prsente une priodicit ponctue par des coupures temporelles. Toutes ces tudes proposent donc des catgories bien distinctes de langues, en fonction du rythme. Trois catgories classiques sont proposes : les langues rythme accentuel, syllabique ou moraque ; une classification classique que nous pouvons illustrer par le tableau suivant (reprsentation et classement des langues selon nos diverses lectures) :
43
langues accentuelles anglais allemand arabe nerlandais russe polonais tha
langues syllabiques langues moraques franais japonais espagnol tamoul italien grec catalan telougou/ yoruba hindi
Tableau 2. Classement des diffrentes langues selon leur classe rythmique
Cependant, cette catgorisation classique des langues en fonction du rythme ne reoit pas laccord de tous les linguistes et se voit fortement remise en question. tel-00455248, version 1 - 9 Feb 2010 vers un continuum rythmique Dauer (1983) tente de justifier les conclusions dAbercrombie en y apportant des mesures acoustiques. Elle procde une analyse en mesurant les variabilits des dures des intervalles entre accents, en choisissant l onset (attaque) comme dbut dintervalle. Dauer obtient des rsultats insatisfaisants pour valider lhypothse dAbercrombie. Les dures des intervalles ne sont pas gales. Dauer explique que les diffrences entre les langues rsident plutt dans la structure interne de lintervalle, reposant sur des proprits plus phonologiques, notamment : -la complexit des compositions syllabiques -labsence ou non de rduction vocalique -limportance de laccent
Ainsi, selon les caractristiques proposes, nous pouvons dcrire les deux types de langue de la faon suivante : (i) Les langues dites syllabiques (comme le franais) se composent de syllabes simples (la plus courante tant CV), et nadmettent pas de rduction vocalique. Les syllabes sont donc de taille relativement stable et semblent donner un rythme rgulier. (ii) Dans les langues accentuelles (comme langlais), la composition des syllabes est beaucoup plus complexe et varie et porte gnralement sur laccent tonique ; les syllabes plus simples font lobjet dune rduction vocalique, accentuant la distinction entre syllabes
44
accentues et inaccentues (fortes/faibles). Leffet de laccent a tendance tre plus marqu dans ce type de langue car il saccompagne dune combinaison dallongement, de modification du contour mlodique, de changement de hauteur et de qualit ; il est donc plus perceptible en anglais. Dauer (1983) tablit alors un continuum rythmique sur lequel elle place les langues selon une certaine tendance plus ou moins accentuelle. Elle utilise un axe qui reprsente le degr dimportance de laccent.
japonais
franais
espagnol
grec
portugais
anglais
tel-00455248, version 1 - 9 Feb 2010
Figure 1.Axe reprsentant le degr d'importance de l'accent dans diffrentes langues (Dauer, 1983:60)
L axe reprsent par une flche permet dobserver un continuum allant des langues moins accentuelles (partant du japonais) aux langues plus accentuelles (langlais) ; on retrouve lextrme gauche les langues rythmicit moraque (japonais), lextrme droite les langues rythmicit accentuelle (langlais) et sur laxe les langues rythmicit syllabique comme le franais. Les travaux de Dauer vont inspirer de nombreuses autres recherches ouvrant la voie une seconde cole qui prfre opter pour lide dun continuum rythmique, remarque qui avait t faite quelques annes auparavant par Delattre (1966), prconisant une rpartition des langues sur un continuum de valeurs contrastes et non dans deux catgories absolues. Ainsi dautres critres vont sajouter au fur et mesure, suivant lide de ce continuum: Hoequist (1983, cit par Herry, 2001) ajoute la caractristique deffet dadjacence: les syllabes accentues subissent linfluence des syllabes inaccentues adjacentes ; le continuum va donc de labsence deffet dadjacence fort effet dadjacence lautre extrme. Miller et al. (1984) argumente dans le sens de critres phonologiques (tels ceux noncs par Dauer) ; Eriksson (1991) souhaite sintresser la composition des intervalles plutt qu leur dure. Dauer (1987) tablit, quelques annes aprs llaboration de laxe scalaire, une classification selon certains traits phonologiques ; lauteur propose un ventail de traits. Elle tablit un systme de cotation selon lequel chaque trait se voit 45
assigner de la valeur + ou dun - . De cette faon, plus une langue obtient de + plus il est probable, selon Dauer, que cette langue en question ait de forts accents et donc ait tendance tre accentuelle. Bertinetto (1989) propose une orientation scalaire en remplacement de la dichotomie traditionnelle. Bertinetto explique quil nexisterait quun type de langues unique mais qui varie en fonction de dviations scalaires (par rapport une isochronie pure). Selon lui, toutes les langues ont une base rythmique commune. Lauteur prsente une synthse des facteurs phontiques et phonologiques (dont certains se retrouvent chez Dauer) permettant de distinguer les diverses langues (1989 : 108) : (a) rduction vocalique OU articulation pleine des syllabes inaccentues (b) certitude OU incertitude dans le dcompte des syllabes (c) acclration du tempo par la compression des syllabes inaccentues OU compression proportionnelle (d) structure syllabique complexe avec incertitude relative des frontires syllabiques OU structure syllabique simple avec des frontires bien dfinies (e) tendance aux syllabes lourdes sous laccent OU absence de cette tendance (f) flexibilit dans le placement de laccent OU rigidit (g) densit relative des accents secondaires OU pas. Lauteur conclut quune langue possde un certain degr des diffrents traits proposs ci-dessus, ce qui contribue lorienter vers un ple rythmique plutt quun autre : iso-accentual and iso-syllabic languages do not contrast because of some radically different feature they are supposed to possess (or, alternatively, not to possess), but rather because of the varying degree to which they seem to exhibit the various features, phonetical and phonological, which are supposed to contribute to orient a language more towards one or towards the other pole of rhythmical behaviour (1987: 111). Les langues sont alors caractrises par diffrents facteurs ; elles possdent chacun de ces facteurs selon un certain degr dimportance. Les diverses langues sont localises selon une scalarisation, et non plus classes selon une dichotomie stricte. Elles sont plus ou moins isoaccentuelles ou plus ou moins isosyllabiques. Il semble que ce continuum ait inspir de nouvelles tudes. Tout dabord, certains linguistes ont affirm quune langue pouvait prsenter les deux tendances rythmiques la fois. Paralllement cela, il semble que ce continuum conduit de nouveaux travaux. Des chercheurs sinterrogent sur lhypothse selon laquelle il puisse exister des variabilits lintrieur mme dune langue, celles-ci classant les dialectes sur des points diffrents du continuum.
tel-00455248, version 1 - 9 Feb 2010
46
Coexistence rythmique : tudes inter-dialectales Ce principe dobtenir un continuum de langues plus ou moins syllabiques ou accentuelles va dvelopper de nouvelles tudes afin de comparer les variabilits lintrieur dune mme langue. La majorit des tudes inter-dialectales porte sur la variabilit de langlais. Bolinger (1981) montre par une exprience, que langlais dHawa aurait une tendance la rythmicit syllabique. Deterding (2001) sintresse aux variabilits dialectales entre langlais britannique standard et langlais de Singapour. Il choisit de mesurer la dure des syllabes. Ces travaux montrent que les dures syllabiques varient considrablement entre les deux varits : langlais de Singapour semble avoir des dures syllabiques plutt gales, contrairement celles de langlais britannique standard. De plus, les voyelles rduites semblent plus prsentes en anglais britannique standard. Lauteur conclut donc que tel-00455248, version 1 - 9 Feb 2010 langlais de Singapour a une tendance lisosyllabicit, tandis que langlais britannique standard serait plutt isoaccentuel. Grabe & Low (2002) tudient la mme comparaison et abondent dans le mme sens que Deterding. Elles observent aussi que les voyelles rduites de langlais de Singapour sont aussi moins centralises et plus longues que celles de langlais britannique standard. Dautres langues ont t tudies en ce sens : Fernandez-Cruz (2000) montre des diffrences rythmiques pour les dialectes portugais. Elle analyse un rythme accentuel pour le portugais europen, syllabique pour le portugais brsilien et moraque pour le portugais afro-brsilien. Ltude de Barkat-Defradas, Hamdi, Pellegrino (2004) montre diffrentes rythmicits de larabe allant dest en ouest. De plus en plus de travaux se sont dvelopps, autant concernant les diffrences lintrieur des langues se penchant sur la comparaison de caractristiques des varits dialectales, que, de manire gnrale, des tudes entre les langues du monde. Les dernires tudes (Roach, 1982 ; Dauer, 1983) rejettent le principe disochronie reposant sur une rptition dunits semblables (pied, syllabe ou more) classant les langues dans trois catgories distinctes. Elles penchent plutt pour un continuum. Ces derniers travaux ne reposent plus sur une isochronie accentuelle ou syllabique (ou moraque) mais sur des caractristiques plus phonologiques, comme la complexit des syllabes, la corrlation entre poids syllabique et accent, labsence ou non de rduction vocalique. Rcemment de nouvelles approches, inspires de ces derniers travaux, se sont dveloppes. 47
1.2.3 Propositions de mtriques rythmiques

Les travaux prsents ci-dessous ont pour but de tester exprimentalement, par le dveloppement de mtriques reposant sur des donnes acoustiques, la classification des langues proposes auparavant. Ramus & al. (1999) Ramus, Nespor & Mehler (1999) et Ramus (1999) proposent une nouvelle approche phonologique de la caractrisation des langues. Dans ces travaux sur la discrimination des langues, Ramus (1999) fonde son approche sur des bases phonologiques du rythme quil dcrit ainsi : tel-00455248, version 1 - 9 Feb 2010 Notre approche repose sur une conception du rythme de parole, non plus comme primitive de lorganisation temporelle des langues, mais comme consquence de certaines de leurs proprits phonologiques [] . (1999:2). Alors que les travaux prcdents nont pas abouti dmontrer le classement rythmique des langues, Ramus choisit de rsoudre ce problme en calculant lintervalle entre consonnes et voyelles. Ramus se base sur deux principales caractristiques (que lon retrouve chez Dauer (1983) : la complexit de la structure syllabique et la rduction des voyelles inaccentues). Selon lauteur, lhypothse est quune analyse de la complexit syllabique dune langue devrait permettre de dterminer sa classe rythmique. Largument consiste dire que plus une langue a de syllabes complexes, plus elle serait de type accentuel, et inversement, plus une langue a de syllabes simples, plus elle serait de type syllabique (ou moraque). Ramus se propose de quantifier ces proprits phonologiques en mesurant la complexit syllabique par une segmentation en consonnes/voyelles, sur un corpus quil a constitu partir dun corpus multilingue du LSCP. Huit langues ont t choisies : langlais, le nerlandais, le polonais, le franais, lespagnol, litalien, le catalan, le japonais. Quatre locutrices natives (de chaque langue) prononaient 5 phrases, ce qui donne une somme de 20 phrases par langue, et donc un corpus de 160 phrases. Ce corpus
48
est segment manuellement en intervalles consonantiques8 et vocaliques9. Ramus introduit ainsi deux nouveaux corrlats ; ici, on ne mesure plus des dures dunits rythmiques, ni de dures de phonmes, mais on lance un calcul statistique de dures dintervalles consonantiques et vocaliques suivant ces deux corrlats: la proportion de dures des intervalles vocaliques: %V (lauteur note que la
proportion dintervalles consonantiques tant gale 1-%V, elle napporte aucune information supplmentaire). lcart type des dures des intervalles consonantiques : C
Ces deux corrlats acoustiques font partie de trois variables choisies par Ramus (la troisime variable tant lcart type des dures dintervalles vocaliques (V)): lauteur part tel-00455248, version 1 - 9 Feb 2010 du principe que le rythme est une proprit linguistique dtectable dans le signal de la parole et a donc transpos les trois classes rythmiques (accentuelle, syllabique, moraque) en trois variables. Les deux paramtres acoustiques sont lis la structure syllabique des langues selon leur catgorie : en effet, les syllabes complexes comportent plus de consonnes que les syllabes simples. Le raisonnement est donc le suivant: plus une langue a de syllabes complexes, plus la proportion moyenne de consonnes augmente et plus le %V diminue. Ces deux paramtres acoustiques devraient donc pouvoir permettre de distinguer les variations entre les langues par une analyse de variance. Lauteur explique que ce sont les deux corrlats retenus qui lui ont permis de dmontrer que les langues choisies se regroupent dans les classes traditionnelles rythmiques, suivant les trois catgories classiques : langlais, le nerlandais, le polonais appartiennent aux langues isoaccentuelles, et le franais, lespagnol, litalien et le catalan sont isosyllabiques ; le japonais, lui, appartient la catgorie isomoraque. Ces rsultats vont dans le sens de ceux tablis par Dauer (1983). Cependant, lauteur tient prciser que ces indices ne prsupposent pas forcment que les langues se divisent en deux groupes distincts. Les rsultats obtenus
Intervalle consonantique = suite de consonnes, cest--dire, toute squence ininterrompue de consonnes (de la 1re consonne la dernire de cette squence) Intervalle vocalique = suite de voyelles, cest--dire, toute squence de voyelles (de la 1re voyelle de la squence la dernire).
9
49
montrent donc que les langues structure syllabique plus complexe ont un %V plus faible et un C plus lev que les langues structure syllabique simple. Lauteur conclut que les variables %V et C sont significatives et reprsentent le meilleur corrlat acoustique, puisquelles semblent rendre compte de la notion traditionnelle de classe rythmique. Notre intrt portant plus particulirement sur langlais et le franais, nous notons les rsultats obtenus : langlais qui a des voyelles pleines et rduites a un %V infrieur celui du franais (40.1% pour langlais contre 43.6% pour le franais), langue qui na pas de rduction vocalique. En revanche, C est plus important en anglais et reflte une structure syllabique complexe (46.4 en anglais contre 37.8 en franais).
tel-00455248, version 1 - 9 Feb 2010
Low & al. (2000) Une seconde tude prsentant des paramtres diffrents est propose par Grabe & Low (2002). Ces travaux sappuient sur lhypothse faite par Low, Grabe & Nolan (2000), quune combinaison de lquation nPVI_V (dcrite ci-dessous) avec des mesures de variabilit dintervalles intervocaliques rendrait un meilleur indicateur de classe rythmique que le nPVI seul. Le but de ltude de Grabe & Low (2002) est dapporter des preuves objectives et acoustiques la classification des langues partir de mesures de dures, tout en vrifiant lhypothse mise par Low, Grabe & Nolan (2000). Ces travaux diffrent du prcdent (Ramus, 1999) par deux nouveauts. Tout dabord, les auteurs utilisent une approche phontique puisque les units phonologiques ne sont pas mises en relation avec le rythme. Cette tude ne sappuie pas sur des mesures de dures des intervalles entre accents ou des syllabes mais propose de calculer le degr de variabilit dans les mesures successives des intervalles acoustico-phontiques. Les calculs seffectuent sur la dure des voyelles et des intervalles entre les voyelles. La deuxime particularit de cette tude est que les auteurs ont choisi dtendre leur corpus sur 18 langues. Grabe & Low ont repris 11 langues dj tudies et ont introduit 7 nouvelles langues (un des objectifs de ces travaux tant dobserver des langues non classes) que lon peut visualiser dans le tableau rcapitulatif propos ci-dessous:
50
Language British English German Dutch Thai Tamil Spanish French Singapore English Japanese Polish Catalan tel-00455248, version 1 - 9 Feb 2010 Estonian Greek Luxembourg Malay Mandarin Rumanian Welsh
Classification Stress-timed (Classe, 1939,Pike, 1946, Abercrombie 1967) Stress-timed (Kohler, 1982) Stress-timed (Ladefoged, 1975, Smith, 1976) Stress-timed (Luangthongkum, 1977) Syllable-timed (Corder, 1973, Asher, 1985) Syllable-timed (Pike, 1946, Hockett, 1958) Syllable-timed (Abercrombie, 1967, Catford, 1977) Syllable-timed (Tongue, 1979, Platt and Weber, 1980) Mora-timed (Blosh, 1942, Han, 1962) Mixed (Dauer, 1987, Nespor, 1990) Mixed (Dauer, 1983, Nespor, 1990) Unclassified Unclassified Unclassified Unclassified Unclassified Unclassified Unclassified
Tableau 3. Langues tudies dans les travaux de Grabe & Low (tir de Grabe & Low (2002: 13): Traditional Rhythmic classifications of languages investigated in the present study .
Grabe & Low ont cr leur corpus en utilisant des passages comparables de parole lue. Chaque langue est reprsente par un seul locuteur qui avait pour tche de lire The North Wind and The Sun leur rythme. Les enregistrements se sont drouls en chambre sourde. Le corpus a t segment manuellement. Les auteurs prcisent quelles ont mesur la dure des voyelles qui taient reprables sur le signal acoustique, cest--dire les voyelles voises, les voyelles dvoises ne possdant pas les caractristiques formantiques dune voyelle voise, car elles ne sont pas observables sur le signal. Les intervalles vocaliques sont mesurs de lattaque ( onset ) de la premire voyelle de lintervalle jusqu la fin ( offset ) de la dernire voyelle ; pour les intervalles consonantiques, la mesure est prise depuis la fin de la dernire voyelle de lintervalle (prcdent) jusqu 51
lattaque de la prochaine voyelle, sans porter attention au nombre de consonnes dans lintervalle. Enfin, les analyses acoustiques ne tiennent pas compte des hsitations, ni des pauses. Afin de mener bien leur tude, des mesures de dures vocaliques et intervocaliques sont calcules puis analyses par une quation appele Pairwise Variability Index (PVI). Cette quation va permettre dobserver les variations, en
calculant le degr de variation entre mesures successives. Les auteurs proposent en fait deux quations utilisables selon le type dintervalles (consonantiques ou vocaliques). La premire quation est appele raw Pairwise Variability Index (rPVI) :
tel-00455248, version 1 - 9 Feb 2010
Dans cette quation, m reprsente le nombre dintervalles (vocaliques ou intervocaliques), d reprsente la dure de lintervalle. Lquation na pas t normalise afin de ne pas supprimer les diffrences de structures syllabiques propres chaque langue. Cette mtrique permet de calculer les intervalles consonantiques et vocaliques ; pour ltude de Grabe & Low (2002), ce calcul est appliqu uniquement aux intervalles consonantiques. La seconde quation, qui est normalise, permet de calculer galement les deux types dintervalles vocaliques et consonantiques. Grabe & Low (2002) lappliquent uniquement aux intervalles vocaliques:
Dans cette quation m reprsente le nombre ditems dans la phrase et d la dure de chaque item. Lquation est normalise afin de neutraliser les effets du dbit de parole. On calcule la diffrence de dure entre chaque couple successif de mesures, on prend la valeur
52
absolue de la diffrence que lon divise par la dure moyenne du couple. Les diffrences sont ajoutes, puis divises par le nombre de diffrences. Le rsultat obtenu est multipli par 100 car la normalisation produit des valeurs fractionnelles. A partir de ces calculs, Grabe & Low mettent deux principales hypothses : 1- les langues dites isoaccentuelles (anglais) auront des taux levs de variabilits vocaliques (nPVI_V) et intervocaliques (rPVI_C). Inversement, les langues dites isosyllabiques (franais) auront des taux de nPVI_V et rPVI_C bas. 2- les deux langues dites mixtes : le catalan aura un taux lev de nPVI_V avec un taux bas de rPVI_C, car il possde une structure syllabique simple et aussi des rductions vocaliques ; le polonais (langue structure syllabique complexe et pas de tel-00455248, version 1 - 9 Feb 2010 rduction de voyelles) aura un taux plus bas de nPVI_V que les langues isoaccentuelles mais un taux relativement haut de rPVI_C. Aucune hypothse na t formule pour les nouvelles langues entrantes. Les rsultats obtenus aprs calculs vont dans le sens des prdictions des auteurs. Les valeurs obtenues saccordent avec la classification de langlais, nerlandais et allemand comme langues isoaccentuelles et le franais, lespagnol comme langues isosyllabiques : les variabilits de dure sont beaucoup plus importantes pour les langues isoaccentuelles que les autres. Mais les auteurs ne prnent tout de mme pas une catgorisation de ces deux classes. Les valeurs obtenues pour le japonais sont similaires celle des langues isosyllabiques. Les rsultats du catalan et du polonais soutiennent lhypothse nonce. Notons cependant que le catalan a un taux de nPVI_V quivalent celui du franais qui na pas de rduction vocalique. Le thalandais est class isoaccentuel comme prdit ; et enfin le tamil ne serait pas isosyllabique car cette langue obtient des taux de nPVI_V et rPVI_C trop levs. En ce qui concerne les nouvelles langues ajoutes, elles ne conviennent aucune des trois classes ; leurs valeurs se chevauchent. Ltude ne sarrte pas l. Conscientes du manque irrvocable de sujets dans la composition de leur corpus, Grabe & Low testent la stabilit des valeurs obtenues par une analyse statistique. Elles concluent des rsultats satisfaisants et lefficacit de lquation PVI. Les auteurs signalent que si la plupart des rsultats favorisent laspect de catgorisation des langues, en aucun cas elles ne soutiennent lide de dichotomie:
53
This finding supports the rhythmic classification suggested by Pike (1946) and Abercrombie (1967), even if the evidence does not come from isochronous interstress-intervals or syllable-durations. There is no support, however, for a strict categorical distinction between languages with high vocalic and intervocalic PVI values and languages with low vocalic and intervocalic PVI values. Rather, it appears that languages can be more or less stress-timed or syllable-timed (2002: 22). Grabe & Low prfrent donc parler de langues plus ou moins isoaccentuelles (ou syllabiques). Elles concluent un chevauchement des langues: [] the results show that there is overlap between the stress-timed and the syllable-timed group and unclassified languages [] (2002: 31). A laide du graphique tir de ltude de Grabe & Low (2002) comparons de plus tel-00455248, version 1 - 9 Feb 2010 prs les rsultats obtenus pour nos deux langues lues prototypes parmi les 18 langues et qui nous intressent pour notre propre tude: langlais et le franais. lgende : = stress-timed =syllable-timed =mora-timed =unclassified
Figure 2. Valeurs du PVI pour les 18 langues (tir de Grabe & Low, 2002:22)
54
Il est noter que les valeurs obtenues par le PVI fournissent des preuves acoustiques videntes pour les diffrences rythmiques que lon retrouve de nouveau entre nos deux langues. Daprs les rsultats de Grabe & Low (2002) nous relevons que langlais, langue dite isoaccentuelle, prsente un taux de variabilit vocalique nPVI important qui slve 57.2, ce qui la fait figurer en haut du graphique. Quant au franais, langue dite isosyllabique, on lui note un taux de variabilit vocalique (nPVI) beaucoup plus bas (43.5). Mme si langlais et le franais nappartiennent pas une dichotomie stricte des langues, que ce soit sous forme de catgorie, de continuum, de traits, de variabilit, ces deux langues sont dans tous ces cas opposes ou, de toute faon, ne se prsentent pas sur la mme ligne. Que ce soit au niveau de lorganisation temporelle ou des tudes sur la tel-00455248, version 1 - 9 Feb 2010 classification des langues, langlais et le franais prsentent des diversits rythmiques videntes qui ne peuvent les unir dans une mme catgorie. Remarques comparatives et limites des deux tudes proposes Les deux dernires tudes proposent une approche diffrente de celles proposes auparavant. Il apparat la vue des paragraphes prcdents quune dichotomie des langues se voit voler en clats . Par contre, une diversit rythmique des langues est prouve par des donnes acoustiques objectives. Cependant, les rsultats des deux tudes prsentes ci-dessus ne se rejoignent quau niveau des langues traditionnelles (cest--dire situes aux extrmes de la figure) ; pour ce qui est des langues situes au centre du graphique, les rsultats sont diffrents selon les calculs : avec les valeurs de %V (Ramus), la proportion des dures de voyelles est plus basse pour le grec, le catalan, le gallois, le luxembourgeois, et le japonais que pour lallemand. Donc, selon lhypothse de Ramus, ces langues devraient tre plus isoaccentuelles que lallemand. Par contre, le taux de nPVI_V de Grabe & Low montre le contraire, puisquil est plus bas pour ces mmes langues que lallemand ; suivant lhypothse de ces auteurs, ces langues devraient donc tre moins isoaccentuelles que lallemand. Malgr ces diffrences de rsultats, ces travaux reprsentent une grande avance dans la mesure o ils fournissent des preuves acoustiques dune variation rythmique des langues.
55
Nanmoins, divers problmes font lobjet de dbats dans la littrature, avec deux grands bmols concernant ces tudes : le nombre limit de sujets dans les corpus utiliss et la mthode de calcul utilise qui est directement associe au tempo. Wagner & Dellwo (2004) expliquent que la combinaison %V- C (Ramus, 1999) rend plutt compte de la structure syllabique que le rythme lui-mme et que ces mesures ne sont pas rsistantes au tempo. Ils prconisent trois points essentiels afin de mesurer le rythme : (i) les mesures doivent prendre en compte plus de paramtres que la structure syllabique, (ii) la mtrique doit tre rsistante aux changements de tempo dans la mesure o ces fluctuations ne sont pas en lien avec la structure rythmique, (iii) les paramtres choisis doivent capturer la nature squentielle des schmas rythmiques. Barry & al. (2003) commentent et tudient le mme problme expos tel-00455248, version 1 - 9 Feb 2010 prcdemment, savoir le lien entre les mesures rythmiques et le tempo de la parole. Ils montrent que C et V sont directement associs au paramtre du tempo. Par ailleurs, une seconde analyse mene par Russo & Barry (2008) vient confirmer ltude de 2003 et montre que le %V est un paramtre rsistant au changement de tempo. Hirst (2009) montre que les paramtres acoustiques proposs par Ramus ne pourraient tre rellement considrs comme acoustiques. Les mesures proposes par Ramus reposent sur une segmentation linguistique pralable du signal, en phonmes, et sur une classification des phonmes en consonnes (C) ou en voyelles (V). Lauteur explique quaucune de ces oprations nest acoustique et que le mme rsultat peut tre obtenu en mesurant le pourcentage du nombre de phonmes vocaliques, par rapport au nombre total de phonmes et lcart type du nombre de phonmes consonantiques dans les diffrents intervalles consonantiques.
Mtriques rythmiques et tempo: nouvelles propositions Des recherches rcentes tentent damliorer lefficacit des mtriques (Hirst, 2000 ; Dellwo 2006, White & Mattys, 2007) et apportent de nouvelles propositions sappuyant sur une mthode de calcul diffrente. Hirst (2000) propose dutiliser un nouveau paramtre sappuyant sur le coefficient de variation (not dsormais cv), une mesure de dispersion relative, calcule selon la formule: 56
Lauteur explique que le cv est indpendant de lunit de mesure, ainsi que du dbit de la parole. Selon Hirst (2000), les paramtres de Ramus sont intressants mais dautres paramtres (tels que le cv) pourraient amliorer la discrimination. Ds lors, lapplication de ce nouveau paramtre est teste par Fernandez-Cruz (2000) qui utilise le coefficient de variation pour les intervalles consonantiques afin de distinguer le portugais europen (PE), le portugais brsilien (PB) et le portugais afro-brsilien10(PAB). Les paramtres de Ramus (C_ % V) permettent de distinguer le PAB du PB ; en revanche, la combinaison cvC-%V propose par Hirst donne un meilleur classement, et ce au niveau des trois dialectes. La combinaison cvC-%V est la reprsentation paramtrique rythmique la plus robuste dans tel-00455248, version 1 - 9 Feb 2010 cette tude. Herry (2001) et Herry & Hirst (2002) appliquent cette mme mthode pour distinguer les productions de francophones de celles des natifs anglais. Parmi une quinzaine de paramtres, une analyse statistique en arbre de rgression, effectue avec le logiciel CRUISE, rvle que le coefficient de variation des intervalles consonantiques, corrl avec dautres paramtres intonatifs, est le paramtre le plus discriminant. Dellwo (2006) ritre la proposition avance par Hirst et prconise galement dutiliser le coefficient de variation et prsente VarcoC , qui se base sur le calcul du coefficient de variation des consonnes, cest--dire lcart type des dures des intervalles consonantiques divis par la moyenne des dures des consonnes, multipli par 100. Les variations de tempo sont normalises. Dellwo (2006) teste VarcoC et C sur des productions de diffrents tempos afin de discriminer langlais et lallemand du franais. Il observe que VarcoC discrimine clairement les langues en question et ce pour les diffrents types de tempo analyss. VarcoC varie en fonction des tempos analyss mais la corrlation nest pas systmatique selon la langue. Cette nouvelle mesure dintervalles normalise est reprise par White & Mattys (2007) et applique galement aux voyelles. Les auteurs testent
Selon ltude de Fernandez-Cruz (2000), le portugais afro-brsilien aurait les caractristiques du portugais avec des bases prosodiques du Bantoue.
10
57
les diffrentes mtriques proposes, les indices de variabilit (rPVI, nPVI), les intervalles de mesures (%V, C, V) et les intervalles de mesures normalises (VarcoV, VarcoC) afin de distinguer quatre langues : langlais et le nerlandais (isoaccentuelles), le franais et lespagnol (isosyllabiques). Les rsultats montrent que la combinaison VarcoV, nPVI_V et %V donne la meilleure discrimination. Ces rsultats donnent des perspectives positives dapplication des mtriques permettant de distinguer plusieurs langues. Application des mtriques: discrimination L1/L2 La premire utilisation de ces mtriques est destine distinguer des structures rythmiques diffrentes entre les langues. De nombreuses tudes11 ont dmontr des rsultats intressants dans la discrimination des langues. Low & al. (2000) examinent les tel-00455248, version 1 - 9 Feb 2010 diffrences de classification entre langlais britannique (isoaccentuel) et langlais de Singapour (isosyllabique) en utilisant lindex de variabilit. Ils montrent que les dures des voyelles sont peu prs gales, contrairement celles de langlais britannique, et que les rductions vocaliques semblent moins frquentes en anglais de Singapour (inspection F1/F2). Lin & Wang (2007) ont vrifi, par lutilisation des corrlats acoustiques proposs par Ramus et par Grabe & Low, limpression auditive que le chinois mandarin tait une langue isosyllabique. Paralllement, peu dtudes ont t menes sur lutilit des mtriques destins une application de discrimination L1/L2 ; et pour la plupart de ces tudes, la langue cible porte en gnral sur langlais (L2) mais aucune ne sest rellement penche sur les productions des francophones en langue anglaise. Une premire utilisation consiste mettre en avant, ou non, une discrimination dans la production de deux langues chez les bilingues en utilisant la mtrique propose par Grabe & Low (PVI). Whitworth (2002) tudie le rythme des enfants bilingues anglais/allemand en utilisant le rPVI et le nPVI afin dobserver linfluence de la langue
Nombreux exemples pourraient tre cits mais le but nest pas dtablir une liste exhaustive des tudes menes, nous citerons donc deux exemples reprsentatifs des travaux rcents mens dans ce domaine.
11
58
maternelle des parents sur la production des enfants dans les deux langues. Carter (2005) analyse les productions despagnols natifs (L1), danglais amricains natifs (L1), et de locuteurs espagnols bilingues en anglais partir denregistrements dinterviews raliss dans les deux langues. La mtrique du PVI a t utilise montrant des diffrences rythmiques entre les productions. Le taux de PVI des bilingues ainsi que celui des espagnols est bien plus bas que celui des natifs amricanophones. Quelques autres tudes tentent de discriminer des groupes dapprenants, de divers niveaux, par rapport aux natifs. Une des premires analyses L1/L2 est celle propose par Markus et al. (2003) qui prsentent une tude comparative des deux mthodes de calcul proposes par Ramus (1999) et Grabe & Low (2000) : le but est de comparer les rsultats obtenus des mesures acoustico-phontiques des natifs ltoniens et des apprenants russes tel-00455248, version 1 - 9 Feb 2010 ayant choisi le ltonien comme seconde langue, sachant que le russe est class comme langue isoaccentuelle (aura donc tendance un fort taux de variabilit entre les intervalles) et le ltonien comme langue isosyllabique (aura une faible proportion de variabilit entre intervalles). Le corpus utilis est compos de 10 natifs ltoniens et de 10 apprenants russes de deux niveaux diffrents (faible et fort) allant de 15 60 ans. La tche tait de lire un court passage dun texte en ltonien. Les rsultats obtenus, selon la mthode Ramus, montrent des diffrences par la variable ( C : variabilit intervalles consonantiques) : les russes de bas niveau en ltonien montrent une variabilit consonantique deux fois plus grande que les russes dun bon niveau et que les natifs. La variabilit des intervalles vocaliques (V) est presque identique pour les russes de bon niveau et les natifs, le taux est plus faible pour les russes dits faibles . Le pourcentage dintervalles vocaliques (%V) ne montre aucune diffrence entre les trois groupes. Pour la mthode Grabe & Low, la variabilit des intervalles vocaliques (nPVI) montre des valeurs plus leves pour les russes de faible niveau, mais aucune diffrence significative entre les russes forts et les natifs. La variabilit des intervalles intervocaliques (rPVI) est similaire pour les natifs et les russes de bon niveau, par contre le taux de variabilit des russes de faible niveau est beaucoup plus lev. Cette tude met en avant, par des proprits rythmiques et en utilisant des mesures acoustiques proposes par Ramus et Grabe & Low, les distinctions entre les schmas rythmiques de natifs et non natifs, de la mme faon que ces calculs sont oprs pour distinguer les catgories rythmiques des langues. Pour conclure leur recherche, les
59
auteurs se questionnent afin de dterminer jusquo les proprits rythmiques peuvent caractriser les types particuliers daccent tranger (2003 :10). Stockmal & al. (2005) sinspirent de ltude de Markus et al. et exprimentent les mtriques de Ramus et de Grabe & Low sur des productions dapprenants russes (L1) en ltonien (L2). Les rsultats obtenus pour les groupes de natifs ltoniens et des apprenants dun bon niveau sont trs proches tandis que les apprenants dun niveau faible sloignent des deux premiers groupes. Utilisant les mmes mtriques ainsi que le Rhythm Ratio (RR) de Gut & al. (2001), Nava & al. (2008) montrent une discrimination entre les productions des espagnols en anglais. Les apprenants espagnols de bon niveau obtiennent des rsultats proches de ceux des natifs anglais, tandis que les apprenants de niveau faible ont des rsultats proches des productions des natifs espagnols. tel-00455248, version 1 - 9 Feb 2010 Lin & Wang (2005) choisissent dutiliser uniquement la mtrique propose par Ramus afin dtudier linfluence du chinois (L1) sur langlais canadien (L2). La discrimination des productions de chinois en anglais est tablie par la combinaison C, %V. Les dernires tudes, prsentes ci-dessous, analysent les productions dapprenants afin dobserver linfluence du rythme de la L1 sur la L2. Le procd utilis est celui dune analyse comparative des prcdentes mtriques. Sont galement inclues les dernires propositions dtailles prcdemment, savoir le coefficient de variation des intervalles consonantiques (cvC) et le coefficient de variation des intervalles vocaliques (cvV). White & Mattys (2007) analysent linteraction L1/L2 entre le castillan (L1) et langlais britannique, et entre le nerlandais (L1) et langlais britannique. Pour cette distinction L1/L2, les rsultats montrent que VarcoV et %V offrent la meilleure distinction entre les deux niveaux natifs/non natifs. Ces rsultats donnent des perspectives positives dapplication des mtriques permettant de distinguer des productions natives/non natives et dobserver ainsi linfluence du rythme de la L1 sur la L2. Une seconde tude mene par Grenon & White (2008) analyse linteraction entre langlais canadien et le japonais par des apprenants japonais. Ltude indique que les corrlats utiliss (%V, varco V, rPVI_C) rvlent des distinctions rythmiques entre les diffrentes productions des natifs et des apprenants. Les auteurs concluent que ces
60
mtriques peuvent indubitablement tre appliques dans le cadre dune distinction L1/L2. De manire gnrale, ces tudes ont montr que les scores obtenus pour les productions des locuteurs L2 se situent lintermdiaire, cest--dire entre celles des natifs de la L1 et celles des natifs de la langue L2. Il est noter quen fonction de ltude mene, diffrents corrlats taient utiliss et tous nont pas donn le mme rsultat. Il semble donc que certaines combinaisons de paramtres soient plus efficaces que dautres. Pour lensemble des travaux prsents ci-dessus, il est possible de conclure que les mtriques appliques permettent de donner une tendance rythmique des productions et de distinguer ainsi les diffrences natifs/non natifs . Tout particulirement, les travaux de White & Mattys (2007) montrent une claire distinction entre les productions dapprenants castillans tel-00455248, version 1 - 9 Feb 2010 et nerlandais avec des natifs anglais et mettent en avant lutilit des mtriques, plus particulirement la combinaison VarcoV-%V dans la discrimination du rythme de locuteurs natifs/non natifs.
61
Synthse
La prsentation de la notion de rythme a montr que ce dernier jouait un rle important dans le quotidien de ltre humain. Une dfinition sest dgage de cette notion complexe que nous proposons de dcrire selon les termes de Di Cristo & Hirst (1977) comme lorganisation temporelle des prominences .
Par la suite, les principales diffrences prosodiques nonces dans ce chapitre ont permis dtablir certaines interfrences rythmiques qui pourraient caractriser les productions du locuteur francophone en anglais et permettre de rendre compte des difficults auxquelles lapprenant est confront. tel-00455248, version 1 - 9 Feb 2010
Par ailleurs, il a t not que la perception du rythme repose sur la rptition de syllabes ou de syllabes accentues. Traditionnellement, le rythme est associ lide dunits isochrones, soit des syllabes, soit des pieds (Lloyd James, 1940 ; Pike, 1945). Nanmoins, lincapacit contrler par des donnes acoustiques ce qui est peru auditivement conduit une remise en question des impressions auditives annonces qui sont la base de la classification des langues (isosyllabiques vs. isoaccentuelles). Plusieurs analyses instrumentales (Bolinger, 1965 ; Hoequist, 1983) ont t menes, mais les rsultats obtenus ne se sont pas rvls satisfaisants. Dauer (1983) sappuie sur le postulat traditionnel de la catgorisation des langues et propose une liste de proprits structurelles qui varient en fonction des langues. Une nouvelle catgorie de langues, appeles langues rythme mixte, est cre et se situe entre les deux opposs . Le concept de classification stricte des langues sassouplit, on parle alors plutt dun continuum. Rcemment, la proposition de diffrentes mtriques se basant sur les propositions de Dauer introduit de faon objective des donnes acoustiques, prenant en compte la dure des intervalles consonantiques et vocaliques (Ramus, 1999 ; Ramus & al., 1999 ; Grabe & Low, 2002 ; Dellwo & Wagner, 2003 ; White & Mattys, 2007). Certaines faiblesses telles que la non normalisation du tempo de certaines mtriques, ou encore lutilisation de petits corpus due la lourde tche de segmentation en units consonantiques ou vocaliques, ont t mises en vidence. Malgr tout, lapplication de ces mtriques a donn des rsultats 62
intressants dans la discrimination des langues, ainsi quau niveau danalyses interdialectales. Par ailleurs, peu dtudes (Nolan, 2000 ; White & Mattys, 2007) ont t menes sur limpact du rythme de la L1 sur les productions de L2 et lutilit que ces mtriques pourraient jouer dans ce rle de discrimination L1/L2. A notre connaissance, aucune recherche na t entreprise sur les productions de francophones en anglais. Enfin, les recherches conduites par White & Mattys (2007), proposant lutilisation de nouvelles mtriques, pourraient tre intressantes afin dvaluer la production rythmique des apprenants francophones en comparaison de celle des natifs et de tester si le rythme produit est plus proche dun rythme franais ou bien sil se rapproche dun rythme anglais. Cest sur cette tude que nous nous fonderons pour mener les analyses tel-00455248, version 1 - 9 Feb 2010 exprimentales de notre recherche, en procdant une analyse comparative des mtriques les plus utilises dans la littrature, appliques aux productions en anglais, de locuteurs francophones.
63
tel-00455248, version 1 - 9 Feb 2010
64
tel-00455248, version 1 - 9 Feb 2010
CHAPITRE 2. ACQUISITION DUNE LANGUE
65
tel-00455248, version 1 - 9 Feb 2010
The far side. by Gary Larson. 1983, 1984 Chronicle Features, San Francisco, dans Fromkin & Rodman (1998:347) An introduction to Language, Harcourt
Dans ce chapitre sur lacquisition dune langue, nous exposons les diffrentes phases dacquisition de la prosodie et plus particulirement du rythme de la langue maternelle (L1) puis de la langue cible (L2). Nous prsentons diffrentes approches pdagogiques et nous analysons ce qui constitue un frein pour lapprenant dans son apprentissage. Ensuite, nous discutons le contenu dapproches technologiques qui tentent de rpondre aux difficults des apprenants et pourraient tre bnfiques pour lenseignement de loral en langue seconde.
66
2.1 Introduction gnrale

2.1.1 Langage : dfinitions
En premier lieu, nous nous devons de distinguer langage, parole et langue. Le langage est le moyen par lequel nous communiquons, la parole en est le vecteur principal et la langue est le systme de langage propre une communaut. Le langage est donc un moyen dexpression, de contact, de communication. Dun point de vue linguistique et pour cder la tradition, nous expliquons la notion de langage selon les termes de De Saussure (1968) qui dfinit le langage comme tant : la facult quont les humains de communiquer entre eux par des signes articuls . Dun point de vue psychologique, puisque nous nous apprtons aborder le thme de lacquisition du langage chez le nourrisson, le langage va permettre lenfant de crer des relations avec autrui ; il est intimement li au dveloppement et la structuration du fonctionnement psychique ; le langage est une fonction structurante de lorganisation du Moi de lenfant (Rondal, 1983). La grammaire gnrative prsuppose quune grande partie du langage est inne. Lart de communiquer nos ides dpend moins des organes qui servent cette communication que de la facult propre de lhomme davoir un langage fond sur une combinatoire de signes arbitraires (il suffit de nous rfrer la langue des signes utilis par les sourds et muets). Lorsque lon voyage dans le temps, nous nous apercevons que la parole tait perue au XVIIIme sicle comme un don, comme le miracle de la parole . Dans son discours physique de la parole, Graud de Courdemoy (1668) apparente la parole une innit de la raison : Je dsire seulement quon observe une vrit trs importante que nous dcouvre cet exemple des enfants, qui est que ds la naissance, ils ont la raison toute entire, car enfin cette manire dapprendre parler est leffet dun si grand discernement et dune raison si parfaite quil nest pas possible den concevoir de plus merveilleux []. Il est vident que la raison toute entire est ds le commencement puisquils apprennent parfaitement la langue du pays o ils naissent et mme en moins de temps quil ne le faudrait des hommes dj faits .
tel-00455248, version 1 - 9 Feb 2010
Cette remarque nous pose le problme de linnit du langage et fait ressurgir de nombreuses questions. Entre autres, dans le cadre de lacquisition du langage et plus 67
particulirement du systme rythmique, on peut notamment se demander si la structure rythmique chez le nourrisson est acquise et/ou inne. Nous exposons, dans la partie suivante, une brve reprsentation des diffrents concepts sur lorigine du rythme, dans le cadre de la description des systmes linguistiques qui sont directement lis au dbat du caractre inn du langage.
2.1.2 Origine du rythme dans le langage : horloge interne

Cette question de linnisme du langage nous ramne un vieux duel qui oppose deux concepts linguistiques, savoir celui de linnisme prn par Chomsky (1968), qui parle tel-00455248, version 1 - 9 Feb 2010 de tendance instinctive au langage et celui de constructivisme (ou
comportementalisme) suivi par Piaget (1950), qui cherche rendre compte des mcanismes de formation des connaissances. Dans le cadre de notre travail, partir de ce dbat oppositionnel, nous cherchons savoir quelle serait lorigine du rythme dans le langage. Certains chercheurs mettent en avant la prdisposition dune horloge interne plus communment appele horloge biologique qui serait naturellement ancre en nous. Cette horloge nous permettrait de reporter le rythme naturel biologique sur dautres activits, telles que la musique par exemple. Pour Fraisse (1956) les rythmes sont acquis pendant le stade de la petite enfance et une fois ancrs en nous, ils nous amnent la cration dautres rythmes sur les vnements qui nous entourent. Dautres auteurs sont alls plus loin dans cette rflexion. Sappuyant sur les travaux de Grosjean (1983) montrant limportance de la syllabe dans la structuration temporelle du rythme, Fant (1991) a cherch prouver par une analyse statistique, la rgulation de la rythmicit syllabique par une horloge interne. Son analyse tend montrer lmergence dattracteurs syllabiques situs des valeurs multiples dune horloge sur une base denviron 140 ms, ce qui correspond environ 7 Hz, cest--dire, une valeur trs proche de la frquence propre loscillation mandibulaire (cf. paragraphe suivant). Lors dune tude compare de langlais, du franais et du sudois,
68
Fant (1991 : 248) a galement remarqu que ces attracteurs sont aussi prsents pour les phnomnes de pauses : the average inter-stress interval within a short time memory span of about 4 seconds preceding pausesynchronizes an internal beat generating clock which sets a preferred pause duration . Dautres auteurs, tels que Davis & Macneilage (1995) ont montr limportance du rle de loscillation mandibulaire sur la structuration du dveloppement du langage. Ltre humain aurait donc physiologiquement une rythmicit naturelle. Cest sur cette mme ligne de rythmicit naturelle de lhumain que Konopczynski (1986) donne au rythme une origine neurologique. En effet, les donnes rcoltes par cet auteur ont montr un caractre isochronique initial et universel du rythme jusquau stade du babil infantile, pour finalement incorporer la structure rythmique de la langue tel-00455248, version 1 - 9 Feb 2010 maternelle. Ce point de vue rsout la dualit des deux concepts traditionalistes, opposant Chomsky et Piaget, puisquil runit la fois le caractre inn initial dune rythmicit due une horloge neurale , dans le stade du tout premier Proto Langage , pour basculer ensuite vers une acquisition de la structure rythmique du systme linguistique impose par la langue maternelle. Par ces diverses tudes, nous constatons la proposition dune origine biologique au rythme par le biais dune horloge interne, quelle soit simplement sous forme dinfluence reconduite sur dautres vnements, ou quelle soit composante physiologique de lhumain (mandibules et neurones). A la lumire de ces travaux, il semblerait que le rythme soit prsent ds les premiers instants de vie. Cest ce quoi nous nous intressons maintenant.
2.2 Acquisition de langlais langue maternelle (L1)

2.2.1 Introduction gnrale : le statut de la prosodie dans lacquisition du langage
Cela pourrait surprendre, surtout lorsque lon sadresse des non spcialistes de notre domaine, mais les lments prosodiques sont en fait les premiers lments acquis par lenfant et ce, bien avant lacte parolier. La recherche sur lacquisition du langage a donn lieu de nombreux travaux et a connu un dveloppement particulirement important dans 69
les annes 60 lorsque lintrt des chercheurs a bascul des inventaires lexicaux vers des recherches menes en phonologie avec, par exemple, louvrage de Jakobson (1941). Tout un ventail dtudes a t men allant des relations entre formes phontiques et leur pertinence linguistique (Stampe, 1969 ; Smith, 1973 dans Konopczynski, 1979), jusqu la grammaire ou le dveloppement syntaxique du langage enfantin. Pourtant un lment important reste oubli : la prosodie. En effet, mme si quelques pionniers tels que Lewis (1936) ou encore Kaczmarek (1953, cit par Konopczynski, 1986) ont tent den tenir compte, ce nest quen 1962, avec Faure, que la prosodie commence prendre son importance et que la littrature sur lacquisition du langage prend en compte cet aspect prosodique. Pourtant, la prosodie, avec tous les lments suprasegmentaux quelle englobe, joue un rle dterminant dans lappropriation de la langue maternelle chez lenfant. Nous savons que petit petit, le nourrisson sveille la prosodie avant mme davoir acquis les tel-00455248, version 1 - 9 Feb 2010 lments du niveau segmental. Limprgnation naturelle dune langue se fait dabord par les lments prosodiques, avant mme les caractristiques segmentales. Par la suite, nous verrons que dans les premires semaines de vie de lenfant, la prosodie (outre la gestualit) est le seul moyen de communication.
2.2.2 Acquisition du rythme de la langue maternelle

Le premier constat est que les tudes focalises sur lacquisition du rythme en L1 sont peu nombreuses. Certains chercheurs lexpliquent par le fait que la nature de la structure rythmique, chez ladulte, reste lusive ou nest pas compltement lucide (Kent & al., 1991 :135 ; Whitworth, 2002 :175) et que lon na pas encore trouv, de manire absolue, le moyen de la quantifier (Whitworth, 2002 :175). Malgr cela, nous avons tent de faire tat des travaux existants, en essayant de retracer lvolution de la structure rythmique dans lacquisition du langage. Notre propos ici, nest pas tant de donner une description minutieuse des tapes de lacquisition du langage, mais plutt de nous intresser lacquisition des lments prosodiques et plus particulirement du rythme12.
Mme si notre travail cherche se focaliser sur le rythme, il reste dlicat de ngliger les autres lments supra-segmentaux, ces derniers ainsi que llment rythmique formant un tout tiss et complmentaire quest la prosodie ; il parat donc difficile domettre les autres lments prosodiques.
12
70
Perception rythmique du ftus Ds sa vie prnatale, le nourrisson semble soumis aux sons, entre autre par le biais de la voix de ses parents. Mais comment les sons parviennent-ils jusquau ftus et comment ce dernier les peroit-il ? A quoi ressemblent ces sons perus de lintrieur ? Nous nous sommes donc hasarde dans lunivers du monde utrin, essayant de comprendre quels lments sonores taient perus et parmi eux, si le rythme de la parole en faisait partie. Nous tentons, premirement, de trouver une justification anatomique cette question, pour nous pencher ensuite sur des expriences qui dmontreraient une perception possible des sons et des squences rythmiques.
tel-00455248, version 1 - 9 Feb 2010
Elments neurophysiologiques
Nous exploitons brivement les lments neurophysiologiques du ftus afin de comprendre lexistence dune ralit anatomique qui soutiendrait lhypothse de certains linguistes (Querleu & Renard, 1981) ayant analys une relle audition ftale. La cration de tous les neurones corticaux a lieu entre la sixime et la dix-septime semaine de gestation. Lorgane de Corti est alors morphologiquement mature vers 4 mois. Il semblerait que vers 6 mois, le ftus acquiert des possibilits de perception auditive. On sait donc que les systmes sensoriels sont matures anatomiquement in utro. La perte de neurones et daxones commence ds la fin de gestation. Aprs la naissance, le dveloppement cognitif consiste en une puration et un amnagement : la perte de neurones saccompagne dune cration exubrante de jonctions entre les neurones, les synapses. Un neurone forme plus de mille connexions et en reoit encore plus. Il peut recevoir plus de dix mille messages en mme temps. Le cerveau de lhomme contenant plus de 100 milliards (1010) de neurones (Williams & Herrup, 2001), les spcialistes ont estim 1015 le nombre de jonctions. Cette densit synaptique explose la naissance. Le cerveau se sculpte ainsi sous linfluence de lexprience interne et externe. Le ftus baigne donc dj dans une atmosphre rythmique ; grce un quipement biologique et cognitif sophistiqu, le nourrisson peut recevoir les sons et ce, mme pendant la priode intra utrine. Cest ce que montre lexprience de Querleu & Renard (1981) que nous exposons dans la partie suivante. 71
Approche exprimentale
Le domaine de la perception intra-utrine est largement tay par les recherches menes ces vingt dernires annes. D'une simple constatation que l'enfant entendait avant de natre, on tend rentrer aujourd'hui dans le dtail de ses performances auditives. Dans une interaction constante avec la vie de sa maman, le ftus grandit et se construit, baignant dans une atmosphre rythmique : le rythme respiratoire et le rythme cardiaque, rguliers et binaires de sa mre, le rythme de son propre cur. A lexception de lodorat et de la vue, les sens du ftus slaborent avant la naissance et cest dailleurs loue qui est le premier sens actif. Notons, par ailleurs, que loreille possde trois fois plus de connexions au systme crbral que lil. tel-00455248, version 1 - 9 Feb 2010 Pendant la priode de gestation, le ftus nest pas labri des bruits extrieurs. Daprs Lecanuet (1995 : 9), l'utrus est un endroit relativement tranquille, les pressions moyennes tant comparables celles gnralement rencontres l'extrieur . Les hautes frquences sont attnues, et les principales proprits acoustiques du signal sont prserves, la prosodie galement. Les travaux de Querleu & Renard (1981) ont montr, en plaant un hydrophone miniaturis dans le vagin, puis dans lutrus gestant, que lenfant tait dans une ambiance assourdie. Tous les sons lui parviennent filtrs en passe-bas, de sorte que, physiquement, il peut capter tous les bruits numrs ci-dessus, y compris la voix maternelle (et selon lauteur, cette dernire est tout particulirement reprable dans les enregistrements) ; mais cest surtout la partie grave des sons qui est achemine, la zone aigu, au-del de 3000 Hz, tant attnue. Cest par le liquide amniotique, jouant le rle de filtre passe-bas, que le ftus est plong dans un univers acoustique grave, quil entend et baigne dans une atmosphre rythmique, soit biologiquement soit par les bruits perus. Cest ainsi que Konopczynski (1990 :172) met lhypothse que le bb, ds la priode prnatale, nage dans une ambiance rythme : Si, en outre, on retient lhypothse, non confirme actuellement, quil existe chez le ftus un apprentissage, une adaptation des stimulations rptes [] et sachant que le rythme biologique et le rythme de la parole ne sont pas synchrones, il sensuit que le rythme de la langue maternelle est lun des premiers lments linguistiques auquel est soumis le bb, et ce ds sa vie prnatale ;a fortiori plus tard, lorsque, se trouvant dans un environnement sonore bruyant, lui parviendront, non point les lments segmentaux, mais lessentiel des mlodies et surtout des squences rythmes . 72
Si lauteur insiste sur le caractre non confirm de lhypothse et le manque danalyses, de plus rcentes tudes renforcent lide que le rythme est dj peru et reconnu par le nourrisson et ce, ds la naissance. Reste savoir si une exposition la langue maternelle peut favoriser, ds avant la naissance, un rglage perceptif sur les paramtres phontiques et/ou prosodiques qui caractrisent cette langue et la diffrencient des autres. La question est trop vaste pour tre traite en quelques lignes. Nous citerons lexemple dune exprience de lecture faite dans le dernier mois de grossesse, pendant lequel la mre lisait toujours le mme passage haute voix (Fromkin & Rodman, 1998). Il semblerait que grce aux expriences auditives reposant sur lhabituation (apparition de rponses motrices ou cardiaques et disparition de ces ractions due la rptition), les ftus ont pu tre entrans la reconnaissance de certains stimuli (histoire, extrait musical,...). Les rsultats de lexprience, obtenus en enregistrant le taux de succion, tel-00455248, version 1 - 9 Feb 2010 montrent qu la naissance les nouveau-ns rythment leur succion en fonction de la rception du passage de prose, lu cette fois par une autre voix fminine (passage habituellement lu par la mre en priode intra-utrine). Les auteurs concluent que le ftus est perceptif des proprits acoustiques du signal et que tout chantillon de langage, avec une intonation et un rythme normaux, alerte le ftus et le pousse rgler son coute sur cet chantillon, en augmentant alors son taux de succion. Le ftus semble donc percevoir le rythme, lintonation, la mlodie de la voix humaine. Afin de mieux se rendre compte de lambiance utrine dans laquelle baigne le ftus, il est possible dcouter un extrait de vie familiale dun couple, tel que cela serait peru par le ftus (la famille se retrouve autour du petit djeuner, coutant de la musique classique, et la maman fredonnant lair cout) (cf. annexes cd-rom, pour des exemples de fichiers son).
Emergences de structures sonores Rythme dans les cris enfantins
Le cri est la premire exprience que le nourrisson exprimente dans sa vie postnatale et ce sera son seul moyen dexpression durant ses premiers mois de vie. En effet, de la naissance jusqu lge de 4 mois environ, sa communication se fera principalement par 73
des pleurs exprimant ainsi des sentiments (Fitzpatrick, 2002). Plusieurs tudes ont t menes analysant les cris de lenfant et il semblerait que la structure rythmique du cri de lenfant ait des consquences sur les schmas communicatifs forms lors de la premire anne de vie. Lester (1985) analyse trois phases rythmiques prsentes dans les cris des nourrissons quil classe en trois priodes : -les priodes de longues dures, indiquant le moment et la frquence des pleurs, qui auraient une implication dans le dveloppement social de lenfant. Des mesures acoustiques faites 3 mois, ont permis de montrer Lester une corrlation entre les pleurs du nourrisson et les structures rythmiques proposes lors dune interaction enfant-mre. En effet, cest souvent par le biais de stimulations rythmiques tels que le chant, les tapotements, (etc.) que les pleurs du nourrisson sont apaiss, ce qui permet Lester de tel-00455248, version 1 - 9 Feb 2010 conclure que cela aide le nourrisson tablir des schmas temporels, en fonction des interactions sociales. -les priodes plus courtes mettant en vidence une coordination entre cycle respiratoire (phase dexpiration) et pleurs ce qui cre un schma rythmique. -les priodes courtes, telles que les changements de frquence fondamentale du cri. Ltude de Wolff (1969) tablit un cadre descriptif dun schma rythmique de base dune squence de cris spontans qui serait dailleurs observable 30 minutes aprs la naissance du nouveau-n, et resterait constante jusquau deuxime mois. Wolff affirme lexistence de squences de temps rgulires intrinsques aux pleurs ; il observe quune squence de pleurs sarticule comme suit : des pleurs, une pause de 0,2 seconde, un court sifflement inspiratoire, une pause, des cris.
Perception du nouveau n
Si ds les premiers instants de vie, un schma rythmique, quelle que soit sa forme, est mis en place, plusieurs tudes montrent que le nourrisson est capable de percevoir le rythme de la parole, voire de distinguer deux classes rythmiques diffrentes (si tant est que lon puisse parler de classes rythmiques).
74
Les travaux de Millot (1985) montrent que le nourrisson de moins de dix jours est capable de distinguer diffrents rythmes non langagiers. Dans son tude sur la dclration et lacclration du rythme cardiaque enfantin, Millot explique que lenfant pose dj une signification sur les divers rythmes et quil adopte un comportement de dfense pour ragir un rythme inhabituel. Daprs ces exprimentations, le nouveau-n ragit diffremment un bruit de rythme cardiaque de 72 120 battements par minute (ce qui est lquivalent de la mre et de celui de lenfant veill), qu un mme rythme mais produit par un mtronome. Lauteur conclut que la divergence de ractions face aux diffrents rythmes est attribue lexprience du rythme acquise pendant la priode ftale. Dautres expriences ont t effectues utilisant de la parole naturelle, lenvers ou encore filtre passe-bas. Lexprience de Mehler & al. (1988) montre que les nouveau-ns tel-00455248, version 1 - 9 Feb 2010 franais de quatre jours arrivent diffrencier le russe du franais, par le biais dune lecture dun passage de texte lu par une bilingue franco-russe ; les prfrences des nourrissons taient indiques par lutilisation dune ttine non nutritive. Les auteurs indiquent que les bbs parviennent diffrencier leur langue maternelle dune autre langue ; cependant, il semble que les langues distinguer doivent tre de classes rythmiques diffrentes pour tre discrimines. Ltude de Bosch & Sebastian-Galls (1997) montre que des nourrissons de 4 mois peuvent distinguer deux langues de mme classe rythmique (ici, lespagnol et le catalan), si lune dentre elle leur est familire. Leur hypothse se base sur le fait que le catalan possde des rductions vocaliques qui nexistent pas en Espagnol ; cette diffrence rythmique devrait tre dtecte par les nouveau-ns. Pour leurs analyses, les auteurs manient des stimuli de phrases normales et filtres passe-bas et utilisent une procdure dorientation visuelle avec des mesures de temps de raction. Elles concluent que les nourrissons seraient capables de discriminer des langues par des indices rythmiques. Une autre exprience (Nazzi & al., 2000) confirme les prcdentes tudes et montre que la discrimination de deux langues dune mme classe rythmique est possible mais seulement, si lune des deux est la langue maternelle du nourrisson. Lexprience de Ramus & Mehler (1999) montre que le nourrisson possde ds la naissance une capacit analyser le rythme de la parole. Afin de mener bien leur tude, Ramus & Mehler ont procd des mesures acoustico-phontiques sur huit langues ; 75
lexprience consiste dmontrer que les sujets discriminent les langues selon les indices rythmiques. Les auteurs formulent lhypothse que les nourrissons peroivent la parole avant tout, comme une succession de voyelles, spares par des consonnes. Une segmentation en consonnes/voyelles dun corpus de phrases parles en huit langues a donc t faite. La dure des intervalles vocaliques et consonantiques a t mesure. Les calculs ont t faits selon 3 variables : proportion des voyelles, cart type des intervalles vocaliques et consonantiques. Les rsultats montrent que les valeurs refltent la classe rythmique attribue chaque langue (cf. chapitre 1). Selon cette tude, le rythme dune langue pourrait donc tre signal par des indices acoustiques et phontiques, mesurables dans le signal de la parole. Cette exprience se distingue par le fait que les auteurs utilisent une technique de tel-00455248, version 1 - 9 Feb 2010 resynthse de parole qui permet, aprs une dgradation de stimuli, de ne garder que le rythme. Une autre exprience consistait resynthtiser les phrases, en remplaant les plosives par t-, les liquides par l-, les nasales par n-, les semi-voyelles par y-, les fricatives par s- et les voyelles par a-, liminant ainsi les diffrences phontiques entre les deux langues mais prservant leurs proprits rythmiques. Lexprience a montr que la discrimination tait effective, mme avec la neutralisation de lintonation. En revanche, sans les proprits rythmiques, cest--dire avec lintonation seule, la discrimination ne se fait pas. Le test a montr que les nouveau-ns taient capables de distinguer le japonais du nerlandais, et ce, par les proprits rythmiques seulement. Les auteurs concluent que le nourrisson possde, ds la naissance, une capacit analyser le rythme de la parole. Cependant, Ramus (2002) montre tout de mme que rythme et intonation restent la combinaison la plus favorable une meilleure discrimination. Lauteur formule lhypothse que cette capacit peut tre utile aux nourrissons dans lacquisition de la structure des syllabes de la langue maternelle. Le mme type de remarque avait dj t formul par Kent & al. (1991 :143), considrant le rle des schmas temporels dans lacquisition du langage.
76
Vocalisation et babillage Renforcement de la structure rythmique
La prochaine tape de communication pour le nourrisson est celle que lon connat trs communment sous le nom de babillage , qui sinstalle aux environs des 4 12 mois13. Avant de prononcer les mots, lenfant pratique les sons, lintonation et le rythme de la langue (Fitzpatrick, 2002). Il utilise des formes prosodiques exagres, des pauses ainsi quune accentuation amplifie. Lexprience de Pettito & Marantette (1991) montre dailleurs, que pendant la priode de babillage, les contours intonatifs produits par les nourrissons sont trs proches de ceux produits par les adultes. Face ce dveloppement langagier, lentourage de lenfant aura tendance utiliser le baby talk (Dodane, 1999). tel-00455248, version 1 - 9 Feb 2010 Di Cristo (2002) fait remarquer que des phnomnes articulatoires sont dj prsents et ancrs, et ce avant mme que la parole napparaisse, donnant lieu une rythmicit : de fait, on observe pendant la priode du babillage, un mouvement rptitif douverture et de fermeture des mandibules sur lequel le langage va se former et se dvelopper. Cest le dbut dune alternance ouverture/fermeture du chenal phonatoire mais avec des dures irrgulires. Ainsi Di Cristo explique quun cadre rythmique est dj dfini, avant mme que la parole ne survienne. Cest pendant cette priode que la structure rythmique se renforce : lidentification du systme rythmique va permettre lenfant de dvelopper un outil de segmentation qui va conduire la construction de structures syntaxiques et dy ajouter par la suite les phonmes (Di Cristo, 2002). Ds deux mois, le nourrisson accorde un traitement particulier la syllabe, quil peroit comme un tout, et non comme une combinaison dlments distincts. La prosodie naturelle force lcoute des bbs et par ce fait, elle aiderait leur attention se porter sur les
La dure diffre selon les auteurs, nous avons donc englob toutes les dates donnes en dfinissant cette priode.
13
77
variations phontiques. La prosodie serait une glue perceptive pour les squences de parole. Face ce comportement rythmique observ dans la phase de babillage, plusieurs tudes tentent de rendre compte du dveloppement langagier de cette phase en utilisant comme unit danalyse, la syllabe, allant de la simple phonation une combinaison de type CV. Oller (1978) distingue deux priodes lintrieur de la phase babillage . La premire, est une squence rpte de syllabes ouvertes, type CV quil nomme le babillage canonique (ba-ba-ba-ba, par exemple). Suite cela, (denviron 6 10 mois) intervient la priode de babillage multi-syllabiques qui consiste en un enchanement de syllabes varies, mais toujours de type CV (ba-bi-da-de, par exemple). Oller montre dans son tude que tel-00455248, version 1 - 9 Feb 2010 lmergence de syllabes saccompagne de variations prosodiques telles que changement de la qualit de voix, de la mlodie et de lintensit ainsi que des variations du taux de pauses. Elbers (1982) observe son propre fils et distingue trois types de squences dveloppementales dans le babillage de lenfant ; elle constate : syllabe simple, syllabe rpte, syllabe concatne. Un bmol pour cette tude qui repose sur une observation et non sur des analyses acoustiques concrtes. Kent & al. (1991) expliquent que le babillage du bb partage une caractristique avec la parole qui est une srie de structures de mouvements organiss en syllabes. Une attention particulire est porte la syllabe en CV cause de sa primarit dans le babillage. Selon lauteur, les vocalisations permettent lenfant de produire des syllabes CV dans une structure prosodique large, qui peut tre module de faon produire des changements de dure, dintensit ou de frquence fondamentale. Dun point de vue perceptif, lexprience de Burns & al. (2007) montre, lors dune analyse compare de nourrissons monolingues (anglais) et bilingues (anglais/franais), que de 6 8 mois aucune distinction nest faite entre les deux catgories ; les nourrissons rpondent de la mme faon, indpendamment de leur environnement linguistique, pour distinguer le franais et langlais. En revanche, de 10 12 mois, les monolingues montrent plus de difficults percevoir les deux langues ; lanalyse montre quils se ralignent sur les caractristiques de leur langue (langlais), qui vient compromettre le dveloppement 78
des reprsentations phontiques de langues additionnelles (alors que les bilingues distinguent parfaitement les deux langues).
Prosodie : structure daccueil
Lcoute des premiers babillages montre que le ton caractristique de la langue a t dj bien saisi par nos jeunes apprentis ; ce nest pas par un espranto universel que le nourrisson commence parler ! Les schmas rythmiques et intonatifs dune langue constituent la vritable charpente partir de laquelle le systme phonologique pourra sorganiser. Selon Konopzynski (1999 :68) la prosodie constitue en cela la structure daccueil de tous les autres lments de la parole, qui sans elle, restent vides de tel-00455248, version 1 - 9 Feb 2010 signification .
Acquisition de la structure rythmique Suite la priode de babillage, une phase plus longue, allant du premier mot des combinaisons de mots, jusqu la phrase plus ou moins labore, caractrise la priode du langage articul. Nous tentons de nouveau de nous attacher seulement la partie rythmique de lacquisition, bien quil semble y avoir une totale interaction dans le dveloppement des niveaux segmental et suprasegmental. A partir de deux ans, lenfant valide les caractristiques rythmiques de base de sa langue maternelle. Certaines tudes montrent que lacquisition des dures segmentales et lacquisition du rythme vont implicitement de pair. Kent (1976) explique que les dures segmentales auront un effet sur lapparence rythmique du langage. Ses analyses rvlent que la dure des segments vocaliques est gnralement acquise vers lge de trois ans dans les syllabes accentues, et lge de 5 ans pour les syllabes inaccentues. La production des dures consonantiques devient gale celle des adultes seulement lge de 8 ans pour les syllabes accentues, et 10 ans pour
79
les syllabes inaccentues. Par son tude, il indique donc que le schma rythmique ne peut sacqurir compltement, tant que les dures segmentales ne sont pas stables. Deux autres tudes mettent en avant la tche difficile, pour un enfant, darriver produire des syllabes rduites lorsque la langue possde un taux de variabilit vocalique important. Konopczynski (1995) et Grabe & al. (1999) dirigent une tude compare dans plusieurs langues, sappuyant sur le principe de dichotomie des langues. Konopczynski compare le franais (isosyllabique) et langlais (isoaccentuel). Elle postule quil serait plus facile dacqurir la structure rythmique du franais et conclut que lacquisition du rythme est lie la complexit de la structure rythmique, comprenant la prdiction de laccentuation lexicale ainsi que lallongement final. tel-00455248, version 1 - 9 Feb 2010 Grabe & al. comparent trois langues (le franais, langlais et lallemand) sur un corpus denfants de 4 ans. Les mesures de variabilit des intervalles vocaliques impliquent un classement possible des langues, selon lordre dacquisition du rythme : les plus rapides sont les Franais, puis les Allemands et enfin les Anglais. Les auteurs concluent que moins il y a de variabilit des intervalles vocaliques comme en franais, plus la structure rythmique sera acquise facilement. Cruttenden (2001 :254) rapporte dans son ouvrage, sans faire part dtudes analytiques ce sujet et prcisant quil y a trs peu de preuves lappui, que lacquisition du rythme par les natifs anglais se ferait dabord par la production des formes pleines des mots grammaticaux, et que la longueur des syllabes tendrait tre gale ; cela sous-entend quun anglais commencerait communiquer avec un rythme isosyllabique. Acquisition de laccent
Dun point de vue imitatif, il semble que les accents soient trs bien perus au dpart et ce, quel que soit lendroit o ils se trouvent (Leopold, 1948 ; Allen, 1972) ; par ailleurs, les enfants le reproduisent correctement. Ce serait vers 5 ans que les enfants ne reproduiraient plus que les modles correspondant leur langue maternelle, et commenceraient transformer ceux qui leur paraissent diffrents. Allen explique que lenfant perdrait petit petit les capacits auditives parce quil ne sen sert pas. Ltude de Todd & Reynolds (1973, cit par Konopczynski (1986)) montre que les mots accentus, porteurs de sens, sont mieux retenus que les mots inaccentus. 80
Indices prosodiques la structuration des noncs
Une fois lacquisition du langage plus avance (matrise de quelques mots, dbut de syntaxe etc. .), comment lenfant va-t-il parvenir extraire les phrases, les syntagmes et les mots, des units qui font sens ? Nous mettons en avant la capacit des nourrissons dtecter les caractristiques physiques des sons de la parole. Dans toutes les langues, le rythme et lintonation font partie de la structure formelle de la parole. Dans certaines dentre elles, les traits mlodiques convoient des diffrences de sens et de structure. Ainsi, en chinois mandarin, la forme ma peut avoir quatre sens diffrents, correspondant aux quatre tons utiliss dans cette langue. tel-00455248, version 1 - 9 Feb 2010 Lutilisation des indices prosodiques dans les diffrentes langues a montr leur rle dans la structuration de ces langues. Cest la prosodie qui va fournir aux nourrissons des possibilits de segmentation de la parole continue en units de sens. Les diffrents types dunits de parole, (propositions, syntagmes, mots) en tant que formes organises, sont reprs progressivement : les premires segmentations portent sur les units larges, bien finies prosodiquement, qui ensuite faciliteront lidentification de structures plus fines, qui leur tour, permettront lidentification des mots. Le rle des indices prosodiques apparat clairement. Cest aussi la simplification et lexagration des structures et de lintonation adopte par ladulte, qui facilitent la tche de segmentation de lenfant. La prosodie va alors jouer un rle majeur dans la structuration. Ce rle nest dailleurs pas seulement jou pendant la priode enfantine. De manire gnrale, la prosodie a une fonction structurante et organisatrice. Hirst (1977) illustre cette fonction par lexemple dun nonc, dont seule la prosodie permettra den distinguer deux sens : he hit the woman with a stick , peut signifier, que lhomme a utilis un bton pour frapper la dame, le dcoupage en units intonatives correspondrait alors : /he hit the woman/ /with a stick/ ; ou bien que lhomme a frapp la dame qui est munie dun bton ; dans ce cas, le dcoupage serait /he hit/ /the woman with a stick/. Au travers des diffrentes tudes menes sur lacquisition du langage au cours de ces dernires annes, il est ais dobserver et de constater que le rythme tient une place 81
prpondrante dans lacquisition de la langue maternelle. Les lments segmentaux arrivent au second plan se dveloppant sur la structure daccueil quest la prosodie. Mais quen est-il pour la L2 ? Dans la section suivante, nous discutons de la place de la prosodie dans lapprentissage dune L2 et des mthodes denseignement pratiques, puis nous nous interrogeons sur ce qui peut constituer une difficult pour des apprenants, et enfin nous exposons les solutions envisages pour pallier les difficults de lapprenant.
2.3 Acquisition de langlais langue seconde (L2) chez ladulte

2.3.1 Introduction gnrale : le statut de la prosodie dans lapprentissage dune
tel-00455248, version 1 - 9 Feb 2010
langue seconde
Ces trente dernires annes ont donn lieu une vritable ascension de la prosodie dans les tudes linguistiques ainsi que dans dautres domaines (psycholinguistique, (traitement automatique des langues (TAL), etc.). Autrefois en marge de la linguistique, la prosodie semble aujourdhui ubiquiste, et ce, de nombreux niveaux danalyse. Elle bnficie aujourdhui dun statut fort diffrent de celui subi plusieurs dcennies auparavant. Selon les propos de Di Cristo (2004 :68), on assiste un changement soudain du statut de la prosodie, jadis vritable Cendrillon de la communication pour en arriver une pidmie de prosodimania . Si lessor de la prosodie est significatif, notamment partir des annes 80, cette affluence masque malgr tout, une absence de rflexion didactique sur lenseignement de loral. En effet, lenseignement de la phontique semble avoir toujours pos un problme important pour les enseignants : que faut-il enseigner en priorit, et comment ? Lenseignement et les recherches sur lapprentissage des lments prosodiques nont t entrepris, que de manire sporadique, cela malgr limportance de la prosodie souligne par plusieurs phonticiens/didacticiens et ce, de multiples reprises. James (1976) souligne limportance de lenseignement des traits prosodiques dune langue seconde, qui, selon ses propos, a t fortement nglig. Propos confirms par Major 82
(2001 :14) : lauteur souligne que lenseignement des facteurs prosodiques est longtemps rest en retrait, au dtriment de lapprentissage de la prosodie : Segmentals have been the most thoroughly studied area in L2 phonology . Munro & Derwing (1995) ; Hardison, (2004) rapportent que les lments prosodiques jouent un rle trs important, voire plus important, que laspect segmental dans le discours en L2. James (1976:227) voque les consquences ngatives dune situation de communication, dans laquelle lintonation serait incorrecte : [] une intonation incorrecte ne risque pas seulement de crer des malentendus. Elle a parfois comme consquence une rupture complte de la communication . tel-00455248, version 1 - 9 Feb 2010 Pritchard (1985) fait part du contentement gnral, face lenseignement dune articulation des segments en franais L2, et constate que lintonation, en tant que phnomne suprasegmental, na pas souvent fait lobjet dtudes systmatiques. Vaissire (1989:3), cite par Freland-Ricard (1995) fait remarquer que lorsquun nonc est jug par un auditeur, la prosodie est tout aussi essentielle que la grammaire et la syntaxe : Une phrase prosodiquement anormale est aussi peu naturelle quune phrase agrammaticale . Ginestet (2002 :87) voque la porte de lintonation dans les changes discursifs : Il sagit dun phnomne trs important vu que dans la communication, en dehors des gestes, nous utilisons, pour nous faire comprendre, lintonation 38% et les mots pour seulement 7%. Cependant au niveau de la didactique du FLE14, le problme de lintonation est encore laiss de ct . Crystal (1969) souligne que le vocable suprasegmental tait ce qui venait en plus dautres lments, et seul le segmental tait prioritaire ; par cette approche, on considre alors que les lments prosodiques sont redondants et que leur tude nest pas ncessaire, contrairement celle des lments suprasegmentaux. Cela peut, entre autres,
14
Franais Langue Etrangre
83
expliquer pourquoi, pendant de nombreuses annes, seul lenseignement des phonmes paraissait crucial. Si lon retrace brivement lvolution de la prosodie dans le domaine de lapprentissage des langues, si lon ne peut pas parler ici de prosodimania , on peut constater une ascension de la prise en compte des facteurs prosodiques, mme si ces derniers ont longtemps t absents de lenseignement dune langue. Les annes 60-70 reprsentent un souffle novateur pour lenseignement de la prosodie, notamment avec des premiers essais de mthodes dapprentissage de la prosodie, lancs par Guberina (1965), suite llaboration dune approche verbo-tonale. Par la suite, un peu plus de recherches ont t entreprises, mettant en avant le rle tel-00455248, version 1 - 9 Feb 2010 fondamental de la prosodie dans lapprentissage dune seconde langue. Alliaume (1989:98) fait primer lapprentissage de la prosodie dune langue seconde sur la grammaire. Lauteur explique que lapprentissage de la grammaire ne serait possible que par le biais des lments prosodiques : Un tudiant qui peroit mal les lments prosodiques de la parole trangre est priv du seul vritable moyen dintgration dynamique de la grammaire de la langue . Lauteur explique que lintgration du systme prosodique de la langue mre est une contrainte pour lapprentissage de la prosodie dune seconde langue. Alliaume (1989:98) prconise donc une mthode, afin de dconditionner lapprenant de la prosodie de sa langue maternelle, en le reconditionnant la prosodie de la langue trangre quil apprend ; ce serait lui faciliter lintgration de la grammaire de cette langue, des contenus smantiques et affectifs du discours [] . Cest ce que lauteur a cherch exploiter par la cration dI-lang (la mthode de lauteur est dveloppe en fin de ce chapitre). Les annes 90 semblent voir le retour des manuels de phontique de correction articulatoire, qui reprennent, sur les principes classiques de lapprentissage des phonmes (en exemple, Ginsy (1995), quelques exercices sur lintonation et le rythme sont proposs. Actuellement, mme si encore parcimonieuses, les tudes sur laccent tranger commencent prendre en compte laspect prosodique de ce phnomne. Lepetit (1992) faisait remarquer qu la fin des annes 80, les travaux attachs aux lments 84
suprasegmentaux lis laccent tranger, ont fait lobjet de peu de recherches et pour la plupart, ces tudes ne portent que sur lenseignement de lintonation de langlais. A lheure actuelle, les recherches sur linfluence des facteurs prosodiques sur laccent tranger commencent merger (Magen, 1998 ; Major, 2001 ; Jilka, 2000, Munro & Derwing, 2001 ; Poqulin, 2009). Ces tudes rcentes montrent limportance du rle de la prosodie, la fois dans la production des apprenants mais galement dans la perception dun accent tranger. Jusquici, laccent tranger a toujours t considr comme caus par des stratgies articulatoires mal imprgnes ou mal reproduites. Si les facteurs prosodiques nont gure t mis en cause, il est indispensable de considrer une production, la fois au niveau segmental mais galement suprasegmental ; il semble difficile denvisager un nonc oral tel-00455248, version 1 - 9 Feb 2010 sans support prosodique. Il faut donc considrer la fois la structure des sons et la prosodie, qui sont essentielles dans lapprentissage. Mme si nous constatons une avance dans la considration porte la prosodie par la communaut scientifique et enseignante, il reste pourtant difficile croire, au vu des approches pdagogiques, que la prosodie ait rellement trouv sa place dans lenseignement des langues. Pourtant, le nombre de travaux portant sur lacquisition de la prosodie de la L2, de plus en plus grandissants, se concentrent essentiellement sur des notions derreurs de prononciation ou bien daccent tranger, et examinent la contribution des erreurs segmentales et suprasegmentales dans la perception de laccent tranger. Ainsi plusieurs tudes, dont celles de Jilka (2000), montrent que les erreurs segmentales ont un effet moindre que les erreurs prosodiques sur lintelligibilit et la perception auditive dun accent tranger dans les productions dapprenants. Si la progression de la prise en compte de la prosodie dans lapprentissage des langues a t lente, on peut observer quaujourdhui, dans la littrature, son rle fondamental (i) dans lacquisition L1/ L2, et (ii) dans la perception de laccent tranger, est reconnu. Les recherches fondamentales sur le rythme et lintonation se sont multiplies et ont largement progress. Malgr tout, cette avance reste insuffisante, et la prosodie continue dtre mise lcart au profit de pratiques articulatoires. Pourtant la prosodie devrait tre la base de lenseignement, comme elle lest la base de lacquisition de la langue maternelle. De nombreuses futures tudes restent incontournables, notamment sur son fonctionnement, mais aussi son dysfonctionnement en L2. Des travaux 85
interdisciplinaires runissant phonticiens, didacticiens, enseignants, informaticiens, techniciens seraient les bienvenus afin de poursuivre ltude de concepts thoriques mais aussi de trouver une application dans lapprentissage dune langue seconde. A partir de ces constats, nous nous intressons aux diffrentes mthodes ou approches actuelles destines lapprentissage dune seconde langue par la prosodie et notamment par le rythme ; nous tentons galement de comprendre en quoi la prosodie constitue une barrire dans lapprentissage L2.
2.4 Acquisition du rythme de la langue seconde

Depuis les annes 80, la floraison de travaux dans le domaine de lacquisition des langues secondes a permis dimportantes avances. Ces dernires ont trs certainement t tel-00455248, version 1 - 9 Feb 2010 rendues possibles par les rsultats d'tudes de grande ampleur, la fois longitudinales, cest--dire suivant des locuteurs, au long des tapes successives de construction d'une nouvelle langue, et aussi translinguistiques, cest--dire comparant les volutions chez des groupes d'apprenants de diffrents couples de langues. Mais l encore, on peut constater le manque de travaux dans lacquisition de la prosodie des L2 ; si les tudes sur lacquisition du rythme en L1 sont peu nombreuses, celles sur lacquisition du rythme en L2 sont dautant plus rares. En effet, il existe une relle paucit des travaux mens dans le domaine de lacquisition du rythme de la parole en langue seconde. Analyse et constat Ltude dAdams (1979) se place dans le cadre de lacquisition du rythme de langlais par des apprenants trangers. Suite une srie danalyses auditives et instrumentales, lauteur montre que le rythme des apprenants diffre de celui du rythme des natifs anglais et ce, selon plusieurs paramtres : (i) le manque dcart de dures entre les syllabes accentues et inaccentues, ce qui sous-entend que les syllabes inaccentues ne sont pas assez rduites, (ii) le manque de phnomnes de liaisons, (iii) des pauses inappropries et (iv) des accents lexicaux mal placs. Les remarques dAdams vont pouvoir tre mises en vidence par les mtriques, proposes partir des annes 90 ; en effet, les lments dun rythme inappropri seront saisis par la mesure des intervalles vocaliques qui mettent en vidence, par exemple, les problmes de diffrence de dures entre syllabes accentues et inaccentues, ou encore les intervalles consonantiques qui 86
refltent le manque de liaison, qui impliquerait linsertion ou la perte de consonnes dans le flux de la parole. Cette premire tude met donc en avant un certain nombre de problmes rencontrs par les locuteurs de L2 et indique quel niveau se situent les diffrentes variations dans le rythme des apprenants. La section suivante expose diverses propositions pdagogiques tentant de remdier ces variations rythmiques. Approches pdagogiques dans lenseignement L2
tel-00455248, version 1 - 9 Feb 2010
Approche acadmique
Nombreux sont les manuels sur lenseignement de la prosodie prsentant une approche tout fait traditionnelle. En effet, il sagit de donner les connaissances thoriques, en exposant les diverses rgles daccentuation lexicale pour fournir ensuite une application avec des exercices cherchant reprer la syllabe accentue. Ainsi, Ginsy (1995) propose un mmento rpertoriant toutes les rgles daccentuation lexicale (terminaisons fortes, les suffixes forts/neutres/mixtes, les prfixs, etc.). Il expose ainsi toute une srie de rgles permettant lapprenant de calculer la position de la syllabe accentue dans le mot. Sont galement prsentes les rgles daccentuation de phrase et cinq schmas intonatifs de base de langlais (glide up/glide down/high jump/dive/take off). Une forme similaire se retrouve dans louvrage de Carr (1999), dans lequel il consacre plusieurs chapitres au rythme de langlais avec des exercices cibls sur, par exemple, laccentuation lexicale et les rductions vocaliques. Le but de lauteur est de donner aux tudiants quelques concepts clefs dans le but de les encourager, par la suite, approfondir leurs connaissances (cf. Preface for teachers ). Approche quasi traditionnelle
Une premire approche, ici, consiste familiariser lapprenant avec, uniquement, le rythme et lintonation de la langue cible par le biais de suites dphonmatises dans lesquelles ne sont gardes que les lments prosodiques.
87
Montredon & al. (1975) proposent une approche pdagogique dexercices varis de prosodie pure, visant ltude de certaines modalits expressives de base, telles que linterrogation, la double question, lnumration, lexclamation, le doute, la surprise, etc. et ce, ds les tous dbuts de l'apprentissage linguistique. Lapprenant doit couter des enregistrements de suites syllabiques dnues de signification ou encore des intonations chelons rgressifs (de la fin vers le dbut). La reproduction des squences de type dadada lui permet ainsi de se sensibiliser au rythme et l'intonation (par la suite est introduit un travail sur des micro-dialogues). Bas sur le mme concept, Faure & Di Cristo (1977) proposent 67 petits dialogues reprsentant des situations de communication pour le franais. Ces exercices visent plus particulirement le travail de lintonation ; le rythme nest pas vraiment pris en compte et les exercices sadressent un niveau avanc dapprenants. tel-00455248, version 1 - 9 Feb 2010 Travail de la prononciation par le rythme
Un autre argument en faveur de limportance du rythme, prn par certains professeurs et chercheurs, est celui de lapprentissage de la prononciation de langlais. Dans nos recherches, nous avons constat un certain nombre darticles portant lutilisation du rythme comme aide et entranement la prononciation. Cest sur cette ide que Dickerson (1989) propose un manuel appel Stress in the Speech Stream (SSS) qui est constitu de textes ddis lexercice de prononciation. Le but de ce manuel est dtre plus particulirement destin des apprenants, de niveau intermdiaire ou avanc, afin de devenir des locuteurs comprhensibles . La mthode se focalise sur le rythme en proposant des exercices sur les accents de mots, de phrases, les contractions, les phnomnes de liaison, et les rductions de voyelles. Le livre propose aussi des entranements sur la prdiction du nucleus dans les noncs. Norris et al. (1995), reprochant aux mthodes dtre inefficaces en donnant de longues listes de vocabulaire, prconise la reconnaissance des schmas accentuels des mots, ainsi que de la structure rythmique de langlais, des fonctions du rythme et de lintonation comme structure informationnelle de la phrase ; il recommande essentiellement lenseignement des formes rduites afin que les tudiants prennent conscience de limportance de laccent. Norris cherche donner aux tudiants un outil de
88
comprhension du fonctionnement de la langue, qui les amne mieux couter pour percevoir la langue. Cest galement sur cet enseignement des formes rduites et des rductions vocaliques que Cruttenden (2001), dans son ouvrage, porte son attention dans un encart spcial intitul Advice to Foreign Learners (2000 :255) : il prconise aux apprenants de se concentrer sur lapprentissage des formes faibles des mots grammaticaux, et de les considrer comme des prononciations rgulires de la langue et non comme exceptions. Il conseille lutilisation des formes fortes uniquement en cas demphase ou de contraste. Par ailleurs, il prcise que les apprenants, parlant une langue caractrise par une isochronie syllabique telle que le franais, devraient porter une attention particulire aux raccourcissements rythmiques des voyelles pleines positionnes dans les syllabes suivies tel-00455248, version 1 - 9 Feb 2010 de /@, ,i/ ; titre dexemple, lauteur propose de pratiquer ce raccourcissement par le travail de paires de mots, telles que short vs. shorter ; lead vs.leading. Approches non conventionnelles
Une autre approche, qui au fil du temps semble devenir quasi conventionnelle car de plus en plus utilise, est la confluence des lments verbaux et para-verbaux. Il sagit de la mise en place dune gestualit qui accompagne la modalit verbale enseigne. Ainsi, la mthode consiste apposer un geste universel , comprhensible par des locuteurs de divers horizons, une mlodie cible (mais l, diffrente selon les langues). Llorca (1998) commente un exemple partir de lexpression de la dception, et compare plusieurs langues : en franais, dommage serait prononc avec une prominence finale de mot accompagne dun mouvement de haussement des paules ou dun mouvement de la main ; lallemand wie schade place une accentuation sur lavant dernire syllabe, lespagnol que lastima sur lantpnultime, etc. Un geste caractristique est donc associ une prosodie particulire et facilite de cette manire lapprentissage de la prosodie ; la gestualit est donc utilise pour mieux percevoir et produire la prosodie de la langue cible. Llorca dveloppe une technique pdagogique visant installer le rythme de la parole par lintermdiaire dun rythme corporel en utilisant des rythmimots. Elle explique que le mouvement permanent caractrisant lactivit parolire est marqu dans lorganisation du discours et est donn par le rythme et lintonation. La proposition faite ici se base sur une pdagogie gestuelle de la prosodie.
89
Au niveau prosodique, prosodier correctement une langue, autre que sa langue maternelle, implique, entre autres, une bonne perception de ses structures rythmiques et intonatives. Cependant, comme nous allons le voir, la perception phontique dune langue trangre pose un certain nombre de difficults. La section suivante prsente les diffrentes difficults auxquelles un apprenant est consciemment ou inconsciemment confront lors de lapprentissage dune langue seconde.
2.5 Problmes particuliers lis lapprenant

Nous avons vu dans une partie prcdente concernant lacquisition de la langue maternelle, que le nourrisson tait capable de diffrencier divers contrastes non natifs, mais tel-00455248, version 1 - 9 Feb 2010 quau fil des mois passs, la discrimination devenait de plus en plus ardue, en raison de son exposition la langue maternelle au dtriment des autres langues. On peut donc postuler que la tche dapprentissage dun adulte face une langue seconde sera bien plus difficile dans la mesure o celui-ci sera moins sensible aux phonmes mais aussi aux lments prosodiques de cette nouvelle langue. Il semble donc quavec lge, linfluence de la langue maternelle provoque diffrents types de difficults que nous exposons ci-dessous. Contraintes extra-linguistiques Des facteurs extralinguistiques peuvent influencer la production des apprenants L2. Tarone & al. (1978) pensent que ce sont les facteurs sociaux, personnels (la motivation par exemple), affectifs ou situationnels qui doivent tre incrimins, car ils forment un crible psychologique . Ce crible entrane alors trs vite une fossilisation des erreurs quil devient difficile de combattre une fois fixe. Anderson (1983) parle de pidginisation , cest-dire que cela correspond une acquisition linguistique o lexposition la langue est limite, et o des facteurs socio-affectifs et des contraintes de temps viennent affaiblir la saisie des donnes linguistiques. Les facteurs proposs par ces auteurs rappellent limpression selon laquelle certains apprenants, indpendamment de leurs niveaux respectifs de travail et dintelligence, ont plus de facilits que dautres parler une langue seconde. Par dduction fataliste, on pourra 90
entendre que certains sont dous pour les langues contrairement dautres. La considration des facteurs psychologiques ainsi que lensemble des facteurs exposs cidessous, nous permettent de mieux considrer ces phnomnes et de mettre alors profit les causes inconscientes des difficults rencontres par les apprenants pour un meilleur enseignement. Contraintes physiologiques Alliaume (1989) affirme que le rythme et lintonation mettent en uvre des processus musculaires et respiratoires particuliers chaque langue. Il explique que ce sont des lments constituants de la parole qui sont dynamiques et qui font appel une activit respiratoire et musculaire particulire, propre chaque langue, do la difficult de modifier un systme respiratoire et musculaire ancr dans la langue maternelle. Ainsi, tel-00455248, version 1 - 9 Feb 2010 laspect physiologique conditionnerait le bon apprentissage prosodique de la L2 (Alliaume, 2008: 14):
Chacun est physiologiquement conditionn par sa langue maternelle, ce qui implique une capacit perceptive rduite aux sons, rythmes, intonations de toute autre langue, mais aussi une sorte de sclrose des organes impliqus dans la production de parole ds quil sagit de dire dans une autre langue
Un autre outil , trs important pour lapprenant dans son apprentissage dune langue seconde, est bien videmment son oreille. Cependant, loreille a une capacit limite de discrimination. Landercy & Renard (1977 :185) expliquent que chaque personne a un seuil de discrimination et dintelligibilit qui lui sont propres, et quil existe un seuil daudibilit, universel, qui ne permet pas dentendre des sons au-dessous de 60 Hz chez ladulte. L'audition est le fruit d'un mcanisme complexe assur par les deux oreilles, pour permettre la perception. On distingue laudition, qui est donc le mcanisme dpendant de chaque sujet, de la perception qui serait lactivit mentale ; partir de cette distinction, nous pourrons postuler que les problmes daudition relveront des causes physiologiques, tandis que les problmes de perception relveront des causes linguistiques. Ltre humain a donc un mcanisme daudition dfini selon un seuil minimum et maximum, qui permet la perception dune palette de sons (sons de la langue maternelle) ; lors de lcoute dune langue trangre, la barrire linguistique empche la perception de sons nouveaux, malgr les prdispositions auditives possibles.
91
L1 source dinfluence de la L2 Les tudes menes en neurologie montrent, qu partir de 10 ans, le cerveau opre auditivement en fonction de la langue maternelle ; ds lors, linfluence de la L1 est grave dans les circuits neuro-moteurs de lapprenant. On a donc ici une incapacit dordre neurologique, reprsente par la perte de la plasticit crbrale lge adulte. Avec lge, lemprise de la L1 grandit et provoque des phnomnes dinterfrences avec les autres langues. Crible et Interfrence
Cette premire contrainte est tablie par la langue maternelle elle-mme. Le systme prosodique (de la L1) fonctionne comme un tat rflexe : il est ancr dans le tel-00455248, version 1 - 9 Feb 2010 cerveau et il prend le pas sur le systme de la seconde langue. Cest ce que Troubetzkoy (1949) appelle le crible phonologique :
Le systme phonologique dune langue est semblable un crible travers lequel passe tout ce qui est dit []. Les sons de la langue trangre reoivent une interprtation phonologiquement inexacte, puisquon les fait passer par un crible phonologique de sa propre langue .
Lapprenant aura donc tendance calquer sur la langue cible le modle rythmique et intonatif quil applique depuis sa naissance ; la langue maternelle constitue donc un obstacle dans lapprentissage dune seconde langue, et plus particulirement avec les annes passant. Ce sont les lments linguistiques de la langue mre qui empchent lapprenant de simprgner et acqurir la langue cible. Le deuxime phnomne, similaire lide du crible phonologique est celui de linterfrence, terme emprunt la physique pour dsigner une rencontre, conjonction de deux sries distinctes de phnomnes ; interaction (Larousse, 2003). Dans la didactique actuelle, lorsquon observe dans une production dun apprenant L2, un glissement des lments de la langue maternelle vers la langue cible, on parle plutt de fautes que dinterfrences. Ce terme t introduit par Weinrich (1953:1). Lauteur dfinit linterfrence comme un exemple de dviation des normes dune langue, qui apparat dans lexpression des bilingues comme un rsultat de contact:
92
"Those instances of deviation from the norms of either language which occur in the speech of bilinguals as a result of their familiarity with more than one language, i.e. as a result of language contact, will be referred to as interference phenomena."
A partir de ce concept, Weinrich tablit une grille danalyse des erreurs dinterfrences au niveau phonologique, morphologique, syntaxique et lexical. Dubois et al. (1994) dfinissent linterfrence comme un phnomne qui entrane un emprunt ou un calque de la langue mre sur la langue cible :
On dit quil y a une interfrence quand un sujet bilingue dans une langue cible A a un trait phontique, morphologique, lexical ou syntaxique caractristique de la langue B. Lemprunt et le calque sont souvent dus, lorigine, des interfrences. Mais linterfrence reste individuelle et involontaire, alors que lemprunt et le calque sont en cours dintgration ou sont intgrs dans la langue A .
tel-00455248, version 1 - 9 Feb 2010
Lapprenant tant marqu par des habitudes linguistiques de sa propre langue, ces phnomnes simposent lui, et constituent donc des contraintes incontournables qui ne facilitent pas la tche dapprentissage dune seconde langue. Seuls les plus jeunes sont moins marqus par ces contraintes. Mackey (1965) distingue deux priodes: lge du contenant et lge du contenu: la priode du contenant se rfre lenfance, pendant laquelle on acquiert et dveloppe le systme prosodique sans possder un grand contenu ; inversement, dans la seconde priode, qui correspond lge adulte, lapprenant possde un grand contenu mais est limit par le systme prosodique insuffisamment acquis. Cependant, plus lenfant prend de lge, plus lacquisition se corse: au cours de lapprentissage, le locuteur va carter progressivement les sons qui ne font pas partie de la langue ambiante. Cest pourquoi plus lenfant vieillit, plus lapprentissage dune deuxime langue devient difficile ; il ne peroit plus les sons quil a limins et la langue seconde sera marque par le systme prosodique de la langue maternelle ; on dira alors communment que lon parle avec un accent tranger.
Transfert et Interlangue
Dans les modles dacquisition, un fait, qui semble indiscutable, est que lon retrouve trs aisment dans les productions de L2 les caractristiques phonologiques de la
93
langue maternelle, ce qui sera trs certainement peru par les natifs comme un accent tranger. Lado (1957) propose de comparer les diffrences et similarits L1 & L2 afin danticiper les difficults des apprenants, expliquant quil est ncessaire de livrer une description scientifique de la langue cible, de manire la confronter celle de la langue maternelle de lapprenant. Lado pense que lapprenant tend reproduire les habitudes de sa langue maternelle dans ses productions en langue cible, lauteur (1957:2) parle alors de transfert positif ou ngatif :
[] the students who come in contact with a foreign language will find some features of it quite easy and other extremely difficult. Those elements that are similar to his native language will be simple for him, and those elements that are different will be difficult .
tel-00455248, version 1 - 9 Feb 2010
Cette thorie est la base de lanalyse contrastive (AC) dans laquelle les structures de L2 identiques celles de la L1 sacquirent rapidement et assez facilement, ce qui correspond au transfert positif ; en revanche, les structures particulires la L1 ou absentes en L2 sacquirent difficilement, ce qui correspond au transfert ngatif. Cette approche de lanalyse contrastive reoit diverses critiques, notamment par sa vision limitative base sur le fait que toutes les erreurs seraient le rsultat dun transfert. Or, dautres facteurs (notamment ceux exposs ci-dessus) sont prendre en compte dans les difficults dapprentissage des apprenants. Richards (1971) considre que le phnomne de transfert nest quun facteur secondaire. Lauteur distingue alors deux types derreurs: (i) les erreurs intra-systmiques ( intra-lingual errors ) qui reprsentent les caractristiques gnrales de lapprentissage de rgles, que ce soit en L1 ou en L2, dues une mauvaise acquisition des rgles, (ii) les erreurs dveloppementales ( developmental errors ) qui sont bases sur une mauvaise comprhension des fonctions des mots, dues des mthodes dapprentissage contrastives de constructions de la langue cible. Klein (1989) conteste lanalyse contrastive et formule un postulat contraire, stipulant que lorsque les structures des langues L1 et L2 sont proches, lapprenant ne peroit pas cette similarit, et cela le pousse ngliger sa production ; il fournira alors moins deffort lapprentissage de la langue cible, ce qui rduit son processus dapprentissage. A linverse, quand lapprenant est conscient des diffrences de structures et des difficults que cela engendre, cela le pousse mieux acqurir un nonc diffrent de 94
sa L1. Il nous semble pourtant quune structure identique entre les deux langues L1 et L2 pourrait au contraire, tre assimile plus facilement par un processus de mmorisation demandant moins deffort , la ressemblance pouvant mener une meilleure assimilation de langue cible. Au vu des diffrentes critiques envers lanalyse contrastive et au travers de lobservation des erreurs dans les productions dapprenants, une image de lerreur aboutit au concept dinterlangue (IL). En tout premier lieu, mise par Corder (1967), puis reprise par Selinker (1972), la notion dinterlangue dcrit une phase transitoire du langage des apprenants en volution entre la langue maternelle et la langue cible. Corder (1971) distingue les fautes occasionnelles et non systmatiques relevant de la performance, et les erreurs plus systmatiques qui dclent la comptence transitoire . Ds lors, le rle jou tel-00455248, version 1 - 9 Feb 2010 par la langue maternelle dans la production des erreurs est toujours pris en compte, en revanche la L1 nest plus le seul facteur en cause. Les caractristiques de linterlangue incluent toujours la notion de transferts, mais dautres stratgies dacquisition sont reconnues comme la simplification. Pour Selinker (1972), cette langue transitoire rsulte de quatre processus psycholinguistiques. Lauteur labore une grille dans laquelle il place en (i), les transferts linguistiques (ainsi que le transfert denseignement ( transfer of training ) qui correspondent la faon dont lapprenant va privilgier certaines formes, selon la manire dont elles ont t enseignes), en (ii) les stratgies dapprentissage propres lapprenant (comme lvitement, la simplification), et enfin, en (iii) les stratgies de communication et le phnomne dhypergnralisation des structures de la L2. A cela, Selinker ajoute ce quil appelle le stade de fossilisation , qui correspond au stade dapprentissage o le niveau de linterlangue de lapprenant stagne, dans la mesure o le systme linguistique de ce dernier se rapproche fortement du systme de la L2, mais o subsistent des formes linguistiques de la L1. Nous pouvons le constater ici, plusieurs thories exposant les modles dacquisition en L2 coexistent. Nous avons cit ici, les principaux concepts tays dans la littrature qui reprsentent des thories gnrales dont le point commun est bien lacceptation des concepts de transfert ou dinterfrence . Bass sur ces mmes concepts, il existe bien dautres modles thoriques de lacquisition, tels que le Native Language Magnet Theory (Kuhl & Iverson, 1995), ou encore le Perceptual Assimilation Model (Best, 1995). Nous citerons ici, plus en dtail, la thorie du Speech Learning Model (SLM) de Flege 95
(1995). Selon le modle SLM, laccent tranger serait d la forte tendance de lapprenant classer un son L2, voisin dun son L1, dans une catgorie phonique (perceptuelle ainsi que productive) prexistente. Un tel son serait reprsent dans une catgorie que lapprenant aurait dveloppe au cours de lacquisition de la langue maternelle (voir aussi Best, McRoberts & Goodell, 2001 ; Kuhl, 1998 ; Kuhl, 2000). Lauteur explique donc, que lorsque deux sons sont quasiment similaires, lapprenant aura une plus grande difficult dacquisition du son de la langue cible. En revanche, les segments diffrents peuvent tre acquis sans grande difficult car la diffrence de perception entre les deux sons est plus vidente pour lapprenant. Flege et Hillenbrand (1984) ont dmontr que les apprenants tardifs anglophones parviennent reproduire la voyelle franaise /y/ dune manire authentique. Les auteurs concluent quil convient alors dexaminer la prononciation de segments qui sont trs voisins dans les L1 et L2. tel-00455248, version 1 - 9 Feb 2010 Cependant, comme on peut le constater partir des explications donnes sur lexemple du modle de Flege, la plupart des recherches sur les modles dacquisition en L2 restent concentres sur les phonmes uniquement, et malheureusement trs peu dtudes portent sur lacquisition des traits prosodiques en L2. Malgr la prdominance des travaux portant sur laspect segmental de la L2, Lado a consacr une petite partie de sa recherche, sur les aspects daccentuation lexicale et de rythme ; cependant, aucun modle dacquisition de la prosodie na rellement t propos. Pourtant, la mme poque, Abercrombie (1967:36) souligne bien que les premiers aspects acquis (donc la prosodie) sont les plus durs modifier, une fois le locuteur adulte. Une description solide des phnomnes de transfert prosodique permettrait dtablir les caractristiques de la L1 qui influencent la prosodie des productions en L2. Le concept de transfert prosodique a donc t introduit, mais peu de travaux ont t mens dans cette optique-l.
Interlangue et transfert prosodique
Considrant la thorie de linterlangue, Calbris & Montredon (1975) ont montr que le rythme et lintonation de la langue maternelle sont les lments les plus ancrs dans
96
linterlangue de lapprenant, dans la mesure o ils relvent du domaine psychologique. Lapprenant subit alors un blocage inconscient au niveau prosodique. Wenk (1985) constate que linterlangue est caractrise par des units rythmiques qui empruntent les caractristiques la fois de la langue maternelle et de la langue cible. Plus rcemment, Jun (2005:4) reconnat lexistence dun transfert prosodique, selon lequel les traits prosodiques de la langue maternelle affectent la production de la prosodie de la langue cible :
[] by comparing the intonational categories and their realizations in the target languages, they can pin down the sources of prosodic interference and transfer.
Ltude rcente de Trofimovitch & al. (2001) analyse les effets de lge tel-00455248, version 1 - 9 Feb 2010 dexposition la langue cible, ainsi que le degr dexprience sur les caractristiques prosodiques des productions des apprenants. Les auteurs montrent que le facteur de lge influe sur la vitesse dlocution, la frquence et la dure des pauses, alors que le degr dexposition aurait un effet positif sur les traits rythmiques. Mennen (2006:4) considre quun transfert prosodique se prsente sous la forme dune interfrence, la fois phonologique et phontique. Elle explique quune influence phonologique relve des diffrences dinventaire de tons phonologiques, de leur forme et de la signification qui leur est attribue, par opposition une influence phontique qui sopre par une diffrence de ralisation phontique dun ton phonologique identique. Enfin, Rasier & Hiligsmann (2007) tudient le rle de la L1 dans lacquisition de la prosodie en L2, et tout particulirement dans lacquisition des pitch accents par des apprenants nerlandais et franais. Les auteurs se basent sur le modle intgr contrastif Integrated Contrastive Model (ICM) qui consiste en une analyse contrastive des productions comparatives des apprenants L2 et des natifs. Sappuyant sur divers travaux antrieurs, ils postulent que les apprenants L2 ont beaucoup de difficults distinguer entre linformation nouvelle et ancienne prsentes dans la phrase. De ce fait, les apprenants ont tendance accentuer voire emphatiser chaque mot de lnonc. De manire gnrale, selon eux, laccent est le phnomne prosodique le plus difficile acqurir en L2. Les rsultats, obtenus partir denregistrements de phrases nominales de type
97
-dterminant+nom+adjectif-, montrent des diffrences de placement daccentuation assez importantes et que les contrastes entre le franais et le nerlandais influencent le processus dacquisition. Par ailleurs, les auteurs ont not une correspondance entre les erreurs daccentuation et les erreurs de pauses et suggrent alors que les erreurs prosodiques sont cumulatives. Ces rcents travaux ouvrent la voix de nouvelles perspectives et ont une importance capitale pour le statut de la prosodie dans lacquisition des langues secondes. Malheureusement trop peu nombreuses, ces tudes ont besoin dtre approfondies et dveloppes, ce qui nous permettrait de mieux cerner les consquences de cet accent tranger sur la production de nos apprenants L2 et den tirer profit pour une meilleure pdagogie de loral. La partie suivante expose la question de surdit de lapprenant, au tel-00455248, version 1 - 9 Feb 2010 travers de trois approches lectroniques qui ont t cres dans le but de remdier aux problmes de perception de lapprenti en langue seconde. Approches lectroniques non conventionnelles : la perception au cur du problme Lorsque lon apprend une seconde langue lge adulte, la matrise totale, notamment des phnomnes prosodiques de la langue cible, est difficile. Cela, dailleurs, nous amne souvent parler daccent tranger, ce que nous avons vu prcdemment. Une hypothse possible cela est que nous avons du mal articuler des sons que nous navons pas pour habitude de prononcer. Une autre cause possible, expose ci-dessus, est que lapprenant adulte a de grandes difficults percevoir les sons de la L2 et donc les articuler correctement (en effet, cette absence de perception ne permet pas lapprenant dentendre ce quil produit rellement et qui nest que le calque de la L1). Pour rpondre cette surdit, diverses mthodes, donnant naissance de petits appareils lectroniques, replacent loral au centre de diffrentes approches pdagogiques. Le travail de la prosodie fait partie intgrante de la rducation de loreille. Ainsi, des mthodes audio-visuelles se dveloppent afin de pallier les difficults inhrentes pour la perception et la production dnoncs.
98
SUVAGs : Systme Universel-Verbo-Auditif-Guberina
Les premires gnrations, au dbut du XIXme sicle, se contentent dajouter une image une mthodologie audio-orale. Cest partir des annes 60 que lon peut considrer lapparition dune deuxime gnration de mthodes qui doivent leur existence la mthodologie structuro-globale. En effet, en 1955 Guberina dveloppe sa thorie verbo-tonale et en 1961 a lieu la commercialisation des premiers SUVAGs (Systme Universel-Verbo-Auditif-Guberina), appareils lectro-acoustiques (cf. figure 3). Cette mthode se dmarque du structuralisme classique, dans la mesure o ce nest pas la structure de la langue qui est considre, mais plutt la structure de la parole. Cette mthode est le fruit des travaux de deux quipes de recherches, celle de Gubrina luniversit de Zagreb et celle de Rivenc au CREDIF tel-00455248, version 1 - 9 Feb 2010 (Centre de Recherche et dEtudes pour la Diffusion du Franais). Se basant sur la thorie de Saussure selon laquelle le rle de la langue est dtre un instrument de communication, les quipes de recherche vont alors utiliser laudio-visuel pour rtablir cette fonction et redonner priorit la communication parle par le biais de limage.
Figure 3. Illustration des appareils SUVAGs en 1961 puis 2000
15
15
http://www.suvag.com/fr/histoire/chronologie.html
99
Les premiers travaux de thse de Gubrina (1939) mettaient dj en avant limportance du rythme et de lintonation dans lacquisition des langues. Les principes du systme verbo-tonal soulignent limportance du rythme et de lintonation comme facteurs optimaux de la structuration des langues, et donc de leur acquisition. Lobjectif est de transmettre le son de telle manire que lapprenant le peroive dans son champ optimal auditif . Gubrina (1974) explique que dans la bande totale de laudition humainement perceptible (16 16 000 Hertz), il sagit des plages dans lesquelles existent des restes auditifs . Ce champ optimal, qui correspond au recensement prcis de ces zones daudition, permet de diffrencier plus facilement les sons de la parole. Gubrina applique ses recherches en pathologie ainsi qu lenseignement des langues trangres et cre les SUVAGs LINGUA. Lauteur base alors son approche sur le fait que lapprenant est un sourd phonologique et quil est incapable de percevoir des sons quil ne possde pas tel-00455248, version 1 - 9 Feb 2010 dans son champ auditif restreint celui de sa langue maternelle ; le procd consiste alors modifier le signal acoustique, pour mettre en valeur les zones de frquences considres comme optimales dans la langue cible. Les SUVAGs donnent la possibilit de travailler llargissement du champ optimal afin que lapprenant puisse diffrencier les sons de la parole dans un champ plus tendu que linitial. Gubrina utilise donc ses SUVAGs LINGUA dans les premires tapes de lenseignement pour mettre en relief lintonation et le rythme ; plus prcisment, cest la deuxime tape de correction sur les 7 envisages qui porte sur le rythme et lintonation. Cest la visualisation, et non la traduction, de la situation par limage en sappuyant sur des aspects non verbaux tels que lintonation, le rythme, lintensit, les gestes, qui est mise en avant. La comprhension se fait alors par laudio-visuel. Lapprentissage des structures de la langue orale seffectue dans un contexte global , qui insre la dmarche dans lensemble des situations relles o se trouvent engags les sujets parlants. Cette approche na cess dtre dveloppe par son auteur au fil des annes. Cependant, Konopczynski (2001) fait remarquer que la notion de frquence optimale dune langue suscite de srieuses rserves parmi la communaut scientifique. Loreille lectronique
Ce premier travail daudiophonologie a inspir par la suite la cration dautres appareils. Les recherches de Tomatis (1971) lient le handicap linguistique lvolution de la maturation de loreille. 100
Tomatis, oto-rhino-laryngologiste, observe que chaque langue utilise de faon prfrentielle certaines plages de frquences sonores appeles bandes passantes . Selon Tomatis, les diffrences de frquences sont lies la diffrence de limpdance de lair en fonction du lieu, cest--dire de laltitude, de la vgtation, de lhumidit etc. En fonction de ces caractristiques, lair propagerait mieux certaines frquences et en attnuerait dautres. La mthode Tomatis se fonde sur les relations existant entre loreille et la voix, par extension, lcoute et la communication.
Si lon restitue loreille la possibilit de percevoir correctement les harmoniques perdus ou compromis, ceux-ci sont instantanment restitus dans lmission vocale ou instrumentale . (Tomatis, 1978:45)
Pour aider l'intgration d'une langue trangre, il convient, selon Tomatis, de donner l'oreille la capacit d'entendre les frquences propres la langue en question et, tel-00455248, version 1 - 9 Feb 2010 aussi, de suivre le tempo des temps de latence caractristique de cette langue ; le sujet deviendrait alors capable d'en reproduire les sons, le rythme et l'intonation avec une plus grande facilit. A partir de ses observations, Tomatis cre un appareil appel oreille lectronique qui faciliterait lapprentissage des langues trangres. La mise en application seffectue de la manire suivante : tant donn que le systme neuromusculaire de lapprenant est dj form pour laudition de sa langue maternelle, loreille lectronique va permettre dentraner le sujet entendre la manire de la population linguistique de la langue cible, et lui faire adopter la posture adquate de la langue cible. Ce processus se ralise par un filtrage, en renforant la bande passante et en introduisant les temps de prcession et de latence ainsi que la latralit auditive de la langue vise. Cela permet de stimuler lcoute, denlever les blocages, dintgrer plus rapidement la langue cible en rorganisant les mcanismes de communication. Progressivement, il se produit un assouplissement audio-oral. Si cette mthode est intressante, notre connaissance, aucune tude objective na valu lefficacit de cette approche. I-LANG : approche neurolinguistique
Suite des recherches et des travaux en neurolinguistique sur le fonctionnement de lactivit crbrale, Alliaume (1989) propose une nouvelle mthode utilisant lactivit du cerveau dans lacquisition prosodique dune seconde langue. Il cre un appareil appel ILANG afin de faciliter lapprentissage du systme prosodique de la langue cible. La
101
mthode consiste envoyer des frquences basses directement lhmisphre droit (dimension prosodique musicale et motionnelle), alors que le gauche reoit les noncs, la dimension linguistique du message. Lauteur explique que cest le cerveau qui commande simultanment les organes de la parole et qu il est important de sadresser directement lui en le stimulant. Alliaume distingue deux dimensions : lexpression de la langue et lexpressivit du sujet parlant qui sont insparables et complmentaires ; chacune, comme le montre le schma ci-dessous (Alliaume & Hesling, 1998 cit dans Aliaume 2008), est gre par lhmisphre droit ou gauche :
modalits non-verbales tel-00455248, version 1 - 9 Feb 2010
modalits verbales
kinsie
prosodie
lexico-grammatical
syntaxe
expressivit
expression
hmisphre droit
SIGNIFICATION
hmisphre gauche
Figure 4. Illustration des modalits de la communication et fonctionnement crbral.
Dans ses travaux, Alliaume explique que chacun des hmisphres joue donc un rle bien prcis, lhmisphre droit traite des modalits non verbales, quand lhmisphre gauche gre les modalits verbales, et lun sans lautre ne pourrait rendre compte de lacte langagier complet. Alliaume le rsume de cette faon (2008:15-16): -HG est plus impliqu dans les traitements des sons de parole et des intonations linguistiques (accents, accentuations spcifiques de la langue) -HD est plus spcialis dans le traitement des intonations affectives qui expriment par la parole ltat motionnel du sujet. [] 102
-la parole de lhmisphre gauche isol (HG), purement mcanique, perdrait son pouvoir de communication humaine qui est la fonction mme de la parole. -La parole de lhmisphre droit isol (HD) serait une modulation sans langage exprimant les motions la manire dun animal familier. A partir de ces constatations, Alliaume propose ainsi un nouveau systme, bas sur la prise en compte du fonctionnement crbral, dans lequel il utilise par lintermdiaire de I-LANG la spcificit de lhmisphre droit, qui traite de faon privilgie les frquences basses du spectre acoustique, sans ngliger les aspects verbaux. Il sagit donc dadresser lhmisphre droit la dimension prosodique (musicale) de la langue cible, pendant que lhmisphre gauche reoit simultanment la dimension linguistique. Par cette mthode, la perception des traits prosodiques (rythme et intonation) de la L2 est place au cur de tel-00455248, version 1 - 9 Feb 2010 lapprentissage. Alliaume semble offrir la possibilit aux enseignants de travailler la composante la plus difficile apprendre de la L2 quest la prosodie, par lusage de lappareil I-LANG, petit et simple dutilisation. Hesling (2000) exprimente I-LANG et prcise quune hyperactivit de lhmisphre crbral, exerce artificiellement par lappareil I-LANG, permettrait aux apprenants de progresser dans leur apprentissage. Les recherches en neurosciences pourraient donc constituer un apport considrable lenseignement de la prosodie dune L2, et lapprentissage des langues trangres en gnral. De ces trois mthodes se dgage un trait commun, se basant sur lide que lapprenant dune langue seconde ne pourra pas reproduire ou communiquer correctement ce quil ne peroit pas correctement. Les trois techniques exposes, SUVAGLINGUA, loreille lectronique et I-LANG, utilisent des appareils destins dconditionner lapprenant de ses habitudes auditives et articulatoires acquises avec sa langue maternelle, et le reconditionner au systme de la langue vise. Lenseignement de langlais, sil veut aider les apprenants surmonter les difficults inhrentes la perception et la production dnoncs, doit considrer le niveau segmental (ce quil fait dj) mais aussi le niveau prosodique et favoriser la place de lcoute et le travail de perception.
103
Cependant, ces appareils ne parviennent pas tre intgrs aux contextes institutionnels. En effet, ces mthodes sont apparues il y a maintenant plus de 35 ans. Nous pourrions voquer quelques raisons cela. Tout dabord, le manque dintrt pour la prosodie de la plupart des enseignants, qui privilgient lapprentissage des lments segmentaux, mais aussi le rle linguistique, ignor par manque de formation ou une formation incomplte. On peut voquer la relative technicit lemploi de ces appareils ainsi que le cot de linvestissement technique. Mais il faut galement mentionner le grand scepticisme que lefficacit de ces techniques peut poser. En effet, ces mthodes nont pas fait lobjet dvaluation, il est donc difficile de se baser sur de telles techniques, sans preuves objectives de leur efficacit. Il pourrait donc tre intressant de les tester sur plusieurs mois, et de les complter, en incluant un systme dvaluation de la prosodie, de manire mesurer la progression de lapprenant et de lui fournir une valuation tel-00455248, version 1 - 9 Feb 2010 objective de ses productions, ce qui nexiste pas lheure actuelle.
104
Synthse
Dans ce chapitre, nous avons rendu compte de la place essentielle de la prosodie autant, dans lacquisition de la langue maternelle, que dans lapprentissage dune langue seconde. Nous avons prsent diffrents concepts qui donnaient au rythme la casquette (Astsano, 2001) dhorloge interne, lui attribuant une origine biologique dans le langage. Nous avons dcrit les diffrentes phases dacquisition de la prosodie de la langue maternelle, en mettant en vidence le rle prpondrant du rythme dans la formation du langage. tel-00455248, version 1 - 9 Feb 2010 Cela nous a permis dobserver, dans une troisime section, que la prosodie tait un facteur essentiel dans la production des apprenants L2 ; cependant, elle ntait pas rellement place au cur des enseignements dispenss, car souvent dlaisse pour un enseignement de correction articulatoire. Il a par ailleurs t dmontr que le systme de la langue maternelle, mis en place ds le babillage, influence les apprentissages futurs de la L2, ce qui a permis de rendre compte dun certain nombre de difficults inconscientes chez les apprenants dune L2. Lapprentissage de loral dune langue seconde seffectue par la perception auditive que le crible phonologique semble rendre slectif. Dans cette optique, nous avons prsent quelques mthodes pdagogiques tentant damliorer la qualit de la prosodie des productions L2. La littrature sur lacquisition des langues L1 & L2 nous permet de constater le hiatus gigantesque entre les besoins des didacticiens et lincapacit de la prosodologie satisfaire leurs requtes, malgr ses avances immenses. Pourtant, la prise en compte de loralit en L2 passe ncessairement par celle de la prosodie. Les approches de Guberina, Tomatis, ou encore Alliaume pourraient tre envisages, dans la mesure o des tudes objectives dvaluation de ces mthodes prouvent leur efficacit.
105
tel-00455248, version 1 - 9 Feb 2010
106
tel-00455248, version 1 - 9 Feb 2010
CHAPITRE 3. PROSODIE ET MULTIMEDIA : PROBLEMES DEVALUATION
107
tel-00455248, version 1 - 9 Feb 2010
from Fromkin & Rodman (1998)
Dans ce chapitre, nous faisons tat des diffrents logiciels et outils dapprentissage les plus pertinents de la prosodie assiste par ordinateur ; les diffrents atouts et inconvnients quils gnrent sont discuts. La notion dvaluation est galement aborde, ainsi que les rcentes tudes tentant de proposer une valuation prosodique objective.
108
3.1 Les logiciels dapprentissage de la prosodie de langlais

3.1.1 Introduction
Dans le domaine musical, le rythme a une place privilgie dans lapprentissage de la musique. Il a t remarqu que le processus dveil chez les tous jeunes enfants les conduit, ds quils sont en mesure de saisir des objets, les entrechoquer de faon rptitive. Dans sa mthode dapprentissage musical, Martenot16 (Laurendeau, 1990) affirme que cest par le rythme, sous sa forme la plus directe, la plus rudimentaire, la plus instinctive, que doit commencer lducation musicale . Ne pourrait-on pas reproduire le mme schma dapprentissage en langue seconde ? Pourquoi ne pas apprendre une langue tel-00455248, version 1 - 9 Feb 2010 seconde en passant dabord par la prosodie et plus particulirement par le rythme de celleci? Nous avons vu que lacquisition dune langue maternelle passe par les lments prosodiques, avant les lments segmentaux. Ce sont donc lintonation et le rythme qui priment et qui sont les premiers lments acquis. Comme dit prcdemment, avec lge, la langue maternelle entrane des interfrences auditives. Il devient donc de plus en plus difficile dacqurir les lments prosodiques de la langue cible. Par ailleurs, lorsque nous coutons une langue qui nous est tout fait trangre, la premire chose qui nous marque est sa musique ; paralllement cela, il nous est impossible de segmenter le flux des mots ou den comprendre le sens. Lenseignement dune seconde langue par le biais dun outil multimdia serait une solution intressante. De fait, les technologies multimdia pourraient jouer un rle de rducation prosodique, ou tre un complment lenseignement de la prosodie, en rendant observables et accessibles les dviations produites par lapprenant.
Martenot est un ingnieur et musicien franais. Il est le crateur de linstrument de musique lectronique clavier appel ondes Martenot (1928).
16
109
3.1.2 Constat
Nous avons cherch savoir sil existait des logiciels sur lapprentissage du rythme uniquement. Dans cette recherche, nous constatons en premier lieu, que parmi les logiciels de langues, la tendance majeure est de se focaliser sur lapprentissage de la grammaire, la conjugaison, la syntaxe ou encore du vocabulaire, alors que la prosodie est reste bien souvent hors jeu . Cela peut sexpliquer certainement par le fait que, ds le dbut de la cration de logiciels, ce sont les matires scientifiques telles que les mathmatiques, la physique ou la chimie qui taient concernes, car en tant que sciences exactes, il tait relativement pratique et facile de les transposer cet outil. De ce point de vue l, il nest donc finalement pas tonnant si, concernant le domaine des langues, les premires applications concernaient les composantes les plus aises systmatiser et automatiser. tel-00455248, version 1 - 9 Feb 2010 Ds lors, il a fallu attendre la fin des annes 90 pour voir la naissance de logiciels dapprentissage de langlais par la prosodie incluant le rythme. Le deuxime constat, face cette recherche, concerne la place du rythme dans ces logiciels. Il nexiste pas de logiciels consacrs uniquement au rythme de la langue cible ; si rythme il doit y avoir, il va toujours de pair avec lintonation (ce qui nest pas tonnant, les deux lments tant complmentaires dun tout formant la prosodie). En revanche, il est ais de trouver des logiciels destins uniquement lapprentissage de lintonation. La section suivante propose un bref historique de lvolution des visualiseurs des courbes intonatives, qui ont donn naissance aux nombreux logiciels multimdia actuels. Historique sommaire de lvolution de la visualisation de lintonation Premires tentatives
Lapprentissage des lments prosodiques a t pendant longtemps nglig au profit des lments segmentaux. Cest partir des annes 60 que certains travaux ont donn lieu de nouvelles technologies bases sur le travail de lintonation. La dmarche rside en la reprsentation graphique par une visualisation de londe sonore sous la forme doscillogrammes voire parfois de spectrogrammes. Ainsi, Vardanian (1964) et Lane & Buiten (1965) dveloppent des mthodes qui consistent visualiser la courbe intonative lors de rptition de phrases donnes. Des expriences ont t menes pour chacun des visualiseurs mais aucune na montr de 110
rsultats pertinents dans les progrs raliss par les apprenants. En effet, soit ces mthodes ne comprenaient pas de feedback visuel adapt (utilisation de loscillogramme et des courbes damplitude ininterprtables), soit elles ntaient pas suffisamment exploites pour tre efficaces. Visualisation de la courbe mlodique
Cest entre les annes 70 et 80 que les progrs techniques et les recherches en sciences du langage sur lacoustique, en parole de synthse, et en reconnaissance de parole ouvrent la voie vers des technologies permettant la visualisation de la courbe mlodique par des types de reprsentations beaucoup plus encourageants. Les recherches de Lon & Martin (1971) ont abouti la mise au point dun analyseur, montrant sur un cran tel-00455248, version 1 - 9 Feb 2010 dordinateur la phrase modle de lenseignant et la reproduction de lapprenant. Lide de logiciels permettant de visualiser les courbes intonatives est alors approfondie et renforce par lapparition dun feedback visuel. Lapprenant peut alors comparer sa production avec celle du modle et reprer les diffrences majeures de production, en particulier par la dure et la forme de la courbe mlodique. Le principe du feedback visuel prend alors toute son importance. Cette avance technologique va permettre galement James (1972, 1977) de mener des expriences confirmant quun feedback visuel dapprenants anglophones reprsente un lment important dans lacquisition des schmas intonatifs de la langue cible, ici le franais. Plus particulirement, il remarque quune visualisation compare est plus efficace quune simple visualisation de la courbe modle. De Bot (1983) montre dans une tude quune meilleure imitation du modle tait plus rapidement atteinte lorsquil y avait un feedback visuel et quun facteur de motivation entrait en jeu. Malgr les progrs apports par lintgration dun visualiseur de mlodie, le feedback semble tre insuffisant et ne permet pas de diffrencier les variations prosodiques pertinentes des variantes individuelles possibles.
Nouvelles technologies : phontique et multimdia
Une dcennie plus tard, les techniques danalyse du signal et dextraction de la frquence fondamentale ainsi que de reconnaissance de la parole deviennent plus fiables et 111
plus accessibles. Divers logiciels sont dvelopps. Leur utilisation premire est plutt destine aux chercheurs ou enseignants-chercheurs, mais il nous semble quune utilisation dtourne de ces produits est tout fait envisageable dans lapprentissage dune L2. Parmi eux, PRAAT, dvelopp par Boersma & Weenick (2001) est un logiciel en libre accs17, en constante volution, qui prsente plusieurs fonctions telles que lanalyse (Fo, formants, courbe dintensit), la manipulation de la parole, la synthtisation. Ce programme informatique, dune apparente complexit, pourrait sintgrer dans un cursus de formation pour des tudiants de niveau avanc (masters), pour qui le logiciel PRAAT constituerait un outil intressant pour mener une auto-valuation prosodique et/ou segmentale de leur propre production. En effet, PRAAT permet de senregistrer, ce qui permettrait aux tudiants de visualiser leurs noncs et de les analyser au travers des diffrentes fonctions proposes par le logiciel (courbes, dures, etc.). tel-00455248, version 1 - 9 Feb 2010 Un second logiciel danalyse, nomm Speech Analyzer, propos par le SIL (Summer Institute of Linguistics) se voit dvelopp par lajout dextensions telles que SaRP18 (Speech Analyzer Rapid Plot) cres par Nikolov & Dommergues (2007). SaRP est une extension de Speech Analyzer, version 3. Il permet de manipuler la reprsentation graphique de donnes acoustiques, en crant un diagramme des voyelles19 (propre chaque production). Plusieurs fonctions sont disposition des utilisateurs, telles que : -ltude des proprits acoustico-phontiques des voyelles, par laboration dun diagramme avec reprsentation graphique des valeurs moyennes, -la possibilit de mener des analyses comparatives des voyelles par superposition graphique, -la possibilit dutiliser le logiciel comme un outil daide la comprhension orale.
17
www.praat.org http://web.uni-plovdiv.bg/rousni/sarp/ SaRP permet galement une visualisation de la f0 et du spectrogramme, comme reprsent sur la
18
19
figure 5.
112
De la mme manire que PRAAT peut tre utilis par des non experts (suite une formation), SaRP peut aussi constituer un outil intressant pour les apprenants. Aprs une formation pour une prise en main du logiciel, lapprenant pourrait tout fait autovaluer les voyelles de ses productions, dautant qu partir de la deuxime anne universitaire, les apprenants matrisent cette charte des voyelles. SaRP offre une application pdagogique intressante qui touche la fois, phonticiens, didacticiens et apprenants.
tel-00455248, version 1 - 9 Feb 2010
Figure 5. Exemple de reprsentation graphique propose dans le logiciel SaRP
Lutilisation premire des logiciels, prsents ci-dessus, nest pas directement destine lapprentissage de la prosodie dune L2, mais il est tout fait envisageable de dtourner leurs fonctions premires dans une vise pdagogique et formatrice pour lapprenant. Le seul bmol est bien entendu, comme dit prcdemment, le besoin que cela soit effectu au sein dune formation, permettant une prise en main de ces logiciels.
113
Cest ainsi qu partir des annes 1990, on peut constater lmergence de nombreux logiciels, quils soient outils danalyse (comme vu prcdemment) ou bien encore, logiciels dapprentissage multimdia (cf.ci-dessous). Cependant, beaucoup de ces outils ne traitent encore que des aspects grammaticaux et lexicaux de la langue, ou bien ciblent uniquement lapprentissage des lments segmentaux. En illustration de ces logiciels, il tait possible de trouver Escape from Arizona planet (1997) prsent par UC Berkeley20, qui tait un programme informatique propos par EF multimdia. Ce logiciel, destin aux apprenants dun niveau avanc, proposait un apprentissage interactif au travers de diverses mises en situation. Lutilisateur pouvait travailler la comprhension, tendre son vocabulaire, pratiquer la lecture, et tester sa prononciation en coutant et rptant des phrases extraites des mises en situation. Pour rsumer, lapprenant pouvait exprimenter une situation de communication, comme il tait tel-00455248, version 1 - 9 Feb 2010 mis en exemple dans la prsentation du logiciel : You are an alien whose spaceship has crashed outside of a small town in the middle of Arizonas desert. Your mission is to find the seven objects necessary to repair your ship [] . WebGrader, propos par Neumeyer & al. (1998), est un outil plus rcent bas sur la reconnaissance de parole, conu pour la pratique de la prononciation dune seconde langue, au travers de diffrentes leons regroupes par thme, telles que repas au restaurant , ou encore les transports en commun . Pour chaque leon, un ensemble de phrases est propos ; lutilisateur peut couter les phrases prononces par un natif et peut senregistrer, afin dobtenir un score sur ses ralisations. PLASER, prsent par Mak & al. (2003) est un logiciel destin lenseignement de la prononciation de langlais pour des apprenants chinois. Utilisant la reconnaissance de parole, cet outil donne un feedback immdiat aux utilisateurs qui pratiquent deux types dexercices, savoir la prononciation, soit par le biais de paires minimales, soit par lutilisation de mots.
20
http://www-writing.berkeley.edu/chorus/call/reviews/archives/escape.html
114
Suivant lide daider lapprenant analyser la prononciation des mots, au travers de la transcription phonmique, des logiciels destins lentranement de la transcription phonmique voient le jour. Phthong21 (1999), par exemple, offre une initiation la phontique anglaise ; ce programme est un tutorial rserv la transcription phonmique. Il est compos de deux types dexercices : soit lutilisateur transcrit un mot anglais, en phonmes laide de lalphabet phontique, soit il analyse un mot transcrit en phonmes pour retrouver sa forme orthographique. Si ces exemples de logiciels assigns lapprentissage des phonmes et de la prononciation (bien loin dtre exhaustifs), dmontrent lengouement pour les aspects segmentaux dune langue, ces dernires annes ont vu merger un bon nombre de logiciels destins lenseignement de lintonation. Cependant, le lancement dun nouvel outil tel-00455248, version 1 - 9 Feb 2010 multimdia dapprentissage des langues nest pas forcment toujours le reflet dune nouveaut mthodologique, mais plutt laboutissement dune opration commerciale charge de rendre loutil plus attractif. Ces outils ne semblent pas sassocier une vritable pdagogie de loral et les possibilits offertes sont encore limites et peu accessibles pour les apprenants. Parmi les logiciels existants sur le march, deux types de regroupements (listes non exhaustives) peuvent tre tablis. Le premier groupe concerne les logiciels proposant un feedback, bas sur la visualisation dun spectrogramme ou oscillogramme (illustr par la figure 6) : -SoundForge (1991)-Sonicfoundry& RealNetworks: http://www.Sonicfoundry.com -Tell me more (1998)-Auralog: http://www.auralog.fr -VOICEbook (1998)-Englishear system (Paris): http://www.voicebook.com -LAVAC (Laboratoire http://www.alizes.fr/cp3i. Vido Actif Comparatif) (1999)/ Tony Toma :
21
www.chass.utoronto.ca/~stairs/phthong/
115
-Speaker (version 4.0-1999)-Neuroconcept: http://www.neuroconcept.com
Figure 6. Proposition de feedback par affichage de loscillogramme (Voicebook, 1998)
tel-00455248, version 1 - 9 Feb 2010
Le deuxime groupe propos, utilise la courbe damplitude ou encore la courbe de frquence fondamentale non lisse afin de reprsenter les courbes intonatives des productions. -Speaker (version 3.0- 1997)-Neuroconcept (cf.above) -Wincecil (1997)-SIL: http://www.jaars.org/itcs/software/cecil/wincecil/we22.zip -Talk to me (1998)-Auralog: http://www.auralog.fr
Figure 7. Proposition de feedback par affichage de la courbe d'amplitude (Wincecil, 1997)
116
La courbe damplitude propose par Wincecil (figure 7) ne semble pas plus convaincante que loscillogramme de Voicebook (figure 6). Dans les deux cas, on peut bien imaginer que lapprenant aura du mal comprendre et dceler ce quil faut retravailler. Sans une aide experte, il parat difficile pour lutilisateur daccder une interprtation de sa production. Il est noter un point positif pour laffichage de Wincecil qui propose dajouter les mots du texte au-dessus de la courbe damplitude. Cela permet lapprenant de mieux visualiser llment sonore quil souhaite tudier. Sans connatre les correspondances entre le texte et loscillogramme ou toute autre forme, ce qui peut tre compris assez facilement par lutilisateur, il parat difficile pour lapprenant de bnficier du meilleur parti de ces affichages pour amliorer la qualit de ses productions. Les diverses reprsentations proposes jusquici, quelle que soit la forme utilise tel-00455248, version 1 - 9 Feb 2010 (spectrogrammes, oscillogrammes, etc.), semblent difficilement accessibles pour des non spcialistes. Lapprenant semble tre considr comme ayant fatalement les connaissances phontiques instrumentales ncessaires linterprtation des courbes visuelles. Lefficacit de ces logiciels peut tre ici incrimine, et laisse un doute sur lefficience de la reprsentation de telles courbes, qui ne sont pas pdagogiquement parlantes pour lapprenant. Malgr ces derniers points ngatifs, il est constatable que, depuis ces toutes dernires annes, se dveloppent quelques rares logiciels, voire didacticiels, cherchant faire voluer loutil pdagogique que peut constituer un logiciel, mettant en exergue le travail de la prosodie et prenant en compte laccessibilit des reprsentations donnes aux apprenants. Une volution, qui vise dpasser les faiblesses constates auparavant, semble donc dj se dessiner. Le logiciel SLIM (Multimedia Interactive Linguistic Software) prsent par Delmonte (1998) se base sur deux objectifs focaliss sur lamlioration (i) de la perception (ii) de la production de lapprenant au niveau prosodique. Deux activits principales sont proposes afin de travailler rythme et intonation. La premire se situe au niveau du mot et est lie la dure des segments syllabiques, la seconde au niveau de la phrase, travaillant sur laccent de phrase, les patrons intonatifs. Ce logiciel semble tre un outil intressant, dpassant lide traditionnelle de simple visualisation de la courbe intonative ; SLIM tend faire de nouvelles propositions dapprentissage. Malheureusement, aucune dmonstration nest propose ; nous ne 117
pouvons commenter plus en dtail ce logiciel. Mais il est noter que Delmonte est un des rares concepteurs mettre laccent sur le facteur rythme , sans favoriser outre mesure, la reprsentation graphique de la mlodie. Martin (2005) lexplique par le fait que des recherches en synthse de la parole ont dmontr que le rythme est parfois plus important que la mlodie pour la comprhension de l'organisation hirarchique (syntaxique) de la phrase . Selon la mme conception, BetterAccentTutor (que nous appelons dsormais BAT) dvelopp par Kommissarchik & Kommissarchik (2000), est un logiciel dapprentissage du systme prosodique de langlais amricain. Ce programme propose un feedback visuel immdiat sur lintonation, laccentuation et le rythme des productions ; les erreurs segmentales ne sont pas prises en compte, lattention est mise sur la prosodie des productions. tel-00455248, version 1 - 9 Feb 2010 Le systme BAT propose deux modes dentranement par visualisation, (i) sur lintonation et (ii) sur lintensit et le rythme. Lapprenant peut visualiser sa production en la comparant avec celle du natif. Sur lensemble des thmatiques de travail propos, lutilisateur a la possibilit de pratiquer des exercices sur laccent de mots, les affirmatives, les Wh-questions, les questions de rptition, les tags, les ordres, les exclamations, tongue twisters , les longues phrases. Concernant le rythme, des exercices cibls sont proposs comme par exemple, des exercices daccentuation lexicale o la fonction distinctive de laccent (en anglais) est mise en avant ; voici un exemple avec lexercice present vs. present reprsent par les 3 figures proposes ci-dessous. Lapprenant doit prononcer un des deux mots ou les deux (present ou present) en rpondant la question he said what ?! .
118
Figure 8. Feedback visuel des mots present vs present avec comparaison des productions natif/apprenant selon les contours intonatifs.
tel-00455248, version 1 - 9 Feb 2010
Figure 9. Feedback visuel des mots present vs present avec comparaison des productions natif/apprenant (rythme/intensit)
Les syllabes sont reprsentes par des marches ; la longueur de la marche reprsente la dure de la syllabe et sa hauteur correspond lnergie du nucleus de la syllabe (la voyelle).
119
Figure 10. Illustration du feedback explicatif des points saillants travailler par l'apprenant
tel-00455248, version 1 - 9 Feb 2010
La troisime tape est un module explicatif propos lapprenant mettant en avant les points saillants de sa production, qui devraient se rapprocher plus de celle du natif. Il est dommage que ce logiciel ne soit focalis uniquement sur laccent amricain ; par ailleurs, il est noter la recherche de nouvelles propositions concernant lamlioration du feedback propos, mme si lon peut sinterroger sur son efficacit face la progression de lutilisateur. Le logiciel Winpitch LTL (Language Teaching Learning) a t rcemment conu au Canada par Martin et son quipe. Il est bas sur le fruit dune collaboration entre un phonticien-ingnieur et une enseignante phonticienne spcialise en didactique des langues (Germain & Martin, 2000). Winpitch LTL semble tre un des logiciels les plus dvelopps actuellement proposant diverses fonctions comme lanalyse en temps rel, la visualisation de la courbe f0, lcoute ralentie. Son originalit rside dans l'annotation des commentaires et segments pertinents intgrs sur l'affichage. Des segments de courbes mlodiques peuvent tre surlignes en couleur et du texte peut tre facilement ajout sur l'cran, pour mettre en relief des proprits mlodiques ou rythmiques particulirement pertinentes pour lapprenant (cf. figure 11, ci-dessous), afin de localiser les diffrences entre la L1 et la L2. Cela requiert la prsence dun enseignant spcialis, en mesure de commenter les visualisations proposes. Sans ces commentaires, Winpitch LTL retombe dans une configuration de feedback, amliore certes, mais traditionnelle.
120
Figure 11. Exemple de feedback visuel du logiciel Winpitch LTL,
tel-00455248, version 1 - 9 Feb 2010
http://www.winpitch.com
Malgr lattention porte sur la pdagogie propose, la conception de Winpitch LTL, tout comme Winpitch Light et Winpitch Pro, reste celle dun outil de recherche avant tout, et ne peut se placer en didacticiel. Notons pas ailleurs, que les logiciels Winpitch ne sont pas tlchargeables gratuitement et que Winpitch Pro est un logiciel payant. Dautres logiciels tels que Prosodia (Herry, 2001) dmontrent quil est pdagogiquement possible de crer un environnement efficace pour un travail dapprentissage de la prosodie. La mthode utilise sappuie sur les propositions de schmas intonatifs prsents par Ginsy (1998). Prosodia traite de lintonation et du rythme au travers de divers exercices de trois diffrents niveaux de difficult, allant de dbutants experts. 5oo phrases sont proposes, pratiquer soit en mode rptition, soit en mode production libre, avec lindication du modle intonatif suivre, par exemple : E.g. Level A, Unit 2, Lesson 2: Glide up (ton normal): Is it a doll? / is it Marys doll? Glide down (ton dtach): Is it a doll? / is it Marys doll? High jump (exprime la surprise): Is it a doll? / is it Marys doll?
Concernant le rythme, ce sont des comptines qui sont proposes lutilisateur : e.g. Level A, Unit 1, Lesson 1: One, two, three, four, 121
Mary at the cottage door Five six seven eight, Eating cherries off a plate.
Le feedback propos est commun aux autres logiciels, savoir la visualisation de la courbe mlodique, quil est possible de comparer avec celle de lapprenant ; en revanche, la courbe est bien plus modlise, et ainsi plus accessible pour lapprenant au niveau de linterprtation (cf. figure 12, ci-dessous).
tel-00455248, version 1 - 9 Feb 2010
Figure 12. Exemple de feedback de la production d'un apprenant (en bas) compare celle d'un natif (en haut), http://www.lpl.univ-aix.fr/~lpldev/prosodia
Prosodia est le rsultat dun projet men au laboratoire Parole et Langage. Il a pu tre ralis grce la collaboration de diverses personnes telles que Ginsy, Ghio, Nishinuma. Ce projet a t financ en partie par le ministre de lducation nationale, de la recherche et des technologies. Herry (2001) explique que lobjectif dun tel logiciel est damliorer lenseignement et lapprentissage des lments prosodiques de la L2. Laspect segmental a aussi t pris en compte, en incluant dans les phrases un travail sur des paires minimales. Les avantages, qui diffrencient Prosodia des autres modles, sont les propositions dexercices labors, afin de cibler les points faibles et les difficults particulires rencontres par lapprenant lors de lapprentissage de la prosodie L2. Le logiciel est galement accompagn dun manuel explicatif sounds, rhythm and intonation of English . Nous regrettons que le contenu soit limit 500 phrases et que le texte ne soit pas align avec la courbe modlise.
122
Prosodia est toujours en cours de dveloppement, faisant lobjet dune collaboration entre le LPL et lquipe de recherche de luniversit de Paris 8. Certains chercheurs se sont consacrs uniquement lapprentissage de laccentuation. Le projet SWAMS (Synchronised Web Authoring Notation System), lanc en 2004, se tourne entirement vers la ralisation du rythme, au niveau de laccent lexical des noncs. Le logiciel, toujours en cours de dveloppement (Stenton & al., 2005), est le projet dune collaboration mene au sein du LAIRDIL22 de luniversit de Toulouse. SWAMS permet une annotation des textes en fonction des accents et de l'intention des auteurs. Par lutilisation de couleurs et de la taille de la police, il est possible de mettre en relief les syllabes accentues dun texte sonore, tout en affichant et en synchronisant les images vido (cf. figure 13). En ltat actuel du systme, cette fonctionnalit est excute tel-00455248, version 1 - 9 Feb 2010 de manire interactive, et permet nimporte quel enseignant sans comptences particulires en informatique, de lutiliser sans contrainte.
Figure 13. Illustration d'une fentre du logiciel SWAMS
Ces derniers logiciels montrent que des recherches sont effectivement en cours de ralisation afin de promouvoir un apprentissage prosodique dune seconde langue,
22
Laboratoire Inter-Universitaire de Recherche en Didactique des Langues
123
tentant de pallier les diffrentes critiques de ces dernires annes. Toivanen (2003) remarque que ltude de lintonation a t dlaisse jusqu prsent, malgr limportance de son rle dans lapprentissage dune seconde langue : The lack of interest shown in prosodic aspects of interlanguage does seem to do a disservice to the discipline of SLA23 research as intonation is undeniably an important aspect of especially the pragmatic aspects of interlanguage speech. Ces propos ont t dmontrs, puisque les premiers essais remontent seulement une quarantaine dannes. Cependant, notons ici, que si la constatation est pertinente, le rythme encore une fois est nglig. En effet, jusque l, lintonation tait le seul lment central des recherches et le rythme en tait largement absent. Les dernires technologies dveloppes apportent donc un souffle nouveau sur les outils multimdia et permettent denvisager une relle application de ces outils dans lenseignement de la prosodie en L2 tel-00455248, version 1 - 9 Feb 2010 par lapport quils pourraient constituer. Nous faisons tat, dans la partie suivante, des diffrents avantages apports par lutilisation dun outil multimdia, mais aussi ses limites.
3.2 Apports des logiciels de langues

Ces dernires annes, les technologies multimdia ont subi un vritable essor par ce que lon appelle lApprentissage des Langues Assist par Ordinateur (A.L.A.O.), ou bien encore lEnseignement Assist par Ordinateur (E.A.O.). Si lon peut sinterroger sur le nombre abondant de ces logiciels24 masquant un ventuel intrt commercial, il semble que ces technologies multimdia soient assez prometteuses et ce, pour diffrents motifs exposs ci-dessous. Utilit dans lapprentissage de la prosodie Un matriel, sur support imprim, ne semble pas adapt un travail sur la perception et production dune langue seconde. Les logiciels qui associent limage au son ainsi qu lanimation, sont plus adapts au travail de loral. Ainsi, les phnomnes
23
Second language acquisition Il est mme possible de trouver un logiciel dapprentissage de la prosodie du Breton (Aubry, 2004)
24
124
inconscients tels que lancrage de la prosodie de la L1 rendant difficile lapprentissage de la prosodie dune L2, ncessitent de commencer par rendre visibles, concrets et observables les dviations prosodiques, afin que lapprenant en prenne conscience. Dodane & Konopczynski (2001) font remarquer que cest seulement en passant par cette tape que lapprenant pourra corriger ses erreurs : En permettant la visualisation des contours dintonation et de la structure accentuelle de la langue cible, elles donnent justement lapprenant la possibilit de les objectiver []. Cette prise de conscience constitue une tape indispensable vers la correction . Lutilisation de lA.L.A.O. pourrait donc constituer un vritable apport pour lutter contre la surdit prosodique de lapprenant adulte. Lapprenant au cur de loutil tel-00455248, version 1 - 9 Feb 2010 Lusage des logiciels place lutilisateur au cur du processus : en effet, celui-ci occupe la place centrale, contrairement un apprentissage en salle de classe ou lenseignant garde le rle principal. Il nest plus sujet passif, comme il pourrait ltre dans une salle de cours surcharge par un effectif trop important o peine une minute de cours lui serait consacre pour son travail de loral. Il est donc actif face cette technologie, va chercher lui-mme les informations. Par ailleurs, il perd son statut d lve et prend le rle d apprenant ; dans ce cadre, lenseignant perd son statut de matre et endosse le rle de conseiller , ce qui change le rapport dautorit lve/matre et redistribue un rle chacun o lapprenant devient le centre dintrt de la formation. En plaant lapprenant au cur de lapprentissage, cela ne signifie en aucun cas le dnigrement du rle de lenseignant. Bien au contraire, sil y a bien une redfinition des rles, cest bien la relation apprenant/enseignant qui volue et non limportance du rle de lenseignant qui est remise en cause. Lenseignant est libr de son rle de rptiteur et devient le guide et le crateur du concept pdagogique sous-jacent au logiciel ; la machine ne peut elle seule satisfaire tous les besoins et demandes de lutilisateur, elle devient un plus pour lenseignant, possdant de surcrot une patience illimite en tant que tuteur. Loin de remplacer lhomme par la machine, comme cela peut tre pens, la relation enseignant/lve, souvent inexistante dans le contexte de cours classique, est ainsi fortement renforce.
125
Par ailleurs, lapprenant se voit attribuer une valuation individuelle, suivant une progression individualise adapte au rythme de chacun. Lapprenant est donc actif, mais aussi autonome, dans la mesure o il travaille son propre rythme et en fonction de ses besoins. Cela palie, en outre, le manque de temps qui empche lenseignant de donner un suivi pdagogique individualis en raison de groupes surchargs dtudiants. Cest ce quexplique Marty (1983) pour qui lenseignement assist par ordinateur permet lapprenant de suivre ltat de son volution et lui offre un programme sur mesure, adapt son rythme dapprentissage : Je nessaierai pas de prouver que les ordinateurs peuvent faciliter lapprentissage dune langue. Il est vident que des tudiants dsireux dapprendre, apprendront plus vite et obtiendront de meilleurs rsultats sils ont accs un ordinateur qui leur fournit une rponse immdiate et une analyse dtaille de leurs erreurs, qui stocke des informations sur leurs rsultats et qui, selon les rsultats obtenus, leur fournit de nouveaux exercices adapts leur profil. Je crois que le profil tir dexercices de ce genre vaut la peine quon investisse dans lE.A.O. . Par lutilisation dun logiciel, lapprenant se voit valu par une machine et na pas ainsi limpression quil reoit un jugement port par un enseignant. Lapprenant peut donc reprer ses erreurs et observer ses progrs, sans pour autant recevoir une note sanction . Cette forme dapprentissage est donc psychologiquement encourageante et gratifiante pour lutilisateur. Murray (1999) montre, par ailleurs, dans son tude, que ce type dapprentissage permet galement lutilisateur de travailler dans un environnement priv, moins stressant dans la mesure o lapprenant semble moins embarrass de pratiquer une tche orale et de raliser de mauvaises productions. Feedback pdagogique La visualisation de lintonation nous a permis de transposer un geste auditif spcifique propre un monde linguistique ferm, en un geste visuel dcodable par une communaut smiotique universelle (Lon et Martin, 1970 : 9). Limportance de la visualisation de la courbe mlodique a rapidement t mise en avant par plusieurs tudes (Lon & Martin, 1970 ; De Bot, 1983). Un certain nombre de travaux ont prouv lefficacit de ces visualiseurs dans lapprentissage du systme prosodique de la langue cible. Un des premiers facteurs positifs avanc par De Bot (1983) est celui de la motivation ; lauteur explique que les apprenants sont beaucoup plus 126
tel-00455248, version 1 - 9 Feb 2010
motivs par ce type de feedback que par un simple feedback auditif propos en laboratoire de langues. Hardison (2004) reporte ses travaux sur lapprentissage de la prosodie assist par ordinateur, et montre au travers de deux expriences leffet positif que ces programmes constituent dans lapplication des technologies de la parole. Ces expriences montrent quun entranement audio-visuel peut aider les apprenants du franais amliorer, non seulement leur prosodie, mais aussi les aspects segmentaux de leur production. Delmonte (1999), Taniguchi & Abberton (1999) mnent galement des tudes qui attestent de leffet positif dun feedback visuel. Taniguchi & Abberton (1999) montrent notamment que des apprenants japonais suite un travail avec feedback visuel de la frquence fondamentale de la voix amliorent leur intonation en anglais. Herry (2001) teste lefficacit de son logiciel Prosodia sur deux groupes dtudiants tel-00455248, version 1 - 9 Feb 2010 (groupe tmoin et groupe test). Le groupe tmoin a suivi un entranement traditionnel en laboratoire, lautre groupe sest entran par lutilisation du logiciel. Deux notations ont t effectues 4 mois dintervalles. Herry conclut que les rsultats ne sont pas statistiquement significatifs , mais la moyenne du groupe test reste plus leve que celle du groupe tmoin, ce qui permet de conclure une certaine efficacit de la mthode. Hincks (2003) tudie limpact des programmes dapprentissage de langue sur la prononciation dun groupe dimmigrants, dun groupe dapprenants tudiant langlais en Sude, compar un groupe contrle dtudiants. Les groupes tests devaient travailler sur la thmatique de langlais technique, en pratiquant 200 heures de plus que le groupe contrle, et taient encourags travailler galement chez eux. Bien que les rsultats soient moins probants pour les tudiants dun niveau pralable assez bon, les rsultats montrent un effet trs bnfique pour les tudiants qui ont dbut le programme avec un fort accent tranger. Si les atouts proposs par les technologies multimdia sannoncent encourageants, et si les points positifs dvelopps ci-dessus montrent les implications mthodologiques et pdagogiques, lobjet multimdia prsente aussi des limites, et la plateforme technique concernant le systme dvaluation ne semble pas rellement satisfaisante.
127
Limites de loutil multimdia Les produits multimdia se voient attribus divers avantages, tels ceux dvelopps dans la section prcdente, ou encore ceux annoncs par Eskenazi (1999), (i) lapprenant entend une grande quantit de parole, (ii) il produit lui-mme une grande quantit dnoncs. Cependant, loutil prsente aussi quelques limites. Le facteur interaction est prendre en compte dans la mesure o il permet lapprenant de se focaliser, non plus sur ses propres productions, mais vers celles de son interlocuteur. Cela constitue un changement de stratgie communicationnelle important. Un entranement isol face un ordinateur apparat insuffisant pour acqurir la vritable oralit dune langue en situation authentique. Par ailleurs, si la visualisation de la courbe mlodique semble tre communment atteste dans le sens o cela faciliterait les progrs de lapprenant et lui serait dun apport tel-00455248, version 1 - 9 Feb 2010 important, il nen reste pas moins que le feedback visuel propos, comme nous lavons vu prcdemment, reste assez pauvre et difficilement interprtable par lutilisateur ; Cazade (2000 :1-2) va jusqu remettre en cause lutilisation des courbes sonores, dans la mesure o elles ne sont daucune utilit pour lapprenant, puisqu aucun feedback ne vient en complment : Ces courbes ont-elles un usage quelconque ? Ne sont-elles l que pour "faire joli", ou plutt "faire srieux, grce laspect scientifique, apparemment inattaquable et dfinitif, quun joli graphe semble pouvoir donner, pour un utilisateur non averti, toute prsentation de rsultats dans un magazine scientifique ou non,
une prsentation multimdia de courtier d'assurance ou mme parfois un expos d'tudiant court de dmonstration ?
Ces courbes (souvent prsentes par un oscillogramme) sont trop complexes graphiquement parlant et sont frquemment laisses linterprtation de lapprenant. Lusage de limitation ainsi que dun feedback visuel et sonore est loin dtre pdagogiquement satisfaisant. Une correction prosodique ainsi que certains commentaires explicatifs pourraient venir complter la visualisation des courbes. Sous-jacent cette constatation, est souvent voqu le manque de coordination entre ingnieurs, phonticiens et pdagogues (Germain & Martin, 2000 ; Dodane & Konopczynski, 2001): Il semble que, dans l'laboration de tout nouveau matriau pdagogique, les phonticiens ou les mthodologues de la prononciation se soient volontairement effacs ou bien qu'ils n'aient pas su adapter leurs recherches aux nouvelles orientations pdagogiques... (Galazzi-Matasci et Pedoya (1989: 39), cit par Germain & Martin, 2000) 128
Martin (2005:104) explique que la fragilit de lensemble de ces logiciels destins lapprentissage de la prosodie relve de considrations didactiques et pdagogiques : Mais le dfi principal est extrieur la visualisation : il sagit de dterminer de manire simple et pdagogiquement convaincante quels sont les facteurs linguistiquement importants dans lapprentissage de la prosodie dune langue trangre, et ensuite den tablir les caractristiques pertinentes par rapport celles de la langue maternelle de lapprenant, et de configurer les modles et les leons proposs en se concentrant sur ces diffrences. Certains logiciels trs rcents, cits prcdemment (SLIM, Prosodia, Winpitch, SWAMS) ont effectivement dpass le problme de la visualisation des courbes ; cependant, lvaluation propose reste complter. En effet, ce nest pas lutilisation des courbes quil faut remettre en cause, mais plutt linterprtation et lvaluation qui laccompagnent. Si le feedback audio-visuel a fait ses preuves et semble avoir t surmont tel-00455248, version 1 - 9 Feb 2010 par certains logiciels, il manque, nanmoins, un vritable systme dvaluation reposant sur des critres objectifs permettant dvaluer le niveau de lapprenant. Malgr quelques premires propositions (Herry & Hirst, 2002 ; Beck et al. 2005), aucune valuation base sur des critres objectifs na rellement t avance dans les recherches sur lvaluation de la prosodie dapprenants franais. Nonobstant, lorsque cela concerne dautres langues L1, comme le japonais par exemple, ciblant lapprentissage de langlais, des tudes rcentes attestent de lintrt que portent les autres nations sur le besoin dlaboration de critres valuatifs. Avant de faire tat des diffrentes tudes portant sur lvaluation, nous proposons en premier lieu, dans la section suivante, de dfinir cette notion et den exposer les diffrents concepts et travaux qui en dcoulent.
3.3 Lvaluation prosodique en L2

Dfinitions et concepts Aprs une prsentation gnrale de la notion dvaluation, lattention est porte sur les valuations prosodiques des productions orales en langue seconde et les propositions de critres valuatifs proposs dans les rcentes recherches.
129
Le terme valuer fait rfrence au fait de fournir des informations pour clairer une prise de dcision (Larousse, 2003). Lvaluation est, tymologiquement, une rflexion sur les rapports aux valeurs (Bonniol & Vial, 1997 :16). Spcifier le type de rapports, savoir, attribuer une valeur ou construire un jugement de valeur, consiste lui attribuer un modle. La mthode dvaluation la plus ancienne est probablement lvaluation perceptive, que lon peut galement qualifier dvaluation subjective. Deux types dvaluation sont gnralement distingus : (i) lvaluation perceptive qui correspond une production value par un auditeur, et, (ii) une valuation objective, qui correspond des mesures instrumentales, acoustiques, etc. Le protocole danalyse se situe alors selon deux choix : (i) le choix qualitatif dans lequel les paramtres mis ltude sont dfinis, et, (ii) le choix quantitatif correspondant tel-00455248, version 1 - 9 Feb 2010 aux chelles de mesure. Selon ce concept, lvaluation est alors une mesure, et cette notion renvoie directement la question de mesurabilit laquelle chercheurs et enseignants sont confronts. La difficult de la mesurabilit est en lien direct avec la problmatique de lvaluation des productions en L2, savoir, quest-ce quon value (quest-ce quon mesure) et comment on lvalue (comment le-mesure-t-on). La premire tape consiste donc dfinir lobjet, comme le prcise Rost (2002 : 174) : In order for assessment to become valid and useful, it is essential to define the construct, that is, the set of traits in the learner that we are seeking to observe, evaluate and provide feedback on La deuxime tape consiste attribuer une donne chiffre cet objet (Bonniol, 1976) : Cela implique que lobjet, o lvnement, puisse tre saisi sous une seule dimension, isolable, susceptible dtre pourvu dune chelle numrique. Partant de ce principe, lvaluation des productions orales devrait reposer sur une grille dfinie selon certains critres valuatifs reprsentant les comptences atteindre pour lapprenant, critres applicables par lensemble de lquipe pdagogique. La ralit actuelle est bien souvent loin de ce concept. Par ailleurs, lvaluation applique dans le cadre universitaire repose sur une valuation perceptive uniquement, ce qui implique un certain nombre de contraintes exposes dans la littrature. Santerre (1989) met en avant le manque de fiabilit dun jugement auditif, expliquant que loreille nest pas un outil de
130
mesure fidle: si elle est un bon dcodeur smantique, loreille est un mauvais instrument de mesure Ce type dvaluation repose sur une apprciation perceptive, propre au jugement de chaque individu. Cela peut entraner des carts de notation assez importants. Herry (1997) lance une valuation subjective par six experts phonticiens sur des productions de lintonation dapprenants francophones et dmontre un cart important entre le jugement auditif et la transcription de schmas intonatifs. De plus, ltude mene par Caverni & al. (1975) met en vidence le caractre subjectif de lvaluation par ce que les auteurs appellent les biais dvaluation . Les notations obtenues prsentaient le cas de divergences importantes, que Caverni et al. expliquent par le fait que lvaluateur serait inconsciemment influenc par des biais dvaluation tels que le sexe, lge, lorigine tel-00455248, version 1 - 9 Feb 2010 sociale (etc.). Santerre (1989) fait remarquer quil serait intressant dutiliser des logiciels spcifiques dont le systme possde un module dvaluation dfini. De fait, lvaluation de productions orales peut tre complexe dans la mesure o divers paramtres entrent en jeu. Il serait donc pertinent dappuyer une valuation perceptive sur une valuation quantitative reposant sur des critres acoustiques objectifs, automatiss dans un logiciel. Cela rejoindrait alors la thorie des quatre /k/ de Hansen (2006) indiquant quune valuation complte doit tre : corrective, comprhensible, qualitative et quantitative . Cependant, rares sont les tudes qui se sont rellement penches sur la question, et un manque vident se fait ressentir dans le domaine de lvaluation des productions orales en L2.
propositions de critres ? Llaboration dune valuation prosodique en langue seconde reste rare. Sans prendre en considration les modles de logiciels de langue, mais en nous basant sur lvaluation de loral en L2 de manire gnrale, le constat repose sur le manque de dfinition de critres valuatifs.
131
Si lon se reporte au systme dvaluation DIALANG25, la prosodie en est absente. DIALANG est un systme dvaluation de comptences en langues, destin des apprenants qui dsirent obtenir un diagnostique sur leur comptence dans la langue cible. Les chelles dvaluation se basent sur le cadre europen commun de rfrence dans lequel figure une des chelles dvaluation lexpression orale ; on aurait pu penser que des critres prosodiques serviraient une valuation de niveaux, mais ce nest pas le cas. Le critre principal de jugement du niveau se base sur ltendue du vocabulaire utilis dans la conversation. Ce type dvaluation saccorde plutt avec les tests de diagnostics qui visent reprer les connaissances dj acquises par les apprenants, mais les critres requis sont toujours bass sur la grammaire et le vocabulaire. Un diagnostic de niveau de langue DIALANG a t labor et automatis ; il est ais dobserver quaucune place na t laisse pour lexpression orale. Ainsi, il est possible dtre valu sur la comprhension tel-00455248, version 1 - 9 Feb 2010 orale, la grammaire et le vocabulaire. Par ailleurs, une analyse est en cours dexprimentation (Tortel, en cours), mettant en avant le manque de fiabilit de ce programme, sachant que sur lpreuve de comprhension orale en anglais, teste par 10 natives anglaises, la moiti des sujets obtient le niveau rpertori comme proche du natif . Ce programme offre de grandes possibilits, mais de nombreuses perspectives de travail sont envisager afin damliorer le systme propos (Lopez & al., paratre). Dans le cadre de recherche sur llaboration de critres prosodiques destins une valuation de loral, les premiers travaux concernent surtout le domaine du FLE. Ainsi, dans le cadre de la cration dun test de niveau, visant valuer la
prononciation des anglophones (apprenant le franais), Di Cristo (1975) propose une valuation prenant en compte des critres prosodiques, dont le rythme. Le test se compose de 40 phrases (chaque phrase contient une difficult prcise) qui se rpartissent selon trois catgories : phonmique, phontique, prosodie. Lvaluation prosodique, comprenant accent et rythme, se base sur les critres suivants (1975 :17) : -absence de neutralisation des voyelles inaccentues, -place de laccent de groupe,
25
http://www.dialang.org
132
-distribution des accents dinsistance, -rythme : galit des syllabes.
Ces critres sont les paramtres de divergences dcrits dans le chapitre 1 sur le rythme. Un exemple de barmes pour laccentuation est cit ; il se base sur une chelle trois catgories : -2=distribution correcte des accents -1=distribution parfois incorrecte des accents -0=distribution toujours incorrecte des accents Ce test comporte plusieurs avantages: tout dabord, il permet dvaluer le niveau des apprenants ; ensuite, excut une seconde fois, le test va permettre de mesurer les tel-00455248, version 1 - 9 Feb 2010 progrs raliss, et enfin il fournit les renseignements ciblant les points faibles des apprenants et sur lesquels ils pourront alors se concentrer. Freland-Ricard (1995) tente dlaborer des paramtres rythmiques en tudiant les dviations des productions dapprenants trangers en FLE. Les paramtres retenus sont les dures syllabiques et les pauses. Au niveau du premier paramtre, lauteur conclut que les sujets trangers ne matrisent pas les dures des syllabes de la mme manire que les Franais, et quils calquent lorganisation temporelle de leur langue maternelle. Concernant ltude des pauses, Freland-Ricard constate que la moyenne des groupements entre deux pauses se situe entre 3 et 5 syllabes, que les groupements internes se caractrisent par un allongement final, et la dure de ces groupements est nettement plus courte que celle des natifs franais. Les conclusions de lauteur permettent dattester des thories sur linfluence de la L1 sur la L2 ainsi que de lobservation dune interlangue mais les rsultats annoncs nont pas t exploits pour llaboration dune valuation prosodique. Lorsque lon se penche sur les travaux de recherche dont le but est llaboration de critres valuatifs implmenter dans un logiciel, la littrature nest pas plus fructueuse. Une investigation rcente a t mene dans le domaine du FLE par Dodane & Konopczynski (2001) examinant la possibilit dappliquer cette recherche de critres rythmiques dans le logiciel Winpitch LTL. Les auteurs tudient les dviations rythmiques de 5 locuteurs trangers (2 malaisiens, 2 japonais, et un taiwanais) dans une tche de lecture et doral spontan en franais. Les mesures releves sont celles des dures 133
syllabiques (accentues et non accentues) et des pics de hauteur. Les rsultats montrent que, dans les productions des francophones (loc. rf.), la dure moyenne des syllabes portant laccent primaire, est plus de deux fois plus longue que celle des syllabes non accentues. Pour lensemble des locuteurs, la dure des syllabes non finales reste trop leve ; les auteurs concluent que cela a pour effet de rduire lcart perceptuel avec les syllabes finales portant laccent primaire. La dviation rythmique commune tous les locuteurs est dassocier la prominence mlodique qui marque laccent secondaire, un allongement de la dure. Les auteurs remarquent quils brisent alors la rgularit syllabique du franais, lun des locuteurs produit une rythmicit de type accentuel. Par la suite, Dodane & Konopczynski utilisent le logiciel Winpitch afin de mettre en vidence les dviations repres par un feedback audio-visuel. Un nonc est pris en exemple, sur lequel elles identifient lendroit o devraient tre raliss laccent primaire et laccent tel-00455248, version 1 - 9 Feb 2010 secondaire en franais, en faisant figurer la dure des syllabes concernes. Finalement, un diagnostic des lments rythmiques travailler est tabli (par exemple, travailler sur lgalit des syllabes inaccentues en leur faisant prononcer toutes les syllabes avec approximativement la mme force). Cette tude montre des rsultats intressants et exploitables mais sa vise na pas pour objectif une automatisation de lvaluation prosodique.
Teixeira et al. (2000) tentent de prdire le degr de dviation des phrases des apprenants par rapport aux natifs. Leur travail nest pas focalis sur laspect segmental des dviations, mais sur les aspects prosodiques. Cucchiarini et al. (2000) montrent que les taux de fluence verbale ( fluency ) de natifs, sur un corpus de parole lue, peuvent tre prdits par le biais de mesures temporelles calcules automatiquement sur de la parole de qualit. Les facteurs les plus influents tant le taux avec lequel les locuteurs articulent les sons et le nombre de pauses ralises. Imoto et al. (2002) proposent une mthode qui value laccent lexical en anglais parl par des apprenants japonais. Lexactitude des prdictions se situent 95,1% pour les natifs et 84.1% pour les apprenants japonais. Quelques travaux commencent donc merger, mais ils ne concernent pas les productions de francophones en anglais. A notre connaissance, la seule tude qui a t faite est celle de Herry (2001) et Herry & Hirst (2002) pour le logiciel Prosodia.
134
Cette valuation prsente deux objectifs : (i) une valuation subjective dapprenants franais base sur la prosodie (anglaise), afin de vrifier lefficacit de la mthode du logiciel, et (ii) une valuation objective, tablissant une corrlation entre le niveau des apprenants franais et des paramtres prosodiques. Cette valuation prend en compte des paramtres rythmiques, afin dtablir une comparaison entre les productions des natifs (britanniques anglais) et celles des apprenants franais. Les paramtres rythmiques ont t choisis selon la typologie traditionnelle des langues isoaccentuelles comme langlais, des langues isosyllabiques comme le franais et sont ceux dfinis par ltude de Ramus & Mehler (1999). A cela, ont t ajouts: (i) le pourcentage de dure vocalique, (ii) la moyenne des dures consonantiques, (iii) la variation des dures consonantiques, (iv) le coefficient de variation des dures consonantiques, (v) la moyenne des dures vocaliques, (vi) la variation des dures tel-00455248, version 1 - 9 Feb 2010 vocaliques, (vii) le pourcentage du nombre de voyelles, (viii) la diffrence de dures moyennes de la phrase des apprenants avec celles de deux locuteurs natifs, (ix) la diffrence (en pourcentage) entre les variations dintensit des tudiants avec celle des deux natifs, et enfin (x) la diffrence (en pourcentage) entre le coefficient de variation dintensit des tudiants et la moyenne des coefficients de variation des deux natifs (Herry, 2001 :294). Les variables prsentes ci-dessus sont corrles avec les rsultats dune valuation subjective qui a permis dobtenir 6 notes sur la production des apprenants et selon des critres de notation diffrents. Les calculs statistiques ont t raliss avec le logiciel CRUISE. Les analyses ont permis de dterminer des paramtres prosodiques, leur degr dimportance, et leurs intervalles pour les 6 notes. Prenons lexemple de la note 3 (dcrire les rsultats obtenus pour toutes les notes serait trop fastidieux). La note 3 reprsente la qualit de production. Lanalyse prdit des classes allant de 1 6 dans lesquelles sont classs les sujets en fonction du paramtre pris en compte par lanalyse. Les rsultats sont donns sous forme darbre. Ainsi, avec laide du logiciel Cruise une prdiction de deux niveaux est tablie, classes 2 et 3 : la classe 2 reprsente les tudiants ayant obtenu entre 58/20 et la classe 3 les tudiants ayant entre 9-12/20. Ces classes ont t tablies en fonction dun seul paramtre : la diffrence de dure par rapport la moyenne des natifs. Dans la classe 2, sur 303 valeurs, 194 sont prdites, ce qui reprsente 64%. Pour la classe 3, 78 valeurs sont prdites sur 187, soit 42%. Si la diffrence de dure est infrieure ou gale 8%, les tudiants sont classs en niveau 3, en revanche une diffrence de dure suprieure 135
8% classe les tudiants en niveau 2. La consquence de ces rsultats montre, quen phase de production (un apprenant produisant un nonc donn), plus lapprenant allonge la dure de lnonc, plus la note diminue et inversement, plus la dure se rapproche de celle du modle, plus la note augmente. Lauteur conclut que les rsultats sont intressants mais pas encore satisfaisants. Elle suggre de poursuivre une valuation objective dans de futurs travaux testant de nouveaux paramtres en plus de ceux dj tablis. Cette proposition dvaluation nest encore quau stade de test et nest pas encore assez significative pour tre incluse dans le logiciel. Le logiciel propose donc, ce stade, un feedback par coute et visualisation des courbes intonatives. La synthse de parole tel-00455248, version 1 - 9 Feb 2010 Une autre technique tout fait intgrable dans les logiciels de langue est celle de la synthse de parole. Plusieurs tudes (Van Santen & al., 2009 ; Wang & al., 2009 ; Felps & al ; 2009) sappuient sur la proposition de reformulation ( rephrasement ) des productions incorrectes des apprenants. Selon Lyster (2001), cette mthode a t efficace lors dune correction explicite des erreurs phonologiques. Tous ces auteurs mettent en avant ce procd de synthse et expliquent que cela constituerait un feedback pertinent. Lide consiste pour lapprenant couter sa propre production de la manire dont elle aurait d tre produite. Lapprenant entend donc sa propre voix mais corrige par la synthse avec un accent natif.
3.4 Conclusion
A la lumire des diffrents travaux exposs dans ce chapitre, il est lgitime de constater le manque dtudes dans le domaine de lvaluation, et de ce fait, le vide laiss par cette absence dvaluation pertinente. Cest sur cette constatation que notre intrt se porte. Lvaluation, essentielle pour un apprenant en langue seconde, se constitue sur un certain nombre de critres et souvre sur le champ de recherche que reprsente lanalyse derreurs , qui selon Corder (1980 : 13) est une notion stratgique pour le chercheur : [] elles [les erreurs] fournissent au chercheur des indications sur la faon dont une langue sapprend ou sacquiert, sur les stratgies et les processus utiliss par lapprenant dans sa dcouverte progressive de la langue .
136
Un apprentissage prosodique (ou tout autre dailleurs) nest efficace que sil est accompagn dun feedback , dune valuation concrte qui serait base sur des critres pertinents. Les premires tudes, remontant trois dcennies, ont dmontr la pertinence dun feedback, mais sans pouvoir arriver un rsultat dapplication suffisant. Aujourdhui, les nouvelles technologies ont russi implmenter un outil pdagogique dapprentissage prosodique accessible et la porte de tout apprenant. Il apparat donc pertinent de se pencher de plus prs sur cet handicap que prsentent ces logiciels, clops dun systme dvaluation automatique concret. Cest dans cette optique, que nous naccorderons pas dimportance linterrogation dfaitiste de Corder (1980 : 41) se demandant : A quoi bon investir du temps et de largent dans des recherches pnibles et techniquement difficiles tel-00455248, version 1 - 9 Feb 2010 sur les erreurs de groupes dapprenants si nous ne pouvons mettre profit leurs rsultats pour amliorer la capacit de communication de ces apprenants? et que nous poursuivons notre tude par la recherche de critres dvaluation intgrables un logiciel de langues, expose dans la section exprimentale de ce travail.
137
Synthse
Pour pallier les difficults (nonces dans les chapitres prcdents) auxquelles les apprenants sont confronts face un changement de rythme, les logiciels semblent tre une solution intressante. Suite un bref historique de lvolution de la technologie, il est noter que les tentatives dintgration doutils technologiques, notamment par la visualisation de la courbe mlodique, nest pas chose nouvelle dans lenseignement de la prosodie L2. Nanmoins, les aspects segmentaux de la langue ont longtemps t favoriss au dtriment de la prosodie, et la complexit de la reprsentation de la courbe mlodique semble avoir tel-00455248, version 1 - 9 Feb 2010 frein lemploi des nouvelles technologies dans lapprentissage des langues. De fait, lvaluation est la composante la plus critique pour ces logiciels de langue.
Il a t montr que les logiciels prsentaient des avantages intressants notamment en resituant lapprenant au cur de lapprentissage. La phontique nest pas suffisamment mise en avant dans lenseignement des langues secondes, particulirement dans le cadre collectif auquel les enseignants sont affects, mais cela nest pas tonnant, vu les diverses contraintes qui lui sont inhrentes. Ds lors, il est assez difficile de consacrer le temps ncessaire la pratique de la phontique, sinon quelques corrections occasionnelles des rares productions des tudiants. Champagne-Muzar & Bourdages (1998) expliquent la marginalisation de la composante phontique, et particulirement de la prosodie, dans lenseignement des langues par le contraste entre la rapide volution des ressources et pratiques pdagogiques pour le cours de L2 et la monotonie des mthodes de phontique corrective . Les auteurs proposent une solution base sur lutilisation de logiciels adapts : Le besoin urgent de fournir lenseignant et lapprenant un vritable outil capable dintgrer dans ses fonctions les nouvelles orientations pdagogiques .
Ainsi, un enseignement mixte alliant approches didactiques traditionnelles, pratiques et technologiques ne peut constituer quun apport bnfique pour lapprenant.
138
Cependant, mme si les nouvelles technologies ont dmontr quelles surpassaient le manque de feedback visuel accessible et interprtable par tout un chacun, le module dvaluation de ces logiciels restent trs incomplet. En effet, jusqu prsent, lvaluation propose repose sur un feedback visuel mais qui ne prend pas en compte les multiparamtres prosodiques sous-jacents. Ce constat, ainsi que le manque de travaux dans ce domaine, atteste du besoin de nombreuses perspectives de recherches. La voie de nombreux travaux, concernant lvaluation prosodique automatique pour les logiciels dapprentissage de la prosodie des langues, est donc pleinement ouverte.
tel-00455248, version 1 - 9 Feb 2010
139
tel-00455248, version 1 - 9 Feb 2010
140
tel-00455248, version 1 - 9 Feb 2010
Section 2. Analyses exprimentales
141
tel-00455248, version 1 - 9 Feb 2010
142
tel-00455248, version 1 - 9 Feb 2010
CHAPITRE 4. CONSTITUTION ET EXPLOITATION

DUNE BASE DE DONNEES : ANGLISH
143
tel-00455248, version 1 - 9 Feb 2010
Ce chapitre dcrit le droulement des diffrentes phases qui ont men la constitution de la base de donnes ANGLISH, nouveau corpus oral danglais L1 & L2 (fusion des mots anglais et English). Sont galement dcrites les tapes dannotation et de segmentation manuelle du corpus en units intonatives, en mots, en syllabes, en units rythmiques (modle de Jassem, 1952) et en phonmes (selon un codage CVC).
144
4.1 Remarques prliminaires

Nous avions soulev dans la partie introductive de cette thse, labsence de disponibilit de corpus danglais L2 produit par des francophones. Or, pour mener bien llaboration de critres prosodiques, il est ncessaire dutiliser un corpus oral danglais britannique suffisamment important, qui regroupe des enregistrements de productions en anglais L1 et L2. Ds lors, un des premiers objectifs de cette recherche consiste en la cration dune base de donnes consquente afin de mener bien les analyses qui vont suivre (cf. chapitre 5), cest--dire chercher dterminer o se situent les carts prosodiques entre des productions de natifs anglais et dapprenants francophones dans le but dtablir des paramtres destins une valuation prosodique. tel-00455248, version 1 - 9 Feb 2010 Malgr tout, le manque dun tel corpus semble tout fait surprenant, tout particulirement lorsque lon considre le statut de langlais dans le monde et la place que cette langue occupe en France. En effet, langlais est la langue officielle de plus de 50 pays et elle est parle en tant que langue maternelle par plus de 330 millions de terriens (Weber, 1997). Estime comme lactuelle langue internationale , elle est assurment la seconde langue la plus apprise et tudie au monde (Crystal, 2003) avec un nombre toujours accru dapprenants (estim 150 millions en 2008 par Weber daprs une interview sur son ouvrage en 2008 : The number of speakers of all the top ten languages have gone up in the last quarter century but relative to each other, the situation among the top ten remains unchanged ). Ces chiffres nous semblent un peu faibles, et effectivement lorsquon se rfre ltude de Graddol (2000 :10), ce dernier annonce 375 millions de locuteurs anglais L1 et 750 millions dapprenants. Langlais est en effet, la premire langue trangre tudie partir de lcole primaire dans de nombreux pays (Allemagne, Espagne etc.), y compris la France, pour laquelle le site www.nationmaster.com annonce environ 16 millions dapprenants sur la population totale. Conjointement, la littrature sur lacquisition des langues est de plus en plus abondante, et les travaux sur lacquisition de langlais L2 se font grandissants. Lorsque lon se penche sur le domaine de lacquisition des langues secondes et notamment lacquisition de langlais L2 par des francophones, la constitution et le travail sur des corpus oraux sont plus rares. Pourtant, les travaux mens dans le cadre de lapprentissage de langlais L2 ne cessent daugmenter tant au niveau segmental quau niveau
145
suprasegmental. Actuellement de nombreuses tudes sont menes, par exemple, sur laccent tranger dun franais parlant anglais (Horgues, 2005) ou de locuteurs dautres nationalits parlant anglais (Cheong, 2007 ; Jilka, 2000). La recherche en linguistique, quel que soit son domaine, semble se tourner vers la constitution et lutilisation de production de parole naturelle. De ce point de vue l, le travail sur corpus reprsente la base fondamentale des travaux entrepris. Les tudes portant sur loral et lacquisition des langues L2 ont alors grand intrt se fonder sur de grands corpus de parole, dont le style rpond aux exigences et objectifs viss. Lutilisation de corpus dans lapprentissage des langues nest dailleurs pas rcente, et cest dans les annes 1990 que le travail sur de larges corpus est apparu notamment avec la naissance du TaLC (Teaching and Language Corpora). Cependant, comme le remarque Mauranen tel-00455248, version 1 - 9 Feb 2010 (2004) si la production et les changes oraux en L2 font lobjet de nombreux travaux et occupent une place largement notable, le travail sur corpus oraux reste particulirement mis de ct, les corpus utiliss tant majoritairement des corpus crits. Le corpus ICLE26 (International Corpus of Learner English) en est une parfaite illustration. En effet, lICLE est un important projet qui est le rsultat dune collaboration de plus de 10 ans dactivits ; sa conception est trs riche et originale, mais ce corpus ne comporte quune base crite reposant sur deux types dexercices : un commentaire compos argumentatif et une dissertation littraire (environ 500 1000 mots pour chacun des exercices). Nous ne trouvons aucune quivalence du mme type pour des corpus oraux. Boulton (2008) fait tat des diffrents corpus existants en DDL ; sur 39 recenss, nous constatons que seulement 11 portent sur loral des apprenants et semblent de surcrot tre difficilement accessibles. Malgr tout, actuellement, un seul projet en cours se distingue des remarques formules cidessus. Il sagit du projet LONGDALE (Granger & al., 2009), qui a pour objectif de constituer un corpus dapprenants avec une partie consacre aux apprenants francophones de langlais L2. Paralllement cela, nombreux sont les corpus danglais L1, et dont les utilisations sont spcifiques certains types de travaux ou rpondent des exigences en fonction des
26
http://www.fltr.ucl.ac.be/fltr/germ/etan/cecl/Cecl-Projects/Icle/icle.htm
146
diverses approches choisies. En effet, de nombreux travaux sur langlais, quel que soit leur cadre thorique, semblent sappuyer sur la volont dutiliser des stimuli naturels. Ainsi plusieurs grandes bases de donnes, orientes selon le type de travaux, sont exploitables et disponibles (tudes inter-dialectales avec IVIE27 (Kochanski & al., 2004), tude dun phnomne particulier sur de langlais spontan avec la base de donnes Aix-Marsec (Auran & al, 2004), ou encore une base de donnes comparatives sur les langues europennes telle que EUROM1 (Chan & al. ,1995), etc.). On retrouve galement plus dune vingtaine de corpus danglais L1 sur le site de lUCREL28 (University Centre for Computer Corpus Research on Language) tels que le BNC (90% de donnes crites), le Lancaster/IBM Spoken English Corpus devenu SEC puis Aix-Marsec ou encore ITU (International Telecommunication Union) pour exemples de corpus oraux. Egalement, des centres de ressources linguistiques tels que le LDC29 (Linguistic Data Consortium) ou tel-00455248, version 1 - 9 Feb 2010 encore l ELRA30 (European Language Resources Association) mettent la disposition de la communaut un grand nombre de corpus anglais L1, tel que AURORA (ELRA), base de donnes dveloppe dans le but principal dtudier linfluence sur la performance de la reconnaissance automatique de la parole pour des entres de parole en mode mains-libres dans des environnements bruits. De ce constat gnral sest impose la ncessit de la constitution dune ressource telle que ANGLISH.
27
http://www.phon.ox.ac.uk/old_IViE http://ucrel.lancs.ac.uk/corpora.html http://www.ldc.upenn.edu/ http://catalog.elra.info/index.php
28
29
30
147
4.2 Origine du corpus ANGLISH

4.2.1 Corpus de base : Eurom 1
Les extraits/passages qui ont servi de base et de support nos enregistrements (destins la cration du corpus ANGLISH) sont issus de la base de donnes multilingue du corpus EUROM 1. Ce corpus a t cr dans le cadre de travail du projet europen SAM_A, lui-mme extension dun projet prliminaire appel SAM (Speech Assessment Methods) dont le but tait de produire une base de donnes de parole commune en langues europennes. La continuit du projet sest appuy sur le dveloppement progressif de la base de donnes dsormais appel EUROM afin de mettre en avant lexistence dun corpus de langues europennes disponible sur Cdroms. tel-00455248, version 1 - 9 Feb 2010 Ainsi le corpus EUROM 1 contient des enregistrements de 60 locuteurs en 11 langues europennes : danois, nerlandais, anglais britannique, franais, allemand, norvgien, sudois, nerlandais, grec, portugais, espagnol. Il a donc t explicitement conu pour faciliter les comparaisons phontiques entre langues, en s'appuyant sur des matriaux similaires et des protocoles d'enregistrement identiques dans toutes les langues.
4.2.2 Description du corpus Eurom 1

Pour chacune des 11 langues proposes, 4 types dexercices de lecture ont t enregistrs suivant lordre annonc ci-dessous : -121 logatomes isols puis en contexte, -100 nombres allant de 0 9999, -40 passages de 5 phrases chacun relatant une histoire du quotidien, -50 phrases isoles provenant des passages proposs. Le corpus a t divis en 3 sous-corpus : - Many Talker Corpus (MANY) : 100 nombres, 3 passages, 5 phrases, lus par 30 hommes et 30 femmes, - Few Talker Corpus (FEW) : 5 x 121 logatomes, 5 x 100 nombres, 15 passages et 25 phrases, lus par 5 hommes et 5 femmes slectionns partir du corpus MANY, - Very Few Talker Corpus (VERY FEW) : 121 logatomes en contexte lus par 1 homme et 1 femme slectionns du corpus FEW. 148
Les enregistrements ont t faits en chambre sourde une frquence de 20KHz et une rsolution de 16 bits, les donnes recueillies directement sur disque dur. Eurom 1 : corpus anglais Le corpus en langue anglaise est compos des enregistrements numrs cidessous : - MANY corpus : 60 locuteurs (30 hommes et 30 femmes) ont lu 3 passages, 5 phrases et 100 nombres, - FEW corpus : 10 locuteurs (5 hommes et 5 femmes) ont enregistr 15 passages, 25 phrases, 5 x 100 nombres et les logatomes isols, - VERY FEW corpus : 2 locuteurs (1 homme et 1 femme) ont lu les logatomes en tel-00455248, version 1 - 9 Feb 2010 contexte.
4.2.3 Enrichissement du corpus Eurom 1 (corpus anglais)

Etat des lieux Parmi les exercices proposs dans le corpus Eurom1 anglais, on trouve la lecture de 40 passages (comme indiqu ci-dessus dans la description du corpus Eurom1). La rpartition de ces 40 passages se fait en 4 groupes de 10 passages nomms respectivement, O, P, Q, R [+ le numro du passage], chacun sous-diviss en groupe de 5 passages. Cidessous la rpartition des enregistrements effectus et classs par locuteur (tableau issu et adapt du corpus Eurom 1). speakers fa fb fc fd fe ff fg fh fi fj Groups of passages o1-o5 o6-o0 p1-p5 x x x p6-p0 q1-q5 x x q6-q0 x x r1-r5 x x x r6-r0
x x x x
x x x x x x x x x x x x x
Tableau 4. Rpartition des enregistrements des passages par locuteur (corpus EUROM 1)
149
Il nous a sembl intressant dexploiter lensemble des 40 passages proposs dans le corpus Eurom1 mais en application un mme locuteur. Dans la mesure o les enregistrements effectus dans ce corpus sont rpartis de manire assez alatoire, la seule directive impose tait que chacun des locuteurs devait lire 15 passages parmi les 40. Une exploitation de la totalit des passages pour un mme locuteur et ce, par plusieurs locuteurs, semblait tre un apport important afin dobtenir une base de donnes comparative inter-passages plus large. Contributions personnelles : extension du corpus EUROM 1 Un premier corpus, nomm eurom1_EN_complete, a t enregistr afin dlargir la base de donnes de EUROM1. Ainsi, cinq locuteurs ont t enregistrs dans une tche de lecture des 40 passages en anglais, extraits du corpus Eurom1. Pour les besoins de cette tel-00455248, version 1 - 9 Feb 2010 thse, certains passages de ces enregistrements ont t exploits dans la partie exprimentale, savoir 4 passages lus des trois locuteurs britanniques, et font ainsi partie du corpus ANGLISH, prsent ci-dessous. Chacun des passages se compose de 5 phrases lies smantiquement (soit au total 200 phrases) racontant un vnement, une histoire de la vie quotidienne. La consigne donne la fois oralement et lcrit, en franais et en anglais, (cf. tte de page des feuillets prsents aux sujets) tait de : Lire les passages comme si lhistoire vous tait arrive et que vous la racontiez un ami . Les passages taient donns lavance de manire ce que les locuteurs se familiarisent avec les textes et puissent viter les bafouillages lors de lenregistrement. Les passages ont t donns 10 par 10, une pause ayant t prvue entre chaque groupe de textes, de faon ne pas surcharger le locuteur. Les enregistrements se sont drouls en chambre sourde au laboratoire de recherche Parole et Langage Aix-en-Provence. Un micro-casque a t utilis pour les enregistrements. Les donnes ont t directement rcupres sur ordinateur sous format wav en qualit numrique mono 16 bits avec un chantillonnage de 44 Hz. Parmi les 5 locuteurs, trois locuteurs, deux femmes et un homme dune moyenne dge de 24 ans, sont britanniques anglais et de langue maternelle anglaise. Les deux locutrices viennent du sud de lAngleterre (Hemel Hempstead et Chertsey, respectivement nord-est et sud-est de Londres) et le locuteur est originaire du nord-est du pays (Yorkshire). Les deux autres locuteurs, une femme et un homme dune moyenne dge de 26 ans, sont amricains originaires de ltat de Californie et de langue maternelle anglaise 150
(anglais amricain). Tous les cinq sont lecteurs au dpartement danglais de luniversit de Provence. Ils ont tous t volontaires pour enregistrer les diffrents passages. Un consentement de participation et de droit de diffusion des enregistrements a t prsent et sign par chacun des participants. A titre de rcapitulation, a) pour laccent anglais et b) pour laccent anglais amricain :
a). 120 passages soit 600 phrases prononces par 3 locuteurs britanniques anglais sont enregistres, ce qui reprsente un total denviron 36 minutes de parole lue. La dure dun passage varie de 10,6073 30,2146 secondes en fonction du locuteur.
tel-00455248, version 1 - 9 Feb 2010
Locuteur
dure (min. sec.)
dure (max. sec.) 30,2146 27,4705 23,1789
moyenne (sec.) 18,5666 18,8120 16,7657
nombre passages 40 40 40 120
dure totale (sec.) 742,6651 752,4834 670,6307 2165,7794 (min.) 12,37 12,54 11,17 36,09
F01GB F02GB H01GB Total
10,6073 12,5439 12,0811
b). 80 passages soit 400 phrases prononces par 2 locuteurs amricains sont enregistres, ce qui reprsente un total denviron 25 minutes de parole lue. La dure dun passage varie de 10,8442 27,8387 secondes.
Locuteur
dure (min. sec)
dure (max. sec) 12, 0021 27, 8387
moyenne (sec.) 19, 6934 17, 1488
nombre passages 40 40 80
dure totale (sec.) 787,7363 685,9543 1473,6906 (min.) 13,12 11,43 24,56
F1AM H1AM Total
10, 8442 27, 6658
151
4.4 ANGLISH : cration dun corpus anglais L1 & L2 4.4.1 Choix, rflexions et exigences
La conception retenue pour ce corpus simposait par diffrents souhaits et exigences que nous exposons dans les thmes dvelopps ci-dessous. Les quatre axes majeurs interdpendants qui ont guid la conception du corpus reposaient sur : (i) la volont de mener bien des travaux sur lvaluation de la prosodie danglophones et de francophones apprenants en anglais L2, permettant de crer une valuation objective intgrable des logiciels de langues, cadre de travail de cette thse, (ii) crer au moins un exercice offrant une base de donnes comparable interlocuteurs, (iii) la volont de combler le manque de larges corpus oraux en anglais L2 parl par des tel-00455248, version 1 - 9 Feb 2010 francophones, (iv) la volont de crer une ressource qui serait utilisable, outre ses propritaires, par la communaut scientifique mais aussi enseignante, (v) une libre diffusion qui serait destine un public dutilisateurs secondaires avec des buts diffrents, allant du simple apport de support sonore de natifs anglais (anglais L1) pour un contenu thorique sur un fait de langue particulier, lanalyse derreurs segmentales ou prosodiques de productions de francophones en anglais L2 par exemple, ou tout autre tude possible.
ANGLISH : corpus, base de donnes ?
Avant de prsenter une description dtaille de la constitution dANGLISH, nous souhaitons faire un bilan terminologique trs bref. Corpus est le premier terme qui merge de manire dominante lorsque lon nomme un matriel linguistique de ce type. Si nous prenons en compte la dfinition de Habert et al. (1997), nous pouvons alors considrer quANGLISH a toutes les caractristiques dun corpus traditionnel : une collection de donnes langagires qui sont slectionnes et organises selon des critres linguistiques explicites pour servir dchantillon de langage . 152
Cela nous conduit une dfinition classique du corpus, comme un rassemblement denregistrements audio et qui catgorise ANGLISH en tant que tel. Cependant, cette dfinition semble assez limitative. Durand (2003) nous propose une dfinition un peu plus complte issue de Gibbon et al. (1998), qui correspondrait notre propre collection denregistrements:
a corpus is any collection of speech recordings which is accessible in computer readable form and which comes with annotation and documentation sufficient to allow re-use of the data-in-house, or by people in other organisations .
Ainsi, nous compltons notre premire dfinition par lide que lensemble des enregistrements audio est alors accompagn par diffrents niveaux (ou niveau unique) de tel-00455248, version 1 - 9 Feb 2010 transcriptions. Cest dailleurs en ce sens l, que nous relevons la tche considrable et la difficult de travail qui nous sont apparues, tant au traitement des donnes audio (environ 5h30), quau niveau des enregistrements, et que pour les diffrents traitements orthographique, extractions des donnes, annotations (etc.). Cependant, par contraste avec la reprsentation classique du corpus comme lment achev ou abouti, un second concept consiste examiner ANGLISH galement en tant que base de donnes. Selon le jargon franais31, une base de donnes se dfinit comme telle : une base de donnes doit tre conue pour permettre une consultation et une modification aise de son contenu, si possible par plusieurs utilisateurs en mme temps . ANGLISH rpond donc galement aux exigences dune base de donnes, comportant une structuration particulire des donnes (enregistrements structurs en catgorie, cf. figure 14, alignement acoustique manuel) et une possibilit de requte (Auran, 2003), dans la mesure o les informations classes de type TextGrid dans le logiciel Praat (Boersma & Weenick, 2009) sont isoles sur des niveaux distincts nomms tiers (appels dsormais ranges , selon le terme emprunt Cho (2009)), et
31
http://www.linux-france.org/prj/jargonf
153
permettent commodment la formulation de requtes diverses. Ainsi lannotation des donnes peut se faire sur plusieurs annes. ANGLISH, en tant que base de donnes, sinscrit donc dans le cadre dune conception dynamique qui attend de recevoir une constante volution. Ce point terminologique nous permet de conclure quANGLISH peut tre considr comme une base de donnes volutive, mais pour des raisons de simplicit, nous nous permettrons dutiliser diverses reprises pour ce travail de thse, le terme corpus , sans bien entendu, que les diffrents points de vue dvelopps ci-dessus, ne soient remis en cause.
Parole de laboratoire vs parole spontane vers parole naturelle tel-00455248, version 1 - 9 Feb 2010
Outre les corpus crits, on distingue dans les travaux de phontique et phonologie, deux types de corpus, savoir les corpus de parole de laboratoire et les corpus de parole spontane. La parole de laboratoire correspond des enregistrements de parole effectus dans des conditions exprimentales, trs souvent en chambre sourde de manire obtenir une bonne qualit de son. Les donnes se composent de lecture de logatomes, de mots, de phrases isoles, de textes ou de phrases prpares en amont. Les exercices proposs tant plutt de la parole contrainte, cela peut parfois aboutir des rsultats peu naturels voire artificiels. En revanche, cela permet lexprimentateur dtudier un phnomne prcis en utilisant des stimuli contrls. Nous retiendrons comme atouts pour le corpus ANGLISH que ce type de mthodologie permettra dobtenir une qualit du signal sonore optimale (cf. qualit technique du corpus) mais aussi den retirer une base de donnes comparables pour lensemble des locuteurs, ce qui nous fera pencher pour une tche de lecture de textes. Le deuxime type de parole, qui est celui de la parole spontane, vient sopposer la parole de laboratoire dans le sens o aucune contrainte nest impose aux locuteurs, ces derniers tant enregistrs dans des conditions naturelles de production (changes, dbats, interviews, etc.) qui ne ncessitent pas lexprimentateur davoir pralablement organis des stimuli. Lavantage de ce type de corpus est quil peut tre recueilli en chambre sourde. De plus en plus dtudes se tournent vers de la parole naturelle, de manire obtenir des caractristiques authentiques des productions des locuteurs. Cest dans ce sens l que nous avons souhait allier la fois qualit optimale du son (enregistrements effectus en 154
chambre sourde), donnes comparables par les tches de lecture et rptitions (cf. varits des genres) et enfin parole naturelle (il a t demand aux locuteurs de parler spontanment dun sujet de leur choix, racontant une anecdote sur, par exemple, leurs dernires vacances). Ainsi ANGLISH combine trois types de donnes orales tout en gardant une qualit acoustique idale des analyses phontiques.
Focus sur loral
Comme nous lavons expliqu prcdemment, il existe une relle paucit de corpus oraux danglais L2 produit par des francophones alors quil existe un nombre assez important de corpus crits disponibles et exploitables pour travailler sur langlais et sur le tel-00455248, version 1 - 9 Feb 2010 franais. Par ailleurs, paralllement cela, un travail considrable reste faire dans le domaine de lapprentissage de loral de langlais. A plusieurs reprises, nous avons pu constater le peu de place laiss loralisation des langues proportionnellement celle faite lcrit. Les preuves de langues du baccalaurat, par exemple, sont dabord menes sur un support crit, loral narrive que de manire optionnelle ; il a dailleurs t constat que plus de 70% des lycens lchance de leur scolarisation de second cycle, ayant tudi langlais pendant plus de 7 ans, atteignent un niveau de comptence mdiocre selon les rapports europens32. Par ailleurs, lorsque lon se penche sur le premier systme majeur dvaluation fond sur le cadre commun europen du Conseil de lEurope, DIALANG, aucune place pour loral na t faite lors de la conception du test-diagnostique. Ainsi, de nouveau, ce sont des comptences crites de la langue qui sont values. Il nous semblait donc important quune ressource de productions orales soit cre afin de (i) pallier un manque de corpus anglais L2 et (ii) obtenir une base de donnes qui pourrait donner lieu de nombreux travaux sur lvaluation de loral et qui permettrait dinclure un systme dvaluation automatique de loral ces tests dj existants et incomplets.
European network of Policy Makers for the evaluation of Education Systems (2004) The Assessment of Pupils Skills in English in Eight European Countries 2002. A European Project. http://cisad.adc.education.fr/reva/pdf/lire16.pdf
32
155
Varits des genres
Pour cette base de donnes, lintention premire tait de raliser la fois des tches reprsentatives du contenu dun logiciel de langue destin lapprentissage de la prosodie de langlais, mais aussi des exercices que lon retrouve en contexte dapprentissage en parcours universitaire. Nous souhaitions galement obtenir des donnes identiques en terme de contenu qui soient comparables pour lensemble des locuteurs ; notre choix sest donc port, tout dabord, sur une tche de lecture que nous avons complte avec une tche dimitation, avec des rptitions de phrases et de la parole naturelle (cf. contenu de la base de donnes pour une description dtaille). Varits des niveaux dapprentissage des locuteurs tel-00455248, version 1 - 9 Feb 2010
Afin de constituer nos diffrents groupes de locuteurs, la question de la reprsentativit a t de nouveau aborde. La constitution dun prcdent corpus (Tortel, 2004) a permis de mettre en avant la problmatique des groupes de niveaux. Quatre groupes avaient t constitus : franais non spcialistes de la langue, tudiants de 1re anne, tudiants de 4/5me anne, et natifs anglais. Il tait apparu, au vu des rsultats obtenus, que les groupes de non spcialistes et tudiants de 1re anne avaient des rsultats quasi quivalents, et mme chose pour les tudiants de 4/5me anne avec le groupe des natifs. Cette difficult se retrouve galement dans les travaux mens en pathologie, comme lillustre les travaux de Revis (2004). Il tait donc souhaitable de constituer des groupes de niveau plus distincts, par rapport leur niveau de langue (niveau acadmique).
Qualit technique du corpus
Pour rendre possible lanalyse exprimentale, la constitution dune base de donnes sonores impose une prcaution particulire et des caractristiques techniques prcises quant lenregistrement effectu ; en effet, le choix du lieu denregistrement et du matriel utilis (entre autres) sont des questions essentielles et primordiales pour mener bien une analyse phontique du signal (conditions identiques pour chaque enregistrement, absence
156
de bruits de fond, matriel de qualit, bon rapport signal/bruit, etc. ). Ainsi, pour une qualit sonore optimale, tous les enregistrements ont eu lieu en chambre anchoque (dans les locaux du LPL) une frquence de 44KHz et une rsolution de 16 bits et ont t effectus laide dun micro-casque. Les donnes ont t recueillies directement sur disque dur sous format wav., PCM, en mono.
4.4.2 ANGLISH : Description du corpus
Le choix du corpus a t un des points essentiels de cette tude. En effet, il reprsente la base de ce travail, et les rsultats et interprtations possibles de cette recherche dpendent en grande partie du choix du type de corpus. La constitution dun tel-00455248, version 1 - 9 Feb 2010 corpus ne signifie pas simplement de regrouper des donnes (crites ou orales) ; en effet, cela entrane un travail qui seffectue en trois phases : (i). un travail prparatoire qui est ralis avant la phase denregistrement des donnes, (ii) lenregistrement des donnes, (iii) la structuration et mise en forme des donnes afin quelles soient utilisables. Nous souhaitions, pour ce travail de thse, un corpus qui regroupe les exigences nonces ci-dessus. Nous constatons que de nombreux enregistrements sont constitus sur des productions de franais en anglais rpondant aux exigences dune tude prcise, mais peu dentre eux se dveloppent et acquirent la casquette de corpus , peu regroupent toutes les caractristiques souhaites pour notre recherche et aucun ne semble tre accessible librement. Nous prsentons ici, une description dtaille du contenu de la base de donnes ANGLISH.
De Eurom 1 ANGLISH : choix des textes et prparation des stimuli
Une prparation pralable aux exercices, comprenant le choix des textes et le montage de la bande son pour la phase de rptition, tait ncessaire. Le choix de base sest port sur les passages du corpus Eurom 1, car les textes proposs nous semblaient adapts une tche de lecture, dans laquelle le sujet pouvait tout
157
fait sapproprier le texte, tant une histoire du quotidien qui pourrait arriver nimporte lequel dentre nous. La difficult majeure a t la slection des quatre textes. Eurom 1 en comporte 40 (comme expliqu prcdemment), ce qui laisse un choix assez important. Mais il est noter que parmi nos groupes, se trouve celui des faux dbutants pour lesquels nous souhaitions absolument viter une difficult segmentale trop importante (puisque ce nest pas ce qui nous intressait en premier lieu), mais aussi limiter les bafouillages. Il est vrai quune difficult de lecture trop importante aurait empch la comprhension et la libre interprtation du texte, et ainsi le non respect involontaire de la consigne par le locuteur. Pour cela, nous avons vit de slectionner les passages comportant des nombres, des dates, des numros de tlphone, des noms propres, des noms de lieux tels que Ireland , Edgebaston , Tewkesbury , des adresses, des noms de maladie tel-00455248, version 1 - 9 Feb 2010 ( hepatitis A , typhoid fever . Une fois ces critres pris en compte, le choix se faisait parmi une quinzaine de textes. Nous nous sommes alors penche sur le nombre de syllabes dans les phrases et avons rpertori le nombre total de syllabes de chacune des phrases de chacun des passages (cf. annexes, section 1). Nous souhaitions viter que les phrases soient trop courtes et comptent moins de 7 syllabes, mais aussi matriser le dbit en contrlant les longueurs de phrases par les syllabes. Un autre critre tait loccurrence des mots polysyllabiques, envisageant un dplacement daccent lexical vers la gauche de la part des locuteurs francophones. Ainsi nous avons tent davoir au moins un mot quadrisyllabique dans chaque passage, puis plusieurs bi -et trisyllabiques. Les mots de deux syllabes semblaient suffisants pour observer le phnomne de dplacement daccent et dallongement de syllabes inaccentues au niveau des locuteurs de niveau faible. En revanche, il tait important de disposer de mots de plus de trois syllabes pour le groupe dtudiants qui ces mots posent plus de difficults. Aprs ce premier tri, nous avons slectionn six textes que nous avons tests sur une dizaine de sujets. Les sujets taient des membres de la famille ou des proches qui nont pas particip par la suite aux enregistrements destins la base de donnes ANGLISH et avaient donc t choisis simplement pour une phase test. Nous leur avons demand de lire les 6 textes voix haute (dans les mmes conditions que pour les rels enregistrements, cest--dire, avec une prise de connaissance des textes en amont, et une prise de son dans la chambre sourde) ; dans un second temps, leur tche tait de slectionner les 4 textes sur lesquels ils se sont sentis laise, la fois dans la tche de 158
lecture et de comprhension. Sur une douzaine dinterrogs, la majorit avait choisi les 4 textes qui ont t prsents lors de la phase finale relle denregistrements.
Concernant la phase de rptition (phase 2), nous avons cr une bande son en utilisant le logiciel CoolEdit, que nous avons ralise partir des noncs des quatre textes proposs en lecture, ainsi quun texte supplmentaire. Nous avons donc extrait et isol 25 phrases (cf. annexes, section 1) prononces par les natifs anglais enregistrs pour le corpus Eurom 1 qui servaient de modles de rfrence aux sujets. Nous avons rcupr un son de type bip qui servait dalerte chaque fois que le locuteur allait entendre une nouvelle phrase. Dix secondes ont t planifies entre chaque phrase, ce qui laissait aux sujets la possibilit de se reprendre sils jugeaient leur prestation mauvaise. La bande-son tait diffuse laide dun appareil mp3, et le son diffus lintrieur de la chambre sourde par tel-00455248, version 1 - 9 Feb 2010 une enceinte relie par un cble lappareil. Deux modles de rfrence ont t crs, lun avec une voix de femme, lautre avec une voix dhomme.
Contenu de la base de donnes
Le corpus ANGLISH se compose de trois phases dexercices diffrents en anglais enregistres selon lordre indiqu suivant :
Lecture
Il sagit dune tche de lecture de 4 passages (cf. annexes, section 1) issus du corpus EUROM 1 (P9, Q0, Q9, R3), lus par 63 locuteurs, ce qui reprsente un total de 252 passages (soit 1260 phrases) pour une dure approximative dune heure et demie de lecture (soit 4765,3138 secondes). Chacun des passages se compose de 5 phrases lies smantiquement racontant un vnement, une histoire de la vie quotidienne. La consigne donne la fois oralement et lcrit tait de : Lire les passages comme si lhistoire vous tait arrive et que vous la racontiez un ami . Les passages taient donns lavance de manire ce que les locuteurs se
159
familiarisent avec les textes et puissent viter les bafouillages lors de lenregistrement. Cidessous, un exemple de passages propos : I've always found it difficult to sleep on long train journeys in Britain. For one thing, I can never make myself comfortable in the seat. Then the other passengers usually talk so loudly or worse still they snore. In addition, there's the constant clickety-click of the wheels on the track. If I do manage to doze off the ticket inspector comes along and wakes me.
La tche de lecture permet de contrler les variables intra-locuteurs et permet dobtenir des donnes parfaitement comparables pour chacun des locuteurs et ce quel que soit son niveau en anglais. Par ailleurs, cette tche semble tre considre comme la base tel-00455248, version 1 - 9 Feb 2010 dune comptence linguistique sur laquelle un enseignant sappuie pour contrler les acquis de ses tudiants. En effet, outre un contrle de lacquisition de la syntaxe ou des lments du niveau segmental, la tche de lecture oralise joue un rle dapprentissage par un entranement de lapprenant larticulation, la respiration, le dosage du dbit, les pauses mais aussi lintonation (Liberman et al., 1967). Lexercice devient donc une tche de lecture expressive o le lecteur tente de donner vie un texte en traduisant des sentiments, en lui donnant une tonalit et donc une intonation particulire.
Rptition
Il sagit dune rptition de 25 phrases (par 63 locuteurs), selon un modle natif (fminin ou masculin) enregistr dans le cadre du corpus EUROM 1, issues des 4 passages utiliss pour la tche de lecture ainsi quun passage (R3) ajout, toujours extrait du corpus EUROM 1 (cf. annexes, section 1). La consigne donne tait de rpter les phrases suivantes en essayant dimiter la faon dont elles sont produites . Cette tche reprsente un total de 1575 phrases, soit une dure totale approximative dune heure et demie (soit 4811, 2246 secondes) pour lensemble des phrases rptes. En cas de bafouillage, le sujet avait pour consigne de se reprendre ou recommencer la phrase, le pilotage de la bande son des phrases tant men par lexaminatrice elle-mme (sachant qu la base, une dure de
160
10 secondes avait t fixe entre chaque phrase). Ci-dessous, un exemple de quelques phrases proposes sur les 25 donnes : [] 04. In addition, there's the constant clickety-click of the wheels on the track. 05. If I do manage to doze off the ticket inspector comes along and wakes me. 06. What can I have for dinner tonight? 07. I do have some fresh pasta in the fridge. 08. The trouble is I eat that two or three times a week. []
Monologue
tel-00455248, version 1 - 9 Feb 2010
Cela consiste en un monologue de 2 minutes environ (produit par 63 locuteurs), sur un sujet non impos (le thme des vacances avait t suggr chacun des sujets mais ntait pas impos afin que le locuteur soit le plus possible laise et confiant dans cet exercice). Ainsi, les locuteurs avaient libre antenne pendant environ deux minutes pour parler dun sujet de leur choix, non prpar, si ce nest quelques minutes, le temps de rflchir un thme appropri. Cette tche reprsente une totalit de 63 monologues, soit une dure totale approximative de parole de trois heures (soit 10799,9619 secondes). Cidessous, un extrait dun monologue produit par une locutrice (F03GB) :
so for the last three or perhaps since er for four weeks I've been learning this Chopin ballad it's the first one in C minor it's terribly difficult and erm whereas I've been working at it quite a lot there's still a lot more to do what I have to do is break it down into small parts and try to work on the technical aspect of some of it [] (cf. annexes, section 1). Certains auteurs tels que Guaitella (1991) pensent que la prosodie dun texte lu ne reflte pas la prosodie dune parole spontane. Nous avons tenu compte de cette remarque et tent dobtenir une partie plus spontane o le locuteur nest plus aid par un support crit par lequel il navait pas rflchir la syntaxe, la grammaire ou au vocabulaire. Cependant, comme le fait remarquer Freland-Ricard (1995), les corpus dits de parole spontane sont souvent des extraits de journaux tlviss, dinterviews, ou encore des 161
entretiens radiophoniques qui utilisent soit un prompteur, soit des fiches de prises de notes prpares lavance, le tout tant rpt plusieurs reprises afin de matriser lintervention au moment voulu. La spontanit nest plus tout fait celle que lon pensait tudier.
Locuteurs
Pour les raisons nonces prcdemment, le choix des locuteurs sest port sur un talonnage vari de deux niveaux assez distincts dapprenants et un niveau contrle reprsent par les natifs. ANGLISH compte donc 63 locuteurs, ports volontaires pour enregistrer les trois exercices proposs qui sont rpartis en trois groupes : (i) le groupe tmoin qui est celui des tel-00455248, version 1 - 9 Feb 2010 natifs anglais (GB), (ii) le groupe dtudiants de 2/3me anne, spcialistes de la langue (FR2), (iii) un groupe de faux dbutants (Hadley, 2002) avec un niveau BAC en anglais nayant pas poursuivi dtudes suprieures spcialises dans l anglais et dont loptique serait de se remettre langlais dans un but spcifique ou personnel. Ils pourraient tre des utilisateurs potentiels dun logiciel de langues (FR1). En voici la composition numrale : -GB : 23 locuteurs, 13 femmes et 10 hommes, britanniques anglais -FR2 : 20 locuteurs, 10 tudiantes et 10 tudiants anglicistes, fin de 2me/dbut 3me anne -FR1 : 20 locuteurs, 10 femmes et 10 hommes en activit ayant niveau Bac anglais L2 Concernant les locuteurs du groupe GB, la moyenne dge est de 31 ans. Tous viennent dAngleterre, et plus prcisment, 6 des Midlands, 4 du Nord et 13 du Sud de lAngleterre. Pour le groupe FR2, tous sont franais de langue maternelle franaise, tudiants en anglais, spcialistes de la langue cible, ayant suivi le cursus universitaire de phontique Aix-en-Provence avec un apprentissage de la prosodie et des caractristiques segmentales ; ils sont soit en fin de 2me anne, soit en dbut de 3me anne. Aucun na effectu de sjours dans un pays anglophone de plus de quatre semaines conscutives, et aucun ne fait partie dune famille dont lun des parents ou membres serait anglophone. Tous ont fait en moyenne 9 10 ans dtudes danglais en milieu scolaire. La moyenne dge du groupe se situe entre 19 et 22 ans.
162
Enfin le groupe FR1 se compose dadultes franais de langue maternelle franaise, dun niveau dtudes post-baccalaurat, exerant une activit professionnelle. La moyenne dge de ce groupe est de 37,5 ans. Aucun ne possde de connaissances approfondies en phontique anglaise ; tous ont un niveau bac danglais et ont suivi un cursus scolaire danglais en tant que L2. Aucun na effectu de sjour rcent de plus dun mois dans un pays anglophone. Toutes ces informations ont t recueillies par le biais dun questionnaire prsent aux sujets en amont des exercices raliser. Un consentement de participation et de droit de diffusion des enregistrements a galement t prsent et sign par chacun des participants (cf. annexes, section 1). Toutes les informations relatives aux locuteurs (issues de la fiche signaltique) sont synthtises et rpertories par groupe et par sexe dans des tableaux prsents en annexe (cf. annexes, section 1). tel-00455248, version 1 - 9 Feb 2010
Codage du corpus
Afin de pouvoir reprer plus facilement les locuteurs pour la suite de ce travail, nous avons cod leur prestation en fonction des tches effectues et de leur groupe dappartenance : -pour la tche de lecture (exemple : F02GBP2) 1. La premire lettre indique le sexe du locuteur : F pour une femme et H pour un homme. 2. En deuxime position, le nombre indique le numro attribu au locuteur (ici, 02) 3. Les deux lettres suivantes indiquent le groupe dappartenance du locuteur : GB, FR1 ou FR2 (ici, GB), le numro indique le niveau (1= faux dbutants ; 2= tudiants anglicistes) 4. Enfin le dernier groupe de caractres du codage indique lexercice effectu : P pour passage et 1, 2, 3 ou 4 pour le numro du passage. -pour la tche de rptition (exemple : H05FR1phrase01_Britain) 1. La premire lettre indique le sexe du locuteur : F pour une femme et H pour un homme. 2. En deuxime position, le nombre indique le numro attribu au locuteur (ici, 05) 3. Les deux lettres suivantes indiquent le groupe dappartenance du locuteur : GB, FR1 ou FR2 (ici, FR1), le numro indique le niveau (1= faux dbutants ; 2= tudiants anglicistes) 4. Le mot phrase indique que cest la tche de rptition de phrases qui est code
163
5. Le nombre suivant est le numro attribu la phrase (ici, 01) 6. Le mot est un mot clef de la phrase, il ne correspond pas ncessairement au noyau de la phrase (ici, Britain) -pour la tche du monologue (exemple : F10FR2_monologue) 1. Les points 1, 2 et 3 prcdents restent inchangs 2. La tche du monologue est indique par le mot monologue (comme dans lexemple cit).
Accessibilit du corpus ANGLISH
tel-00455248, version 1 - 9 Feb 2010
Le corpus ANGLISH sera en libre accs, partir de janvier 2010, sur le Centre de Ressources pour la Description de lOral (CRDO) http://crdo.fr. Le CRDO (Bel & Blache, 2006) est le CRN (Centres de Ressources Numriques) centr sur les ressources orales, initiative conjointe de la Direction de lInformation Scientifique et du Dpartement scientifique Homme et Socit du CNRS sous la responsabilit des laboratoires LACITO et LPL. Un accs est ouvert la communaut scientifique et enseignante dans le but que chacun puisse accder cette ressource des fins scientifiques et pdagogiques.
4.4.3 Transcriptions du corpus

Le travail de transcription et dannotation a t effectu manuellement avec le logiciel PRAAT33 (Boersma & Weenick, 2009).
Transcription orthographique La premire grande tape concernant lannotation des enregistrements (une fois le codage des donnes achev), porte sur lencodage orthographique. ANGLISH tant
33
www.praat.org
164
compos de trois types de donnes, nous nous sommes attele deux catgories de transcription orthographique que nous avons ralise manuellement dans Praat. Pour les phases 1 et 2 (contextes de lecture et rptition), nous avons effectu une transcription orthographique partir des scripts denregistrements utilisant les textes originaux (issus de Eurom 1). Pour la phase 3 (contexte du monologue) la transcription orthographique a t ralise par un encodage orthographique partir du contenu du signal. Pour effectuer ce codage orthographique (phase 3), nous avons tabli une convention de notation selon les principes suivants : la ponctuation nest pas prise en compte mais les phnomnes typiques de loral tels que les faux-dparts, les pauses pleines, les rptitions, les mots tronqus sont prciss. En voici quelques exemples : -les mots tronqus sont suivis dun tiret ; par exemple lors dune hsitation : la troncation bene- pour benefited tel-00455248, version 1 - 9 Feb 2010 -les aspects non linguistiques tels que les rires sont marqus entre crochets, par exemple : [laugh] -les interjections de type hsitation o le locuteur cherche un mot particulier ou cherche gagner du temps pour rflchir la suite de son discours sont marques er ou erm pour les locuteurs britanniques et euh pour les locuteurs franais ; -les formes contractes ont t retranscrites telles quelles sans modification, cest-dire sans avoir t ramenes une forme non contracte, la transcription est donc faite en fonction des ralisations effectives, comme le mot cos forme contracte du mot because dans la phrase I think just 'cos I met erm a friend . Toutes les transcriptions orthographiques des monologues du groupe des natifs anglais ont t vrifies et attestes par une personne native.
Transcription phonmique
La transcription phonmique a t ralise manuellement et de manire canonique pour lensemble des locuteurs. Cette transcription concerne uniquement la phase de lecture des passages (exercice que nous utilisons pour lanalyse exprimentale de cette recherche).
165
Il sagit dune transcription phonmique (ou transcription phontique large) en SAMPA34 (Speech Assesment Methods Phonetic Alphabet) ; cette phonmisation manuelle seffectue sous Praat. La question du choix de lalphabet phontique adopt sest pose nous. Mme si, avec lutilisation du phontiseur aligner , le SAMPA nous tait impose, nous avons souhait approfondir la question. Jusquici, lAlphabet Phontique Internationale (API) a beaucoup plus souvent t utilis que le SAMPA mais cela pose un certain nombre de problmes. Tout dabord, il requrait jusqu prsent, lutilisation dune police spcifique ; ensuite, cet alphabet nest pas toujours reconnu lors de lutilisation de certains logiciels et notamment dans le domaine du traitement du signal. En revanche, nous exposons deux points positifs qui contribuent lutilisation de lalphabet SAMPA et qui nous confortent dans ce choix forc : le SAMPA tant constitu uniquement de symboles ASCII, il ne tel-00455248, version 1 - 9 Feb 2010 requiert aucune installation pralable et sutilise sur toutes les plates-formes, un simple clavier dordinateur est suffisant. Un autre avantage est la possibilit de convertir trs facilement une transcription SAMPA en API. Ces deux tapes de transcriptions orthographiques et phonmiques acheves, nous procdons lalignement manuel de la transcription orthographique pralablement effectue.
Alignement acoustique manuel
Afin dobtenir une segmentation manuelle la plus homogne possible sur lensemble du corpus utilis, des critres traditionnels ont t adopts (Peterson & Lehiste, 1960). Les mesures ont t obtenues laide de linspection visuelle du spectrogramme et de la forme de londe.
34
Description disponible sur le site http://www.phon.uc.ac.uk/home/sampa/home.htm
166
A lheure actuelle, chaque passage de lecture a t segment en units intonatives (UI), en mots (mot), en syllabes (syllabe), en units rythmiques (NRU), bases sur le modle de Jassem (1952), et en segments (CVC) cods C (pour consonnes) et V (pour voyelles), pour lensemble des locuteurs de sexe fminin. Les passages de lecture des groupes de locuteurs de sexe masculin ont t aligns en units intonatives (UI) et en phonmes (CVC) selon le codage C/V nonc ci-dessus. Le niveau utilis pour les analyses exprimentales prsentes dans le chapitre 5 repose sur le niveau de la segmentation en phonmes (CVC).
tel-00455248, version 1 - 9 Feb 2010
Figure 14. Exemple de TextGrid d'annotation extrait dANGLISH effectu dans PRAAT
Concernant le niveau des units syllabiques, qui constitue le premier niveau suprieur celui du phonme, la syllabe a t dtermine en fonction du Principe dAttaque Maximale (Pulgram, 1970) selon lequel la plus grande squence de consonnes obissant aux rgles phonotactiques de langlais est systmatiquement prfre en tant quattaque syllabique. Ainsi un mot comme inspector /Inspekt@/ (passage 1) analys au niveau de la syllabe accentue, aura pour noyau /e/ et regroupe en attaque la squence maximale /sp/, la squence suprieure /nsp/ nest pas licite. Le dcoupage en units rythmiques est effectu selon le modle rythmique propos par Jassem (1952) car nous pensons quil prsente une structuration rythmique intressante ; par ailleurs des travaux (Bouzon, 2004) ont montr que le modle de Jassem
167
rendait mieux compte de la structuration rythmique de langlais que le modle classique dAbercrombie/Halliday (1967). La structuration rythmique (selon Jassem) est divise en units rythmiques troites (NRU) comprenant la syllabe accentue du mot suivie de toutes les syllabes du mot et en anacrouses (ANA) qui comprennent toutes les syllabes inaccentues non incluses dans la NRU. Le niveau des units rythmiques constitue un niveau supplmentaire danalyse possible pour diverses perspectives de recherches dont nous ne discutons pas plus ici, ne faisant pas lobjet de ce travail de thse. Au niveau des critres de segmentation, le dbut de chaque phrase a t align avant le premier pic damplitude dpassant le bruit de fond, alors que sa fin a t tablie la dernire pulsation glottale de f0 et non la fin de la courbe damplitude car une rgion de voix souffle tait souvent prsente la fin dun nonc. Les variations soudaines de lamplitude et de lintensit ainsi que les transitions formantiques ont t utilises comme tel-00455248, version 1 - 9 Feb 2010 critres de segmentation. Les frontires entre consonnes et voyelles ont t marques lapparition de la premire priode vocalique prenant en compte la stabilit des formants F1 & F2. Les pauses, quelles soient pleines ou silencieuses, sont notes par le symbole # . Les mots ou portions de texte sur lesquels le locuteur a bafouill, mais qui ont t repris par le sujet, ont t isols par des frontires droite et gauche et ont t marqus galement par le symbole # .
4.5 Perspectives
Plusieurs perspectives majeures sont envisages dans le cadre de lamlioration dANGLISH. Nous retenons particulirement deux progressions au niveau (i) de la transcription phonmique, (ii) au niveau de lalignement. Progression de lannotation phonmique La transcription phonmique est effectue ce jour sur la partie lecture. Il serait important de continuer la raliser sur lensemble du corpus. Par ailleurs, la transcription propose est une transcription canonique, il serait donc intressant de la reprendre et denvisager une transcription individuelle et propre chacun des locuteurs.
168
Progression de lalignement Le dveloppement de lalignement est envisag tout dabord sur la partie lecture au niveau des locuteurs de sexe masculin, ce qui permettra de complter la segmentation actuelle (UI et CVC) par un alignement au niveau du mot, de la syllabe et de lunit rythmique. De plus, nous envisageons lalignement des autres tches proposes dans ANGLISH et particulirement, celle du monologue de manire pouvoir appliquer les critres dvaluation proposs sur de la parole spontane. Cela laisse envisager de nombreuses heures de segmentation.
tel-00455248, version 1 - 9 Feb 2010
169
Synthse
Ce chapitre nous a permis de prsenter la base de donnes ANGLISH, qui constitue la ralisation du premier objectif fix pour notre travail de thse. Nous avons prsent le protocole dexprimentation ainsi que les diverses potentialits du corpus.
Actuellement, ANGLISH comporte environ 5H30 de parole en anglais, langue maternelle (L1) par des natifs anglais britanniques et langue cible (L2) par des francophones de deux niveaux diffrents en anglais. Les productions enregistres se rpartissent sur trois tches diffrentes (lecture, rptition, monologue) et comptent 63 locuteurs. ANGLISH constitue une ressource importante pour une analyse comparative de tel-00455248, version 1 - 9 Feb 2010 langlais produit par des francophones et des anglophones. Chaque tche a t transcrite orthographiquement ; plusieurs ranges dalignement sont proposes pour la tche de lecture depuis le phonme jusqu lunit intonative en passant par les mots, syllabes et units rythmiques. Concernant lexploitation plus particulire dANGLISH, dans le cadre de llaboration de critres rythmiques bass sur lanalyse des productions des francophones, nous retenons ltape dalignement en CVC dans la mesure o elle a permis lexploitation de dures temporelles auxquelles nous avons eu recours dans ltude dcrite dans le chapitre suivant.
La base de donnes ANGLISH est disponible gratuitement sur le site du CRDO http://crdo.fr, permettant ainsi une large diffusion, ainsi que, nous lesprons, un large retour qui contribuera lenrichissement de la base de donnes. Prsentement, nous allons nous tourner vers lexploitation dANGLISH afin de tester les critres rythmiques valuatifs possibles des productions de locuteurs francophones, au travers des hypothses formules dans le chapitre suivant, ce qui constitue notre second objectif.
170
tel-00455248, version 1 - 9 Feb 2010
171
tel-00455248, version 1 - 9 Feb 2010
CHAPITRE 5. ANALYSES EXPERIMENTALES
172
Dans ce chapitre, nous proposons tout dabord un rcapitulatif de la problmatique souleve dans le chapitre 3 concernant les mtriques rythmiques et une prsentation succincte de lensemble des diffrentes hypothses qui en dcoulent. Dans une deuxime partie, nous cherchons corroborer ou infirmer ces hypothses par le biais dexpriences que nous exposons ci-aprs.
5.1 Problmatique et objectifs

Nous avons soulev dans notre introduction et constat dans le chapitre 3, le manque de critres prosodiques valuatifs dans lapprentissage dune langue seconde. A lheure actuelle, o nous assistons un vritable essor de la cration de nouvelles tel-00455248, version 1 - 9 Feb 2010 technologies ducatives, labsence dune valuation objective se fait ressentir. En effet, de manire gnrale, la seule valuation possible est un feedback audio-visuel, pas toujours accessible pour lutilisateur. Pourtant, nous avons vu que ces nouvelles technologies pourraient entre autres, (i) accrotre la qualit de lenseignement phontique (en effet, il est vrai que lapproche communicative propose actuellement basait essentiellement la communication sur lapprentissage des contenus), et (ii) constituer un apport intressant pour lapprentissage de la prosodie : nous avons mis en avant que les lments prosodiques constituaient la base de la communication orale (Di Cristo, 2002), mais aussi quils taient les lments les plus difficiles acqurir pour lapprenant, pour les diverses raisons exposes dans le chapitre 2. De ces constats, nous pensons quil serait intressant de chercher complter ces modules dvaluation. Par ailleurs, nous avons vu au travers de la littrature, que lapprentissage du rythme anglais tait une tche difficile pour les francophones (Adams, 1979). Cette difficult reposait, entre autres, sur le fait que ces deux langues prsentaient des structures rythmiques trs diffrentes (Delattre, 1966 ;Wenk, 1985 ;Bolinger, 1981): -rduction vocalique, -structure syllabique, -accentuation lexicale, -classification oppositionnelle (etc.). Ces diffrences, nous lavons vu, ont pu tre mises en vidence par llaboration de mtriques rythmiques, dont nous proposons ici un bref rcapitulatif : 173
% V35
C, V
rPVI (c,v)
nPVI (c,v)
cvC,cvV
Wagner & Dellwo (2004)/ White & Mattys (2007)
Ramus & al. (1999)
Grabe & Low (2002)
% dure des segments vocaliques

FR (L1)
cart type de la dure des segments cons. & voc. 4.39 5.35 3.78 4.64
indice indice brut de normalis de variabilit entre variabilit entre la dure des la dure des intervalles intervalles cons. & voc. cons. et voc. successifs successifs 50.4 64.1 ----43.5 57.2
coefficient de variation de la dure des segments cons. & voc.
43.6 40.1
44 47
50 64
tel-00455248, version 1 - 9 Feb 2010
GB (L1)
Tableau 5. Rcapitulation des diffrentes mtriques utilises pour notre tude
Parce-que ces mtriques permettent de distinguer des langues (Ramus & al., 1999 ; Grabe & Low, 2002 ;Dellwo & Wagner, 2003 ;Lin & Wang, 2005 ;White & Mattys, 2007), des dialectes (Fernandez-Cruz, 2000 ; Ferragne & Pellegrino, 2004), nous mettons lhypothse quelles permettent de distinguer la production rythmique dapprenants, des productions orales de natifs. En effet, plusieurs tudes se sont penches sur une distinction L1/L2 (Whitworth, 2002 ; Carter, 2005 ; White & Mattys, 2007 ; Grenon & White, 2008) et ont montr quil tait possible de distinguer la langue maternelle de la langue cible, notamment en utilisant le paramtre de coefficient de variation. De fait, si ces mtriques assurent une telle distinction, elles pourraient rendre compte de linfluence de la L1 (le franais) sur la langue cible (langlais) et permettraient ainsi de diffrencier la production orale danglophones et de francophones parlant anglais. Le but sera dutiliser ces mtriques
% C est iso-morphique au % V, il nest donc pas ncessaire de le prendre en considration 174
35
comme critres valuatifs du rythme dans lapprentissage dune langue seconde en explorant la meilleure combinaison de paramtres possibles. Dans ce chapitre, donc, nous proposons de comparer la structure rythmique de locuteurs anglophones et dapprenants franais travers les 9 paramtres rythmiques prsents ci-dessus ainsi que les diffrentes combinaisons qui se sont rvles pertinentes dans les travaux antrieurs. Ltape suivante est donc dexaminer les performances prosodiques de diffrents niveaux dapprenants par mthode comparative avec des productions de natifs. Le but, nous le rappelons, est de dterminer les dviations possibles pour en dgager des critres rythmiques objectifs et valuatifs, qui pourraient tre intgrs des mthodes dapprentissage, telles que les logiciels multimdia, voire galement, dtre examins dans tel-00455248, version 1 - 9 Feb 2010 le cadre dtudes sur lvaluation en pathologie ou encore en parole de synthse.
5.2 Mthodologie
5.2.1 Base de donnes
Afin de mener bien cette tude, nous avons travaill sur la partie lecture du corpus ANGLISH (prsente dans le prcdent chapitre). Il sagit donc de productions oralises, de textes lus par des locuteurs anglophones et des apprenants francophones de diffrents niveaux. Nous rappelons ici les modalits de la tche de lecture ainsi que la composition des trois groupes de locuteurs. Le corpus de lecture ANGLISH est compos de 4 passages (cf. annexes, section 1) issus du corpus EUROM 1 (P9, Q0, Q9, R3), lus par 63 locuteurs, ce qui reprsente un total de 252 passages (soit 1260 phrases), soit un total d une dure approximative dune heure et demie de lecture (soit 4765,3138 secondes). Chacun des passages se compose de 5 phrases lies smantiquement, racontant un vnement, une histoire de la vie quotidienne. La consigne donne la fois oralement et lcrit tait de : Lire les passages comme si lhistoire vous tait arrive et que vous la racontiez un ami . Les passages taient donns lavance, de manire ce que les
175
locuteurs se familiarisent avec les textes et puissent viter les bafouillages lors de lenregistrement. Concernant les locuteurs, ces derniers sont rpartis en trois groupes, constitus en fonction de critres prcis. Ils sont au nombre de 63 (cf. annexes, section 1 pour une description dtaille de lidentit de chaque locuteur). -GB : 23 locuteurs, 13 femmes et 10 hommes, britanniques anglais -FR2 : 20 locuteurs, 10 tudiantes et 10 tudiants anglicistes, fin de 2me/dbut 3me anne -FR1 : 20 locuteurs, 10 femmes et 10 hommes en activit ayant niveau Bac anglais L2 A partir des fichiers son, nous avons effectu un travail de transcription et dannotation manuelles avec le logiciel PRAAT (Boersma & Weenick, 2009). Nous ne revenons pas nouveau sur ce point, puisquil est dvelopp dans le chapitre 4, mais nous rappelons brivement les ranges obtenues et annotes dans un fichier TextGrid, suite tel-00455248, version 1 - 9 Feb 2010 ce travail36 : -la range orthographique, non ponctue, nomme orthographe -la range SAMPA, qui correspond une transcription phonmique canonique en sampa, nomm sampa (cf. annexes, section 2 pour une liste des symboles et quivalence API et section 1, pour la transcription des 4 passages tudis) -la range des units intonatives dont chaque pause est note #, nomm UI -la range des phonmes, nomme CVC (cf. figure 15), dont la segmentation suit le codage suivant : Les segments vocaliques sont nots : V Les segments consonantiques sont nots : C Les pauses inter-units intonatives sont notes : # Les pauses/hsitations intra-units intonatives sont notes : P
Les textgrids des locuteurs de sexe fminin sont composs de 7 ranges de segmentation (orthographe, sampa, UI, mots, syllabes, NRU, CVC)
36
176
segment cons = C
tel-00455248, version 1 - 9 Feb 2010
Figure 15. Exemple de segmentation en CVC
Dans notre exprience, cest partir de la segmentation en CVC, effectue sur lensemble du corpus de lecture, que nous menons notre tude comparative des diffrentes mtriques proposes dans la littrature, et ce, pour chacun des groupes tablis.
5.2.2 Calcul et obtention des mtriques

Les mtriques rythmiques ont t calcules pour chacune des 5 phrases des 4 passages enregistrs par les 63 locuteurs, soit un total de 1260 donnes pour chacune des mtriques. A partir dun script Praat, labor par Daniel Hirst (cf. annexes, section 2), les mtriques sont calcules automatiquement partir dun dossier dans lequel sont runis lensemble des fichiers TextGrid. Chaque paramtre est calcul en fonction des intervalles de dures (en millisecondes) des segments consonantiques et vocaliques. Pour chaque locuteur, nous obtenons 9 paramtres rythmiques :
177
%V C V rPVI_C
la somme de la dure des intervalles vocaliques divise par la dure totale des intervalles vocaliques et consonantiques, multiplie par 100 cart type des dures des intervalles consonantiques cart type des dures des intervalles vocaliques moyenne des diffrences de dures entre les intervalles consonantiques successifs (brut) moyenne des diffrences de dures entre les intervalles consonantiques
nPVI_C
successifs divise par la moyenne de ces mmes intervalles et multiplie par 100 (normalis)
rPVI_V
moyenne des diffrences de dures entre les intervalles vocaliques successifs (brut) moyenne des diffrences de dures entre les intervalles vocaliques successifs
tel-00455248, version 1 - 9 Feb 2010
nPVI_V
divise par la moyenne de ces mmes intervalles et multiplie par 100 (normalis)
cvV
(coefficient de variation=) cart type des dures des intervalles vocaliques divis par la moyenne des dures des intervalles vocaliques (coefficient de variation=) cart type des dures des intervalles consonantiques divis par la moyenne des dures des intervalles consonantiques
Tableau 6. Mthode de calcul des 9 paramtres rythmiques
cvC
Les donnes de sortie sont obtenues, sous format tabulaire, dans une fentre Praat Info (reprsente ci-aprs) pour laquelle chaque colonne correspond : passage : indique le passage tudi pour lequel les mtriques sont calcules, type : renseigne si le locuteur est un anglophone (GB), un francophone niveau 1 (FR1) ou 2 (FR2), speaker : identifie le locuteur, gender : informe sur le sexe du locuteur, IU : indique la position de lunit intonative dans le passage, - les colonnes 6 14 : donnent les rsultats pour chaque paramtre rythmique calcul (dtaill dans le tableau 6).
178
Tableau 7. Extrait des donnes de sortie obtenues par le script "calculate_rhythm_metrics"
tel-00455248, version 1 - 9 Feb 2010
5.3 Analyses statistiques

5.3.1 Caractrisation des groupes de 3 niveaux
Nous procdons tout dabord une analyse en composantes principales (ACP)37, afin dtudier les ressemblances entre les individus du point de vue de lensemble des variables et ainsi apprcier une classification en trois groupes selon un ensemble de paramtres indpendants. LACP permet en effet la transformation de nos variables corrles (ici les 9 paramtres rythmiques) en variables indpendantes, et rduit le nombre de composantes. Elle permet ainsi la caractrisation des noncs ou de groupes dnoncs (FR1, FR2 et GB) par les variables (cf. script en annexes, section 2). A partir de notre objet de composantes principales nouvellement cr, nous effectuons ensuite une analyse discriminante (homoscdasticit ou paramtrique linaire) afin de voir sil est possible de dterminer, de manire fiable, le groupe dappartenance des locuteurs (FR1, FR2 ou GB). La figure montre une certaine classification o les locuteurs
37
Les analyses sont effectues partir de lenvironnement de travail R (R development Core Team,
2008).
179
du groupe FR1 (en vert) se situent, sur laxe des abscisses, entre [-4 et -2], ceux du groupe FR2 (en bleu), entre [-2 et 1] et ceux du groupe GB (en rouge) entre [1 et 4]. Au vu de ce graphique, nous pouvons donc dire quil semble possible, partir de critres rythmiques, de distinguer les trois groupes.
tel-00455248, version 1 - 9 Feb 2010
Figure 16. Reprsentation graphique de l'analyse discriminante des 1260 phrases produites par les 63 locuteurs
Dans cette procdure, chaque phrase est classifie laide de fonctions discriminantes calcules sur lensemble des donnes. Ici, nous utilisons lensemble des variables, cest-dire les 9 paramtres rythmiques.
180
Classe relle
Classe prdite FR1 FR2 100 192 108 GB 23 93 344
FR1 FR2 GB Classe relle (en%)
274 97 29 Classe prdite FR1
FR2 25% 50% 22%
GB 6% 25% 72%
FR1 FR2 GB
69% 25% 6%
Tableau 8. Prsentation des rsultats des prdictions des diffrentes classes (FR1/FR2/GB), (en
tel-00455248, version 1 - 9 Feb 2010
haut, valeurs brutes ; en bas, valeurs exprimes en pourcentage)
Sur lensemble des groupes, les deux groupes opposs (FR1 et GB) se distinguent particulirement bien ; les prdictions slevant 72% pour le groupe GB sont positives. En effet, seulement 6% des locuteurs de ce groupe sont classs en FR1, ce qui, sur lensemble des donnes, ne reprsenterait quun seul locuteur. On pourrait lexpliquer par le fait que certaines phrases ont peu de consonnes et seraient donc plus proches dune structure rythmique isosyllabique (donc du franais). Le second groupe (FR1) est galement bien discrimin avec 69%. Tout comme les GB, seulement 6% des locuteurs sont mal classs. Le fait que 25% des locuteurs soient classs en FR2 ne semble pas si tonnant dans la mesure o certains locuteurs pourraient avoir un niveau danglais lgrement suprieur au niveau faible annonc des FR1. La discrimination du groupe FR2 seffectue sur la base des 50% ; les 50 autres pour cent des apprenants, sont rpartis galement de part et dautre, cest--dire, soit en FR1, soit en FR2. Ces rsultats sont trs intressants car ils montrent bien le niveau mi chemin des tudiants, entre ceux dont le niveau scarte particulirement des GB ou ceux, au contraire qui y sont trs proches. Les prdictions semblent donc assez fidles la ralit composite du groupe et justifient quelles natteignent que 50%.
181
Il semble donc possible, partir des 9 critres rythmiques, de prdire avec une relativement bonne fiabilit, le niveau de langue ou de groupe auquel correspond la phrase analyse (69,50% au global). Lanalyse ANOVA rvle dailleurs une corrlation significative entre les composantes principales et le groupe (F(2,1257)=69,503 ; pval<2,2e16
).
5.3.2 Analyses des mtriques rythmiques : distinction L1/L2

A partir des rsultats obtenus, nous proposons, en amont dune analyse statistique, une reprsentation graphique de la moyenne (reprsente par le point jaune) et de lerreurtype (standard error) calcules pour chacune des variables (cest--dire chaque paramtre mtrique) en fonction du groupe (GB, FR1 et FR2), afin dvaluer de possibles diffrences significatives entre les niveaux de langues selon des critres rythmiques. tel-00455248, version 1 - 9 Feb 2010 Lerreur-type est lcart-type de lerreur de cette estimation ; elle est obtenue par le calcul de lcart-type divis par la racine carre du nombre dobservations : /n Ce type de reprsentation graphique prsente un intrt visuel particulier dans la mesure o, lorsque deux moyennes sont loignes de plus de 2 erreurs-types, les diffrences sont significatives. Visuellement les barres se chevauchent lorsque les moyennes ne sont pas significativement distinctes (pour une illustration de chevauchement, cf. figure 21, plan cvC).
Dans cette section, nous prsentons de manire chronologique, les rsultats du calcul de lerreur-type pour les mtriques dites traditionnelles, cest--dire les plus utilises dans la littrature, savoir Ramus & al., Grabe & Low, White & Mattys et nous testons galement les propositions des meilleures combinaisons avances par ces auteurs, savoir %V-C (Ramus & al.) ; nPVI_V,rPVI_C (Grabe & Low) ; %V,cvC (Dellwo) ; %V,cvV (White & Mattys). Les donnes se prsentent comme suit : gauche, une analyse de dispersion des points en fonction des 3 groupes et de la combinaison avance, droite, la reprsentation graphique de lerreur-standard selon un agrandissement de la partie du graphe de dispersion. Nous rappelons que nous cherchons dfinir des critres rythmiques valuatifs et nous pensons que les mtriques pourraient jouer un rle important dans la discrimination 182
L1/L2, et permettraient de donner une tendance rythmique de la production des apprenants franais. Jusquici, aucune tude, notre connaissance, navait men de comparaison valuative de lefficacit de ces mtriques dans la discrimination L1/L2, afin dobserver linfluence du rythme de la L1 (franais) sur les productions rythmiques de nos apprenants en L2 (anglais). De manire gnrale, quelle que soit la combinaison annonce, nous pensons que si les productions des apprenants FR2 sont rythmiquement correctes, les valeurs obtenues seront proches de celles des natifs. En revanche, nous nous attendons ce que le groupe FR1, supposment dun niveau faible, soit clairement distingu des natifs et des FR2, par des rsultats beaucoup plus loigns de ceux des deux autres groupes.
tel-00455248, version 1 - 9 Feb 2010
V, C,%V (Ramus & al., 1999)
*Rappel des calculs de ces diffrents paramtres : %V : la somme de la dure des intervalles vocaliques divise par la dure totale des intervalles vocaliques et consonantiques, multiplie par 100 C : cart type des intervalles de dures des segments consonantiques
V :
cart type des intervalles de dures des segments vocaliques
*hypothses : La structure syllabique rythmique de langlais, nous lavons dit, est complexe. Suivant les principes thoriques de Ramus et al., nous faisons donc lhypothse que le taux de C des anglais sera plus lev que celui des apprenants de faible niveau, et inversement, que le taux de V, sera plus lev chez les FR1, et plus faible chez les natifs, le groupe des FR2 se situant mi-chemin.
183
Figure 17. Visualisation des points de dispersion (gauche) et des erreurs-types (droite) selon le
tel-00455248, version 1 - 9 Feb 2010
plan (V, C)
Au vu de ce graphique, le C est plus lev chez les FR1 et plus faible chez les GB, le C des FR2 se situant entre celui des FR1 et des GB. Les rsultats infirment donc notre premire hypothse (F(2,1257)=54,74 ; pval<2,2e-16). Quant au V, ce sont les FR2 qui ont le taux le plus bas et les GB le plus haut graphiquement. Cependant, la diffrence nest pas rapporte significative (F(2,1257)=8,827 ; pval=0,02). Bien que nous obtenions des rsultats contraires ceux attendus, le plan (V, C) (figure 17) montre cependant une distinction assez nette des groupes FR1 et FR2, lorsque le paramtre C est considr sparment, ou en combinaison linaire avec le paramtre V (F(2,1257)=15,21 ; pval=2,958e-07). Dans ce graphique, il est noter que la production des francophones FR2 sapparente plus celle des anglophones. Le paramtre V ne permet pas une distinction des trois groupes (pval= 0,02). La figure de gauche montre dailleurs quil est difficile de distinguer notamment, mme graphiquement, les groupes FR1 & FR2. Nous pouvons donc dire, partir de ces premiers rsultats graphiques, que C ou la combinaison de C et V pourraient permettre une catgorisation des groupes dapprenants FR1 et FR2 et du groupe des anglophones, alors que V uniquement ne le permet pas.
184
Dans leur tude, Ramus & al. montrent galement que la combinaison % V-C permet de distinguer les locuteurs franais des locuteurs anglais. Les auteurs rapportent un score plus lev pour les franais. Nous formulons donc lhypothse que, la fois le %V sera le plus lev pour FR1 que pour GB (FR2 se situant toujours mi-chemin entre les deux) et que la combinaison %V-C est une bonne combinaison permettant la discrimination de nos trois groupes.
tel-00455248, version 1 - 9 Feb 2010
Figure 18. Visualisation des points de dispersion (gauche) et des erreurs-types (droite) selon le plan (%V, C)
Les reprsentations graphiques ci-dessus infirment notre premire hypothse (F(2,1257)=25,87 ; pval= 9,746e-12). Cependant, partir du graphe de dispersion et partir de la reprsentation des erreurs-standards, il est quand mme possible de distinguer les natifs des apprenants, si lon considre le paramtre %V uniquement. Le niveau des apprenants ne peut tre en revanche distingu. Dailleurs, la corrlation entre FR2 et %V est non significative (pval=0,0846). Nous pouvons donc conclure, au vu de ces reprsentations graphiques, que %V permet de distinguer les anglophones des francophones, que C permet plutt la discrimination des niveaux des apprenants, ce qui est galement le cas pour la combinaison linaire %V-C.
185
PVI (Grabe & Low, 2002)
*rappel des calculs des paramtres : rPVI_C/rPVI_V : indice brut de variabilit des dures des intervalles consonantiques / vocaliques successifs nPVI_C/nPVI_V : indice normalis de variabilit des dures des intervalles consonantiques / vocaliques successifs *hypothses : Selon ltude de Grabe & Low, le PVI normalis permet de corriger les fluctuations de tempo. Cette mesure apparat donc galement intressante ici. Les auteurs tel-00455248, version 1 - 9 Feb 2010 ont rapport que les taux de nPVI_V et rPVI_C taient levs pour les Anglais et faibles pour les Franais. Nous formulons donc lhypothse selon laquelle les taux de PVI_V et de PVI_C des natifs seront plus levs que ceux des FR2, les taux des FR1 tant les plus faibles. En effet, si les rductions vocaliques sont correctement produites, alors les diffrences de variations vocaliques seront plus importantes (caractristiques des langues isoaccentuelles). Pour rsumer, plus la production rythmique de lapprenant est proche de celle dun natif, plus le taux de nPVI_V se rapproche de celui des natifs et obtient une valeur haute.
186
tel-00455248, version 1 - 9 Feb 2010
Figure 19. Visualisation des points de dispersion (gauche) et des erreurs-types (droite) selon le plan (rPVI_V, rPVI_C)
Sur le plan (rPVI_V, rPVI_C), si lon considre le rPVI_V, il n y a pas de diffrence significative entre les diffrents groupes (F(2,1257)=0,5938 ; pval= 0,5524). Si lon considre en revanche le rPVI_C (F(2,1257)=54,75 ; pval<2,2e-16) ou la combinaison du rPVI_V avec le rPVI_C (F(2,1257)=16,89 ; pval= 5,797e-08), on observe un taux plus lev chez les FR1 que chez les GB, des rsultats qui infirment ceux de la littrature. Si ces reprsentations graphiques ne corroborent pas notre hypothse, il apparat cependant que le rPVI_C ou la combinaison rPVI_V - rPVI_C pourraient tre de bons critres de discrimination des groupes FR1, FR2 et GB.
Les prochains graphes prsentent les mtriques du PVI calcul de manire normalise.
187
Figure 20. Visualisation des points de dispersion (gauche) et de erreurs-types (droite) selon le
tel-00455248, version 1 - 9 Feb 2010
plan (nPVI_V,nPVI_C)
Le plan (nPVI_V, nPVI_C) corrobore ici notre premire hypothse. Si lon considre nPVI_V, on observe que le taux est le plus lev pour les GB, suivi de celui des FR2, le taux des FR1 tant le plus bas (F(2,1257)=50,13 ; pval<2,2e-16). Si lon considre prsent le nPVI_C, il n y a pas de diffrence significative entre les groupes FR2 et GB (F(2,1257)=8,326 ; pval= 0,00025). Cependant, lhypothse est toujours valide, dans le sens o les FR1 ont toujours le taux le plus bas. Similairement au plan (V, C), on observe donc partir du paramtre nPVI_V et de la combinaison linaire des paramtres nPVI_V et nPVI_C (F(2,1257)=41,53 ; pval<2,2e-16) une nette sparation des groupes FR1 et FR2, le groupe FR2 sapprochant graphiquement du groupe GB. A partir du paramtre nPVI_C, on observe uniquement une sparation entre les apprenants de premier niveau et les deux autres groupes. Nous pouvons donc conclure que les paramtres pris sparment ou leur combinaison pourraient permettre la classification des groupes en fonction du niveau (FR1 vs FR2) mais non une distinction en fonction du critre natif vs. non natif.
Selon Grabe & Low, la combinaison qui permet une meilleure discrimination entre les langues, est celle du nPVI_V, rPVI_C, combinaison dont nous commentons les rsultats sur nos donnes.
188
Figure 21. Visualisation des points de dispersion (gauche) et des erreurs-types (droite) selon le
tel-00455248, version 1 - 9 Feb 2010
plan (rPVI_C,nPVI_V)
Au vu du graphique de dispersion, nous retrouvons les rsultats prsents ci-dessus. Le taux nPVI_V est plus lev pour les natifs que pour les apprenants ; linverse, le rPVI_C est plus lev pour les apprenants. Le rPVI_C permet une distinction nette des trois groupes alors que le nPVI_V permet plutt une distinction du niveau des apprenants. Par contre, la combinaison rPVI_C - nPVI_V ne permet pas une distinction des trois groupes (F(1, 1257)=4,103 ; pval=0,01675).
cvC,cvV ( Dellwo, 2006 ; White & Mattys, 2007).
*rappel des calculs des paramtres : cvC/cvV : coefficient de variation (cart type sur la moyenne) des dures des intervalles consonantiques / vocaliques.
*hypothses : Selon les diffrentes tudes diriges par Dellwo (2006) puis White & Mattys (2007), cvC/cvV apparaissent galement comme des mesures fiables, puisque le tempo est normalis dans leurs calculs. Nous pouvons donc formuler lhypothse que ces mesures permettent de distinguer les groupes FR1, FR2 et GB. White & Mattys rapportent, entre autres, de leur tude, que le cvV est plus lev chez les Anglais que chez les Espagnols. 189
Lespagnol tant une langue isosyllabique, nous pouvons penser que nous retrouverons des rsultats similaires chez nos sujets franais, savoir, que nous nous attendons ce que cvV soit moins lev chez FR1 et FR2 que chez GB.
tel-00455248, version 1 - 9 Feb 2010
Figure 22. Visualisation des points de dispersion (gauche) et des erreurs-types (droite) selon le plan (cvV,cvC)
Au vu de ces graphiques, lhypothse formule est valide. Le cvV pour GB est en effet plus lev que celui de FR1 et FR2 (F (1, 1257)=87,18 ; pval<2,2e-16). Le cvC est galement suprieur pour les natifs que pour les apprenants (F (1, 1257)=17,21 ; pval= 4,248e-08). De plus, lorsque le paramtre cvV est considr uniquement ou en combinaison avec le paramtre cvC (F (1, 1257)=86,43 ; pval<2,2e-16), on observe une distinction nette entre les trois groupes, le groupe des FR2 tant plus proche des FR1 quil ne lest du groupe GB. Ces critres rythmiques pourraient donc jouer le rle de critres valuatifs puisquils rendent compte linairement des diffrents niveaux. Le paramtre rythmique cvC, en revanche, ne permet pas une distinction des groupes FR1 et FR2, les croix se chevauchant. Sur le graphe de dispersion, on retrouve en effet la tendance dcrite, cest--dire que lon peut distinguer les natifs (en rouge) des FR, mais il est plus difficile de distinguer les deux niveaux de FR.
190
Selon les diffrents travaux de White & Mattys (2007,2008), il a t mis en vidence que la combinaison %V-cvV permettait une meilleure discrimination des langues, des productions de pathologie et des voix normales, ou encore une distinction L1/L2. Nous vrifions ce que cette combinaison montre sur nos propres donnes.
tel-00455248, version 1 - 9 Feb 2010
Figure 23. Visualisation des points de dispersion (gauche) et des erreurs-types (droite) selon le plan (%V,cvV)
Au vu des deux graphes, la distinction se fait au niveau GB/FR. Que ce soit %V ou cvV, les deux groupes FR sont peine discrimins et sont trs proches tandis que les GB sloignent assez bien des sujets francophones. Nous pouvons donc conclure quune telle combinaison serait intressante pour une distinction entre natifs et apprenants et non, pour une distinction entre les niveaux des apprenants (F (1,1257)=102,4 ; pval<2,2e-16). Cette combinaison pourrait donc tre complmentaire de la combinaison nPVI_V et nPVI_C qui permet plutt une distinction des niveaux dapprenants.
191
Nous proposons dobserver ici galement la combinaison de cvC et de %V.
tel-00455248, version 1 - 9 Feb 2010
Figure 24. Visualisation des points de dispersion (gauche) et des erreurs-types (droite) selon le plan (%V, cvC )
Le plan (%V, cvC) est similaire celui du cvV, cvC. Le plan (%V, cvC) montre clairement une distinction entre les groupes des francophones (FR1 et FR2) et le groupe danglophones, aussi bien lorsque les paramtres rythmiques %V et cvC sont considrs sparment, quen combinaison linaire38 (F(1,1257)=46,46 ; pval<2,2e-16). La distinction entre les groupes FR1 et FR2 est moins flagrante, les croix ntant pas loin de se chevaucher. Ces critres rythmiques semblent donc, premire vue, rendre compte des diffrents niveaux des apprenants franais (FR2 tant le plus proche de GB, FR1 le plus loign) et permettent la distinction des productions oralises des francophones et celles des anglophones. Nous pouvons dores et dj affirmer que la combinaison de plusieurs paramtres rythmiques permet la classification des groupes FR1, FR2 et GB, la considration dun seul paramtre pouvant savrer parfois non discriminante (par exemple, dans le cas de V,
Nous proposons une combinaison linaire des diffrents paramtres suite aux tudes de (Herry & Hirst, 2002 ; Dellwo, 2006)] qui ont montr que la combinaison de plusieurs facteurs rythmiques amliore la discrimination inter- et intra-langues ainsi quune discrimination L1-L2.
38
192
cvC, rPVI_V et nPVI_C). Nous pouvons galement conclure que certaines combinaisons permettent la distinction des niveaux de langue, alors que dautres permettent celle entre natifs et apprenants.
Afin de confirmer les rsultats graphiques que nous venons de commenter, et dvaluer quel(s) paramtre(s) serai(en)t le(s) critre(s) valuatif(s) le(s) plus pertinent(s), nous menons des analyses statistiques.
5.3.3 Essai de paramtrisation rythmique : recherche de combinaisons par SVM

Nous proposons, prsent, dvaluer les paramtres rythmiques, afin dtablir quel tel-00455248, version 1 - 9 Feb 2010 est celui ou ceux (par combinaison) qui sont considrer pour une valuation du rythme de lapprenant franais. A partir de 9 paramtres rythmiques, plus de 5000 combinaisons sont possibles. Nous allons donc en calculer plus de 255 (sur la base de 1 4 paramtres) afin de dgager les meilleures combinaisons et de ce fait, les meilleurs rsultats pour une tche de discrimination L1/L2. Les combinaisons traites ici ont t calcules partir dun script labor par Daniel Hirst (cf. annexes, section 2). Les donnes de sortie sont rcupres dans un fichier .txt. Les tableaux prsents ci-dessous, rsultant dune analyse discriminante39, rapportent les pourcentages globaux obtenus (cest--dire les taux de prdiction) pour chacune des possibilits combinatoires testes (le dtail des rsultats obtenus pour chaque groupe est donn en annexes, section 2). Les rsultats (en %) ont t ordonns de faon dcroissante dans les tableaux proposs. La mthodologie suivie se base sur la proposition danalyse faite par Whitaker (1997). Lauteur remet en cause lutilisation de lanalyse pas pas (stepwise methods) recommande par tous les paquets statistiques- qui engendre un certain nombre derreurs (degr de libert incorrect, chantillonnage, estimation du sous-ensemble optimal des
39
Support Vector Machines, R.
193
prdicateurs). Ainsi, au lieu deffectuer une analyse pas pas, nous avons donc choisi une analyse complte permettant dtudier toutes les combinaisons possibles. Analyse un facteur
Nous tentons de savoir si un seul facteur donne dassez bons rsultats de fiabilit pour tre utilis comme critre valuatif. Ci-dessous le tableau rcapitulatif des valeurs obtenues pour chacun des 9 paramtres.
tel-00455248, version 1 - 9 Feb 2010
VARIABLE cvV nPVI_V V %V C cvC rPVI_C nPVI_C rPVI_V
SCORE OBTENU 45,79% 43,57% 43,09% 42,61% 42,61% 42,38% 42,14% 38,88% 37,69%
Tableau 9. Prsentation des donnes de sortie d'une analyse SVM - une discrimination un paramtre
De manire globale, une discrimination un facteur donne une fiabilit de classement dune moyenne de 42% (effectue sur les paramtres les plus pertinents). Le paramtre qui se dgage et se distingue des 8 autres est celui du cvV avec 45,79% (facteur prconis par White & Mattys, cependant en combinaison avec %V). Le nPVI_V et le C suivent de prs avec une moyenne de 43%. Pour la suite des analyses de combinaisons plusieurs facteurs, la fonction crossvalidation par dixime est utilise, cest--dire que lanalyse seffectue sur les 9/10me du corpus avec validation sur le dixime qui reste et qui na donc pas t utilis pour faire les prdictions ; ensuite, on prlve un autre dixime et on recommence, et ainsi de suite pour tout le corpus. Lutilisation de la mthode des machines vecteurs de support (support vector machine SVM ) permet de pouvoir oprer diverses combinaisons, et ne prend
194
pas obligatoirement lensemble des facteurs. Cette analyse prsente plusieurs avantages (cf. Baayen (2008), SVM vs. ADL 5.2.3). Analyse combinatoire deux facteurs
Lorsquon prend en considration deux facteurs, on observe que la moyenne des pourcentages les plus levs se situe environ 56% sauf pour la combinaison (C,cvC) qui se dmarque nettement avec une fiabilit de 62,30%.
VARIABLES C, cvC rPVI_C,nPVI_C tel-00455248, version 1 - 9 Feb 2010 cvC,rPVI_C V,cvV
SCORE OBTENU 62,30% 57,30% 54,92% 54,04%
Tableau 10. Prsentation des rsultats des meilleures combinaisons deux facteurs
Afin dvaluer le poids de chacun des deux paramtres dans la prdiction des classes, nous reprsentons graphiquement une analyse de dispersion des points ainsi que lerreur-type des deux paramtres combins C,cvC.
Figure 25. Visualisation des points de dispersions (gauche) et des erreurs-types (droite) selon le plan (C,cvC)
195
A partir du graphe des points de dispersion, on peut poser la question dune ventuelle corrlation entre ces deux paramtres. Nous effectuons donc une analyse de variance entre C et cvC qui savre confirmer notre observation. Une analyse ANOVA vient confirmer une forte corrlation (F(1,1258)= 1495 ; p-val < 2,2e-16). Or, on sattendait, a contrario, ce que ces deux paramtres ne soient pas corrls puisque cette combinaison deux facteurs ressortait comme la plus discriminante. Cependant, sachant que les paramtres C, cvC, pris sparment, permettent respectivement une prdiction 42,61% et 42,38%, nous pouvons penser que la prdiction de 62,30%, obtenue par combinaison, serait due aux rsidus qui expliqueraient lamlioration du score.
tel-00455248, version 1 - 9 Feb 2010
Analyse combinatoire trois facteurs
La meilleure combinaison 3 facteurs qui donne une fiabilit de 63,09 % comprend (%V, V,cvV). Cependant, lensemble des meilleures combinaisons retenues (cf. tableau 11), suit de prs la premire propose car elles se situent environ 61-62%.
VARIABLES %V, V,cvV C,cvC,rPVI_V C, V,cvC %V, C,cvC C,cvC,nPVI_V C,cvC,cvV C,cvV,nPVI_C C,cvC,rPVI_C %V,rPVI_V,nPVI_V
SCORE OBTENU 63,09% 62,69% 62,46% 62,14% 62,14% 62,06% 61,66% 61,50% 61,34%
Tableau 11. Prsentation des rsultats des meilleures combinaisons trois facteurs
Il est noter ici, que les scores des combinaisons trois facteurs sont quasiquivalents aux scores des combinaisons deux facteurs, avec en moyenne, une fiabilit de 63%. Par ailleurs, nous remarquons que le paramtre %V, important dans une combinaison 196
trois facteurs, permet daugmenter la fiabilit de (V,cvV) de 54,04% 63,09%. En revanche, lorsquil sagit dajouter ce paramtre la meilleure combinaison binaire sortante, savoir (C,cvC), cela na aucune influence sur la valeur de prdiction qui reste 62,14% (avec trois facteurs contre 62,30% deux facteurs).
Analyse combinatoire quatre facteurs
Lorsquon passe une combinaison quatre facteurs, la fiabilit augmente positivement.
VARIABLES tel-00455248, version 1 - 9 Feb 2010 %V, V,cvV,nPVI_V %V,cvV,rPVI_V,nPVI_V %V, V,cvC,cvV C, V,cvC,nPVI_V %V,V,rPVI_V,nPVI_V %V, C,cvC,nPVI_V C, V,cvC,nPVI_C C,cvC,cvV,rPVI_V
SCORE OBTENU 66,74% 66,03% 65,71% 65,15% 65,07% 65% 65% 65%
Tableau 12. Prsentation des rsultats des meilleures combinaisons quatre facteurs
Le meilleur taux de fiabilit obtenu se situe 66,74% et combine %V, V,cvV,nPVI_V ; tout comme la combinaison trois facteurs, ce sont les paramtres rythmiques des intervalles vocaliques qui priment, contrairement la combinaison binaire qui est constitue de deux paramtres bass sur les intervalles consonantiques. Les autres meilleures combinaisons quatre facteurs suivent de prs la premire et se situent une moyenne de 65%. Nous constatons donc que les valeurs de fiabilit augmentent avec une combinaison quatre facteurs avec une marge de 4%. Cependant, par rapport une combinaison binaire, la diffrence de fiabilit nest pas trs importante. Lorsque lon passe de 1 2, puis 197
3 facteurs, on gagne en moyenne 10% dans notre prdiction ; si lon suit ce schma de progression, nous devrions obtenir une prdiction fiable 75% avec une combinaison quatre facteurs. On peut donc conclure que laugmentation positive que lon trouve avec quatre facteurs est finalement minime. La question se pose : faut-il prendre en compte 4 facteurs et obtenir une valeur de prdiction fiable lgrement plus importante, ou faut-il se limiter un nombre moindre de facteurs mais avec une valeur de prdiction toujours relativement bonne? Pour notre part, nous pensons quune prdiction deux facteurs partir des critres C,cvC semble plus pertinente car il nous semble que le meilleur modle utiliser est celui qui obtient le meilleur score avec le moins de facteurs possibles, mais surtout, cela permet de construire un feedback prcis, sur des erreurs cibles, et de comprendre o se situent les difficults.
tel-00455248, version 1 - 9 Feb 2010
5.4 Discussion et conclusion

5.4.1 Influence de la L1 sur la L2 ?
La premire tape tait de pouvoir mettre en avant des diffrences entre les productions des natifs et les productions des francophones en anglais en essayant de voir si le rythme de la L1 tait prsent dans les productions en L2. Si le franais est une langue isosyllabique, contrairement langlais qui est isoaccentuel, les caractristiques du rythme du franais de niveau moyen ou faible, devraient venir se reproduire dans les productions en anglais. Ainsi nous devrions retrouver pour FR1 des rsultats assez loigns des FR2 et encore plus des GB. Afin de reprer dventuels impacts du rythme de la L1 sur la L2, nous avons procd une reprsentation graphique des productions effectue partir du calcul des erreurs type (standard error) en fonction de deux paramtres rythmiques. Chacun des graphiques est complt par une ANOVA. Nous avons propos dtudier les mtriques les plus utilises dans la littrature. Nos hypothses fondes sur la littrature, se formulent comme suit :
198
Plus la production rythmique de lapprenant est bonne, plus les valeurs obtenues seront proches de celles du natif et tendront ainsi une production rythmique isoaccentuelle. -Les taux de C des apprenants devraient tre levs en raison de la structure syllabique complexe de la langue anglaise, tandis que les taux de V devraient tre assez bas. -Le pourcentage de voyelles (%V) devrait tre assez lev pour les locuteurs francophones. -Les taux de variabilit de PVI devraient tre assez levs si le rythme produit est proche de celui dun natif. -les taux de cvC et cvV devraient galement tre levs si la production rythmique est correctement ralise. tel-00455248, version 1 - 9 Feb 2010 Il est possible de distinguer deux types de rsultats :
(i). Les rsultats corroborent les hypothses. A cette corroboration sont attribus les paramtres rythmiques suivants, (seuls et en combinaison) : (nPVI-C,nPVI_V) et (cvV,cvC). Dans les deux cas de combinaisons, les valeurs obtenues taient celles attendues, savoir des taux de PVI normaliss et des taux de coefficient de variation levs pour les natifs, linverse des taux de francophones plutt bas, correspondant une production rythmique proche du franais. Les taux pour le groupe des FR2 se situent lintermdiaire des deux groupes opposs. Ce sont ici les mtriques normalises qui donnent de meilleurs rsultats ; la neutralisation des variations de tempo semble donc amliorer les rsultats de ces mtriques. Ces deux combinaisons semblent reflter au mieux linfluence de la L1 sur la L2. (ii). Les rsultats infirment les hypothses. On trouve plusieurs paramtres traits de manire individuelle ou en combinaison, dont les taux obtenus viennent contredire les rsultats annoncs dans la littrature: de manire gnrale, les valeurs donnent des rsultats contraires et inverss ceux des tudes de rfrence. Le %V des francophones est relativement bas et plus bas que celui des natifs alors que ce paramtre tait prdit plus lev. Les valeurs de C ainsi que du rPVI des anglais sont bien plus basses que les valeurs obtenues par Ramus et Grabe et infrieures aux valeurs obtenues pour les francophones. Les mtriques non normalises, comme
199
annonc dans la littrature, nindiquent pas de rsultats satisfaisants et ne montrent en rien une influence rythmique. Ces rsultats pourraient sexpliquer par le phnomne du rythme des textes utiliss pour lanalyse (Hirst, 2009). En effet, dans ce contexte, le mme texte a t utilis pour les natifs et non natifs, on a donc une neutralisation des diffrences de structure rythmique. Le rythme du texte est donc neutralis et cela pourrait expliquer les rsultats contraires ceux noncs dans la littrature. Ainsi, face la difficult phonotactique laquelle les locuteurs francophones sont confronts, un effet dhyper articulation pourrait galement confirmer des taux de C, rPVI levs, car mme si la diffrence de structure consonantique a t neutralise, le locuteur francophone na pas pour habitude de prononcer des squences de consonnes aussi complexes et pourrait produire une surarticulation.
tel-00455248, version 1 - 9 Feb 2010
5.4.2 Discrimination partir des critres rythmiques

Nous avons tabli quil y avait des diffrences de rythme dans la production des francophones et des natifs. Nous avons pu voir, quun francophone de niveau faible (FR1) en anglais, aurait tendance reproduire un rythme isosyllabique dans sa production orale. De fait, sil existe bien des diffrences, est-il possible, par le biais des mtriques rythmiques, (i) de diffrencier des natifs/ des apprenants, et (ii) de diffrencier le niveau des apprenants et ainsi obtenir une gradation FR1/FR2/GB ? Afin dtablir sil tait possible de diffrencier plusieurs niveaux et den dgager des critres rythmiques, nous avons procd plusieurs analyses statistiques. Analyse discriminante
Il a t montr quavec lensemble des paramtres rythmiques, il tait possible de classer correctement les locuteurs dans leur groupe avec un score global de 69,50%. Cette discrimination a montr une distinction majeure entre FR1 & GB qui sont les deux groupes opposs (natifs vs. apprenants de niveau faible) avec une marge minime derreur de 6% pour les deux groupes respectifs. Le groupe FR2 se trouve mi-chemin entre les opposs, ce qui correspond relativement la ralit de la composition des groupes. Cela nous
200
permet de confirmer, par ailleurs, le choix des critres de slection qui ont t utiliss lors de la constitution des groupes. Reprsentation graphique de chaque paramtre Nous avons test les diffrentes mtriques proposes dans la littrature, qui reprsentaient celles les plus utilises ; nous avons galement tudi les diffrentes combinaisons proposes par les mmes auteurs. Cela nous a permis de constater que les combinaisons sont meilleures prdicatrices quun paramtre unique. En effet, un seul paramtre, quel quil soit, nobtient au maximum que 43% et ne dpasse en aucun cas, les 50%. Par ailleurs, certaines mtriques permettent la distinction natifs/apprenants alors que tel-00455248, version 1 - 9 Feb 2010 dautres permettent plutt de diffrencier des niveaux au sein des apprenants. Enfin, une troisime catgorie de mtriques permet dtablir une gradation entre les 3 niveaux. Voici, un tableau rcapitulatif des diffrentes mtriques, en fonction de la tche de discrimination vise.
Niveaux de distinction 1 PARAMETRE
apprenant vs natif %V cvC C
FR1 vs FR2
Gradation (FR1-FR2-GB) C rPVI_C cvV
nPVI_C nPVI_V
COMBINAISON
%V cvV
%V, C nPVI_C,nPVI_V
rPVI_V,rPVI_C cvV,cvC %V,cvC
Tableau 13. Rcapitulatif des diffrentes mtriques prsentes en fonction de la tche de discrimination vise
Daprs le tableau prsent ci-dessus, il est possible de distinguer 3 types de discrimination en fonction des paramtres obtenus. Ainsi, %V et cvC ainsi que la combinaison %V,cvV donnent une meilleure distinction apprenant/natif. Les paramtres
201
C, nPVI_C et nPVI_V ainsi que les combinaisons %V,
C ; nPVI_C,nPVI_V
permettent une meilleure distinction FR1/FR2. Enfin, une gradation, allant de FR1 jusqu GB, est possible par lensemble des facteurs suivants : C, rPVI_C, cvV en tant que facteurs individuels, ou en combinaisons avec rPVI_V,rPVI_C ; cvV,cvC ; %V,cvC.
SVM (support vector machine) Parce que les combinaisons semblent apporter de meilleurs rsultats et que certaines mtriques permettraient une distinction graduelle des trois groupes, une SVM par factorisation de diverses combinaisons, allant de 1 4 paramtres, est mene afin dobtenir les meilleurs prdictions possibles. Les meilleures prdictions pour chacune des tel-00455248, version 1 - 9 Feb 2010 combinaisons factorielles sont rpertories dans le tableau ci-dessous :
VARIABLE cvV C, cvC %V, V,cvV %V, V,cvV,nPVI_V
SCORE OBTENU 45,79% 62,30% 63,09% 66,74%
Tableau 14. Rcapitulatif des meilleures prdictions pour chacune des combinaisons factorielles
Ces rsultats confirment les observations graphiques des reprsentations de lerreurtype, selon lesquelles les combinaisons des paramtres, quelles soient deux ou divers facteurs, sont meilleures quun paramtre seul. Plus il y a de paramtres, plus la fiabilit de la prdiction augmente. Cependant, on remarque que les prdictions obtenues pour la combinaison -C,cvC- sont quasi quivalentes celles des prdictions avec 2 ou 3 paramtres. Cette combinaison est a priori surprenante puisquon aurait pu penser que ces deux facteurs seraient fortement corrls. Si lon compare ces donnes avec les combinaisons proposes dans la littrature, aucune des combinaisons binaires avances ne figure dans la liste des meilleures combinaisons. Selon lanalyse SVM, ces combinaisons obtiennent les rsultats de fiabilit suivants : 202
COMBINAISON PROPOSEE % V, C nPVI_V, rPVI_C %V, cvV %V, cvC
SCORE OBTENU (SVM) 46,58% 48,65% 49,68% 46,34%
Tableau 15. Prsentation des prdictions obtenues par l'analyse SVM des mtriques exposes dans la littrature
Ces rsultats sont loin du taux de fiabilit quobtient C,cvC avec plus de 63%. Par ailleurs, nous avions conclu quun modle simple, mais apportant un taux de prdiction pratiquement aussi lev quun modle pluri-mtrique tait prfrable. Pour notre part, nous pensons donc que la combinaison C,cvC apparat tre la combinaison la plus discriminante et la plus fiable, dans une tche de discrimination L1/L2, tel-00455248, version 1 - 9 Feb 2010 anglais/franais. Cela, bien videmment, en tant consciente que cette mesure, C, est largement critique dans la littrature de par son lien avec les fluctuations de tempo.
On peut se demander prsent, si cette combinaison ne pourrait pas tre galement efficace dans la distinction inter-langues, inter-dialectales et pour les tudes de lvaluation en pathologie. En effet, il serait intressant de confirmer ces rsultats, en testant cette combinaison sur dautres corpus, y compris des corpus L1/L2, afin de confirmer ces premiers rsultats. Il serait donc tout fait envisageable dutiliser la combinaison deux facteurs C,cvC des fins valuatives dans une comparaison de productions rythmiques natifs/francophones.
203
tel-00455248, version 1 - 9 Feb 2010
204
Conclusion et perspectives
Lobjectif de ce travail tait de proposer des critres rythmiques valuatifs de la production orale dapprenants franais en anglais L2, dans le cadre de llaboration dune valuation objective de la prosodie de langlais britannique. Lide tait dasseoir des critres objectifs valuatifs du rythme, partir de mtriques rythmiques. Ds lintroduction, nous avons mis en vidence le manque dvaluation de loral en anglais L2 et tout particulirement de la prosodie. Nous ne cherchions pas convaincre ; toute personne sintressant lapprentissage de la langue doit dj tre persuade de limportance des traits prosodiques dans la production langagire. Le fait est que la tel-00455248, version 1 - 9 Feb 2010 prosodie pose un certain nombre de problmes aux apprenants, elle est un facteur majeur dans la comprhensibilit du message faire passer son interlocuteur. Nous avons vu que les logiciels multimdia pouvaient tre dune grande aide pour remdier ces difficults et apporter un souffle nouveau dans lenseignement de la phontique. Cependant, le constat est pertinent : aucune valuation objective de la prosodie nest propose dans ces outils multimdia, un problme qui stend dailleurs lenseignement de la phontique de manire globale, dans lequel bien souvent, aucune grille valuative de la prosodie nest propose pour valuer loral des tudiants. Cependant, avant de proposer un critre quel quil soit, il tait ncessaire en premier lieu danalyser le cadre de travail dans lequel nous nous situons. Le premier travail de cette recherche tait avant tout descriptif. Avant de pouvoir envisager de soumettre un critre rythmique, il fallait dcrire lobjet dtude de ces travaux. Une recherche approfondie sur la notion de rythme nous a permis de comprendre les diffrences essentielles entre le fonctionnement des deux systmes prosodiques des langues tudies (le franais et langlais), ce qui nous a conduits prendre conscience dun certain nombre dinterfrences rythmiques potentielles chez lapprenant francophone. Ce dernier, nous lavons vu, se retrouve confront de nombreuses difficults, conscientes et/ou inconscientes. Nous mesurons prsent les problmes auxquels nous devons faire face lorsque nous basculons dune langue lautre, dans la mesure o il faut plonger vers un systme prosodique compltement diffrent.
205
Malgr tout, un certain nombre de thmatiques nont pu tre abordes, du fait du champ large de recherche que couvre la prosodie. Nous avons donc d faire un choix, et celui-ci sest port tout naturellement sur le rythme. Nous avons pu constater en effet, aussi bien dans la littrature, que dans la cadre de notre mtier denseignant, quil tait tout particulirement difficile acqurir pour les apprenants. Nous ne rfutons pas pour autant limportance du rle jou par les autres composantes prosodiques, galement difficiles acqurir, mais la place importante quoccupe le rythme dans la production orale nous a conforte dans notre premier choix. Sans aucun doute, cette recherche se doit dtre complte par ltude des autres composantes prosodiques. Par ailleurs, nous avons d galement cibler dans ce travail une partie des aspects rythmiques de la langue. Une tude exhaustive pourrait se pencher sur dautres phnomnes rythmiques, tels que les pauses, les dures syllabiques, ces lments tant difficilement indissociables des faits prosodiques. tel-00455248, version 1 - 9 Feb 2010 Paralllement cela, nous avons port grand intrt dtailler et analyser les outils multimdia proposs actuellement, ce qui fut ncessaire pour constater le manque de paramtres valuatifs, mais aussi attester de lapport positif que ces mthodes pourraient susciter. Le premier objectif fix pour ce travail de recherche tait de proposer une base de donnes comparatives danglais L1/L2, sur laquelle il serait possible de travailler llaboration de critres prosodiques mais galement, qui viendrait pallier un manque tonnant de corpus disponibles danglais L2. Cest ce que nous nous sommes attache faire et cest ce que nous prsentons dans le chapitre 4 de cette thse. La ralisation de cette base de donnes a t le fruit dune longue rflexion et exprimentation qui nous a amene la cration dune base de donnes consquente nomme ANGLISH. Une des volonts face cette tche tait de rendre ces enregistrements disponibles la communaut, ce qui est bien le cas puisqu ANGLISH sera disponible librement sur le site du CRDO http://crdo.fr, permettant ainsi une large diffusion, ainsi que, nous lesprons, un large retour qui contribuera lenrichissement de la base de donnes. La partie lecture de ce corpus nous a permis dtablir nos analyses exprimentales. Llaboration de cette base de donnes a constitu un point essentiel cette recherche et nous donne la possibilit disoler des paramtres rythmiques importants pour la mise en place dune valuation. Le second objectif de ce travail, que nous traitons dans le chapitre 5, tait de mener bien une proposition de critres pour tablir une valuation objective de loral des 206
apprenants francophones. Lide est de quantifier un paramtre rythmique afin de proposer un critre fiable dvaluation. Nous avons choisi dutiliser les mtriques rythmiques dans la mesure o la littrature a mis en avant le rle de discrimination quelles pouvaient jouer entre les langues ou les dialectes. Une premire tape rside dans lvaluation des diffrentes mtriques les plus utilises proposes dans la littrature, par une reprsentation des diffrentes combinaisons selon le calcul de lerreur-type (mthode utilise par Ramus et al., 1999). Cela nous a permis de constater dans un premier temps dun point de vue graphique, quil y avait bien une influence du rythme de la L1 sur la L2 mettant en vidence des diffrences rythmiques dans les productions. Plus la production de lapprenant tait rythmiquement proche dun rythme franais, plus il sloignait des valeurs des natifs. Par ailleurs, il a t mis en avant que des combinaisons de paramtres taient plus efficaces quun paramtre isol. Par la suite, une analyse discriminante calcule sur tel-00455248, version 1 - 9 Feb 2010 lensemble des neuf paramtres proposs, prdit de manire significative 69,50% de fiabilit, lappartenance des locuteurs leur groupe de niveau (FR1, FR2, GB). Afin de rendre compte des diffrences rythmiques par un critre valuatif prcis, nous avons mis en vidence que : (i) une combinaison binaire tait plus favorable une discrimination dite fiable, linstar de combinaisons pluri-paramtriques, (ii) certaines combinaisons pourraient servir distinguer natifs/apprenants, dautres faire une distinction FR1/FR2, et une troisime catgorie discriminant le niveau des 3 groupes, (iii) la combinaison C,cvC tait la combinaison la plus fiable et que ces deux paramtres rythmiques pourraient tre pris en compte comme critres valuatifs dans le but de mettre en avant la tendance rythmique des productions des apprenants francophones. Il est possible de discriminer la L1 de la L2, et de distinguer les productions rythmiques des apprenants. Nous souhaitons insister sur le fait que la combinaison mtrique utilisable comme critre valuatif, donnera une tendance rythmique des productions, savoir plus ou moins isoaccentuelle, plus ou moins proche des productions de natifs. Il est vident que cette tendance doit tre renforce par dautres critres rythmiques prcis, afin doptimiser les rsultats dune valuation propose lapprenant.
207
Ce travail reprsente un point de dpart. Il convient dapprofondir la problmatique et complter cette recherche qui ouvre la voie de nombreuses perspectives de travail. En effet, beaucoup reste faire dans ce domaine, dune part pour dfinir les points de rupture entre la prosodie de langlais et celle des apprenants francophones, et dautre part, pour laborer un systme valuatif objectif, bas sur de nombreux critres pertinents, dans le but damliorer la production des apprenants et faire en sorte que parler une langue trangre, et notamment ici, langlais, ne soit plus une corve ou une honte pour un francophone. Les rsultats des analyses exprimentales permettent de proposer des perspectives et des propositions didactiques.
Perspectives
tel-00455248, version 1 - 9 Feb 2010 Tout dabord, nous pensons quil serait intressant dexploiter lexercice de rptition du corpus dans le but de mener une tude comparative entre la production de lecture et la tche de rptition. Cette analyse nous permettrait de mieux cibler les erreurs de production en essayant de noter si, une auto-correction des erreurs produites en lecture, a t opre par le locuteur lors de la phase rptition. Cela pourrait permettre lamlioration de llaboration dun feedback plus prcis. Il serait galement intressant de penser la mise en place dun test de perception qui permettrait lvaluation perceptive des productions francophones en les classant sur une chelle gradue. Nous pourrions ainsi mettre en place une chelle plusieurs niveaux, donc au-del des trois niveaux proposs dans ce travail, partir de laquelle un apprenant pourrait se voir class, et ainsi apprcier son volution dans lapprentissage de la L2. Un tel test permettrait galement de valider la rpartition des locuteurs et sinscrirait en complment dune valuation subjective partir de critres de niveaux acadmiques , tels que proposs dans cette thse. Le groupe dfini rpondrait plus au critre dhomognit recherch pour la rpartition des locuteurs. Le test de perception permettrait laffinage des groupes puisquil amne lvaluation objective des variabilits intralocuteurs possibles au sein dun mme groupe. Concernant les aspects mmes de ce travail, nous pensons quil serait intressant dexploiter la partie spontane du corpus, selon une mme mthodologie, cest--dire par la 208
mise en place de critres rythmiques (que nous pouvons imaginer diffrents pour la parole spontane) afin dvaluer lapprenant dans son apprentissage de la L2. Sil est possible dtablir de tels critres, partir de la parole spontane, cela permettrait dvaluer le niveau de lapprenant dans une production qui lui appartient et qui est non fige sur la rptition de la production orale du natif. De tels critres et une telle valuation viendraient ainsi complter la base mthodologique labore dans ce travail et les perspectives prsentes ci-dessus. Par ailleurs, nous pourrions tester dautres mtriques prsentes dans la littrature mais jusquici trs peu usites et notamment utiliser les algorithmes dvelopps par Loukina & al. (2009) pour automatiser des prdictions de classement. Pour optimiser les rsultats obtenus avec lanalyse discriminante, nous pourrions tel-00455248, version 1 - 9 Feb 2010 effectuer une discrimination franais/anglais, mais aussi FR1/FR2. Des premiers rsultats montrent dj des perspectives trs intressantes avec 90% de fiabilit pour une discrimination FR/ANG. Par ailleurs, afin de complter llaboration dun feedback, il sagirait danalyser les productions par passage entier, et non plus par phrase, mais aussi, par les 4 passages, cest--dire par locuteur. Jusquici, nous avons labor une aide au locuteur en valuant son nonc et en lui donnant une tendance rythmique ; par la suite, nous pourrions donner une valuation des locuteurs eux-mmes. Llaboration de critres, autres que rythmiques, comme nous lavons mentionn plus haut, apparat galement ncessaire. De tels critres, labors partir des composantes prosodiques que nous connaissons, viendraient complter ce travail et lenrichir tout naturellement. Une fois les critres prosodiques bien tablis, i.e. dcids la fois, partir dune lecture exhaustive des travaux mens dans le domaine et partir de la rflexion denseignants sur les difficults dapprentissage de la L2, des seuils pourraient tre dfinis et ainsi renseigner lapprenant la fois sur son niveau de langue, en terme de prosodie (nous ne proposons pas une valuation de ses comptences linguistiques mais de sa prononciation), et sur ses progrs dans lapprentissage de cette langue. La dtermination de seuils pourrait se faire notamment par la collaboration de chercheurs, denseignants et dinformaticiens.
209
A long terme, nous pouvons penser quune telle mthodologie permettra llaboration dun systme dvaluation automatique de la prosodie, applicable au champ de la L2 mais galement en pathologie ou en parole de synthse.
tel-00455248, version 1 - 9 Feb 2010
210
Rfrences
Abercrombie, D. (1967) Elements of General Phonetics, Edimbourg, Grande Bretagne: Edinburgh University Press, 203p. Adams, C. (1979) English Speech Rhythm and the Foreign Learner, Walter de Gruyter & Co, 231p. Allen, G.D. (1972) The location of Stress Beats in Rhythmic English, An Experimental Study, 2, Off-print, Language and Speech, 15 (2), pp.179-195. Allen, G.D. (1975) Speech rhythm: its relation to performance universals and articulatory timing, Journal of Phonetics, 33, pp.75-86. Alliaume, J. (1989) Prosodie et apprentissage des langues, Cahiers de LAPLIUT, Association des Professeurs de langue des IUT, 32 (3), Actes de Congrs, pp.96-104. Alliaume J. ; Hesling, I. (1998) Le langage et les deux cerveaux, Editions CERALEC, Fort de France, 127p. Anderson-Hsieh, J. ; Johnson.R ; Koehler, K. (1992) The Relationship between Native Speaker Judgments of Nonnative Pronunciation and Deviance in Segmentals, Prosody, and Syllable Structure, Language Learning, 42 (4), pp. 529-555. Asher, R.E. (1985) Tamil, London: Croom Helm. Astsano, C. (2001) Rythme et accentuation en franais. Invariance et variabilit stylistique, Coll. Langue et Parole, Paris, France : L'Harmattan, 336 p. Aubry, Y. (2004) Logiciel du traitement de la parole et daide lenseignement et lapprentissage de la prosodie : application au breton, travaux de D.R.T. dingnierie, universit du Maine. Auran, C. (2004) Prosodie et anaphore dans le discours en anglais et en franais: cohsion et attribution rfrentielle, thse de doctorat, universit de Provence. Auran, C. ; Bouzon, C. ; Hirst, D. (2004) The aix-MARSEC project: an evolutive database of spoken british English, In Speech Prosody 3:04, pp. 561-564. Baayen, R.H. (2008) Analyzing Linguistic Data: A Practical Introduction to Statistics using R, Cambridge, 368 p.
tel-00455248, version 1 - 9 Feb 2010
211
Barkat-Defradas, M. ; Hamdi, R. ; Pellegrino, F. (2004) De la caractrisation linguistique l'identification automatique des dialectes arabes, MIDL, Paris, 29-30 novembre 2004. Barry, W.J. ; Andreeva, B. ; Russo, M. ; Dimitrova, S. ; Kostadinova, T. (2003) Do rhythm measures tell us anything about language type, Proceedings of the 15th International Congress of Phonetic Sciences, Barcelona, pp.2693-2696. Beck, A. ; Dcurr, N. ; Gaillard, P. ; Kabbaj, N. ; Pchou, A. ; Stenton, A. ; Tazi, S. ; Toma, A. ; Tricot, A. ; Vaillant-Sirdey, C. (2005) SWAMS, un systme ayteur de synchronisation et dannotation pour un apprentissage multimodal des phnomnes accentuels en langue vivante 2, EIHA 05, pp. 1-14. Beckman, M. (1992) Evidence For Speech Rhythms Across Languages, In Tohkura, Y. ; Vatikiotis-Bateson, E. ; Sagisaka, Y. (eds), Speech Perception, Production And Linguistic Structure, pp. 457-463.
tel-00455248, version 1 - 9 Feb 2010
Bel, B. & Blache, P. (2006) Le Centre de Ressources pour la Description de lOral (CRDO), Travaux Interdisciplinaires du Laboratoire Parole et Langage (TIPA), 25, pp. 13-18. Benguerel & DArcy. (1986) Time-Warping and the Perception of Rhythm in Speech. Off-print, Journal of Phonetics, 14, pp. 231-246. Bertinetto, P.M. (1989) Reflections on the dichotomy stress vs. syllable-timing, Revue de Phontique Applique, 91-92-93, pp. 99-130. Best, C. (1995) A Direct Realist View of Cross-Language Speech Perception, in STRANGE, W. (ed), Speech Perception and Linguistic Experience, Issues of Cross-Language Research, Baltimore, IN, USA: New York Press, Inc., pp. 171-204. Best, C. ; McRoberts, G. ; Goodell, E. (2001) Discrimination of non-native consonant contrasts varying in perceptual assimilation to the listeners native phonological system, Journal of Acoustic Society of America, 109, pp.775794. Bloch, B. ; Trager. G.L. (1942) Outline of linguistic analysis, Linguistic Society of America (pub.), Waverly Press. Bloch, B. (1950) Studies in Colloquial Japanese IV: Phonemics, Language, 26, pp. 86-125. Blumstein & Cooper (1974) Hemispheric processing of intonation, Cortex, 10, pp. 146-158 Boersma, P. & Weenick, D. (2009) Praat: a system for doing phonetics by computer, version 5.1.04. Tlchargeable partir de www.praat.org.
212
Bolinger, D. (1965) Pitch accent and sentence rhythm, Forms of English: Accent, morpheme, order, Cambridge, MA: Harvard University Press, pp. 139-180. Bolinger, D. (1972) Intonation, Selected Readings, Coll. Penguin Modern Linguistics Readings, Harmondsworth, Grande Bretagne: Penguin Books, 464 p. Bolinger, D. (1981) Two Kinds of Vowels, Two Kinds of Rhythm, Bloomington, IN, USA : IULC Publications, 68 p. Bongaerts, T. (1999) Ultimate attainment in L2 pronunciation: the Case of very advanced late L2 learners, in: Birdsong, D. (ed.), Second Language Acquisition and the Critical Period Hypothesis, Lawrence Erlbaum, Mahway, NJ, pp. 133-159. Bonniol, J.J (1976) La fidlit en question, objet dtude docimologique, Connexions, 19, pp. 3-78.
tel-00455248, version 1 - 9 Feb 2010
Bonniol, J.J ; Vial, M. (1997) Les modles de lvaluation, Textes fondateurs avec commentaires, De Boert, 368p. Bosch, L. ; Sebastian-Galles, N. (1997) The role of prosody in infants nativelanguage discrimination abilities: the case of two phonologically close languages, In EUROSPEECH-1997, pp. 231-234. Boulton, A. (2008) Esprit de corpus : promouvoir lexploitation de corpus en apprentissage des langues, revue lectronique Texte et Corpus, 3, Actes des Journes de la linguistique de Corpus 2007, pp. 37-46. Bouzon, C. (2004) Rythme et structuration prosodique en anglais britannique contemporain, Thse de doctorat, Universit de Provence. Burns, T.C. ; Yoshida, K. ; Hill, K. ; Werker,J.F. (2007) The development of phonetic representation in bilingual and monolingual infants, Applied Psycholinguistics, Psychological and Linguistic Studies across Languages and Learners, 28 (3), Cambridge, Grande Bretagne : Cambridge University Press, pp. 455-474. Caelen-Haumont, G. (1983) Le rythme dans la parole: une revue des tudes portant sur le franais, Actes du 4me colloque Langages et Signification, ALBI, I, Le Rythme, pp. 233-245. Calbris, G. ; Montredon, J. (1975) Approche Rythmique,Intonative et expressive du franais langue trangre, vol.1, Cl International, Paris, 77p. Carter, P. (2005) Quantifying rhythmic differences between Spanish, English and Hispanic English, Theoretical and Experimental approaches to romantic
213
linguistics, Current Issues in Linguistics Theory 272, John Benjamins P.C, pp. 64-75. Carr, P. (1999) English phonetics and phonology, Oxford (UK), Malden, 169p. Catford, JC. (1977) Fundamental Problems in Phonetics, Edimbourg, Grande Bretagne : Edinburgh University Press, 278p. Cazade, A. (1999) De lusage des courbes sonores et autre supports graphiques pour aider lapprenant en langues, ALSIC, vol. 2 (2), pp. 3-32. Caverni, J.P., Fabre, J.P., Noizet, G., (1975) Dpendance des valuations scolaires par rapport des valuations antrieures, le travail humain, tome 38 (2), pp. 213-222. Champagne-Muzar, C. ; Bourdages, J.S. (1998) Le point sur la phontique, CLE International, 101p.
tel-00455248, version 1 - 9 Feb 2010
Chan, D., Fourcin, A., Gibbon, D., Grandstrm, B., Huckvale, M, Kokkinakis, G., Kvale, K., Lamel, L., lindberg, B., Moreno, A., Mouropoulos, J., Senia, F., Transcoso, I., Velt, C. & Zeiliger, J. (1995) "EUROM A Spoken Language Ressource for the EU." In Proceedings of Eurospeech95, Madrid, 1995. Cheong, H.S. (2007) The role of listener affiliated socio-cultural factors in perceiving native accented versus foreign accented speech, thse de doctorat, the Ohio state university. Cho, Y.S. (2009) Etude sur la prosodie de la langue corenne, thse de doctorat, universit de Provence. Chomsky, N. ; Halle, M. (1968) The Sound Pattern of English, Longman Higher Education, 470p. Classe, A. (1939) The rhythm of English prose, B. Blackwell. Corder, S.P. (1967) The significance of learners errors, IRAL, 5(4), pp. 162-169. Corder, S.P. (1973) Introducing Applied Linguistics, Hardmondsworth, Penguin, 400p. Corder, S.P. (1980) Que signifient les erreurs des apprenants ?, Langages, 15 (57), Paris, pp.9-15 (traduction dun article de 1967). Couper-Kuhlen, E. (1993) English speech rhythm: Form and function in everyday verbal interaction, John Benjamins Publushing co, 360p. Cruttenden, A. (1986) Intonation, Coll. Cambridge Textbooks in Linguistics. Cambridge, Grande Bretagne : Cambridge University Press, 214p.
214
Cruttenden, (2001) Gimsons pronunciation of English, sixth edition, Arnold, 360 p. Crystal, D. (1969) Prosodic Systems and Intonation in English, Cambridge University Press, London, 381p. Crystal, D. (2003) English as a Global Language, Cambridge University Press, 2nd Edition, 228p. Cucchiarini, C. ; Strik, H. ; Boves, L. (2000) Different aspects of expert pronunciation quality ratings and their relation to scores produced by speech recognition algorithms, Speech Communication n 30, pp.109-119. Cummins, F., Fort, R. (1998) Rhythmic constraints on English, in Walley, A. ; Flege, J., avril 1998, Journal of Phonetics 262, pp. 145-171. Cuq, J.P. (2003) Dictionnaire de didactique du franais langue seconde et langue trangre, Paris, France : Cl international, 303p.
tel-00455248, version 1 - 9 Feb 2010
Dauer, R. (1983) Stress-timing and syllable-timing reanalyzed, Journal of Phonetics, 11 (1), pp. 51-62. Dauer, R (1987) Phonetic and phonological components of language rhythm, Proceedings of the 11th International Congress of Phonetic Sciences, 5, pp. 445-450. Davis, B.L. & Macneilage, P.F. (1995) The articulatory basis of babbling, Journal of Phonetics, 11, pp.51-62. De Bot, K. (1983) Visual feedback of intonation I: effectiveness and induced practice behavior, Language and Speech, 26 (4), pp.331-350. De Cordemoy, G. (1668) Discours physique de http://fr.wikipedia.org/wiki/G%C3%A9raud_de_Cordemoy. la Parole
De Saussure, F. (1968) Cours de linguistique gnrale, Collection tudes et Documents, Payot, Paris, 3me dition, 331p. Delais-Roussarie, E. (2002) Constituer des corpus oraux : mthodes et outils. Carnets de grammaire, Rapports interne de lquipe de recherche syntaxe et smantique, 10, Toulouse-le Mirail. Delattre, P. (1966) A Comparison of Syllable Length Conditioning among Languages. Off-print, IRAL, 4 (1), sept. 1966, pp. 183-198. Dell, F. (1984) L'accentuation dans les phrases en franais, in Formes sonores du langage, F. Dell ; D.J. Hirst ; Vergnaud, J.R. (eds.), Hermann, pp. 65-122.
215
Dellwo, V. (2006) Rhythm and Speech rate: A variation coefficient for C, Language and Language-Processing, pp. 231-241. Dellwo, V. (2008) The role of speech rate in perceiving speech rhythm, In Speech Prosody 4:08, pp. 375-378. Delmonte, R. (1998) Prosodic modeling for automatic language tutors, In STiLL1998, pp. 57-60. Delorme, A. ; Fluckiger, M. (2003) Perception et ralit: une introduction la psychologie des perceptions, De Boeck, 516p. Deterding, D. (2001) The measurement of rhythm: A comparison of Singapore and British English, Journal of Phonetics, 29 (2), pp. 217-230. Di Cristo, A. (1975) Prsentation dun test de niveau destin valuer la prononciation des anglophones, Universit de Provence, R.P.A., 33-34, pp.935. Di Cristo, A. ; Hirst, D. (1993) Rythme syllabique, rythme mlodique, et reprsentation hirarchique de la prosodie du franais (Prosodie), Institut de Phontique d'Aix et UA 261 du CNRS. Aix-en-Provence, France: 1993-94, pp. 9-24. Di Cristo, A. ; Hirst, D. (1997) Un procd d'alignement automatique de transcriptions phontiques sans apprentissage pralable, 4e congrs dAcoustique, pp. 14-18. Di Cristo, A. ; Hirst, D. (1998) Intonation Systems. A Survey of Twenty Languages. Cambridge, Grande Bretagne : Cambridge University Press, 1998, 487p. Di Cristo, A. (2000) Interprter la prosodie, Actes des 23me Journes d'Etude sur la Parole, Aussois, 19-23 juin, pp. 13-23. Di Cristo, A. (2002) De la mtrique et du rythme de la parole ordinaire : lexemple du franais, Bordas, E. (ed.) : le rythme de la prose, Revue de smiolinguistique des textes et discours, 16, pp. 25-43. Di Cristo, A. (2004) La prosodie au carrefour de la phontique, de la phonologie et de larticulation formes-fonctions, Travaux Interdisciplinaires du Laboratoire Parole et Langage, 23, pp. 67-211. Dickerson, W.B. (1989) Stress in the Speech Stream : the Rhythm of Spoken English, Urbana and Chicago, University of Illinois Press. Dodane, C. (1999) Apprentissage prcoce de langue trangre : interfrences de traitement entre langue et musique, 3e congrs international du rythme : le
tel-00455248, version 1 - 9 Feb 2010
216
rle du rythme pour le dveloppement humain, Institut Jacques-Dalcroze, Genve. Dodane, C. ; Konopczynski, G. (2001) Utilisation des technologies multimdias dans la correction prosodique de ladulte (L2), communication orale, Ecole Doctorale Europenne. Dubois et al. (1973) Dictionnaire de linguistique, Paris, France : Larousse, 516p. Durand, J. ; Delais-Roussarie, E. (2003) Corpus et variation en phonologie du franais, PUM, 372p. Elbers, L. (1982) Operating principles in repetitive babbling: A cognitive continuity approach, Cognition, 12, pp.4563. Erikson, L.J. (1991) Development of the Filtered U Algorithm for Active Noise Control, Journal of the Acoustical Society of America, 89 (1), pp. 257-265.
tel-00455248, version 1 - 9 Feb 2010
Eskenazi, N. (1999) Using a Computer in Foreign Language Pronunciation Training: What Advantage?, CALICO Journal, 16 (3) , pp.447-471. Fant, G. (1991) Units of temporal organization: stress groups versus syllables and words, Proceedings of the XIIth ICPHS, 1, universit de Provence, Aix-enProvence, pp.241-261. Faure, G. (1962) Recherches sur les caractres et le rle des lments musicaux dans la prononciation anglaise. Essai de description phonologique, Coll. Etudes anglaises, Didier, Paris, 380p. Faure, G. ; Di Cristo, A. (1977) Le franais par le dialogue, Hachette, Collection outils, Paris, 80p. Faure, G. ; Hirst, D. ; Chafcouloff (1980) Rhythm In English: Isochronism, Pitch and Perceived Stress, In WAUGH, L. R. ; SCHOONEVELD, C.H. van (eds), The Melody Of Language. Intonation And Prosody, pp. 71-80. Felps, D. ; Bortfled, H. ; Gutierrez-Osuna, R. (2009) Foreign accent conversion in computer-assisted pronunciation training, Speech Communication, 51, pp. 920-932. Fernandez-Cruz, R. (2000) Analyse phonologique et phontique du portugais brsilien parl par les communauts noires dAmazonie, thse de doctorat, Universit de Provence. Ferragne, E. ; Pellegrino, F. (2004) Rhythm in Read British English : Interdialect Variability, Proceedings of Interspeech 04 ICSLP, Jeju Island, Korea, pp.1573-1576.
217
Field, J. (2005) Intelligibility and the listener: the role of lexical stress, TESOL Quarterly, 39 (3), pp.399-423. Fitzpatrick, M. (2002) Theories of Child Language Acquisition, Child Language Acquisition [Online], [2004, February 4]. Flege, J.E. (1995) Second-language speech learning: Findings and problems, in Strange, W. (ed.), Speech Perception and Linguistic Experience: Theoretical and Methodological Issues, Timonium, MD: York Press, pp. 233-273. Flege, J.E. ; Hillenbrand, J. (1984), Limits on phonetic accuracy in foreign language speech production (French & English), Journal of the Acoustical Society of America, 76 (3), pp. 708-721. Fraisse, P. (1956) Les structures rythmiques, Studia Psychologica, ERASMES, S.A, Paris-Bruxelles, 125p.
tel-00455248, version 1 - 9 Feb 2010
Fraisse, P. (1974) Psychologie Du Rythme, Paris, France : PUF, Presses Universitaires de France, 244 p. Freland-Ricard, M. (1995) Analyse multilingue des erreurs prosodiques chez lapprenant tranger-essai de paramtrisation, thse de doctorat, Universit de Provence. Fromkin, V. ; Rodman, R. (1998) An introduction to Language, Harcourt, sixth ed., 565p. Galazzi-Matasci, E. ; Pedoya, E. (1983) Et la pdagogie de la prononciation ?, Le Franais dans le Monde, 180, pp. 39-44. Germain, A. ; Martin, P. (2000) Prsentation d'un logiciel de visualisation pour l'apprentissage de l'oral en langue seconde, Alsic, 3 (1), pp.61-76. Gibbon, D. ; Moore, R. ; Winski, R. (1998) Spoken Language System and Corpus Design, Berlin: Mouton de Gruyter, 216p. Ginsy, M. (1995) Mmento de phontique anglaise, Nathan Universit, 288p. Ginestet, F. (2002) L'enseignement/apprentissage de l'intonation du franais. Une approche de l'intonation implicative avec des apprenants chinois, Travaux didactique du franais langue trangre, 47, pp. 87-104. Goldman, J.P. ; Auchlin, A. ; Simon, A.C. ; Avanzi, M. (2007) Phonostylographe : un outil de description prosodique. Comparaison du style radiophonique et lu, Nouveaux cahiers de linguistique franaise, 28, pp. 219-237. Granger et al. (2009) The LONGDALE Project Longitudinal Database of learner English, http://cecl.fltr.ucl.ac.bc/LONGDALE.html
218
Goodglass, H. ; Calderon, M. (1977) Parallel processing of verbal and musical stimuli in right and left hemispheres, Neuropsychologia, 15 (3), pp. 397-407. Grabe, E. ; Low, E.L. (2002) Durational variability in speech and the rhythm class hypothesis, In Gussenhoven, C. ; Warner, N. (ds.), Laboratory Phonology 7. Coll. Phonology & Phonetics, 4-1. Berlin, Allemagne : Mouton De Gruyter, pp. 515-546. Graddol, D. (2000) The future of English?A guide to forecasting the popularity of the English language in the 21st century, The British Council, The English company (UK) Ltd, 65p. Grenon, I. ; White, L. (2008) Acquiring Rhythm: a Comparison of L1 and L2 speakers of Canadian English and Japanese, In H. Chan, H. Jacob & E. Kapia (Eds.), BUCLD 32: Proceedings of the 32nd annual Boston University Conference on Language Development, Somerville, Massachusetts: Cascadilla Press, pp.155-166.
tel-00455248, version 1 - 9 Feb 2010
Grodzinsky, Y. (1990) Theoretical perspectives on language deficits, Cambridge Mass ; London: MIT press, 192p. Grosjean, F. (1983) How long is the sentence? Prediction and prosody in the on-line processing of language, Linguistics, 21, pp. 501-529. Grosjean, F. ; Collins, M. (1979) Breathing, Pausing, Reading, Phonetica, 36, pp. 98-114. Guaitella, I. (1991) Rythme et parole: comparaison critique du rythme de la lecture oralise et de la parole spontane, Thse de doctorat, Universit de Provence. Guberina, P. (1939) Valeur logique et valeur stylistique des propositions complexes, thse dtat, universit de la Sorbonne. Guberina, P. (1974) Structuration et dpassement des structures, Actes du 3me colloque international SGAV pour lenseignement des langues, Didier, pp. 41-55. Gut, U. ; Urua, E. ;Adouakou, S. ; Gibbon, D. (2001) Rhythm in West African tone languages: a study of Ibibio, Anyi and Ega, Typology of African Prosodic Systems Worshop, Bielfield University, Germany. Gut, U. (2003) Prosody in second language speech production: the role of the native language, Fremdsprachen Lehren und Lernen, 32, pp. 133-151. Habert, B. ; Nazarenko, A. ; Salem, A. (1997) Les linguistiques de corpus, Paris : Armand Colin, 240p.
219
Hadley, G. (2002) Sensing the winds of change: an introduction to data-driven learning, RELC journal, 32 (2), pp. 301-319. Han, M.S. (1962) The feature of duration in Japanese, Onsei no kenkyuu, 10, pp. 6580. Halliday, M. (1967) Intonation and Grammar in British English, Coll. Janua Linguarum, Series Practica, 48. La Haye, Pays-Bas : Mouton & Co., 62p. Handel, S. (1983) The contextual nature of rhythmic interpretation, in Perception and psychophysics, 34 (2), pp. 103-120. Handel, S. (1989) Listening. An Introduction to the Perception of Auditory Events. Coll. Bradford Books. Cambridge, MA, USA : The MIT Press, 1989, 597p. Hansen, T.K. (2006) Computer assisted pronunciation training: the four Ks of feedback, in 4th International conference on multimedia and information and communication technologies in education, Seville, Espagne, pp. 342-346. Hardison, D.M. (2004) Generalization of Computer-Assisted Prosody Training: Quantitative and Qualitative Findings, Language Learning & Technology, 8 (l), pp. 34-52. Herry, N. (1997) Prediction and Transcription of Intonation Patterns in English, mmoire de matrise, universit de Provence. Herry, N. (2001) Evaluation objective et subjective de la prosodie anglaise parle par des franais : Apport de lenseignement assist par ordinateur, Thse de doctorat, Universit de Provence. Herry, N. ; Hirst, D. (2002) Subjective and objective evaluation of the prosody of English spoken by French speakers: the contribution of computer assisted learning, Proceedings of Speech Prosody 1:02, Aix-en-Provence. Hesling, I. (2000) Le rle de lhmisphre crbral droit dans la production de la perception de la parole, Thse de doctorat, UTM, http://www.univtlse2.fr/rech/sout-theses/2000-01-21-ang-hesling.htlm. Hincks, R. (2003) Speech technologies for pronunciation feedback and evaluation, ReCALL 15, Cambridge University Press, pp. 3-20. Hincks, R. ; Edlund, J. (2009) Promoting increased variation with transient visual feedback, KTH Royal Institute of Technology, Language Learning and Technology, 13 (3), pp. 32-50. Hirst, D. J. (1977) Intonative Features. A syntactic Approach to English Intonation, Collection Janua Linguarum, Series Minor, Mouton, La Haye, Pays Bas, 139p.
220
tel-00455248, version 1 - 9 Feb 2010
Hirst, D. & Di Cristo, A. (ed.). (1998). Intonation in British English, in Hirst, D.J. ; Di Cristo, A. (eds), Intonation Systems: A survey of Twenty Languages, Cambridge: Cambridge University Press, pp. 56-77. Hirst, D. (2000) The Prosody paradox: Universal and language-specific parameters of speech prosody, In proceedings of Workshop prosody 2000: Speech Recognition and Synthesis, (ESCA/ISCA), (Krakw, Poland). Hirst, D. (2009) The rhythm of text and the rhythm of utterances: from metrics to models, in Proceedings of Interspeech, Annual Conference of the International Speech Communication Association, (10: 2009 septembre 6-10 : Brighton). Hockett, C.F. (1958) A Course in Modern Linguistics. New York, NY, USA: MacMillan & Co. Ltd., 621p. Hoequist, C.J. (1983) Durational correlates of linguistic rhythm categories, Phonetica, 40, pp. 19-31. Horgues, C. (2005) Contribution ltude de laccent franais en anglais. Quelques caractristiques prosodiques de langlais parl par des apprenants francophones et leur valuation perceptive par des juges natifs, Actes des VIIImes RJC ED268 Langage et langues, Paris III, 21 mai 2005. Imoto, K. ; Tsubota, Y. ; Raux, A. ; Kawahara, T. ; Dantsuji, M. (2002) Modeling and Automatic Detection of English Sentence Stress for Computer-Assisted English Prosody Learning System, 7th International Conference on Spoken Language Processing-ICSLP, Denver, Colorado, USA. Jakobson, R. (1941) Kindersprache, Aphasie und allgemeine Lautgesetze, Sprkvetenskapliga Sllskapets I Uppsala Frhandlingar, Uppsala: Uppsala Universitetet. English translation: Child Language, Aphasia and Phonological Universals, The Hague & Paris: Mouton, 1968. James, E. (1972) Lacquisition des faits prosodiques laide dun visualiseur de mlodie, Thse de 3me cycle, Universit de Provence. James, E. (1976) The Acquisition of Prosodic Features of Speech Using a Speech Visualizer, International Review of Applied Linguistics in Language Teaching, 14 (3), pp. 227-243. James, E. (1977) The Acquisition of a Second-Language intonation Using a Visualizer, Canadian Modern Language Review, 33 (4), pp. 503-506. Jassem, W. (1952) Stress in Modern English, Bulletin de la socit polonaise de linguistique, fascicule XI, Poland / Croatie.
tel-00455248, version 1 - 9 Feb 2010
221
Jilka, M. (2000) The Contribution of Intonation to the Perception of Foreign Accent, Doctoral Dissertation, Arbeiten des Instituts fr Maschinelle Sprachverarbeitung (AIMS), 6 (3), University of Stuttgart. Jun, S.A. (2005) Prosodic Typology: The Phonology of Intonation and Phrasing, New York: Oxford University Press, 466p. Kacmarek, L. (1953) Ksztaltowanie Sie Nowy Dziecka, Poznan, towarzystwo Przyjaciol Nauk. Kent, R.D. (1976) Anatomical and neuromuscular maturation of the speech mechanism: evidence from acoustic studies, Journal of speech and hearing Research, 19, pp. 421-444. Kent, R.D. ; Mitchell, P.R. ; Sancier, M. (1991) Evidence and Role of Rhythmic Organization in Early Vocal Development in Human Infants, in The Development of Timing Control and Temporal Organization in Coordinated Action, J.Fagard & P.H. Wolff editors, 81, pp.135-149. Klein, W. (1989) Lacquisition de langue trangre, Paris, Armand Colin, 251p. Kochanski, G. ; Grabe, E. ; Coleman, J. (2004) The difference between a question and a statement: a survey of English dialects. The Journal of the Acoustical Society of America 115(5), pp. 23-98 Kohler, K.J. (1982) F0 In The Production Of Lenis And Fortis Plosives, Off-print, Phonetica, 39, pp. 199-218. Kohler, K.J. (1991) The Phonetics Phonology Issue in the Study of Articulatory Reduction, Phonetica, pp. 180-192. Kommissarchik, J. ; Kommissarchik, E. (2000) Better Accent Tutor, Analysis and visualization of speech prosody, Proceedings of InSTIL 2000, Dundee, Scotland, pp. 86-89. Konopczynski, G. (1986) Du prlangage au langage : acquisition de la structure prosodique, Thse dEtat, Universit de Strasbourg. Konopczynski, G. (1979) Le statut de la prosodie dans les recherches sur l'acquisition du langage : Rflexions sur les corpus, in Lon, P. ; Rossi, M., Problmes De Prosodie, vol. 1: Approches Thoriques, 1979, pp. 57-70. Konopczynski, G. (1990) Le langage mergent : caractristiques rythmiques, Hamburg :Buske (Beitrage zur Phonetik une Linguistik ; Bd.60). Konopczynski, G. (1999) Lacquisition du systme prosodique de la langue maternelle et ses implications pour lapprentissage dune L2. in Delcloque, Philippe, p 62-70.
222
tel-00455248, version 1 - 9 Feb 2010
Krashen, S. (1981) Second Language acquisition and learning, Oxford, Pergamon Press, 150 p., tlchargeable partir de: http://www.sdkrashen.com/SL_Acquisition_and_Learning/index.html. Kuhl, P.K. (1998) Effects of language experience on speech perception, Journal of Acoustical Society of America, 103, pp. 29-31. Kuhl, P.K. (2000) A new view of language acquisition, Proceedings of the National Academy of Science, 97, pp.11850-11857. Ladefoged, P. (1975) A Course in Phonetics. New York, NY, USA : Harcourt Brace Jovanovich, Inc., 296p. Landercy, A. ; Renard, R. (1977) Elments de Phontique, Didier, Bruxelles, 214p. Lane, H. ; Buiten, R. (1965) A preliminary manual for the speech auto-instructional device, Behavior Analysis Laboratory, Progress Report n5, nov. 1, University of Michigan. LAVAC (version 4.03.i-1999). LAVAC (Laboratoire Vido Actif Comparatif) a t conu par Tony Toma. diteur C3 : Montpellier. Consult en novembre 1999 : http://www.alizes.fr/cp3i. Lecanuet, J. P. (1995) L'audition auditive prnatale, In : I. Delige & J. A. Sloboda Naissance et dveloppement du sens musical, Paris : PUF. Lado, R. (1957) Linguistics across Cultures, Ann Arbor, MI: University of Michigan Press, 141p. Laurendeau, J. (1990) Maurice Martenot, luthier de l'lectronique, CroissyBeaubourg, Dervy-Livres. Le Robert (2000) Dictionnaire historique de la langue franaise, Maury-eurolivres, Manchecourt, p.28. Lehiste, I. (1977) Isochrony reconsidered, Journal of Phonetics, 5 (3), pp. 253-263. Lon P. & Martin P. (1971) Linguistique applique et enseignement de lintonation, Etudes de Linguistique applique, n3, p. 36-45. Leopold, W.F. (1948) The Development of Descriptive Linguistics in America 1925-1956, German Ch., In JOOS, Martin (ed), Reading in Linguistics, vol. 1, pp. 215-216. Lepetit, D. (1992) Intonation franaise: enseignement et apprentissage, coll.Etudes Phontiques, Studies in Phonetics, 1, Toronto, Canada: Canadian Scholars Press, 113p.
tel-00455248, version 1 - 9 Feb 2010
223
Lester, B. (1985) Introduction: theres more to crying than meets the ear, In Infant Crying:Theoretical and Research perspectives, New York, B. Lester & C.F.Z. Boukydis editors, Plenum Press. Lewis, M.M. (1936) Infant Speech: a study of the beginnings of language, the International Journal of Psychoanalysis, 18, pp. 324-325. Liberman, A.M. ; Cooper, F.S ; Shankweiler, D.P. ; Studdert-Kennedy, Y.M. (1967) Perception of Speech code, Psychological Review, 74 (6), pp. 13-50. Liberman, M. ; Prince, A. (1977) On Stress and Linguistic Rhythm, Linguistic Inquiry n8, pp. 249336. Lin, H. ; Wang, Q. (2005) Vowel quantity and consonant variance: a comparison between Chinese and English, In proceedings of Between Stress and Tone, Leiden, June 2005.
tel-00455248, version 1 - 9 Feb 2010
Lin, H. & Wang, Q. (2007) Mandarin Rhythm: An Acoustic Study, Journal of Chinese Language & Computing, 17 (3), pp. 127-140. Llorca, R. (1998) Relations rythmiques entre geste et parole: Application la pdagogie et au spectacle, in Guiatella et al. eds, Orage 98, Paris, LHarmattan. Lloyd James, A. (1940) Speech Signals in Telephony, London Lopez, G. ; Prodeau, M. ; Herry-Benit, N. ; Tortel, A. From assessing levels to analysing the productions, ( paratre) Loukina, A. ; Koschanski, G. ; Shih, C. ; Keane, E. ; Watson, I. (2009) Rhythm measures with language independent segmentation, Proceedings of Interspeech conference 2009, Brighton, England. Low, E. ; Grabe, E. ;Nolan, F. (2000) Quantitative characterizations of speech rhythm: Syllable-timing in Singapore English, Language and Speech, vol. 43, pp. 377-401. Luangthongkum, T. (1977) Rhythm in Thai, doctoral dissertation, University of Edinburgh. Lyster, R. (2001) Negotiation of form, recasts, and explicit correction in relation to error types and learner repair in immersion classrooms, Language Learning 51 (1), pp.265-301. Mackey, W.F. (1965) Language Teaching Analysis, Longman, London, 554p. Magen, H.S. (1998) The Perception of Foreign Accented Speech, In WALLEY, Amanda C., FLEGE, James E., Journal of Phonetics, pp.381-400.
224
Mak B., Siu M. ; Ng M. ; Tam Y. ; Chan Y. ; Chan K. ; Leung K. ; Ho S. ; Chong F. ; Wong J. ; Lo J. (2003) PLASER: pronunciation learning via automatic speech recognition, Proceedings of the HLT-NAACL 03 workshop on Building educational applications using natural language processing - Tome 1, pp. 23 -29. Major, R.C. (2001) Foreign Accent: The Ontogeny and Phylogeny of Second Language Phonology, Mahwah (NJ.): Lawrence Erlbaum Associates, 211p. Martin, P. (2005) Winpitch LTL, un logiciel multimdia denseignement de la prosodie, Alsic, 8 (2), pp.95-108. Marieb, W.F. (1993) Anatomie et physiologie humaine, De Boeck-Wesmael S.A., seconde dition, pp.382-389. Markus, D. ; Bond, D. ; Stockmal, V. (2003) Measures of Native and non-native Rhythm in a Quantity Sensitive Language, University of Latvia, Riga ; Universit dOhio, pp.1-11. Marty, F. (1983) Les enseignants de langues face lEnseignement Assist par Ordinateur, Le Journal de la Formation Continue et de lEAO, 169, 10/12/1983. Mauranen, A. (2004) Speech Corpora in the classroom, in G.Aston et al. (eds.), Corpora and Language Learners, Amsterdam, John Benjamins, pp. 95-211. Mehler, J. ;Jusczyk,P. ; Lambertz, G. ; Halstead, N. ;Bertoncini, J. ;Amiel-Tison, C. (1988) A precursor of language acquisition in young infants, Cognition, vol. 29, pp. 143-178, dans Hall, P ; (1999) Acquisition du langage: spcialisation des enfants dans leur langue maternelle, 3e Congrs International du Rythme : le rle du rythme pour le dveloppement humain, Institut Jacques-dalcroze, Genve. Mennen, I. (2006) Phonetic and phonological influences in non-native intonation: an overview for language teachers, Working Papers Queen Margaret University College 9. Meumann, E. (1894) Untersuchungen zur Psychologie u. Aesthetik d. Rhythmus, Philos.Stud., vol. 10, pp. 249-322. Miller, JL. Grosjean, F. & Lomanto, C. (1984) Articulation rate and its variability in spontaneous speech: a reanalysis and some implications, Phonetica, 41 (4), p. 215 Millot, JL. (1985) Contribution ltude des interactions entre le nouveau-n et son environnement social. Aspects somesthsiques et acoustiques, Thse dEtat, Universit de Besanon.
tel-00455248, version 1 - 9 Feb 2010
225
Minematsu, N. ; Fujisawa, Y. ; Nakagawa, S. (1999) Automatic detection of stressed syllables in English words using HMM and its application to prosodic evaluation of pronunciation proficiency, Trans. IEICE, J82-D-II (11), pp.1865-1876. Montredon J., et al., (1975) Cest le printemps 1, Paris, Cl international. Munro, M.J. ; Derwing, T.M. (1995) Foreign-Accent, Comprehensibility, and Intelligibility in the Speech of Second Language Learners. Language Learning, vol. 45 (2), pp. 73-97. Munro, M.J. ; Derwing,T. (1998) Evidence in Favor of a Broad Framework for Pronunciation Instruction, Language Learning, 48 (2), pp. 393-410. Munro, M.J. ; Derwing, T.M. (2001) Modeling perceptions of the accentedness and comprehensibility of L2 speech: the role of speaking rate, Studies in Second Language Acquisition, 23, pp.451-468.
tel-00455248, version 1 - 9 Feb 2010
Murray, G.L. (1999) Autonomy and language learning in a stimulated environment, System 27(3), pp.295-308. Myers, G. & Myers, M. (1984) Les Bases De La Communication Interpersonnelle. Une Approche Thorique Et Pratique, Montral, Canada : McGraw-Hill, 470 p. (Original : "The Dynamics of Human Communication". Traduit par P. Racine). Nava, E. ; Goldstein, L. ; Saltzman, E. ; Nam, H. ; Proctor, M. (2008) Modeling prosodic rhythm: evidence from L2 speech, Journal of Acoustical Society of America, 124 (4), pp. 2577-2577. Nazzi, T. ; Jusczyk, P.W. ; Johnson, E.K. (2000) Language discrimination by English learning 5-month-olds: effect of rhythm and familiarity, Journal of Memory and Language, n43, pp.1-19. Neri, A. ; Cucchiarini, C. ; Strik, H. ; Boves, L. (2002) The pedagogy-technology interface in computer assisted pronunciation training, Computer Assisted Language Learning, 15 (5), pp. 441-467. Nespor, I. (1990) On the rhythm parameter in phonology, In Logical issues in Language Acquisition (I.Roca, editor), Dordrecht: Foris, pp. 157-175. Neumeyer, L. ; Franco, H. ; Abrash, V. ; Julia, L.. Ronen, O. ; Bratt, H. ; Bing, J. ; Digalakis, V. ; Rypa, M. (1998): "Webgrader(TM): a multilingual pronunciation practice tool", In STiLL Speech Technology in Language Learning, pp. 61-64. Nicaise, A. ; Grey. M. (1998) Lintonation de langlais, Paris : Nathan universit, 128p.
226
Nikolov, R., Dommergues, J.-Y. et Ryst. E. (2007) SaRP : un outil de reprsentations graphiques multi-points et multi-sries des formants vocaliques, Scientific Works, vol. 45, Book 1, Philology, Plovdiv University "Passii Hilendarski", Bulgaria. Norris et al. (1995) Competition and segmentation in spoken word recognition, Journal of Experimental Psychology : Learning, Memory and Cognition, 21, pp. 1209-1228. OConnor, J.D., Tooley, O. (1961) The Perceptibility Of Certain Word Boundaries, In ABERCROMBIE, David ; FRY, D.B. ; MACCARTHY, P.A.D. ; SCOTT, N.C. et al. (eds), In Honour Of Daniel Jones. Papers Contributed On The Occasion Of His Eightieth Birthday: 12 September 1961, pp. 171-176. Oller, D.K. (1978) Infant vocalization and the development of speech, Allied Health and Behavioral Sciences 1, pp.523-549.
tel-00455248, version 1 - 9 Feb 2010
Pettito, L.A. & Marantette, P.F. (1991) Babbling in the Manual Mode: Evidence for the Ontogeny of Language, Science n 251, pp. 1493-1496. Piaget, J. (1950) Introduction lpistmologie gntique, Payot, Paris. Pike, K. (1945) The Intonation of American English. Ann Arbor, MI, USA: The University of Michigan Press, 203p. Platon, Les Lois, livre II, ed. Flammarion, 2006, traduction de L. Brisson & JF. Pradeau, pp. 114-159. Platt, J.T. & Weber, H. (1980) English in Singapore and Malaysia: Status, Features and Functions. Kuala Lumpur: Oxford University Press. Poqulin, M. (2009) Phonological issues in the production of prosody by francophone and sinophone learners of English as a second language, Thse de Doctorat, Universit de Qubec, Montral Pritchard, R. (1985) The Teaching of French Intonation to Native Speakers of English, International Review of Applied Linguistics, vol. 23 (2), p. 117-147. Pulgram, E. (1970) Syllable, word, nexus, cursus, La Haye, Pays-Bas, Mouton & Co., 174p. Querleu, O.D., Renard, X. (1981) Perception auditive et rcativit ftale aux stimulations sonores, Journal Gynecol, Obstet, Biol. Repr. n 10, pp. 307314. Ramus, F. (1997) Le Rle du Rythme pour la Discrimination des Langues. Actes des JIOSC 97, pp 225-229.
227
Ramus, F. ; Mehler, J. (1999) Language identification with suprasegmental cues: a study based on speech synthesis, Journal of the Acoustic Society of America, 105 (1), pp. 512-521. Rasier, L. ; Hiligsmann, P. (2007) Prosodic transfer from L1 to L2. Theoretical and methodological issues, Nouveaux cahiers de linguistique franaise 28, pp.4166. Revis, J. (2004) Lanalyse perceptive des dysphonies : approche phontique de lvaluation vocale, thse de doctorat, Universit de la Mditerrane, Marseille. Richards, J.C. (1971) A Non-Contrastive Approach to Error Analysis, English Language Teaching 25, pp. 204-219. Roach, P. (1982) On the Distinction between "Stress Timed" and "syllable Timed" Languages. In CRYSTAL, David (ed.), Linguistic Controversies. Essays In Linguistic Theory And Practice, In Honour Of F.r. Palmer, 1982, pp. 73-79 Roach, P. (1991) English Phonetics and Phonology, Cambridge University Press, 262p. Rondal, J.A. (1983) L'interaction adulte-enfant et la construction du langage, Coll. Psychologie et Sciences Humaines. Bruxelles, Belgique : Mardaga, 197p. (Ddi Art Staats). Rost, M. (2002) Teaching and Researching Listening, Harlow:Pearson, 328p. Russo, M. ; Barry, J. (2008) Isochrony reconsidered. Objectifying relations between rhythm measures and speech tempo, In: Proceedings of Speech Prosody 4: 08, pp. 419-422. Santacroce, M. (2002) Informatique, numrique et multimdia : quelques mythes rcurrents en didactique des langues, Travaux Interdisciplinaires du Laboratoire Parole et Langage dAix-en-Provence (TIPA), 21, pp. 121-151. Santerre, L. (1989) Peut-on juger de la production par la perception? (ou faut-il en croire ses oreilles?), Mlanges de phontique gnrale et exprimentale offerts Pla Simon, vol. 2, Publications de l'Institut de phontique de Strasbourg, pp. 735-755. Schmidt, E.N. (1939) Uber den Aufbau rhythmischer Gestalten, N. Psychology studies, n14, in Fraisse (1956). Selinker, L. (1972) Interlangue, IRAL, n10, pp. 209-231.
tel-00455248, version 1 - 9 Feb 2010
228
Selkirk, E. (1984) On the Major Class Features and Syllable Theory. In LIEBER, Rochelle, Consonant Gradation In Fula: An Autosegmental Approach, pp. 107-136. Smith, D.M. (1973) Creolization and language ontongeny: a premiminary paradigm for comparing language socialization and language acculturation, New ways of analyzing variation in British English, Washington, Georgetown University. Smith, A. (1976) The timing of French, with reflections on syllable timing, Work in Progress 9, Edinburgh University Department of Linguistics, pp.97-108. Stampe, D. (1969) The acoustic of the phonetic representation, in Papers from the Fifth Regional Meeting of the Chicago Linguistics Society, Chicago, IL: Chicago Linguistics Society, pp. 433-444. Steele, J. (1779) Prosodia Rationalis, or An Essay towards Establishing the Melody and Measure of Speech, to be Expressed and Perpetuated by Peculiar Symbols, 2nd edition amended and enlarged. London: J. Nichols [Kessinger Publishing, 2008], 268p. Stenton, A. ; Pchou, A. ; Vaillant-Sirdey, C. ; Tricot, A. (2005) Effet du double codage synchrone de laccentuation en L2 selon les modalits de restitution du sujet, communication au 1er colloque international de didactique cognitive, Toulouse, 26-28 janvier 2005. Stockmal, V. ; Markus, D. ; Bond, D. (2005) Measures of Native and Non-Native Rhythm in a Quantity Language, Language and Speech, 48 (1), pp. 55-63. Taniguchi, M. ; Abberton, E. (1999) Effect of interactive visual feedback on the improvement of English intonation of Japanese EFL learners, Speech, Hearing and Language:, Work in progress, n11, pp. 76-89. Tanner, M.W. ; Landon, M.M. (2009) The effects of computer-assisted pronunciation readings on ESL learners use of pausing, stress, intonation and overall comprehensibility, Brigham Young University, Language Learning and Technology, 13 (3), pp. 51-65. Tarone, E. ; Frauenfelder, U. ; Selinker, L. (1978), The Phonology of Interlanguage, in Richards, J.C., ed., pp. 15-33. Teixieira, C. ; Franco, H. ;Shriberg,E. ; Precoda, K. ; Sonmez,K. (2000) Prosodic Features for Automatic Text-Independent Evaluation of Degree of Nativeness for Language Learners, ICSLP-6th International Conference on Spoken Language Processing, Beijing, China, October 2000. Thelen, E. (1979) Rhythmical behavior in infancy: an ethological perspective, Development Psychology, n17, pp. 237-257.
229
tel-00455248, version 1 - 9 Feb 2010
Tongue, R.K. (1979) The English of Singapore and Malaysia, Singapore: Eastern Universities Press. Toivanen, J. (2003) Tone choice in the English intonation of proficient non-native speakers, Media Team, Unmea University, PHONUM 9, pp.195-168. Tomatis, A. (1971) Education et dyslexie, Paris, France : Editions ESF, 201p. Tortel A. (2004) Evaluation of intonation and rhythm of French and Native speakers, mmoire de master I, Universit de Provence. Tortel, A. (en cours) DIALANG: valuation de la proposition de diagnostic Trofinovitch, P. ; Baker, W. ; Mack, M. (2001) Context -and Experienced- Based Effects on the Learning of Vowels in a Second Language, Studies in the Linguistic Sciences, 3 (2), pp. 167-186. Troubetzkoy, N. S. (1949) Principes de Phonologie, Klincksieck, Paris, 396p.
tel-00455248, version 1 - 9 Feb 2010
Vaissire, J. (1989) On automatic extraction of prosodic information for automatic speech recognition system, Eurospeech 98, European Conference on Speech communication and technology, Paris, vol. 1, pp.202-205. Van Santen, J.P.H. ; Tucker Prudhommeaux, E. ; Black, L.M. (2009) Automated assessment of prosody production, Speech Communication, 51 (11), pp.10821097. Vardanian, R.M. (1964) Teaching English through oscilloscope displays, Language Learning, 3/4, pp. 109-117. Wagner, P. ; Dellwo,V. (2004) Introducing YARD (Yet Another Rhythm Determination) And Re-introducing Isochrony to Rhythm Research, In: Proceedings of Speech Prosody 2:04, Nara, Japan. Wang, H. ; Waple, C.J. ; Kawahara, T. (2009) Computer Assisted Language system based on dynamic question generation and error prediction for automatic speech recognition, Speech Communication 51 (10), pp.995-1005. Weber, G. (1997). The Worlds 10 most influential Languages, Language Today, 3, pp.12-18. Weinreich, U. (1953) Languages in contact. Findings and problems, New York, La Haye, Pays Bas:Mouton & Co., 148p. Wenk, B. J. (1985) Speech rhythm and second language acquisition, Language and Speech, vol. 28 (2), pp. 157-175.
230
Wenk, B.J. ; Wioland (1982) Speech Rhythms In Second Language Acquisition, in Tjaden, K. , avril-juin 1985, pp. 157-176. White, L. ; Mattys, SL. (2007) Calibrating rhythm: First language and second language studies, Journal of Phonetics, 35(4), pp 501-522. Whitworth, N. (2002) Speech Rhythm Production in Three German-English Bilingual Families, Leeds Working Papers in Linguistics & Phonetics, D. Nelson editors, n 9, pp.176-205. Williams, R. and Herrup, K. (2001) The Control of Neuron Number, The Annual Review of Neuroscience, n 11, pp. 423453. Wolff, P. (1969) The natural history of crying and other vocalizations in early infancy, In Determinants of Infant Behaviour, vol. 4, B.M. Foss editors, London: Methuen.
tel-00455248, version 1 - 9 Feb 2010
Ouvrages ou articles consults Astolfi, J.P. (2006) Lerreur, un outil pour enseigner, Paris, ESF, 117p. DeBoysson Bardies, B. (1996) Comment la parole vient aux enfants, de la naissance jusqu' deux ans, (ed) Odile Jacob, Paris, France, 289p. Faure, G. (1975) Manuel Pratique danglais parl, Hachette, 208p. Krashen, S. (1985) The Input Hypothesis: Issues and Implications, Longman, Harlow Essex, England, 120p. Mc Laughlin, B. (1987) Theory of Second Language Learning, Ed. Arnold, 184p. Malherbe, M. (1982) Les langages de lhumanit, Seghers, Paris, 444p.
231
RESUME
Labsence de systme dvaluation de la prosodie de langlais L2 parl par des apprenants francophones a motiv la ralisation de ce travail de thse. Ds lors, lanalyse de facteurs rythmiques dans la production dapprenants franais, qui fait lobjet de cette recherche, a un double objectif : analyser linfluence du rythme de la langue maternelle (L1=franais) sur la langue cible (L2=anglais), et dautre part, proposer des critres valuatifs du rythme des productions des francophones, partir de diffrentes mtriques rythmiques proposes dans la littrature. Ces travaux ont men llaboration dune base de donnes danglais L1/L2 nomme ANGLISH, partir de laquelle nous avons montr une discrimination des locuteurs natifs/non natifs sappuyant sur la combinaison de paramtres rythmiques. Les rsultats de ces travaux de recherche montrent donc quil est possible de distinguer la L1 de la L2, et de donner une tendance rythmique des productions des apprenants francophones.
_____________________________________________________________
tel-00455248, version 1 - 9 Feb 2010 Mots-clefs: prosodie, rythme, mtriques, anglais, L1 & L2, apprenants francophones, valuation, critres rythmiques, corpus dapprenants TITLE: Qualitative evaluation of prosody of French learners: contribution to prosodic characterisation
SUMMARY
This thesis was motivated by the absence of systems of evaluation of the prosody of English spoken by French learners. The main aim of our research was to analyse rhythmic factors in the production of French learners with two objectives: first of all, to analyse the influence of the mother tongues rhythm (L1=French) on the target language (L2=English), but also to provide evaluative criteria for French speakers based on various rhythmic metrics proposed in the literature. This led to the elaboration of a database of English L1 / L2, ANGLISH, which enabled us to distinguish between native and non-native speakers by using a combination of rhythmic parameters. The results of this research show that it is possible to distinguish between L1 and L2 rhythm, and to foresee the rhythmic tendencies in the productions of French-speaking learners. Key-words: prosody, rhythm metrics, English, L1 & L2, French learners, evaluation, rhythmic criteria, learners corpus
UFR LACS
Formation doctorale: Cognition, Langage, Education

LABORATOIRE PAROLE ET LANGAGE (LPL) UMR 6057 CNRS /Universit de Provence 5, avenue Pasteur 13100 Aix-en-Provence, France
232

THAnneTORTEL Versionfinale

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

THAnneTORTEL Versionfinale

Transféré par

Droits d'auteur :

Formats disponibles

DOCTORAT Aix-Marseille Universit Universit de Provence U.F.R.

THESE DOCTEUR DAIX-MARSEILLE UNIVERSITE

EVALUATION QUALITATIVE DE LA PROSODIE DAPPRENANTS FRANCAIS : APPORT DE PARAMETRISATIONS PROSODIQUES

Monsieur Daniel HIRST

tel-00455248, version 1 - 9 Feb 2010

THESE DOCTEUR DAIX-MARSEILLE UNIVERSITE

tel-00455248, version 1 - 9 Feb 2010

EVALUATION QUALITATIVE DE LA PROSODIE DAPPRENANTS FRANCAIS : APPORT DE PARAMETRISATIONS PROSODIQUES

Monsieur Daniel HIRST

tel-00455248, version 1 - 9 Feb 2010

tel-00455248, version 1 - 9 Feb 2010

tel-00455248, version 1 - 9 Feb 2010

Table des matires

tel-00455248, version 1 - 9 Feb 2010

tel-00455248, version 1 - 9 Feb 2010

Elments neurophysiologiques ..................................................................................................... 71 Approche exprimentale ............................................................................................................... 72

Emergences de structures sonores ........................................................................................... 73

Vocalisation et babillage .......................................................................................................... 77

Acquisition de la structure rythmique ...................................................................................... 79

2.4 ACQUISITION DU RYTHME DE LA LANGUE SECONDE ........................................................... 86

Analyse et constat ..................................................................................................................... 86 Approches pdagogiques dans lenseignement L2 ................................................................... 87

tel-00455248, version 1 - 9 Feb 2010

L1 source dinfluence de la L2 ................................................................................................. 92

Approches lectroniques non conventionnelles : la perception au cur du problme ............. 98

Nouvelles technologies : phontique et multimdia.................................................................... 111

tel-00455248, version 1 - 9 Feb 2010

tel-00455248, version 1 - 9 Feb 2010

tel-00455248, version 1 - 9 Feb 2010

Table des figures

Table des tableaux

(iii) un entranement intense la perception et production de la L2.

tel-00455248, version 1 - 9 Feb 2010

tel-00455248, version 1 - 9 Feb 2010

Section 1. Aspects thoriques

tel-00455248, version 1 - 9 Feb 2010

tel-00455248, version 1 - 9 Feb 2010

CHAPITRE 1. INTRODUCTION A LA NOTION DE

tel-00455248, version 1 - 9 Feb 2010

1991 by Chronicle Features, from Fromkin & Rodman (1998)

1.1 Prsentation gnrale

1.1.1 Introduction et dfinition

1.1.2 Rythme : systme organisateur de la prosodie

1.1.3 Le rythme : la bte noire de lapprenant ?

absence de rduction vocalique langue accent fixe isosyllabique

langue accent libre

1.2 Le rythme de la parole

1.2.2 Classification des langues : volution du concept

tel-00455248, version 1 - 9 Feb 2010

les langues dites rythmicit accentuelle (ou stress-timed ) : le rythme se base

langues accentuelles anglais allemand arabe nerlandais russe polonais tha

Tableau 2. Classement des diffrentes langues selon leur classe rythmique

tel-00455248, version 1 - 9 Feb 2010

tel-00455248, version 1 - 9 Feb 2010

1.2.3 Propositions de mtriques rythmiques

tel-00455248, version 1 - 9 Feb 2010

tel-00455248, version 1 - 9 Feb 2010

tel-00455248, version 1 - 9 Feb 2010

tel-00455248, version 1 - 9 Feb 2010

CHAPITRE 2. ACQUISITION DUNE LANGUE

tel-00455248, version 1 - 9 Feb 2010

2.1 Introduction gnrale

tel-00455248, version 1 - 9 Feb 2010

2.1.2 Origine du rythme dans le langage : horloge interne