Vous êtes sur la page 1sur 21

Transcrire et analyser les corpus dinteractions

adulte-enfant
Christophe Parisse, Aliyah Morgenstern

To cite this version:


Christophe Parisse, Aliyah Morgenstern. Transcrire et analyser les corpus dinteractions adulteenfant. Edy Veneziano, Anne Salazar Orvig, Josie Bernicot. Acquisition du langage et interaction, LHarmattan, pp.201-222, 2010. <halshs-00531693>

HAL Id: halshs-00531693


https://halshs.archives-ouvertes.fr/halshs-00531693
Submitted on 10 Jan 2012

HAL is a multi-disciplinary open access


archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from
teaching and research institutions in France or
abroad, or from public or private research centers.

Larchive ouverte pluridisciplinaire HAL, est


destinee au depot et `a la diffusion de documents
scientifiques de niveau recherche, publies ou non,
emanant des etablissements denseignement et de
recherche francais ou etrangers, des laboratoires
publics ou prives.

A paraitre dans Transcrire et analyser les corpus denfant. In Edy


Veneziano, Anne Salazar Orvig, Josie Bernicot Eds, Acquisition du
langage et interaction. Paris : LHarmattan

Transcrire et analyser les corpus dinteractions adulteenfant


Christophe Parisse et Aliyah Morgenstern
MoDyCo, INSERM et Universit Sorbonne Nouvelle - Paris 3

Introduction
Ce chapitre a pour objectif de partager avec nos lecteurs le fruit
de la rflexion que nous menons depuis des annes sur le recueil, la
transcription, le codage et lanalyse des productions spontanes des
enfants en interaction et sur les outils informatiss qui sont utiliss
dans les travaux sur lacquisition. Nous esprons ainsi aider de
jeunes collgues entrer dans la communaut des chercheurs de
terrain qui font de la linguistique de corpus et partagent des
donnes de qualit, ce qui pourra ainsi faire avancer notre
connaissance gnrale sur le langage de lenfant.
Nous pensons que mme si les situations exprimentales
prsentent un grand intrt, le corpus spontan des productions des
enfants en interaction est fondamental pour comprendre
lappropriation progressive du langage comme la en particulier
montr Brown (1973). Ce type de corpus permet de garantir que
lon analyse les productions langagires dans des situations
naturelles et de tester ainsi les limites des thories que nous
utilisons et des hypothses que nous posons. Il nous permet
galement de nous laisser surprendre par les productions
langagires et dobserver limprvu, tout en nanalysant que ce qui
existe rellement et non les crations du chercheur.
Par ailleurs, le travail sur les productions spontanes de lenfant
dans un contexte dialogique montre quil sagit dune situation
exemplaire pour
- travailler sur un corpus ORAL avec tous les problmes
techniques et scientifiques que cela pose ;
- avoir des donnes vidos et textuelles via les transcriptions et les
avoir alignes ;
- comprendre la nature interprtative des codages, mais aussi du
langage.
De nos jours, les chercheurs qui travaillent sur des suivis
longitudinaux denfants en milieu naturel peuvent filmer les
1

A paraitre dans Transcrire et analyser les corpus denfant. In Edy


Veneziano, Anne Salazar Orvig, Josie Bernicot Eds, Acquisition du
langage et interaction. Paris : LHarmattan

enfants leur domicile. Les enregistrements sont ensuite transcrits


et informatiss. Mais, si lacquisition du langage est sans doute le
premier domaine dans lequel on a systmatiquement utilis des
donnes conversationnelles spontanes, avant de pouvoir sappuyer
sur toutes ces technologies, les premiers observateurs du langage
enfantin avaient adopt une autre mthode de recueil des donnes :
la mthode du journal (Morgenstern, sous presse). Les journaux
des scientifiques de la fin du dix-neuvime sicle et du dbut du
vingtime sicle avaient lextraordinaire avantage de permettre au
chercheur, le plus souvent lun des parents de lenfant, de faire des
descriptions quotidiennes. Certains scientifiques ont dailleurs tenu
des journaux sur leurs propres enfants, notamment entre la fin du
XIX et le dbut du XX sicle (Taine 1976, Darwin 1977). Les
tudes de cas, dtailles, approfondies, ancres dans la ralit
quotidienne permettent de rendre compte du dveloppement de
lenfant, de mettre au jour les liens entre le langage, la cognition, le
psychisme, et le dveloppement moteur. Depuis les annes 1950, le
magntophone, puis le camscope ont rvolutionn la discipline et
depuis les annes 1980, sajoute encore la possibilit dutiliser des
logiciels pour faire des transcriptions informatiss, puis daligner
les transcriptions avec le document source (enregistrement audio
ou vido) et de mutualiser facilement les donnes par internet.
Quand on transcrit des corpus dinteractions adulte-enfant, et en
particulier si lon veut faire mettre les corpus disposition dautres
chercheurs, il est ncessaire de prendre en compte diffrents
domaines danalyse et des approches varies qui concernent les
productions de lenfant, ou de ladulte, en prenant en compte le
niveau prosodique, phonologique, phontique, morpho-syntaxique,
pragmatique, discursif mais aussi le non verbal (gestes, regards,
mimiques, actions, manipulations dobjets, jeux, routines) et le
contexte extra-linguistique (situations diverses). Aussi avons-nous
intrt faire la description la plus fine possible du contexte extralinguistique tout en gardant en parallle lalignement des
transcriptions et des enregistrements vidos (Morgenstern, Parisse
2007).
Sil est ncessaire de rassembler des bases de donnes les plus
riches possibles de suivis longitudinaux denfants en interaction, il
est galement important de constituer son propre corpus afin de
donner vie sa recherche dans la relation que nous nouons avec
2

A paraitre dans Transcrire et analyser les corpus denfant. In Edy


Veneziano, Anne Salazar Orvig, Josie Bernicot Eds, Acquisition du
langage et interaction. Paris : LHarmattan

lenfant et sa famille. Quand on pntre dans le milieu familial, et


que lon occupe soi-mme la position dobservateur, on doit
chercher sy sentir bien, en tester les limites, tre accept et ne
pas faire intrusion. Ce processus dajustement la situation de
terrain permet dentrer concrtement dans lactivit de recherche.
Le fait de donner une existence officielle cette activit de recueil
de donnes en faisant signer un document lgal dautorisation
parentale est une manire de sassurer une lgitimit et de donner
corps au corpus et au monde de la recherche que nous
reprsentons auprs de la famille qui nous a accepts. Cest ainsi
que la relation que nous avons noue avec la famille et qui sinscrit
dans le temps, sinscrit galement dans lespace scientifique.
Nous prsenterons tout dabord les raisons que lon peut avoir
de transcrire du corpus longitudinal avec des outils informatiss.
Nous discuterons galement les problmes que posent la fiabilit
des transcriptions et leur ct subjectif quil est impossible de nier
ou dradiquer. Toute transcription est en effet le rsultat des
positions thoriques et de linterprtation du chercheur. Nous
parlerons ensuite des mthodes de transcription et des choix
scientifiques quil est important de faire. Nous finirons ce chapitre
sur la ralisation pratique de transcriptions et sur les possibilits
quouvre linteroprabilit des logiciels de transcription en vue de
recherches pluridisciplinaires et multimodales sur les mmes
donnes.
1. Transcrire avec des moyens modernes
1.1. Pourquoi transcrire avec des moyens modernes?
Il est de nos jours absolument ncessaire de transcrire ses
enregistrements audio ou vido avec des outils informatiss. Ces
outils peuvent sembler fastidieux au premier abord, effrayer le
novice, mais ils rendent le travail du transcripteur beaucoup plus
confortable et rigoureux. Ils permettent daller plus vite une fois
quon les matrise, dutiliser des formats de codage normaliss, de
faire des analyses de frquence et surtout daligner les
transcriptions avec les enregistrements, ce dont on ne saurait
aujourdhui se passer. Grce ces outils informatiss, on se donne
galement les moyens dentrer dans une communaut
3

A paraitre dans Transcrire et analyser les corpus denfant. In Edy


Veneziano, Anne Salazar Orvig, Josie Bernicot Eds, Acquisition du
langage et interaction. Paris : LHarmattan

internationale de chercheurs qui mutualisent leur donnes via


internet, de prenniser les donnes et on apporte sa pierre la
construction des connaissances sur le langage en gnral et le
langage de lenfant en particulier.
Linterprtation des productions enfantines est difficile et
souvent subjective en raison de la distance entre les noncs des
enfants et la reprsentation que nous avons du langage oral, venues
souvent de notre apprentissage et utilisation du langage crit et de
ses normes. Transcrire du langage enfantin est une excellente cole
pour comprendre la nature multi-modale de la communication
langagire en situation. En effet, si la distance entre productions et
transcriptions semble se rduire mesure que lenfant grandit, elle
nest jamais abolie et il faudra toujours se servir des indices suprasegmentaux, visuels et extra-linguistiques pour donner un sens et
une forme aux donnes. Faut-il interprter ? Cest une particularit
forte du type de discours et dinteraction tudis en acquisition du
langage : il est frquent que les productions langagires et/ou
gestuelles ne soient pas univoques. Cest le cas par exemple des
onomatopes comme poum , hop , etc., propos desquelles il
importe de savoir si elles ont t prononces en tapant dans une
balle ou en sautant, par exemple. On voudrait, grce la
transcription systmatique des vnements et gestes accompagnant
ce qui est dit, pouvoir associer la production verbale au contexte, et
tenir compte de cette association dans nos analyses quantitatives et
qualitatives.
1.2. Quest-ce quune transcription ?
Il existe un grand nombre de formes de transcription en
fonction des buts scientifiques viss, mais aussi en fonction du
modle thorique sous-jacent. Les transcriptions peuvent aussi se
faire de multiples niveaux : phontique, phonologique,
orthographe, syntaxe, smantique, actes de langages, pragmatique,
gestes, pointages, interactions avec autrui, avec la scne, etc. La
situation de production de langage (interactions, rcit oraux, textes
crits) joue galement de manire trs importante sur les formats
de transcription. Enfin la nature des locuteurs (bbs, jeunes
enfants, adultes) ou des conditions de recueil (laboratoire, lieu
4

A paraitre dans Transcrire et analyser les corpus denfant. In Edy


Veneziano, Anne Salazar Orvig, Josie Bernicot Eds, Acquisition du
langage et interaction. Paris : LHarmattan

ordinaire, endroit bruyant) modifie galement la manire de


transcrire et les codes utiliss.
La quasi-totalit des transcriptions de langage est fonde sur le
modle de la transcription crite, cest--dire de la traduction dans
le systme de la langue crite des situations de parole. Ceci veut
dire que les transcriptions comportent en gnral une ligne dite
principale qui contient des lments dont la plupart sont en format
orthographique standard. Dans le cas de transcriptions de loral, il
existe en gnral tout un ensemble de conventions permettant de
modifier certains mots en fonction de leur prononciation effective
loral et dajouter au format crit ordinaire un large ensemble de
codes permettant de signaler des lments non-verbaux, les pauses,
les intonations, les hsitations, les reprises, les recouvrement
dnoncs entre locuteurs, etc. Enfin, il faut aussi indiquer
systmatiquement le nom des locuteurs. On trouve aussi dans
certains systmes des codes qui vont au-del de la transcription et
qui servent la caractriser. Par exemple, on trouve des codes pour
caractriser les carts la norme syntaxique, pour dcrire la
structure syntaxique. Il existe ainsi de nombreuses conventions
parmi lesquelles on peut citer celles de CHILDES1, du
GARS/DELIC2, de VALIBEL3, etc.
Cependant, dans le cas de donnes orales ou signes, il est trs
difficile de rsumer une transcription une simple ligne
orthographique, mme si celle-ci est largement enrichie de notes
diverses. En effet, il se pose un certain moment des problmes de
lisibilit, de suivi des modifications et de contrle des formats.
Cest pourquoi on trouve souvent des lignes dannotations
supplmentaires. Par exemple, pour les jeunes enfants on trouvera
souvent une ligne phontique et/ou phonologique, une ligne
situation, ventuellement une ligne geste, pointage, regard,
intonation, etc. Ces lignes, largement utilises dans le systme
CHILDES et reprises dans presque tous les autres systmes, sont
appeles en gnral tire , de langlais tier, signifiant niveau.
1

http://childes.psy.cmu.edu/
http://sites.univ-provence.fr/delic/corpus/conventions.html
3
http://www.uclouvain.be/cps/ucl/doc/valibel/documents/conventions_val
ibel_2004.PDF
2

A paraitre dans Transcrire et analyser les corpus denfant. In Edy


Veneziano, Anne Salazar Orvig, Josie Bernicot Eds, Acquisition du
langage et interaction. Paris : LHarmattan

Elles sont systmatiquement apparues avec la gnralisation des


logiciels de transcription.
1.3. Les limites et les dangers des transcriptions
Il nous est donc impos doprer des choix thoriques
importants. Ces choix sont une grande responsabilit car ils auront
ensuite un effet considrable sur les analyses scientifiques menes.
Tout corpus est une construction, au sens o il est toujours dj le
produit des analyses du chercheur (Ochs, 1979). Ainsi les
procdures de transcription puis de codage des donnes mritent
une attention toute particulire, si lon veut viter de dnaturer les
productions.
Les mthodes de compilation, de transcription et de
prsentation des donnes ont t trs discutes depuis la fin des
annes soixante dix, en raison des nombreuses variables
intervenant chaque tape du processus. On peut se demander si la
transcription doit tre de nature phontique (pour plus
dauthenticit), phonologique, lexicale, orthographique (pour plus
de lisibilit et pour permettre les analyses automatiques comme sur
la morphosyntaxe en utilisant des outils standards bass sur les
conventions orthographiques) et jusquo aller dans les dtails
tant donn que lon peut toujours recourir, grce lalignement,
aux donnes sources. Par ailleurs, faut-il oprer une slection, et si
oui selon quels critres ? quelles conditions les informations
ajoutes, et notamment celles qui ne concernent pas les productions
verbales stricto sensu, sont-elles un enrichissement plutt quune
gne ? Les choix techniques sont des mises en applications des
choix scientifiques et cest le va et vient entre technique et
recherche scientifique qui doit tre constamment en cours.
On peut remettre en question la notion de ligne principale et son
contenu qui conditionne les analyses et celles des chercheurs qui
utilisent des donnes dj recueillies et transcrites. Dans quelle
mesure linterprtation des productions est-elle fiable ? Faut-il faire
appel un accord inter-juge ? Est-il possible davoir un accord
suffisamment bon sur des donnes denfants trs jeunes dont
les productions sont phonologiquement trs instables et ne peuvent
se comprendre quen utilisant la fois les informations
situationnelles, contextuelles et nos connaissances sur lenfant ? Il
6

A paraitre dans Transcrire et analyser les corpus denfant. In Edy


Veneziano, Anne Salazar Orvig, Josie Bernicot Eds, Acquisition du
langage et interaction. Paris : LHarmattan

ne semble possible de construire une comprhension suffisamment


fine des productions de lenfant qu partir dobservations
frquentes qui nous permettent de nous acclimater la musique
propre SA langue, aux situations particulires dans lesquelles il
se trouve et ses capacits cognitives, motrices, pratiques,
intellectuelles qui conditionnent sa pratique langagire. Est-ce
dire quil est impossible pour un chercheur qui ne connat pas
lenfant et na que la vido de transcrire ? Certainement pas, mais
il nous faut tre humble face la multitude dinformations
ncessaires pour sassurer de la fiabilit dune transcription et tre
bien conscient que nous ne pourrons jamais totalement reconstruire
ce que lenfant aura voulu dire dautant plus quil lui arrive de
produire une musique, des formes sans autre intention que le fait
dinteragir avec autrui ou tout simplement de se faire plaisir. Mme
dans le monde idal du psycholinguiste, lactivit de transcription
ne pourra pas tre une science exacte, et peut-tre est-ce ce qui fait
la magie du langage : les signaux acoustiques et visuels mis par
les locuteurs ne sont pas reprsentables sans un minimum
dinterprtation qui correspond des dcisions auxquelles il est
important de rflchir. Chaque dcision a un effet sur les analyses
manuelles ou automatiques qui suivront. Il est donc important
dune part de bien avoir en tte son objet dtude pour faire les
bons choix de transcriptions et dautre part, si lon na pas transcrit
soi-mme les donnes, de bien connatre les transcriptions sur
lesquelles on veut travailler avant de dcider de les utiliser pour un
projet de recherche bien particulier.
Il reste nanmoins que, quelle que soit la technique utilise, il
ny a pas une seule transcription possible mais une multitude,
toutes justes dun certain point de vue. Pour saffranchir de
cette limitation intrinsque, la seule mthode efficace est la
description de la manire dont sest droule la transcription et du
choix des conventions et des techniques utilises. Ladoption dun
standard normalis ou connu, dun outil informatique partageable
et lutilisation conjointe la transcription du son ou de la vido,
aide garantir cette transparence, et est aussi un garant de qualit
du travail scientifique ralis avec les corpus.

A paraitre dans Transcrire et analyser les corpus denfant. In Edy


Veneziano, Anne Salazar Orvig, Josie Bernicot Eds, Acquisition du
langage et interaction. Paris : LHarmattan

2. Comment transcrire ?
2.1. Formats et prsentation de donnes.
En dehors de la difficult inhrente au processus de
transcription, il existe plusieurs manires de prsenter les donnes
ainsi transcrites qui prsentent toutes des avantages et des
inconvnients. Il nexiste pas de prsentation et de format
parfait , mais toute une srie de modles qui sont plus ou moins
adapts aux diffrents usages que lon peut en faire. Dans la
mesure o nous recommandons dutiliser des logiciels de
transcription car ils sont les seuls offrir des garanties sur le
respect dun format et la possibilit de partage des donnes, nous
nous contenterons ici de prsenter les deux principaux formats
disponibles dans les logiciels grant des corpus de langage oral et
qui sont utiliss dans les travaux sur le langage de lenfant.
Format texte
Le format texte est une prsentation verticale des transcriptions
comme un texte classique. Laxe vertical, de haut en bas,
reprsente laxe du temps ou la succession temporelle. Lespace
dcriture de chaque ligne est parfois utilis comme moyen
complmentaire de codage ou dalignement temporel. Chaque
ligne principale est en gnral suivie dun ou plusieurs tires qui
contiennent des informations dpendantes de la ligne principale.
Un exemple classique de ce type de format est celui du logiciel
CLAN (CHILDES), mais cest aussi le cas de Transcriber ou de
PHON.
*CHI:
%mor:
%pho:
%add:
%act:
*FAT:
%mor:

je [/] j' appuie sur vert ?


pro:subj|je v|appuyer prep:art|sur adj|vert ?
z api sy v

FAT .
CHI appuie sur un bouton de la machine caf .
oui vas+y .
adv:yn|oui v:mdllex|vas+y .

Exemple de partition issu du programme CLAN (les reprsentent


des indicateurs dalignement temporel texte/vido).

A paraitre dans Transcrire et analyser les corpus denfant. In Edy


Veneziano, Anne Salazar Orvig, Josie Bernicot Eds, Acquisition du
langage et interaction. Paris : LHarmattan

Certains logiciels comme PHON permettent de lier directement


les annotations (par exemple la transcription phontique) des
parties de la ligne principale (par exemple les mots puis les
phonmes). Dautres plus nombreux comme CLAN ne font pas de
lien explicite, le seul lien existant tant celui de la reprsentation
choisie par lutilisateur (dans lexemple ci-dessus lutilisation
despaces).
Le format texte est trs bien adapt lanalyse textuelle, en
particulier les rcits, mais aussi les successions dinteractions
lorsquune analyse sintresse des suites dchanges qui sont plus
facilement visualiss en format texte quen format partition (voir
ci-dessous). Le format texte permet galement dafficher un grand
nombre de lignes dpendantes en mme temps. Le format texte
prsente par contre des limitations importantes dans la
reprsentation des dialogues et en particulier des chevauchements
entre locuteurs. Il est galement moins bien adapt une situation
dinteraction impliquant plus de deux ou trois personnes.
Format partition
Le format partition est une prsentation horizontale des
transcriptions qui ressemble une partition de musique. Le
dcoulement du temps est reprsent par lhorizontale de gauche
droite. Selon les logiciels, cet axe horizontal est proportionnel au
droulement temporel ou la taille du texte transcrit. Dans ce
format, chaque interlocuteur correspond une ligne de la partition.
Des lignes supplmentaires permettent de coder les lignes
dpendantes de chaque interlocuteur. Ce format est largement
utilis dans les logiciels servant coder les interactions de langage
(par exemple ELAN ou EXMARaLDA), mais cest aussi la
prsentation utilise dans un logiciel comme PRAAT (bien que
spcialis dans le traitement du son, PRAAT permet la
transcription et lalignement temporel).

A paraitre dans Transcrire et analyser les corpus denfant. In Edy


Veneziano, Anne Salazar Orvig, Josie Bernicot Eds, Acquisition du
langage et interaction. Paris : LHarmattan

Exemple de partition issue du programme ELAN

Comme le format texte, ce type de format prsente des


avantages et des inconvnients. Les avantages sont une prcision
extrme dans les chevauchements dnoncs et dans les
alignements temporels en gnral, la possibilit de visualiser
facilement les interactions de nombreux interlocuteurs et la libert
de maniement des annotations dpendantes par rapport aux
annotations principales. Les longs noncs ou les tours de paroles
et les annotations secondaires, si elles sont en grand nombre,
peuvent cependant tre assez peu lisibles.
2.2. Choix dun modle de transcription
De manire idale, le choix dun systme de transcription ne
devrait tre fait que sur des critres defficacit ou de besoin de la
recherche. On ne saurait quencourager les usagers connatre et
apprendre de nombreux modes de transcription et prsentation de
corpus afin de faire le meilleur choix. Nanmoins, lutilisation dun
type de systme ou dun autre relve souvent de lhabitude ou de
lappartenance une communaut (par exemple : acquisition du
langage oral, interactions ou langues signes). Les utilisateurs
peuvent aussi tre amens choisir un format parce quil nexiste
quun seul logiciel qui remplisse exactement les besoins des
recherches quils mnent. Dans les deux cas, ceci conduit parfois
compenser dune manire ou dune autre les faiblesses dun
systme impos et pousse parfois les utilisateurs utiliser ou
continuer dutiliser un systme qui nest pas toujours optimal pour
leurs besoins. Lidal en la matire serait une meilleure
compatibilit entre logiciels qui permette de passer plus facilement
de lun lautre, et de mme utiliser deux logiciels diffrents pour
la mme recherche lorsque le besoin existe. A cet gard de
nombreux progrs ont t raliss pour atteindre une plus grande
10

A paraitre dans Transcrire et analyser les corpus denfant. In Edy


Veneziano, Anne Salazar Orvig, Josie Bernicot Eds, Acquisition du
langage et interaction. Paris : LHarmattan

interoprabilit des logiciels et il est souvent possible de convertir


effectivement des transcriptions. Cet exercice peut, hlas, parfois
imposer une limite la nature des lments convertis et il est
important de les connatre et dtre prudent avant dentreprendre
une conversion.
2.3. Planifier et organiser des transcriptions
Le temps consacr raliser des transcriptions peut tre trs
long. Il varie largement selon lentranement des transcripteurs, le
type de format exig, le niveau de qualit vis, la situation de
recueil de lenregistrement sonore ou vido, le type de production
langagire des locuteurs ainsi que leur dbit. Le temps ncessaire
pour une transcription svalue en mesurant la proportion du temps
mis transcrire par rapport la dure de lenregistrement.
Pour une simple transcription de ligne principale
orthographique, on pourra avoir dans les meilleurs cas des rapports
de cinq six pour des transcripteurs rapides, un langage
parfaitement audible et bien enregistr, une diction claire. Ceci
veut dire quil faudra cinq six heures pour transcrire une heure
denregistrement. Ces performances sont rarement atteintes et
ncessitent une grande pratique et une utilisation optimale des
matriels ou logiciels sa disposition, comme par exemple le
SoundWalker de CLAN qui reproduit lutilisation dune pdale
de contrle du dfilement du son. Le rapport effectif est plus
souvent de dix quinze pour un travail standard. Dans le cas o le
milieu sonore est mauvais ou la langue produite difficile
percevoir (par exemple dans le cas de jeunes enfants, de troubles
de langage, ou daccents spcifiques), les temps peuvent
sallonger, les rapports monter vingt fois le temps de
lenregistrement.
Lorsque la transcription ncessite des lignes secondaires en plus
de la ligne principale, le temps de transcription peut aisment
doubler. Ainsi lajout dune ligne phontique peut prendre
beaucoup de temps, surtout si elle doit tre ralise avec prcision
sur tous les locuteurs. Il faut aussi faire attention dans ce cas de
figure utiliser les logiciels les plus adapts pour lexercice. Pour
les tudes de dialogue enfant-adulte, ou dinteractions, on est
11

A paraitre dans Transcrire et analyser les corpus denfant. In Edy


Veneziano, Anne Salazar Orvig, Josie Bernicot Eds, Acquisition du
langage et interaction. Paris : LHarmattan

souvent amen ajouter beaucoup de codes supplmentaires (nonverbal, situations, gestes, etc.).
Enfin le temps global peut aussi se modifier en fonction du
temps consacr au contrle des transcriptions. Dans le cas de
double transcription compltement ralise en aveugle, il faut
compter deux fois le temps total plus le temps ncessaire pour
obtenir un accord entre transcripteurs. Ce travail est trop lourd pour
tre ralis pour toute transcription et il est en gnral rserv
quelques chantillons permettant de mesurer la qualit de
transcription. La pratique la plus courante consiste faire vrifier
les transcriptions, soit par linvestigateur de ltude, soit par un
spcialiste. Une telle vrification prend un temps important,
variable selon la quantit de corrections apporter la premire
transcription. Un temps de deux quatre fois le temps original
nest pas exceptionnel, surtout dans le cas de transcriptions
dlicates raliser.
Lorsque lon tient compte de lensemble des lments
ncessaires pour raliser du corpus de langage oral (en incluant
aussi le temps de tournage et de digitalisation), on se rend compte
du temps que ncessite une tude complte. Sur la base dun temps
(tout compris) allant de quinze quatre-vingt dix heures par heure
de corpus selon les conditions du corpus, on comprend quun
corpus qui reprsente un suivi mensuel de deux ans cote entre
trois cent et mille huit cent heures de travail, c'est--dire environ
deux douze mois de travail temps plein.
Ces chiffres expliquent combien il est important de mutualiser
les donnes de corpus, la fois pour des raisons conomiques mais
aussi tout simplement pour permettre de raliser certains travaux
dans des temps raisonnables. La mutualisation ne doit malgr tout
pas limiter la ralisation de nouveaux recueils de corpus qui sont
importants pour obtenir de nouvelles donnes, couvrir des champs
complmentaires ou vrifier des rsultats prcdents, mais aussi
pour apprendre rellement ce quest la production de langage, que
ce soit celle denfants, dadultes ou de personnes souffrant de
troubles du langage. En ce sens, le recueil et la transcription de
corpus reste la meilleure cole qui soit, mais il convient, en regard
du temps ncessaire pour obtenir un corpus exploitable, de
correctement planifier le recueil et la transcription, faute de quoi la
12

A paraitre dans Transcrire et analyser les corpus denfant. In Edy


Veneziano, Anne Salazar Orvig, Josie Bernicot Eds, Acquisition du
langage et interaction. Paris : LHarmattan

transcription peut occuper tout le temps de travail consacr un


mmoire ou mme une thse.
3. Raliser des transcriptions
Le travail sur un corpus de langage oral passe par quatre
phases : (a) lenregistrement (vido ou son), (b) la digitalisation
(transformation du film ou du son en un format exploitable par un
logiciel de transcription), (c) la transcription (pour laquelle il existe
de nombreux outils), (d) lexploitation du corpus (fonctions de
recherche, statistique et visualisation des outils de corpus).
3.1. Lenregistrement
Lenregistrement de corpus est une tape fondamentale car elle
est dlicate et ne peut tre recommence comme une prise de vue
de cinma. Plusieurs lments fondamentaux doivent tre contrls
avec soin.
La situation doit tre prpare au mieux. De nombreux lments
rentrent en compte, notamment les besoins scientifiques (situation,
milieu, nombre de locuteurs, etc.). Sil est clair que la ralisation
doit se plier aux aspects scientifiques, il faut chercher se mettre
dans les meilleures conditions de ralisation : lumire correcte,
absence de bruits annexes, espace pour dplacer aisment la
camra. Les lments techniques peuvent dans certains cas
compenser certaines limitations de la situation, comme lutilisation
dun grand angle dans des espaces rduits ou celle dun micro
directionnel externe la camra dans le cas de bruits environnants.
On peut aussi multiplier les camras ou les micros lorsque le
contrle de la situation est fondamental. Dans une certaine mesure,
la qualit des matriels vido ou audio rcents (surtout lorsque le
matriel achet est de bonne facture, c'est--dire un ordre de prix
allant de 500 8004) facilite le recueil de nouveaux
enregistrements en assurant une bonne qualit vido ou sonore
4

Nous avons tenu donner des prix pour fixer les ordres de grandeur du
cot du matriel utiliser pour une tude de corpus, hors cot de
lordinateur lui-mme. Ces prix correspondent lanne 2009 et sont
susceptibles dvoluer, le plus souvent la baisse, avec lamlioration des
techniques et la diffusion de ce type de matriel.

13

A paraitre dans Transcrire et analyser les corpus denfant. In Edy


Veneziano, Anne Salazar Orvig, Josie Bernicot Eds, Acquisition du
langage et interaction. Paris : LHarmattan

mme sans lutilisation de matriel spcialis comme des micros


externes. Ceux-ci, sils sont de bonne qualit, sont toutefois
indispensables dans tous les travaux exigeants du point de vue
acoustique.
La plupart des camras actuelles peuvent convenir, mais il vaut
mieux viter les formats de type DVD qui sont le plus souvent
difficiles convertir. Les formats tout numrique sont une bonne
option, ainsi que les formats Mini-DV. La qualit haute-dfinition
est un plus, mais nest pas ncessaire.
3.2. La digitalisation
Lre du tout numrique a grandement facilit cette part du
travail. Pour des recueils anciens, dits analogiques, on est oblig de
passer par du matriel spcialis (cartes dacquisition numrique
pour ordinateur, ou camra numrique externe intermdiaire). Les
cartes (internes ou externes) pour ordinateur ne sont plus trs
coteuses (moins de 150 en gnral) mais tous les matriels
noffrent pas une trs bonne qualit de digitalisation, ou ne
permettent pas tout type de transformation.
Les camras numriques de type Mini-DV ou de type support
mmoire (format MPEG-4, AVCHD) permettent une efficacit
maximale car le processus est une simple conversion et non une
digitalisation. Ce procd sopre sans perte de qualit. La
multiplication des systmes et des modles, allie la grande
mobilit de ce secteur conomique, nous interdit de proposer des
solutions cls en mains. Il faut simplement savoir que dune faon
gnrale il faut aller de la camra lordinateur (par la prise
Firewire dans le cas de Mini-DV, par transfert de donnes pour les
mmoires). Il faut ensuite raliser une conversion de donnes, du
format origine de la camra vers le format utilis par le logiciel de
transcription (son, vido Quicktime, vido Windows Media Vido,
selon le cas). Ces deux tapes ncessitent souvent lachat doutils
peu couteux comme un logiciel de montage vido (I-Movie est
gratuit sur les Mac dApple, de nombreux logiciels payant sont
disponibles sur les PCs pour des prix allant de 50 100) et
comme un programme de conversion vers Quicktime . La capacit
de conversion vers Windows Media Vido est en gnral
14

A paraitre dans Transcrire et analyser les corpus denfant. In Edy


Veneziano, Anne Salazar Orvig, Josie Bernicot Eds, Acquisition du
langage et interaction. Paris : LHarmattan

gratuitement assure par les logiciels de montage vido. Le format


DVD, peu recommand, ncessite des programmes spcifiques de
conversion (de type DVD Ripper ) disponibles sur Internet des
cots de lordre de 30 50.
3.3. La transcription
Il existe une dizaine de logiciels permettant la transcription de
dialogues oraux, avec alignement la vido ou au son. Chaque
logiciel, au-del de son type de prsentation (voir ci-dessus
prsentation en mode texte ou partition), vise un usage spcifique
et prsente des avantages et des inconvnients. Nous ne dcrirons
pas lensemble de ces logiciels ici (voir http://icar.univlyon2.fr/projets/corinte/confection/alignement.htm pour une liste
trs complte) mais listerons simplement les six logiciels les plus
utiliss pour travailler sur le langage de lenfant (voir aussi
Rohlfing & al., 2006, pour une description des logiciels au format
partition). Tous ces logiciels sont gratuits.
Nom
Origine

Praat
www.praat.
org

Spcificit

Phontique,
signal sonore
PC/Mac/
Linux
Partition
Son
Wav, Aif,
MP3, Au
TextGrid

Systme
Prsentation
Vido/Son
Format
Type de
fichier
Importation

Exportation

Phon
phon.ling.mun
.ca/phontrac/
wiki/
Phonologie

Clan
childes.psy.
cmu.edu

PC/Mac

Rcit,
Interactions
PC/Mac

Texte
Vido
Quicktime

Texte
Vido ou Son
Quicktime

Phon et
TalkbankXml
Clan, Praat
(prvision)

Chat TalkbankXml
Elan,
Exmaralda,
Praat
Elan,
Exmaralda,
Praat, Texte

Clan, Praat
(prvision)
15

A paraitre dans Transcrire et analyser les corpus denfant. In Edy


Veneziano, Anne Salazar Orvig, Josie Bernicot Eds, Acquisition du
langage et interaction. Paris : LHarmattan

Commandes
annexes

Langage de
script trs
puissant

Recherche

(avec
commande
COMBO)
Large
bibliothque
de fonctions

Tableau 1a : Description synthtique des logiciels de transcription

Nom
Origine
Spcificit

Systme
Prsentation
Vido/Son
Format

Type de
fichier
Importation

Exportation

Commandes
annexes

Elan
www.lat-mpi.
eu/tools/elan
Interaction
multilocuteurs
PC/Mac/
Linux
Partition
Vido et Son
Quicktime,
Windows
Media, Java
Media
EAF (Xml)

Exmaralda
exmaralda.org
Interactions,
textes

Transcriber
trans.source
forge.net
Rcit,
Interactions

PC/Mac/
Linux
Partition
Vido ou Son
Java Media
Framework

PC/Mac/
Linux
Texte
Son
Tous formats
courants

XML

Trs XML

Clan,
Transcriber,
Shoebox
Shoebox,
Clan, Texte
(plusieurs
types), autres
Recherche

TASX, Praat

Clan, autres

TASX, Praat,
formats Html

Texte

Logiciels
complmentai
-res puissants

Tableau 1b : Description synthtique des logiciels de transcription

Les six logiciels prsents dans les tableaux ci-dessus


permettent tous de prsenter des transcriptions en relation avec du
16

A paraitre dans Transcrire et analyser les corpus denfant. In Edy


Veneziano, Anne Salazar Orvig, Josie Bernicot Eds, Acquisition du
langage et interaction. Paris : LHarmattan

son ou de la vido, ce qui les rend adapts lanalyse du langage


oral et des interactions. Ils ne sont pas concurrents dans la mesure
o ils remplissent tous des fonctions diffrentes. Ils ont galement
tous une grande panoplie de fonctions qui leur offrent une certaine
adaptabilit et noblige pas systmatiquement changer de logiciel
lorsque lon change de mode de travail. Cette souplesse ne devrait
toutefois pas empcher lutilisateur averti de changer de logiciel
lorsque cela peut lui apporter des solutions techniques efficaces.
On peut profiter des capacits de conversion entre logiciels pour
passer dun logiciel lautre et utiliser intelligemment le logiciel le
plus appropri en fonction de ses besoins du moment. Lutilisateur
non-spcialiste peut choisir son logiciel en fonction des
caractristiques dcrites dans la troisime ligne des tableaux 1a et
1b ci-dessus. Certains logiciels trs spcialiss comme PRAAT et
PHON ne sont pas concurrents des autres logiciels car lutilisateur
qui dsire faire de la phontique ou de la phonologie les utilisera
naturellement. Les autres logiciels sont parfois choisis selon des
prfrences de laboratoire ou des habitudes. Ce nest pas toujours
une bonne solution car certains logiciels ont des fonctions
spcifiques qui sont utiles ou parfois mme vitales pour certaines
tudes. Ainsi, ELAN est incomparable lorsquil sagit daligner
plusieurs lignes de transcription (plusieurs interlocuteurs ou/et
plusieurs vnements) de manire temporelle prcise. CLAN est
particulirement adapt au traitement de rcit (comme Transcriber)
mais aussi la description des interruptions, reprises, erreurs de
performance ou variantes de prononciation grce son riche
systme de codage. Enfin, EXAMARaLDA prsente une
configuration intermdiaire entre ces deux extrmes.
3.4. Lexploitation des corpus
Les logiciels informatiss prsentent lavantage de permettre
lexploitation automatise des donnes quils peuvent crer. Les
possibilits offertes par les diffrents logiciels sont trs variables et
fonction de lobjectif scientifique pour lequel ils ont t conus.
Par exemple CLAN, conu pour traiter les corpus servant
tudier lacquisition du langage permet de calculer la LME
(Longueur Moyenne dEnonc), mesure propose par Brown
(1973) et systmatiquement utilise dans la littrature sur
17

A paraitre dans Transcrire et analyser les corpus denfant. In Edy


Veneziano, Anne Salazar Orvig, Josie Bernicot Eds, Acquisition du
langage et interaction. Paris : LHarmattan

lacquisition comme permettant dvaluer le niveau approximatif


de dveloppement de langage dun enfant. PRAAT, dabord conu
pour traiter et afficher du signal de parole permet dautomatiser et
modifier les traitements sur ce signal. EXMARaLDA, conu pour
traiter des donnes textuelles de volume important, dispose de
logiciels annexes pour traiter et diter des corpus entiers.
Pour le traitement du langage de lenfant, le logiciel aujourdhui
le plus adapt est CLAN. Non seulement il permet comme tous les
autres logiciels de raliser des recherches dans les corpus, mais il
permet aussi de calculer des frquences lexicales, des frquences
phonologiques, les diffrences entre formes produites et attendues,
des rapports type-token, la LME, de faire de lanalyse
morphologique et syntaxique, et aussi de calculer des indices de
dveloppement syntaxique comme le DSS (Developmental
Sentence Score - Lee, 1974). Il dispose galement de toute une
srie de commandes annexes permettant de vrifier et diter les
corpus. Enfin, le rsultat de toute commande peut tre enchain
avec une autre commande et galement stock dans un fichier de
format texte. Cette dernire possibilit permet dutiliser des outils
comme un traitement de texte ou un tableur pour diter ces
rsultats ou les utiliser pour faire des calculs supplmentaires ou
des statistiques. Le dfaut de CLAN est que ces commandes
annexes passent par une interface utilisateur en mode commande
qui, bien que puissante, reste difficile maitriser pour beaucoup
dutilisateurs. Par exemple, la commande de recherche de chane
de caractres prsente dimmenses possibilits mais au prix dun
usage complexe. On ne peut que recommander lutilisateur de
procder par essais et erreurs en allant de commandes simples
des commandes complexes de manire progressive (cette
recommandation qui sapplique tous les programmes
informatiques est particulirement importante ici).
Les autres logiciels ont en gnral des interfaces utilisateurs
plus modernes (qui ne riment pas toujours avec simplicit
dutilisation). Si aucun logiciel na la mme varit de commandes
que CLAN, les fonctions de recherche peuvent tre plus puissantes.
Cest le cas dELAN, mais encore plus de PHON qui utilise un
vritable langage de programmation pour faire ses recherches.
18

A paraitre dans Transcrire et analyser les corpus denfant. In Edy


Veneziano, Anne Salazar Orvig, Josie Bernicot Eds, Acquisition du
langage et interaction. Paris : LHarmattan

EXMARaLDA prsente lavantage doffrir des programmes


annexes (Corpus Manager et EXAKT) qui permettent de manier
des bases de donnes, dditer des mtadonnes, de raliser des
recherches sur les annotations et de calculer des concordances.
Apprendre connatre et manier les commandes
dexploitation des corpus est certainement coteux en termes
defforts et de temps. Ce temps est toutefois largement compens
par les rsultats que cela permet dobtenir. Pour ceux qui veulent
aller plus loin, il est possible dutiliser les corpus, ventuellement
aprs transformation, avec des outils spcifiques plus puissants
destins au traitement automatique du langage et des textes.
Conclusion
Il nest plus possible aujourdhui denvisager des travaux sur
lacquisition du langage qui naient pas un lien avec des corpus de
productions attestes ou des situations exprimentales. Ceci est
aujourdhui beaucoup plus facile quautrefois grce au nombre
important de logiciels et doutils disponibles. Pour ceux qui ne
peuvent constituer leur propre corpus, des bases de donnes
comme CHILDES (USA) ou le CRDO (France) permettent une
premire approche des corpus. On peut esprer que la
gnralisation de normes communes permettant damliorer
linteroprabilit des systmes apportera encore plus de donnes et
de rsultats scientifiques dans un futur proche.
Malgr ses normes avantages, il faut toutefois rester conscient
des limites du travail sur corpus. Si les hypothses scientifiques
sont mal poses, si le corpus est mal conu ou utilis mauvais
escient, les rsultats obtenus seront sans valeur. Travailler sur plus
de 10 000 mots nest pas forcment synonyme de qualit ou
dintrt scientifique.
Cest pourquoi les auteurs de ce chapitre, en accord avec la
plupart des chercheurs et spcialistes du domaine, prconisent,
pour ltudiant comme pour le chercheur confirm, dutiliser la
fois les deux stratgies.
-1) Recueillir du corpus quand on commence ses
recherches et continuer en recueillir tout au long de son travail
scientifique. Seul le travail de recueil et surtout de transcription
19

A paraitre dans Transcrire et analyser les corpus denfant. In Edy


Veneziano, Anne Salazar Orvig, Josie Bernicot Eds, Acquisition du
langage et interaction. Paris : LHarmattan

permet de bien apprhender les phnomnes rels, de mesurer leur


dimension effective, comme un moment unique et mystrieux du
dveloppement dun tre humain mais aussi comme un moment ou
des milliers dinformations se combinent.
-2) Donner ses propres corpus la communaut, en
respectant les rgles danonymat et de paternit des travaux, et
regarder les corpus des autres pour les comparer aux siens. Ceci
prsente un double intrt : augmenter le matriel disponible pour
arriver peut-tre un jour disposer de quantit dinformation
comparable celle que lenfant reoit dans les premires annes de
sa vie ; inciter la comparaison entre tudes et la multiplication
des points de vue sur de mmes enfants, afin de faire avancer la
comprhension de ce domaine de recherche pour lequel beaucoup
de travail reste encore accomplir.

Rfrences
Brown, R., 1973, A first language : The early stages. Cambridge, Mass.,
Harvard University Press.
Darwin, C., 1877, A Biographical Sketch of an Infant, Mind, vol. 2 : 285294.
Lee, L. (1974). Developmental Sentence Analysis. Evanston, IL:
Northwestern University Press.
Morgenstern, A. en collaboration avec Sandra Benazzo, Marie Leroy,
Emmanuelle Mathiot, Christophe Parisse, Anne Salazar Orvig,
Martine Sekali (sous presse). Lenfant dans la langue : de
lobservation du naturaliste lanalyse du linguiste. Paris :
Presses de la Sorbonne Nouvelle.
Morgenstern, A., Parisse, C. (2007). Codage et interprtation du langage
spontan d'enfants de 1 3 ans. Corpus n6 "Interprtation,
contextes, codage", pp. 55-78.
Projet Corinte: ICAR (CNRS, Lyon 2, ENS-LSH)
http://icar.univ-lyon2.fr/projets/corinte/confection/alignement.htm
Rohlfing & al. (2006). Comparison of multimodal annotation tools
workshop report. Gesprchsforschung Online-Zeitschrift zur
verbalen Interaktion (ISSN 1617-1837) Ausgabe 7 (2006), 99123.

Taine, H., 1876, L'acquisition du langage chez les enfants et dans


l'espce humaine. Revue Philosophique de la France et de
l'Etranger, 1, 357-395.
20