Académique Documents
Professionnel Documents
Culture Documents
www.sonal-info.com
Mode demploi
Alex ALBER
Universit F. Rabelais (Tours) / UMR C.I.T.E.R.E.S
Chercheur associ au Centre dEtudes de lEmploi
Avant-propos......................................................................................... 7
1.1
1.2
1.3
Se lancer ! ............................................................................................ 29
3.1
3.2
Annexes .............................................172
19 Utiliser Sonal dans une recherche collective ..................................... 173
19.1 Crer un corpus modle ................................................................................... 174
19.2 Distribuer le corpus modle ............................................................................. 177
19.3 Centraliser les fichiers ...................................................................................... 177
1 Avant-propos
Sonal est un logiciel de construction et danalyse de corpus de donnes qualitatives.
Vous pourrez lutiliser pour archiver, annoter, retranscrire puis analyser des documents
sonores, des vidos et des documents textuels. Il appartient la famille des CAQDAS
(pour Computer Assisted Qualitative Data Analysis Software) qui regroupe lensemble
des logiciels qui proposent dassister les chercheurs dans lanalyse de donnes
qualitatives1.
Cest lintrieur de ces extraits que seront ajoutes les retranscriptions. Le travail de
retranscription nintervient donc plus comme un moyen de remplacer la bande par un
verbatim mais comme un moyen dajouter du texte sur la bande.
Le rsultat du travail dencodage/retranscription est donc un matriel audio-textuel dit
synchronis car le son et sa retranscription sont toujours accessibles simultanment.
Sonal propose toute une srie doutils trs spcifiques qui permettent de grer
conjointement les versions sonores et textuelles des entretiens (outils de
resynchronisation, dcoupage/fusion simultans du texte et du son etc.).
Pour une recension des outils existants, voir le site (en franais/anglais) de Christophe Lejeune
http://www.squash.ulg.ac.be/logiciels/fonctionnalite/caqdas ou (en allemand/anglais) de Ronny Gey
http://www.sosciso.de. Luniversit du Surrey a galement propos une tude comparative de plusieurs
outils http://www.surrey.ac.uk/sociology/research/researchcentres/caqdas/. Plus fondamentalement,
larticle de J. Jenny (1998) propose une typologie clairante des diffrentes familles doutils.
2
Il est galement possible de traiter des documents textuels dans Sonal, mais la mthode propose est
fortement marque par la logique initiale du logiciel.
Cette base de donnes contiendra, pour chaque entretien, une srie de caractristiques
dfinies par lutilisateur, sous la forme de variables (99 au maximum) pouvant prendre
chacune jusqu 98 modalits (99= non rponse). Vous aurez accs un dcompte des
diffrentes caractristiques des fichiers (tri plat).
une sorte de feutre surligneur directement sur les fichiers media (son et vido) pour
reprer certaines parties. Ces parties de bande ainsi isoles et colories sont appeles
des extraits .
Figure 3 - Exemple de fichier son avant et aprs encodage
Les couleurs apposes sur la bande sont appeles thmatiques car leur usage
premier est de reprer des sujets particuliers dans les entretiens, mais de nombreux
usages dtourns sont possibles. Par exemple, dans la version de Sonal pour musiciens,
les thmatiques sont appeles Styles .
La grille thmatique peut contenir jusqu 99 catgories diffrentes, distingues par un
code, une zone de texte libre, et une couleur choisie parmi 52 diffrentes. Chaque
extrait peut se voir affecter une ou plusieurs thmatiques.
Figure 4 Fentre de gestion des
thmatiques
On peut dabord placer lintrieur des zones de texte une simple description du
contenu, des notes ou - et cest lorientation premire de loutil - y retranscrire le
contenu des prises de parole.
Sonal assiste lutilisateur dans cette tche laide dun systme de dicte qui
fonctionne ainsi : la lecture progresse par courtes portions successives (3 5
secondes), sarrte et attend la validation du transcripteur pour passer la portion
suivante. La bande progresse donc au rythme du transcripteur, sans que celui-ci ait
sen occuper outre mesure. De plus, Sonal laisse priodiquement des balises dans le
texte afin de renseigner la position des passages retranscrits (appels points de
synchronisation . Enfin, un systme de balises de locuteurs annonant les prises de
parole (touches F1 F12 paramtrables) permet de distinguer les questions des
rponses.
Si lencodage est continu (tous les extraits se touchent) et que lintgralit des
extraits est retranscrite, les versions sonores et textuelles de lentretien sont dites
synchronises . On peut dornavant naviguer soit dans le son, et relire
immdiatement la retranscription qui en a t faite, soit voluer dans la
retranscription, et retrouver trs rapidement le passage sonore associ avec ce quon
vient de lire.
Il sagit donc dun outil dassistance la synthse des matriaux, qui repose
largement sur les centres dintrt de lutilisateur, et qui ne revt donc pas le
moindre caractre dobjectivit en lui-mme.
On retrouve ainsi trs rapidement tous les extraits pertinents, qui sont envoys dans
une fentre de synthse . Les synthses peuvent tre enregistres dans Sonal, et
tre exports vers un traitement de texte pour insertion dans une restitution crite.
En permettant un inventaire rapide des matriaux disponibles sur les diffrents sujets,
ce systme rpond aux questions prosaques : quai-je comme matriau sur telle ou
telle thmatique ? Quen disent les rpondants ayant tel ou tel profil ? Selon le
niveau de traitement des matriaux, le rsultat sera sous la forme dun micro-trottoir
(son uniquement) ou dun thsaurus de passages audio-textuels.
Cette analyse chronomtrique peut ensuite tre exporte vers Trideux ou vers un
tableur.
Enfin, le croisement des contenus sonores (dure) et textuels (nombre de mot) des
extrait dbouche sur une analyse de dbit (dbitmtrie) qui analyse les variations de
la vitesse dlocution en fonction des rpondants, des sujets etc.)4
Cette fonction nest pas encore implmente un niveau global dans la version 1.6
Idem.
- Compatibilit
Sonal est un logiciel dvelopp dans et pour un environnement Windows (XP 8). Il
est cependant possible de lutiliser dans un environnement Mac ou Linux, mais cela
suppose une mulation de Windows.
Cest une copie des fichiers essentiels utiliss par Sonal (cf. ci-dessous) qui sont placs
dans un dossier part.
Les fichiers mdia ne sont pas recopis, vous pouvez donc en crer trs
frquemment sans prendre le risque de surcharger votre ordinateur. Par
exemple, la sauvegarde de 15h denregistrements intgralement retranscrits ne
pse mme pas un mgaoctet.
Vous pouvez mme vous envoyer ce dossier compress par mail pour plus de
scurit. Il vaut donc mieux faire trop de sauvegardes que pas assez.
- Logique fonctionnelle
- Pour changer quelque chose, cliquez dessus. Si une zone de texte apparat, cest que
vous avez trouv. Pour enregistrer la modification dun paramtre, faites entre.
- Il ny a pas de doubles-clics dans le logiciel.
- Ne faites quune chose la fois. En plus de la page du corpus, viter douvrir
plusieurs pages conjointement (synthse en mme temps que saisie etc.).
Si votre dfinition dcran est leve, il est possible que Windows vous ait propos
dagrandir les polices de 25% : Sonal naime pas a du tout ! Les fentres sont mal
dimensionnes et vous ne verrez pas toutes les fonctions. Vous devez travailler avec
des polices de taille normale.
2 Comprendre
lorganisation
du
logiciel
Cette partie vise vous permettre de comprendre la manire dont Sonal fonctionne,
ce qui vous aidera corriger dventuels problmes.
Fichier
Corpus
Entretien1
Entretien2
Entretien3
- Le fichier Corpus
Le fichier Corpus a pour extension *.crp. Cest en ouvrant un fichier corpus que lon
accde aux entretiens retranscrits dun projet.
Cest un simple fichier texte (ditable avec le bloc note) qui contient, entre balises :
- La liste des thmatiques : |THEM|
- La liste des variables de la base de donnes : |POS|
- Le dictionnaire des modalits des diffrentes variables : |DIC|
- La liste des entretiens |ENTR|
- La liste des locuteurs rpondant aux codes F1 F12 |LOCU|
Malgr ses contraintes, ce fonctionnement permet une certaine souplesse. Pour peu
que leurs grilles thmatiques et leurs variables soient identiques, deux fichiers Crp
peuvent largement partager un mme fichier RTR. On peut aussi dcliner un
corpus en plusieurs sous-corpus. Par exemple, un dossier de projet pourra contenir
un corpus complet, une copie qui ne contient que certains types dentretiens, une
autre que les entretiens dun interrogateur donn etc. en se rfrant tous des
fichiers communs. Ce qui impliquera que le travail dans un entretien simpactera
dans tous les projets o il est intgr.
son nom
sa dure
les observations qui lui sont rattaches
son nombre dextraits
les valeurs associes chacune des variables.
ses coordonnes
la ou les thmatiques
le texte associ
les mots-cls.
Le dimensionnement du tableau de donnes est fix par dfaut 999 extraits dans
999 entretiens. Normalement, cela suffit amplement.
Le croisement de ces bases permet ensuite Sonal doprer toutes sortes danalyses
rsultant de filtrages oprs tant sur le contenu des extraits que sur les
caractristiques des entretiens desquels ils sont issus. Lorsque Sonal ouvre un extrait,
il sait par la base des extraits dans quel entretien il se trouve. A laide de la base des
entretiens, il sait quelles sont les caractristiques de cet entretien et laide du
dictionnaire, il peut renvoyer si, par exemple, lextrait est issu dun entretien
homme ou femme , et sil faut lafficher ou non, en fonction du filtrage opr.
Construire un corpus
3 Se lancer !
3.1 Premire tape : crer un rpertoire de projet5
Pour commencer votre travail et construire votre corpus, avant mme le lancement
du logiciel, vous devez crer ou choisir un rpertoire qui accueillera votre projet.
Pour crer votre rpertoire de projet, choisissez un emplacement o vous
disposerez de suffisamment de place et o laccs est rapide ; vitez de
travailler directement sur un support externe de type USB, cela ralentit un peu
le logiciel et comporte plus de risques daccident (retrait involontaire de la cl,
panne, etc). Utilisez plutt ces supports pour conserver des sauvegardes (cf.
plus haut).
Placez tous les enregistrements et tous les documents que vous voulez traiter dans ce
dossier.
La version en ligne de ce tutoriel contient des vidos qui pourront peut-tre vous
aider.
Nous allons commencer par apprendre ajouter des bandes ou des documents texte
notre corpus, avant de voir comment construire la grille thmatique. Nous verrons
ensuite comment construire et renseigner la base de donnes, avant de rentrer dans
le travail dencodage proprement dit, avec la retranscription et le dcoupage sonore.
Des vidos. Sonal supporte les formats *.AVI et *.MPG, sous rserve
dinstaller les codecs ncessaires pour que Windows Media Player soit
capable de les lire.
Des fichiers texte. Sonal peut soit importer des documents depuis Word
*.DOC, *.DOCX, soit depuis des fichiers au format *.TXT. Dans les deux cas,
ceux-ci seront convertis en texte simple (ANSI).
- Possibilits dencodage
Ces trois types de documents font lobjet dun mme type dencodage. Au-del des
valeurs renseignes dans la base de donnes, leur contenu sera dcoup en parties
successives, contiges ou non, mais de prfrence non superposes.
Pour les sons ou les vidos, les documents sont dcoups sur la base des
coordonnes chronomtriques (en secondes), pour les documents texte, cest la
position du mot de dpart rapporte au total des mots qui sert de rfrence (en
millimes).
reprs par des balises de locuteurs. Dans les sons et les vidos, les interventions
seront repres par des points de synchronisation, qui renseigneront sur la position
dans le son de lintervention considre.
Dans les vidos, les points de synchronisation placs dans le texte serviront de
base au sous-titrage. Vous pouvez donc utiliser Sonal pour raliser des soustitres. Un export au format *.Srt des retranscriptions est en projet.
Apparat alors une boite de dialogue de type Ouvrir dans laquelle il vous faudra
choisir le fichier son que vous voulez importer. Par dfaut Sonal cherche des fichiers
WAV mais vous pouvez importer dautres fichiers son en modifiant le type de
filtrage, voir ci-dessous.
Votre fichier est ensuite ajout au corpus. Sil est au format WAV, Sonal va dabord
prendre le temps de le dessiner intgralement, ce qui peut prendre quelques
secondes. Sil est dans un format compress, Sonal se contentera de dessiner un
spectre sonore fictif et renseignera le format du fichier au dbut de limage (voir cidessous).
Si vous procdez de la sorte, le fichier vido sera reprsent comme un fichier audio
compress, et Sonal ne pourra pas le dessiner, ce qui est un peu pnalisant pour le
travail de synchronisation.
Pour pouvoir travailler les vidos dans de meilleures conditions, il existe une
deuxime mthode, qui consiste dabord ajouter lextraction sonore de la vido au
format WAV recommand (mono 8 ou 16 bit) dans le corpus, et de placer dans le
mme rpertoire la version vido, avec strictement le mme nom, hormis lextension,
qui doit tre *.Avi ou *.Mpg. Sonal reprera cette vido et lutilisera dans le lecteur,
mais il dessinera la version WAV qui lui est associe.
La boite de dialogue qui apparat recherche des fichiers Word (*.Doc, *.Docx) ou des
fichiers Texte (*.TXT) :
Attention, les fichiers Word ne seront correctement imports que si Word est
install sur votre machine. Sonal dialogue en effet avec le logiciel lui-mme. Si
vous avez un traitement de texte libre, utilisez-le pour exporter le contenu
textuel des fichiers word vers un fichier *.Txt. Le rsultat est strictement le
mme que si vous laviez import depuis word.
La reprsentation des fichiers texte suite leur importation est un peu diffrente de
celle des sons ou des vidos. Sonal cre doffice un seul trs long extrait non
thmatis quil faudra dcouper par la suite (voir ici)
Slectionnez les fichiers voulus et cliquez sur ajouter. Tous les fichiers seront ajouts
successivement.
Il faut en suivre les tapes. A savoir 1) commencer par choisir un format de fichier
(MP3 ou WAV), puis 2) cliquer dans la liste des fichiers (tous les fichiers au format
donn trouvs dans le rpertoire du projet). Ensuite, 3) dfinir lordre de
concatnation, voire retirer certains fichiers laide des boutons situs droite de la
liste. Il reste enfin 4) nommer le fichier de sortie qui runira les fichiers choisis dans
lordre choisi.
En cliquant sur concatner, vous allez lancer lexcution dun fichier *.BAT:
Si vous ne voulez pas renommer votre dossier, crez un projet dans un rpertoire
dont l'adresse ne contient pas d'accent ("C:\Concat\" par exemple) pour faire vos
fusions, avant d'importer les bandes fusionnes dans votre corpus principal.
Aprs dix secondes laisses au systme pour raliser la concatnation, votre nouveau
fichier va tre import.
Pour changer le nom du document et de tous les fichiers crs partir de lui, il suffit
de taper un nouveau nom et de valider avec entre.
Sonal vous demande une confirmation :
Aprs acceptation, lentretien, ainsi que tous les fichiers satellites sont renomms.
La mthode la plus simple pour y arriver est de placer dans le rpertoire du projet
une version compresse du ou des fichiers que vous voulez remplacer. Ils doivent
porter strictement le mme nom.
Puis, en cliquant sur le nom de lentretien en question dans la fentre de corpus,
vous verrez apparatre la page dinformations sur lentretien.
En haut de cette page est renseign le nom du document. Une case situe
immdiatement droite du nom renseigne son extension. Lorsque lon clique dessus,
les autres extensions disponibles dans le corpus sont rpertories. Dans lexemple cidessous, il suffit de cliquer sur le Mp3 pour que le document associ lentretien en
question soit la version mp3 et non plus WAV du fichier. Cette dernire pourra tre
supprime ou en tout cas retire du dossier de projet sans que cela change quoi que
ce soit pour Sonal.
Une autre mthode peut tre de demander lajout dun document sonore et de
choisir la version compresse du fichier que vous voulez remplacer. Sonal
comprendra que vous voulez effectuer le remplacement et vous demandera une
confirmation :
''
vous ajoutez une troisime, elle se nommera " exemple " et ainsi de suite.
Lorsqu'il lira ces pistes, sonal retirera automatiquement les ' la fin du nom et
chargera le fichier son d'origine. Cela implique qu'il faut faire attention
Nouvelle piste vierge vous permet comme son nom l'indique d'avoir une
nouvelle piste pour encoder librement le document en question.
La premire chose faire est de rgler le volume sonore. Lorsque le curseur indique
un volume adapt (ni trop faible, ni satur), vous pouvez dmarrer l'enregistrement.
Aprs avoir dfini le nom du fichier et choisi son format, vous pouvez lancer
l'enregistrement.
L'interface prend alors cette apparence :
Vous pouvez alors laisser "tourner la bande" jusqu' la fin de l'enregistrement, que
vous signifierez simplement en cliquant sur le bouton stop.
Une fois l'enregistrement termin, l'entretien est automatiquement ajout au corpus
courant et charg.
Si vous souhaitez gagner du temps dans vos retranscriptions, vous pouvez placer des
marqueurs en cours d'enregistrement, c'est--dire prdfinir les extraits et
ventuellement leur affecter une thmatique.
Pour ce faire, vous pouvez cliquer sur le bouton ci-dessous, ou simplement taper
entre, en notant que le curseur doit tre dans la zone de texte voue la saisie des
notes pour que la touche entre fonctionne :
Ce faisant, vous dfinissez la fin de l'extrait, auquel sera ajout le texte contenu dans
la zone de texte. Les diffrents extraits dcoups apparaissent par la suite par ordre
chronologique invers.
Si vous avez dj dfini des thmatiques, vous pouvez directement les affecter aux
extraits que vous avez dcoups en cliquant sur les petites flches en bout de ligne:
Il ne faut pas perdre de vue que les thmatiques nont pas quune fonction graphique,
elles interviennent dans les processus de filtrage et il faut donc les envisager comme
de futurs moyens de distinguer les diffrents passages. Dans la mesure o il est
possible de superposer plusieurs thmatiques pour un mme extrait, on gagne faire
en sorte que les diffrentes thmatiques sexcluent les unes les autres.
Pour crer des thmatiques dans un corpus, il faut soit aller dans le menu
thmatiques puis choisir grer les thmatiques , soit cliquer sur le bouton
Grer les thmatiques au sommet du panneau latral situ gauche de la page :
Vous devez dabord en dfinir le nom (zone de texte), la couleur (cliquez sur choisir
une couleur ), puis valider.
Dans la mesure o aucune modalit nest renseigne pour les diffrents documents
du corpus, on trouve --- lintersection des lignes et des colonnes.
Cette modalit sera par la suite disponible la slection pour les autres documents.
Dans la fentre de tri plat qui apparat alors, vous pouvez modifier la variable et les
intituls des modalits. La logique est toujours la mme, cliquez sur ce que vous
voulez changer, puis validez avec entre pour enregistrer le changement.
Vous pouvez aussi utiliser la mthode suivante : faites un clic droit sur lentte de
colonne de la variable puis dplacez l jusqu la positionner sur la colonne o vous
souhaitez la placer.
NB : Dplacer une variable va consister dune part modifier le fichier corpus et tous
les fichiers RTR satellites rfrencs dans le corpus. La modification ne sappliquera
pas delle-mme tous les entretiens prsents dans le dossier du projet.
Dans le menu droulant, choisissez litem Suppr , situ tout la fin pour
totalement supprimer la variable.
Sonal vous crera alors un fichier tabul lisible par Excel ou Calc qui reprendra, pour
chaque ligne, les informations contenues dans la base de donnes.
Lorsque vous faites cela, Sonal cre une base de donnes au format Trideux dans un
dossier nomm Trideux qui est situ dans le dossier de votre projet. Cette base
porte le nom de votre corpus suivi de (DAT) .
Depuis la version 1.9, Sonal va directement lire dans cette base sans quil vous soit
ncessaire de lancer Trideux.
Linterface a alors cette apparence :
Lintrt de la fentre dexploration est quil vous sera possible de cliquer sur lune
des modalits pour avoir un nouveau tri plat, mais portant uniquement sur la
population en question. Vous pouvez ainsi creuser dans votre base volont :
La fentre dexploration vous permet en quelque sorte de faire des tris croiss
plat . Mais vous pouvez galement y raliser des tris croiss classiques, en cliquant au survol dune variable -, sur le bouton
situ en bout de ligne :
Si vous voulez utiliser des outils plus pousss pour vos analyses, vous pouvez
videmment ouvrir votre base directement dans Trideux.
Attention, si vous utilisez Sonal dans une perspective analytique, lencodage intgral
simpose. En effet, il faut encoder intgralement le son pour procder des analyses
chronomtriques, et retranscrire intgralement le texte pour procder des analyses
lexicomtriques.
Nous allons maintenant aborder les mthodes dencodage proprement dites. Vous
allez progressivement dcouvrir que Sonal vous permet de travailler de manire trs
personnalise en combinant les fonctions des diffrentes interfaces. Il y a cependant
6
Vous pouvez regarder la premire vido de ce tutoriel pour mieux comprendre la logique et faire
votre choix.
Fentre dcoute
7 Retranscrire intgralement
La retranscription intgrale est fortement recommande pour une utilisation de
Sonal des fins de recherche. Pour utiliser Sonal comme outil de retranscription
intgrale, la mthode la plus pratique est dutiliser la fentre de lecture (reader), qui
est spcifiquement dvolue cette tche7.
La bande se lance. Vous pouvez larrter avec la barre despace de votre clavier.
Pour plus dinformations sur cette page, voir ici, cette partie indique seulement les
oprations raliser pour retranscrire.
Pour gagner du temps, commencez par paramtrer les locuteurs (3) puis activez le
mode dicte (4). Il est prfrable dactiver le mode dicte automatique (5).
1
Dans cette configuration, vous tes prt(e) commencer la saisie, mais avant de
commencer retranscrire, il est important de paramtrer les raccourcis de locuteurs,
qui vous permettront de gagner du temps dans la saisie.
Les locuteurs sont paramtrs par dfaut de R1 R11. La premire ligne est rserve
la question. Pour modifier la chaine de caractres associe par exemple la touche
F1, il faut tout simplement cliquer sur l'tiquette qui contient le code "R1", taper ce
que vous voulez voir renvoy la place, par exemple "Question ?", puis valider avec
la touche entre.
Touche Entre
pour valider
Une fois vos raccourcis paramtrs, vous pouvez commencer la saisie proprement
dite.
Si vous voulez sauter une ligne et non pas passer la portion suivante, tapez ctrl +
entre.
La lecture reprend une seconde avant la fin de la portion prcdente et lit la portion
suivante, avant de sarrter. Vous pouvez de nouveau faire alt+espace pour
redmarrer ou arrter la bande, et retranscrire confortablement la portion, avant de
la valider.
Vous progressez ainsi jusqu ce que la portion de dicte courante dborde de
lextrait de 15 secondes que vous avez cr initialement.
Tout lintrt de la dicte est quau fur et mesure des validations, lextrait va
sallonger progressivement, sans intervention de votre part.
Si vous nutilisez pas le mode dicte, vous pouvez toujours allonger manuellement
vos extraits en les dplaant par glisser/dposer la souris.
- La dicte "automatique"
Attention, cette fonction nest disponible quavec les fichiers WAV Mono et elle est
beaucoup plus prcise avec les fichiers encods au format 16bits. En phase de
retranscription, il est donc conseill de convertir les fichiers au format Wav, quitte
leur substituer ensuite des fichiers compresss.
Lorsque la dicte automatique est active, Sonal commence par tudier le son de la
portion considre et propose un dcoupage. Les portions proposes sont
reprsentes dans la barre de synchronisation, travers des lignes pointilles :
Zone de silence
Elle vous permettra dabord de rgler le seuil de dtection du silence . Les boutons
situs sur la droite vous permettront dlever ou de diminuer le niveau de dtection
des blancs :
Choisissez alors le locuteur dans la liste qui apparat : Sonal vous place un point de
synchronisation suivi de la balise du locuteur en question la suite du texte
retranscrit.
- La sauvegarde automatique
La case en forme de disquette signifie que les modifications de lextrait seront
mmorises chaque validation de portion de dicte.
Le petit plus situ tout en bas droite vous donnera des informations
complmentaires que vous pouvez ne pas vouloir connatre
- La correction orthographique
Sonal vous permet de vrifier lorthographe du texte saisi soit en cours de frappe (les
mots mal orthographis apparaissent en rouge, soit de manire globale, en vrifiant
tout lextrait.
Vrifier lorthographe
Vrifier
lorthographe
cours de saisie
en
avant de la relcher.
Une fois lextrait cal, cliquez sur le bouton de validation de lextrait situ en bas de
page:
Vous pouvez remarquer que les balises de locuteurs sont normalises ( Question :
au lieu de [>question?] ), que les questions sont grises et que les points de
synchronisation sont reprsents sous la forme dun petit bouton
. Lorsquon
clique dessus, la bande est ramene leur position. Ces points figurent galement
dans la barre de synchronisation situe immdiatement au dessus de la zone de texte.
Si lon clique dessus, cest le texte correspondant qui est affich. Cest donc un
moyen de naviguer rapidement dans le texte, de resynchroniser laffichage des deux
supports.
Vous pouvez remarquer que le prcdent extrait est gris. Seul lextrait en cours
ddition est reprsent dans sa couleur relle.
Le nouvel extrait est immdiatement coll au prcdent car la logique de cette
page est la retranscription intgrale. Pour crer un encodage discontinu (qui
ignore certaines parties), il vaut mieux (commencer par) encoder le son (voir
partie suivante). Si toutefois vous avez des passages inaudibles ou absolument
sans intrt (absence du rpondant) au milieu dune retranscription intgrale,
rien de vous empche de crer un extrait, de lallonger sans le retranscrire (
En parallle, chaque sauvegarde, une copie de ce fichier est cre dans le dossier
Restaur situ dans le rpertoire de projet. 10 versions successives sont
sauvegardes, numrotes entre parenthse (1) (10). Pour restaurer ces versions
prcdentes depuis Sonal, utilisez le bouton ci-dessous :
En cas de difficult, il est toujours possible daller copier la version la plus rcente de
ce fichier dans le dossier Restaur, et de le coller la place du Rtr courant, en retirant
son numro la fin du nom.
Pour parer toute ventualit, vous pouvez raliser un dossier de sauvegarde, depuis
la fentre de corpus :
Sonal crera, au nom demand, un dossier qui contiendra une copie des fichiers Rtr
de tous les entretiens du projet, et du fichier de corpus. Ces fichiers seront ensuite
votre disposition pour une restauration en cas de problme. Les fichiers en question
sont trs lgers, vous ne risquez pas la surcharge en crant frquemment des
dossiers. Faites-le chaque fois que vous aurez bien avanc dans votre travail.
Lexport est alors effectu au format *Rtf, qui peut tre lu par la plupart des
traitements de texte. Choisissez un nom et une adresse pour le fichier cr ; il sera
cr puis ouvert avec votre traitement de texte par dfaut.
Lexport est ralis par dfaut avec les informations sur les extraits, sans balises de
synchronisation, et avec la reproduction dans le texte des passages pondrs.
Pour obtenir plus doptions, vous pouvez utiliser le menu accessible depuis la page
contenant les informations dtailles sur lentretien (on y accde en cliquant sur le
nom de lentretien dans la page de corpus. Puis, il faut cliquer sur le bouton cidessous et choisir les options voulues avant de cliquer sur lun ou lautre des exports :
soit directement vers Word (il faut que vous ayez Microsoft Word install sur votre
machine), soit vers nimporte quel traitement de texte, par le truchement dun fichier
*Rtf quil vous faudra dfinir avant enregistrement:
Afficher les formats : reprsenter dans le texte les parties pondres (cette
fonction nest pour linstant disponible que dans lexport en *Rtf.)
Vous arrivez alors sur la page de visualisation dtaille de lentretien que vous avez
choisi dencoder. Cette page vous permet dcouter ou de regarder les documents :
Si votre document est une vido, cliquez sur le bouton vido pour voir limage
associe au son :
Pour quitter cette fentre, vous pouvez utiliser la touche Echap ; votre retour dans
cette fentre, la lecture reprendra l o vous lavez laisse.
Pour vous dplacer vers la gauche ou la droite, utilisez les touches ou les boutons
<- et -> .
Pour zoomer ou dzoomer, utilisez les touches ou les boutons + ou -
encodage continu, ce qui revient chapitrer les bandes. On parle alors dencodage
la vole. De plus, lencodage la souris est source derreurs. Vous risquez de
superposer involontairement des extraits, ce que la fentre dcoute sait grer, mais
sans entrain particulier, car le fonctionnement de Sonal nest pas vraiment prvu
pour a.
Vous pouvez alors choisir parmi les thmatiques existantes. Si vous souhaitez en
ajouter une, cliquez sur le petit bouton + situ en haut droite de la fentre de
slection des thmatiques. Vous devrez alors dfinir un nom et une couleur pour la
thmatique ajouter, puis la slectionner dans la liste.
Une fois la thmatique slectionne, lextrait prend la couleur de la thmatique
voulue :
Une fois quun extrait se voit associer une thmatique, lorsquon reclique sur le nom
de la thmatique associe, laffichage prend une forme diffrente:
En pareil cas, sil ny a aucun extrait dans lentretien la portion dbute zro ; sinon,
Sonal repart de la fin du dernier extrait cr, mme sil y a des portions vierges avant
lui.
Une fois que vous avez dfini un point de dpart, la lecture progresse en allongeant
au fur et mesure votre extrait. Un calque gris clair sallonge progressivement pour
matrialiser lextrait en cours de cration. Vous pouvez modifier sa longueur en
cliquant dans la partie zoome de la bande en bas de la page. Il est ainsi facile de
revenir quelques secondes en arrire pour dfinir prcisment une fin dextrait.
Ces fonctions sont galement accessibles laide des boutons ci-dessous, qui
remplacent le bouton Nouvel extrait aprs quon la utilis :
Placer un point de synchronisation
dans les annotations.
On peut y saisir du texte libre dcrivant le contenu de lentretien, ou de que lon veut.
Attention, la barre despace ne permet plus le contrle de la bande lorsque lon
utilise cette fonction. Celle-ci retrouve sa fonction originale.
Vous pouvez donc ainsi trs facilement encoder tous vos entretiens la vole, dans le
temps ncessaire ou presque pour les couter.
En utilisant les fonctions dacclration ou de ralentissement de lecture (cidessous), on peut notablement acclrer ce travail.
Vous arrivez alors sur la fentre de saisie, qui vous permet de modifier le contenu de
lextrait, c'est--dire dy associer du texte (typiquement, de retranscrire son contenu),
et de dfinir sa thmatique. Les fonctionnalits de la fentre de saisie sont
prsentes plus bas.
Lorsque lon clique un endroit sur lextrait, celui-ci se divise en deux parties. Les
deux parties conservent la mme thmatique.
En revanche, lextrait situ gauche du point de coupure conserve le texte de
lextrait initial tandis que celui de droite sera vierge :
Le curseur prend alors la forme d'une paire de ciseaux, avec des bordures d'extraits
fictives.
Une fois la thmatique choisie, les pages correspondant lextrait sont colories.
Logiquement, l'extrait que vous venez de dbuter s'tire jusqu' la fin du document,
car vous vous tes content de scinder l'extrait global, il vous faudra donc placer une
nouvelle bordure la suite pour dfinir la fin de l'extrait que vous venez de
commencer. En affectant "Pas de thmatique" l'extrait suivant, on peut laisser
vierge de tout codage la suite de l'entretien, jusqu' la dclaration d'un nouveau
dbut d'extrait :
On peut par exemple superposer plusieurs thmatiques par extrait pour prendre en
charge les parties qui peuvent tre encodes avec plusieurs thmatiques :
10 Resynchroniser
une
retranscription
La resynchronisation revient dcouper simultanment les versions audio et texte
d'un entretien en renseignant priodiquement dans le texte la position dans la bande
correspondante, soit sous la forme d'un point de synchronisation, soit sous la forme
de bordure d'extrait.
La resynchronisation peut vous permettre, si vous dcouvrez Sonal au milieu dune
recherche, dintgrer des entretiens dj retranscrits dans votre corpus, pour pouvoir
les soumettre au mme cadre analytique que ceux que vous saisirez dans Sonal, tout
particulirement en matire chronomtrique. Si seules fonctions de synthse et
d'analyse lexicomtrique vous intressent, vous pouvez aussi vous contenter de
dcouper le texte, sans lui associer de bande (voir encoder les documents textuels).
Une fois dans la page de lecture, dans le menu Entretiens, choisissez, en fonction
du format du fichier qui contient la retranscription de lentretien lun ou lautre des
items du menu. Vous avez deux formats possibles. Si votre fichier est au format word,
choisissez doc ou docx.
Si vous navez pas Word, exportez votre fichier dans le bloc note au format *.txt et
choisissez ce format pour limportation.
Ciblez le fichier qui contient les retranscriptions, choisissez ouvrir.
Attention, si vous aviez dj commenc encoder le fichier, tout ce que vous avez
fait sera cras! Un message vous prvient au cas o. Assurez vous de ne pas faire de
fausse manipulation.
Aprs importation, le texte du fichier va tre associ lentretien dans un seul et
unique extrait dnu de thmatique, dont la dure sera gale celle de lentretien.
La barre de navigation en haut de la page se strie de gris (ce qui renvoie labsence
de thmatique) et le texte de lentretien apparat dans son intgralit :
Attention, cette fonction rencontre parfois des difficults avec les caractres
imports de Word, qui ne sont pas toujours reconnus. Une mthode simple et
efficace consiste faire un rechercher/remplacer directement dans le fichier
*.rtr de lentretien, en prenant garde que Sonal ne soit pas en marche, du
moins quil ne lise pas ce corpus au moment o vous ditez les *.rtr (sinon vos
modifications risquent dtre crases par les sauvegardes suivantes ralises
par Sonal).
Il est important que les timecodes soient les plus prcis possibles. Mentionner la
minute sans prciser les secondes aboutit une erreur de placement qui peut
logiquement aller jusqu une minute. Cest beaucoup, beaucoup trop pour Sonal. Il
faut donc que les coordonnes dans le texte correspondent bien celles dans la
bande. Il vaut mieux ne pas avoir du tout de points de synchro que des points de
synchro errons.
Quand un point dsigne une mauvaise position, et quon ne sait pas si la vraie
position du texte est loin avant ou aprs ce point, cest pour le moins droutant.
Mme si la lecture du texte en parallle de lcoute permet de se reprer, on
doit donc ttonner en aveugle autour du point et cest parfois assez long.
Dautant que le systme de calcul infrentiel des positions (qui permet
dapproximer la position dans la bande dun passage textuel et inversement)
est totalement dtraqu par lexistence de points trs imprcis.
Si, aprs conversion, vous vous apercevez que les times codes sont trop imprcis et
que les points de synchronisation sont mal placs, une fonction vous permet de
dbarrasser les entretiens de tous leurs points de synchronisation. Elle est accessible
dans le menu balises de la page de lecture :
Important : il y a parfois des lments non retranscrits en fin de bande, par exemple,
quelques minutes dchanges informels qui sont prsents sur la bande mais pas dans
le texte. Cela peut tre problmatique pour lestimation des positions, pour des
raisons assez logiques. Ecouter immdiatement la fin de lentretien et vrifier que la
bande et le texte sarrtent bien ensemble peut vous faire gagner du temps.
Une fois la bonne occurrence du mot trouve dans le texte, aprs avoir cal la
bande et le verbatim, vous pouvez placer un point de partition.
4) Dcoupe
Placer un point
synchronisation.
de
- le bouton
vous permet de supprimer le point de synchronisation, ce qui ne sert
en gnral que si vous avez cr un point en trop, ou quil nest pas correctement
plac.
Ces points sont dits drivants . Ils sont une forme particulire de point de
synchronisation.
Avant de cliquer sur Ajouter des points drivants , choisissez les options
immdiatement sous le bouton : o les points doivent tre placs, quelle frquence
etc.
Des points drivants vont apparatre l o vous lavez demand.
L aussi, le calcul est dautant plus long que les extraits le sont eux-mmes. Le
prdcoupage de lentretien en quelques grands extraits acclrera donc le
processus.
Validation, avec entre. Le point devient sensible au dplacement (il est bleu et des
caractres < et > sont placs ses extrmits). Si vous utilisez les flches <- et ->, le
point se dplacera vers la gauche ou vers la droite.
Astuce : si le point a une position trop anticipe (trop gauche), pour viter davoir
le dcaler un grand nombre de fois vers la droite, vous pouvez taper ctrl+entre, le
point est alors valid la position atteinte dans la lecture.
Aprs validation, le point redevient normal et les flches retrouvent leur fonction
originale. On passe ainsi de point en point et cest un rel gain de temps.
Une fois les points drivants jugs utiles corrigs, vous pouvez supprimer tous ceux
que vous avez ignors.
11 Redcouper
un
document
audio-textuel
Cette partie vise vous montrer comment il est possible de transformer
continuellement le dcoupage des documents audio-textuels lintrieur de la page
de lecture. La trame temporelle contenue dans le texte va vous permettre deffectuer
des dcoupages simultanment dans le texte et le son, en scindant ou fusionnant des
extraits de part et dautre des positions connues. Ces fonctionnalits vous seront par
exemple particulirement utiles si vous avez retranscrit intgralement vos entretiens
sans procder un dcoupage, et que vous souhaitez par la suite raliser un
encodage thmatique des fins danalyse.
Cela implique que les fonctions prsentes maintenant ne sont utiles que si votre
entretien est synchronis, ce qui doit tre le cas si vous avez retranscrit dans Sonal. Si
votre entretien nest pas synchronis, commencez par le resynchroniser.
Les fonctions de redcoupage de documents audio-textuels prennent place dans la
fentre de lecture. Elles sont trs fastidieuses oprer dans la fentre dcoute, qui
ne permet pas vraiment de prendre en compte la fois le texte et le son.
Couper
- le bouton
vous permet de transformer le point de synchronisation en borne
dextrait ; concrtement, de dcouper en deux lextrait de part et dautre du point de
synchro.
Une bordure dextrait apparatra alors dans le texte. Les trois boutons en bout de
ligne vous permettent dditer le texte de lextrait, de modifier sa thmatique ou de
supprimer la bordure.
Thmatique
Editer
Supprimer
12 La pondration qualitative
Une fois les extraits retranscrits, Sonal vous propose une dernire couche
dencodage, facultative, mais qui est susceptible de vous rendre service en phase de
rdaction. Cette fonction se nomme pondration qualitative .
Lintrt de cette pondration qualitative est quelle pourra tre utilise pour filtrer
les extraits et leur contenu textuel : en phase danalyse thmatique vous pourrez ne
voir et nexporter que les passages pondrs un certain niveau.
Bien sr, le logiciel vous rendra ce que vous lui donnerez : gare donc aux effets de
renforcement circulaire dans les analyses.
Si la case de mise en forme des balises est coche, ces balises sont mises en forme
(voir ci-dessous).
On survole ensuite le texte jusquau dernier mot de la portion marquer, sur lequel
on va cliquer nouveau. Un menu va apparatre :
Une fois le poids confr, le texte prend la forme voulue et la pondration est
rappele en marge du texte :
Lorsquun mot est pondr, on ne peut plus lutiliser comme point de dpart
ou de fin pour une pondration. Cela empche de dbuter ou de terminer une
slection cheval sur une autre. En revanche, une pondration peut en
englober une autre. Par exemple, vous pouvez avoir toute une partie +1 et
seul un passage lintrieur de cette partie +3 mais, pour obtenir ce rsultat,
il faut commencer par marquer le passage +3 puis lenglober dans un
marquage plus gnral +1.
Aprs avoir ajout des mots cls, placez le curseur dans la zone de texte
principale pour voir la mise en forme.
Cette fentre apparatra si vous cliquez sur la liste des tags en tte des extraits dans
les fentres de lecture (cf ci-dessus), ou si vous cliquez sur limage ci-dessous dans les
diffrentes fentres :
Les mots-cls sur lesquels vous voulez agir doivent tre slectionns dans la liste de
gauche. Ils apparaissent alors dans la liste de droite. Vous pouvez les en retirer en
cliquant dessus. La zone de texte au sommet de la liste de droite vous permet de
dfinir le nouveau nom affecter au(x) mot(s)-cl(s) choisi(s).
Il ne vous reste qu dfinir si vous voulez que ce codage sapplique tout le corpus
ou aux seuls extraits actifs. Puis cliquez sur recoder. Aprs un message de
confirmation, Sonal ira transformer les mots-cls des diffrents extraits retenus.
Analyser un corpus
14 Organisation
gnrale
du
systme danalyse
14.1 Choisir (ou pas) un angle dapproche des donnes
Sonal vous propose danalyser votre corpus de trois (ou quatre) faons. Ces
approches peuvent tre utilises en parallle, tout au long de la construction du
corpus. Chaque mthode partage avec les autres une logique commune : on va filtrer
les extraits sur la base de leur thmatique, du type dentretien dont ils sont issus, de
leur contenu textuel ou de leurs mots cls, avant danalyser le rsultat de ce filtrage
de diffrentes manires.
La quatrime approche propose ce jour par Sonal repose sur les balises de
locuteurs. Si les prises de paroles sont correctement renseignes, Sonal vous
propose danalyser la dynamique des conversations sur la base du nombre de
mots utiliss par linterrogateur et par ses rpondants. Cest lanalyse des
interventions (ADI).
Dans Sonal, un extrait cest donc 1) une dure de bande, 2) du texte, 3) une
thmatique 4) une srie de mots-cls et 5) des caractristiques tires de la base de
donnes o sont enregistres des informations sur lentretien duquel est issu
lextrait. Cest sur la base de ces diffrents attributs que les extraits vont tre activs
ou non.
Dun point de vue graphique, Sonal offre une reprsentation trs intuitive des
filtrages puisque les analyses portent sur les extraits allums reprables dans le
mur du corpus.
Corpus filtr (certaines thmatiques et certains entretiens sont dsactivs)
Il faut savoir que les filtrages oprs sont transversaux dans le logiciel. On peut filtrer
les extraits depuis le corpus (cf. ci-dessus), mais on peut galement demander des
filtrages lintrieur des fentres danalyse spcifiques (lexico ou chronomtriques).
A chaque fois, les filtrages oprs un endroit sappliquent tout le reste des
interfaces.
Le nuage de tags reprsente les mots cls en ajustant leur police leur frquence :
plus un mot cl est frquent, plus il est gros. En cliquant sur un mot cl, on accde
directement la fentre de synthse o sont compils tous les extraits qui
contiennent le mot cl en question. NB : Les autres critres de filtrage restent
oprants.
La fentre qui apparat alors vous permettra de relire et/ou de rcouter tous les
extraits slectionns. La colonne de gauche contient tous les extraits retenus.
Lorsque lon clique sur lun dentre eux, la bande son se lance et le texte de lextrait
apparat dans la partie droite de la page. Une fois un extrait termin, Sonal lance
automatiquement le suivant.
Si lextrait contient des points de synchronisation, un petit bouton + apparat
sur la gauche de ltiquette dextrait. Au clic, la liste des points apparat sous
ltiquette de lextrait. Vous pouvez ainsi accder plus rapidement certains
passages.
Libre vous dutiliser par la suite le cadre interprtatif quil vous plaira; Sonal se
contente de vous mettre disposition linventaire exhaustif des extraits portant sur
un sujet donn et/ou tant issus de certains (types) dentretiens. On parle donc
danalyse qualitative car elle repose sur une dmarche interprtative mais il ny a pas
Si vous cliquez sur la case filtrer extraits , le contenu des extraits retenus est filtr
pour ne plus afficher que les passages du poids demand. Cela peut tre utile pour
exporter un recueil de citations juges illustratives vers un traitement de texte en
cours de rdaction.
Aprs avoir prpar votre export en cochant (ou pas) les diffrentes cases doption,
vous pouvez choisir dexporter directement dans Word (si vous avez Microsoft Word)
ou bien denregistrer lexport au format *.Rtf, que votre ordinateur ouvrira avec le
traitement de texte courant.
Les options disponibles sont les suivantes :
Informations sur les interviews : afficher le contenu de la base de donnes
pour chaque entretien
Observations sur les interviews : afficher les observations sur les diffrents
entretiens
Informations sur les extraits : voir les coordonnes temporelles et les
thmatiques des extraits
Afficher les balises : voir les points de synchronisation (convertis en
HH :MM:SS)
Afficher les formats : reprsenter dans le texte les parties pondres (cette
fonction nest pour linstant disponible que dans lexport en *Rtf.)
La fentre de synthse peut donc galement tre utilise pour faire des modifications
slectives dans votre corpus.
16 Lanalyse lexicomtrique
Pour lancer une analyse lexicomtrique, cliquez sur le bouton Lexico situ dans
la page de corpus.
Base lexicale
Lorsque vous cliquez sur le bouton Lexico dans la page du corpus, si vous avez dj
cr cette base, le logiciel la chargera, sinon il en crira une nouvelle, ce qui prendra
Vous aurez alors la possibilit de recharger les lemmes cres dans la nouvelle base.
Des barres bleues reprsentent ces frquences suivant une chelle logarithmique.
Cest loccasion de vrifier la fameuse loi de Zipf, que traduit (normalement) la
dcroissance trs progressive des occurrences des formes lintrieur dun corpus .
La liste reprsente les formes tries dabord par pourcentage de spcificit, puis par
occurrences, ce qui veut dire que vous avez au sommet de la liste les formes
exclusives les plus frquentes.
Lafon Pierre. Sur la variabilit de la frquence des formes dans un corpus. In: Mots, octobre 1980,
N1. pp. 127-165.
Vous pouvez choisir de ne retenir que les formes dont la longueur est infrieure un
certain nombre de caractres. Pas dfaut, Sonal limite laffichage aux mots de plus de
2 caractres.
Vous pouvez galement choisir un plancher pour le nombre doccurrences. Celui-ci
doit tre fonction du nombre doccurrences total et de la finesse du filtrage.
Dans le cas dune analyse factorielle, il peut tre bon de placer un plancher
daffichage adapt pour limiter le nombre de formes tudies moins de 9999.
Pour ce faire, deux possibilits soffrent vous. Parmi les boutons qui apparaissent
droite du mot survol, les deux premiers servent accder au dtail de ses
occurrences.
Le premier vous permet daccder la synthse des extraits contenant le lemme
slectionn (le mot ou les mots regroups sous un mme terme).
Depuis la version 1.9 de Sonal, vous avez le choix de voir uniquement les occurrences
prsentes dans les extraits retenus ou toutes les occurrences de la forme tudie.
Cest en cochant ou non la case tenir
compte du filtrage que vous choisirez de
voir ou non toutes les occurrences du
corpus. Le cas chant, toutes les
apparitions du mot choisi seront recenses,
Voici le sens des graphiques apparaissant dans la partie latrale gauche de la page :
La barre bleue gauche reprsente les effectifs; la barre de droite bleue ou rouge
reprsente la probabilit calcule avec lindice de spcificit de P. Lafon pour que ces
effectifs soient observs dans la catgorie comme ils le sont (une fois encore, cette
indice na de sens que si vous ne filtrez pas les occurrences).
Les boutons au sommet de ce panneau vous permettent de trier les mots. Le premier
correspond au mode de tri qui est affich au dmarrage (toutes les catgories, qui
mlange les thmatiques, les entretiens et les variables, qui peuvent tre
redondants), le second vous permet de trier par entretien, le troisime par
thmatique, et enfin, le quatrime, par variable. A chaque fois, en cliquant sur une
sous-catgorie, vous serez ramen aux extraits correspondants.
16.6 La lemmatisation
Sur la partie gauche du panneau consacr la lexicomtrie, diffrents boutons vous
permettent de modifier la base lexicale et de lancer des analyses.
La lemmatisation consiste regrouper sous un mme terme diffrents mots qui
partagent par exemple une racine commune, ou qui se rfrent un mme champ
lexical. Concrtement, cela revient par exemple mettre sous le terme manger
toutes les formes conjugues (ou flchies ) du verbe manger : (je) mange, (nous)
mangeons (quil) manget etc. Cela peut aussi consister mettre au singulier tous les
pluriels etc. Cela permet de diminuer le nombre doccurrences diffrentes dans la
base, et de durcir un peu les rsultats statistiques.
Sonal vous laisse le choix de lemmatiser ou non votre corpus et de le faire soit de
manire automatique, soit manuelle. De plus, pour viter les cueils lis
lautomatisation, vous pouvez revenir tant que vous le voulez sur les lemmatisations
opres, car le contenu dun lemme reste accessible et les formes regroupes
peuvent toujours faire lobjet dune analyse individualise, et tre dtaches du
groupe.
Vous devez dabord slectionner les mots que vous voulez regrouper (1). Pour cela
cliquez simplement sur les mots dans la liste. Pour faire une slection collective,
enfoncez le bouton de la souris sur le premier mot de la srie puis descendez la souris
sans relcher le bouton. Cliquez ensuite sur le bouton Regrouper (2) qui vous
affiche une fentre de lemmatisation rcapitulant toutes les formes slectionnes.
Dans la zone de texte en bas de la page, donnez un nom pour le groupe cr (3),
(pour faciliter la remmoration quil sagit dune forme synthtique, vous pouvez
prendre le parti de placer un petit + la fin). Cliquez enfin sur lemmatiser pour
valider. Votre nouveau groupe va tre cr. Si le nom de groupe existe dj, les mots
seront simplement ajouts au groupe existant.
La base est partiellement rcrite puis trie. Cette opration peut prendre un certain
temps si le groupe contient beaucoup de mots diffrents
Files\Sonal\). Cela implique que votre dictionnaire des mots outils est partag entre
vos diffrents corpus. La liste des mots outils est vierge linstallation, vous devez
lenrichir progressivement. Une bonne mthode est de trier les mots par occurrences
avant toute lemmatisation. Les mots les plus courants sont gnralement les moins
significatifs et peuvent tre limins collectivement.
- La lemmatisation automatique
Le bouton Lemmatiser la base propose une lemmatisation automatique de toute la
base. En cliquant sur la flche pointant vers le bas droite du bouton, vous pourrez
choisir les diffrentes options. Pour
linstant, est propose la lemmatisation
des verbes, des pluriels (simples ! (s), pour
linstant), des nombres et des mots outils.
A chaque fois quun groupe est cr, la
forme synthtique affecte tous les mots
qui en font partie est suivie dun +.
Cette procdure est trs rudimentaire et
ne gre aucune exception. Aussi, il est
gnralement ncessaire de revenir sur les
regroupements oprs.
Sonal cre alors un fichier portant le nom du corpus avec lextension *.lem
Ce fichier mmorise, pour chaque forme donne, le lemme associ.
Formes regroupes
Retirer du lemme
Attention, les catgories analytiques utilises dans le tableau lexical doivent tre
prsentes dans votre corpus. Si vous navez pas cr de variable par exemple, le fait
de demander un dcompte des occurrences par variable fera planter le systme En
pareil cas, il faudra dcocher la case Variables avant de lancer le calcul du tableau.
Cibois Philippe, Le traitement des mots associs des questions : lapport du logiciel
Trideux in Didier Demazire, Claire Brossaud, Patrick Trabal et Karl Van Metter (dir.),
Analyses textuelles en sociologie. Logiciels, mthodes, usages, Rennes, Presses
Universitaires de Rennes, 2006, p.156-173
10
Cibois Philippe, Eclairer le vocabulaire des questions ouvertes par les questions
fermes : le tableau lexical des questions, Bulletin de mthodologie sociologique,
n26, 1989, p.12-23.
Autre information importante : le tableau lexical ne peut contenir plus de 9999 lignes
(soit 9999 formes diffrentes). Cela laisse une certaine marge mais ce plafond nest
pas du tout infranchissable. Au besoin, augmentez le nombre minimum
doccurrences pour filtrer la base.
Une fois le tableau lexical cr, il vous est propos de louvrir, pour visualiser son
contenu et ventuellement le traiter dans dautres applications. Vous ntes en rien
oblig de louvrir, mais cela peut vous permettre de mieux comprendre de quoi il
retourne. Pensez seulement le refermer pour pouvoir passer la suite.
Pour obtenir une reprsentation de type factoriel des carts lindpendance
lintrieur de ce tableau lexical, cliquez sur le bouton Analyse factorielle.
La fentre danalyse factorielle souvre alors.
Ce plan, que vous pouvez paramtrer avec les diffrentes options situes sur la partie
gauche de lcran, vous permettra de faire ressortir des typologies articulant le
langage utilis (en noir) et les diffrentes catgories (en bleu). Pour une meilleure
comprhension de la mthode et de la manire dont il faut lire ses rsultats, je vous
renvoie aux publications de P. Cibois sur le sujet.
17 Lanalyse chronomtrique
17.1 A quoi sert lanalyse chronomtrique?
Lanalyse chronomtrique vous permet dtudier les temps de parole consacrs aux
diffrentes thmatiques de votre corpus. En analysant le temps pass sur chaque
sujet, elle rpond la question de savoir qui parle de quoi, et pendant combien de
temps? Ces informations peuvent tre prcieuses pour dceler ou confirmer de
grandes tendances dans la propension des diffrents types de rpondants parler de
diffrents sujets.
Le graphique circulaire peut tre export en utilisant le bouton Export image qui
vous permettra denregistrer limage (au format Bitmap) au nom et lemplacement
voulus. Cest peu de choses prs une copie dcran.
Pour lanalyse dun entretien donn, ou dun type dentretien, utilisez les boutons de
filtrage. Les panneaux (thmatiques, entretiens, variables) vous permettront daffiner
vos analyses.
Cette mthode se borne une analyse locale qui ne permet pas proprement parler
de comparaisons. Vous pouvez videmment alterner les filtrages pour reprer
visuellement les variations entre entretiens ou types dentretiens, mais ce nest pas
forcment trs pratique. Des amliorations de linterface sont en cours. Dici l, la
meilleure solution pour analyser les temps de parole est encore dexporter les
rsultats pour travailler hors de Sonal.
En cliquant ensuite sur le bouton Export trideux, vous lancerez lcriture dune base
lisible par Trideux. Elle sera situe dans le dossier du projet, dans un sous dossier
nomm Trideux\. La base cre portera le nom du corpus, suivi de (HMS). La base
contient pour premires variables les thmatiques et les entretiens du corpus. Puis
les diffrentes variables de votre base de donnes.
Les units de temps peuvent ensuite faire lobjet dune analyse similaire celle qui
serait produite partir de rponses individuelles.
Depuis la version 1.9, Sonal importe une
fonctionnalit cre initialement pour
Trideux, la fentre dexploration, qui offre
une grande souplesse pour tudier les
diffrentes frquentes du corpus.
Cette fentre, laquelle on accde en
cliquant sur Explorer , vous permettra de
raliser des tris plat (analyse de frquence
univarie) et des tris croiss en allant
directement puiser dans la base Trideux
cre, sans avoir ouvrir le logiciel.
Lintrt de la fentre dexploration est quil vous sera possible de cliquer sur lune
des modalits pour avoir un nouveau tri plat, mais portant uniquement sur la
population en question. Vous pouvez par exemple cliquer sur une modalit de votre
tri des thmatiques et choisir ensuite la variable "Entretiens". Vous aurez alors le
temps passs sur ladite thmatique dans les diffrents entretiens. Vous pouvez ainsi
creuser dans votre base volont :
La fentre dexploration vous permet en quelque sorte de faire des tris croiss
plat . Mais vous pouvez galement y raliser des tris croiss classiques, en cliquant au survol dune variable -, sur le bouton
situ en bout de ligne :
Si vous voulez approfondir vos analyses, vous pouvez galement installer Trideux et
ouvrir votre base chronomtrique comme n'importe quelle base.
Une fois dans Trideux, toutes les fonctionnalits du logiciel vous sont accessibles.
Vous pouvez par exemple accder, via le bouton Tri plat, une reprsentation en
barres des temps de parole consacrs aux diffrentes thmatiques, de la dure des
diffrents entretiens ou le temps total par catgorie de rpondant.
Pour tudier plus en dtail les rsultats de votre tri plat, vous pouvez utiliser
lexplorateur de donnes, qui vous permettra, de manire intuitive, de creuser vos
catgories la manire de poupes russes.
Dans lexemple ci-dessous, les donnes sont tires dun corpus dentretiens
exploratoires raliss par des L2 de sociologie de lUniversit F. Rabelais, en vue de la
ralisation dune enqute par questionnaire. Les entretiens, relativement courts, ont
t encods thmatiquement et annots, avant dtre redistribus sous forme de
corpus audio aux tudiants. En parallle, chaque entretien sest vu qualifier par
quelques variables (sexe, ge du rpondant, sexe de lenquteur etc), ce qui a
permis davoir une vue globale de lchantillon, et dtudier les variations du contenu
des entretiens selon les caractristiques de lenqut comme de lenquteur. Dans
lexemple ci-dessous, on tudie la place des thmatiques dans les entretiens raliss
par des enqutrices, selon quelles interrogeaient des tudiantes ou des tudiants.
A savoir: afin d'viter que les informations ajoutes en apart ("rires" etc.) ne
nuisent au dcompte des mots, Sonal exclu du dcompte tout ce qui est entre
parenthses.
Lanalyse globale des changes se lance depuis la page de corpus, en cliquant sur le
bouton changes :
Chaque intervention est contenue dans un extrait qui est lui-mme contenu dans un
entretien. Elle rcupre donc la thmatique et les mots-cls de son extrait et les
attributs de lentretien duquel il est tir.
On peut ensuite oprer toutes sortes de dnombrements en croisant les
caractristiques du filtrage, exactement comme dans les analyses lexico ou
chronomtriques. Les mmes panneaux latraux sont disponibles pour cumuler les
critres.
On peut choisir de focaliser lanalyse sur les entretiens ou sur les thmatiques. Les
deux ne fournissent pas les mmes informations et il peut tre utile de croiser les
approches. Pour savoir sur quels sujets un rpondant est le plus prolixe par exemple,
on pourra choisir de visionner les rsultats par thmatique, et filtrer par entretien,
laide du panneau latral.
Les rsultats apparaissent sous la forme suivante :
Sonal va crer un fichier nomm ADI.xls (pour Analyse Des Interventions) dans le
rpertoire du projet.
Vous aurez la fois les rsultats globaux et le dtail des interventions prises en
compte.
Annexes
19 Utiliser
Sonal
dans
une
recherche collective
Sonal peut vous permettre de construire assez simplement un corpus partag entre
plusieurs chercheurs. Une bonne organisation, et une connaissance minimale de
lorganisation du logiciel vous permettront de vous en sortir trs facilement.
Le point essentiel comprendre est que Sonal interprte le contenu des fichiers
dencodage associs aux diffrents entretiens (*.Rtr) partir des catgories
renseignes dans le fichier corpus (*.Crp).
Par exemple, un fichier dencodage ne contiendra pas le nom des thmatiques
mais simplement leur numro ( 001 , 002 ), cest dans le fichier Corpus
que sera trouve linformation manquante, savoir que le code 001 ou
002 correspond telle ou telle thmatique. De mme pour les variables.
Chaque entretien contient des codes, mais le dictionnaire des variables est dans
le fichier corpus.
Cela implique simplement que tous les fichiers encods partir dun mme corpus
partageront une mme grille dencodage (thmatique et catgorielle) et pourront
tre lus identiquement depuis ce mme corpus. Autrement dit, pour pouvoir runir
des entretiens encods par diffrentes personnes, il faut que chacun travaille
partir dune version identique du corpus de dpart, que chacun ajoute ses
entretiens dans une version personnelle de ce mme fichier de projet et, aprs les
avoir encods, les rimporte dans un corpus collectif ventuellement partag en
ligne.
Corpus
Modle
Corpus
perso
Corpus
perso
Corpus
perso
Corpus
Collectif
Corpus
perso
la plus simple est dajouter la grille des thmatiques une catgorie attrape
tout , du type Pas de thmatique adapte . Si chaque chercheur y affecte
les extraits dont il ne sait pas quoi faire, il sera possible, une fois le corpus
fusionn, dinventorier les extraits non affects et de les redistribuer dans les
thmatiques idoines cres a posteriori.
Une autre mthode, un peu plus complique, consiste laisser plusieurs
thmatiques vierges chaque chercheur, afin de laisser chacun complter la
grille sa guise. Attention, cela implique danticiper les superpositions de
code : il faudra donc affecter des codes spcifiques chacun. Par exemple,
imaginons que vous ayez 25 thmatiques au dpart. Vous pouvez ajouter 5
thmatiques vierges par personne, en affectant les codes 30 34 au premier
chercheur, 35 39 au suivant, 40 44 au troisime, et ainsi de suite. Ainsi,
chacun pourra utiliser les thmatiques vierges qui lui ont t affectes pour
crer de nouveaux codes, en se contentant de modifier ses catgories
thmatiques. Par souci de clart, vous pouvez faire en sorte que chacun ne
voie que ses propres thmatiques vierges au moment de la distribution des
corpus modles (voir plus bas).
Une mthode assez pratique pour construire les dictionnaires contenant beaucoup
de catgories consiste utiliser un tableur. Il suffit de placer chaque information dans
une colonne (variable, modalit, libelle) et de concatner le tout en bout de ligne.
Dans lexemple ci-dessous, on peut voir comment crer simplement le dictionnaire
de la variable PCS au niveau 2 de lInsee (les intituls ont t recopis directement en
ligne):
fois tous les entretiens runis nouveau, il sera possible de remplir la base donnes
en une seule fois.
Mais au-del, les points de synchronisation permettent surtout doffrir une plus
grande souplesse dans lutilisation du logiciel. Ils permettent notamment de
redcouper les extraits (cf. plus bas) et amliorent le calcul de position.
Il y a donc un grand intrt en placer trs rgulirement dans le texte. Comment
faire ?
Au clic droit, les points de synchro (dans la barre de synchronisation comme dans le
texte) font apparatre un menu contextuel qui vous permet de faire diffrentes
choses :
- le bouton
vous permet dditer le texte de lextrait (cf. plus bas) en vous
positionnant prcisment au niveau du point de synchronisation. Cela peut par
exemple vous permettre de modifier manuellement la valeur du point ou de le
dplacer dans le texte.
- le bouton
vous permet de transformer le point de synchronisation en borne
dextrait. Concrtement, de dcouper en deux lextrait de part et dautre du point de
synchro.
- le bouton
vous permet de supprimer le point de synchronisation, ce qui ne sert
en gnral que si vous avez cr un point en trop, ou quil nest pas correctement
plac.
Point drivant
Comme ces points sont ajouts automatiquement, leur position est dtermine par
calcul : en se basant sur les coordonnes fiables autour du point (avant et aprs), et
sur le nombre de mots contenus dans ces limites, le logiciel infre la position
probable de la balise en question dans la bande, et lajoute comme point de synchro
dans le texte.
Evidemment, la qualit de lestimation est trs relative. Aussi ces points ont-ils la
particularit de se terminer par un ? (exemple : [621,5?]). Sonal sait donc quils ne
sont pas totalement fiables et recalcule leur position chaque modification de la
trame temporelle. Ds que lon corrige un point quelque part (par glisser dplacer),
les points environnants sajustent automatiquement cette nouvelle donne : la
validation dun point donne une base corrige pour lestimation de la position des
points environnants qui sont encore incertains. Concrtement, si vous dplacez un
point vers la gauche ou la droite, tous les points avant et aprs se dcalent dans le
mme sens. De cette manire, on dcale dun mme mouvement plusieurs points et,
logiquement, lestimation se fait de plus en plus prcise mesure que lon corrige les
points. Dans certains contextes (voir plus bas), ce procd est vraiment trs efficace.
22 Dbuguer un corpus
Malgr tous les efforts faits pour stabiliser lapplication et pour limiter les risques de
perte de donnes, il est toujours possible qu un moment donn, vous ayez
dbuguer votre corpus. Votre chance en loccurrence est que le fonctionnement de
Sonal est particulirement simple. Tout repose sur des fichiers texte avec un systme
de balisage rudimentaire. Il est donc toujours possible de corriger manuellement ce
qui dysfonctionne. Mais, pour ce faire, la premire chose faire est de se pencher un
peu sur le fonctionnement du logiciel pour en comprendre lorganisation densemble.
En pareil cas, Sonal ne retrouve pas ce quil cherche sur chaque ligne (code, couleur,
nom) et peut planter au moment du chargement des thmatiques.
Au besoin, nhsitez pas faire des copies du fichier corpus (que vous placerez dans
le mme dossier que loriginal) et tenter des modifications.
Une bonne mthode pour sassurer que le problme ne provient pas du corpus est de
faire une copie du fichier crp, et dy retirer tous les entretiens, c'est--dire de
supprimer les lignes entre les balises |ENTR|.
Aprs enregistrement, Si Sonal peut louvrir, cest bien que le problme provient dun
entretien en particulier, pas des paramtres du corpus.
Si jamais vous avez un doute sur lentretien fautif. Vous pouvez repartir de votre
corpus sans entretien et rajouter les entretiens (idalement par un ajout collectif). Au
moment du chargement des entretiens dans le corpus, vous pourrez voir au niveau
de quel entretien se produit le problme.
Pour tenter une restauration, il vous faudra simplement recopier le fichier dont le
nom se termine par (10) et le coller dans le rpertoire du projet en lieu et place
du Rtr effectivement utilis dans le corpus.
Cela implique de dabord renommer le Rtr de lentretien dfectueux situ dans
le dossier projet. Passer par exemple de NomEntretien.Rtr
NomEntretien(Ancien).Rtr puis de coller le fichier Rtr issu du dossier Restaur
sa place, en lui donnant exactement le mme nom, c'est--dire en retirant le
(10) situ la fin.
Les fonctionnalits non explicites, et qui ne sont pas prsentes ailleurs, sont rsumes page
suivante :
Ajouter un
document texte
Enregistrer un
entretien
Zommer/dzoomer
Mettre lchelle
Trier les entretiens
LIRE
Glisser/dplacer les
entretiens
Voir dtails
ECOUTER
Lire
Ecouter
Synthse
Exporter
Lorsque lon clique sur le nom dun entretien dans la page de corpus ( Voir dtails
dans la page ci-dessus), un panneau latral apparat sur la gauche, qui contient les
informations cls au sujet du document et qui permet un accs rapide certaines
fonctionnalits.
La partie suprieure du panneau contient des raccourcis qui vous permettent
dcouter, de lire lentretien, de voir sa synthse, de lanalyser chronomtriquement
et enfin de lexporter vers Word ou nimporte quel traitement de texte (via le format
RTF).
Renommer
(Changer
de) format
Observations
(validation par
entre)
Ajouter un point de
synchronisation
Choix de la
thmatique
Extrait
prcdent/suiv
ant
Vitesse
de
lecture
(si disponible)
Activer
dicte
le
mode
Voir la suite de la
bande
Dbuter
un
nouvel extrait
( la suite
lactuel)
de
Revenir la
taille dorigine
de lextrait
La partie infrieure contient le texte associ lextrait. Elle permet de retranscrire ou de commenter le contenu sonore de lextrait. Elle permet
aussi de contrler la bande tout en retranscrivant :
Contrle du lecteur
Lorsque vous travaillez dans une fentre ddition de texte, la barre despace ne peut pas tre utilise pour contrler la bande. Les fonctions de
pilotage ncessitent dutiliser le bouton Alt en mme temps que la commande.
Pour dmarrer ou arrter la lecture utilisez ALT + Barre despace
Pour vous dplacer vers la gauche ou la droite utilisez ALT + ou
Vrifier
lorthographe
cours de saisie
Lancer
vrification
complte
lorthographe
une
de
en
- Lire un entretien
23.5.1 Ouvrir la liseuse
Le bouton daccs la liseuse est plac immdiatement droite de celui de la page dcoute
dans la page de corpus car le choix de lune ou lautre approche. Le bouton reprsente une
page de texte.
- Confort de lecture
La liseuse vous offre les fonctions usuelles de mise en page (police, taille de police,
espacement, nombre de colonnes). Les boutons ddis sont juste au dessus du texte. Par
dfaut, la page est volontairement troite, pour amliorer le confort de lecture, mais vous
pouvez llargir en dplaant la bordure droite du cadre qui contient le texte.
Pour vous dplacer dans le texte, utilisez la molette de la souris ou lascenseur sur la droite
de la page. Cependant, pour effectuer des dplacements rapides, le plus simple est de
cliquer directement sur les extraits dans le spectre de lentretien qui est en haut de la page.
Vous disposez dune sorte d ascenseur horizontal qui vous permet de vous dplacer
prcisment dans le texte, il ne faut pas sen priver. Vous pouvez galement utiliser les
flches prcdent et suivant de part et dautre du bouton Play pour sauter dextrait en
extrait. Lorsque vous tes perdu dans le texte ou dans la bande, ces fonctions vous
permettent de vous retrouver trs facilement.
Lors dun clic sur un extrait, le texte et la bande se positionnent au dbut de lextrait. Si vous
recliquez un peu plus loin sur lextrait dj choisi, la bande se placera prcisment l o vous
avez cliqu et le texte se positionnera aussi prs que possible de la position correspondant
au passage cout dans le texte.
La qualit du positionnement dans le texte est fonction de la qualit du maillage
temporel : si vous tes dans un long ou un trs long extrait sans point de
synchronisation, le systme dinfrence positionnelle peut se tromper de plusieurs
lignes. Plus le maillage est troit (i.e. les extraits sont courts ou des points de
synchronisation sont placs intervalles rguliers), plus le placement est prcis.
Les boutons
du dbut.
Par ailleurs, si vous avez plac des points de synchronisation dans le texte, vous pourrez
rcouter le passage considr en cliquant sur le bouton .
24 Traduire Sonal
Pour traduire Sonal, il faut choisir une langue dans le menu droulant disponible au
dmarrage du logiciel :
Il vous faudra redmarrer le logiciel. Les principales fonctions seront traduites dans la langue
voulue.
Ces fichiers sont de simples fichiers texte qui contiennent le texte de base du logiciel suivis
de = et de leur traduction. Remplacez ce qui suit le = par votre traduction :
25 Informations
Les mises jour sont chaudement recommandes. Le logiciel gagne en stabilit au fil du
temps, il est dommage de s'en priver. Dans tous les cas, les mises jour ne peuvent pas
nuire vos donnes.
Vous pouvez suivre le dveloppement du logiciel en vous rendant sur son site ou sur le
carnet de recherche qui lui est consacr sur hypothses.org.
Si vous voulez suivre les mises jour, vous pouvez vous abonner au flux RSS de Sonal.
Si vous voulez nous faire part de vos difficults ou si vous avez des suggestions, vous pouvez
nous crire cette adresse :