Académique Documents
Professionnel Documents
Culture Documents
www.sonal-info.com
Mode demploi
Alex ALBER
Universit F. Rabelais (Tours) / UMR C.I.T.E.R.E.S Chercheur associ au Centre dEtudes de lEmploi
Valider lextrait ................................................................................................... 67 Rouvrir un extrait existant.................................................................................. 69 Sauvegarder la retranscription ........................................................................... 70 Exporter une retranscription .............................................................................. 72 La fentre dcoute ............................................................................................ 74 Dfinir des extraits ............................................................................................. 78 Encodage la vole ............................................................................................ 82 Editer les extraits (fentre de saisie) .................................................................. 86 Redimensionner un extrait ................................................................................. 87 Dcouper un extrait ........................................................................................... 88 Fusionner deux extraits ...................................................................................... 89 La liseuse de documents .................................................................................... 90 Chapitrer les documents .................................................................................... 91 Affecter une thmatique un extrait textuel .................................................... 91 Etape 1 : Importer la version sonore de lentretien .......................................... 93 Etape 2 : Importer le texte de la retranscription ............................................... 94 Etape 3 : Reformater les balises de locuteurs .................................................... 95 Etape 4 : commencer le dcoupage ................................................................... 98 Ajouter des points de synchronisation ou une coupure dextrait ................... 101 Ajuster la position dun point de synchronisation ........................................... 102 Dplacer tous les points de synchronisation avant les balises de locuteur ..... 102 Supprimer un point de synchronisation .......................................................... 103 La synchronisation semi-automatique ............................................................. 103
22.1 Diagnostiquer lorigine du problme ............................................................... 153 22.2 Si un entretien dysfonctionne .......................................................................... 154
1 Avant-propos
Sonal est un logiciel de construction et danalyse de corpus de donnes qualitatives. Vous pourrez lutiliser pour archiver, annoter, retranscrire puis analyser des documents sonores, des vidos et des documents textuels. Il appartient la famille des CAQDAS (pour Computer Assisted Qualitative Data Analysis Software) qui regroupe lensemble des logiciels qui proposent dassister les chercheurs dans lanalyse de donnes qualitatives1.
Cest lintrieur de ces extraits que seront ajoutes les retranscriptions. Le travail de retranscription nintervient donc plus comme un moyen de remplacer la bande par un verbatim mais comme un moyen dajouter du texte sur la bande. Le rsultat du travail dencodage/retranscription est donc un matriel audio-textuel dit synchronis car le son et sa retranscription sont toujours accessibles simultanment. Sonal propose toute une srie doutils trs spcifiques qui permettent de grer conjointement les versions sonores et textuelles des entretiens (outils de resynchronisation, dcoupage/fusion simultans du texte et du son etc.).
Pour une recension des outils existants, voir le site (en franais/anglais) de Christophe Lejeune http://www.squash.ulg.ac.be/logiciels/fonctionnalite/caqdas ou (en allemand/anglais) de Ronny Gey http://www.sosciso.de. Luniversit du Surrey a galement propos une tude comparative de plusieurs outils http://www.surrey.ac.uk/sociology/research/researchcentres/caqdas/. Plus fondamentalement, larticle de J. Jenny (1998) propose une typologie clairante des diffrentes familles doutils. 2 Il est galement possible de traiter des documents textuels dans Sonal, mais la mthode propose est fortement marque par la logique initiale du logiciel.
Avec ceci de particulier que les fonctions dencodage sonore ouvrent sur des analyses dites chronomtriques quon ne retrouve pas ncessairement dans les autres logiciels existants.
Cette base de donnes contiendra, pour chaque entretien, une srie de caractristiques dfinies par lutilisateur, sous la forme de variables (99 au maximum) pouvant prendre chacune jusqu 98 modalits (99= non rponse). Vous aurez accs un dcompte des diffrentes caractristiques des fichiers (tri plat).
une sorte de feutre surligneur directement sur les fichiers media (son et vido) pour reprer certaines parties. Ces parties de bande ainsi isoles et colories sont appeles des extraits . Figure 3 - Exemple de fichier son avant et aprs encodage
Les couleurs apposes sur la bande sont appeles thmatiques car leur usage premier est de reprer des sujets particuliers dans les entretiens, mais de nombreux usages dtourns sont possibles. Par exemple, dans la version de Sonal pour musiciens, les thmatiques sont appeles Styles . La grille thmatique peut contenir jusqu 99 catgories diffrentes, distingues par un code, une zone de texte libre, et une couleur choisie parmi 52 diffrentes. Chaque extrait peut se voir affecter une ou plusieurs thmatiques. Figure 4 Fentre de gestion des thmatiques Figure 5 Palette de couleurs disponibles
On peut dabord placer lintrieur des zones de texte une simple description du contenu, des notes ou - et cest lorientation premire de loutil - y retranscrire le contenu des prises de parole. Sonal assiste lutilisateur dans cette tche laide dun systme de dicte qui fonctionne ainsi : la lecture progresse par courtes portions successives (3 5 secondes), sarrte et attend la validation du transcripteur pour passer la portion suivante. La bande progresse donc au rythme du transcripteur, sans que celui-ci ait sen occuper outre mesure. De plus, Sonal laisse priodiquement des balises dans le texte afin de renseigner la position des passages retranscrits (appels points de synchronisation . Enfin, un systme de balises de locuteurs annonant les prises de parole (touches F1 F12 paramtrables) permet de distinguer les questions des rponses. Si lencodage est continu (tous les extraits se touchent) et que lintgralit des extraits est retranscrite, les versions sonores et textuelles de lentretien sont dites synchronises . On peut dornavant naviguer soit dans le son, et relire immdiatement la retranscription qui en a t faite, soit voluer dans la retranscription, et retrouver trs rapidement le passage sonore associ avec ce quon vient de lire.
Il sagit donc dun outil dassistance la synthse des matriaux, qui repose largement sur les centres dintrt de lutilisateur, et qui ne revt donc pas le moindre caractre dobjectivit en lui-mme.
On retrouve ainsi trs rapidement tous les extraits pertinents, qui sont envoys dans une fentre de synthse . Les synthses peuvent tre enregistres dans Sonal, et tre exports vers un traitement de texte pour insertion dans une restitution crite.
En permettant un inventaire rapide des matriaux disponibles sur les diffrents sujets, ce systme rpond aux questions prosaques : quai-je comme matriau sur telle ou telle thmatique ? Quen disent les rpondants ayant tel ou tel profil ? Selon le niveau de traitement des matriaux, le rsultat sera sous la forme dun micro -trottoir (son uniquement) ou dun thsaurus de passages audio-textuels.
Cette analyse chronomtrique peut ensuite tre exporte vers Trideux ou vers un tableur.
On peut galement analyser le contenu textuel des extraits (analyse lexicomtrique), par exemple reprer les mots les plus spcifiquement utiliss selon les enregistrements, les types denregistrement, les sujets abords, les locuteurs etc.
Une lemmatisation manuelle ou automatique des formes (intgralement rversible) est disponible, qui permet de crer des entits smantiques de niveau suprieur. On peut galement tudier un mot en particulier, pour savoir dans quelles parties du corpus il apparat le plus significativement.
Il est galement possible dtudier la dynamique des conversations, en connaissant, pour chaque entretien, le ratio des questions et des rponses, la longueur moyenne des interventions etc4.
Enfin, le croisement des contenus sonores (dure) et textuels (nombre de mot) des extrait dbouche sur une analyse de dbit (dbitmtrie) qui analyse les variations de la vitesse dlocution en fonction des rpondants, des sujets etc.)5
On peut donc la fois avoir une approche comprhensive, consistant tudier successivement des slections dextraits pour synthtiser leur contenu, ou utiliser les fonctions danalyse globale pour se laisser suggrer des pistes analytiques dont on pourra trs facilement tester la pertinence en retournant aux matriaux dorigine.
Cette fonction nest pas encore implmente un niveau global dans la version 1.6 Idem.
Moins acadmiquement, Sonal peut - pourquoi pas - permettre un groupe de musique denregistrer ses rptitions en intgralit, pour reprer certaines improvisions intressantes, ou certains passages retravailler. De mme pour toute production visuelle ou sonore de longue dure que lon souhaite annoter. Enfin, il est galement possible dutiliser Sonal pour raliser des sous-titrages. Les points de synchronisation permettent en effet de reprer la position temporelle des extraits dans la bande, et sonal les affiche dans la fentre vido de manire synchronise, ce qui revient transformer les retranscriptions en sous-titres. .
- Compatibilit
Sonal est un logiciel dvelopp dans et pour un environnement Windows (XP 8). Il est cependant possible de lutiliser dans un environnement Mac ou Linux, mais cela suppose une mulation de Windows.
Cest une copie des fichiers essentiels utiliss par Sonal (cf. ci-dessous) qui sont placs dans un dossier part.
Les fichiers mdia ne sont pas recopis, vous pouvez donc en crer trs frquemment sans prendre le risque de surcharger votre ordinateur. Par exemple, la sauvegarde de 15h denregistrements intgralement retranscrits ne pse mme pas un mgaoctet.
Vous pouvez mme vous envoyer ce dossier compress par mail pour plus de scurit. Il vaut donc mieux faire trop de sauvegardes que pas assez.
- Logique fonctionnelle
- Pour changer quelque chose, cliquez dessus. Si une zone de texte apparat, cest que vous avez trouv. Pour enregistrer la modification dun paramtre, faites entre. - Il ny a pas de doubles-clics dans le logiciel. - Ne faites quune chose la fois. En plus de la page du corpus, viter douvrir plusieurs pages conjointement (synthse en mme temps que saisie etc.).
Si votre dfinition dcran est leve, il est possible que Windows vous ait propos dagrandir les polices de 25% : Sonal naime pas a du tout ! Les fentres sont mal dimensionnes et vous ne verrez pas toutes les fonctions. Vous devez travailler avec des polices de taille normale.
2 Comprendre logiciel
lorganisation
du
Cette partie vise vous permettre de comprendre la manire dont Sonal fonctionne, ce qui vous aidera corriger dventuels problmes.
A lintrieur du rpertoire projet, il y a deux types de fichiers diffrents : un fichier central, le fichier projet (corpus) dont le rle est de centraliser les informations communes tous les fichiers dun projet, et les fichiers satellites, qui ne se rfrent qu un seul entretien.
Fichier Corpus
Entretien1
Entretien2
Entretien3
- Le fichier Corpus
Le fichier Corpus a pour extension *.crp. Cest en ouvrant un fichier corpus que lon accde aux entretiens retranscrits dun projet.
Le fichier corpus ne contient aucune donne sonore ni aucune retranscription. Sa fonction est de runir les informations communes tous les entretiens du projet.
Cest un simple fichier texte (ditable avec le bloc note) qui contient, entre balises : - La liste des thmatiques : |THEM| - La liste des variables de la base de donnes : |POS| - Le dictionnaire des modalits des diffrentes variables : |DIC| - La liste des entretiens |ENTR| - La liste des locuteurs rpondant aux codes F1 F12 |LOCU|
Les informations stockes dans le fichier corpus servent ensuite interprter le contenu des fichiers satellites rattachs aux entretiens.
Le fichier dencodage (*.rtr) dun entretien donn ne contiendra pas linformation le rpondant est un homme de 30 40 ans mais, la variable 1, le rpondant a la modalit 1 et la variable 2, le rpondant a la modalit 3 , en suivant les valeurs de lexemple ci-dessus. De mme, un extrait de cet entretien ne se verra pas affecter une thmatique en toutes lettres (comme par exemple Thmatique 2 ), mais uniquement le code de la thmatique ( 004 dans lexemple ci-dessus).
Ce fonctionnement a des incidences particulires pour tout ce qui a trait aux recodages, ce pourquoi il vaut mieux oprer toutes les modifications depuis le logiciel lui-mme, qui va aller appliquer les modifications (dans le code dune variable ou dune thmatique par exemple) la fois dans le fichier corpus et dans tous les fichiers satellites.
- Un fichier *.Bmp : cest limage du spectre sonore de lintgralit de lentretien. Pour gagner du temps, il nest dessin quune fois lors de lajout de lentretien au projet et enregistr. - Un fichier *.Lct : cest le fichier qui mmorise les parties lues. - Un fichier *.Rtr : cest le fichier qui contient les informations sur lentretien (dure, observations, modalits prises par les diffrentes variables) et surtout les parties retranscrites et leurs coordonnes. Le fichier RTR CONTIENT TOUT VOTRE TRAVAIL. Cest le fichier le plus important de tous.
Malgr ses contraintes, ce fonctionnement permet une certaine souplesse. Pour peu que leurs grilles thmatiques et leurs variables soient identiques, deux fichiers Crp peuvent largement partager un mme fichier RTR. On peut aussi dcliner un corpus en plusieurs sous-corpus. Par exemple, un dossier de projet pourra contenir un corpus complet, une copie qui ne contient que certains types dentretiens, une autre que les entretiens dun interrogateur donn etc. en se rfrant tous des fichiers communs. Ce qui impliquera que le travail dans un entretien simpactera dans tous les projets o il est intgr.
Construire un corpus
3 Se lancer !
3.1 Premire tape : crer un rpertoire de projet6
Pour commencer votre travail et construire votre corpus, avant mme le lancement du logiciel, vous devez crer ou choisir un rpertoire qui accueillera votre projet.
Pour crer votre rpertoire de projet, choisissez un emplacement o vous disposerez de suffisamment de place et o laccs est rapide ; vitez de travailler directement sur un support externe de type USB, cela ralentit un peu le logiciel et comporte plus de risques daccident (retrait involontaire de la cl, panne, etc). Utilisez plutt ces supports pour conserver des sauvegardes (cf. plus haut).
Placez tous les enregistrements et tous les documents que vous voulez traiter dans ce dossier.
La version en ligne de ce tutoriel contient des vidos qui pourront peut-tre vous aider.
La boite de dialogue qui souvre alors correspond un enregistrer sous : Sonal vous demande comment sappellera et o sera positionn le fichier corpus que vous voulez crer. Il faut lenregistrer dans le rpertoire projet qui contient dj vos entretiens.
Dans la mesure o la boite de dialogue recherche spcifiquement des fichiers dont lextension est *.crp, vous devez normalement ne voir aucun fichier dans votre dossier de projet, mme sil contient vos bandes. Vous devez donc choisir un nom et cliquer sur enregistrer . Si vous voyez des fichiers corpus dans le dossier, sachez que les slectionner cette tape revient demander Sonal de crer un nouveau projet en les crasant. Logiquement, Sonal refusera de faire une telle chose.
Choisissez un emplacement et un nom puis validez. Ceci fait, vous avez un projet vierge. La page principale a cette apparence :
Le projet de ne contient ni entretien, ni variable, ni thmatique, lexception de la thmatique vierge (sans couleur) qui rpond au nom de Pas de thmatique et qui figure dans le panneau gauche de lcran, sous le bouton grer les thmatiques .
Si vous ne voyez pas cette thmatique, cest quil ny a pas de projet ouvert. Aucune fonctionnalit ne rpondra, tant que vous naurez pas ouvert ou cr un corpus. Pour ce faire, allez dans le menu corpus :
Nous allons commencer par apprendre ajouter des bandes ou des documents texte notre corpus, avant de voir comment construire la grille thmatique. Nous verrons ensuite comment construire et renseigner la base de donnes, avant de rentrer dans le travail dencodage proprement dit, avec la retranscription et le dcoupage sonore.
- Possibilits dencodage
Ces trois types de documents font lobjet dun mme type dencodage. Au-del des valeurs renseignes dans la base de donnes, leur contenu sera dcoup en parties successives, contiges ou non, mais de prfrence non superposes.
Pour les sons ou les vidos, les documents sont dcoups sur la base des coordonnes chronomtriques (en secondes), pour les documents texte, cest la position du mot de dpart rapporte au total des mots qui sert de rfrence (en millimes).
Il nest pas conseill dallonger ou de raccourcir les documents textuels aprs encodage. Sonal se prte avant tout un encodage de documents finis, mme sil est toujours possible de modifier lgrement le contenu textuel des documents, pour des corrections par exemple. Les extraits dcoups se verront associer une ou plusieurs couleurs thmatiques et du texte libre, soit des retranscriptions, soit toutes sortes dannotations (commentaires, donnes musicales etc.). Les diffrents intervenants gagneront tre
reprs par des balises de locuteurs. Dans les sons et les vidos, les interventions seront repres par des points de synchronisation, qui renseigneront sur la position dans le son de lintervention considre.
Dans les vidos, les points de synchronisation placs dans le texte serviront de base au sous-titrage. Vous pouvez donc utiliser Sonal pour raliser des soustitres. Un export au format *.Srt des retranscriptions est en projet.
Apparat alors une boite de dialogue de type Ouvrir dans laquelle il vous faudra choisir le fichier son que vous voulez importer. Par dfaut Sonal cherche des fichiers WAV mais vous pouvez importer dautres fichiers son en modifiant le type de filtrage, voir ci-dessous.
Si le fichier est hors du rpertoire de projet, qui contient votre fichier corpus, Sonal vous demandera de limporter :
Le processus prendra plus ou moins de temps en fonction de la taille du fichier mais Sonal ne vous renseignera pas sur la progression de la copie. Vous aurez seulement un message de confirmation la fin de la copie.
Votre fichier est ensuite ajout au corpus. Sil est au format WAV, Sonal va dabord prendre le temps de le dessiner intgralement, ce qui peut prendre quelques secondes. Sil est dans un format compress, Sonal se contentera de dessiner un spectre sonore fictif et renseignera le format du fichier au dbut de limage (voir ci dessous).
Si vous procdez de la sorte, le fichier vido sera reprsent comme un fichier audio compress, et Sonal ne pourra pas le dessiner, ce qui est un peu pnalisant pour le travail de synchronisation.
Pour pouvoir travailler les vidos dans de meilleures conditions, il existe une deuxime mthode, qui consiste dabord ajouter lextraction sonore de la vido au format WAV recommand (mono 8 ou 16 bit) dans le corpus, et de placer dans le mme rpertoire la version vido, avec strictement le mme nom, hormis lextension, qui doit tre *.Avi ou *.Mpg. Sonal reprera cette vido et lutilisera dans le lecteur, mais il dessinera la version WAV qui lui est associe.
La boite de dialogue qui apparat recherche des fichiers Word (*.Doc, *.Docx) ou des fichiers Texte (*.TXT) :
Ceux-ci peuvent tre placs nimporte o sur lordinateur, Sonal se contentera de recopier leur contenu.
Attention, les fichiers Word ne seront correctement imports que si Word est install sur votre machine. Sonal dialogue en effet avec le logiciel lui-mme. Si vous avez un traitement de texte libre, utilisez-le pour exporter le contenu textuel des fichiers word vers un fichier *.Txt. Le rsultat est strictement le mme que si vous laviez import depuis word.
La reprsentation des fichiers texte suite leur importation est un peu diffrente de celle des sons ou des vidos. Sonal cre doffice un seul trs long extrait non thmatis quil faudra dcouper par la suite (voir ici)
La fentre qui apparat alors inspecte le contenu du rpertoire de projet, et vous propose dimporter tous les fichiers prsents rpondant au filtrage voulu.
Slectionnez les fichiers voulus et cliquez sur ajouter. Tous les fichiers seront ajouts successivement.
Pour changer le nom du document et de tous les fichiers crs partir de lui, il suffit de taper un nouveau nom et de valider avec entre. Sonal vous demande une confirmation :
Aprs acceptation, lentretien, ainsi que tous les fichiers satellites sont renomms.
La mthode la plus simple pour y arriver est de placer dans le rpertoire du projet une version compresse du ou des fichiers que vous voulez remplacer. Ils doivent porter strictement le mme nom. Puis, en cliquant sur le nom de lentretien en question dans la fentre de corpus, vous verrez apparatre la page dinformations sur lentretien. En haut de cette page est renseign le nom du document. Une case situe immdiatement droite du nom renseigne son extension. Lorsque lon clique dessus, les autres extensions disponibles dans le corpus sont rpertories. Dans lexemple ci dessous, il suffit de cliquer sur le Mp3 pour que le document associ lentretien en question soit la version mp3 et non plus WAV du fichier. Cette dernire pourra tre supprime ou en tout cas retire du dossier de projet sans que cela change quoi que ce soit pour Sonal.
Une autre mthode peut tre de demander lajout dun document sonore et de choisir la version compresse du fichier que vous voulez remplacer. Sonal comprendra que vous voulez effectuer le remplacement et vous demandera une confirmation :
La fentre qui apparat vous permet de slectionner les documents supprimer. Par dfaut, il vous est seulement propos de retirer les documents du corpus, c'est--dire de laisser intacts tous les fichiers satellites associs au document donn. De la sorte, ces documents pourront tre ajouts nouveau au projet sans quaucune donne ne soit perdue. Il est parfois utile de supprimer dfinitivement tout ou partie des fichiers satellites dun entretien, par exemple son image (*.BMP), pour la recharger, auquel cas il suffit de cliquer sur Effacer dfinitivement les fichiers du rpertoire et de choisir les extensions supprimer. Les diffrentes fonctions du menu entretiens (ou enregistrements) vous permettent de grer la liste des documents contenus dans votre corpus. Nous allons maintenant pourvoir commencer lencodage proprement dit. Ce travail comporte deux aspects. On peut dabord commencer par construire et renseigner la base de donnes qui permettra de dnombrer les diffrentes caractristiques des entretiens et, au besoin, de tester certaines hypothses de recherche. La partie suivante explique cette dmarche mais vous pouvez choisir daller directement lencodage des documents.
Cette mthode est particulirement adapte lenregistrement de sminaires, de confrences, voire de cours. Attention, cette fonctionnalit repose sur un dialogue avec la carte son qui nest pas galement possible sur toutes les machines ni dans toutes les versions de Windows. Si Sonal ny arrive pas sur votre PC, vous le saurez rapidement... Voici comment vous y prendre pour enregistrer un entretien dans Sonal.
Avant toute chose, si vous ne lavez pas dj fait, vous devez crer ou ouvrir un corpus. Ce corpus dfinira notamment l'endroit o sera enregistr le fichier que vous allez crer (il sera positionn dans le mme dossier que le fichier *.Crp). Il vous fournira galement les thmatiques que vous pourrez affecter aux extraits isols en cours d'enregistrement (cf. ci-dessous).
La premire chose faire est de rgler le volume sonore. Lorsque le curseur indique un volume adapt (ni trop faible, ni satur), vous pouvez dmarrer l'enregistrement.
Pour pouvoir lancer l'enregistrement, vous devez imprativement nommer le fichier que vous allez enregistrer. Cette page vous permet galement de dfinir les caractristiques du fichier : - la frquence (11025Hz par dfaut) - le nombre de canaux (Mono par dfaut, la stro est possible mais dconseille dans le cas d'enregistrement d'entretiens) L'interface vous informe sur l'espace restant sur le disque ou le priphrique o vous allez enregistrer votre fichier et vous prcise combien de temps de bande est votre disposition en fonction du format utilis.
Aprs avoir dfini le nom du fichier et choisi son format, vous pouvez lancer l'enregistrement. L'interface prend alors cette apparence :
Vous pouvez alors laisser "tourner la bande" jusqu' la fin de l'enregistrement, que vous signifierez simplement en cliquant sur le bouton stop. Une fois l'enregistrement termin, l'entretien est automatiquement ajout au corpus courant et charg. Si vous souhaitez gagner du temps dans vos retranscriptions, vous pouvez placer des marqueurs en cours d'enregistrement, c'est--dire prdfinir les extraits et ventuellement leur affecter une thmatique. Pour ce faire, vous pouvez cliquer sur le bouton ci-dessous, ou simplement taper entre, en notant que le curseur doit tre dans la zone de texte voue la saisie des notes pour que la touche entre fonctionne :
Ce faisant, vous dfinissez la fin de l'extrait, auquel sera ajout le texte contenu dans la zone de texte. Les diffrents extraits dcoups apparaissent par la suite par ordre chronologique invers.
Si vous avez dj dfini des thmatiques, vous pouvez directement les affecter aux extraits que vous avez dcoups en cliquant sur les petites flches en bout de ligne:
Il ne faut pas perdre de vue que les thmatiques nont pas quune fonction graphique, elles interviennent dans les processus de filtrage et il faut donc les envisager comme de futurs moyens de distinguer les diffrents passages. Dans la mesure o il est possible de superposer plusieurs thmatiques pour un mme extrait, on gagne faire en sorte que les diffrentes thmatiques sexcluent les unes les autres.
Il a 52 couleurs disponibles (pour des raisons de transparence) mais les utilisateurs peuvent crer jusqu' 99 thmatiques diffrentes par corpus.
Pour crer des thmatiques dans un corpus, il faut soit aller dans le menu thmatiques puis choisir grer les thmatiques , soit cliquer sur le bouton Grer les thmatiques au sommet du panneau latral situ gauche de la page :
Vous devez dabord en dfinir le nom (zone de texte), la couleur (cliquez sur choisir une couleur ), puis valider.
Votre thmatique apparat maintenant dans la liste. Renouvelez lopration autant de fois que ncessaire pour crer votre grille de dpart.
Lutilisateur dfinit jusqu 99 variables, auxquelles il pourra affecter 98 modalits (99=non rponse). Les variables typiques dune enqute sociologique sont les incontournables : Sexe, ge, Pcs, etc. mais lutilisateur est totalement libre dencoder ce qui lui plait. Pour chaque entretien, on pourra ensuite renseigner les informations demandes (Homme, 50 ans, Employ), soit les en tapant directement au clavier, soit en choisissant la modalit dans une liste. La base de donnes vise galement prouver des hypothses de recherche : si vous pensez quun attribut particulier est susceptible dinfluencer les discours et reprsentations de vos interviews, int grer cette variable dans la base de donnes vous permettra par la suite de vrifier si cet attribut a bel et bien une influence.
Mme si ce travail peut parfois sembler trs formel, il ne faut pas oublier que la connaissance prcise des personnes interroges dcrot avec le temps et le nombre, et que le fait de garder de manire formalise des informations cls au sujet des rpondants prsente lintrt par la suite dviter de se perdre dans ses donnes. Pour peu que le corpus commence contenir plus dune quinzaine dentretiens, il devient utile de pouvoir diter rapidement des tableaux rcapitulatifs sur la population enqute sans avoir compter la main les entretiens rpondant telle ou telle caractristique.
On accde la base de donnes en cliquant sur le bouton Base de donnes dans la page de corpus. :
Dans la mesure o aucune modalit nest renseigne pour les diffrents documents du corpus, on trouve --- lintersection des lignes et des colonnes.
Cette modalit sera par la suite disponible la slection pour les autres documents.
Attention, si vous utilisez Sonal dans une perspective analytique, lencodage intgral simpose. En effet, il faut encoder intgralement le son pour procder des analyses chronomtriques, et retranscrire intgralement le texte pour procder des analyses lexicomtriques. Nous allons maintenant aborder les mthodes dencodage proprement dites. Vous allez progressivement dcouvrir que Sonal vous permet de travailler de manire trs personnalise en combinant les fonctions des diffrentes interfaces. Il y a cependant
7
Vous pouvez regarder la premire vido de ce tutoriel pour mieux comprendre la logique et faire votre choix.
des interfaces plus spcifiquement ddies certains types de travail et dveloppes dans un but prcis. Si vous souhaitez retranscrire rapidement vos entretiens, en vous donnant pour objectif de raliser une retranscription intgrale, utilisez prioritairement la fentre de lecture. Si vous voulez avant tout (ou dabord) dcouper la bande sonore sans vous soucier de retranscrire, utilisez exclusivement la fentre dcoute. Fentre de lecture Fentre dcoute
Nous allons maintenant commencer par apprendre comment retranscrire intgralement, avant daborder lencodage des fichiers son ou vido.
7 Retranscrire intgralement
La retranscription intgrale est fortement recommande pour une utilisation de Sonal des fins de recherche. Pour utiliser Sonal comme outil de retranscription intgrale, la mthode la plus pratique est dutiliser la fentre de lecture (reader), qu i est spcifiquement dvolue cette tche8.
La page de lecture a cette apparence lors de louverture dun entretien non retranscrit :
La bande se lance. Vous pouvez larrter avec la barre despace de votre clavier. Pour plus dinformations sur cette page, voir ici, cette partie indique seulement les oprations raliser pour retranscrire.
Pour gagner du temps, commencez par paramtrer les locuteurs (3) puis activez le mode dicte (4). Il est prfrable dactiver le mode dicte automatique (5). 1 2
Dans cette configuration, vous tes prt(e) commencer la saisie, mais avant de commencer retranscrire, il est important de paramtrer les raccourcis de locuteurs, qui vous permettront de gagner du temps dans la saisie.
Les locuteurs sont paramtrs par dfaut de R1 R11. La premire ligne est rserve la question. Pour modifier la chaine de caractres associe par exemple la touche F1, il faut tout simplement cliquer sur l'tiquette qui contient le code "R1", taper ce que vous voulez voir renvoy la place, par exemple "Question ?", puis valider avec la touche entre.
En bas de page, vous pouvez utiliser deux options : Ajouter un saut de ligne aprs le nom du locuteur : la fonction est explicite. Ajouter automatiquement un point de synchro aprs le nom: cette fonctionnalit vous permet de prparer le redcoupage ventuel de l'entretien en plaant un point de synchronisation chaque question et rponse. Vous amliorez ainsi le maillage chronologique de l'entretien, ce qui est trs bnfique par la suite.
Une fois vos raccourcis paramtrs, vous pouvez commencer la saisie proprement dite.
Si vous voulez sauter une ligne et non pas passer la portion suivante, tapez ctrl + entre.
Attention, cette fonction ralentit le logiciel et nest disponible quavec les fichiers WAV Mono. La case en forme de disquette signifie que les modifications de lextrait seront mmorises chaque validation de portion de dicte.
Commenons avec un exemple. Imaginons que votre bande commence par une prise de parole de linterrogateur, je taperai F1 sur mon clavier. Sonal ajoutera la balise [>Question ?] suivie dun point de synchronisation (position en secondes entre crochets ) :
Lorsque lon clique sur un point de synchronisation dans le texte, la position de la bande est ramene sa valeur. En cochant ou non la case [ ] ci-dessous, on pourra contracter ou non les points de synchronisation pour allger laffichage.
Retranscrivez la partie propose jusqu son terme en reportant bien les changements de locuteurs puis, une fois que vous aurez fini, tapez entre . Vous passez alors la portion suivante.
Une fois la portion valide avec entre , le cadre blanc qui signale la portion courante se dcale vers la droite :
La lecture reprend une seconde avant la fin de la portion prcdente et lit la portion suivante, avant de sarrter. Vous pouvez de nouveau faire alt+entre pour redmarrer ou arrter la bande, et retranscrire confortablement la portion, avant de la valider. Vous progressez ainsi jusqu ce que la portion de dicte courante dborde de lextrait de 15 secondes que vous avez cr initialement.
Tout lintrt de la dicte est quau fur et mesure des validations, lextrait va sallonger progressivement, sans intervention de votre part.
Si vous nutilisez pas le mode dicte, vous pouvez toujours allonger manuellement vos extraits en les dplaant par glisser/dposer la souris.
- La correction orthographique
Sonal vous permet de vrifier lorthographe du texte saisi soit en cours de frappe (les mots mal orthographis apparaissent en rouge, soit de manire globale, en vrifiant tout lextrait. Vrifier lorthographe Vrifier lorthographe cours de saisie
en
Une chose trs importante savoir : SONAL sous-traite la vrification Microsoft Word et uniquement Word. Si Word nest pas install sur votre machine ou que vous avez une version non compatible, la correction ne fonctionnera pas.
Avant de valider, il importe de dfinir la fin de lextrait. La dicte automatique parvient parfois sarrter sur de vraies alternances de paroles, mais il est
gnralement ncessaire de caler la main la fin de lextrait. Pour cela, il suffit d attraper la bordure de fin avec la souris et de la dplacer latralement
avant de la relcher.
Une fois lextrait cal, cliquez sur le bouton de validation de lextrait situ en bas de page:
Vous pouvez remarquer que les balises de locuteurs sont normalises ( Question : au lieu de [>question?] ), que les questions sont grises et que les points de synchronisation sont reprsents sous la forme dun pet it bouton . Lorsquon clique dessus, la bande est ramene leur position. Ces points figurent galement dans la barre de synchronisation situe immdiatement au dessus de la zone de texte. Si lon clique dessus, cest le texte correspondant qui est affich. Cest donc un moyen de naviguer rapidement dans le texte, de resynchroniser laffichage des deux supports.
Vous pouvez modifier ce qui doit ltre, ou poursuivre la retranscription. Pensez valider pour quitter la fentre ddition. Pour poursuivre la retranscription, cliquez sur Nouvel extrait . Sonal cre alors un extrait de 15 secondes immdiatement coll au prcdent. La fentre ddition souvre.
Vous pouvez remarquer que le prcdent extrait est gris. Seul lextrait en cours ddition est reprsent dans sa couleur relle. Le nouvel extrait est immdiatement coll au prcdent car la logique de cette page est la retranscription intgrale. Pour crer un encodage discontinu (qui ignore certaines parties), il vaut mieux (commencer par) encoder le son (voir partie suivante). Si toutefois vous avez des passages inaudibles ou absolument sans intrt (absence du rpondant) au milieu dune retranscription intgrale, rien de vous empche de crer un extrait, de lallonger sans le retranscrire ( laide du mode dicte ou la main ), avant den dbuter un nouveau lorsque lentretien reprend.
Vous pouvez reprendre le cycle de dictes et progresser ainsi jusquau bout de lentretien.
De mme, les modifications de lentretien sont sauvegardes chaque validation dextrait. Au besoin, vous pouvez aussi demander lenregistrement de la retranscription en cliquant sur le bouton ci-dessous.
Que se passe-t-il lorsquon enregistre ? Lenregistrement revient rcrire le fichier *.Rtr de lentretien avec les informations courantes. Ce fichier contient tout votre travail sur lentretien, il porte le mme nom que la bande (voir dtails sur le systme de fichiers). En parallle, chaque sauvegarde, une copie de ce fichier est cre dans le dossier Restaur situ dans le rpertoire de projet. 10 versions successives sont sauvegardes, numrotes entre parenthse (1) (10). Pour restaurer ces versions prcdentes depuis Sonal, utilisez le bouton ci-dessous :
En cas de difficult, il est toujours possible daller copier la version la plus rcente de ce fichier dans le dossier Restaur, et de le coller la place du Rtr courant, en retirant son numro la fin du nom. Pour parer toute ventualit, vous pouvez raliser un dossier de sauvegarde, depuis la fentre de corpus :
Sonal crera, au nom demand, un dossier qui contiendra une copie des fichiers Rtr de tous les entretiens du projet, et du fichier de corpus. Ces fichiers seront ensuite votre disposition pour une restauration en cas de problme. Les fichiers en question sont trs lgers, vous ne risquez pas la surcharge en crant frquemment des dossiers. Faites-le chaque fois que vous aurez bien avanc dans votre travail .
Lexport est alors effectu au format *Rtf, qui peut tre lu par la plupart des traitements de texte. Choisissez un nom et une adresse pour le fichier cr ; il sera cr puis ouvert avec votre traitement de texte par dfaut. Lexport est ralis par dfaut avec les informations sur les extraits, sans balises de synchronisation, et avec la reproduction dans le texte des passages pondrs.
Pour obtenir plus doptions, vous pouvez utiliser le menu accessible depuis l a page contenant les informations dtailles sur lentretien (on y accde en cliquant sur le nom de lentretien dans la page de corpus. Puis, il faut cliquer sur le bouton cidessous et choisir les options voulues avant de cliquer sur lun ou lautre des exports : soit directement vers Word (il faut que vous ayez Microsoft Word install sur votre machine), soit vers nimporte quel traitement de texte, par le truchement dun fichier *Rtf quil vous faudra dfinir avant enregistrement:
Les options disponibles sont les suivantes : Informations sur les interviews : afficher le contenu de la base de donnes pour lentretien en question Observations sur les interviews : afficher vos observations Informations sur les extraits : voir les coordonnes temporelles et les thmatiques des extraits Afficher les balises : voir les points de synchronisation (convertis en HH :MM:SS) Afficher les formats : reprsenter dans le texte les parties pondres (cette fonction nest pour linstant disponible que dans lexport en *Rtf.)
Cette page prsente lavantage de proposer la fois une reprsentation plus dtaille des bandes et un encodage plus libre des extraits que la page de lecture. Elle est donc faite pour faciliter le dcoupage du son ou de la vido.
Vous arrivez alors sur la page de visualisation dtaille de lentretien que vous avez choisi dencoder. Cette page vous permet dcouter ou de regarder les documents :
Si votre document est une vido, cliquez sur le bouton vido pour voir limage associe au son :
Pour quitter cette fentre, vous pouvez utiliser la touche Echap ; votre retour dans cette fentre, la lecture reprendra l o vous lavez laisse. Pour vous dplacer vers la gauche ou la droite, utilisez les touches ou les boutons <- et -> . Pour zoomer ou dzoomer, utilisez les touches ou les boutons + ou -
Le logiciel mmorise les portions de 10 secondes que vous avez lues. Un trait dabord gris puis de plus en plus clair saffichera sous le spectre de lentretien au fil des passages.
Dans la partie infrieure, la portion zoome qui correspond au rectangle blanc positionn dans la partie suprieure.
En utilisant la souris, vous pouvez repositionner la lecture. SI vous cliquez dans la partie suprieure de la fentre, la portion zoome (matrialise par le rectangle blanc) va se dplacer pour dbuter l o vous avez cliqu. Si vous cliquez dans la partie infrieure, la lecture se positionnera seule se positionnera l o vous avez cliqu.
La portion zoome apparat dans la partie infrieure de la page et la lecture dbute. Vous pouvez maintenant positionner plus finement le lecteur en cliquant dans la partie zoome.
Le temps de chargement dpend de la dure de la portion zoome . Il nest pas utile de dlimiter des portions trop importantes. Pour pouvoir tirer profit du zoom, qui permet de reprer les blancs dans la bande, il vaut mieux se limiter une ou deux minutes. Une fois vous avez compris la logique daffichage, vous pou vez commencer encoder la bande, c'est--dire dcouper des extraits.
encodage continu, ce qui revient chapitrer les bandes. On parle alors dencodage la vole. De plus, lencodage la souris est source derreurs. Vous risquez de superposer involontairement des extraits, ce que la fentre dcoute sait grer, mais sans entrain particulier, car le fonctionnement de Sonal nest pas vraiment prvu pour a.
Lencodage la vole limite ces risques derreur et savre gnralement prfrable. Nous allons cependant commencer par voir comment crer des extraits la souris.
Vous pouvez alors choisir parmi les thmatiques existantes. Si vous souhaitez en ajouter une, cliquez sur le petit bouton + situ en haut droite de la fentre de slection des thmatiques. Vous devrez alors dfinir un nom et une couleur pour la thmatique ajouter, puis la slectionner dans la liste. Une fois la thmatique slectionne, lextrait prend la couleur de la thmatique voulue :
Une fois quun extrait se voit associer une thmatique, lorsquon reclique sur le nom de la thmatique associe, laffichage prend une forme diffrente:
On peut alors modifier la thmatique existante, en cliquant dessus, ou ajouter une couche , ce qui reviendra affecter deux thmatiques superposes lextrait courant.
En pareil cas, sil ny a aucun extrait dans lentretien la portion dbute zro ; sinon, Sonal repart de la fin du dernier extrait cr, mme sil y a des portions vierges avant lui.
Une fois que vous avez dfini un point de dpart, la lecture progresse en allongeant au fur et mesure votre extrait. Un calque gris clair sallonge progressivement pour matrialiser lextrait en cours de cration. Vous pouvez modifier sa longueur en cliquant dans la partie zoome de la bande en bas de la page. Il est ainsi facile de revenir quelques secondes en arrire pour dfinir prcisment une fin dextrait. Si vous ne souhaitez pas dlimiter de portion, utilisez la barre despace, qui stoppe lallongement et annule le dcoupage. Pour dlimiter la fin de lextrait, tapez entre . Pour dlimiter la fin de lextrait, et en dbuter un immdiatement la suite, tapez Alt + entre . Ces fonctions sont galement accessibles laide des boutons ci-dessous, qui remplacent le bouton Nouvel extrait aprs quon la utilis :
Placer un point de synchronisation dans les annotations. Valider la cration de lextrait Valider la cration de lextrait et en dbuter un nouveau
On peut y saisir du texte libre dcrivant le contenu de lentretien, ou de que lon veut.
Attention, la barre despace ne permet plus le contrle de la bande lorsque lon utilise cette fonction. Celle-ci retrouve sa fonction originale.
Vous pouvez donc ainsi trs facilement encoder tous vos entretiens la vole, dans le temps ncessaire ou presque pour les couter.
En utilisant les fonctions dacclration ou de ralentissement de lecture (cidessous), on peut notablement acclrer ce travail.
Vous arrivez alors sur la fentre de saisie, qui vous permet de modifier le contenu de lextrait, c'est--dire dy associer du texte (typiquement, de retranscrire son contenu), et de dfinir sa thmatique. Les fonctionnalits de la fentre de saisie sont prsentes plus bas.
Lextrait est redimensionn. Evitez les superpositions lorsque vous redimensionnez les extraits.
On active le mode dcoupage en cliquant sur le bouton Couper . Le bouton Couper se met alors clignoter. Le curseur prend la forme de ciseaux lorsque lon survole lextrait dans la partie infrieure de la page.: On peut arriver au mme rsultat en utilisant simplement le clic droit sur lextrait.
Lorsque lon clique un endroit sur lextrait, celui-ci se divise en deux parties. Les deux parties conservent la mme thmatique. En revanche, lextrait situ gauche du point de coupure conserve le texte de lextrait initial tandis que celui de droite sera vierge :
Cliquez dessus et les deux extraits nen feront plus quun : Si les deux extraits ont des thmatiques diffrentes, celle(s) de lextrait de gauche lemporte(nt). Si lextrait de droite contient du texte, celui-ci est ajout la suite de celui de lextrait prcdent, avec un point de synchronisation entre les deux, afin de ne pas perdre la position de dbut.
En cliquant sur les pages, on progresse dans le document. Depuis cette page, vous pouvez videmment diter le contenu des extraits, exactement comme dans la liseuse, en cliquant sur les coordonnes de l'extrait ou sur le gros "plus" gauche de la bordure. Je vous dissuade cependant d'effacer ou d'ajouter de trop grandes parties de textes l'intrieur de documents dj encods car cela risque de perturber le calcul en millimes de la position des extraits et Sonal risque de vous embter avec des histoires de coordonnes des extraits incorrectes. Encodez donc des documents finaliss, ou qui ne ncessitent que des petites retouches.
Le curseur prend alors la forme d'une paire de ciseaux, avec des bordures d'extraits fictives.
En cliquant sur le mot, vous scinderez l'extrait courant en deux parties. Les extraits apparatront d'une manire qui, tout en restituant la verticalit propre au texte, conserve la latralit de l'encodage, comme s'il s'agissait d'une bande. Pour le voir, il vous faudra choisir une premire thmatique.
Une fois la thmatique choisie, les pages correspondant lextrait sont colories.
Logiquement, l'extrait que vous venez de dbuter s'tire jusqu' la fin du document, car vous vous tes content de scinder l'extrait global, il vous faudra donc placer une nouvelle bordure la suite pour dfinir la fin de l'extrait que vous venez de commencer. En affectant "Pas de thmatique" l'extrait suivant, on peut laisser vierge de tout codage la suite de l'entretien, jusqu' la dclaration d'un nouveau dbut d'extrait :
C'est donc en ajoutant successivement des bordures et en jouant avec les thmatiques que vous encoderez votre entretien. Il faut jongler avec une logique d'encodage un peu particulire, mais qui permet finalement de tout faire assez simplement.
On peut par exemple superposer plusieurs thmatiques par extrait pour prendre en charge les parties qui peuvent tre encodes avec plusieurs thmatiques :
Les extraits crs seront reprsents et interprts exactement l'identique des entretiens enregistrs, ceci prs que Sonal ne vous proposera normalement pas de les lire et qu'ils ne compteront pas dans les analyses chronomtriques.
10 Resynchroniser retranscription
une
La resynchronisation revient dcouper simultanment les versions audio et texte d'un entretien en renseignant priodiquement dans le texte la position dans la bande correspondante, soit sous la forme d'un point de synchronisation, soit sous la forme de bordure d'extrait. La resynchronisation peut vous permettre, si vous dcouvrez Sonal au milieu dune recherche, dintgrer des entretiens dj retranscrits dans votre corpus, pour pouvoir les soumettre au mme cadre analytique que ceux que vous saisirez dans Sonal, tout particulirement en matire chronomtrique. Si seules fonctions de synthse et d'analyse lexicomtrique vous intressent, vous pouvez aussi vous contenter de dcouper le texte, sans lui associer de bande (voir encoder les documents textuels).
Une fois dans la page de lecture, dans le menu Entretiens, choisissez, en fonction du format du fichier qui contient la retranscription de lentretien lun ou lautre des items du menu. Vous avez deux formats possibles. Si votre fichier est au format word, choisissez doc ou docx.
Si vous navez pas Word, exportez votre fichier dans le bloc note au format *.txt et choisissez ce format pour limportation. Ciblez le fichier qui contient les retranscriptions, choisissez ouvrir. Attention, si vous aviez dj commenc encoder le fichier, tout ce que vous avez fait sera cras! Un message vous prvient au cas o. Assurez vous de ne pas faire de fausse manipulation. Aprs importation, le texte du fichier va tre associ lentretien dans un seul et unique extrait dnu de thmatique, dont la dure sera gale celle de lentretien. La barre de navigation en haut de la page se strie de gris (ce qui renvoie labsence de thmatique) et le texte de lentretien apparat dans son intgralit :
En ltat, il ne sert pas grand chose davoir un extrait gigantesque. Il va falloir le redcouper progressivement. Mais avant, il pourra tre trs utile de reformater les balises, pour permettre Sonal de reprer le changement de locuteur et le statut interrogatif des questions.
Attention, cette fonction rencontre parfois des difficults avec les caractres imports de Word, qui ne sont pas toujours reconnus. Une mthode simple et efficace consiste faire un rechercher/remplacer directement dans le fichier *.rtr de lentretien, en prenant garde que Sonal ne soit pas en marche, du moins quil ne lise pas ce corpus au moment o vous ditez les *.rtr (sinon vos modifications risquent dtre crases par les sauvegardes suivantes ralises par Sonal).
Il est important que les timecodes soient les plus prcis possibles. Mentionner la minute sans prciser les secondes aboutit une erreur de placement qui peut logiquement aller jusqu une minute. Cest beaucoup, beaucoup trop pour Sonal. Il faut donc que les coordonnes dans le texte correspondent bien celles dans la bande. Il vaut mieux ne pas avoir du tout de points de synchro que des points de synchro errons.
Quand un point dsigne une mauvaise position, et quon ne sait pas si la vraie position du texte est loin avant ou aprs ce point, cest pour le moins droutant. Mme si la lecture du texte en parallle de lcoute permet de se reprer, on doit donc ttonner en aveugle autour du point et cest parfois assez long. Dautant que le systme de calcul infrentiel des positions (qui permet dapproximer la position dans la bande dun passage textuel et inversement) est totalement dtraqu par lexistence de points trs imprcis.
Si, aprs conversion, vous vous apercevez que les times codes sont trop imprcis et que les points de synchronisation sont mal placs, une fonction vous permet de dbarrasser les entretiens de tous leurs points de synchronisation. Elle est accessible dans le menu balises de la page de lecture :
Important : il y a parfois des lments non retranscrits en fin de bande, par exemple, quelques minutes dchanges informels qui sont prsents sur la bande mais pas dans le texte. Cela peut tre problmatique pour lestimation des positions, pour des raisons assez logiques. Ecouter immdiatement la fin de lentretien et vrifier que la bande et le texte sarrtent bien ensemble peut vous faire gagner du temps.
Pour travailler avec suffisamment de prcision, il faut afficher la barre de synchronisation en cliquant sur le bouton synchro :
Comment dcoupe-t-on de si grands extraits? Pour un premier dcoupage trs large, la meilleure mthode est de commencer par choisir une position dans le son (15 ou 30 min), avant de rechercher sa position dans le texte. Vous pouvez aussi progresser dans la retranscription, et rechercher la position dun passage textuel dans le fichier son. Vous pourrez ainsi placer des points de synchronisation ou de partition (bordure dextrait).
Une fois la bonne occurrence du mot trouve dans le texte, aprs avoir cal la bande et le verbatim, vous pouvez placer un point de partition.
4) Dcoupe
A lcoute, on corrige ventuellement lapproximation propose en repositionnant le lecteur dans la barre synchronisation. Une fois la bonne position dtermine, on peut arrter la bande pour plus de confort et placer un point de synchronisation ou de partition (voir ci-dessous).
de
10.7 Dplacer tous les points de synchronisation avant les balises de locuteur
Lors de la retranscription, Sonal ajoute par dfaut les points de synchronisation aprs les balises de locuteurs. Pour redcouper un entretien, il peut tre plus pratique davoir ces points non pas aprs mais avant les balises de locuteur. Une fonction permet de raliser cette interversion dans tout lentretien en une seule fois. Elle est disponible dans le menu balises de la page de lecture :
- le bouton vous permet de supprimer le point de synchronisation, ce qui ne sert en gnral que si vous avez cr un point en trop, ou quil nest pas correctement plac.
Ces points sont dits drivants . Ils sont une forme particulire de point de synchronisation.
Avant de cliquer sur Ajouter des points drivants , choisissez les options immdiatement sous le bouton : o les points doivent tre placs, quelle frquence etc. Des points drivants vont apparatre l o vous lavez demand.
L aussi, le calcul est dautant plus long que les extraits le sont eux-mmes. Le prdcoupage de lentretien en quelques grands extraits acclrera donc le processus.
Validation, avec entre. Le point devient sensible au dplacement (il est bleu et des caractres < et > sont placs ses extrmits). Si vous utilisez les flches <- et ->, le point se dplacera vers la gauche ou vers la droite. Astuce : si le point a une position trop anticipe (trop gauche), pour viter davoir le dcaler un grand nombre de fois vers la droite, vous pouvez taper ctrl+entre, le point est alors valid la position atteinte dans la lecture.
Aprs validation, le point redevient normal et les flches retrouvent leur fonction originale. On passe ainsi de point en point et cest un rel gain de temps.
Le raccourci ctrl+x permet de convertir les points de synchronisation en points de partition (couper les extraits de part et dautre).
Avec cette mthode, et dans de bonnes conditions, on peut resynchroniser les entretiens dans un temps compris entre un tiers et la moiti de la bande ellemme, soit 20 30 minutes pour une heure dentretien, mais cela dpend de la qualit de la transcription et du nombre de locuteurs. Cela dpend galement de la frquence dajout des points drivants. Vous ntes pas obligs de placer trop de points drivants ni de tous les corriger. Vous pouvez vous focaliser sur ceux qui correspondent un changement de thmatique.
Une fois les points drivants jugs utiles corrigs, vous pouvez supprimer tous ceux que vous avez ignors.
11 Redcouper audio-textuel
un
document
Cette partie vise vous montrer comment il est possible de transformer continuellement le dcoupage des documents audio-textuels lintrieur de la page de lecture. La trame temporelle contenue dans le texte va vous permettre deffectuer des dcoupages simultanment dans le texte et le son, en scindant ou fusionnant des extraits de part et dautre des positions connues. Ces fonctionnalits vous seront par exemple particulirement utiles si vous avez retranscrit intgralement vos entretiens sans procder un dcoupage, et que vous souhaitez par la suite raliser un encodage thmatique des fins danalyse. Cela implique que les fonctions prsentes maintenant ne sont utiles que si votre entretien est synchronis, ce qui doit tre le cas si vous avez retranscrit dans Sonal. Si votre entretien nest pas synchronis, commencez par le resynchroniser. Les fonctions de redcoupage de documents audio-textuels prennent place dans la fentre de lecture. Elles sont trs fastidieuses oprer dans la fentre dcoute, qui ne permet pas vraiment de prendre en compte la fois le texte et le son.
Couper
- le bouton vous permet de transformer le point de synchronisation en borne dextrait ; concrtement, de dcouper en deux lextrait de part et dautre du point de synchro.
Une bordure dextrait apparatra alors dans le texte. Les trois boutons en bout de ligne vous permettent dditer le texte de lextrait, de modifier sa thmatique ou de supprimer la bordure. Thmatique Editer Supprimer
Le menu contextuel des points de synchronisation permet donc de dcouper les extraits. Mais linverse Pour ce faire, faites un clic-droit sur le bouton de synchro et cliquez sur le bouton . qui dlimite lextrait dans la barre
Supprimer la bordure
Avec ces diffrentes fonctionnalits, vous pouvez donc dcouper et redcouper loisirs vos entretiens.
12 La pondration qualitative
Une fois les extraits retranscrits, Sonal vous propose une dernire couche dencodage, facultative, mais qui est susceptible de vous rendre service en phase de rdaction. Cette fonction se nomme pondration qualitative .
Lintrt de cette pondration qualitative est quelle pourra tre utilise pour filtrer les extraits et leur contenu textuel : en phase danalyse thmatique vous pourrez ne voir et nexporter que les passages pondrs un certain niveau.
Bien sr, le logiciel vous rendra ce que vous lui donnerez : gare donc aux effets de renforcement circulaire dans les analyses.
Si la case de mise en forme des balises est coche, ces balises sont mises en forme (voir ci-dessous).
On survole ensuite le texte jusquau dernier mot de la portion marquer, sur lequel on va cliquer nouveau. Un menu va apparatre :
Ce menu vous permet de faire deux choses : Affecter un poids la partie slectionne ou la copier vers le presse papier. :
Une fois le poids confr, le texte prend la forme voulue et la pondration est rappele en marge du texte :
En cas de problme, rappelez-vous que vous avez toujours la possibilit daller directement dans le texte modifier ou supprimer les balises (voir ci-dessus).
Aprs avoir ajout des mots cls, placez le curseur dans la zone de texte principale pour voir la mise en forme.
Analyser un corpus
gnrale
du
Chaque extrait possde des caractristiques qui lui sont propres : des coordonnes temporelles spcifiques (les extraits ne se superposent pas) une chane de caractres (texte) correspondant la retranscription Et dautres, quil partage avec dautres extraits : une ou plusieurs thmatique(s), qui dfinissent notamment sa couleur un entretien, duquel il est issu, et qui lui confre des caractristiques renseignes dans la base de donnes.
Dans Sonal, un extrait cest donc 1) une dure de bande, 2) du texte, 3) une thmatique 4) une srie de mots-cls et 5) des caractristiques tires de la base de donnes o sont enregistres des informations sur lentretien duquel est issu
lextrait. Cest sur la base de ces diffrents attributs que les extraits vont tre activs ou non.
La premire question est donc de savoir comment on active et comment on dsactive les extraits. Il y a quatre approches possibles et complmentaires pour activer ou dsactiver les extraits : On peut choisir de ne garder actives que certaines thmatiques On peut choisir de ne garder actifs que les extraits contenant certains mots cls. On peut choisir de ne garder actifs que certains entretiens en les choisissant individuellement On peut choisir de ne garder actifs que certains types dentretiens, en se basant sur les caractristiques de la base de donnes. Dun point de vue graphique, Sonal offre une reprsentation trs intuitive des filtrages puisque les analyses portent sur les extraits allums reprables dans le mur du corpus.
Corpus filtr (certaines thmatiques et certains entretiens sont dsactivs)
Il faut savoir que les filtrages oprs sont transversaux dans le logiciel. On peut filtrer les extraits depuis le corpus (cf. ci-dessus), mais on peut galement demander des filtrages lintrieur des fentres danalyse spcifiques (lexico ou chronomtriques). A chaque fois, les filtrages oprs un endroit sappliquent tout le reste des interfaces.
Hors exceptions, le systme dactivation/dsactivation des thmatiques, des (types d) entretiens est partout le mme :
Le bouton situ au sommet des panneaux de filtrage permet lactivation ou la dsactivation des toutes les catgories
En cumulant ou non les caractristiques de filtrage, vous pourrez donc trs facilement slectionner une collection dextraits que vous pourrez soumettre lune des approches proposes par le logiciel
Le nuage de tags reprsente les mots cls en ajustant leur police leur frquence : plus un mot cl est frquent, plus il est gros. En cliquant sur un mot cl, on accde directement la fentre de synthse o sont compils tous les extraits qui contiennent le mot cl en question. NB : Les autres critres de filtrage restent oprants.
La fentre qui apparat alors vous permettra de relire et/ou de rcouter tous les extraits slectionns. La colonne de gauche contient tous les extraits retenus. Lorsque lon clique sur lun dentre eux, la bande son se lance et le texte de lextrait apparat dans la partie droite de la page. Une fois un extrait termin, Sonal lance automatiquement le suivant.
Si lextrait contient des points de synchronisation, un petit bouton + apparat sur la gauche de ltiquette dextrait. Au clic, la liste des points apparat sous ltiquette de lextrait. Vous pouvez ainsi accder plus rapidement certains passages.
Libre vous dutiliser par la suite le cadre interprtatif quil vous plaira; Sonal se contente de vous mettre disposition linventaire exhaustif des extraits portant sur un sujet donn et/ou tant issus de certains (types) dentretiens . On parle donc danalyse qualitative car elle repose sur une dmarche interprtative mais il ny a pas
proprement parler de mthode. Il sagit tout simplement de sassurer quon ne rate aucun passage intressant. Une fois la synthse ralise, il est possible de copier des extraits individuellement pour les coller dans un traitement de texte, de supprimer de la synthse ceux qui ne prsentent pas dintrt etc.
La ligne de chaque extrait contient le premier contexte dapparition du mot puis , si vous cliquez dessus, apparat une liste des contextes dans lesquels le mot se trouve. Si vous cliquez sur ces lignes, vous tes amens leur position dans lextrait, ce qui est pratique si vous ralisez des extraits trs longs.
Cette fonctionnalit vous permet galement de rechercher un mot cl lintrieur de tout le corpus. Il suffit de ne pas filtrer les extraits avant synthse.
Puis slectionnez un niveau de filtrage dtermin par le nombre dtoiles. Lorsquun niveau est dfini, napparaissent plus que les extraits qui contiennent au moins un passage pondr au niveau donn.
Si vous cliquez sur la case filtrer extraits , le contenu des extraits retenus est filtr pour ne plus afficher que les passages du poids demand. Cela peut tre utile pour exporter un recueil de citations juges illustratives vers un traitement de texte en cours de rdaction.
Aprs avoir prpar votre export en cochant (ou pas) les diffrentes cases doption, vous pouvez choisir dexporter directement dans Word (si vous avez Microsoft Word) ou bien denregistrer lexport au format *.Rtf, que votre ordinateur ouvrira avec le traitement de texte courant. Les options disponibles sont les suivantes : Informations sur les interviews : afficher le contenu de la base de donnes pour chaque entretien Observations sur les interviews : afficher les observations sur les diffrents entretiens Informations sur les extraits : voir les coordonnes temporelles et les thmatiques des extraits Afficher les balises : voir les points de synchronisation (convertis en HH :MM:SS) Afficher les formats : reprsenter dans le texte les parties pondres (cette fonction nest pour linstant disponible que dans lexport en *Rtf.)
Aprs enregistrement, votre synthse sera sauvegarde dans un fichier portant lextension *.snt, situ dans un sous-dossier du dossier qui accueille votre corpus nomm Synth . Ce fichier ne contient aucune donne en elle-mme, seulement des informations permettant dextraire nouveau les donnes du corpus. Si vous modifiez un extrait, celui-ci apparatra modifi aprs rouverture de la synthse.
La fentre de synthse peut donc galement tre utilise pour faire des modifications slectives dans votre corpus.
16 Lanalyse lexicomtrique
Pour lancer une analyse lexicomtrique, cliquez sur le bouton Lexico situ dans la page de corpus.
16.1 A quoi sert lanalyse lexicomtrique? - Compter les occurrences des diffrents mots (ou formes)
Lanalyse lexicomtrique permet dabord un dcompte des mots les plus frquemment utiliss dans votre corpus afin de reprer, au-del des formes gnralement trs banales qui occupent le haut de la liste, les termes particuliers les plus rcurrents dans vos entretiens. La spcificit de Sonal est que vous pourrez non seulement relire mais aussi rcouter tous les passages qui contiennent les mots qui vous intressent. Ds lors, la lexicomtrie joue un rle dindexation de la bande sonore et permet une entre diffrente dans les matriaux, qui transcende les catgories thmatiques et les caractristiques des entretiens.
- Etudier les spcificits langagires associes un sujet et/ou un (type de) locuteur etc.
Lanalyse lexicomtrique prend tout son intrt lorsquelle ne porte plus sur lintgralit du corpus, mais sur une sous-partie, que vous aurez pralablement filtre. En pareil cas, Sonal vous permettra de reprer trs rapidement le vocabulaire le plus caractristique de cette sous-partie. Par exemple, il devient possible dtudier les mots les plus utiliss par un type de rpondant sur un sujet donn, en contrastant en fonction des caractristiques possibles. Vous accdez ainsi aux diffrences de formulation sur un sujet donn par diffrents groupes de locuteurs, ce qui cadre avec une tradition structurale de lanalyse lexicale dans laquelle le vocabulaire est le reflet des positions sociales.
- Etudier les catgories de rpondants ou les sujets dans lesquels une forme est la plus frquente.
Sonal propose une approche complmentaire en vous permettant, pour un mot donn, de rechercher dans quelles partitions du corpus il est le plus prsent et le plus spcifique. On peut donc faire des allers-retours entre une entre par les catgories (quel vocabulaire est le plus li tel sujet par exemple) et une entre par le vocabulaire (dans quelle sous population du corpus trouve-t-on le plus frquemment et le plus spcifiquement un mot donn?)
Lorsque vous cliquez sur le bouton Lexico dans la page du corpus, si vous avez dj cr cette base, le logiciel la chargera, sinon il en crira une nouvelle, ce qui prendra plus de temps. La dure de chargement est variable en fonction des dimensions du corpus et de la puissance de votre ordinateur. Si vous avez le moindre problme avec la base lexicale et quelle vous emp che daccder la fonction de lexicomtrie, il vous suffit de supprimer le fichier lexico.xls dans le dossier projet. Au prochain rechargement, une base sera rgnre.
Avant de se pencher sur la signification des graphiques et des indicateurs affichs, il faut dabord faire le tour de linterface
Des barres bleues reprsentent ces frquences suivant une chelle logarithmique. Cest loccasion de vrifier la fameuse loi de Zipf, que traduit (normalement) la dcroissance trs progressive des occurrences des formes lintrieur dun corpus .
La liste reprsente les formes tries dabord par pourcentage de spcificit, puis par occurrences, ce qui veut dire que vous avez au sommet de la liste les formes exclusives les plus frquentes.
Lafon Pierre. Sur la variabilit de la frquence des formes dans un corpus. In: Mots, octobre 1980, N1. pp. 127-165.
Les barres bleues reprsentent la spcificit positive, la barre rouge la spcificit ngative. Les barres reprsentent limprobabilit que les mots apparaissent comme ils le font. En clair, plus la barre est large, moins lapparition du mot dans les conditions observes est probable. Le contenu des cases dans le prolongement des barres renseigne linverse la probabilit en %. Plus elle est basse, moins la forme apparat de manire prvisible.
Vous pouvez choisir de ne retenir que les formes dont la longueur est infrieure un certain nombre de caractres. Pas dfaut, Sonal limite laffichage aux mots de plus de 2 caractres. Vous pouvez galement choisir un plancher pour le nombre doccurrences. Celui-ci doit tre fonction du nombre doccurrences total et de la finesse du filtrage.
Pour ce faire, deux possibilits soffrent vous. Parmi les boutons qui apparaissent droite du mot survol, les deux premiers servent accder au dtail de ses occurrences. Le premier vous permet daccder la synthse des extraits contenant le lemme slectionn (le mot ou les mots regroups sous un mme terme). La page de synthse saffiche alors, avec votre slection. Le bouton reprsentant une petite liste, situ sur immdiatement droite du bouton play, vous permet daccder une page danalyse du mot qui contient de manire condense toutes les phrases dans lesquelles le mot recherch apparat.
Attention, laffichage ne se limite pas aux mots contenus dans les extraits isol s. Toutes les apparitions du mot choisi sont recenses, quelles soient ou non dans des thmatiques ou des extraits filtrs. Pour les mots trs frquents, au dessus de 500 occurrences, le chargement de cette page peut tre assez long : un message vous demandera de confirmer votre commande.
Ce choix sexplique par la finalit confre cette interface, qui est de retourner lanalyse. En gnral, vous vous penchez sur un mot aprs avoir isol une sous-partie du corpus (une thmatique et/ou un type de locuteur), en retournant lanalyse, le logiciel vous dit en somme do vous auriez pu arriver. Dans cette optique, lors du chargement, la recherche de spcificit se fait dabord sur lensemble des catgories de filtrage du corpus. Sur le ct gauche
de la page, apparaissent les diffrentes catgories avec lesquelles le mot est li. Les extraits ne sont pas tris.
La barre bleue gauche reprsente les effectifs; la barre de droite bleue ou rouge reprsente la probabilit calcule avec lindice de spcificit de P. Lafon pour que ces effectifs soient observs dans la catgorie comme ils le sont. Les boutons au sommet de ce panneau vous permettent de trier les mots. Le premier correspond au mode de tri qui est affich au dmarrage (toutes les catgories, qui mlange les thmatiques, les entretiens et les variables, qui peuvent tre redondants), le second vous permet de trier par entretien, le troisime par thmatique, et enfin, le quatrime, par variable. A chaque fois, en cliquant sur une sous-catgorie, vous serez ramen aux extraits correspondants.
16.6 La lemmatisation
Sur la partie gauche du panneau consacr la lexicomtrie, diffrents boutons vous permettent de modifier la base lexicale et de lancer des analyses. La lemmatisation consiste regrouper sous un mme terme diffrents mots qui partagent par exemple une racine commune, ou qui se rfrent un mme champ lexical. Concrtement, cela revient par exemple mettre sous le terme manger toutes les formes conjugues (ou flchies ) du verbe manger : (je) mange, (nous) mangeons (quil) manget etc. Cela peut aussi consister mettre au singulier tous les pluriels etc. Cela permet de diminuer le nombre doccurrences diffrentes dans la base, et de durcir un peu les rsultats statistiques. Sonal vous laisse le choix de lemmatiser ou non votre corpus et de le faire soit de manire automatique, soit manuelle. De plus, pour viter les cueils lis lautomatisation, vous pouvez revenir tant que vous le voulez sur les lemmatisations opres, car le contenu dun lemme reste accessible et les formes regro upes peuvent toujours faire lobjet dune analyse individualise, et tre dtaches du groupe.
Vous devez dabord slectionner les mots que vous voulez regrouper (1). Pour cela cliquez simplement sur les mots dans la liste. Pour faire une slection collective, enfoncez le bouton de la souris sur le premier mot de la srie puis descendez la souris
sans relcher le bouton. Cliquez ensuite sur le bouton Regrouper (2) qui vous affiche une fentre de lemmatisation rcapitulant toutes les formes slectionnes. Dans la zone de texte en bas de la page, donnez un nom pour le groupe cr (3), (pour faciliter la remmoration quil sagit dune forme synthtique, vous pouvez prendre le parti de placer un petit + la fin). Cliquez enfin sur lemmatiser pour valider. Votre nouveau groupe va tre cr. Si le nom de groupe existe dj, les mots seront simplement ajouts au groupe existant. La base est partiellement rcrite puis trie. Cette opration peut prendre un certain temps si le groupe contient beaucoup de mots diffrents
- La lemmatisation automatique
Le bouton Lemmatiser la base propose une lemmatisation automatique de toute la base. En cliquant sur la flche pointant vers le bas droite du bouton, vous pourrez choisir les diffrentes options. Pour linstant, est propose la lemmatisation des verbes, des pluriels (simples ! (s), pour linstant), des nombres et des mots outils. A chaque fois quun groupe est cr, la forme synthtique affecte tous les mots qui en font partie est suivie dun +. Cette procdure est trs rudimentaire et ne gre aucune exception. Aussi, il est gnralement ncessaire de revenir sur les regroupements oprs.
Formes regroupes
Apparaissent alors, sous forme darborescence, les diffrentes formes regroupes sous un lemme commun.Vous pouvez ds lors regarder le nombre doccurrences de ces diffrentes formes, et ventuellement dtacher certains mots du groupe, en cliquant sur la petite croix droite du nom.
Retirer du lemme
10
Cibois Philippe, Le traitement des mots associs des questions : lapport du logiciel Trideux in Didier Demazire, Claire Brossaud, Patrick Trabal et Karl Van Metter (dir.), Analyses textuelles en sociologie. Logiciels, mthodes, usages, Rennes, Presses Universitaires de Rennes, 2006, p.156-173
11
Cibois Philippe, Eclairer le vocabulaire des questions ouvertes par les questions fermes : le tableau lexical des questions, Bulletin de mthodologie sociologique, n26, 1989, p.12-23.
Dans Sonal, cette mthode procde en deux tapes. Il faut dabord crer un tableau lexical, qui recense, pour chaque mot, le nombre dapparitions dans les diffrentes catgories du corpus. Attention, le tableau lexical est produit partir des extraits maintenus actifs, et sur les formes retenues aprs filtrage. Cela implique quune approche globale des matriaux par lintermdiaire dune analyse factorielle doit logiquement se faire sur lintgralit du corpus. Cependant, en cela comme en dautres choses, Sonal vous laisse une absolue libert. En cliquant sur la flche situe droite du bouton, vous pourrez choisir les catgories afficher en colonnes dans le tableau lexical, et dterminer si elles joueront un rle actif ou illustratif (supp.) dans lanalyse factorielle :
Une fois le tableau lexical cr, il vous est propos de louvrir, pour visualiser son contenu et ventuellement le traiter dans dautres applications. Vous ntes en rien oblig de louvrir, mais cela peut vous permettre de mieux comprendre de quoi il retourne. Pensez seulement le refermer pour pouvoir passer la suite. Pour obtenir une reprsentation de type factoriel des carts lindpendance lintrieur de ce tableau lexical, cliquez sur le bouton Analyse factorielle. La fentre danalyse factorielle souvre alors.
Ce plan, que vous pouvez paramtrer avec les diffrentes options situes sur la partie gauche de lcran, vous permettra de faire ressortir des typologies articulant le langage utilis (en noir) et les diffrentes catgories (en bleu). Pour une meilleure comprhension de la mthode et de la manire dont il faut lire ses rsultats, je vous renvoie aux publications de P. Cibois sur le sujet.
17 Lanalyse chronomtrique
17.1 A quoi sert lanalyse chronomtrique?
Lanalyse chronomtrique vous permet dtudier les temps de parole consacrs aux diffrentes thmatiques de votre corpus. En analysant le temps pass sur chaque sujet, elle rpond la question de savoir qui parle de quoi, et pendant combien de temps? Ces informations peuvent tre prcieuses pour dceler ou confirmer de grandes tendances dans la propension des diffrents types de rpondants parler de diffrents sujets.
Vous disposez de plusieurs informations : le temps total de bande la dure totale des extraits et le pourcentage de la bande encode (celui-ci peut excder 100% en cas de superpositions dextraits) le nombre dextraits Le graphique circulaire peut tre export en utilisant le bouton Export image qui vous permettra denregistrer limage (au format Bitmap) au nom et lemplacement voulus. Cest peu de choses prs une copie dcran.
Pour lanalyse dun entretien donn, ou dun type dentretien, utilisez les boutons de filtrage. Les panneaux (thmatiques, entretiens, variables) vous permettront daffiner vos analyses.
Cette mthode se borne une analyse locale qui ne permet pas proprement parler de comparaisons. Vous pouvez videmment alterner les filtrages pour reprer visuellement les variations entre entretiens ou types dentretiens, mais ce nest pas forcment trs pratique. Des amliorations de linterface sont en cours. Dici l, la meilleure solution pour analyser les temps de parole est encore dexporter les rsultats pour travailler hors de Sonal.
Le tableau des secondes vous permettra de faire vos propres graphiques partir des donnes brutes, le tableau des pourcentages en lignes vous permettra de rpondre la question de savoir qui consacre quelle part de son temps de parole aux diffrents sujets, en comparant ventuellement chaque sous-population la moyenne, le tableau des pourcentages en colonnes apporte linformation complmentaire : dans quelles populations se concentrent les interventions sur un sujet donn.
Les units de temps peuvent ensuite faire lobjet dune analyse similaire celle qui serait produite partir de rponses individuelles. Voici comment vous y prendre : il faut dabord choisir entre deux units de temps : les minutes ou les secondes. En cliquant droite du bouton Export Trideux, vous afficherez un menu droulant dans lequel vous pourrez choisir entre les deux units (voir ci-dessous). A ct de chaque unit, vous avez le nombre de lignes que contiendrait la base de donnes cre.
Le travail en secondes est videmment prfrable mais si votre corpus dpasse par exemple une centaine dheures de bandes, votre base contiendra 360 000 vnements, ce que Trideux peut grer, mais au prix dun ralentissement significatif. Si vous travaillez en minutes sur un corpus court, la prcision sera mauvaise car les valeurs sont discrtises (arrondies la minute suprieure) pour des raisons logiques (on ne peut pas ajouter 2,5 lignes une base de donnes). Le changement dunit implique videmment que tous les indicateurs statistiques fournis par Trideux sont utiliser avec prudence. Par exemple, selon que vous travaillerez en minutes ou en secondes, le khi de vos tableaux pourra varier de 1 60 et, en fonction, tre ou non significatif.
En cliquant ensuite sur le bouton Export trideux, vous lancerez lcriture dune base lisible par Trideux. Elle sera situe dans le dossier du projet, dans un sous dossier nomm Trideux\. La base cre portera le nom du corpus, suivi de (Min)1 ou de (Sec)1 selon lunit choisie. La base contient pour premires variables les thmatiques et les entretiens du corpus. Puis les diffrentes variables de votre base de donnes.
Une fois dans Trideux, toutes les fonctionnalits du logiciel vous sont accessibles. Vous pouvez par exemple accder, via le bouton Tri plat, une reprsentation en barres des temps de parole consacrs aux diffrentes thmatiques, de la dure des diffrents entretiens ou le temps total par catgorie de rpondant.
Tri plat des thmatiques (dans Trideux)
Pour tudier plus en dtail les rsultats de votre tri plat, vous pouvez utiliser lexplorateur de donnes, qui vous permettra, de manire intuitive, de creuser vos catgories la manire de poupes russes. Dans lexemple ci-dessous, les donnes sont tires dun corpus dentretiens exploratoires raliss par des L2 de sociologie de lUniversit F. Rabelais, en vue de la ralisation dune enqute par questionnaire. Les entretiens, relativement courts, ont t encods thmatiquement et annots, avant dtre redistribus sous forme de corpus audio aux tudiants. En parallle, chaque entretien sest vu qualifier par quelques variables (sexe, ge du rpondant, sexe de lenquteur etc), ce qui a permis davoir une vue globale de lchantillon, et dtudier les variations du contenu des entretiens selon les caractristiques de lenqut comme de lenquteur. Dans
lexemple ci-dessous, on tudie la place des thmatiques dans les entretiens raliss par des enqutrices, selon quelles interrogeaient des tudiantes ou des tudiants.
Fentre d'exploration de donnes
La fentre de tableau crois graphique vous donnera la possibilit de raliser ce genre de croisements, mais de manire plus systmatique. La reprsentation graphique des PEM agissant comme un stimulus pour vous permettre de reprer rapidement les cases contenant des carts la moyennes intressants.
Tri crois graphique (Trideux)
18 Lanalyse conversationnelle
Les fonctionnalits danalyse conversationnelle ne sont pour linstant disponibles quentretien par entretien (Voir la page de lecture). Une approche globale des corpus sera possible et documente prochainement.
19 Lanalyse dbitmtrique
Lanalyse dbitmtrique nest pas encore implmente lchelle du corpus. Voir la page de lecture pour une approche entretien par entretien.
Annexes
A quoi servent-ils ? Cest en quelque sorte un niveau infrieur de chapitrage des entretiens, complmentaire des extraits, qui signalement quant eux un changement de sujet. Ils sont pratiques pour reprer les phrases intressantes que lon veut pouvoir rcouter ou voir ressortir. En effet, il faut savoir que les points de synchronisation apparaissent dornavant sous forme darborescence dans la synthse, un niveau infrieur aux extraits. Les placer devant des phrases importantes permet de les mettre en relief et de les (donner ) couter trs facilement. Exemple de synthse avec points de synchronisation
Mais au-del, les points de synchronisation permettent surtout doffrir une plus grande souplesse dans lutilisation du logiciel. Ils permettent notamment de redcouper les extraits (cf. plus bas) et amliorent le calcul de position. Il y a donc un grand intrt en placer trs rgulirement dans le texte. Comment faire ? Au clic droit, les points de synchro (dans la barre de synchronisation comme dans le texte) font apparatre un menu contextuel qui vous permet de faire diffrentes choses :
- le bouton vous permet dditer le texte de lextrait (cf. plus bas) en vous positionnant prcisment au niveau du point de synchronisation. Cela peut par exemple vous permettre de modifier manuellement la valeur du point ou de le dplacer dans le texte. - le bouton vous permet de transformer le point de synchronisation en borne dextrait. Concrtement, de dcouper en deux lextrait de part et dautre du point de synchro. - le bouton vous permet de supprimer le point de synchronisation, ce qui ne sert en gnral que si vous avez cr un point en trop, ou quil nest pas correctement plac.
Point drivant
Comme ces points sont ajouts automatiquement, leur position est dtermine par calcul : en se basant sur les coordonnes fiables autour du point (avant et aprs), et sur le nombre de mots contenus dans ces limites, le logiciel infre la position probable de la balise en question dans la bande, et lajoute comme point de synchro dans le texte. Evidemment, la qualit de lestimation est trs relative. Aussi ces points ont -ils la particularit de se terminer par un ? (exemple : *621,5?+). Sonal sait donc quils ne sont pas totalement fiables et recalcule leur position chaque modification de la trame temporelle. Ds que lon corrige un point quelque part (par glisser dplacer), les points environnants sajustent automatiquement cette nouvelle donne : la validation dun point donne une base corrige pour lestimation de la position des points environnants qui sont encore incertains. Concrtement, si vous dplacez un point vers la gauche ou la droite, tous les points avant et aprs se dcalent dans le mme sens. De cette manire, on dcale dun mme mouvement plusieurs points et, logiquement, lestimation se fait de plus en plus prcise mesure que lon corrige les points. Dans certains contextes (voir plus bas), ce procd est vraiment trs efficace.
22 Dbuguer un corpus
Malgr tous les efforts faits pour stabiliser lapplication et pour limiter les risques de perte de donnes, il est toujours possible qu un moment donn, vous ayez dbuguer votre corpus. Votre chance en loccurrence est que le fonctionnement de Sonal est particulirement simple. Tout repose sur des fichiers texte avec un systme de balisage rudimentaire. Il est donc toujours possible de corriger manuellement ce qui dysfonctionne. Mais, pour ce faire, la premire chose faire est de se pencher un peu sur le fonctionnement du logiciel pour en comprendre lorganisation densemble.
En pareil cas, Sonal ne retrouve pas ce quil cherche sur chaque ligne (code, couleur, nom) et peut planter au moment du chargement des thmatiques. Au besoin, nhsitez pas faire des copies du fichier corpus (que vous placerez dans le mme dossier que loriginal) et tenter des modifications. Une bonne mthode pour sassurer que le problme ne provient pas du corpus est de faire une copie du fichier crp, et dy retirer tous les entretiens, c'est--dire de supprimer les lignes entre les balises |ENTR|.
Ce faisant, vous ne supprimerez absolument pas vos donnes, vous vous contenterez de ne plus rfrencer les entretiens en question dans le corpus. Ceux-ci resteront disponibles pour une importation ultrieure.
Aprs enregistrement, Si Sonal peut louvrir, cest bien que le problme provient dun entretien en particulier, pas des paramtres du corpus. Si jamais vous avez un doute sur lentretien fautif. Vous pouvez repartir de votre corpus sans entretien et rajouter les entretiens (idalement par un ajout collectif). Au moment du chargement des entretiens dans le corpus, vous pourrez voir au niveau de quel entretien se produit le problme.
Pour tenter une restauration, il vous faudra simplement recopier le fichier dont le nom se termine par (10) et le coller dans le rpertoire du projet en lieu et place du Rtr effectivement utilis dans le corpus.
Cela implique de dabord renommer le Rtr de lentretien dfectueux situ dans le dossier projet. Passer par exemple de NomEntretien.Rtr NomEntretien(Ancien).Rtr puis de coller le fichier Rtr issu du dossier Restaur sa place, en lui donnant exactement le mme nom, c'est--dire en retirant le (10) situ la fin.
Si, au rechargement du corpus, votre entretien bloque toujours. Essayez avec la version 9, puis la 8 et ainsi de suite jusqu retrouver une version stable. Evidemment, plus vous remonterez en arrire, plus vous risquez de perdre du travail. Si vous possdez un dossier de sauvegarde rcent, il vous suffira daller y recopier une version stable du Rtr de lentretien fautif et de la coller la place du Rtr s itu dans le dossier du projet (pensez renommer le Rtr fautif avant, on ne sait jamais)
Les fonctionnalits non explicites, et qui ne sont pas prsentes ailleurs, sont rsumes page suivante :
Sonal - Mode demploi 157 Ajouter un enregistrement Enregistrer un entretien Ajouter un document texte Zommer/dzoomer Mettre lchelle Trier les entretiens
Lire Ecouter
Synthse Exporter
Renommer
En dessous, la zone de rappel du nom et de lextension du document vous permettra de le renommer, ou de changer de format. Plus bas, deux barres vous signifient la fois le % de retranscription et dcoute (dans la page dcoute). Une zone dobservations vous attend juste en dessous (validez avec entre pour sauvegarder vos modifications). La partie infrieure du panneau est dvolue aux variables de la base de donnes. Vous pouvez directement modifier les valeurs dans cette fentre.
La fentre contient deux parties : La partie suprieure reprsente le spectre de lextrait. Elle permet de se positionner dans la bande et de choisir la thmatique associe. La fentre de choix de la thmatique apparat sur la droite.
La partie infrieure contient le texte associ lextrait. Elle permet de retranscrire ou de commenter le contenu sonore de lextrait. Elle perme t aussi de contrler la bande tout en retranscrivant :
Contrle du lecteur Lorsque vous travaillez dans une fentre ddition de texte, la barre despace ne peut pas tre utilise pour contrler la ba nde. Les fonctions de pilotage ncessitent dutiliser le bouton Alt en mme temps que la commande. Pour dmarrer ou arrter la lecture utilisez ALT + Barre despace Pour vous dplacer vers la gauche ou la droite utilisez ALT + ou
Vous disposez de certaines options : Vous pouvez notamment insrer automatiquement Question ou Rponse, diter une liste de 12 interlocuteurs dont le code sera insr en utilisant les touches F1 F12. Afficher ou non la valeur des balises de synchronisation
en
une de
- Lire un entretien
23.5.1 Ouvrir la liseuse
Le bouton daccs la liseuse est plac immdiatement droite de celui de la page dcoute dans la page de corpus car le choix de lune ou lau tre approche. Le bouton reprsente une page de texte.
- Confort de lecture
La liseuse vous offre les fonctions usuelles de mise en page (police, taille de police, espacement, nombre de colonnes). Les boutons ddis sont juste au dessus du texte. Par dfaut, la page est volontairement troite, pour amliorer le confort de lecture, mais vous pouvez llargir en dplaant la bordure droite du cadre qui contient le texte.
Pour vous dplacer dans le texte, utilisez la molette de la souris ou lascenseur sur la droite de la page. Cependant, pour effectuer des dplacements rapides, le plus simple est de cliquer directement sur les extraits dans le spectre de lentretien qui est en haut de la page. Vous disposez dune sorte d ascenseur horizontal qui vous permet de vous dplacer prcisment dans le texte, il ne faut pas sen priver. Vous pouvez galement utiliser les flches prcdent et suivant de part et dautre du bouton Play pour sauter dextrait en extrait. Lorsque vous tes perdu dans le texte ou dans la bande, ces fonctions vous permettent de vous retrouver trs facilement. Lors dun clic sur un extrait, le texte et la bande se positionnent au dbut de lext rait. Si vous recliquez un peu plus loin sur lextrait dj choisi, la bande se placera prcisment l o vous avez cliqu et le texte se positionnera aussi prs que possible de la position correspondant au passage cout dans le texte.
La qualit du positionnement dans le texte est fonction de la qualit du maillage temporel : si vous tes dans un long ou un trs long extrait sans point de synchronisation, le systme dinfrence positionnelle peut se tromper de plusieurs lignes. Plus le maillage est troit (i.e. les extraits sont courts ou des points de synchronisation sont placs intervalles rguliers), plus le placement est prcis.
Par ailleurs, si vous avez plac des points de synchronisation dans le texte, vous pourrez rcouter le passage considr en cliquant sur le bouton .
24 Traduire Sonal
Pour traduire Sonal, il faut choisir une langue dans le menu droulant disponible au dmarrage du logiciel :
Il vous faudra redmarrer le logiciel. Les principales fonctions seront traduites dans la langue voulue.
Ces fichiers sont de simples fichiers texte qui contiennent le texte de base du logiciel suivis de = et de leur traduction. Remplacez ce qui suit le = par votre traduction :
25 Informations
Les mises jour sont chaudement recommandes. Le logiciel gagne en stabilit au fil du temps, il est dommage de se priver des progrs faits progressivement. Dans tous les cas, les mises jour ne peuvent pas nuire vos donnes.
Vous pouvez suivre le dveloppement du logiciel en vous rendant sur son site ou sur le carnet de recherche qui lui est consacr sur hypothses.org.
Si vous voulez suivre les mises jour, vous pouvez vous abonner au flux RSS de Sonal.
Si vous voulez nous faire part de vos difficults ou si vous avez des suggestions, vous pouvez nous crire cette adresse :