Vous êtes sur la page 1sur 23

UTILISATION DU LOGICIEL

TRANSCRIBER

Outil pour faire de l’alignement texte-son


Emmanuelle Canut
PROJET DOC
Université de Lille
LA CONSTITUTION DU CORPUS
◼ Règles déontologiques pour l’oral
 Aspects juridiques
◼ Procédures d’anonymisation et exploitation des données
de l’enregistrement et de la transcription
 Guide des bonnes pratiques pour la constitution, l’exploitation, la
conservation et la diffusion des corpus oraux, CNRS & Délégation
Générale à la Langue Française et aux Langues de France (2006)
 Cf documents pour le projet DOC (autorisation et cession de
droits)

◼ Utilisation de conventions de transcription


adaptées au projet
 Cf document pour le projet DOC pour la langue
utilisée
◼ en lien avec les spécificités du logiciel Transcriber
Téléchargement du logiciel

◼ Pour travailler depuis son ordinateur :


◼ http://sourceforge.net/project/showfiles.php?gro
up_id=40021&package_id=51790
 A cette adresse, choisir Transcriber-1.5.1-
windows.exe
◼ Pour les mac :
http://sourceforge.net/project/showfiles.php?gro
up_id=4002 A cette adresse télécharger le
fichier qui a l’extension .dmg
ETAPE 1 : fonctions de base
◼ Interface générale Transcriber
Barre de
menu

Zone de
transcription

Touches d’actions
sur le fichier son

Représentation des
oscillations du son
Position de
lecture

Temps (en
Futurs segments secondes)
du fichier
Choix de la langue
◼ Menu Options puis sous-menu Général…

ATTENTION !
Il arrive que les fenêtres
ne s’ouvrent pas
complètement : tirer la
fenêtre vers le bas avec
votre souris pour avoir
les informations OK,
cancel…
Démarrer une transcription
Menu Fichier
=> ouvrir une transcription ou nouvelle transcription
Ouvrir un fichier son
Menu fichier => ouvrir un fichier son
Nommer le fichier

Cliquer sur « report »

Dans « topic » (sujet) : ID du corpus_Nom(s)etudiant(s)


ID corpus = DOC_FR_2020_RENC (FR = Français, mettre ES pour Espagnol… ;
RENC = rencontre, mettre CONS pour conseil et OPI pour opinion)
Créer un locuteur

Raccourci clavier : Ctrl + t


Ou cliquer directement sur
l’étiquette bleue no speaker
Créer un locuteur (suite)

Taper le nom du locuteur


Valider et recommencer pour chaque nouveau locuteur (L2, L3)
ETAPE 2 : Aligner le son et la
transcription
◼ Pour écouter l’enregistrement
 Utiliser les boutons de navigation dans le fichier son
(avec la souris)
 Utiliser la touche Tabulation du clavier
◼ Pour lancer et interrompre le fichier audio
◼ Pour transcrire
 Transcrire manuellement
◼ Transcriber n’est pas un logiciel de transcription automatique !
 Adopter les conventions de transcription
◼ Se référer au document de conventions pour le projet DOC
 Utiliser les balises de Transcriber pour indiquer la
prononciation, les bruits, des commentaires, etc.
Procédure de segmentation
◼ Pour aligner le texte et le son : deux
méthodes
 1. Faire le découpage en segments en amont
◼ Découper le fichier son en petits segments avant de transcrire
◼ Une puce (bullet) identifie un segment
 Critères : pauses, temps précis (en s’appuyant sur la bande son)
 Préférer les segments courts
◼ Ainsi, une fois le découpage
effectué, on peut commencer à
transcrire dans les segments
Procédure de segmentation
(suite)
◼ 2. Faire le découpage du son en même temps
qu’on le transcrit
 Lancer le son et transcrire
en opérant des lecture/pause
grâce à la touche tabulation
 Les segments sont
délimités à l’aide de la
touche Entrée
Créer un tour

Ctrl + t et
sélectionner le
locuteur
Supprimer un tour (une frontière)
Chevauchements
Cocher Parole superposée/overlapping speech et indiquer l’ordre des
locuteurs (1er/2ème locuteur)
ATTENTION ! Le son et le texte des parties chevauchées doivent être
alignés
Insérer une balise : commentaire

Edition/edit => insérer une balise/insert event =>


commentaire/comment.
Ecrire le commentaire dans l’espace description
Insérer une balise : bruit

Edition/edit => insérer une balise/insert event =>


bruit isolé/isolated noise
Insérer une balise : bruit (suite)
Choisir un bruit dans la liste
Si bruit non répertorié : écrire dans description le symbole indiqué
dans les conventions de transcription

Créer un bruit
Option => événements/
events => modifier la liste
des bruits/edit noise list
Cliquer sur « nouveau » et
insérer un nouveau bruit
Insérer une balise : prononciation
Edition/edit => insérer une balise/insert event => prononciation/
pronounce
Ecrire l’élément en alphabet SAMPA (cf conventions) dans
l’espace description
Insérer une balise : langue / lexique
Vérifier l’alignement
◼ Utiliser les flèches du clavier pour naviguer dans le corpus
 Vérifier que ce qui est entendu et transcrit coïncident
Enregistrer le travail en cours

◼ Enregistrer le travail
 Menu Options => enregistrer la configuration/save
configuration
◼ Enregistrer le fichier
 Menu Fichier => enregistrer sous/save as

Vous aimerez peut-être aussi