Vous êtes sur la page 1sur 5

Voici une bonne pratique des erreurs les plus commises et ce qu'il faut faire dans ces cas là

pour éviter les Redo.

[Segmentation]
 Un segment est à couper seulement pour 2 raisons :
 Pause de parole de plus de 0,5 s (pour une même personne, et non pour
d’autres annotations telles que noise, autre speaker etc. Ainsi si un autre
speaker prend la parole, il n’y aura pas lieu de couper le premier segment
sauf si le premier speaker ne parle pas pendant au moins 0,5 s) 
 Le speaker a parlé plus de 30 secondes sans interruption 
NB : 
Pour savoir rapidement si une pause de parole est < ou > 0,5 seconde, il suffit
d'utiliser les touches 5 et 8 du clavier qui permettent d'avance de 0,5 seconde à la fois
=> Ainsi couper le segment au moment où la personne arrête de parler avant la pause de
0,5 s puis ouvrir un autre segment quand il commence à parler (On peut utiliser le bouton
split pour couper un segment en posant préalablement le curseur audio et le curseur du
clavier au bon endroit)
Pour les coupures de segments à 30 secondes, ne pas dépasser les 30 secondes (millièmes
de seconde comprises). On peut couper de 29 à 30 secondes, sans dépasser les 30
secondes.

 Un segment doit commencer quand il y a quelques choses sur le spectre audio (il
peut commencer 0,1 seconde MAX avant la prise de parole. De même un segment
ne doit pas se terminer s’il y a encore quelques choses sur le spectre audio
(terminaison d’un mot). Il peut terminer 0,1 seconde MAX après la prise de parole
 
[Speaker label]
 “speaker 1” , “speaker 2”  etc. sont tout en minuscule. 
 Quand le nom du speaker est connu, il faut changer le label “speaker 1” en “speaker
prénom” ou “speaker nom & prénom” : ce changement se fait en une seule fois au
niveau de l’entête comportant la liste des speakers.
 “pre recorded speaker 1”, “pre recorded speaker 2” sont utilisés pour des pré
enregistrements et non pour des personnes parlant en live : Chanson, Pub etc.
 “unidentifiable speaker” : Si l’on arrive pas à identifier la personne pour une raison
particulière telle que changement de voix (imitation) ou bruit environnant ne
permettant pas de l’identifier, il faut associer le segment au label "unidentifiable
speaker". 
NB : Un ID contient un seul "unidentifiable speaker". Tous les segments dont
on arrive pas à reconnaître le speaker (imitation ou bruit) peuvent être associés à cet
"unidentifiable speaker"

[PII]
Update about PII 
 Prénom des Youtubeurs et leurs invités : Pas de PII
 Autre prénom mentionné : PII (si ce n'est pas une personnalité célèbre : généralement visible
sur wikipédia)
 Les informations personnelles (numéro de téléphone, carte bancaire) restent des PII.
 Les identifiants dans les réseaux sociaux ne sont pas des PII

Examples: 
1) Salut c'est Néo et Swan (NOT PII). Names are shared willingly on a public platform.

2) J'ai rencontré mon ami Alexandre hier. (Alexandre is PII because he is not around and did not
share his information willingly on a public platform).

3) J'ai avec moi aujourd'hui un invité. Salut François (NOT PII), he is a guest of the episode and
agreed to share his name and any info in the audio.

4) Une fille m'a donné son numéro de téléphone 12345 (Her phone number should be PII as she does
not appear to agree to share her phone number publicly).Elle m’a aussi donné son nom facebook :
Julia (NOT PII car nom dans les réseaux sociaux)

[Ponctuation]
 Quand une phrase est terminée, il faut mettre un point et non une virgule.
 Ne pas mettre une virgule quand le speaker hésite, fait une pause ou répète un mot.
La virgule est à positionner en fonction de la construction de la phrase (syntaxe) et
non en fonction de la façon dont le speaker prononce la phrase.
 Mettre toujours un espace avant et après les ponctuations suivantes ? : ! ;
 Pas d’espace avant une virgule ou un point.

[Répétition]
Si un mot est répété, il faut l’écrire. Si c’est un bout de mot même un seul lettre ou une seule
syllabe, il faut l’écrire en mettant un tiret au moment où le mot a été coupé.
Exemple : "éco- économie", "pour pour", "j- je vais au marché"
NB : 
 Il est à rappeler qu'il ne faut pas mettre des virgules pour séparer les
répétitions.
 Il faut noter qu’on écrit les mots entendus tels quels sans modification. Voici
néanmoins quelques exceptions :
- le mot "y a" s'écrit "il y a"
- quand le "ne" n'est pas prononcé, il ne faut pas l'écrire : On écrit "je
sais pas" si la personne prononce cette phrase comme telle.
- Ne pas faire des raccourcis avec l'apostrophe même si la personne
en fait. Par exemple, on écrit "Tu es là" quand la personne dit "t'es là"

[Noise / unintelligible]
 Les bruits d'inspirations avant chaque phrase sont à marquer comme noise. A ne pas
les oublier pour ne pas à refaire le task.
 Si UNE SEULE personne parle et que l'on ne comprend pas ce qu'il dit, mettre une
annotation "unintelligible" et non “noise”. Si l’on arrive pas à identifier la personne
pour une raison particulière : changement de voix (imitation) ou bruit environnant
ne permettant pas de l’identifier, il faut associer le segment au label "unidentifiable
speaker". 
NB : Un ID contient un seul "unidentifiable speaker". Tous les segments dont on arrive pas à
reconnaître le speaker (imitation ou bruit) peuvent être associés à cet "unidentifiable
speaker"

=> Si c'est un bruit de foule et non une voix d’une seule personne, on met une annotation
NOISE et non “unintelligible”
 Les noises suivent aussi la règle de 0,5 seconde : un long segment de noise peut
être fait si l’on entend des bruits sans une pause de 0,5 s entre eux, même pour
différents types de bruits (un bruit de fond : vent, foule est considéré comme une
“noise”. Un long segment de “noise” est à mettre en place pendant la durée dudit
bruit. Et si un autre bruit survient pendant la période où il y a déjà un long segment
de “noise”, on ignore car il y a déjà un segment “noise” (ne pas superposer 2
segments de noises entre eux. Par contre, on peut superposer avec “noise” tout
autre annotation horni “noise” telle “musique”, “laugher”, etc.

[Chanson / Musique]
 Si c’est une musique (sans parole), alors, on met seulement l’annotation “Music”
 Si c’est une chanson en langue étrangère (autre que le français) :
o On met une annotation “Music” et en même temps
o On met les segments “Foreign speech” quand il y a une personne qui chante,
peu importe s’il y a différentes voix qui chantent.
 Si c’est une chanson en français :
o On met une annotation “Music” et en même temps
o On met les segments “Singing” quand il y a une personne qui chante et on
transcrit les paroles pour chaque personne qui chante.
NB : Si c’est une chanson pré enregistrée, alors on utilise les labels
“pre recorded speaker 1”, “pre recorded speaker 2” pour les segments de
parole. Si c’est une chanson chantée en live (au micro de la vidéo), alors on
utilise les labels “speaker 1”, “speaker 2” etc.

[Chiffres / Unités / Heure]


 Les chiffres inférieurs à 10 sont écrits en toute lettre sauf s’ils sont suivis d’unité de
mesure ou de mathématiques. Les chiffres > 10 sont écrits en chiffre
Exemples : “deux élèves”, “2 cm”, “12 tribus d’Israël”
 Les chiffres sont écrits sans séparateur de milliers.
Exemples : “100000” et non “100 000”
 Les unités monétaires sont écrits en toute lettre sauf l’euro qui doit être écrit en “€”
Exemples : “2 €”, “3 dollars”, “4 pesos”
 Il faut toujours mettre un espace avant chaque unité
Exemples : “2 %” et non “2%”, “3 cm” et non “3cm”, “4 kg ” et non “4kg”
 L’heure s’écrit dans ce format : 3h50 (sans espace)
Exemples : “15h30” et non “15 h 30”

[Channels]
L’option multi-Channel est fonctionnelle sur certains IDs. Certains sons/ voix peuvent
seulement être écoutés sur 1 channel. Ainsi, vous devez choisir pour chaque segment créé
s’il sera affecté à "Channel 0", "Channel 1" ou  "All channels".

Les couleurs du spectre facilitent ce choix. Ci-dessous des exemples :


- All Channels: Les 2 channels contiennent le même son

- Channel 0: Seulement le channel 0 (rouge) contient l’audio

- Channel 1 : Seulement le channel 1 (bleu) contient l’audio pour le segment concerné

NB : Si vous choisissez seulement 1 channel (0 ou 1, il faut s’assurer que l’autre non choisi
ne contient pas le même son/voix)
Pour savoir si le “channel 0” (rouge) contient quelque chose (car généralement, il est caché
derrière le “channel 1” (bleu). Il suffit d’aller dans le menu en haut "Multi-Channel Recording"
puis cliquer sur “channel 0” puis faire Play (ne pas oublier de faire play). Les sons produits
par le “channel 0” seront affichés en rouge.

Dans le cas où les 2 channels contiennent 2 sons différents et qui se chevauchent, il faut
créer séparément les 2 segments respectivement dans chaque channel concerné.
L’affichage avec « all channel » permet de détecter ces cas particuliers.

[21 speakers]
Si vous avez une tâche qui comporte plus de 20 speakers, vous stoppez à la fin du 20e
speaker [au moment où le speaker 21 entre en jeu] et m'aviserez sur le temps de
transcription auquel vous avez stoppé. N’oubliez pas de changer le statut de l’ID en « Ready
for Review ». Vous serez payé par rapport au temps traité (avant le 21e speaker)

Vous aimerez peut-être aussi