Vous êtes sur la page 1sur 29

NOTE: All information provided in this document is confidential.

Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

Forester French (Maghreb)


Transcription Guidelines
Introduction

L’objectif du projet: Le but du projet est de transcrire des fichiers audios qui aideront
notre client à développer des modèles de reconnaissance vocale de pointe.

L'objectif de ce projet est de transcrire (écrire ou représenter avec un tag) le discours que vous
entendez dans des fichiers audio. Vous allez devoir utiliser notre plateforme de transcription en
ligne, appelée Ampersand. Un guide d'utilisation d'Ampersand sera mis à votre disposition.

Veuillez lire attentivement ce document et gardez-le sous la main lorsque vous commencerez à
transcrire. Il y a beaucoup de détails à retenir, mais vous serez plus à l'aise après avoir effectué
quelques transcriptions. Si vous avez la moindre question, contactez votre superviseur. Bonne
chance !

1
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

Informations générales

L'objectif de ce projet est de transcrire tout discours


compréhensible ainsi que les bruits qui apparaissent en même
temps que le discours.
Le discours (speech), c'est tout ce qui contient du langage humain.
Dans ce projet, vous devez transcrire le discours même lorsqu'il n'est
pas grammaticalement correct. La transcription peut contenir :

● des hésitations (euh, hum)


● des mots familiers (wesh, chelou)
● des répétitions (depuis le le le jour de l'an)

Exemples

● TRANSCRIPTION : euh non euh je sais pas c'est quoi.


● TRANSCRIPTION : il a il a trop le seum d'avoir perdu!

Discours, bruits
autres, no-speech
Speech, non-speech Le discours est la plupart du temps représenté par des mots et des
noise, and no-speech caractères. Certains mots, cependant, ne sont pas compréhensibles ou
se superposent. Ces paroles-là sont représentées par des tags.

Les bruits autres qui sont entendus pendant le discours doivent aussi
être taggés. Si des bruits comme de la musique, du rire, une toux,
sont entendus directement avant, directement après, ou pendant du
discours (moins d'une seconde ne sépare le bruit du discours), alors
ces bruits doivent être taggés.

Si une utterance entière ne contient aucun discours (mots), alors les


sons qui apparaissent dans cette utterance ne devraient pas être
taggés. A la place, utilisez le tag no speech et passez à l’utterance
suivante.
Les bruits qui ne sont pas entendus en même temps que le discours
(c'est-à-dire s'il y a plus d'une seconde d'intervalle entre le discours et
le bruit) ne doivent pas être taggés.

2
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

Si l’utterance contient du discours (des mots), il faut utiliser le tag no


speech à chaque fois qu’il y a une pause sans discours d’au moins une
seconde.
Le volume de votre ordinateur doit être réglé de façon à ce que le locuteur
le plus fort de l'utterance soit à un niveau sonore confortable. Le discours
Bruits et discours
de premier plan, c'est tout le discours qui peut être compris aisément à
de premier plan ce volume, sans efforts ou écoutes répétées.
Foreground Le discours et les bruits à un volume sonore inférieur au volume de
speech/noise premier plan ne doivent ni être transcrits ni taggés, même s'ils sont
compréhensibles.

Les fichiers audios ont été découpés en segments courts pour faciliter
l'écoute et la transcription. Ce sont les utterances. Vous devez considérer
que les utterances d'un même batch ne forment qu'un seul et même
fichier audio, en ignorant donc les coupures.
Utterance
Une utterance est une unité de transcription. Chaque utterance a sa zone
de transcription et doit être sauvegardée avant de passer à la suivante.

Un batch de transcription est un fichier audio qui a été découpé en


Batch utterances qui peuvent être réparties sur plusieurs pages.

Certains batches peuvent aussi contenir des informations supplémentaires


quant à la source du fichier audio dans la section Source.

Utilisez cette information pour vous guider dans l’écriture des noms
propres: prénoms et noms de personne, noms de lieu, de produit ou de
Source marque.

Note: l’information additionnelle contenue dans la Source peut contenir


des fautes d’orthographe. Faites appel à votre meilleur jugement lorsque
vous utilisez la Source pour les noms propres. Si vous n’êtes pas sûr.e,
faites une recherche en ligne rapide afin de vérifier l’orthographe correcte.

3
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

Transcription du discours
Utilisez les règles d'orthographe et de grammaire françaises.

Reportez-vous au Larousse en ligne pour l’orthographe.

Les traits d'union devraient être utilisés pour les mots composés et
lorsqu'il est correct d'en utiliser, mais aussi dans l'écriture des nombres,
afin de différencier un grand nombre d'une suite de nombres.

Exemples
Orthographe Le locuteur dit "33" – utilisez un trait d'union
● 33 ==> TRANSCRIPTION : trente-trois 
Le locuteur dit "30 3" – n'utilisez PAS de tiret

● 30 3 ==> TRANSCRIPTION : trente trois

Les traits d'union doivent être utilisés en suivant les règles


d'orthographe et de grammaire françaises
● TRANSCRIPTION : ce jour-là, ont-ils mangé en tête-à-tête?
● TRANSCRIPTION : dis-moi Martine, t’es prête?

A l'oral il arrive souvent d'utiliser des contractions non standard,


notamment avec le pronom je lorsqu'il est suivi d'une consonne. Vous
devez transcrire la forme complète, et non la contraction.

Exemples
Contractions non
standard Correct Incorrect
je suis j'suis, chui
il y a y a, ya, y'a
je sais j'sais, ché

4
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

je me j’me
tu sais t’sais

En revanche on acceptera “t’es” ou “t’as” s’ils sont prononcés


ainsi.

Suivez les règles de majuscules françaises, à une exception : n'utilisez


PAS de majuscule au début d'un mot en début de phrase, sauf si ce
mot devrait commencer par une majuscule où qu'il se trouve.
Lettres Par exemple, les noms de personnes, de pays, de marques, commencent
majuscules généralement par une majuscule : Edith Piaf, le Mexique, Wiko, YouTube.
Pour plus d'informations sur l'utilisation des majuscules, cliquez ici :
https://www.lalanguefrancaise.com/general/guide-complet-usage-majuscu
les-francais/

Certains mots ou groupes de mots sont parfois incompréhensibles, pour


plusieurs raisons : il y a une interférence ou des bruits de fond, l'audio est
de mauvaise qualité, ou le locuteur ne s'exprime pas clairement. Si après
trois écoutes répétées vous ne comprenez toujours pas ce qui est dit,
remplacez le mot ou le groupe de mots par le tag unintelligible.
Vous ne devez pas insérer plusieurs tags unintelligible à la suite : si
plusieurs mots à la suite sont incompréhensibles, remplacez-les tous par
un seul tag unintelligible. Si une utterance entière est incompréhensible,
insérez le tag unintelligible dans la zone de transcription et passez à
l'utterance suivante.
Lorsque le locuteur bredouille ou ne prononce que la moitié d'un mot,
unintelligible remplacez le bégaiement ou la moitié du mot par le tag unintelligible.
Si vous ne comprenez pas le mot parce qu’il est dans une langue

b étrangère, utilisez le tag

Exemples
Le locuteur dit quelque chose que vous ne comprenez pas

TRANSCRIPTION : tu veux aller voir demain?

5
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

Le locuteur dit "sal-sal-sal salut tout le monde, j'espère que vous


allez bien!"

TRANSCRIPTION : salut tout le monde, j'espère que


vous allez bien!
Le locuteur dit "le mois dernier chui allé à la pl- à la mer."

TRANSCRIPTION : le mois dernier je suis allé à la à la


mer.

Lorsque deux locuteurs de premier plan parlent en même temps à un


volume sonore plus ou moins égal, ne transcrivez PAS les discours qui se
chevauchent. Remplacez les mots qui se chevauchent par le tag overlap.

N'utilisez PAS le tag overlap lorsque vous entendez clairement le


overlap o locuteur principal en premier plan et qu'il y a des bruits ou du discours
en fond. Si vous comprenez le locuteur de premier plan, transcrivez ce
qu'il dit.

Le chant (singing) qui intervient au premier plan doit être transcrit


(soit par des mots soit par des tags).
On considère ce qui suit comme singing: le chant, le rap, la récitation
de poèmes, de mantras, de sermons religieux mais aussi de discours
chantonnés.

Il y a deux manières de transcrire les discours chantés dans ce

Discours chanté - projet: un tag pour remplacer chaque mot qui est
Singing chanté que vous ne connaissez ou ne comprenez pas et un span tag

pour surligner les mots chantés en français que vous


pouvez écrire.
Singing/le chant est considéré comme du discours et de ce fait des
règles similaires s’appliquent: le tag doit être utilisé
pour marquer un changement de locuteur/de chanteur.

6
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

1. Utilisez le tag pour remplacer chaque mot chanté


que vous ne comprenez pas (exemple: du chant inintelligible, du chant
marmonné) ou pour chaque mot chanté dans une langue étrangère
(même si vous comprenez!). Utilisez aussi un tag unique

pour le “scat”, le chant en charabia/yaourt.

Exemple:
Un locuteur commence une phrase en français et puis
chantonne un mot en allemand “kaaaartoffeeeeellll!”.

TRANSCRIPTION: et là il me dit !

Quelqu’un “scat”/chante du charabia:


“di-dou-di-daba-didou-boubi-bah”: Utilisez un seul tag
singing.

TRANSCRIPTION:

S’il y a plus d’un mot chanté en séquence, vous devez utiliser un tag

pour chaque mot. Jugez au mieux pour déterminer le


nombre de mots chantés que vous entendez.

Exemple:

Quelqu’un commence à rapper en français mais vous ne


comprenez pas ce qui est dit. Vous pensez entendre au moins
5 mots différents.

TRANSCRIPTION:

7
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

Exemple:
Quelqu’un commence à chanter deux mots que vous ne
comprenez pas et quelques secondes plus tard quelqu’un
rappe en même temps. Les deux chants se chevauchent.

TRANSCRIPTION:

Exemple:
Quelqu’un récite un poème en anglais puis une autre
personne continue le poème.

TRANSCRIPTION:

2. Si vous pouvez comprendre les mots chantés (et ils sont en


français), vous devez les écrire et les surligner avec le span tag

Exemple:
Quelqu’un récite un poème.

TRANSCRIPTION: je sais que tu m’attends, je ne peux demeurer loin


de toi

Plusieurs personnes chante la chanson Joyeux Anniversaire


en même temps à l'unisson

TRANSCRIPTION: joyeux anniversaire Karim, joyeux anniversaire!

Plusieurs personnes chantent Frère Jacques en canon


(commençant à quelques secondes d’intervalle)

TRANSCRIPTION:

8
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

Plusieurs personnes chantent à tour de rôle:


TRANSCRIPTION: j’irais où tu iras mon pays sera toi

Quelqu’un parle puis quelqu’un d’autre répond en


chantonnant.
TRANSCRIPTION: qu’est-ce que tu en penses? j’adore!

/!\ Conseils:

● Utilisez le tag pour chaque mot chanté que vous ne


comprenez pas.

● Utilisez le tag pour chaque mot étranger chanté,


même si vous les comprenez.Ignore singing in the background.
● Ignorez la musique qui accompagne le chant. Les pauses brèves
de musique seule sans chant dans une utterance peuvent aussi
être ignorées.
● Utilisez le tag pour le chant comme vous le feriez
pour du discours parlé: quand le locuteur ou le chanteur change.
● Use punctuation in places where it falls naturally in songs,
singsong words, poems or sermons.
● If multiple people sing the same words at the same time, please
transcribe it as one speech.
● Si plusieurs personnes chantent différents mots en même temps
(i.e. différentes chansons, en canon, pas synchronisés…), utilisez
le tag .
● Si du chant et du discours parlé interviennent au même moment
et à un volume similaire, il faut utiliser le tag pour
remplacer les mots, même si on les comprend.
● Si du chant et du discours parlé interviennent au même moment
mais l’un des deux est un discours de fond, il faut l’ignorer, on
ne transcrit que le discours de premier plan.

9
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

Il y a deux manières de transcrire les discours en langue étrangère:


- un tag pour remplacer un mot que vous ne connaissez pas et
- un span tag pour surligner un ou des mots que vous pouvez écrire.

Utilisez le tag pour les discours dans une langue autre


que le français qui ne serait pas compris par des locuteurs français.
Les mots d’emprunts sont acceptables et devraient être transcrits
normalement: hello, sushi, week-end, e-mail, coach, business, start-up,
ciao…

Exemple:
Le locuteur utilise des mots d’emprunts dans sa phrase
TRANSCRIPTION: hello tout le monde! ça c’est ma gang, abonnez-vous à
notre newsletter

Le locuteur dit un mot étranger après “que” et vous ne le


connaissez pas

Discours en TRANSCRIPTION: qu’est-ce que veut dire en russe?


langue étrangère
S’il y a plus d’un mot dans une langue étrangère en séquence, vous devez

utiliser un tag pour chaque mot. Jugez au mieux pour


déterminer le nombre de mots étrangers que vous entendez.

Exemple:
Un locuteur dit “denken Sie an die Kinder“ au milieu d’une
phrase et vous ne comprenez pas

TRANSCRIPTION: j’ai cru qu’elle disait

et euh ensuite

Si vous pouvez comprendre et écrire la langue étrangère, alors vous

pouvez écrire les mots et les surligner avec le span tag

10
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

Exemple:
Un locuteur dit “denken Sie an die Kinder“au milieu d’une phrase
et vous comprenez les mots

TRANSCRIPTION: j’ai cru qu’elle disait denken Sie an die Kinder et euh
ensuite

/!\ Conseils:

● Souvenez-vous que les mots d’emprunts viennent de langues


étrangères mais sont connus et acceptés dans la langue française.
Ils ne sont pas considérés comme des mots étrangers dans ce
projet et il ne devrait pas être remplacés par un tag Not French. Par
exemple: hello, gang, week-end, blender, coach, rush, news,
newsletter, ciao, sushi, e-mail, country...
● Les noms propres étrangers (nom de personne, d’un lieu, de
marque...) ne sont pas considérés comme des mots étrangers, ils
doivent être transcrits.
● Si vous ne pouvez pas comprendre un mot à cause d’un problème
d’audio, de bruit ou parce que la personne ne parle pas clairement,

mais le discours est en français, utilisez


● Si vous ne pouvez pas comprendre un mot parce qu’il est dans une

langue étrangère, utilisez


● Si vous n’êtes pas sûr.e de l’orthographe d’un mot d’emprunt, faites
une recherche en ligne rapide.
● Si vous pouvez comprendre et transcrire ce qui est dit mais ce n’est
pas en français ni un mot d’emprunt, alors surlignez les mots.
● Le chant/rap/poème dans une langue étrangère devrait être

marqué comme (un tag pour chaque mot chanté


que vous pouvez identifier), il ne faut pas écrire les mots
chantés étrangers même si vous pouvez les comprendre.

Dans ce projet les nombres doivent être épelés de toutes lettres, en


utilisant des tirets. Les tirets nous permettront de différencier un nombre
Nombres e.g. deux-mille-douze (2012) de plusieurs e.g. deux-mille douze (2000
12).

11
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

Exemples

● 2012  ==> TRANSCRIPTION : deux-mille-douze

Le locuteur donne une suite de chiffres (4 8 6 2)

● 4 8 6 2 ==> TRANSCRIPTION : quatre huit six deux

Le locuteur donne l'heure

● il est 17h30 ==> TRANSCRIPTION : il est dix-sept heures trente


● il est 5h et demi ==> TRANSCRIPTION : il est cinq heures et
demie

Le locuteur donne une opération

● 1 + 1 = 2 ==> TRANSCRIPTION : un plus un égale deux


● 21,4 ==> TRANSCRIPTION : vingt-et-un virgule quatre

Le locuteur donne un prix

● c'est 12€99 ==> TRANSCRIPTION : c'est douze euros


quatre-vingt-dix-neuf.

Les chiffres arabes sont à utiliser UNIQUEMENT s'ils sont accolés à une
lettre ou à un mot sans espace.

Exemples

● H2O
● iPhone 6S
● TF1
● PS4

MAIS

12
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

● Xbox 360 ==> Xbox trois-cent-soixante


● France 2 ==> France deux
● Forever 21 ==> Forever twenty-one
● CAC 40 ==> CAC quarante

Les sigles et les acronymes sont des mots composés des premières lettres
de plusieurs mots. Ils peuvent être prononcés comme une suite de lettres
ou bien comme un seul mot.
Les sigles et les acronymes doivent être transcrits en majuscules sans
espaces ni points.

Acronymes & Exemples


Sigles
● NASA
● ONU
● FIFA
● UNESCO
● PS

Lorsqu'un locuteur épelle un mot, lettre par lettre, vous devez transcrire
les lettres épelées en majuscules avec des espaces.

Exemples
Mots épelés
● TRANSCRIPTION : je m'appelle Jean, ça s'écrit J E A N.
● TRANSCRIPTION : c'est une abeille. A B E I deux L E.

Transcrivez les adresses email ou les sites internet comme ils sont
Emails / sites prononcés.
internet

13
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

Exemples

● www.facebook.com  ==> TRANSCRIPTION : WWW point


Facebook point com.
● www.mangerbouger.fr ==> TRANSCRIPTION : trois W point
manger bouger point FR.
● emmanuelmacron@gmail.fr ==> TRANSCRIPTION : Emmanuel
Macron arobase Gmail point FR.

Langage Tout doit être transcrit, y compris jurons et insultes. Si toutefois vous êtes
vraiment mal à l'aise à l'idée de transcrire certains mots, vous pouvez les
inapproprié remplacer par le tag unintelligible.
Transcrivez les hésitations et interjections comme hein, euh, eh, bof en
utilisant le tableau ci-dessous comme référence. Transcribe hesitations
and other disfluencies like uh-huh and hm, using the table below.

List of Hesitations/Interjections
Acceptable
Meaning
Spelling
Agreement hum, bah, ouais
Disagreement ah, oh, euh
waouh, oh, ah,
Hésitations et Surprise oh là là, hein, eh
interjections ben, houp là
euh, hum,
Seeking
mouais, bah,
Confirmation
hein
 bah, beurk,
Disgust
beuh
 eh, waouh, ah,
Delight
ben
Calling Someone  eh, oh
Emphasizing  eh, hein

14
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

Exemples

● TRANSCRIPTION : euh, qu'est-ce que je disais? ah oui! je me


rappelle.

● TRANSCRIPTION : eh ben dis-donc, te gêne pas surtout hein.


● TRANSCRIPTION : pff c'est vraiment la cata.
● TRANSCRIPTION : oh là là mais qu'est-ce que tu as grandi!

15
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

Span Tags (surbrillance)

Il y a deux types de tags : les span tags (colorés) et les event tags (gris).
Les event tags doivent être insérés entre les mots, et les span tags sont utiliser pour mettre
certains mots en surbrillance.
Pour enlever un span tag, sélectionnez le mot surligné et cliquez sur untag. La couleur ne
changera qu'une fois que vous aurez cliqué ailleurs.

Raccourci
Span Tag clavier Quand l’utiliser

Lorsque le locuteur dit un mot qui n'est pas dans le dictionnaire Larousse,
transcrivez le mot comme vous l'entendez et surlignez-le avec le span tag
colloquial.

Le tag colloquial peut être utilisé avec des mots d'argot, des mots
familiers, ou des mots dans une langue étrangère utilisés dans la vie
courante mais qui ne sont pas dans le Larousse. Pour savoir si un mot
devrait être taggé colloquial, n'hésitez pas à consulter le dictionnaire
Larousse en ligne, beaucoup de mots d’argots ou anglais s’y trouvent :
http://larousse.fr/dictionnaires/francais

v En cas de doute, il est préférable de surligner le mot avec colloquial


plutôt que de ne pas le faire.
colloquial
Exemples
et comme d'hab il est pas là! ⇒ TRANSCRIPTION : et comme d'hab il
est pas là!
c'est pas grave, je le regarderai en replay. ⇒ TRANSCRIPTION : c'est
pas grave, je le regarderai en replay.

Par exemple ces mots ne figurent pas dans le Larousse mais sont
couramment utilisés en Français et devraient être taggés comme
colloquial:

16
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

relou, wesh, youtubeur, influenceur...

Lorsque le locuteur prononce mal un mot par accident, transcrivez le mot


dans son orthographe correcte et surlignez-le avec le span tag
mispronunciation.
Ce tag ne doit pas être utilisé si le locuteur a un accent, mais seulement
s'il écorche un mot par accident. En cas de doute, demandez vous :
"Est-ce que cette personne prononcerait le mot de manière différente si je
leur demandais de répéter ?" Si la réponse est oui, alors il faut utiliser le
tag mispronunciation.

mispronunciat w
ion
Example

Vous entendez “hier je l'ai accompagné à l'aréoport” ⇒ TRANSCRIPTION


: hier je l'ai accompagné à l'aéroport.

Si vous entendez un mot dans un audio mais vous n’êtes pas entièrement
sûr.e de son orthographe, ou vous n’êtes pas totalement confiant de ce
que vous avez entendu, surlignez ce mot avec le tag best guess.

Ce tag peut être particulièrement utile lorsqu’un locuteur utilise un nom


propre que vous ne connaissez pas.

Attention à ne pas utiliser le tag best guess si le discours est


inintelligible parce que l’audio est de mauvaise qualité ou parce que le

locuteur bredouille, dans ces cas là il faut utiliser le tag .


best guess
Exemple:

● Vous entendez “il m’a dit d’aller à Wolengi” mais vous n’êtes pas
sûr.e de ce qu’est Wolengi ni de comment l’épeler. Vous l’épelez
comme il vous parait le plus probable et vous le surlignez avec le
tag best guess: Wolengi

17
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

N’utilisez PAS ce tag pour des mots que vous pouvez épeler correctement
en faisant une recherche en ligne rapide.

Exemples:

● Vous n’êtes pas certain.e du nom d’un artiste, “Emir Kusturica” =


vous faites une recherche en ligne avec une orthographe
approximative + quelques mots clés (par exemple vous avez
entendu le mot “film” dans le batch) pour trouver l’orthographe
correcte.
● Vous n’êtes pas sûre de l’orthographe du mot “dilemme” = vous
faites une recherche en ligne ou dans un dictionnaire et utilisez
l’orthographe correcte.

/!\ Souvenez-vous :
Si vous entendez quelque chose dans votre langue mais vous n’arrivez

pas à comprendre les mots = utilisez

Si vous entendez quelque chose dans une langue étrangère et vous ne

comprenez pas ce qui est dit = utilisez

18
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

Tagger les bruits autres


Les tags sont présentés dans la liste suivante dans l'ordre du plus fréquemment utilisé au plus
rare.

Raccourci
Event Tag clavier Quand l’utiliser

Lorsqu'il y a une période d’au moins une seconde qui ne contient pas de
mots, il faut insérez le tag no speech. Les bruits autres qui ne sont pas
entendus à moins d'une seconde d'intervalle avec le discours doivent être
ignorés.
Lorsqu’une utterance entière ne contient aucun discours (aucun mot dit ou
chanté) on utilise un seul tag: le tag no speech. Il faut ignorer les autres
bruits s’il n’y a pas de discours.

Exemple
Vous entendez quelqu'un parler, puis une longue pause, et après
deux secondes, un bruit de porte :

TRANSCRIPTION : bof, je sais pas trop.


=> Comme il y a une période de plus d'une seconde sans mots à
la fin, on insère le tag no speech. Le bruit de porte est entendu
plus d'une seconde après le discours, il est donc ignoré et il n'est
pas transcrit.
no speech c

/!\ Lorsqu’une utterance entière ne contient aucun discours (aucun mot dit
ou chanté) on utilise un seul tag: le tag no speech. Il faut ignorer les
autres bruits s’il n’y a pas de discours.

Exemple
L’utterance entière contient seulement de la musique sans
parole, quelqu’un qui pleure ou des bruits autres mais ne
contient aucun discours (aucun mot):

TRANSCRIPTION:
Il faut ignore tous les autres bruits tant qu’il n’y a pas de discours
dans une utterance entière.

19
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

Lorsqu'un bruit autre est émis par un locuteur en premier plan (bruit de
bisou, rire, toux, etc) il faut remplacer ce bruit par le tag spk.

On utilise ce tag seulement si :


- le volume du bruit est similaire à celui du discours de premier plan
- ET le bruit intervient à moins d’une seconde du discours.

Exemple

s Quelqu'un parle et tousse fort au milieu de sa phrase :


spk
TRANSCRIPTION : peut-être qu'il est parti plus tôt.

Si le bruit intervient au même moment que le discours, on ne le transcrit


pas tant qu’on entend clairement ce qui est dit. Si le son est trop fort et
rend la compréhension du mot difficile, alors on utilisera le tag
unintelligible à la place du mot et du son.

Si le son intervient tout au long de l’utterance plus ou moins au même


volume alors il sera considéré comme bruit de fond, il faut l’ignorer.
Lorsque vous entendez de la musique instrumentale (sans paroles)
juste avant ou juste après du discours, remplacez-la par le tag music.

Attention : si quelqu'un chante, vous ne devez PAS utiliser

. Vous devez remplacer les mots chantés par . On ne


transcrit pas tout ce qui est chanté/rappé/récité (poème, prière).

On utilise ce tag seulement si :


- le volume du bruit est similaire à celui du discours de premier plan
m
- ET le bruit intervient à moins d’une seconde du discours.
music
Exemple
Un animateur radio annonce un titre avant un jingle musical qui
commence moins d'une seconde après le dernier mot :
TRANSCRIPTION : c'est le retour de la grippe hivernale, on en parle dans

quelques instants avec nos spécialistes.

20
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

Une personne parle puis on entend une chanson avec des paroles:
TRANSCRIPTION: bon, maintenant euh, je vais vous faire écouter ma

chanson préférée!

Lorsque vous entendez un bruit extérieur (qui n'est pas produit la


bouche/le nez d’un locuteur) qui intervient pendant, juste avant ou juste
après du discours, et qui est au même volume sonore que le locuteur de
premier plan, remplacez ce bruit par le tag noise.

Ne taggez pas les bruits de fond : ceux qui sont à un volume inférieur à
celui du discours ou qui sont au même volume tout au long de
l’utterance

On utilise ce tag seulement si :


n - le volume du bruit est similaire à celui du discours de premier plan
noise - ET le bruit intervient à moins d’une seconde du discours.

Exemple
On sonne à la porte et, moins d'une seconde après, quelqu'un
commence à parler :

TRANSCRIPTION : ah là là mais qui c'est?

Lorsqu'il y a un changement de locuteur, insérez le tag change-spk avant


que le deuxième locuteur ne commence à parler. Il arrive qu'une utterance
commence avec un locuteur différent. Dans ce cas-là, l'utterance doit
commencer par le tag change-spk.
N’oubliez pas d’ajouter un point (. ? !) ou un tag incomplete avant le tag
k change-spk (s’il y a changement de locuteur, le discours précédent s’est
change-spk soit terminé, soit il a été interrompu).
Le tag change-spk doit seulement être utilisé pour le discours : si
quelqu'un tousse pendant que quelqu'un d'autre parle, n'utilisez pas le tag
change-spk.

21
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

Exemples
Il y a un changement de locuteur au milieu d'une utterance :

TRANSCRIPTION : ah salut vous allez bien? écoute on fait


aller, hein.
Le locuteur 1 parle dans la première utterance, et le locuteur 2
dans la deuxième utterance :
TRANSCRIPTION :
UTT1 : il paraît que tu t'es bien débrouillé hier, bravo!
UTT2 : oh tu sais, c'était un travail d'équipe, j'aurais
jamais réussi sans eux.

Lorsqu'un mot est coupé au début ou à la fin d'une utterance parce que le
fichier n'a pas été découpé correctement, il faut utiliser le tag truncation.
Ce tag ne doit être utilisé qu'au tout début ou à la toute fin d'une
utterance, et jamais au milieu. Utilisez ce tag uniquement si un mot est
coupé et qu'on ne l'entend pas en entier. Si la phrase est coupée mais
qu'aucun mot n'est coupé au milieu, n'utilisez pas le tag truncation.

Attention : N'utilisez pas truncation si le locuteur bredouille, commence à


dire un mot et s'arrête, puisque ce tag ne s'applique qu'en cas de coupure
de l'enregistrement, au début ou à la fin d'une utterance du au découpage
d’un fichier audio en segments (utterances).

t
truncation
● Lorsqu'un mot est coupé à la fin d'une utterance, vous ne pouvez
pas entendre la fin du mot mais il arrive qu'il soit possible de
deviner le mot prononcé par le locuteur en écoutant les deux
utterances. Dans ces cas-là, transcrivez le mot tronqué en entier,
immédiatement suivi du tag truncation.

Exemple
Le locuteur dit "je trouve pas mes lunettes" mais le mot lunettes
est coupé à la fin de l'utterance et vous entendez "je trouve pas

22
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

mes lunè-". D'après le contexte de votre transcription, vous


comprenez que le locuteur dit "lunettes". Vous allez donc
transcrire "lunettes" en entier, et insérer le tag truncation :

TRANSCRIPTION : je trouve pas mes lunettes

● Lorsqu'un mot est coupé à la fin d'une utterance, vous ne pouvez


pas entendre la fin du mot et il est possible que vous ne pouviez pas
deviner le mot prononcé par le locuteur. Dans ces cas-là, remplacez
le mot tronqué par le tag unintelligible, immédiatement suivi du
tag truncation.

Exemple
Vous entendez "j'y suis allé au mois de j-" et le contexte ne vous
permet pas de deviner de quel mois il s'agit, ni l’utterance
suivante. Vous allez donc remplacer le mot tronqué par
unintelligible puis insérer le tag truncation :

TRANSCRIPTION : j'y suis allé au mois de

● Lorsqu'un mot est coupé au début de l'utterance, c'est-à-dire que


vous n'entendez pas le début du mot, remplacez le mot tronqué
par le tag truncation.

Exemple
Vous entendez "-ouvé un super job dans la région". Même si vous
pouvez deviner le mot en entier, ne le transcrivez pas, mais
remplacez-le par le tag truncation :

23
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

TRANSCRIPTION : un super job dans la région.

● Lorsque le mot est coupé à la fin de l'utterance, cela veut dire que la
deuxième partie du mot se trouve au début de l'utterance suivante.
C'est la raison pour laquelle il faut transcrire le mot à la fin de
l'utterance, mais jamais au début.

Exemple
Dans la première utterance vous entendez "je pensais le faire
hier et puis fi-".
Dans la deuxième utterance vous entendez "-nalement j'ai décidé
que ça servait à rien"
Vous pouvez deviner le mot tronqué à la fin de la première
utterance grâce à la seconde. Vous pouvez donc transcrire le mot
en entier dans la première utterance avant d'insérer le tag
truncation.
TRANSCRIPTION :

UTT1 : je pensais le faire hier et puis finalement

UTT2 : j'ai décidé que ça servait à rien.

Si vous entendez une uii (information identifiant l'utilisateur) dans


une utterance, transcrivez l’utterance et remplacez l'uii par le tag uii.
Les uii sont des informations privées qui peuvent être des noms complets
(nom + prénom), des pseudos, des adresses complètes, des gamertags,
i des numéros de téléphone personnels, des numéros de carte de crédit ou
uii de sécurité sociale.
Attention, il y a des exceptions. N'utilisez pas uii si :

24
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

● il s'agit d'un programme d'informations (journal télévisé,


informations à la radio) ou d’un programme télévisé ou de radio, ou
encore d’une série télé/film
● il s'agit de matériel promotionnel (une publicité pour un produit,
pour un événement...) et les informations données ne sont pas
confidentielles. Par exemple, un numéro de téléphone donné pour
prendre des réservations, ou un nom complet donné comme
personne à contacter pour plus d'informations.
● le nom complet donné est celui d'un personnage public (personnage
politique, sportif professionnel, journaliste, artiste, etc).
● c’est un programme d’un YouTuber/blogger
● le nom donné n’est pas complet (seulement prénom ou nom de
famille)
/!\ Soyez prudent.e, les noms complets ou les gamertags donnés
lors de loterie ou tirage au sort seront toujours considérés comme
UII.

La plupart des fichiers audio contenant des uii sont éliminés avant la
tâche de transcription. Il se peut que quelques uii aient été
malencontreusement oubliées, mais cela reste rare.

25
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

Ponctuation
A la fin de chaque phrase complète, utilisez un point (.) pour les affirmations, un
point d'interrogation (?) pour les questions, ou un point d'exclamation (!) pour les
exclamations.
Attention : N'utilisez toujours qu'un seul signe de ponctuation à la fois. Les
combinaisons (comme "?!" ou "...") ne sont pas autorisées. N'utilisez aucun autre
signe de ponctuation : deux points, points de suspension, point virgule ne sont pas
autorisés. Ne marquez PAS les dialogues par des tirets ou des guillemets.
Contrairement aux règles d'écriture du français, dans ce projet il ne faut jamais
d'espace avant un signe de ponctuation. (ex. quoi? et non pas quoi ?)
Le tag unintelligible est le seul tag qui peut être suivi d’un point .?!
Si le dernier mot d’une phrase est tronqué, on utilise un point avant le tag
truncation.

N'oubliez pas que toutes les utterances d'un batch constituent un seul fichier
audio qui a été découpé en segments (utterance) pour faciliter l'écoute et la
Ponctuation transcription. Cela veut donc dire que si une phrase n'est pas terminée à la fin
pour d'une utterance et continue dans l'utterance suivante, alors il ne faut pas ajouter
de ponctuation à la fin de la première utterance, mais plutôt à la fin de la phrase
marquer la complète.
fin d’une
phrase Exemples :
TRANSCRIPTION :
UTT1 : oui c'est vrai qu'elle est pas mal. et tu penses quoi
UTT2 : de celle-ci? j'arrive pas à me décider!

TRANSCRIPTION :

UTT1 : t’as vu mon nouveau vélo?

UTT2 : je l’ai acheté sur Internet!

Si une phrase n’est pas terminé (le locuteur change de phrase ou il est coupé),
il faudra utiliser le tag incomplete.

26
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

Utilisez le tag incomplete lorsqu’un locteur commence une phrase et (a) il est
interrompu par un autre locuteur, ou (b) il commence une nouvelle phrase
sans toutefois finir la première.

Attention : si la phrase continue sur l'utterance suivante, n'utilisez PAS le tag


incomplete.

Exemples
Le locuteur commence une phrase, ne la termine pas et en commence
une autre :

TRANSCRIPTION : bon c'est vrai que je me suis un peu okay je


me suis super mal comporté.
Le locuteur se fait interrompre avant de terminer sa phrase. Il faut
utiliser le tag incomplete puis le tag change-spk :

TRANSCRIPTION : bien sûr mais si tu crois oh


arrête de dire n'importe quoi!
incomplete
N'utilisez PAS le tag incomplete si le locuteur se répète au milieu d'une même
phrase, ou ne prononce pas un mot entièrement.

N'oubliez pas que toutes les utterances d'un batch constituent un seul fichier
audio qui a été découpé en segments pour faciliter l'écoute et la transcription.
Cela veut donc dire que si une phrase n'est pas terminée à la fin d'une utterance
et continue dans l'utterance suivante, alors il ne faut PAS ajouter le tag
incomplete.

Exemples :
TRANSCRIPTION :
UTT1 : oui c'est vrai qu'elle est pas mal. et tu penses quoi
UTT2 : de celle-ci? j'arrive pas à me décider!

27
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

Il ne faut PAS utiliser le tag incomplete pour un mot coupé au milieu d’une
utterance dû à la qualité de l’audio ou car le locuter ne prononce qu’une partie
d’un mot: il faut utiliser le tag unintelligible.

Vous pouvez utiliser des virgules (,) pour aider à la lisibilité du texte. Par exemple
dans une énumération, pour séparer des mots ou des propositions :
TRANSCRIPTION : j'ai acheté des œufs, de la farine, du chocolat et des pommes.
Virgules TRANSCRIPTION : si tu veux, il peut venir.
Suivez les règles françaises d'utilisation de la virgule. En cas de doute, il est
préférable de ne PAS utiliser de virgule.

28
NOTE: All information provided in this document is confidential. Any publication,
provision, or dissemination of this content is strictly prohibited. Do not share or
post the contents on the internet.

Références
● Les majuscules en français
● Le Larousse en ligne
● Les virgules en français

29

Vous aimerez peut-être aussi