Académique Documents
Professionnel Documents
Culture Documents
~~~~~~~~~~~~~~~~~~
Accueil: "http://dimio.altervista.org/"
PRECISIONS:
~~~~~~~~~~~
DESCRIPTION:
~~~~~~~~~~~~
DSpeech est un programme TTS (Du Texte � la Parole) avec la fonctionnalit� ASR
(Reconnaissance automatique de la parole) integr�e. Et ce au point de lire � haute
voix le texte �crit et de choisir les phrases � lire en accord avec les r�ponses
vocales de l'utilisateur. Il est pr�vu pour fournir rapidement et directement des
fonctions plus pratiques que celles requisent par des programmes de ce type,
maintenant au plus bas l'invasivit� et la consommation des ressources (il n'y a pas
d'insatllation, il n'est pas int�gr� au syst�me, il est l�ger, il s'installe
rapidement et ne modifie pas le registre).
- Prend en charge la ligne de commande et peut donc �tre utilis�, sans interface
graphique, pour cr�er des livres audio.
- Vous permet de sp�cifier le format de la sortie audio, cela peut �tre utile dans
des situations tr�s particuli�res, lorsqu'il est n�cessaire de travailler avec des
fichiers wav de caract�ristiques d�finies.
- Vous permet de cr�er des montages en ins�rant des fichiers wav ou mp3 via un
KeyWord sp�cifique. Cela peut �tre utile pour introduire, lors de la lecture, des
effets particuliers, tels qu'une toux, un rire, ou m�me des coupures musicales.
- Lorsque vous sauvegardez les mp3, vous pouvez en sp�cifier la qualit�, afin de
favoriser la taille ou la qualit� du r�sultat.
- Il est maintenant possible de convertir du texte en mp3 ou en wav en le divisant
en fichiers de 5, 10, 20 ou 30 minutes chacun.
- Dans le fichier "CustomTAG.TXT", il est maintenant possible d'ins�rer des TAG
personnalis�s qui appara�tront dans le menu contextuel (par exemple les tags
expressifs Loquendo).
- En option, en utilisant une option sp�ciale, vous pouvez activer l'int�gration de
DSpeech avec le menu contextuel de Windows.
- Gr�ce aux fichiers ".lng" appropri�s, il est possible de traduire l'interface
dans d'autres langues.
- Vous permet d'ouvrir et de lire un fichier ou une page Web directement � partir
d'Internet et de stocker vos liens favoris dans une liste.
Bien que DSpeech supporte nativement les voix SAPI4, il exprime le meilleur de son
potentiel avec les entr�es SAPI5 (certaines options avanc�es ne sont disponibles
que si vous utilisez ces derni�res).
DSpeech peut �tre utilis� avec n'importe quel lecteur d'�cran, mais sp�cifiquement
il est test� pour fonctionner avec le lecteur d'�cran NVDA.
CR�ATION DE DIALOGUES:
~~~~~~~~~~~~~~~~~~~~~~~
UTILISATION D'�TIQUETTES:
~~~~~~~~~~~~~~~~~
- Il est possible d'ins�rer des TAG sp�ciaux qui permettent de modifier les
caract�ristiques de la voix pendant qu'elle parle (vitesse, volume, fr�quence,
etc.).
- Gr�ce aux TAG, il est possible d'obtenir des effets particuliers, tels que
l'accent mis sur un terme, l'orthographe d'un ou plusieurs mots et l'insertion de
pauses.
- Dans tous les cas, les TAG ne sont valables que dans la m�me ligne.
OPTIONS DE REPRODUCTION:
~~~~~~~~~~~~~~~~~~~~~~~~
DUPLEX DE FILM:
~~~~~~~~~~~~~~~~~~~~
- DSpeech est capable de lire les sous-titres d'un film pendant sa visualisation,
donc il est capable de lire les fichiers SRT (le format standard des sous-titres).
Gr�ce � cette fonctionnalit�, il est possible de s'assurer que DSpeech lise les
sous-titres tout en regardant le film sans �tre forc�s de les lire � l'�cran (ce
qui vous emp�che souvent de suivre le cours).
- Il est conseill� de d�finir une entr�e diff�rente pour lire le texte entre
guillemets (menu "Options" -> "Personnaliser les voix dans le texte cit�"), cela
am�liorera grandement le r�sultat final.
- Pour commencer la copie, proc�dez comme suit:
1. Assurez-vous que dans le m�me dossier il y a � la fois le film que vous voulez
voir et le fichier sous-titres (.SRT).
2. Assurez-vous que le film et le fichier de sous-titres ont le m�me nom (par
exemple "Buffy.avi" et "Buffy.srt").
3. Assurez-vous que l'option "Permet de g�rer les fichiers SRT" est coch�e et
ouvrez le fichier de sous-titres (par exemple "Buffy.srt").
4. Positionnez le curseur sur le point de sous-titre � partir duquel vous voulez
que le film d�marre.
5. Appuyez sur "Parler".
OPTIONS AVANC�ES
~~~~~~~~~~~~~~~~~
- Gr�ce au menu contextuel, vous pouvez entrer une s�rie de KeyWord qui vous
permettent d'effectuer des actions sp�ciales.
En particulier:
1. D�marrez un programme externe ou ouvrez un fichier.
2. Commencez la lecture d'un fichier texte donn�.
3. Ins�rez un fichier wav ou mp3 dans le dialogue que vous cr�ez (ceci peut �tre
utilis� pour cr�er des dialogues avec des effets sonores).
4. Faites une pause de quelques secondes.
5. Fermez DSpeech.
6. Des instructions de contr�le de flux sont �galement disponibles, mais veuillez
vous r�f�rer � la section "SYST�ME DE SCRIPT ET RECONNAISSANCE VOCALE".
- A l'aide d'un �l�ment de menu, vous pouvez d�finir la priorit� de DSpeech sur
"Idle" afin qu'elle fonctionne en arri�re-plan total sans occuper le processeur
pour d'autres processus. Cette option est particuli�rement utile lors de la
cr�ation de livres audio car le processus de conversion peut utiliser le PC pendant
plusieurs heures.
REPRODUCTION DU TEXTE
~~~~~~~~~~~~~~~~~~~~~~~
- � l'aide des touches ou des raccourcis clavier appropri�s, vous pouvez d�marrer
et mettre en pause ou reprendre la lecture exactement o� vous le souhaitez.
ENREGISTREMENT DU MICROPHONE
~~~~~~~~~~~~~~~~~~~~~~~~~~~~
OPTIONS D'ACCESSIBILIT�:
~~~~~~~~~~~~~~~~~~~~~~~~~
HOTKEYS:
~~~~~~~~
- Les HotKeys sont divis�s en deux cat�gories, ceux du programme (tels que F5 pour
d�marrer la lecture ou F4 pour mettre en pause), qui ne fonctionnent que si vous
travaillez sur DSpeech, et les globaux, similaires au pr�c�dent pour la
fonctionnalit�, mais � la place, ils sont intercept�s et continuent de fonctionner
m�me si vous travaillez sur d'autres programmes. Pour activer ce dernier: menu
Options -> Accessibilit� -> Activer la validit� globale des HotKeys.
- Il existe une option suppl�mentaire (menu Options -> Accessibilit� -> Permet �
F10 HotKeys d'activer / d�sactiver la validit� globale des HotKeys) qui permet
d'appuyer sur la touche F10 dans n'importe quel contexte (m�me en utilisant Office
par exemple), activer ou d�sactiver tous les Hotkeys globaux DSpeech.
De cette mani�re, il est possible, par exemple, de relancer la lecture d'un texte
en cours de reproduction sans avoir � abandonner la fen�tre du programme sur lequel
il travaillait.
Il suffit donc d'appuyer sur F10, d'appuyer sur F9 (qui demande � DSpeech de
recommencer la lecture depuis le d�but) puis d'appuyer � nouveau sur F10 pour
d�sactiver tout le reste des HotKeys qui peuvent nous d�ranger si nous faisons
autre chose.
Cette option peut �galement �tre activ�e simplement en cliquant sur l'ic�ne de la
baguette.
OPTIONS AUDIO:
~~~~~~~~~~~~~~
EDITION DU TEXTE:
~~~~~~~~~~~~~~~~~
En plus des fonctions standards d'�dition (trouver, remplacer, copier etc.) une
fonction particuli�re est ajout�e, "Enlever les retours clavier inutiles." Cela
permet de supprimer tous les espaces inutiles dans le texte qui pourrait ralentir
la fluidit� de la lecture avec des voix artificielles.
DSpeech peut aussi convertir un texte en fichier Wav ou Mp3. Si le format mp3 est
choisi, il est possible de d�finir les caract�ristiques de la compression, en
fonction des r�glages on peut privil�gier la taille, la qualit� audio du fichier
produit, pour obtenir un r�sultat �quilibr�.
En activant la fonction "Activer r�ponse IA lorsque vous appuyez sur Entr�e" vous
pouvez avoir l'illusion (plus ou moins) de converser avec un autre �tre humain.
Chaque fois que vous appuyez sur ENTER, la phrase sera analys�e et D-Speech
r�pondra avec une phrase appropri�e.
Par d�faut, seule une personnalit� virtuelle en italien (Selena) est install�e, ce
qui n�cessite donc l'utilisation d'une voix f�minine italienne, mais le programme
est capable d'utiliser aussi les autres (si elles seront jamais r�alis�es).
En v�rit�, personne ne peut parler d'une v�ritable intelligence artificielle comme
le � noyau � de l'algorithme est bas� sur � pattern matching �, cependant, cette
technique est actuellement celle qui donne les meilleurs r�sultats en termes de
r�alisme des r�ponses. La base de donn�es avec le mod�le phrases (qui correspond au
fichier SELENA.IA) est, en partie, d�riv� d'un ancien programme open-source
(Babbea) est n� � son tour un autre programme pour taquiner l'IA (H�lo�se) qui
�tait , � l'�poque, pass� comme un programme de r�flexion.
Dans tous les cas, le fichier peut �tre modifi� � volont�.
RECONNAISSANCE VOCALE:
~~~~~~~~~~~~~~~~~~~~~~
- TXT (fichiers texte simples dans les deux formats ANSI et UNICODE).
- RTF
- HTM, HTML
- PDF (n�cessite "PDFToText.exe" pour �tre pr�sent).
- DOC (Fichier produit avec MS Word, pour les utiliser il faut que Word soit
install�).
- XML (Exp�rimental, format utilis� pour les flux RSS).
UTILISATEUR: "Ordinateur"
PC: "Ordinateur pr�t, qui �tes vous? "
UTILISATEUR: "Dimio"
PC: "Alors, Bienvenue"
Etc.
Le syst�me de script est tr�s similaire � BASIC. La plupart des mots-cl�s sont
con�us pour fonctionner uniquement en mode direct et, lors de la conversion en
fichiers audio, sont simplement ignor�s, n�anmoins certains d'entre eux, par
exemple le mot-cl� ">STOP", fonctionnent �galement pendant les conversions.
>DO
>EXIT DO
>LOOP [n]
>CALL NomdelaroutineSub
>RANDOM
>CASE
>END RANDOM
>EXECUTE CheminAcc�sProgramme
>OPEN Texte�lire.txt
>PLAY Fichier.wav
>WAIT Seconde
>DELAY MilliSeconde
>REM
>STOP
>BREAK
>CLEAR
>CLOSE
>DEL
>HIDE
>SHOW
>TOP
>WAIT_ANYKEY
>SHUTDOWN
>SELFDESTRUCT
>SELFDESTRUCT_AND_SHUTDOWN
>REM Commentaire
Il vous permet d'ins�rer des commentaires dans le texte qui seront compl�tement
ignor�s par DSpeech � la fois pendant la lecture et la conversion en fichiers
audio.
>VOICE NomeVoce
Changez la voix narrative.
>DO
...
>EXIT DO
...
>LOOP [n]
Il ex�cute une boucle cyclique, quand il rencontre la "EXIT DO", il sort. Si vous
sp�cifiez un num�ro [n], seul le nombre de cycles indiqu� sera ex�cut�.
>IF TIMEOUT
...
>END IF
Ex�cute les commandes entre l'IF END IF et si, apr�s une >RECOGNIZE_WITH_TIMEOUT a
d�pass� le temps sp�cifi� sans que l'utilisateur a fourni une entr�e vocale.
>CALL NameSub
...
>SUB NameSub
...
>END SUB
La premi�re d�claration, >CALL NameSub, provoque l'ex�cution saute � >SUB NameSub
en >END SUB, d�termine l'instruction de retour imm�diatement apr�s la >CALL SUBNAME
(est tout � fait similaire � l'ancien Gosub et Return du BASIC).
>RANDOM
...
>CASE
...
>CASE
...
>CASE
...
>END RANDOM
Vous permet d'ex�cuter de mani�re al�atoire les instructions suivantes pour chaque
cas.
>EXECUTE CheminDuPrograme
Ouvre le Programme sp�cifi� par son cheminement.
>OPEN FichierALire.txt
Ouvre un fichier texte et commence la lecture.
>STOP
Termine l'ex�cution du script et/ou de la lecture de la voix et/ou de la conversion
en fichiers audio.
>BREAK
Mot-cl� utilis� pour diviser un fichier en plusieurs fichiers MP3 � des points
pr�d�finis.
>PLAY NomDuFichier.wav
Joue un fichier wav.
>WAIT Secondes
Il attend le nombre de secondes sp�cifi�es (1-60) avant de continuer.
>DELAY MilliSecondes
Attendez le nombre sp�cifi� de millisecondes (100-900) avant de continuer.
>CLOSE
Ferme le programme DSpeech sans enregistrer les param�tres.
>CLEAR
Supprimer le contenu de la fen�tre.
>DEL PathFile
Supprimez le fichier ou le dossier indiqu�.
>HIDE
Rend la fen�tre du programme invisible.
>SHOW
Affichez � nouveau la fen�tre du programme en annulant une commande >HIDE
pr�c�dente.
>TOP
Afficher la fen�tre principale de DSpeech
>WAIT_ANYKEY
Il attend que l'utilisateur appuie sur n'importe quelle touche pour continuer.
>SHUTDOWN
�teignez l'ordinateur, si vous souhaitez que DSpeech se ferme d'une mani�re
sp�cifique, par exemple sans enregistrer les param�tres, par rapport � la commande
appropri�e pour fermer DSpeech, par exemple >CLOSE ou >SELFDESTRUCT.
>SELFDESTRUCT
Ferme DSpeech et supprime le fichier "DSpeech.exe" (c'est-�-dire s'auto-efface du
disque), le fichier "DSpeech.ini" et le fichier �ventuellement ouvert.
>SELFDESTRUCT_AND_SHUTDOWN
Supprimer "DSpeech.exe", "DSpeech.ini" et tout fichier ouvert avant d'�teindre
l'ordinateur.
Dans le menu contextuel (click droit) on a acc�s � tous les MOTS-CL� avec des
exemples.
Je n'explique pas la syntaxe, consid�rant qu'elle peut �tre d�duite, intuitivement,
� partir des exemples.
Ci-dessous un exemple de script de reconnaissane vocale:
>VOICE Marco
Je suis Angelus, l'ordinateur de Dimitri. Qui es tu?
>DO
>RECOGNIZE Dimitri, Gloria, OTHER_WORDS
>IF RECOGNIZED Dimitri
Angelus attend tes instructions.
>EXIT DO
>END IF
>IF RECOGNIZED Gloria
Tu te trompes d'ordinateur, le tien est � c�t�.
>EXIT DO
>END IF
>IF RECOGNIZED OTHER_WORDS
>RANDOM
>CASE
Peux tu r�p�ter, s'il te plait? Je n'ai pas reconnu ton nom.
>CASE
Qu'as tu dit? Peux tu r�p�ter?
>CASE
Je n'ai pas reconnu ton nom, peut �tre que je ne le connais pas!
>END RANDOM
>END IF
>LOOP
Sauf si vous avez des moteurs ASR commerciaux compatibles avec SAPI5 (comme
Loquendo ASR), nous utiliserons simplement le moteur Microsoft gratuit (sur mon
site est le lien) bas� sur la phon�tique anglaise, c'est pourquoi, pour rendre
certains mots reconnaissables, il est souvent n�cessaire de les adapter � la
prononciation anglaise. Par exemple, pour que l'ordinateur reconnaisse le mot
"Russie", il faudra �crire "Rassya".
RACCORSIS CLAVIER:
~~~~~~~~~~~~~~~~~~
LIGNE DE COMMANDE:
~~~~~~~~~~~~~~~~~~
SYNTAXE:
Il est possible d'indiquer comme seule option un fichier texte � ouvrir, dans
l'exemple suivant DSpeech ouvrira simplement l'interface et chargera le fichier
"FileToSpeech.txt".
DSpeech.exe FichierALire.txt
/Play = D�marrer la lecture d'un fichier ou d'une page Web. Les exemples suivants
chargent les fichiers "FileToSpeech.txt" et "index.html" et commencent � les lire.
/Speak = Vous permet de prononcer une courte phrase. L'exemple suivant prononce le
mot "Hello!" sans ouvrir DSpeech.
DSpeech.exe /Speak Hello!
/Mp3 = Convertir un fichier texte en fichier Mp3. Dans le premier des exemples
suivants, le fichier "Source.txt" est converti en fichier "Source.mp3". Alors que
dans le second exemple le fichier "Source.txt" est converti en un fichier nomm�
"Destination.mp3". Dans le troisi�me exemple, le fichier web index.html est
converti en un fichier appel� "Destination.mp3".
/Aac = Convertir un fichier texte au format AAC pour les appareils Apple. (Voir ci-
dessus).
QUESTIONS CONNUES
~~~~~~~~~~~~~~~~~~
NOTES:
~~~~~
- Lorsque vous ins�rez un fichier mp3 dans le texte, en particulier s'il est grand,
il peut y avoir une l�g�re pause entre la lecture de la ligne pr�c�dente et la
lecture du fichier audio, ceci est normal et ne constitue pas un d�faut, la pause
dispara�t compl�tement � l'enregistrement du r�sultat sous forme de fichier wav ou
mp3.
- Pour la compression en mp3, le codec Lame est utilis� (www.mp3dev.org), il
correspond au fichier "Lame.exe" inclus dans le paquet.
- Pour la compression Ogg Vorbis, l'encodeur "oggenc.exe" du paquet "vorbis-tools-
1.0.1-win32" est utilis�.
- Le fichier "pdftotext.exe", qui fait partie du paquet "Xpdf"
(http://www.foolabs.com/xpdf/), est utilis� pour ouvrir les fichiers PDF.
- Pour la compression dans AAC, le fichier "neroaacenc.exe" de Nero AG est utilis�
(ils sont identiques � Nero Burning Rom).
CONFIGURATION SYSTEME:
~~~~~~~~~~~~~~~~~~~~~~
Le paquet MS-SAPI5.1 peut �tre pr�sent sur votre syst�me. Il est t�l�chargeable sur
le site Microsoft.
Personnelement j'utilise les voix Microsft Paul Mobile et Microsoft Julie Mobile.
LES VOIX:
~~~~~~~~~
La qualit� de ces voix est r�ellement en-de�a de celle des voix des tierces parties
(une diff�rence �norme), c'est pourquoi il est conseill� de t�l�charger et
installer ces voix concurrentes. Malheureusement les meilleures sont payantes, et
ne peuvent pas �tre distribu�es l�galement. vous trouverez les meilleures voix chez
les fabricants ci-dessous:
LICENCE:
~~~~~~~~
CODEURS:
~~~~~~~
BETA-TESTEURS:
~~~~~~~~~~~~~
Luna
Matas