Vous êtes sur la page 1sur 42

But : créer un fichier Djvu interactif (avec texte cherchable (OCR), bookmarks et hyperliens) à partir de pages scannées ou photographiées

TUTORIEL POUR LA CREATION D’UN EBOOK DJVU

Table des matières

1) Programmes utilisés dans ce tutoriel

2) Numérisation des pages en mode automatisé

2.1

Avec un appareil photo numérique

 

2.2

Si vous avez un scanner, créez un script Autohotkey !

 

2.3

Pour scanner plusieurs pages avec IrfanView

 

2.4

Pour créer un script de scan automatisé avec IrfanView

2.5

Lancement

du

script

Autohotkey

pour

le

scannage

automatique

2.6 Renommage par lot des pages scannées avec IrfanView

3) Redressement de pages scannées avec Abbyy Finereader

4) Cadrage des pages redressées avec IrfanView et Autohotkey

4.1 Quelques fonctionnalités et raccourcis utiles de IrfanView

4.2 Script autohokey pour le cadrage semi-automatique des

pages

5) Amélioration des pages avec Photoshop CS3

5.1 Filtres utiles photoshop pour l’amélioration des pages

5.2 Quelques outils de Photoshop CS

5.3 Création d’un script Photoshop pour l’amélioration des

pages 6) Création de fichiers DJVU à partir de Document Express 6.5 Pro 6.1) Lancement de Document Express 6.5 Pro à partir de

Cracklock 6.2) Création de Djvu à partir d’images JPEG ou TIFF 6.3) Océrisation de fichiers DjVu à partir de Finereader 9 Pro 6.4) Imbriquer le texte océrisé de Finereader avec DjvuOCR 6.5) Création d’un fichier Djvu entièrement océrisé 7) Création semi-automatique de Liens dynamiques dans un Djvu 7.1) Annotations dynamiques menant vers une page

(cliquables)

7.2 Script des annotations dynamiques (aucun clic sur les

icônes)

7.3 Bookmarks pour la navigation dans le document DjVu

8) Quelques précisions sur la commande djvused 9) Utilisation de Thumbsplus

1) Programmes utilisés dans ce tutoriel (à télécharger ici)

- Autohotkey & Autoscriptwriter (pour l’automatisation de tâches diverses dans Windows avec n’importe quel logiciel, la création de raccourcis quelconques)

- Photoshop portable CS3 (pour l’amélioration des pages,

la retouche de certains détails)

- IrfanView (pour le cadrage des pages, l’automatisation du renommage de fichiers, la conversion de format, du cadrage

- Thumbsplus (pour le traitement par lots d’images, parfois utile)

- Abbyy finereader pro 9 (pour le redressement des pages scannées + l’océrisation de fichiers djvu)

- Document Express 6.5 Pro, et DjVuViewer de Caminova (édition + lecture de DjVu)

- DjvuOCR (pour l’incorporation du texte océrisé par Abbyy finereader dans le fichier djvu, le retrait du texte)

- djvused.exe (pour l’utilisation de lignes de commandes permettant de multiples opérations sur les fichiers djvu)

- Cracklock (pour l’utilisation illimitée des versions d’essai de logiciels tels que Djvu Express Editor)

- Bookmarktool 2 (pour la gestion des « bookmarks » (ou « outline ») , l’arborescence, le plan de navigation du djvu pour l’accés rapide à certaines pages

- jEdit 4 (version java, pour éditer des fichiers texte divers, notamment les fichiers bookmarks sous format html et les annotation (rectangles dynamiques apparaissant dans le djvu)

- un lecteur mp3 (pour écouter vos titres préférés pendant les longs moments à créer le djvu !! Winamp conseillé)

Commencez par installer ces programmes…

2) Numérisation/scan des pages en mode automatisé 2.1 Avec un appareil photo numérique

Si vous n’avez pas de scanner, utilisez un appareil photo numérique classique, 5 mégapixels minimum si possible, idéal 10 Mp, évitez le flash sur les pages brillantes, l’arrondi des pages n’est pas gênant car Finereader 9 peut découper les double-pages photographiées et aussi redresser automatiquement l’arrondi proche de la ligne centrale, et aussi les pages scannées de travers.

2.2 Si vous avez un scanner, créez un nouveau script Autohotkey

Clic droit sur le bureau, nouveau/ Autohotkey script, donnez un titre par exemple : autoscan.ahk, puis Entrer, le script est encore vide à ce stade. Ensuite clic droit sur le fichier créé, Edit script et laisser le fichier ouvert réduit dans la barre des tâches pour le compléter comme indiqué ci-après.

pour

l’enregistrement multipages en .jpg ou .tif séparés à partir du scanner

2.3

Pour

scanner

plusieurs

pages

avec

IrfanView,

et

Ouvrir IrfanView, File/Select TWAIN Source, sélectionnez le modèle du scanner) puis File/Acquire-batch scanning, cochez multipage images, mettez le numéro de la première page scannée [pour les pages hors du corpus de texte, comme la table des matières, etc… ajoutez par exemple le préfixe COUV_ signifiant « couverture » dans Output file name pour les pages allant de la 1 ère de couverture COUV_00 (number of digits 2) jusqu’à la page précédant la page numérotée 1], (vous pouvez même ajouter l’intitulé du livre, par ex. pour un livre de physique-chimie 1 ère année, on mettra PC1_, et PC1_COUV_, mais vaut mieux mettre l’intitulé en suffixe : ###_PC1, et COUV_##_PC1, on verra pourquoi ensuite ); increment 1 si vous faites toutes les pages consécutivement, sinon 2 si vous scannez en double-pages ou bien une page sur 2, number of digits 3 pour la plupart des livres (qui ont moins de 1000 pages, pour les livres de + de 1000 pages vous pouvez toutefois laisser 3 digits, c’est plus pratique pour la suite).

Cochez Skip existing files, remember last scan counter, choisissez un dossier de destination des pages scannées, par exemple nommé livrescan, pour le format : .tif, compression LZW pour un livre en noir&blanc, ne PAS cocher save as multipage image, ou bien jpeg pour les livre en couleur ou niveau de gris (ayant des surfaces grisées). Une fois ces réglages terminés :

Cliquez sur OK et la fenêtre de numérisation de VOTRE SCANNER va s’ouvrir. Dans les paramètres, choisissez si possible 300 dpi, mode noir et blanc, couleur ou niveau de gris suivant les couleurs présentes dans le livre, (si votre scanner est trop long, mettez 200 dpi, mais en-deçà, la qualité sera faible) réglez la longueur de numérisation de page par rapport à la hauteur du livre grâce à un aperçu (seulement pour la 1 ère page ! après toutes les autres auront la même longueur de numérisation, pour la largeur aucune importance laisser 210mm (scanner A4) car on ne gagne pas de temps sur la largeur, juste sur la longueur. (on cadrera les pages avec IrfanView plus tard comme décrit ci-après).

Pour commencer la numérisation, cliquez sur le bouton de la boîte de dialogue de numérisation de votre scanner ouverte à partir d’IrfanView qui va automatiquement numéroter les images à chaque clic de numérisation. Heureusement, au lieu de cliquer à chaque fois sur le bouton, on peut automatiser le clic toutes les x secondes (temps aller-retour de scannage de votre scanner). Voici comment créer le script adéquat…

2.4 Pour créer un script de scan automatisé avec IrfanView, afin de simplement retourner le livre à chaque scan, sous plus toucher à rien sur l’ordinateur !

Ouvrez Autoscriptwriter, mettez les fenêtre de ce programme et de la boîte de dialogue de numérisation du scanner côte à côte, cliquez sur Record… à ce moment-là, tout ce que vous effectuez avec la souris et/ou le clavier à partir de la fenêtre d’un programme actif ou sur le bureau s’enregistre sous forme de scripts autohotkey à chaque opération ! (pas grave si vous ne connaissez pas les commandes autohotkey, elles sont écrites dans la fenetre d’autoscriptwriter) Très pratique. Dans le cas qui nous intéresse, cliquez sur le bouton de numérisation de la boîte de dialogue du scanner (elle doit déjà être ouverte à partir de IrfanView cf 2.3). (pas le bouton réel !!, tout se passe sur l’écran !)

Enfin, quand le scanner a terminé l’aller-retour, cliquez sur Stop pour arrêter l’enregistrement.

cliquez sur Stop pour arrêter l’enregistrement. créé pour modifier le script suivant. Observez, après
cliquez sur Stop pour arrêter l’enregistrement. créé pour modifier le script suivant. Observez, après

créé pour modifier le script suivant.

Observez,

après

cette

phase

record,

les

commandes

créées

dans

la

fenêtre

ci-contre,

commandes

correspondant

à

l’activation

de

la

dialogue

de votre scanner + les coordonnées du clic sur le bouton

boite

de

de

numérisation.

Vous

allez

vous

aider

de

ce

script

Dans le script autoscan.ahk déjà ouvert vierge, écrivez (ou copiez) les commandes suivantes (ATTENTION : les parties gras en bleu dépendent de votre scanner et seront différentes des miennes !! Grâce à la fenêtre ci- dessus de autoscriptwriter, vous devez modifier ces parties en bleu), qui permettent de faire une boucle cliquant automatiquement à des intervalles réguliers sur le bouton de numérisation [intervalles = temps de scannage aller-retour de VOTRE SCANNER]:

(les phrases après les « ; » sont des commentaires sans effet sur le script qui donnent des explications sur le script, vous n’êtes pas obligé de les copier)

; AutoHotkey Version: 1.x

; Language:

English

;

Platform:

Win9x/NT

;

Author:

A.N.Other <myemail@nowhere.com>

;

;

Script Function:

; Template script (you can customize this template by editing "ShellNew\Template.ahk" in your Windows folder)

;

#NoEnv ; Recommended for performance and compatibility with future AutoHotkey releases.

SendMode Input ; Recommended for new scripts due to its superior speed and reliability.

SetWorkingDir %A_ScriptDir% ; Ensures a consistent starting directory.

Sleep, 2000

; ceci permet de commencer le clic au bout de 2 secondes, une fois que vous aurez lancer

; le script, ça permet d’avoir le temps de placer le livre sur le scanner avant de démarrer la boucle

Loop, 100

; loop correspond à une boucle : ici, 100 fois de suite, le script va faire cliquer la souris sur

; le bouton de numérisation de la boite de dialogue du scanner (vous pouvez remplacer 100

; par une autre valeur, par exemple si le livre fait 1000 pages, mettez 1000, mais

; ça n’a aucune importance, relancez le script dès que la boucle est terminée)

;

l’accolade suivante est le début de la boucle

{

;

le script suivant active la boite de dialogue de votre scanner,

;

j’ai un scanner brother DCP-130C dont la boite de dialogue s’intitule

;

Paramétrage du Scanner TW-Brother DCP-130C USB - 3.9 –

;

la partie suivant active cette fameuse boite de dialogue :

WinWait, Paramétrage du Scanner TW-Brother DCP-130C USB - 3.9 - ,

; remplacez Paramétrage….etc…. par le nom de votre fenêtre comme affiché

; dans Autoscriptwriter

IfWinNotActive, Paramétrage du Scanner TW-Brother DCP-130C USB - 3.9 - , , WinActivate, Paramétrage du Scanner TW-Brother DCP-130C USB - 3.9 - ,

WinWaitActive, Paramétrage du Scanner TW-Brother DCP-130C USB - 3.9 - ,

SendEvent {Click, left, 569, 333}

; ceci est le fameux clic sur le bouton de numérisation de la boite de dialogue

; de votre scanner. Evidemment, remplacez les 2 valeurs ci-dessus 569 et 333 par les

; coordonnées apparues dans Autoscriptwriter lorsque vous avez cliqué sur le bouton

; de numérisation lors de la phase « record »

; pour plus de détails sur la manière de « faire cliquer » ou « faire presser une touche »

; au script, reportez-vous dans l’aide :cherchez « keystrokes » dans l’index

; tous les détails sont expliqués sur les Send, SendEvent, etc…

Sleep, 21000

; “sleep” correspond à une pause dans l’exécution du script d’une durée donnée en millisecondes,

; mon scanner brother met 21 secondes environ pour scanner en aller-retour

; avant de pouvoir recliquer sur le bouton de numérisation pour une autre page

; remplacez 21000 par la durée aller-retour de votre scanner,

; cette durée dépend de votre scanner et de la hauteur de page du livre scanné

; les commandes suivantes (facultatives) étaient initialement prévues pour produire

; un bip sonore quand le scanner avait scanné la page à l’aller, dès que je l’entendais

; je retournais le livre le temps du retour de la lampe

;SoundBeep, 600, 100

; “SoundBeep” produit un bip sonore de fréquence donnée (ici 600Hz), pour 1 durée donnée

; (ici 100 ms)

;Sleep, 11600

;Config pour A4 :

;Sleep, 7000

;SoundBeep, 600, 100

;Sleep, 13600

}

;

fin de la boucle

;

Ainsi, au lancement de ce script, la souris clique toute seule sur le bouton de numérisation de

;

la boite de dialogue de votre scanner à intervalle régulier (ici 21 secondes)

p::Pause

; pendant l’exécution, vous pouvez à tout moment appuyer sur « p » pour faire une pause,

; pour suspendre les clics, réappuyez sur « p » pour reprendre les clic

; cette pause est utile ! par ex. prendre un café, une page du livre

; qui pose problème, etc….

; plus généralement pour créer un raccourci avec une touche, reportez-vous dans l’aide

; à la section « hotkeys » (recherchez hotkey dans l’index)

Une

enregistrez-le. (fichier/enregistrer)

fois

que

vous

avez

copié/modifié

ce

script

dans

autoscan.ahk,

2.5 Lancement du script Autohotkey pour le scannage automatique

Assurez-vous que IrfanView est bien paramétré (cf 2.3), et que la boîte de dialogue de votre scanner est ouverte, prête à numériser (ouverte à partir de Irfanview : « acquire/batch scanning » (raccourci Ctrl+Shift+A, voir détails ci-dessus en 2.3)

Ensuite, double-cliquez sur l’icône de autoscan.ahk pour lancer le script.

A ce moment une petite icône verte « H » apparaît dans la barre des tâches. Le script est actif ! [remarque : vous pouvez

une petite icône verte « H » apparaît dans la barre des tâches. Le script est

désactiver le script et ses raccourcis à tout moment : clic droit sur l’icône, cochez « suspend hotkeys »]

Au bout de 2 secondes (car Sleep 2000 dans le script), le clic se fait tout seul sur la fenêtre de scan.

Quand la page est scannée, retourner le livre pour passer à la page suivante, et quand la lampe est revenue au point de départ, normalement si votre temps est correct, le clic suivant se produit, et ainsi de suite….

Ceci vous libère de toute opération sur l’ordinateur, vous pouvez pendant ce temps regarder la télé, écouter la musique, etc…, la seule chose que vous faites : tourner les pages !

(c’est pourquoi au départ j’ai mis un bip pour savoir à quel moment il fallait retourner le livre, j’ai donc dans le script décomposer le temps total de 21 sec en 2 temps de 10 sec et 11 sec séparés par un bip, mais avec l’habitude, ou au bruit du scanner, vous savez quand le scan-aller est terminé). Relancez le script si la boucle est terminée.

2.6 Renommage par lot des pages scannées avec IrfanView

Une fois que toutes les pages sont scannées grâce à l’automatisation ci-dessus, normalement la numérotation des images doit être correcte si le paramétrage expliqué en 2.3 est correct (correspondance entre N° image et N° de page)

Toutefois des erreurs peuvent arriver, à cause des pages blanches par exemple, une page oubliée, un scan deux fois de suite d’une même page, etc…)

Heureusement IrfanView facilite la tâche est permet le renommage par lot.

Ouvrez IrfanView, File/Batch Conversion rename (ou appuyer sur « B »), cochez batch rename.

Dans Regarder dans allez dans le dossier contenant les pages scannées, sélectionnez les pages mal numérotées, puis cliquez sur Add,

les pages mal numérotées, puis cliquez sur Add, Cliquez sur Sort Files , cochez by Name,

Cliquez sur Sort Files, cochez by Name, cochez Auto sort file list after insert.

cochez by Name, cochez Auto sort file list after insert. Ensuite, une fois les pages mal

Ensuite, une fois les pages mal numérotées ajoutées, cliquez sur Options dans batch rename settings

after insert. Ensuite, une fois les pages mal numérotées ajoutées, cliquez sur Options dans batch rename
Supposons que l’erreur de numérotation se situe à la page 11 du livre dont les

Supposons que l’erreur de numérotation se situe à la page 11 du livre dont les pages scannées sont nommées PC1_001, PC1_002, etc…

(PC1 correspond à un intitulé du livre, vous n’êtes pas obligé d’en mettre, les ### sont les 3 chiffres (=digits) de la numérotation utilisée ici.

Malheureusement, vous vous rendez compte que PC_012.jpg est en fait la page 11 du livre, jusque PC_033.jpg (qui est donc la page 30)

Il faut donc mettre 11 dans Starting counter, increment 1 (les numéros vont être successivement PC1011.jpg, PC1012 .jpg, etc…)

Si PC011.jpg existe déjà dans le dossier, il peut y avoir un conflit de nom, le renommage ne se fera pas ! Donc renommez d’abord la page qui cause le conflit. Ensuite cliquez sur OK. Avant de démarrer le batch, cliquez sur Use current (look in) directory, afin d’effectuer le renommage dans le dossier courant.

, afin d’effectuer le renommage dans le dossier courant. Enfin, cliquez sur Start Batch pour démarrer

Enfin, cliquez sur Start Batch pour démarrer le renommage.

Vous pouvez évidemment utiliser ce renommage dans d’autres cas, pas spécialement pour des pages mal numérotées !

Par exemple, pour ajouter un suffixe ou un préfixe à des pages déjà numérotées (si vous avez oublié par exemple de mettre l’intitulé préfixe PC1 d’un livre de physique- chimie 1 ère année (d’où PC1) avant le numéro des fichiers ###, vous écrivez PC1_$N

(les starting counter n’est pas pris pattern)

en compte

car il

n’y pas

« # »

dans

Name

Pour les fichiers Djvu, je vous conseille de mettre plutôt un suffixe : le numéro de page doit toujours apparaître en premier, c’est beaucoup plus pratique pour Djvu Express Editor pour la gestion des pages !

Exemple $N_PC1, $N_L1, $N_astro, etc… (pour ajouter « _PC1 », _L1, _astro au nom des images) ou ###_PC1, etc… pour une renumérotation)

Ca donnera des choses du genre 001_PC1, 002_PC2, etc….

Ce suffixe n’est pas obligatoire mais est utile pour éviter les conflits de numéro de pages lors de la fusion de 2 fichiers Djvu par exemple, et aussi pour éditer plusieurs Djvu fusionnés.

3) Redressement de pages scannées avec Abbyy Finereader

Une fois les pages scannées, certaines seront probablement scannées un peu de travers pour un scanner manuel, et/ou tournées de 90°, et à l’envers pour 1 page sur 2 (pages paires ou impaires) il faut donc les remettre à l’endroit les redresser !

il faut donc les remettre à l’endroit les redresser ! Abbyy Finereader 9 fait cela bien

Abbyy Finereader 9 fait

cela bien automatiquement !

très

Allez dans Outils/Options, cochez ne pas traiter les images des pages acquises (car on veut simplement redresser les jpg ou tif, pas océriser !),

Cochez :

- corriger l’obliquité des images,

- détecter l’orientation des pages.

Eventuellement cochez segmenter les pages doubles si vous avez scanné deux pages à la fois (par ex. pour un petit roman qui, ouvert, se scanne entièrement en double-page sur le scanner). Ne cochez pas les cases suivantes. Sélectionner votre scanner, puis OK.

les cases suivantes. Sélectionner votre scanner, puis OK . Ensuite automatisées/automation manager/nouveau. allez dans

Ensuite

automatisées/automation manager/nouveau.

allez

dans

Outils/tâches

Donnez un nom par exemple Redressepages, OK.

Donnez un nom par exemple Redressepages , OK. Dans l’étape 1, cliquez alors sur Ouvrir des

Dans l’étape 1, cliquez alors sur Ouvrir des images, puis sur modifier. Cochez Demander le nom du fichier d’image au lancement de la tâche, puis OK

Dans l’étape 2, cliquez sur Enregistrer des images , puis cliquez sur Modifier. Dans dialogue

Dans l’étape 2, cliquez sur Enregistrer des images, puis cliquez sur Modifier.

Dans

dialogue Enregister des images, cochez

de

la

boîte

Enregistrer sous le nom spécifié et à l’emplacement indiqué, choisissez dans parcourir un dossier où enregistrer les pages redressées (différent de celui des pages scannées initiale auquel qu’il ne faut jamais modifier !)

scannées initiale auquel qu’il ne faut jamais modifier !) Pour le type : choisissez JPEG, couleur

Pour le type : choisissez JPEG, couleur pour les livres en couleur, ou bien TIFF niveau de gris, compression LZW pour les livres en niveau de gris, ou bien encore TIFF noir et blanc LZW pour les livres en noir et blanc (le format .tif en N&B ou niveau de gris est nettement plus réduit en taille qu’un jpg, par contre un tif couleur prend ENORMEMENT de place ! ne pas l’utiliser)

Dans la section Nom, ajouter une lettre de repère, par exemple r, pour savoir plus tard que le dossier d’image correspond à des pages redressées.

Cliquez sur OK, puis exécutez le script : cliquez sur Exécuter).

Sélectionnez d’abord les pages scannées numérotées « normalement » (sans les préfixes/suffixes) de 1 jusque la fin

(Remarque pour sélectionner facilement : cliquez sur la 1 ère image à redresser, appuyez sur Shift, puis cliquez sur la dernière page à redresser.)

Enfin, cliquez Ouvrir.

Les pages sont alors automatiquement redressées et enregistrées dans le dossier spécifié ! Le seul inconvénient : Finereader numérote toutes les pages redressées dans l’ordre sans laisser le nom d’origine, voilà pourquoi il

faut d’abord redresser les pages en deux fois (2 groupes séparés, celles avec préfixe/suffixe et celles sans préfixe/suffixe).

Une fois cette 1 ère phase terminée, renumérotez les pages redressées grâce à IrfanView en remettant le même style de numérotation que les pages d’origine (cf. 2.6), par exemple r-0001.jpg, r-0002.jpg, …. Du dossier des pages redressées devront être renommées en : PC1_001.jpg, PC1_002.jpg, etc

Après le renommage de ce premier groupe de pages, réexécutez le script de redressement pour les pages ayant un préfixe/suffixe, par exemple :

COUV_00_PC1, COUV_01_PC1, etc…

Elles seront nommées par Finereader en r-0000.jpg, r-0002.jpg, etc… mais grâce au mode batch de IrfanView encore (cf 2.6) vous les renommerez en COUV_00_PC1.jpg, COUV_01_PC1.jpg…

A la fin de cette étape, vous avez un dossier contenant toutes les pages scannées redressée, ayant une numérotation correcte.

scannées redressée, ayant une numérotation correcte. [Remarque : pour les pages photographiées possédant des

[Remarque : pour les pages photographiées possédant des pages courbées, vous pouvez d’abord redresser les lignes en ouvrant toutes les pages d’abord sans traitement, puis cliquez sur le petit crayon de modification d’image en bas à droite (ou Ctrl + Shift + C) (figure ci-contre) , puis dans Réaligner et redresser, cochez appliquez à toutes les pages, cliquez sur les 2 boutons Réaligner l’image, Redresser les lignes de texte.] Enregistrez ensuite toutes les images (cochez Toutes) dans fichier/enregistrer des images…, pas besoin d’appliquer le redressement dans ce cas. FIN de la remarque]

le redressement dans ce cas. FIN de la remarque] On peut maintenant passer au cadrage semi-

On peut maintenant passer au cadrage semi- automatisé des pages avec IrfanView (appelé aussi le crop, qui consiste à découper en rectangles de même dimension, pour se débarrasser des bords).

4) Cadrage des pages redressées avec IrfanView et Autohotkey

4.1 Quelques fonctionnalités et raccourcis utiles de IrfanView

Avant de créer le script, quelques précision sur les raccourcis IrfanView et le rectangle de cadrage.

La touche :

o : permet d’ouvrir une image

s : permet d’enregistrer l’image dans un dossier qui reste mémorisé une fois le 1 er enregistrement effectué

Ctrl+S : enregistre l’image dans le dossier d’origine

Créez un nouveau script autocrop.ahk sur le bureau, puis collez le script suivant (bouton droit sur l’icône autocrop.ahk, edit script) :

Flèche droite du clavier : permet d’ouvrir l’image suivante dans le dossier courant.

Flèche gauche du clavier : revient à l’image précédente dans le dossier courant.

Shift + C : définit un rectangle de sélection (notre rectangle pour croper la page)

Ctrl + Y : permet de « croper » la page, c’est-à-dire que seule la zone dans le rectangle de sélection est conservée, la taille de l’image a alors la taille du rectangle, on se débarrasse des bords

+ /- : pour zoomer ou dézoomer l’image courante.

F12 : pour afficher une palette d’outils affichée ci-contre, par exemple l’outil crayon (icône du crayon en haut à droite), vous pouvez modifier le diamètre du crayon (Width (px)), puis sélectionner la couleur désirée, par exemple pour effacer des tâches sur la page ou des textes indésirables (copyright, tampons indiquant la provenance, etc…), par ex. pour une page blanche tâchée, on sélectionnera la couleur blanche (cliquez sur le rectangle noir en bas, et choisissez le blanc), diamètre entre 100 et 1000 suivant la taille de la zone à gommer.

Enfin, avec la souris :

- Un « clic and drag » (= clic gauche maintenu, puis mouvement de la souris) sur l’image fait apparaître un rectangle de sélection. Lâchez la souris à l’endroit désiré pour former le rectangle.

- Un clic droit au-dessus du rectangle permet de le déplacer.

Un petit entraînement d’abord !

Ouvrez une page du livre contenant si possible la zone maximale de corpus de texte (c'est-à- dire qui a la hauteur de texte maximale, la largeur maximale), tracez avec la souris le rectangle de sélection contenant ce corpus de texte en laissant des marges blanches autour, de sorte de ne pas inclure les bordures de scannage, comme sur l’exemple ci-contre (rectangle noir visible). Une fois le rectangle tracé, mémorisez les dimensions par le raccourci Shift + C (ou Edit/create custom crop selection).

Shift + C (ou Edit/create custom crop selection ). Cliquez sur Save values and exit. Cette
Shift + C (ou Edit/create custom crop selection ). Cliquez sur Save values and exit. Cette

Cliquez sur Save values and exit. Cette option est super, car pour les pages suivantes, on aura juste à appeler ce rectangle (Shift + Cg) et cliquer sur Save and apply to image sans redessiner la sélection.

Ainsi pour n’importe quel livre, il faudra toujours faire le crop manuellement pour la première, pour définir les dimensions du rectangle de cadrage.

On peut également utiliser photoshop pour l’amélioration des pages, cette étape est expliquée plus loin, une fois les pages cadrées.

4.2 Script autohokey pour le cadrage semi-automatique des pages

On va créer un script (en fait 2 scripts) pour faciliter le cadrage : on aura simplement à :

1. positionner correctement à la souris (sans aucun clic) un rectangle de dimension donnée sur la page redressée courante,

2. puis appuyer sur la barre espace pour : [croper la page, l’enregistrer dans un dossier défini à l’avance, et passer automatiquement à la page suivante].

On répète juste 1. et 2. pour la page redressée suivante qui s’affiche automatiquement.

Ainsi on met seulement quelques minutes pour cadrer des centaines de pages, car on n’a pas à ouvrir séparément les pages, les enregistrer, etc… le script magique autocrop.ahk qu’on va créer fait cela tout seul !

En fait, pour l’automatisation, le script autocrop.ahk fera presser les touches adéquates, on a successivement au cours du script :

1) tracer le rectangle automatiquement (Maj+C),

2) on positionne le rectangle correctement manuellement (le clic bouton droit sur le rectangle se fera tout seul par le script !) En fait ce rectangle est déjà à peu près bien positionné si vous avez scanné le livre en mettant chaque page à peu près au même endroit !), donc vous ne bougerez pas beaucoup la souris (ou le doigt sur un touchpad de portable),

3) appuyer manuellement sur espace dès qu’il est bien positionné

4) croper l’image (Ctrl + Y) automatiquement

5) enregistrer l’image (s) automatiquement

6) passer à l’image suivante (flèche droite) automatiquement

Très pratique ! Les seules phases manuelles sont le positionnement du rectangle, et appuyer sur espace, c’est raisonnable pour quelques centaines de pages. Copiez les commandes suivantes dans le script autocrop.ahk nouvellement créé :

#NoEnv ; Recommended for performance and compatibility with future AutoHotkey releases.

SendMode Input ; Recommended for new scripts due to its superior speed and reliability.

SetWorkingDir %A_ScriptDir% ; Ensures a consistent starting directory.

Space::

Send, {Click right up}

Send, {CTRLDOWN}y{CTRLUP}

Send, s

WinWait, Save Picture As

,

IfWinNotActive, Save Picture As

,

, WinActivate, Save Picture As

,

WinWaitActive, Save Picture As

,

Send, {Enter}

Send, {RIGHT}

Sleep, 100

SendEvent, z

Dans un second script créé sur le bureau que vous nommerez cadre.ahk, copiez les commandes suivantes :

z::

SetTitleMatchMode, 2

WinWait, IrfanView,

IfWinNotActive, IrfanView,

WinWaitActive, IrfanView,

Send, {SHIFTDOWN}c{SHIFTUP}{ENTER}

Sleep, 100

MouseMove, 15, 352

SendEvent {Click, right down, 515,352}

KeyWait, Rbutton

Explication succinte des 2 scripts de cadrage

Dans le premier, on définit un raccourci de barre espace qui :

- SetTitleMatchMode, 2 : évite d’écrire le titre des fenêtre en entier, afin d’activer la fenêtre contenant simplement le mot IrfanView dans WinWait, car l’intitulé de la barre Irfanview change en fonction de l’image ouverte, (dimensions de l’image affichées après le mot IrfanView)

- Send, {Click right up} : Relève le bouton droit de la souris (car lors du déplacement du rectangle de sélection, le bouton droit est enfoncé)

- Send, {CTRLDOWN}y{CTRLUP} : crop de l’image par le raccourci Ctrl +Y d’irfanview

- de Send, s… jusque {Enter} : enregistrement de l’image dans le dossier spéficié grâce à la 1 ère page (nom identique à l’image ouverte)

- Send, {RIGHT} : ouverture de l’image suivante

- SendEvent, z : appuie sur la touche z : tracé du rectangle de cadrage (z est un raccourci du 2 ème script)

Le second script, exécuté par l’appui sur z, trace le rectangle de cadrage, et laisse ensuite le bouton droit de la souris enfoncé pour permettre positionnement du cadre.

Finalement, pour effectuer le cadrage semi automatique :

a) Ouvrez IrfanView, faites le crop manuel d’une page à corpus maximal, sauvez

les valeurs du rectangle de cadrage, puis enregistrez-là dans un dossier réservé aux pages cadrées (ce dossier est mémorisé par IrfanView pour la suite)

b) Ouvrez ensuite la 1 ère page du dossier des pages redressées, lancez les 2

scripts (double-clic sur autocrop.ahk et cadre.ahk), et commencez par appuyer

sur z pour tracer le rectangle.

c) Ensuite, appuyez sur barre espace (ça crop, sauve, puis passe à la page

suivante)

d) Positionnez correctement (avec le doigt du touchpad ou la souris) sans rien

cliquer

Répétez c) et d) jusque la fin du livre (vous voyez, seulement 2 opérations manuelles : positionnement et appui sur espace, aucun clic)

A la fin de cette étape, on a 3 dossiers d’images : les pages scannées, redressées et cadrées.

5) Amélioration des pages avec Photoshop CS3

On peut améliorer d’un coup toutes les pages scannées en appliquant un script photoshop que l’on crée manuellement. Ce script n’a rien à voir avec Autohotkey.

Si vous trouvez que vos pages scannées sont trop sombres, peu éclairées, ou bien possèdent des élément à effacer

5.1 Filtres utiles photoshop pour l’amélioration des pages

Effectuons pour s’habituer quelques essais sur une page scannée :

a) Exposition : Image/réglages/exposition

(Ctrl + Shift + R)

Exposition : Image/réglages/exposition (Ctrl + Shift + R) Le curseur Exposition permet de blanchir la page

Le curseur Exposition permet de blanchir la page (vers la droite), le décalage permet de mieux contraster (vers la gauche), la correction gamma renforce les couleurs, l’aspect général (vers la droite)

b) Niveaux : Image/réglages/Niveaux

(Ctrl + L)

En général, les pages scannées présentent parfois un fond bruité, la courbe noire ci-contre est alors fortement augmentée sur l’extrême droite, décaler légèrement le curseur de droite vers la gauche, cochez aperçu et observez en direct le résultat, jouez également sur les 2 autres curseurs de

droite vers la gauche, cochez aperçu et observez en direct le résultat, jouez également sur les

gauche pour améliorer la page. (essayez Auto pour voir, mais pas indispensable)

la page. (essayez Auto pour voir, mais pas indispensable) c) Flou de surface : Filtre/atténuation/flou de

c) Flou de surface : Filtre/atténuation/flou de surface…

Ce filtre est génial pour faire disparaître le texte qui apparaît légèrement au verso de la page scannée, par transparence de la feuille.

Mettez le curseur Rayon à environ 85-90, et Seuil à 10 niveaux environ, observez grâce à l’aperçu, vous verrez que la surface est beaucoup plus homogène, lisse.

Attention toutefois à ne pas faire disparaître trop fort les bordures de certains rectangles colorés apparaissant des certains livres (par exemple, théorème de maths mis en valeur dans un rectangle bleu, marge colorées, etc…

Le texte de devant, quant à lui, reste intact !!

d) Accentuation :

Filtre/renforcement/accentuation

Permet de renforcer le texte parfois un peu pâle sur certains livres, ou trop fin. Fait ressortir le texte.

Jouez sur les curseurs Gain, Rayon, Seuil pour voir l’effet sur la page. Les valeurs à mettre dépendent de votre scannage !

e) Tons foncés/tons clairs :

Image/réglages/tons foncés/tons clairs

clairs : Image/réglages/tons foncés/tons clairs Permet d’homogénéiser l’éclairage d’une page

Permet d’homogénéiser l’éclairage d’une page lorsqu’il y a trop d’écart de luminosité sur la surface, comme ça arrive pour les pages prises en photos (voir curseurs ci-dessous)

gamme de tons : permette d’éclairer (vers la droite) l’image

rayon : à 15px environ

facteur : à 50% environ

quantité : 0%

contraste des tons moyens : permet de faire ressortir certains texte

Vous pouvez utiliser également le filtre Renforcement/Plus Net ou Netteté Optimisée pour rendre le texte/l'image plus nette. Enfin,

f)

Luminosité/contraste

Image/réglages/luminosité,contraste

Luminosité/contraste Image/réglages/luminosité,contraste Jouez sur les curseurs et voir l’effet obtenu, pour avoir

Jouez sur les curseurs et voir l’effet obtenu, pour avoir une page bien blanche.

et voir l’effet obtenu, pour avoir une page bien blanche. Ces filtres sont surtout utiles pour

Ces filtres sont surtout utiles pour l’amélioration de pages en couleur.

5.2 Quelques outils de Photoshop CS

Pour chaque image, vous pouvez la décomposer en calques, qui sont affichés dans la palette calques grâce à Fenêtre/calques (ou

F7).

la palette calques grâce à Fenêtre/calques (ou F7). L’ouverture d’une image JPG donne un calque verrouillé

L’ouverture d’une image JPG donne un calque verrouillé (cadenas) sous forme d’arrière-plan.

calque verrouillé (cadenas) sous forme d’arrière-plan. Pour le déverrouiller, double-cliquez dessus, donnez un nom

Pour le déverrouiller, double-cliquez dessus, donnez un nom au calque, puis OK.

Pour sélectionner une zone de l’image, appuyez sur M (cadre de sélection en haut à gauche), vous pouvez placer cette sélection sur un nouveau calque (bouton droite sur la zone, calque par couper)

La palette d’outils (ci-contre) permet de multiples opérations. Un bouton droit sur chaque icône fait apparaître les options

Pour déplacer une image d’un calque, appuyez sur V, sélectionnez le calque dans la palette calques, puis déplacez-la (icône en haut à droite : flèche noire)

Pour gommer une zone : sélectionnez le calque correspondant dans la palette calques, appuyez sur E, bouton droit sur l’icône de la gomme pour choisir la gomme manuelle (ou magique pour gommer les surfaces de même couleurs), par bouton droit modifez le diamètre et la dureté suivant les cas.

Pour cloner une zone proche d’une autre : tampon de duplication (6 ème icône à gauche en allant vers le bas)

Pour tracer une forme colorée (par ex. pour cacher une zone du livre avec un rectangle blanc), cliquez, dans la palette outils sur la 9 ème icône (ou appuyez sur U) sur la droite en allant vers le bas (petit rond blanc sur la figure). Ensuite cliquez sur le petit rectangle blanc (celui de gauche, cf ci-contre),

le petit rectangle blanc (celui de gauche, cf ci-contre), Sélectionnez la couleur désirée en cliquant sur

Sélectionnez la couleur désirée en cliquant sur le rectangle « couleur » , puis tracez le rectangle.

sur le rectangle « couleur » , puis tracez le rectangle. Dans la palette calques ,

Dans la palette calques, mettez ce calque de forme au dessus (déplacement grâce à une sélection du calque, puis à la souris), ensuite fusionnez ces calques (bouton droit sur un calque, fusionnez les calques visibles)

Beaucoup d’autres possibilités dans Photshop sont expliquées dans des aides ou tutoriaux dédiés.

5.3 Création d’un script Photoshop pour l’amélioration des pages

Après la prise en main de ces outils, créons un script photoshop qui applique automatiquement plusieurs filtres successivement et enregistre les images scannées d’un dossier.

et enregistre les images scannées d’un dossier. Après avoir fait plusieurs essais de filtres sur vos

Après avoir fait plusieurs essais de filtres sur vos pages, et décider quelle séquence/ordre de filtres était la plus adaptée (n’oubliez pas de revenir en arrière Ctrl+Z si c’est pas un filtre adéquat), annulez toutes les opérations de l’historique (fenêtre/historique pour l’afficher) : pour cela cliquez sur l’étape la plus haute correspondant au 1 er filtre appliqué et supprimez-la (toutes les étapes suivantes sont supprimées automatiquement)

Pour créer le script, affichez la fenêtre script (fenêtre/scripts), cliquez sur créer un ensemble (à droite de la flèche, cf ci-

, affichez la fenêtre script ( fenêtre/ scripts), cliquez sur créer un ensemble (à droite de

contre), donnez un nom à cet ensemble (ici les ensembles visibles sont :

scripts par défaut, raccourcis, retouche.

Ensuite, cliquez sur créer un script, donnez un nom, éventuellement une touche de raccourci (pas nécessaire). Par exemple, en donnant le nom Script 1, puis OK, le bouton d’enregistrement du script est actif (rond rouge).

bouton d’enregistrement du script est actif (rond rouge). Appliquez alors les filtres testés précédemment (dans
bouton d’enregistrement du script est actif (rond rouge). Appliquez alors les filtres testés précédemment (dans

Appliquez alors les filtres testés précédemment (dans l’ordre retenu) sur la page ouverte. Toutes les opérations effectuées sont notées au fur et à mesure. Dans l’exemple ci-contre, j’applique d’abord une luminosité contraste, puis une accentuation.

Pour arrêter l’enregistrement, appuyez sur stop (carré à côté du rond). Vous pouvez poursuivre l’enregistrement en ré-appuyant sur le rond. Possibilité de décochez certaines étapes du script (coches à gauche). Les carrés à côté des coches sont pour l’attente de saisie de texte dans les boîtes de dialogue (par exemple : enregistrement de l’image, attente qu’on entre le nom). Seulement dans ce cas, cochez la case correspondante.

Vous pouvez enregistrer autant de scripts que vous souhaitez !

Une fois l’enregistrement terminé pour l’image ouverte, appliquez le script à

toutes les images d’un dossier :

Fichier/automatisation/traitement par lots…

Dans la boîte de dialogue qui s’ouvre, choisissez l’ensemble de votre script, puis le nom du script créé,

ensemble de votre script, puis le nom du script créé, Dans source , choisissez le dossier

Dans source, choisissez le dossier source contenant les pages scannées,

Dans destination, sélectionnez le dossier où seront enregistrées les pages améliorées (les pages d’origine sont les pages scannées OU BIEN cadrées OU BIEN redressées, mais autant appliquer le script sur les pages cadrées car elles sont déjà réduites, donc moins de surface à opérer.

Parfois lors de l’exécution, une boîte de dialogue d’enregistrement s’ouvrira pour CHAQUE page, ce qui empêche le déroulement pour les pages suivantes. Pour éviter ce problème, lors de l’enregistrement du script, enregistrer les modifications faites à l’image dans un dossier, et/ou cochez

Priorité sur les instructions de script « Enregistrer sous » (cf ci-dessus). Normalement, l’enregistrement se fait sans problème sans même cocher cette case.

A ce stade, les pages sont cadrées et améliorées, on a donc a priori 4 dossiers : pages scannées, redressées, cadrées, améliorées.

6) Création de fichiers DJVU à partir de Document Express 6.5 Pro 6.1) Lancement de Document Express 6.5 Pro à partir de Cracklock

Ouvrir Cracklock Manager (ce programme « fait croire » aux programmes type Try and buy que la date de l’ordinateur est toujours celle de l’installation ! A chaque lancement du programme à partir de cracklock, on a donc toujours le même nombre de jours restants avant l’expiration de la période d’essai !)

[remarque : si la fenêtre de cracklock reste réduite dans la barre des tâches, passez la souris sur l’icône de la barre des tâches, puis bouton droit sur la mini-fenêtre qui apparaît, puis agrandir]

droit sur la mini-fenêtre qui apparaît, puis agrandir ] Cliquez sur Add program, allez dans

Cliquez sur Add program, allez dans Programmes/Caminova/Document Express 6.5 Professional/bin puis ajoutez DjVuPro.exe

Paramétrez le programme ajouté par bouton droit, configure… et cochez exactement comme sur le modèle ci-contre, sauf bien sûr la date d’installation, correspondant à la date d’installation du progamme Document Express 6.5 Pro.

(cochez virtual date, virtual time, virtual time zone [madrid, paris], et Freeze date and time).

Lancez Document express 6.5 par bouton droit, run puis cancel pour le nombre de jours d’essai (donc vous pouvez utiliser le programme en illimité !)

Voilà ! Vous êtes prêt pour créer votre document Djvu !

6.2) Création de Djvu à partir d’images JPEG ou TIFF

Ouvrir d’abord la

première page

uniquement

:

document Djvu ! 6.2) Création de Djvu à partir d’images JPEG ou TIFF Ouvrir d’abord la

File/open (Ctrl +O), choisissez jpeg Files ou Tiff Files suivant le format des pages améliorées, et aller dans le dossier contenant les pages améliorées.

Quand la page s’ouvre, les options de zoom sont les suivantes : affichage 100%, pleine largeur, pleine page, ou personnalisé. Choisissez de préférence Fit page (3 ème icône de page comme ci-contre) pour avoir l’aperçu global de la page.

Ajoutez ensuite les autres pages en faisant bouton droit sur la première vignette (= Thumbnail) (page 1), puis choisissez Insert Page(s) After

Choisissez à nouveau le format JPEG ou TIFF suivant les cas,

et sélectionnez simultanément les pages à ajouter après la

sélectionnez simultanément les pages à ajouter après la première page. IMPORTANT : seulement les 100 pages
sélectionnez simultanément les pages à ajouter après la première page. IMPORTANT : seulement les 100 pages

première page.

IMPORTANT :

seulement les 100 pages suivantes (s’il y en a qu moins 100 !) car j’ai remarqué que ce programme rame énormément au-delà de 100 pages.

évitez d’ajouter plus de 100 images à la fois

, sélectionnez

Au bout de quelques secondes, les pages s’ajoutent.

Enregistrez alors le fichier djvu par : File/Save as….

Dans la boîte dialogue qui apparaît, choisir :

Type : DjVu Files

boîte dialogue qui apparaît, choisir : Type : DjVu Files DPI : identique au DPI choisi

DPI : identique au DPI choisi lors du scannage (si vous n’avez pas scanné les images, pour connaître la résolution d’une image dans Windows : bouton droit, propriétés, puis détail)

Profile :

- pour les pages en couleur, j’ai constaté que la qualité Map avec lossy dans text quality était très correcte en rapport qualité/taille, alors qu’en mode normal certains signes typographiques deviennent flous.

- Pour les pages noir et blanc, choisir Bitonal, et lossy pour text quality.

Ne pas cocher OCR (sera fait après avec Abbyy Finereader 9 bien meilleur

que le moteur IRIS utilisé dans ce programme)

Dans Nom du fichier, écrire un nom évocateur des numéros de pages. Par exemple pour les pages 1 à 100 : 001-100_PC1.djvu, pour les pages de COUV_00 à COUV_13 : COUV00-15.djvu)

Une fois le Djvu enregistré, fermez le document (pas le programme !),

ouvrez
ouvrez

la 101 ème page

(et pas les 100 pages suivantes d’un coup !) et faites de même

pour ajouter de la 102 ème à la 200 ème page( bouton droit sur la vignette, insert pages after), enregistrez en format DjVu.

[REMARQUE :Quand tous les groupes de 100 pages sont enregistrés, on pourrait ouvrir le 1 er groupe, et ajouter les groupes suivants : bouton droit sur la vignette, Insert Page(s) After (méthode identique, sauf qu’il s’agit cette fois de fichiers DjVu), et sélectionnez d’un coup les autres groupes (ils

doivent être dans l’ordre). Une fois TOUTES les pages ajoutées,

enregistrez

par Save As
par Save As

, (et non Save car ça remplacerait le 1 er groupe de 100 pages !)

et donnez un nom pour votre ebook DjVu. Le profil n’a ici aucune importance, car les fichiers sont déjà en Djvu, ne pas cochez OCR non plus. A cette étape, on aurait notre fichier Djvu à l’état brut : il contient toutes les pages du livre, mais aucun lien dynamique interne, ni bookmark pour une navigation aisée dans le document, ni OCR.]

Toutefois, pour océriser le document, il ne faut pas tout de suite rassembler les groupes de 100 pages, car Abbyy Finereader mettrait beaucoup trop de temps à océriser un Djvu de plusieurs centaines de pages ! Or il est assez rapide pour un Djvu de 100 pages environ.

6.3) Océrisation de fichiers DjVu à partir de Finereader 9 Pro

Ouvrir Abbyy Finereader 9 Pro, et dans

Outils/Options/1.

Numériser/Ouvrir, cochez cette fois Lire automatiquement les images des pages acquises (très importants pour laisser les pages dans l’ordre !),

Cochez seulement Convertir

en noir.…

niveaux

de gris

Puis OK.

Convertir en noir.… niveaux de gris Puis OK. Ouvrir ensuite le 1 e r groupe de

Ouvrir ensuite le 1 er groupe de 100 pages (Ctrl+O) Fichier/Ouvrir un PDF, une image : le djvu est lu intégralement par Finereader.

, un nom similaire relatif à la numérotation du groupe de 100 pages (par exemple : 201-300)

Une fois terminé, Fichier/Enregistrer le document Finereader

donnez

Fermer le document, puis océrisez de mêmes avec les autres DjVu (remarque : le dernier groupes n’a pas nécessairement 100 pages ! ce sont les pages restantes !)

6.4) Imbriquer le texte océrisé de Finereader avec DjvuOCR

On va maintenant insérer le texte reconnu par Finereader dans le document Djvu.

le texte reconnu par Finereader dans le document Djvu. Pour cela, lancez DjvuOCR.exe Choisissez Batch mode

Pour cela, lancez DjvuOCR.exe

Choisissez Batch mode OCR manager, ajoutez le fichier DjVu (Add), cochez Ignore error checking, Burn DJVU books.

Dans FineReader Project Directory, choisissez le dossier Finreader enregistré correspondant au groupe de pages du fichier DjVu, puis Test project pour vérifier qu’aucune erreur ne s’est produite.

pour vérifier qu’aucune erreur ne s’est produite. Si aucune erreur n’est affiché lors du test, cliquez

Si aucune erreur n’est affiché lors du test, cliquez sur Process.

Une petite fenêtre apparaît, puis quand elle se ferme, le DjVu est normalement océrisé.

Vérifiez cela en ouvrant le fichier DjVu avec le lecteur de Caminova :

en ouvrant le fichier DjVu avec le lecteur de Caminova : Les jumelles doivent être sombre

Les jumelles doivent être sombre (non grisée), cliquez dessus et rechercher des termes : si tout a fonctionné les termes sont surlignés correctement lors de la recherche de termes.

Si une erreur se produit lors du test, il faut insérer le texte océrisé par ligne de commande grâce à l’exécutable FRFGrab.exe, fourni avec le programme djvuOCR.exe. On utilisera plus tard une seconde commande, djvused.exe.

Pour que ces commandes soient toujours reconnues dans Windows, copiez djvused.exe et FRFGrab.exe dans C:\Windows\system32

Ouvrir la fenêtre de commande en tapant cmd dans la zone de recherche juste au-dessus du bouton démarrer de Windows, lors du clic sur démarrer en bas à gauche, ou bien allez dans Accessoires/invite de commande.

Tapez FRFGrab.exe juste après l’invite de commande, faites Entrer. Toute l’aide s’affiche, mais pas de panique vous devez juste connaître que quelques commandes minimes pour insérer (ou même enlever !) la couche OCR dans le Djvu. Ce programme sert surtout à récupérer le texte des fichiers .frf générés par Finereader et donner en sortie un fichier .txt contenant tout le texte référencé pour chaque page du Djvu, et compréhensible par la commande djvused.exe

du Djvu, et compréhensible par la commande djvused.exe Pour se déplacer dans un dossier avec les

Pour se déplacer dans un dossier avec les lignes de commandes, tapez cd pour monter d’un niveau au dossier parent, dir pour afficher le contenu du dossier courant, et cd [nom du dossier] pour aller dans un dossier contenu dans le dossier courant.

Supposons que notre document Finereader soit enregistré sous le nom 201- 300, et produit une erreur avec DjvuOCR.exe, et se situe dans [votre nom d’utilisateur]/mes documents/livre. Alors tapez cd documents puis cd livre. Si livre est le seul dossier commençant par li…, tapez cd li* (* est un joker signifiant tous les caractères). Si vous ne savez plus où vous êtes, tapez dir, les dossier sont indiqués par <REP>.

Une fois dans C:\Users\[nom utilisateur]\Documents\livre, allez dans le document finereader par cd 201-300. Tous les fichiers .frf sont normalement ici, vérifiez-le par un dir.

Tapez enfin la ligne de commande suivante, récupérant le texte des fichiers .frf vers un fichier .txt structuré :

FRFGrab –i –g *.frf > 201-300.txt (évidemment remplacez 201-300 par un nom en relation avec le fichier finereader enregistré)

*.frf prend tous les fichiers frf du dossier, l’option –i ignore les erreurs, -g génére les positions des pages dans l’ordre, (à partir de 1, mais ceci n’a aucun rapport avec le numéro réel de la page, l’essentiel et que la position de la page dans le fichier .txt généré corresponde à la position dans le DjVu (qui est dans notre exemple 201-300.djvu)

Une fois ce fichier .txt généré, on peut insérer le texte dans le Djvu manuellement avec la commande djvused.exe (mais c’est plus chiant si le .txt et le .djvu sont à 2 endroits différents : il doivent être dans le même dossier) ou bien avec DjvuOCR.exe :

être dans le même dossier) ou bien avec DjvuOCR.exe : Cliquez sur Burn OCR file in

Cliquez sur Burn OCR file in DjVu Book, puis sélectionnez le fichier .txt produit dans le dossier finereader, et le fichier DjVu correspondant.

Enfin cliquez Process pour insérer le texte.

Très rarement le programme dit que le fichier txt est invalide, dans ce cas ouvrez le fichier .txt, et ajoutez ou enlevez la ponctuation gênante (généralement à cause d’une « ) » au début du fichier (ça doit normalement commencer ainsi :

# -------------------------------------

select 1

remove-txt

set-txt

Vérifiez succinctement que le texte a bien été inséré et correspond bien au Djvu. Pour l’insérer manuellement, se reporter en 8) grâce à la commande Djvused.exe.

Faites de même pour les autres fichiers Djvu, en espérant qu’aucune erreur se produise, sinon vous devez insérer avec FRFGrab.exe ce qui est un peu plus long.

Remarque : il existe un moyen dans DjvuOCR, pour insérer le texte qu’à partir d’une certaine position (Manual mode OCR manager) et surtout pour enlever le texte d’un fichier Djvu (Remove OCR layer). Ces outils ne présentent aucune difficulté.

6.5) Création d’un fichier Djvu entièrement océrisé

A cette étape, tous les groupes d’une centaine de pages sont océrisés, on PEUT MAINTENANT ouvrir le 1 er groupe AVEC DOCUMENT EXPRESS 6.5 PRO, et ajouter les groupes suivants : bouton droit sur la vignette du 1 er Djvu ouvert (thumbnail), Insert Page(s) After (méthode identique qu’en 6.2, sauf qu’il s’agit cette fois de fichiers DjVu), et sélectionnez d’un coup les autres groupes (ils doivent être dans l’ordre). Une fois TOUTES les pages

ajoutées,

groupe de 100 pages !) et donnez un nom pour votre ebook DjVu. Le profil n’a ici aucune importance, car les fichiers sont déjà en Djvu, ne pas cochez OCR non plus. A cette étape, on a notre fichier Djvu entièrement océrisé : il

contient toutes les pages du livre avec possibilité de rechercher du texte,

mais aucun lien dynamique interne, ni bookmark pour une navigation aisée

dans le document.

enregistrez par Save As

, (et non Save car ça remplacerait le 1 er

7) Création semi-automatique de Liens dynamiques dans un Djvu

Comme pour le scannage, on va utiliser autohotkey pour créer des liens dynamiques au sein du Djvu : les annotations et les bookmarks. Ces liens fonctionnent parfaitement avec le DjvuViewer, issu du plugin de Caminova.

Ouvrez le fichier entièrement océrisé avec Document Express 6.5 Pro

7.1) Annotations dynamiques menant vers une page (cliquables)

Pour commencer, créons manuellement un lien dynamique, par exemple pour les lignes de la table des matières.

Aller sur la première page de la table des matières (aidez-vous le

exemple pour les lignes de la table des matières. Aller sur la première page de la

l’outline sur la gauche, la table des matières fait partie des pages nommées COUV )

Cliquez sur le rectangle de liens (Rectangular Hyperlink) à droite du bouton « T », ensuite tracez un rectangle (bouton gauche enfoncé) encadrant une ligne de la table des matières, au moment où vous lâcher le bouton gauche de la souris, une fenêtre s’ouvre :

le bouton gauche de la souris, une fenêtre s’ouvre : (cf ci-contre), dans style choisissez don’t

(cf ci-contre), dans style choisissez don’t display pour ne pas afficher le rectangle, dans description : le texte-bulle qui s’affichera lorsque vous passerez la souris sur la ligne de la table des matières (par exemple : Aller à cette page)

highlight pour mettre surbrillance colorée, link to : page name afin de référer à la page désirée, page name : choisissez ici le bon numéro de page. Pour atteindre plus vite la page 353 par exemple, appuyez sur la touche 3 puis la touche PageDown (flèche avec les 3 traits vers le bas). Vous comprenez maintenant tout l’intérêt d’avoir mis les numéro d’abord dans les noms de pages ! On accède beaucoup plus rapidement aux pages désirées, de même pour la table des matières, appuyez sur C pour aller directement aux pages COUV, puis choisir la bonne page. Cliquez OK pour valider.

Observez ce que font les autres effets de style en cliquant OK, puis en sélectionnant la main, et en passant la souris sur la ligne correspondante.

Pour afficher les liens présents sur une page, cliquez juste sur le rectangle avec la flèche rouge (Select annotations). Pour les supprimer, bouton droit sur l’annotation, Annotation/Delete.

Voilà, vous pouvez par exemple créer les liens de page pour chaque ligne de la table des matières vers les pages cible, puis les liens retour de la page cible vers la page adéquate de la table des matières.

De même pour des livres d’exercices dont les solutions sont groupées à la fin : liens aller-retour énoncé-solution, avec en commentaire (description) :

Voir la solution de l’exercice et Revenir à l’énoncé de l’exercice. Le commentaire doit être parlant.

Vous vous apercevrez vite que c’est (très) long de créer ces liens, rien que pour la table des matières !

7.2 Script des annotations dynamiques (aucun clic sur les icônes)

Nous allons donc créer un script autohotkey pour éviter de devoir cliquer sur les mêmes boutons à chaque fois, mais simplement positionné la souris autour des mots à encadrer. L’avantage, c’est que le script positionne déjà à peu près au bon endroit le rectangle dynamique.

Par exemple j’ai créé un script annotation.ahk qui effectuent les actions suivantes (en bleu)

- Je positionne la souris dans le coin gauche supérieur de la ligne à encadrer

- J’appuie sur F1 : la souris clique sur Rectangular Hyperlink, revient à l’endroit où la souris se trouvait, trace le début du rectangle (avec des paramètre qu’on définira dans le script) attend que je positionne le rectangle…

- …dès que le rectangle encadre bien la ligne (j’ai donc bougé jusqu’au coin inférieur droit, j’appuie sur F3 : le bouton gauche est lâché, la fenêtre de style s’ouvre alors, la souris choisit don’t display dans style, colle le commentaire Aller à cette page (doit être copiée dans le presse- papier), choisit Page name dans link to, puis clique dans Page name et éventuellement appuie sur un chiffre de début de page (par exemple 4 pour les pages 400 et +).

- Dès que la bonne page est choisie, j’appuie sur F4 pour simuler la touche Entrer

Fin des actions, le lien est créé. J’ai donc simplement pressé 3 touches

quasi consécutives F1, F3, F4 (gain de temps) et positionné la souris (qui est déjà à peu près bien placée correctement, vous verrez pourquoi dans

le script, donc gain de temps encore !) sans jamais cliquer sur un seul

bouton !

On peut définir quelques autres raccourcis pratiques pour éviter de devoir cliquer sur les icônes : w pour cliquer sur Select Annotation et revenir à l’endroit initial, q pour cliquer sur Rectangular Hyperlink et revenir à l’endroit initial.

Les choix de ces touches sont arbitraires, vous pourrez les modifier à souhait, mais ils me paraissent très pratiques. (évitez les touches telles que « T » qui sont déjà définies dans Document Express, vérifiez qu’elles n’ont pas d’effet en les pressant dans le programme, T tourne les pages du Djvu de 90° par exemple, mais w et q n’ont aucun effet, donc peuvent être utilisées.)

Pour créer le script vous-même, faites l’action décrite en 7.1 en phase Record avec Autoscriptwriter et notez les éléments importants :

coordonnées de la souris sur les différentes icônes, etc…

A l’aide de ces données copiez les commandes ci-dessus dans votre script

annotation.ahk que vous aurez créé préalablement, explicitant les raccourcis F1, F3, F4 décrits ci-dessus (en fait il existe un raccourci F2, mais automatiquement lancé par le script. En commentaires après les « ; » : description des actions)

[REMARQUE : remplacez nomdevotrefichier.djvu par le nom de votre fichier djvu, pour cela : dans le bloc-note, Ctrl +H (édition/Remplacer), rentrer les noms et cliquez Remplacer tout. Les textes en bleu doivent également être remplacées]

; début du script annotation.ahk

#NoEnv ; Recommended for performance and compatibility with future AutoHotkey releases.

SendMode Input ; Recommended for new scripts due to its superior speed and reliability.

SetWorkingDir %A_ScriptDir% ; Ensures a consistent starting directory.

F1::

WinWait, Document Express Editor ( UNREGISTERED - For Evaluation Only ) - [nomdevotrefichier.djvu],

IfWinNotActive, Document Express Editor ( UNREGISTERED - For Evaluation Only ) -

[nomdevotrefichier.djvu], , WinActivate, Document Express Editor ( UNREGISTERED - For Evaluation Only )

- [nomdevotrefichier.djvu],

WinWaitActive, Document Express Editor ( UNREGISTERED - For Evaluation Only ) - [nomdevotrefichier.djvu],

MouseGetPos, OutputVarX, OutputVarY,

; memorisation de la position de la souris

MouseClick, left,

Sleep, 100

MouseClick, left, 453, 95

; coordonnée du clic sur le bouton Rectangular Hyperlink

MouseMove, OutputVarX, OutputVarY,

; mouvement de la souris vers la position mémorisée

Send, {F2}

Return

; fin du raccourci F1

;;;;;;;;;;; démarre le rectangle à la position de la souris

F2::

WinWait, Document Express Editor ( UNREGISTERED - For Evaluation Only ) - [nomdevotrefichier.djvu],

IfWinNotActive, Document Express Editor ( UNREGISTERED - For Evaluation Only ) -

[nomdevotrefichier.djvu], , WinActivate, Document Express Editor ( UNREGISTERED - For Evaluation Only )

- [nomdevotrefichier.djvu],

WinWaitActive, Document Express Editor ( UNREGISTERED - For Evaluation Only ) - [nomdevotrefichier.djvu],

;;;;;;;;;;;;;;;;;;;;;; 1.mémorise la position de départ coins supérieur gauche

MouseGetPos, OutputVarX, OutputVarY,

;;;;;;;; 2. coin SUPERIEUR gauche du rectange;

SendEvent {Click, left down,}

;;;;;;;;;;;;;;;;;;;;;;;3. tracé du rectangle jusqu'au coins INFERIEUR droit;

MouseMove,

OutputVarX + 173, OutputVarY + 20,

; trace le rectangle de 173 pixels vers la gauche, de 20 pixels vers le bas, données à modifier !

return

;;;;;; à ce stade, attend un relâché du clic gauche à l'endroit du coin DROIT INFERIEUR;;;

;;;;; clic du coin INFERIEUR DROIT ci-après;;;;;;;;

F3::

;;;;;;;;;;;;;;;;;;;;;;;4. copie de la phrase 'aller à cette page ou autre';

MouseGetPos, OutputVarX, OutputVarY,

SendEvent {Click, left up}

; relâché du clic gauche, la fenêtre de style apparaît…

Sleep, 100

;;;;;;;;;;;;;;;;;;;;;;;5. OUVERTURE DE LA FENETRE DE LIENS;

WinWait, Rectangular Highlight / Hyperlink Properties, ;IfWinNotActive, Rectangular Highlight / Hyperlink Properties, , WinActivate, Rectangular Highlight / Hyperlink Properties,

WinWaitActive, Rectangular Highlight / Hyperlink Properties,

;;;;;;;;;;;;;;;;;;;;;;;6 CHOIX AFFICHAGE

Send, {Up} ;{DOWN};{DOWN}

; ici don’t display va être sélectionné, car la flèche du haut et enfoncée

; pour prendre un autre style enlevez les ; et/ou

; ajoutez des ;{DOWN} sans les ; ils ne sont pas actifs ici car un ; est devant

SendEvent {Click, left down, 158, 274}

; clic dans la case description, ces coordonnées sons peut-être différentes pour vous

;;;;;;;;;;;;;;;;;;;;;;;7 SOURIS DANS LA CASE DE COMMENTAIRES;

MouseMove, 34, 274

;;;;;;;;;;;;;;;;;;;;;;;8 SELECTION DU COMMENTAIRE PAR DEFAUT;

SendEvent {Click, left up}

;;;;;;;;;;;;;;;;;;;;;;9 COPIE DU COMMENTAIRE EN PRESSE PAPIER;

;;;;;;;;;;;; ici : notez ici le commentaire et copiez-le avant d’appliquer ce script

Send, {CTRLDOWN}v{CTRLUP}

Sleep, 100

;;;;;;;;;;;;;;;;;;;;;;10 CHOIX DE SELECTION PAR NUMERO DE PAGE;

MouseClick, left, 141, 381

Sleep, 100

MouseClick, left, 157, 418

Sleep, 100

;;;;;;;;;;;;;;;;;;;;;;11 CHOIX DE LA PAGE;

MouseClick, left, 403, 376

;;;;;;;;;;;;;;;;;;;;;;12 DEBUT DU NUMERO DE PAGE;

Sleep, 100

Send, s

;Send, c

;Send, p

Send, 1{PgDn}

; pour baisser de plusieurs dizaines de pages ajoutez des pagedown comme ci-dessus

; l’exemple ci-dessus va à la page 100, puis baisse d’un cran

;;;;;;;;;;;;;;;;;;;;;;13 ATTENTE D'APPUYER SUR ENTREE;

;;; attend la touche Entrée (ici raccourcie par f4)

KeyWait, F4

Sleep, 100

;;; revient à l'endroit du lien et clic avec la main pour revenir

MouseMove, OutputVarX - 100, OutputVarY+3,

Sleep, 100

Send, w

return

w::

;;;; w est le raccourci icône de la selection des annotations, pour voir les annotations déjà sur la page

MouseGetPos, OutputVarX, OutputVarY,

WinWait, Document Express Editor ( UNREGISTERED - For Evaluation Only ) - [nomdevotrefichier.djvu],

IfWinNotActive, Document Express Editor ( UNREGISTERED - For Evaluation Only ) - [nomdevotrefichier.djvu], , WinActivate, Document Express Editor ( UNREGISTERED - For Evaluation Only ) - [nomdevotrefichier.djvu],

WinWaitActive, Document Express Editor ( UNREGISTERED - For Evaluation Only ) - [nomdevotrefichier.djvu],

MouseClick, left, 382, 99

MouseMove, OutputVarX, OutputVarY,

Sleep, 100

return

;; commentaires à copier régulièrement , à laisser dans ce script

;; Revenir à la table des matières

;; Voir la solution

;; Voir la solution de l'exercice

;; Aller à cette page

;; Revenir à l'énoncé

F4::Send {Enter}

;;;;;;;;; icone 'main par la touche q';;;;;;;;;;;

q::

WinWait, Document Express Editor ( UNREGISTERED - For Evaluation Only ) - [nomdevotrefichier.djvu],

IfWinNotActive, Document Express Editor ( UNREGISTERED - For Evaluation Only ) - [nomdevotrefichier.djvu], , WinActivate, Document Express Editor ( UNREGISTERED - For Evaluation Only ) - [nomdevotrefichier.djvu],

WinWaitActive, Document Express Editor ( UNREGISTERED - For Evaluation Only ) - [nomdevotrefichier.djvu],

MouseGetPos, OutputVarX, OutputVarY,

MouseClick, left, 293,99

MouseMove, OutputVarX, OutputVarY -3,

return

;;; fin du script à copier dans annotation.ahk

Vous pouvez créer autant de script que vous le souhaitez afin de modifier sensiblement les coordonnées suivant que vous encadrer une ligne de table des matières, ou simplement un titre de chapitre.

Par exemple, tdm.ahk pour les lignes de la table des matières : les valeurs a et b dans OutputVarX + a, OutputVarY+b (a et b sont dans ce cas des écarts relatifs, pas des coordonnées absolues) pourront être calculées grâce à des clics séparés « dans le vide » sur la page, dans la fenêtre de Document Express lors d’un Record de Autoscripwriter, afin de connaître les écarts relatifs (différence entre abscisses d’une part, et ordonnées d’autres part). Ces écarts devraient être pour la tdm la longueur et la hauteur d’une ligne hauteur environ.

Titres.ahk pour les liens retour vers la table des matières (largeur d’un titre pour a, hauteur d’un mot de titre pour b), etc…

Les coordonnées affichées en bleu sont probablement différentes pour vous, à moins que vous n’ayez aussi par chance un écran 17’ et Document Express affiché sur toute la hauteur de l’écran !

7.3 Bookmarks pour la navigation dans le document DjVu

A gauche dans l’outline (View/Navigation Pane) est affiché l’arborescence. A ce stade, vous n’avez pas encore renommé ces bookmarks. Lors de la fusion des Djvu, il se peut qu’il en manque une partie. Pour commencer, supprimez-les tous par clic droit sur le bookmark-parent (le tout premier), Delete, et enregistrez File/Save.

Désormais l’outline est complet et contient toutes les pages numérotées.

Vous pouvez mettre un titre sur les bookmarks correspondant aux titres des différents chapitres (double-clic sur le bookmark, ou clic droit/Edit)

Voici un exemple de bookmarks :

Pour imbriquer des « bookmarks-fils » dans un « bookmark parent » (le signe « + » indique que le bookmark possède des « sous-bookmark », glissez le fils avec la souris vers le second.

», glissez le fils avec la souris vers le second . En cliquant sur le «
», glissez le fils avec la souris vers le second . En cliquant sur le «

En cliquant sur le « + », le bookmark est développé. On peut évidemment créer des « sous-sous-bookmarks », pour une structrure plus détaillée.

Exemple d’imbrication de bookmarks :

plus détaillée. Exemple d’imbrication de bookmarks : Remarque : le « bookmark- parent » doit éviter

Remarque : le « bookmark- parent » doit éviter de renvoyer vers une page, car en cliquant sur le «-», (c’est-à-dire en refermant le bookmark), cette page s’affichera, ce qui peut être gênant pour la lecture.

Il vaut mieux créer les bookmarks-parents sans liens (clic droit sur un bookmark/Add), le déplacer au-dessus des fils, et glisser les bookmarks- fils avec liens dans les bookmark-parents. Ceci doit être valable pour tous les niveaux. Dans l’exemple, le bookmark Table des matières L1 Pearson n’est pas actif (sans lien), ni d’ailleurs Cursus LMD (L1), ni les 3 autres visibles au-dessus, alors que les Tdm…, 1000 tests…., Auteurs…, Pearson…., et Auteursle sont. Cette règle permet de refermer les bookmarks en restant sur la page courante. Sinon, la page du bookmark parent va s'afficher.

Pour créer les bookmarks sur tout le livre, il faut bien sûr s’aider de la table des matières (numéros de pages indiqués) et des annotations dynamiques créées auparavant pour revenir à la table des matières, et savoir d’un coup d’œil sur quel page des bookmarks il faut cliquer. D’où l’importance de créer d’abord les liens dynamiques AVANT les bookmarks !

Cette partie n’est pas tellement automatisable avec les scripts Autohotkey, car les coordonnées des bookmarks se modifient constamment…

Toutefois, il est possible d’éditer les bookmarks dans un éditeur html comme jEdit pour les imbriquer plus facilement.

A l’aide de Bookmarktool2.exe :

plus facilement. A l’aide de Bookmarktool2.exe : Glissez le fichier Djvu dans DjVu File, cliquez sur

Glissez le fichier Djvu dans DjVu File, cliquez sur Export, puis OK.

Ouvrez ensuite le fichier html généré avec jEdit (clic droit, open with jEdit), la structure des bookmarks s’affiche.

Ces derniers sont situés entre les balises <ul> et </ul>. Il suffit donc d’écrire ces balises, un script rapide ul.ahk permet d’éviter de taper ces caractères à chaque fois (suspendre ou fermez les scripts précédents d’abord !) : F1 pour taper <ul>, F2 pour taper </ul>, et F3 pour passer à la ligne.

F1::Send <ul>

F2::Send </ul>

F3::Send {Enter}

Lors de l’ajout des balises <ul> (ouvrante) et </ul> (fermante), n’en oubliez pas, surtout les fermantes quand il s’agit de plusieurs niveaux imbriqués !

La structure se présent comme sur l’exemple ci-dessous. Vous remarquerez que les bookmark sans lien n’ont pas href=

remarquerez que les bookmark sans lien n’ont pas href= Les modifications terminées, enregistrez le fichier html

Les modifications terminées, enregistrez le fichier html (fichier/enregistrer) et réinsérez-le dans le Djvu : dans Bookmarktool2, cochez Replace, puis Save. (Pour enlever les bookmarks du djvu : cochez Remove, puis Save.)

Fermez l’application, et ouvrez le DjVu ayant les bookmarks fraîchement édités avec DjvuViewer pour observer le résultat. J’ai constaté qu’au-delà de 100 bookmarks inclus dans un bookmark-parent direct, DjvuViewer ne parvient pas à ouvrir le fichier DjVu et génère une erreur. Evitez d’inclure plus d’une cinquantaine de bookmark-fils directs. Par contre l’inclusion de plus de 100 bookmarks étalés sur plusieurs niveaux ne pose aucun problème.

8) Quelques précisions sur la commande djvused.exe

Après avoir copier/coller djvused.exe dans C:\Windows\System32, tapez djvused dans l’invite de commande, lisez l’exemple donné à la fin :

l’invite de commande, lisez l’exemple donné à la fin : L’exemple donné, pour extraire LE TEXTE

L’exemple donné, pour extraire LE TEXTE d’OCR + les annotations dans un seul fichier est : djvused file.djvu –e output-all > file.dsed

Vous pouvez également n’extraire que les annotations :

djvused file.djvu –e output-ant > file.txt

Et ensuite éditer certains details du fichier d’annotations (mais ça contient toutes les coordonnées des rectangles du fichier, donc assez indigeste) et réinsérer le fichier .txt par : djvused file.djvu –f file.txt -s

Pour extraire simplement le texte océrisé ‘hidden text’ :

djvused file.djvu –e output-txt > file.txt puis le réinsérer après l’avoir édité par : djvused file.djvu –f file.txt –s (attention les 2 fichiers file.txt n’ont aucun rapport, l’un est pour le texte océrisé, l’autre pour les annotations, changez le nom pour les distinguer).

Les fichiers file.djvu et file.txt doivent se trouvent dans le même dossier pour être traités en ligne de commandes, si l’adresse complète des fichiers n’est pas spécifiée.

En tapant simplement la commande djvused, on peut lire la description des différentes commandes, comme le montre l’exemple ci-dessous : on constate que l’on peut effectuer la plupart des opération de DjvuOCR (normal, car ce programme utilise djvused.exe à la base !) : par exemple enlever le « hidden text » (texte océrisé), les annotations, etc…

(voir écran ci-dessous).

Remarque : pour voir le nom d’une (des) pages composant un fichier DjVU, allez sur la page, clic droit/Page Information… ou Document Information : vous retrouver alors les numéros des pages .djvu composant le fichier global DjVu (dit « bundle »).

Options de la commande djvused

Options de la commande djvused

9) Utilisation de Thumbsplus

Thumbsplus est une programme de traitement d’images par lot. Ça peut être très utile pour effectuer des opérations successives sur un ensemble d’images. Photoshop CS fait déjà des choses similaires, mais ce petit programme a parfois quelques fonctionnalités très intéressante et plus rapides à mettre en œuvre pour le batch.

Voyons quelques exemples.

a) Aperçu sous forme de vignettes, classement des vignettes

a) Aperçu sous forme de vignettes, classement des vignettes Ouvrez Thumbsplus , cliquez sur l’icône Location

Ouvrez Thumbsplus, cliquez sur l’icône Location dans la fenêtre principale, et aller dans le dossier des pages scannées. Vous pouvez classer (sort) les vignettes de multiples manières : par nom, similarité, date, resolution, largeur, hauteur, taille, type, etc… et même au hasard ! La similarité peut être d’un grand secours lors d’un oubli de numérotation, pour repérer rapidement les vignettes des pages par exemple pour un livre en couleur.

vignettes des pages par exemple pour un livre en couleur. La taille des vignettes peut également

La taille des vignettes peut également être choisie : large, small, custom, list, report

b) Batch Process sur un dossier ou des images sélectionnées

Le batch process est un traitement par lot. Voyons brièvement les opérations susceptibles d’être utilisées pour des pages scannées :

Ouvrez une image par double-clic.

pour des pages scannées : Ouvrez une image par double-clic. Une fenêtre s’ouvre avec un menu

Une fenêtre s’ouvre avec un menu : File, Edit, Image, Transform, View, Help.

Dans Transform, nous avons une multitude d’opérations, et surtout le Crop/Add borders. Cliquez dessus : la fenêtre ci-contre apparaît.

borders. Cliquez dessus : la fenêtre ci-contre apparaît. Cette fonction de Crop permet d’ enlever (rognage)

Cette fonction de Crop permet d’enlever (rognage) ou d’ajouter ou même de conserver une partie quantifiée en pixels (ou autre unité) de l’image.

- Pour rogner par exemple 223 pixels sur la gauche (=enlever 223 pixels à gauche) choisissez by, amount : 223, units : pixels, orientation : from left. puyez sur F12

- Pour ne conserver que 223 pixels de la partie gauche de l’image, choisissez to, les autres paramètre étant identiques.

- Cochez Add Border pour ajouter une bordure de couleur personnalisable.

Vous pouvez également rogner, etc… à partir de la droite, ou bien du centre de l’image (dans notre exemple de 223 pixels, à partir du centre : la moitié sera retirée à gauche env. 111 px, l’autre moitié à droite env.112 px)

La fonction Autocrop de Transform, enlève les pixels blancs tout autour de l’image : utile pour se débarrasser de marges blanches.

Enfin, dans Image/Process, la plupart des outils classiques de retouche d’image sont présents.

Pour lancer un traitement par lot (batch process), allez dans l’environnement principal de Thumbplus, dans Image/Batch Process (F12),

Donnez un nom au processus, cliquez sur Suivant, et ajoutez la séquence des opérations sur les images sélectionnées ou du dossier sélectionné.

Dans l’exemple ci-contre, les images subiront une amélioration d’ensemble (General Enhance), un crop de 223 pixels à gauche (Crop by 223 from left), et une balance des couleurs automatique (Auto Color Balance).

Cliquez sur Suivant, choisissez le format de sortie, éventuellement un suffixe et/ou préfixe, les autres paramètres, puis lancez le batch (Terminer).

les autres paramètres, puis lancez le batch ( Terminer ). FIN DU TUTORIEL DE CREATION D’UN

FIN DU TUTORIEL DE CREATION D’UN EBOOK DJVU

Voilà ! Ceci termine notre tutoriel. Vous avez désormais toutes les clés en main pour créer facilement un fichier DjVu interactif ! Il ne reste plus qu’à l’ouvrir avec DjVuViewer. Profitez de l’interactivité !

Amusez-vous bien !