Vous êtes sur la page 1sur 108

AVIS

JURIDIQUES

Copyright 2002 ScanSoft, Inc. Tous droits rservs. Le logiciel prsent dans ce manuel est fourni sous licence et son utilisation et sa copie sont soumises aux termes de la licence. R E M A RQ U E
IMPORTANTE

ScanSoft, Inc. fournit cette publication en l'tat , sans garantie daucune sorte, expresse ou implicite, y compris, mais de manire non limitative, toute garantie implicite de qualit commerciale ou dadquation un usage particulier. Certaines juridictions ne reconnaissant pas les limitations de garantie expresse ou implicite dans certaines transactions, cette clause peut ne pas sappliquer votre cas. ScanSoft se rserve le droit de rviser et/ou modifier cette publication priodiquement sans obligation de notification de telles rvisions ou modifications. MARQUES
COMMERCIALES

ScanSoft, OmniPage, OmniPage SE, OmniPage Pro, PaperPort, Pagis, True Page et Direct OCR sont des marques dposes ou des marques commerciales de ScanSoft, Inc. enregistres aux tats-Unis et/ou dans d'autres pays. Tous les autres noms de socit ou de produit cits peuvent tre des marques de leurs propritaires respectifs.

ScanSoft, Inc.
9 Centennial Drive Peabody, MA 01960 tats-Unis

ScanSoft Belgium BVBA


Guldensporenpark 32 BE-9820 Merelbeke Belgique

Numro de rfrence : 58-281201-01A

A B L E

D E S

M A T I R E S

PRSENTATION GNRALE
Utilisation de ce manuel Consultation de laide en ligne Aide HTML en ligne Aide contextuelle Notes techniques Glossaire OmniPage SE

7
8 9 9 9 10 10 10

INSTALLATION ET CONFIGURATION
Environnement requis Installation de OmniPage SE Configuration dun scanner pour utilisation avec OmniPage SE Lancement de OmniPage SE Enregistrement de OmniPage SE Nouvelles fonctions dOmniPage Pro 12 OmniPage SE et OmniPage Pro 12

11
12 13 14 16 17 17 19

INTRODUCTION
Reconnaissance optique de caractres (OCR) Technologie OCR dOmniPage SE Documents dans OmniPage SE Principales tapes de lOCR Bureau OmniPage Barre des menus

21
22 22 23 23 24 25 OmniPage SE Manuel dutilisation iii

Barres doutils Fentre d'image diteur de texte Bote outils OmniPage Gestion de documents Vignettes Gestionnaire de documents Personnaliser des colonnes dans le gestionnaire de documents Supprimer des pages dun document Imprimer un document Fermer un document Documents OmniPage Avantages du format OPD Enregistrer au format OPD Rglages

25 26 26 27 28 28 29 30 30 31 31 31 32 32 33

TRAITEMENT DES DOCUMENTS


Guide de dmarrage rapide Charger et reconnatre les exemples de fichiers image Numriser et reconnatre un document d'une page Prsentation du traitement Traitement automatique Arrter et relancer le traitement automatique Traitement manuel Traitement combin Traitement l'aide de l'Assistant OCR Traitement partir dautres applications Configuration de Direct OCR

35
36 36 36 38 40 41 42 43 45 46 47

iv

Table des matires

Utilisation de Direct OCR Utilisation de OmniPage SE avec PaperPort Traitement de documents avec Planifier OCR Dfinition de la source des images de page Importer des fichiers image Numriser avec un chargeur ADF Numriser sans chargeur ADF Dfinition de la mise en page du document Zones et fonds Dcoupage en zones automatique Traage de zones manuel Types et proprits de zone Gestion des zones Gestion des grilles du tableau dans limage Utilisation des gabarits de zone

47 48 49 50 50 53 53 54 55 56 56 58 60 62 64

Importer des documents partir dun scanner 51

VRIFICATION ET DITION
Modes daffichage de lditeur de texte Vrification des rsultats de lOCR Vrification du texte reconnu Dictionnaires utilisateur Apprentissage Apprentissage manuel IntelliTrain Fichiers dapprentissage dition du texte et des images dition en direct Lecture du texte voix haute

67
68 69 70 72 73 74 74 75 77 79 80

OmniPage SE Manuel dutilisation

ENREGISTREMENT ET EXPORTATION
Enregistrement des images originales Enregistrement des rsultats de lOCR Enregistrement dun document lors dune session de travail Slection dun niveau de formatage

83
84 85 86 87

Slection des options d'enregistrement volues 88 Enregistrement dun document au format PDF 90 Copie des pages dans le Presse-papiers Ajout de pages un e-mail comme pice jointe 90 91

INFORMATIONS TECHNIQUES
Dpannage Solutions de premier recours Test de OmniPage SE Augmentation de la quantit de mmoire disponible Augmentation de l'espace disque Reconnaissance de texte incorrecte Reconnaissance de fax incorrecte Problmes de systme ou de performances pendant lOCR Support ODMA Fonctions volues du module Planifier OCR Types de fichier supports Types de fichier pour louverture et lenregistrement des images Types de fichier pour lenregistrement des rsultats de lOCR Dsinstallation du logiciel

93
94 94 95 96 96 97 98 98 99 99 100 100 102 103

vi

Table des matires

Prsentation gnrale
Nous vous remercions de la confiance que vous portez OmniPage SE. La documentation cite ci-dessous est destine vous prsenter le programme et faciliter son utilisation. Manuel de rfrence Le prsent manuel fournit des informations relatives aux principes d'utilisation d'OmniPage SE (Special Edition) : procdures dinstallation et de configuration, description des commandes et zones de travail disponibles, instructions de ralisation de diffrentes tches, mthodes de personnalisation et de gestion de traitement et diverses informations techniques. Ce manuel est propos au format PDF ; vous pouvez ainsi utiliser les outils de navigation de votre afficheur PDF et les liens hypertexte intgrs pour passer aux diffrentes sections du document. Aide en ligne Laide en ligne dOmniPage SE contient des informations sur les fonctions, les rglages et les procdures relatives au logiciel. Au format HTML, cette aide a t conue pour garantir une consultation aise et rapide. Son module daide contextuelle trs complet assure une assistance suffisante pour vous permettre daccomplir sans dlai les oprations requises. Voir Consultation de laide en ligne , page 9. Fichier ReadMe/LisezMoi Ce fichier au format HTML comporte les informations de dernire minute concernant le logiciel. Il est vivement recommand de le consulter avant dutiliser OmniPage SE. Pour ouvrir le fichier ReadMe/LisezMoi, vous pouvez, lors de linstallation dOmniPage SE, slectionner loption ReadMe/LisezMoi, ou, tout moment, choisir la commande correspondante dans le menu Aide. Informations de numrisation et renseignements divers Le site Web de ScanSoft (www.scansoft.com) fournit des informations actualises au sujet du programme. La section Scanner Guide contient des donnes rgulirement mises jour et relatives aux scanners supports et d'autres questions y affrentes ; ScanSoft effectue des tests sur les 25 modles les plus rpandus. Pour accder au site Web de ScanSoft, vous pouvez, lors de linstallation dOmniPage SE, slectionner loption daccs au site Web, ou, tout moment choisir la commande correspondante dans le menu Aide.

OmniPage SE Manuel dutilisation

Utilisation de ce manuel
Ce manuel prsuppose que vous matrisez les principes de travail dans lenvironnement Microsoft Windows. Pour tous dtails sur cet environnement (utilisation des botes de dialogue, des menus droulants et contextuels, des barres de dfilement, de la fonction Glisser-dplacer, etc.), reportez-vous la documentation Windows approprie. Vous devriez galement connatre le fonctionnement de votre scanner et de son logiciel. Avant de procder la configuration du scanner avec OmniPage SE, assurez-vous quil est install et quil fonctionne correctement. Reportez-vous, si ncessaire, la documentation du scanner. Ce manuel utilise les conventions suivantes : Texte en gras Texte en italiques
Police sans empattement

Introduit les nouveaux termes et signale les titres des diffrentes sections de chaque chapitre. Indique le nom des rubriques de l'aide en ligne. Indique le texte dvelopp des options dans les botes de dialogue. Indique les noms de fichier, tels que exemple.tif Prsente une remarque qui introduit des informations supplmentaires. Prsente un conseil qui introduit des suggestions sur laccomplissement de tches spcifiques laide des fonctions du logiciel. L'icne SE, place en marge de certaines sections, vous permet d'identifier rapidement les diffrences entre OmniPage SE et OmniPage Pro 12. Voir OmniPage SE , page 10.

Prsentation gnrale

Consultation de laide en ligne


Laide en ligne dOmniPage SE contient des informations sur les fonctions, les rglages et les procdures relatives au programme. Le systme daide devient disponible ds linstallation du logiciel.

Aide HTML en ligne


Pour accder laide en ligne dOmniPage SE, choisissez la commande Aide OmniPage SE dans le menu daide. Vous pourrez obtenir les informations requises en consultant des rubriques de la table des matires, en slectionnant des mots-cls dans lindex alphabtique ou en effectuant des recherches sur lintgralit du texte daide. Les autres commandes du menu Aide vous permettront daccder de nombreux sujets ou pages Web utiles. Lors de lutilisation dOmniPage SE, vous pouvez consulter la rubrique daide relative la bote de dialogue, la zone dcran ou le message affich en appuyant sur la touche F1.

Aide contextuelle
Pour afficher des informations succinctes sur un lment dinterface dOmniPage SE (commande de menu, bouton de barre doutils, groupe doptions, bote de dialogue, etc.), vous pouvez procder des manires suivantes : Pour afficher la rubrique daide relative un lment du bureau en dehors dune bote de dialogue ou dune fentre de message, cliquez sur le bouton daide dans la barre doutils standard afin dafficher licne daide (flche accompagne dun point dinterrogation), puis cliquez sur cette icne et sur llment requis. Vous pouvez galement afficher cette icne via la squence Maj. + F1. Cette combinaison affiche l'aide relative aux commandes des menus contextuels. Pour afficher une mini-fentre dcrivant un lment de bote de dialogue, cliquez sur le point dinterrogation situ dans langle suprieur droit de la bote en question puis sur llment requis. Certaines botes de dialogue ou fentres de message comportent un bouton Aide (icne ou libell). Pour accder aux informations sur leurs lments, cliquez sur ce bouton. Pour supprimer une fentre daide contextuelle, cliquez nimporte o sur le bureau.

OmniPage SE Manuel dutilisation

Notes techniques
Le site Web de ScanSoft (www.scansoft.com) propose des notes techniques (Tech Notes) concernant les problmes les plus courants concernant l'utilisation dOmniPage. Ces pages Web peuvent galement inclure des conseils sur l'installation et le dpannage du logiciel.

Glossaire
Ce manuel ne comporte pas de glossaire. En revanche, l'aide en ligne inclut un glossaire exhaustif, assorti d'un index alphabtique et d'une table des matires. Consultez-le pour trouver la dfinition d'un terme utilis dans ce manuel ou dans le programme.

OmniPage SE
La version dOmniPage dont vous disposez est une version spciale de lapplication OmniPage Pro. Cette version a spcialement t conue pour certains fabricants de scanners et ne comprend pas lensemble des fonctionnalits dOmniPage Pro 12. Ce guide ainsi que laide en ligne offrent une description de lensemble des fonctionnalits du produit. Licne SE, place en marge de certaines sections, vous permet didentifier rapidement les diffrences entre chacune des versions. Si vous tes intress par les fonctionnalits supplmentaires offertes par la version professionnelle du produit, consultez notre site Web pour effectuer une mise niveau vers OmniPage Pro 12.Voir OmniPage SE et OmniPage Pro 12 , page 19.

10

Prsentation gnrale

Chapitre 1

Installation et configuration
Ce chapitre contient les informations ncessaires l'installation et au lancement d'OmniPage SE, soit les sections suivantes :
x x x x x x x

Environnement requis Installation de OmniPage SE Configuration dun scanner pour utilisation avec OmniPage SE Lancement de OmniPage SE Enregistrement de OmniPage SE Nouvelles fonctions dOmniPage Pro 12 OmniPage SE et OmniPage Pro 12

OmniPage SE Manuel dutilisation

11

Environnement requis
Pour installer et utiliser OmniPage SE 2.0, vous devez prvoir lenvironnement minimum suivant :
x x

Processeur Pentium ou suprieur Microsoft Windows 98 ( partir de la Deuxime dition), Windows Me, Windows NT 4.0 (avec au moins Service Pack 6), Windows 2000 ou Windows XP 64 Mo de mmoire RAM (128 Mo recommands) 90 Mo despace disque disponible destin aux fichiers dapplication, plus 5 Mo despace disponible lors de linstallation 5 Mo pour Microsoft Installer (MSI) si absent de votre systme (ce module est inclus dans le systme d'exploitation Windows Me, Windows 2000 et Windows XP) Affichage SVGA avec 256 couleurs. Couleur 16 bits et rsolution de 800 x 600 pixels recommandes [65536 couleurs dans Windows 2000 et Moyenne (16 bits) dans XP]. Souris (ou quivalent) compatible Windows Lecteur de CD-ROM (pour linstallation) Scanner compatible avec le pilote appropri (si vous prvoyez de numriser des documents). Pour consulter la liste des scanners supports, reportez-vous au guide des scanners (Scanner Guide) sur le site Web de ScanSoft (www.scansoft.com).
Vous obtiendrez de meilleures performances avec un processeur plus puissant, et des valeurs suprieures de RAM et despace disque.

x x x

x x x

12

Installation et configuration

Chapitre 1

Installation de OmniPage SE
Pour vous guider dans linstallation, OmniPage SE affiche des instructions sur chaque cran. Avant de lancer linstallation dOmniPage SE, respectez les points suivants :
x x

Fermez les applications actives, en particulier les logiciels antivirus. Si vous installez OmniPage SE sur un systme Windows NT, Windows 2000 ou Windows XP, ouvrez une session avec privilges dadministrateur. Si une version antrieure d'OCR de ScanSoft est dj installe sur votre ordinateur, le programme d'installation vous demandera l'autorisation de dsinstaller le logiciel existant.

w Pour installer OmniPage SE :

1. Insrez le CD-ROM OmniPage SE dans le lecteur appropri. En principe, le programme dinstallation dmarre automatiquement. Si ce nest pas le cas, ouvrez lExplorateur Windows, cliquez sur licne du lecteur de CD-ROM, puis cliquez deux fois sur le fichier de programme Autorun.exe. 2. Choisissez la langue dinstallation souhaite. Ce choix dtermine galement la version du module Texte-parole et la langue de l'interface du programme. L'interface du programme affiche dans la langue choisie des lments tels que les commandes de menu, les botes de dialogue, les fentres de message, etc. Vous pouvez modifier la langue dinterface ultrieurement, via les options du logiciel, mais la slection effectue lors de linstallation dtermine la version du module Texte-parole installe. Veuillez noter que le module Texte-parole n'est pas disponible dans OmniPage SE. 3. Pour installer le logiciel, suivez les instructions affiches sur les crans successifs. Tous les fichiers ncessaires la numrisation sont copis automatiquement lors de linstallation.
Certains problmes peuvent tre rsolus en dsinstallant puis en rinstallant OmniPage SE. Voir Dsinstallation du logiciel , page 103. Dans OmniPage Pro 12, le module Texte-parole est disponible en franais, anglais (britannique et amricain), allemand, italien, portugais et espagnol. Ce module n'est pas disponible dans OmniPage SE. Voir Lecture du texte voix haute , page 80.

Installation de OmniPage SE

13

Configuration dun scanner pour utilisation avec OmniPage SE


Tous les fichiers ncessaires la configuration et au support du scanner sont copis automatiquement lors de linstallation du programme. Avant de numriser des documents laide dOmniPage SE, vous devrez vrifier que votre scanner est install correctement, avec le pilote appropri, et tester son fonctionnement. Les pilotes du scanner ne sont pas fournis avec OmniPage SE. Linstallation et la configuration du scanner seffectuent via lAssistant du scanner, que vous pouvez lancer vous-mme, en appliquant les procdures dcrites. Sinon, l'Assistant du scanner apparat la premire fois que vous tentez une numrisation. Pour configurer votre scanner avec OmniPage SE laide de l'Assistant du scanner, suivez les tapes suivantes :
x

Choisissez Dmarrer Programmes ScanSoft OmniPage SE 2.0 Assistant du scanner. ou cliquez sur le bouton Configuration dans longlet Scanner de la bote de dialogue Options. ou choisissez un paramtre de numrisation dans la zone de liste droulante Importer une page de la bote outils et cliquez sur le bouton Importer une page. L'Assistant du scanner dmarre. La premire fentre s'affiche uniquement lors de la configuration initiale, partir d'OmniPage SE.

Choisissez Slectionner un scanner ou un appareil photo numrique, puis cliquez sur Suivant. La liste de tous les pilotes de scanner TWAIN dtects s'affiche ; le scanner par dfaut du systme est slectionn. Cliquez une fois pour slectionner le pilote de scanner voulu. Si vous devez rechercher un pilote, cliquez sur Autres pilotes. Si vous voulez masquer l'interface de votre scanner au cours de la numrisation ou modifier la mthode de transfert des images, slectionnez Configurer les paramtres volus pour ouvrir une fentre supplmentaire. Cliquez sur Suivant. Choisissez Oui pour tester la configuration de votre scanner, puis cliquez sur Suivant. L'Assistant vrifie la connexion de l'ordinateur au scanner. l'issue de lopration, cliquez sur Suivant.

14

Installation et configuration

Chapitre 1
x

Insrez une page de test dans le scanner. L'Assistant est prt effectuer une numrisation de base au moyen du logiciel fourni par le fabricant du scanner. Cliquez sur Suivant. L'interface utilisateur native de votre scanner s'affiche. Cliquez sur Numriser pour lancer la numrisation de la page de test. Si ncessaire, cliquez sur Image inverse ou Image manquante et effectuez les slections appropries. Si l'image affiche dans la fentre est correcte, cliquez sur Suivant. Slectionnez l'lment qui dcrit le mieux votre scanner, puis cliquez sur Suivant. Cliquez sur Suivant pour passer la slection de la taille de page. Les tailles de page que l'Assistant du scanner attribue votre scanner sont indiques dans la fentre. Pour modifier les tailles de page, cliquez sur volu, effectuez les changements voulus et cliquez sur Suivant. Insrez dans le scanner une page contenant du texte, mais pas d'image. Cliquez sur Suivant pour lancer une numrisation en noir et blanc. Si ncessaire, cliquez sur Image inverse ou Image manquante et effectuez les slections appropries. Si l'image affiche dans la fentre est correcte, cliquez sur Suivant. Si vous disposez d'un scanner couleur, insrez une photographie couleur ou une page comportant une image couleur. Cliquez sur Suivant pour lancer une numrisation en couleur. Si ncessaire, cliquez sur Image inverse ou Image manquante et effectuez les slections appropries. Si l'image affiche dans la fentre est correcte, cliquez sur Suivant. Si votre scanner ne gre pas la couleur, ignorez cette tape. Insrez dans le scanner une photographie ou une page contenant une image. Cliquez sur Suivant pour lancer une numrisation en niveaux de gris. Si ncessaire, cliquez sur Image inverse ou Image manquante et effectuez les slections appropries. Si l'image affiche dans la fentre est correcte, cliquez sur Suivant. Vous venez de configurer votre scanner pour utilisation avec OmniPage SE. Cliquez sur Terminer.

x x x x x x

x x x x

Pour modifier les rglages du scanner par la suite ou pour configurer un autre scanner, ouvrez de nouveau l'Assistant de configuration du scanner depuis le menu Dmarrer de Windows ou depuis longlet Scanner de la bote de dialogue Options. Pour tester et dpanner un scanner ne fonctionnant pas correctement, ouvrez l'Assistant du scanner depuis le menu Dmarrer de Windows et

Configuration dun scanner pour utilisation avec OmniPage SE

15

slectionnez Tester scanner/appareil photo numrique dans la premire fentre, puis appliquez la procdure dcrite ci-dessus.

Lancement de OmniPage SE
Pour lancer OmniPage SE, effectuez l'une des oprations suivantes :
x x

Dans la barre des tches Windows, cliquez sur Dmarrer et choisissez Programmes ScanSoft OmniPage SE 2.0 OmniPage SE 2.0. Cliquez deux fois sur licne OmniPage SE situe dans le dossier dinstallation dOmniPage SE ou sur le bureau Windows (si vous ly avez place). Cliquez deux fois sur licne ou le nom de fichier dun document OmniPage (OPD) pour le charger. Voir Documents OmniPage , page 31.

Lorsque vous ouvrez lapplication, lcran daccueil puis le bureau OmniPage SE saffichent. Voir Bureau OmniPage , page 24. Cette section prsente les principales zones de travail du programme. Vous pouvez galement excuter le programme avec une interface limite :
x

Ouvrez le programme Planifier OCR. Dans la barre des tches Windows, cliquez sur Dmarrer et choisissez Programmes ScanSoft OmniPage Pro 12.0 Planifier OCR. Voir Traitement de documents avec Planifier OCR , page 49. Cette fonction n'est pas disponible dans OmniPage SE. Dans une application dclare dans Direct OCR, choisissez Acqurir texte dans le menu Fichier. Voir Configuration de Direct OCR , page 47. Cliquez avec le bouton droit sur une icne ou un nom de fichier image pour afficher son menu contextuel. Choisissez la sous-option requise de la commande Convertir en pour dfinir une cible. Pour ajouter des services dOCR, utilisez OmniPage SE avec les produits de gestion de documents de ScanSoft, PaperPort ou Pagis. Voir Utilisation de OmniPage SE avec PaperPort , page 48.

16

Installation et configuration

Chapitre 1

Enregistrement de OmniPage SE
LAssistant denregistrement ScanSoft est lanc lissue de linstallation du programme. Lenregistrement seffectue via un formulaire lectronique facile remplir (moins de cinq minutes). Lorsque vous avez termin de remplir le formulaire et que vous cliquez sur Envoyer, le programme tente de se connecter Internet pour accomplir lenregistrement. Si vous nenregistrez pas votre copie du logiciel pendant son installation, le programme vous invitera intervalles rguliers accomplir cette formalit. Vous pouvez visiter le site Web (www.scansoft.com) pour vous enregistrer en ligne. Cliquez sur Support, puis dans l'cran de support principal, choisissez Enregistrer dans la colonne de gauche. Pour plus de dtails sur l'utilisation de vos donnes d'enregistrement, reportez-vous la clause relative la confidentialit de la politique de ScanSoft.

Nouvelles fonctions dOmniPage Pro 12


La famille de produits OmniPage compte dsormais OmniPage Pro 12 et OmniPage SE. Cette section prsente les amliorations apportes OmniPage Pro 12. Comme l'indique la section suivante, certaines de ces fonctionnalits sont galement comprises dans OmniPage SE. Nouvelles fonctionnalits de OmniPage Pro 12 par rapport OmniPage Pro 11:
x

Importante augmentation de la prcision De nouveaux niveaux de prcision avec l'amlioration de la synergie entre les moteurs de reconnaissance, le support des dictionnaires professionnels et l'apprentissage possible des caractres choisis par l'utilisateur. Rationalisation de linterface Vous pouvez effectuer le traitement automatique et manuel directement partir de la bote outils OmniPage, sans avoir recours des barres d'outils spares (voir la page 27). Les vignettes apparaissent dornavant dans la fentre d'image ; vous pouvez choisir d'afficher la page courante, la page des vignettes ou les deux (voir page 28). La vue Dtails de la version prcdente a t remplace par le gestionnaire de documents, qui inclut une colonne de remarques pour les commentaires et les mots-cls explorables. Nouveaux concepts de zones La fonction de dcoupage en zones en direct permet de modifier des zones la vole , sans devoir relancer la reconnaissance de la page

Enregistrement de OmniPage SE

17

entire (voir page 79). Le fond des pages est affect du type Traiter (dcoupage en zones automatique) ou Ignorer ; par consquent lintgralit des instructions de dcoupage en zones apparat sur la page et vous pouvez enregistrer celles-ci dans des gabarits de zone (voir page 55). Les procdures suivre pour tracer des zones irrgulires, ainsi que diviser et joindre des zones, ont t simplifies et elles n'exigent aucun outil spar (voir page 60).
x

Amlioration de la vrification La bote de dialogue Vrification de lOCR affiche maintenant les mots douteux dans un contexte tendu. Un vrificateur dynamique peut rester ouvert pendant la vrification du texte, tandis que l'affichage et la fentre d'image suivent le contexte d'dition (voir page 69). Niveaux de formatage pour laffichage et lenregistrement L'affichage dans l'diteur de texte accepte trois niveaux de formatage (voir page 68). Le niveau de formatage de sortie est dsormais slectionn au moment de l'exportation ; les slections possibles dpendent du type de fichier spcifi. Loption d'exportation Pages en continu est une version amliore de la vue Conserver l'enchanement des colonnes de la version prcdente. Elle conserve la mise en page, si possible sans cadres et blocs de texte, pour la disposition du texte entre les colonnes (voir page 87). Meilleure analyse des pages Le transfert du formatage des tableaux a t amlior, en particulier la dtection des tableaux dpourvus de traits de grille dans les pages originales. Les adresses Web et e-mail peuvent tre dtectes et transfres vers l'diteur de texte ; vous pouvez galement insrer des hyperliens. L'ordre de lecture peut maintenant tre affich et modifi aprs reconnaissance dans la vue True Page de l'diteur de texte. Voir partir de page 77. Meilleur traitement PDF OmniPage Pro 12 recherche le texte de fond dans les PDF qu'il ouvre, afin de garantir une prcision de reconnaissance suprieure. Un nouveau type de fichier, PDF dit, assure une bonne conservation du format sur les pages modifies dans l'diteur de texte l'issue de la reconnaissance. Options d'enregistrement volues La gamme des options de sauvegarde a t enrichie pour chaque type de fichier de sortie. Les types de fichier de sortie dfinis par l'utilisateur peuvent tre crs sur la base de rglages personnaliss (voir page 88). Si votre version dOmniPage Pro 12 inclut les nouveaux formats d'enregistrement XML et eBook, voir page 102.

18

Installation et configuration

Chapitre 1

OmniPage SE et OmniPage Pro 12


La liste suivante rpertorie les fonctionnalits de la version professionnelle d'OmniPage Pro 12 qui n'ont pas t ajoutes OmniPage SE :
x x x x x x x x x x x x

Meilleur niveau de reconnaissance. Accs au module d'apprentissage, IntelliTrain et aux fichiers d'apprentissage pour la reconnaissance de caractres. Capacit d'ouverture et de lecture du contenu de fichiers PDF. Capacit d'enregistrement des fichiers reconnus au format PDF. Numrisation en vis--vis pour numriser les livres en un clin d'il. Des fonctionnalits de formatage des pages en continu permettant une conservation parfaite de la mise en page. Planifiez l'OCR pour que vos travaux soient traits de faon automatique et selon un horaire dfini. Gestion des formats d'image TIFF LZW et GIF en entre et sortie. Exportation aux formats eBook et XML. Prise en charge de la sortie WYSIWYG HTML 4.0. Nombre de langues reconnues passant de 50 plus de 100. Accs des dictionnaires juridiques et mdicaux dans certaines langues. Accs au module Texte-parole RealSpeak, permettant la lecture voix haute des textes reconnus.

Pour obtenir une mise niveau, consultez le site www.scansoft.com.

OmniPage SE et OmniPage Pro 12

19

20

Installation et configuration

Chapitre 2

Introduction
De nos jours, la plupart des activits professionnelles (correspondance, cration de rapports, gestion des donnes, etc.) font appel un ordinateur et pourtant, certaines sources dinformation circulent toujours sous la forme imprime et ne sont pas directement exploitables par la machine. Ainsi, si vous voulez insrer un article de magazine au format papier dans un rapport en cours de cration sur ordinateur, vous devez trouver un moyen de le faire, en vitant la saisie manuelle, source d'erreur et synonyme de perte de temps. OmniPage SE vous propose une solution sre : la reconnaissance optique de caractres (OCR). Ce chapitre dcrit lemploi de la technologie OCR par OmniPage SE dans le but de transformer les informations contenues dans vos documents numriss ou fichiers image en donnes lectroniques ditables par vos applications habituelles. Ce chapitre propose les sections suivantes :
x

Reconnaissance optique de caractres (OCR) Documents dans OmniPage SE Principales tapes de lOCR

x x x x

Bureau OmniPage Gestion de documents Documents OmniPage Rglages

OmniPage SE Manuel dutilisation

21

Reconnaissance optique de caractres (OCR)


La reconnaissance optique de caractres (OCR) est une opration qui consiste extraire du texte dune image obtenue par numrisation dun document papier ou par ouverture dun fichier image lectronique. Le texte dune image nest pas directement utilisable car ses caractres se composent de groupes de points (pixels). Pendant la reconnaissance, OmniPage SE analyse limage propose, identifie les caractres quelle contient et dfinit les solutions permettant de les transformer en texte ditable. lissue de la reconnaissance, le texte peut tre enregistr dans la plupart des applications (logiciels de traitement de texte ou de PAO, tableurs, etc.).

Technologie OCR dOmniPage SE


Outre le texte, OmniPage SE peut reconnatre les lments et caractristiques suivants du document : lments graphiques Photos, logos, illustrations, etc. Formatage du texte Format des caractres, tel que type (Arial, Times New Roman...), corps (8, 12) et style (gras, italique, soulign) d'une police. Format des paragraphes, tel que retraits, tabulations, marges et interlignes. Mise en page Agencement des colonnes, agencement des tableaux, emplacement des lments graphiques et des en-ttes. Les lments et caractristiques conservs par OmniPage SE dpendent des rglages slectionns pour chaque document. Pour plus de dtails sur le choix des rglages, consultez la rubrique Conseils de rglages de laide en ligne OmniPage SE.
OmniPage SE reconnat uniquement les caractres imprims, tels que les sorties imprimante ou le texte tap la machine. Vous pouvez toutefois lui demander de conserver un bloc de texte manuscrit (une signature, par exemple) en affectant celui-ci du type de zone Graphique.

22

Introduction

Chapitre 2

Documents dans OmniPage SE


OmniPage SE gre les documents de faon individuelle. Lorsque vous importez la premire image ( partir dun scanner ou dun fichier), le programme cre un document. Toutes les images importes par la suite sont ajoutes ce document, jusqu son enregistrement et sa fermeture. Dans OmniPage SE, un document comporte une ou plusieurs pages, chacune delles constitue par une image importe. Aprs la reconnaissance, le document comportera galement le texte reconnu correspondant ses images (affichable via lditeur de texte) et des graphiques ou des tableaux ventuels. Voir Bureau OmniPage , page 24.

Principales tapes de lOCR


OmniPage SE propose deux modes de traitement des documents : automatique et manuel. Voir Traitement automatique , page 40 et Traitement manuel , page 42. Les deux modes impliquent globalement les mmes tapes principales : 1. Importer des images de document dans OmniPage SE Vous pouvez numriser un document papier (avec ou sans le chargeur de feuilles automatique [ADF]) ou charger un ou plusieurs fichiers image. Les images importes apparaissent sous la forme de vignettes dans la fentre d'image ; l'image de la premire page est affiche. Les informations relatives aux pages concernes s'affichent dans le gestionnaire de documents. Voir Dfinition de la source des images de page , page 50. 2. Excuter lOCR pour obtenir du texte ditable Pendant la reconnaissance, OmniPage SE trace des zones autour des parties de limage traiter, puis interprte le contenu textuel et graphique de chaque zone. Vous pouvez galement crer des zones manuellement ou en appliquant un gabarit de zones prdfini. lissue de la reconnaissance, vous pouvez dtecter et corriger les erreurs ventuelles laide du module de vrification de lOCR et diter le document dans lditeur de texte. 3. Exporter le document vers la destination de votre choix Une fois le document reconnu, vous pouvez lenregistrer dans un fichier (en spcifiant le nom et le type voulus), le copier dans le Presse-papiers ou lenvoyer comme pice jointe dun e-mail. Vous pouvez galement lenregistrer au format de document OmniPage (OPD) selon la procdure dcrite ci-aprs. Un mme document peut tre enregistr plusieurs fois avec diffrents rglages demplacement, de type de fichier, de formatage, etc., selon vos besoins. Voir Enregistrement et exportation , page 83.

Reconnaissance optique de caractres (OCR)

23

Bureau OmniPage
Le bureau OmniPage dispose dune barre de titre et de menus dans sa partie suprieure et dune barre dtat dans sa partie infrieure. Il est compos de trois espaces de travail ou fentres : gestionnaire de documents, fentre d'image et diteur de texte. Dans leur partie suprieure, ces trois espaces de travail comprennent les boutons de fermeture, d'agrandissement et de rduction de la fentre. La Fentre d'image est munie de la barre doutils Image et la fentre diteur de texte de la barre doutils Formatage.

Barre doutils Standard Bote outils OmniPage Longlet Vignettes contient des images rduites de toutes les pages du document. La page actuelle prsente une icne en forme d' il . Ce symbole marque une page reconnue. Barre doutils Image Barre doutils Formatage

Boutons pour explorer le document Boutons permettant d'afficher ou de masquer le gestionnaire de documents, l'diteur de texte et laffichage des vignettes et de la page actuelle pour la fentre d'image. Vous pouvez galement effectuer ces oprations depuis le menu Affichage. Faites glisser ces barres de fractionnement pour redimensionner les zones de travail. Fentre d'image : Cette fentre affiche l'image de la page actuelle et indique les zones traces. La fentre d'image peut afficher la page actuelle, la page des vignettes ou les deux. Boutons de lditeur de texte offrant trois niveaux de formatage. diteur de texte : Affiche le rsultat de la reconnaissance de la page actuelle en mode True Page.

24

Introduction

Chapitre 2
Lexemple utilis sappuie sur un document de trois pages. La page 1 reprsente la page actuelle, reconnue et vrifie ; la page 2 a t reconnue mais non vrifie ; la page 3 a t importe et divise manuellement en zones, mais na pas t reconnue. Licne figurant dans la partie infrieure de chaque vignette indique ltat de la page correspondante. Les boutons de la barre dtat vous permettent dafficher et de masquer les fentres du bureau OmniPage SE, et de passer dautres pages du document. Un clic avec le bouton droit dans une fentre affiche son menu contextuel avec les commandes les plus utiles pour cette fentre.

Barre des menus


Pour obtenir des informations succinctes sur une commande de menu, cliquez sur le bouton daide contextuelle puis sur la commande concerne. La fentre qui apparat explique la fonction de la commande. Pour fermer cette fentre, cliquez nimporte o sur lcran.

Barres doutils
Le programme propose trois barres d'outils principales, qui peuvent toutes tre flottantes, si besoin. Le menu Affichage permet de les afficher, de les masquer et de les personnaliser. L'aide contextuelle explique l'action de chaque outil. Deux barres d'outils supplmentaires permettent de piloter des tches spcifiques.
Barre doutils Emplacement par dfaut
Horizontalement sous la barre de menus Verticalement gauche de la page d'image actuelle Horizontalement en haut de l'diteur de texte

Autres emplacements d'ancrage


Tout bord du bureau OmniPage Verticalement droite de la page d'image actuelle

Action
Excution des fonctions de base du programme. Voir page 31 et page 69.

Standard

Image

Oprations sur les images, les zones et les tableaux. Voir page 55 et page 62.

Formatage

Aucun

Formatage du texte reconnu dans l'diteur de texte. Voir page 77. Contrle de l'emplacement et de l'aspect du vrificateur. Voir page 70. Modification de l'ordre des lments dans les pages reconnues. Voir page 77.

Vrificateur

Placez le curseur sur la fentre du vrificateur pour afficher cette barre d'outils flottante. Cliquez sur loutil Changer lordre de lecture. Cette barre doutils remplace la barre doutils Formatage.

Ragencement

Bureau OmniPage

25

Fentre d'image
Lorsque cette fentre affiche l'image de page actuelle, la barre d'outils Image est disponible. Les images de page possdent toutes une valeur de fond : Traiter ou Ignorer. Les zones peuvent tre traces manuellement sur les images de page ou places automatiquement l'issue de la reconnaissance. Il existe cinq types de zones : Traiter, Ignorer, Texte, Tableau et Graphique. Les zones sont automatiquement traces pour les lments placs l'intrieur des zones Traiter et sur un fond Traiter en dehors d'autres zones, et leurs types de zones sont dtermins pendant le traitement. Voir Zones et fonds , page 55. Si l'image de page actuelle est masque, les vignettes apparaissent en ranges pour assurer une utilisation optimale de l'espace disponible.

diteur de texte
L'diteur de texte affiche les rsultats de la reconnaissance selon trois niveaux de formatage :
x x x

Aucun formatage Conserver le formatage polices/paragraphes True Page

Le mode True Page conserve la mise en page sur la base des cadres et des blocs de texte, de tableaux et d'images. True Page peut afficher des zones multicolonnes, afin de prsenter des blocs de texte pouvant tre assimils un enchanement de colonnes au moment de l'exportation. True Page correspond galement un niveau de formatage d'exportation, de mme que Pages en continu, qui conserve la mise en page sans blocs ni cadres. Voir Modes daffichage de lditeur de texte , page 68. OmniPage SE ne prend pas en charge la fonction de formatage des Pages en continu.

26

Introduction

Chapitre 2

Bote outils OmniPage


La bote outils dOmniPage SE vous permet de grer toutes les tapes du traitement. Elle est place par dfaut dans la partie suprieure du bureau OmniPage, au-dessus des fentres de travail, mais peut galement prendre la forme de fentre flottante ou tre ancre le long du bord infrieur du bureau.
Bouton Lancer Bouton Importer la page Bouton Excuter lOCR Bouton Exporter les rsultats

Liste droulante Importer la page

Liste droulante de description de la mise en page

Liste droulante Exporter les rsultats

Le traitement automatique est lanc, arrt et relanc laide du bouton Lancer (1-2-3). Voir Traitement automatique , page 40. Le traitement manuel permet de traiter les documents page par page et tape par tape. Vous pouvez dmarrer chacune des tapes avec le bouton correspondant : Importer la page (1), Excuter lOCR (2) et Exporter les rsultats (3). Voir Traitement manuel , page 42. Vous pouvez passer du mode automatique au mode manuel tout moment, la seule condition que le programme ne soit pas en train deffectuer une opration de traitement. Cette proprit signifie que vous pouvez modifier le mode slectionn entre les diffrentes tapes du traitement dun document. Par exemple, il est possible de traiter automatiquement certaines pages, puis insrer dans le document dautres pages traites manuellement. Selon le mme principe, vous pouvez appliquer le mode automatique une pile de pages, puis vrifier le rsultat obtenu et, si ncessaire, retraiter certaines pages manuellement. Cette procdure est dcrite au chapitre 3. Voir Traitement combin , page 43. L'Assistant OCR est conu pour les nouveaux utilisateurs. Voir Traitement l'aide de l'Assistant OCR , page 45. Si un document est ouvert lorsque vous lancez l'Assistant OCR, le programme vous invite l'enregistrer, puis le ferme. Si vous utilisez lAssistant OCR pour traiter et enregistrer un document, celui-ci est par la suite disponible pour des tapes de traitement supplmentaires (ajout de nouvelles pages, retraitement des pages, etc.) en mode automatique ou manuel.

Bureau OmniPage

27

Gestion de documents
La gestion de documents s'effectue partir des vignettes de la fentre d'image ou du gestionnaire de documents (partie infrieure du bureau OmniPage). Les deux fentres comportent des informations succinctes sur les pages du document trait et sont synchronises. Les illustrations utilises dans ce manuel prsentent ces deux fentres avec le mme document de sept pages. Les pages 1 et 2 sont slectionnes et la page 4 est la page actuelle (c.--d. la page affiche dans la fentre d'image). L'tat de la page est indiqu comme suit :
Page
1 2 3 4 5 6 7

tat
Importe Reconnue Reconnue, vrifie Modifie Modifie, vrifie En instance Enregistre

Icne

Oprations effectues sur la page


Page importe, mais pas encore reconnue. Page reconnue, non vrifie ou vrification interrompue. Page reconnue et entirement vrifie. Page reconnue, avec excution dans l'diteur de texte d'au moins une modification ou un changement de formatage. Page reconnue, modifie dans l'diteur de texte et entirement vrifie. Page importe et peut-tre reconnue, avec certains changements de type de zone stocks, mais pas traits. Page reconnue et enregistre au moins une fois.

Vignettes
Longlet Vignettes contient des images rduites de toutes les pages du document. Vu leur prsentation verticale, vous devrez peut-tre faire dfiler les vignettes pour atteindre llment requis. La page actuelle prsente une icne en forme d' il . Vous pouvez slectionner plusieurs pages dans un document ; toute page slectionne prsente un aspect distinctif . Utilisez les vignettes pour les oprations de page, comme suit : Pour passer une page, cliquez sur sa vignette. Pour modifier lordre dapparition dune page, cliquez sur sa vignette et faites-la glisser sur le numro de page voulu. Les pages sont renumrotes automatiquement. Pour supprimer une page, slectionnez sa vignette et appuyez sur la touche Suppr.

28

Introduction

Chapitre 2
Pour slectionner plusieurs pages adjacentes, maintenez enfonce la touche Maj. et cliquez sur la premire, puis sur la dernire vignette du groupe requis. Pour slectionner plusieurs vignettes non adjacentes, maintenez enfonce la touche Ctrl et cliquez sur les pages individuelles pertinentes. Cela permet ensuite de dplacer, supprimer ou soumettre lOCR le groupe de pages slectionnes. Vous pouvez aussi exporter les pages slectionnes.
Pour afficher des informations sur une image importe, placez le curseur sur la vignette correspondante (les bulles d'aide doivent tre actives). La mini-fentre qui saffiche spcifie la taille de limage en pixels et en units de mesure du programme. Vous tes galement inform de la rsolution de limage.

Gestionnaire de documents
Cette fonction fournit un rsum d'informations sur un document sous la forme d'un tableau. Les ranges reprsentent les pages ; les colonnes offrent les donnes statistiques ou dtat des pages, et (le cas chant) spcifient les statistiques globales du document. L'illustration ci-dessous affiche les colonnes dfinies par l'utilisateur.

Pour afficher la vignette dune page, placez le curseur sur son icne dtat.

Entrez des commentaires ou des mots-cls consultables.

La page actuelle prsente une icne en forme d' il . Dans le gestionnaire de documents, vous pouvez effectuer les oprations suivantes : Pour passer une page, cliquez sur la partie gauche de la range de pages ou double-cliquez dans sa range. Pour modifier lordre dapparition dune page, cliquez sur sa range et faites-la glisser lemplacement requis. Un indicateur saffiche pour vous signaler lendroit dinsertion de la page. Les pages sont renumrotes automatiquement. Pour supprimer une page, slectionnez sa range et appuyez sur la touche Suppr. Pour slectionner plusieurs pages adjacentes, maintenez enfonce la touche Maj. et cliquez sur la premire, puis sur la dernire range du groupe requis. Pour slectionner plusieurs ranges non adjacentes, maintenez enfonce la

Gestion de documents

29

touche Ctrl et cliquez sur les lments individuels pertinents. Cela permet ensuite de dplacer, supprimer ou soumettre lOCR le groupe de pages slectionnes. Vous pouvez aussi exporter les pages slectionnes. La slection de plusieurs pages naffecte pas ltat de la page actuelle. Toutes les pages slectionnes sont contrastes.

Personnaliser des colonnes dans le gestionnaire de documents


Vous pouvez spcifier les colonnes que vous souhaitez inclure dans le gestionnaire de documents. Dans le menu Affichage, cliquez sur Personnaliser les colonnes pour afficher la bote de dialogue illustre ci-dessous.

Cet lment est contrast. Pour slectionner (activer) un lment, cochez sa case. La taille dimage est fournie en pixels.

Pour modifier lordre dapparition des colonnes, contrastez un lment, puis cliquez sur l'une de ces flches.

Dfinissez la largeur de la colonne contraste.

Dfinissez les colonnes afficher, leur largeur et leur ordre dapparition. Le contenu de chaque colonne est dcrit en dtail dans la rubrique Personnaliser les colonnes du gestionnaire de documents de l'aide en ligne. Vous pouvez modifier la largeur des colonnes tout simplement en faisant glisser les sparations de colonne voulues dans la barre de titre.

Supprimer des pages dun document


Toute suppression de page doit tre confirme et ne peut pas tre annule. Pour supprimer la page actuelle, vous devez recourir la commande Supprimer la page actuelle du menu dition. Pour supprimer toutes les pages slectionnes dans le gestionnaire de documents ou dans la page des vignettes, appuyez sur la touche Suppr ou utilisez la commande Effacer du menu contextuel.

30

Introduction

Chapitre 2

Imprimer un document
Pour imprimer un document, utilisez la commande Imprimer du menu Fichier. Vous pouvez dcider dimprimer une image de page ou le texte reconnu (c.--d., le rsultat de lOCR affich dans lditeur de texte). Vous pouvez imprimer tout ou partie des pages d'un document. L'outil Imprimer de la barre doutils Standard envoie l'imprimante des images ou du texte, en fonction de la fentre active (fentre d'image ou diteur de texte).

Fermer un document
Pour fermer un document, utilisez la commande Fermer du menu Fichier. Si vous navez pas effectu de sauvegarde du document ou si vous y avez apport des modifications depuis le dernier enregistrement, vous tes invit lenregistrer. Pour plus de dtails sur lenregistrement dun document au format de document OmniPage (*.OPD), reportez-vous la section qui suit. Un message vous demande galement denregistrer les nouvelles donnes dapprentissage, si vous avez slectionn loption Demander l'enregistrement des donnes d'apprentissage la fermeture des documents dans la section Vrification de la bote de dialogue Options. La dernire phrase ne s'applique pas OmniPage SE.

Documents OmniPage
Le format Document OmniPage correspond au type de fichier propre OmniPage SE (extension .OPD). C'est un des types de fichiers disponibles pour lenregistrement dun document. Le format OPD est destin lenregistrement des documents sur lesquels vous avez lintention de retravailler plus tard dans OmniPage SE. Ainsi, vous pourrez terminer le traitement du document, y ajouter des pages ou modifier le texte reconnu. Un document OmniPage contient limage de page originale (corrige et prtraite) et toute zone trace sur celle-ci. lissue de la reconnaissance, un fichier OPD comporte galement le rsultat de lOCR. Les caractres reconnus sont enregistrs avec leurs coordonnes et dtails techniques, ce qui permet de conserver le lien entre limage et le texte correspondant, et rend possible la vrification lors de la rouverture du fichier dans OmniPage SE. Au moment de lenregistrement au format de document OmniPage, le logiciel sauvegarde galement les rglages en cours (et les nouvelles donnes dapprentissage). Lors de louverture dun document OmniPage, ses rglages sont appliqus, remplaant les paramtres du programme.

Documents OmniPage

31

Un document OmniPage cr et enregistr dans OmniPage SE n'inclut pas de donnes d'apprentissage. Si vous ouvrez un fichier OPD contenant des donnes d'apprentissage dans OmniPage SE, ces donnes seront ignores.

Avantages du format OPD


Le format OPD, propos parmi dautres types de fichiers disponibles dans OmniPage SE, est particulirement adapt aux circonstances suivantes : o Vous ne pouvez pas terminer le traitement dun document au cours de la session en cours. o Vous souhaitez transmettre le document dautres utilisateurs disposant dOmniPage SE ou Pro (par exemple, lenvoyer un spcialiste pour vrification). Votre bureau est quip dun scanner gnrant des images destines la reconnaissance et la vrification sur plusieurs postes de travail. o Vous souhaitez mettre en place une archive des documents reconnus dont les images originales restent accessible. (le texte reconnu permet deffectuer des recherches par mot-cl et accepte dautres techniques de rcupration de documents).
Avant d'installer une mise jour d'OmniPage, vous devez enregistrer les rsultats de la reconnaissance stocks dans les fichiers OPD. En effet, ces fichiers ne seront peut-tre pas compatibles avec les nouveaux formats de fichier OPD ; il se peut aussi que seules les images soient conserves. Lorsque vous ouvrez un fichier OPD cr dans OmniPage Pro 10, seules les images sont charges. Lorsque vous ouvrez un fichier OPD cr dans OmniPage Pro 11 et son dition spciale, les images et les pages reconnues sont charges, mais les zones ne sont pas conserves.

Enregistrer au format OPD


Si vous avez lintention de crer un fichier OPD, il est recommand denregistrer votre document sous ce format ds le dbut de son traitement ( des fins de protection). Pendant une session de travail, utilisez rgulirement le bouton Enregistrer, et sauvegardez le document la fin de la session. Le bouton Enregistrer sauvegarde le document actuel sous le mme nom et type de fichier, mais vous pouvez enregistrer votre document sous plusieurs formats. Si, lors du premier enregistrement du document, vous lavez affect dun format autre que OPD (par exemple, .doc), utilisez la commande Enregistrer sous du menu Fichier pour le sauvegarder en tant que fichier OPD. Si vous enregistrez un document OPD sous un autre format, le programme ne le renregistre pas automatiquement au format OPD. Au moment de la fermeture du document ou de l'application, vous serez invit enregistrer le document en tant que fichier OPD.

32

Introduction

Chapitre 2
La barre de titre indique le nom du fichier dans lequel le document entier a t enregistr pour la dernire fois.

Rglages
Les rglages OmniPage SE sont regroups dans la bote de dialogue Options. Vous pouvez y accder depuis la barre d'outils Standard ou le menu Outils. Chaque onglet est prsent sommairement ci-dessous (reportez-vous l'aide contextuelle en ligne pour obtenir des informations dtailles sur chaque fentre de rglages). OCR Permet de spcifier la ou les langues de reconnaissance, un dictionnaire utilisateur ou professionnel, des caractres de rejet et le mappage des polices. Pour slectionner ou dslectionner une langue, cochez ou dcochez la case correspondante. Vous pouvez effectuer plusieurs slections, mais limitez-vous aux seules langues apparaissant dans le document reconnatre. Les lments indiqus en premier correspondent aux dernires langues slectionnes. Pour afficher directement une langue, entrez ses premires lettres. OmniPage SE ne prend pas en charge les dictionnaires professionnels. Scanner Permet de dfinir la taille et lorientation de la page pour la numrisation. Vous pouvez galement spcifier les rglages de luminosit et de contraste, et dfinir les options de numrisation des documents multipages, avec ou sans chargeur ADF. Cet onglet permet aussi de modifier la configuration du scanner, dinstaller un nouveau scanner ou de changer de scanner par dfaut. Voir Importer des documents partir dun scanner , page 51. Longlet Scanner ne s'affiche pas si vous aviez spcifi l'affichage de l'interface TWAIN native de votre scanner lors de la configuration de celui-ci. Voir Configuration dun scanner pour utilisation avec OmniPage SE , page 14. Direct OCR Permet de dfinir les rglages de Direct OCR, fonction assurant les services de reconnaissance directement partir des applications extrieures (traitement de texte, etc.). Utilisez cet onglet pour enregistrer/dsenregistrer des applications pour Direct OCR et activer/dsactiver ce service. Vous pouvez galement slectionner le dcoupage en zones automatique ou manuel, et activer ou dsactiver la vrification. Voir Configuration de Direct OCR , page 47. Traitement Permet de dfinir l'emplacement d'insertion de nouvelles images, dactiver le message demandant la suite des pages lors de la numrisation, de spcifier la numrisation sur deux pages pour le traitement des livres et de dfinir d'autres

Rglages

33

paramtres. Cet onglet vous donne aussi la possibilit de modifier la langue dinterface. OmniPage SE ne prend pas en charge la numrisation en vis--vis. Vrification Permet dactiver ou de dsactiver la vrification automatique la suite de la reconnaissance. Vous pouvez aussi utiliser cet onglet pour configurer IntelliTrain dans le but de charger ou de travailler avec un fichier dapprentissage. Voir Vrification des rsultats de lOCR , page 69. Les rfrences au module IntelliTrain et aux fichiers d'apprentissage ne s'appliquent pas OmniPage SE. Mise en page personnalise Permet de dcrire en dtail la mise en page du document dentre. Grce cet onglet, vous pouvez configurer le dcoupage en zones automatique (recherche ou omission de colonnes, de graphique et de tableaux). Voir Dfinition de la mise en page du document , page 54. diteur de texte Permet dafficher ou de masquer certaines fonctions de lditeur de texte, de dfinir lunit de mesure appliquer et dactiver ou de dsactiver le retour la ligne automatique. Voir dition du texte et des images , page 77. Dans OmniPage Pro 12, si vous pouvez accder un systme DMS partir de votre ordinateur et que votre dition d'OmniPage Pro 12 inclut le support ODMA, une fentre ODMA peut galement d'afficher. Voir Support ODMA , page 99.
Certains rglages s'appliquent uniquement aux sessions de reconnaissance suivantes (c'est le cas, par exemple, de la langue de reconnaissance, du fichier dapprentissage et de la luminosit du scanner). De ce fait, il est important de dfinir correctement ces rglages avant le lancement dun traitement. Pour appliquer les nouveaux rglages aux pages reconnues, vous devez recommencer lOCR de celles-ci. Par contre, les autres rglages sont activs immdiatement dans les pages existantes (par exemple, retour la ligne automatique ou unit de mesure dans lditeur de texte).

34

Introduction

Chapitre 3

Traitement des documents


Ce chapitre dcrit les modes de traitement des documents disponibles sous OmniPage SE et fournit des dtails sur les principales tapes des procdures impliques :
x x x x x x x x

Guide de dmarrage rapide Prsentation du traitement Traitement automatique Traitement manuel Traitement combin Traitement l'aide de l'Assistant OCR Traitement partir dautres applications (Direct OCR, PaperPort) Traitement de documents avec Planifier OCR

Les instructions dtailles portent sur les oprations suivantes :


x x x

x x

Dfinition de la source des images de page Dfinition de la mise en page du document Zones et fonds Dcoupage en zones automatique Traage de zones manuel Types et proprits de zone Gestion des zones Gestion des grilles du tableau dans limage Utilisation des gabarits de zone

OmniPage SE Manuel dutilisation

35

Guide de dmarrage rapide


Cette section vous prsente toutes les tapes de la procdure d'OCR de base.

Charger et reconnatre les exemples de fichiers image


Les exemples de fichiers image (comportant une seule page et multipages) sont mis votre disposition dans le dossier Programmes. Traitez ces fichiers en appliquant la procdure dcrite ci-dessous, mais dans un premier temps ignorez toute rfrence au scanner. Voir Importer des fichiers image , page 50. Les rsultats vous donneront une rfrence indiquant la qualit d'OCR que vous devriez obtenir avec vos propres fichiers aux caractristiques comparables. Par la suite, passez la numrisation d'une page place dans votre scanner.

Numriser et reconnatre un document d'une page


Mettez votre scanner sous tension et assurez-vous quil fonctionne correctement. Pour ce test, choisissez une page au texte net. Ce test prsuppose qu'OmniPage SE prsente les rglages par dfaut et que votre document est rdig dans la langue qui a t spcifie comme langue d'interface pendant l'installation. S'il ne s'agit pas de la premire utilisation du programme, ouvrez la bote de dialogue Options (via le menu Outils) et choisissez Valeurs par dfaut. Le document sera trait automatiquement et les rsultats de l'OCR seront enregistrs dans un fichier. Vous allez effectuer la vrification, mais non l'dition, du document dans l'diteur de texte.

36

Traitement des documents

Chapitre 3

Action
1. 2. Le cas chant, configurez le scanner l'aide de l'Assistant du scanner. Slectionnez Dmarrer  Programmes  ScanSoft OmniPage SE 2.0  OmniPage SE 2.0. Placez le document soigneusement dans le scanner. Dans le menu droulant Importer la page, slectionnez l'option de numrisation adapte votre document : noir et blanc, niveaux de gris ou couleur. Dans le menu droulant de description de la mise en page, vrifiez que la commande Automatique est slectionne. Ce rglage est le plus appropri un grand nombre de documents. Dans le menu droulant Exporter les rsultats, vrifiez que l'option Enregistrer sous est slectionne. Cliquez sur Lancer.

Rsultat
OmniPage SE est configur pour l'utilisation avec votre scanner. Le programme OmniPage SE est ouvert.

3. 4.

Vous pouvez spcifier l'aspect des images ou des textes et fonds de couleur dans le document export. Notez que la numrisation en couleur exige un scanner couleur.

5.

OmniPage SE est configur pour le traage des zones et spcification des proprits de zones automatiques.

6.

Vous pouvez attribuer un nom au fichier d'exportation aprs la vrification du document. OmniPage SE lance la numrisation de votre document. Une vignette apparat, assortie d'une jauge de progression. La fentre Vrification de l'OCR apparat. Le module Vrification de l'OCR est similaire la fonction de vrification orthographique d'un programme de traitement de texte, mais offre des fonctionnalits supplmentaires spcifiques la reconnaissance. Les marques de vrification sont supprimes une fois que vous avez termin lopration. Chaque mode de l'diteur de texte dfinit un niveau de formatage diffrent. Vous pouvez ainsi choisir le niveau voulu lors de l'enregistrement. La vrification de la reconnaissance est termine. La bote de dialogue Enregistrer sous apparat. Par dfaut, la fonction Enregistrer et lancer est active et votre document est ouvert automatiquement dans le programme de traitement de texte associ au type de fichier slectionn. Vous avez utilis OmniPage SE avec succs pour reconnatre le document et l'ouvrir dans votre application cible.

7.

8.

Utilisez la fentre Vrification de l'OCR pour modifier les mots que le programme considre comme reconnus incorrectement.

9.

Cliquez dans la fentre de l'diteur de texte. Slectionnez les diffrents modes de l'diteur de texte pour comparer les modifications d'affichage de la page. Cliquez sur Reprendre pour relancer la vrification. Lorsque le message La vrification de l'OCR est termine. saffiche, cliquez sur OK. Choisissez le nom et le type de fichier, ainsi que le chemin et le niveau de formatage requis pour l'enregistrement du document reconnu. Cliquez sur OK. Vrifiez le document dans votre programme de traitement de texte.

10.

11.

12.

Si vous obtenez de bons rsultats lors de la reconnaissance des exemples de fichiers image, mais non de la page numrise, vrifiez l'installation et la configuration de votre scanner, notamment la luminosit et la rsolution d'image. Voir Importer des documents partir dun scanner , page 51. Vous obtiendrez un modle de rglage de luminosit optimal. Consultez galement les rubriques Configurer le scanner et Dpanner le scanner de laide en ligne.

Guide de dmarrage rapide

37

Prsentation du traitement
Le diagramme suivant rcapitule les principales tapes :
Importer les pages partir d'un fichier page 50 partir du scanner page 51 Dcrire la mise en page page 54 Appliquer un gabarit page 64 Zones automatiques page 56 Tracer des zones manuellement page 56 Exporter les pages Excuter lOCR Avec les paramtres courants page 33 Vrifier et diter page 70 Vrifier page 69 Dans un fichier page 85 Dans le Presse-papiers page 90 Par e-mail page 91

Les mthodes de traitement disponibles dans OmniPage SE sont prsentes succinctement ci-dessous. Une description approfondie de chaque mode est fournie dans les pages suivantes du manuel. Automatique La solution la plus simple et la plus efficace de traiter un document consiste laisser OmniPage SE sen charger pour vous. Slectionnez les rglages dans la bote de dialogue Options et les commandes dans la bote outils OmniPage, puis cliquez sur Lancer. OmniPage SE soumet chaque page toutes les tapes du traitement, si possible effectuant plusieurs oprations en parallle. Sous ce mode, le logiciel se charge galement de tracer les zones. Manuel Le traitement manuel vous assure un contrle plus prcis du traitement de votre document. Vous pouvez traiter chaque page individuellement avec diffrents rglages. Le programme marque une pause entre chaque tape du traitement : importation dimages, reconnaissance et exportation. Vous pouvez ainsi tracer des zones manuellement ou modifier les langues de reconnaissance. Pour lancer une tape, cliquez sur l'un des trois boutons correspondants dans la bote outils OmniPage. Combin Vous pouvez traiter un document automatiquement, puis afficher le rsultat obtenu dans lditeur de texte. Si la qualit de l'ensemble du document est bonne et que seules certaines pages sont insatisfaisantes, vous pouvez passer au traitement manuel pour modifier les rglages et relancer la reconnaissance des pages incorrectes. Vous pouvez aussi importer les images manuellement, tracer des zones sur tout ou partie d'entre elles, puis appliquer toutes les pages le traitement automatique.

38

Traitement des documents

Chapitre 3
Assistant OCR LAssistant OCR vous guide dans la slection des rglages et des commandes de reconnaissance en vous posant quelques questions sur le document. Cela fait, lAssistant lance le traitement en mode automatique. Si vous navez pas lhabitude dutiliser OmniPage SE, nhsitez pas faire appel lAssistant OCR.

Traitement partir dautres applications La fonction Direct OCR permet de faire appel aux services OCR dOmniPage SE partir de votre application de traitement de texte usuelle ou d'une autre application. De plus, OmniPage SE tablit un lien automatique avec les programmes de gestion de documents de ScanSoft PaperPort et Pagis. Traitement diffr (Planifier OCR) Le module Planifier OCR permet de diffrer la reconnaissance automatique des documents (par exemple, une heure o vous nutilisez pas l'ordinateur). Pour spcifier les rglages et lheure de lancement du traitement, utilisez lAssistant de nouveau travail de ce module. OmniPage SE ne prend pas en charge la fonction Planifier OCR.

Prsentation du traitement

39

Traitement automatique
Le mode automatique reprsente une mthode efficace pour le traitement de documents, notamment de documents volumineux. Vous dfinissez les rglages pertinents, puis utilisez le bouton Lancer dans la bote outils OmniPage pour appliquer toutes les tapes du traitement un nouveau document ou pour relancer et terminer le traitement dun document ouvert.
Bouton Lancer Bouton Importer la page Bouton Excuter lOCR Bouton Exporter les rsultats

Liste droulante Importer la page

Liste droulante Exporter les rsultats

Liste droulante de description de la mise en page

1. Dans la liste droulante du bouton Importer la page, slectionnez la commande requise. Vous dfinissez la source du document (fichier image ou scanner). Voir Dfinition de la source des images de page , page 50. 2. Dans la liste droulante de description de la mise en page, slectionnez l'option pertinente (voir lillustration plus haut). La description du type de document import ou le choix d'un gabarit de zones aide le programme dans le processus de traage de zones automatique. Voir Dfinition de la mise en page du document , page 54. 3. Dans la liste droulante du bouton Exporter les rsultats, slectionnez la commande requise. Vous pouvez enregistrer le document reconnu dans un fichier au format document OmniPage. Vous pouvez enregistrer les pages voulues (actuelle, slectionnes, toutes) dans un fichier, les copier dans le Presse-papiers ou les envoyer comme pice jointe dun courrier lectronique. Voir Enregistrement et exportation , page 83.

40

Traitement des documents

Chapitre 3

4. Choisissez la commande dans la barre doutils Standard ou dans le menu Outils et vrifiez que les rglages en cours conviennent au document. Vous pouvez, par exemple, spcifier la ou les langues de reconnaissance et activer/dsactiver la vrification du texte reconnu. Voir Rglages , page 33. 5. Cliquez sur Lancer ou choisissez Lancer le traitement automatique dans le menu Traitement. Les pages du document sont traites les unes aprs les autres ; OmniPage SE peut effectuer plusieurs tches simultanment. Ainsi, le programme peut lancer le chargement et la reconnaissance dune nouvelle page pendant la vrification de la page prcdente.

Arrter et relancer le traitement automatique


Arrter : Lorsque le traitement automatique est en cours, le bouton Arrter remplace le bouton Lancer. Cliquez sur ce bouton pour arrter lopration. Cette commande est utile lorsque vous souhaitez modifier certains rglages alors que le traitement est dj entam. Relancer : Lorsque le traitement automatique est termin, le bouton Lancer rapparat. Cliquez sur ce bouton pour relancer le traitement. La bote de dialogue Traitement automatique vous permet deffectuer les actions suivantes :
x

Terminer le traitement des pages non reconnues et non vrifies, puis exporter les rsultats. x Exporter un document dj enregistr, avec ou sans modification, sous un autre nom, emplacement ou type de fichier, ou avec un autre niveau de formatage. x Ajouter des pages de la mme source ou d'une autre source, en conservant ou modifiant les rglages. x Recommencer le traitement de toutes les pages pour liminer tous les rsultats de l'OCR et relancer la reconnaissance de toutes les pages du document avec des rglages diffrents. Vous pouvez activer le dcoupage en zones automatique ou appliquer un fichier de gabarit. Le relancement du traitement est utile si un rglage inadquat a produit des rsultats insatisfaisants dans lintgralit du document. Une telle intervention peut simposer, par exemple, lorsque la spcification dune langue incorrecte lors du premier traitement a entran le marquage de la plupart des mots du document comme douteux pendant la vrification. Cette option permet de rexcuter lOCR sans avoir recommencer la numrisation, le chargement ou le redcoupage en zones de toutes les images.

Traitement automatique

41

Traitement manuel
Le traitement manuel vous assure un contrle plus prcis du traitement de votre document. Vous pouvez traiter chaque page individuellement avec diffrents rglages. Le programme marque une pause entre chaque tape du traitement : importation dimages, reconnaissance et exportation. Vous pouvez ainsi tracer des zones manuellement ou modifier le fond de chaque page. Pour lancer une tape, vous cliquez sur l'un des trois boutons correspondants dans la bote outils OmniPage.

1. Cliquez sur la commande dans la barre doutils Standard ou choisissez Options dans le menu Outils pour vrifier ou modifier les rglages de la bote de dialogue Options. Voir Rglages , page 33. 2. Dans la liste droulante du bouton Importer la page, slectionnez loption requise. Vous dfinissez la source du document (fichier image ou scanner). Si vous effectuez une numrisation, slectionnez le mode voulu et effectuez les rglages pertinents dans les fentres Scanner et Traitement de la bote de dialogue Options. Voir Dfinition de la source des images de page , page 50. 3. Cliquez sur le bouton Importer la page. Cette action affiche la bote de dialogue Charger un fichier image (permettant dindiquer les noms des fichiers image voulus) ou lance la numrisation. Des vignettes de chaque page apparaissent dans la fentre d'image, avec l'image de page actuelle. Les boutons de la barre d'tat vous permettent d'afficher ou de masquer ces images. Les informations relatives aux pages concernes s'affichent dans le gestionnaire de documents. 4. Les images de page importes dans le programme sont toujours dotes de la valeur de fond Traiter. Si vous ne tracez aucune zone sur ces pages, elles seront soumises un dcoupage en zones automatique lors du lancement de la reconnaissance. 5. Vous pouvez tracer et modifier manuellement des zones sur une ou plusieurs images, et leur attribuer des proprits. Les boutons de la barre dtat vous permettent de passer d'une page lautre. Ds que vous tracez une zone sur une page, son fond reoit la valeur Ignorer. Tracez des zones valeur Traiter pour dfinir le dcoupage en zones automatique sur des parties d'une page. Voir Zones et fonds , page 55.

42

Traitement des documents

Chapitre 3
6. Dans la liste droulante du bouton Excuter lOCR, slectionnez loption requise. Choisissez la mise en page du document original. La valeur spcifie est prise en compte dans le processus de traage de zones automatique. Voir Dfinition de la mise en page du document , page 54. Vous pouvez galement slectionner un gabarit pour appliquer ses zones la page actuelle. Voir Utilisation des gabarits de zone , page 64. 7. Cliquez sur le bouton Excuter lOCR pour reconnatre la page actuelle. Pour reconnatre plusieurs pages, slectionnez le groupe de pages requis l'aide des vignettes ou dans le gestionnaire de documents (Voir Gestion de documents , page 28.) et cliquez sur le bouton Excuter lOCR. Les pages reconnues s'affichent dans l'diteur de texte. 8. Si vous avez activ loption de vrification, la bote de dialogue Vrification de lOCR affiche la liste des mots douteux provenant des pages reconnues. Vous pouvez vrifier et diter le texte trait. Voir Vrification des rsultats de lOCR , page 69. 9. Continuez charger les pages, excuter lOCR et procder aux oprations ddition et de vrification selon vos besoins. Vous pouvez changer l'ordre de lecture des lments de page dans l'diteur de texte. Voir dition du texte et des images , page 77. 10. Dans la liste droulante du bouton Exporter le texte reconnu, slectionnez loption requise. Vous pouvez enregistrer le document reconnu au format document OmniPage. Vous pouvez enregistrer les pages voulues (actuelle, slectionnes, toutes) dans un fichier, les copier dans le Presse-papiers ou les envoyer comme pice jointe dun courrier lectronique. Cliquez sur le bouton Exporter les rsultats. Voir Enregistrement et exportation , page 83.

Traitement combin
Le traitement automatique garantit rapidit et efficacit. S'il exige une plus grande attention, le traitement manuel assure un meilleur contrle sur les rsultats. Vous pouvez combiner ces deux avantages lorsque vous traitez un seul document. Pour lancer une reconnaissance automatique et terminer l'opration en mode manuel : Dans le cas dun document volumineux dont seules quelques pages exigent une attention particulire de votre part, vous navez pas besoin de traiter manuellement lintgralit du document. Vous pouvez le traiter automatiquement dans un premier temps, puis afficher le rsultat obtenu dans lditeur de texte, o vous identifiez les pages reconnues correctement, et celles

Traitement combin

43

qui ncessitent des rglages diffrents ou un traage de zones manuel. Ajustez certains paramtres et/ou modifiez des zones, puis passez au mode manuel pour relancer la reconnaissance des pages inadquates. 1. Prparez le document et excutez un traitement en mode automatique, selon la procdure dcrite dans les sections prcdentes. 2. Si vous interrompez ou terminez la vrification, vous serez invit enregistrer le document. Il est recommand deffectuer une sauvegarde, mme si le document se trouve dans un tat intermdiaire. 3. Slectionnez une page exigeant la redfinition des zones et supprimez ou modifiez les zones existantes dans la fentre d'image. Vous pouvez galement charger un gabarit pour appliquer ses zones la page actuelle. Tracez les nouvelles zones selon vos besoins. Voir Zones et fonds , page 55. 4. Modifiez les autres rglages en fonction des particularits de la page actuelle. Voir Rglages , page 33. 5. Cliquez sur le bouton Excuter lOCR pour relancer la reconnaissance de la page actuelle. Dans la fentre affiche, confirmez lannulation des rsultats de lOCR prcdents. Vous pouvez aussi choisir d'appliquer le traitement en direct pour appliquer les modifications apportes aux zones sans devoir relancer la reconnaissance de la page entire. Voir dition en direct , page 79. 6. Pour relancer la reconnaissance de plusieurs pages, slectionnez le groupe de pages voulu dans la page des vignettes ou dans le gestionnaire de documents avant de cliquer sur le bouton Excuter lOCR. 7. Lorsque toutes les pages soumises au nouveau traitement fournissent un rsultat satisfaisant, renregistrez le document. Pour lancer une reconnaissance manuelle et terminer l'opration en mode automatique : 1. Cliquez sur le bouton Importer la page afin de dfinir les rglages et d'importer les images pour le document. 2. Examinez les pages pour en dterminer la luminosit, l'orientation et le contenu. Renumrisez ou faites pivoter les images insatisfaisantes. Rordonnez les pages selon vos besoins.

44

Traitement des documents

Chapitre 3
3. Tracez manuellement les zones dans les pages dont vous ne voulez traiter quune partie ou pour lesquelles vous voulez fournir des instructions de zones prcises. Appliquez la valeur Ignorer aux fonds ou aux zones que vous voulez exclure du traitement. Appliquez la valeur Traiter aux fonds ou aux zones pour lesquels vous voulez dfinir le dcoupage en zones automatique. 4. Cliquez sur le bouton Lancer, puis choisissez Terminer le traitement des pages existantes dans la bote de dialogue Traitement automatique. 5. l'issue de la vrification (le cas chant), vous pouvez enregistrer ou exporter le document.

Traitement l'aide de l'Assistant OCR


Vous pouvez utiliser lAssistant OCR pour lancer le traitement dun nouveau document. Si un document est ouvert lorsque vous slectionnez l'Assistant OCR, ce dernier se ferme. En vous guidant travers cinq fentres de traitement, lAssistant OCR vous aide slectionner les rglages appropris votre document, puis lance le traitement automatique. Toutes les fentres de lAssistant sont munies daide contextuelle. Pour afficher le premier cran de lAssistant, cliquez sur le bouton Assistant OCR dans la bote outils OmniPage : 1. La premire fentre vous permet de dfinir la source du document : scanner ou fichier image. Voir Dfinition de la source des images de page , page 50. Effectuez les slections appropries et cliquez sur Suivant. 2. La deuxime fentre vous demande de dcrire la mise en page du document original dans le but de faciliter le traage de zones automatique. Voir Dfinition de la mise en page du document , page 54. 3. La troisime fentre vous permet de dfinir les langues de reconnaissance. Les langues associes un dictionnaire sont accompagnes de licne de livre ouvert. Les slections les plus rcentes apparaissent au dbut de la liste. 4. La quatrime fentre vous donne la possibilit de vrifier le texte avant de lexporter. Si vous choisissez loption Oui, vous pouvez aussi diter le texte avant lenregistrement. Vous dcidez galement si vous voulez crer et utiliser des donnes IntelliTrain pendant la vrification. Voir IntelliTrain , page 74. La rfrence au module IntelliTrain ne s'applique pas OmniPage SE.

Traitement l'aide de l'Assistant OCR

45

5. La dernire fentre vous demande de dfinir les modalits dexportation : enregistrement dans un fichier ou copie dans le Presse-papiers. Aprs avoir effectu la slection requise, cliquez sur Terminer pour fermer lAssistant et dmarrer le traitement automatique. 6. Si vous avez activ loption de vrification et que le texte contient des mots douteux, la bote de dialogue Vrification de lOCR apparat. Une fois la vrification termine ou arrte, la bote de dialogue Copier dans le Presse-papiers ou Enregistrer sous apparat pour vous permettre de spcifier les rglages dexportation pour le fichier, notamment un intervalle de pages et un niveau de formatage. 7. Le document est conserv dans OmniPage SE. Vous pouvez diter le rsultat de la reconnaissance et lenregistrer sous diffrents formats. OmniPage SE vous permet de redfinir des zones manuellement ou de modifier les rglages, puis d'utiliser le traitement manuel pour relancer la reconnaissance de certaines pages du document. Le document peut tre enrichi de nouvelles pages via le traitement automatique ou manuel.
Les fentres de lAssistant contiennent toujours les derniers rglages spcifis dans le programme. De plus, OmniPage SE applique les rglages slectionns dans lAssistant OCR toute opration de traitement automatique ou manuel (jusqu leur ventuelle modification). Par consquent, si ces rglages conviennent plusieurs documents, il suffit de cliquer sur Lancer dans la bote outils OmniPage. Les rglages applicables qui ne sont pas proposs par lAssistant OCR adoptent les valeurs les plus rcentes spcifies dans le programme (il s'agit principalement des rglages du scanner, du dictionnaire utilisateur et du fichier dapprentissage). Les gabarits de zones ne peuvent pas tre utiliss avec lAssistant OCR. Si un fichier de gabarit est actif lors du lancement de lAssistant, il est dcharg et loption Automatique est applique la description du document original. Vous ne pouvez pas exporter un document reconnu en tant que pice jointe un message lectronique ; vous devez, pour cela, employer le traitement automatique ou manuel.

Traitement partir dautres applications


La fonction Direct OCRTM permet de faire appel aux services OCR dOmniPage SE partir de votre application de traitement de texte usuelle ou d'une autre application. Le recours cette fonction suppose l'tablissement pralable d'un lien direct entre OmniPage SE et lapplication en question. lissue de cette opration, deux commandes ajoutes au menu Fichier de lapplication relient celle-ci aux services dOCR.

46

Traitement des documents

Chapitre 3

Configuration de Direct OCR


1. Dmarrez lapplication lier OmniPage SE. Lancez OmniPage SE, ouvrez la bote de dialogue Options, puis la fentre Direct OCR et slectionnez Activer Direct OCR. 2. Slectionnez les options de traitement pour la vrification et le dcoupage en zones. Les rglages effectus sappliquent lensemble des oprations futures de Direct OCR jusqu' leur ventuelle modification ; ils ne sont pas pris en compte si vous utilisez OmniPage SE sans Direct OCR. 3. La fentre Non enregistres affiche la liste des applications actives ou enregistres dans le pass. Slectionnez la ou les applications voulues et cliquez sur Ajouter ou recherchez une application absente de la liste au moyen du bouton Parcourir.

Utilisation de Direct OCR


1. Dmarrez lapplication lie OmniPage SE et ouvrez un document. Pour importer dans le document les rsultats des pages numrises, placez celles-ci correctement dans le scanner. 2. Slectionnez la commande Configuration d'acquisition du texte dans le menu Fichier de l'application cible pour spcifier les rglages appliquer lors de la reconnaissance. Tout rglage non dfini conserve la valeur utilise lors de la dernire session OmniPage SE, et tout rglage modifi dans Direct OCR est reflt dans OmniPage SE. 3. Slectionnez la commande Acqurir texte du menu Fichier pour importer des images partir dun scanner ou dun fichier. 4. Si vous avez slectionn loption Dfinir les zones automatiquement dans la fentre Direct OCR de la bote de dialogue Options ou dans la fentre Configuration d'acquisition du texte, la reconnaissance est lance immdiatement. 5. Si vous navez pas slectionn loption Dfinir les zones automatiquement, le programme vous propose de tracer des zones manuellement sur chaque image de page. Cliquez sur le bouton Excuter lOCR pour poursuivre la reconnaissance. 6. Si la fonction de vrification a t active, cette opration suit lOCR. Le texte reconnu est ensuite insr dans votre application lemplacement du curseur, avec le niveau de formatage spcifi avec la commande Acqurir les rglages de texte.

Traitement partir dautres applications

47

Si OmniPage SE est ouvert au moment de lappel de la fonction Direct OCR partir d'une application cible, une nouvelle session dOmniPage SE dmarre. Pour plus de dtails, reportez-vous aux rubriques relatives Direct OCR dans l'aide en ligne, notamment Direct OCR Questions et rponses. Le fichier ReadMe/ LisezMoi et le site Web de ScanSoft peuvent proposer des informations plus rcentes sur certaines applications cibles spcifiques.

Utilisation de OmniPage SE avec PaperPort


PaperPort est un produit de gestion de documents papier de ScanSoft. Ce programme permet de lier vos pages aux applications appropries. Ces pages peuvent comporter des lments graphiques et/ou du texte. Si PaperPort est prsent sur un ordinateur dot d'OmniPage SE, les services dOCR de ce dernier tendent les fonctionnalits de PaperPort. Pour choisir un programme d'OCR, cliquez avec le bouton droit sur le lien PaperPort d'application de texte, slectionnez Prfrences, puis spcifiez OmniPage SE 2.0 en tant que programme d'OCR utiliser. linstar de Direct OCR, vous pouvez spcifier les rglages dOCR de votre choix.
:

Dans cet exemple, OmniPage SE a t slectionn comme programme dOCR pour Word 2000. Par la suite, vous pouvez faire glisser des images de page depuis le bureau PaperPort sur le lien Word de PaperPort. Lors de la reconnaissance du texte, seule une jauge de progression apparat ; toutefois, lutilisateur peut demander l'affichage de la fentre de dcoupage en zones manuel ou de vrification dOmniPage SE. Les rsultats de lOCR sont placs dans un nouveau document sans titre de lapplication cible.

48

Traitement des documents

Chapitre 3

Traitement de documents avec Planifier OCR


OmniPage SE ne prend pas en charge la fonction Planifier OCR. Le texte suivant ne s'applique qu' OmniPage Pro. Le module Planifier OCR permet de diffrer le traitement automatique de vos travaux d'OCR (dans la limite de huit jours suivant lactivation de cette fonction). Chaque travail planifi porte sur un document. Les pages de celui-ci peuvent provenir dun scanner muni dun chargeur ADF ou dun fichier image. Lors du dmarrage dun travail planifi, vous navez pas besoin dtre prsent et OmniPage Pro ne doit pas obligatoirement tre actif. Lordinateur doit tre allum au moment du lancement dun travail diffr, mais vous pouvez lteindre entre la configuration de Planifier OCR et lheure du dbut du traitement planifi. Si le travail en question implique la numrisation, votre scanner doit tre actif au moment du dmarrage du travail et les pages correspondantes doivent tre places dans le chargeur ADF. Pour configurer un travail planifi, procdez comme suit : 1. Cliquez sur Planifier OCR dans le menu Traitement ou dans le menu Dmarrer de Windows : slectionnez Programmes ScanSoft OmniPage Pro 12.0 Planifier OCR. 2. La bote de dialogue Planifier OCR apparat. Cliquez sur Nouveau pour accder lAssistant de nouveau travail. Celui-ci vous guide travers six fentres de traitement (similaires celles de lAssistant OCR). 3. La premire fentre vous permet de dfinir la source de limage : scanner avec chargeur ADF ou fichier. 4. Les deux fentres suivantes sont similaires aux crans de lAssistant OCR, mais vous pouvez en outre spcifier un dictionnaire utilisateur ou spcialis et un fichier dapprentissage. Lactivation de la fonction IntelliTrain dpend des rglages actifs dans OmniPage Pro au moment du lancement du travail. 5. Les fentres suivantes vous permettent de spcifier le nom, le type et lemplacement du fichier dexportation, ainsi qu'une option de sparation de fichier et un niveau de formatage. 6. La dernire fentre permet de dfinir l'heure du lancement du travail et (le cas chant) l'heure d'arrt, ainsi que la conservation ou la suppression des fichiers d'origine aprs traitement. Pour fermer lAssistant, cliquez sur Terminer.

Traitement de documents avec Planifier OCR

49

La bote de dialogue Planifier OCR affiche tous les travaux planifis et indique leur tat : En attente, En cours, En pause, Erreur ou Termin. Pour modifier les rglages d'un travail en attente, slectionnez Modifier le travail. Vous pouvez afficher, modifier et rutiliser les travaux accomplis pour traiter de nouveaux documents exigeant des rglages similaires ; vous pouvez aussi supprimer les travaux termins lorsque vous nen avez plus besoin.

Dfinition de la source des images de page


Les images de page peuvent provenir des sources suivantes : fichier image ou scanner. Il existe essentiellement deux types de scanner : plat et alimentation feuille feuille. Pour faciliter la numrisation des documents multipages, un scanner peut tre quip dun chargeur de feuilles automatique (ADF). Les images des documents numriss peuvent tre soit exportes directement dans OmniPage SE, soit enregistres avec le logiciel du scanner au format de fichier image pour ouverture dans OmniPage SE.

Importer des fichiers image


Vous pouvez crer un fichier image partir de votre scanner, ou le recevoir par e-mail ou par fax. La liste des types de fichier image compatibles avec OmniPage SE est trs tendue. Voir Types de fichier pour louverture et lenregistrement des images , page 100. Slectionnez Charger un fichier image dans la liste droulante Importer la page. Les fichiers figurent dans la bote de dialogue Charger un fichier image, qui apparat au moment du lancement dun traitement automatique. Lors dun traitement manuel, cliquez sur le bouton Importer la page ou utilisez le menu Traitement. Les rglages volus proposs dans la partie infrieure de la bote de dialogue illustre ci-dessous peuvent tre affichs ou masqus selon vos prfrences.

50

Traitement des documents

Chapitre 3

Dossier actuel. Pour placer plusieurs fichiers dans la zone Nom de fichier, utilisez les squences Maj.+clic ou Ctrl+clic.

Slectionnez cette option pour afficher une vignette du fichier slectionn. Elle n'est pas disponible lorsque plusieurs fichiers sont slectionns.

Spcifiez le ou les types de fichiers afficher. Cette option est destine aux fichiers TIFF, DCX et MAX multipages. Blank.tif est un fichier vide destin loption denregistrement Un fichier aprs chaque page blanche.

Cliquez sur volu pour afficher la partie infrieure de la fentre, et sur Standard pour la masquer.

Permet d'ajouter des fichiers partir de plusieurs dossiers et de contrler avec prcision leur ordre dintgration.

Utilisez ces flches pour modifier l'ordre des fichiers.

Lorsque vous intgrez un fichier avec le bouton Ajouter, il est plac en fin de liste. Pour insrer un fichier un emplacement diffrent, contrastez un fichier dans la liste : le nouveau fichier sera ajout immdiatement en dessous du fichier contrast le plus bas.

Importer des documents partir dun scanner


Pour bnficier de cette fonction, vous devez disposer dun scanner pris en charge, oprationnel et correctement configur dans OmniPage SE. Voir Configuration dun scanner pour utilisation avec OmniPage SE , page 14. Le programme offre plusieurs modes de numrisation que vous choisissez en fonction des deux facteurs suivants :
x x

le type de graphique souhait dans le document de sortie ; le mode qui produira la reconnaissance la plus prcise.

Numriser en noir et blanc Slectionnez cette option pour numriser vos documents en noir et blanc. Cette option ne convient pas aux documents dont vous voulez conserver la couleur en sortie ou dont vous souhaitez obtenir des photographies en noir et blanc : (celles-ci ncessitent la numrisation en niveaux de gris). Pour de meilleurs rsultats de reconnaissance, utilisez cette option pour un texte noir net sur fond blanc ou clair. La rapidit de numrisation et de traitement, ainsi que le moindre

Dfinition de la source des images de page

51

espace disque occup reprsentent les deux principaux avantages de ce mode de numrisation par rapport aux deux autres. Numriser en niveaux de gris Slectionnez cette option pour numriser vos documents en niveaux de gris. Ce rglage convient notamment aux photographies en noir et blanc. Pour de meilleurs rsultats de reconnaissance, utilisez cette option pour les pages prsentant un contraste variable ou rduit (peu de diffrence entre les zones claires et sombres) et un fond en couleur ou en dgrad. Numriser en couleur Slectionnez cette option pour numriser vos documents en couleur. Elle s'applique uniquement aux scanners couleur. Cette option est particulirement adapte si vous souhaitez conserver les graphiques, le texte et les fonds en couleur dans le document de sortie. La numrisation en couleur noffre pas de meilleure prcision dOCR que le mode en niveaux de gris (pour une rsolution donne), mais exige des dlais plus importants et une plus grande quantit de mmoire et despace disque. Luminosit et contraste Les rglages de luminosit et de contraste influent considrablement sur la prcision de lOCR. Vous dfinissez ces paramtres dans longlet Scanner de la bote de dialogue Options ou dans l'interface de votre scanner. Le diagramme ci-dessous illustre le rglage de luminosit optimal. Ds le chargement dune image, vrifiez son aspect. Si les caractres sont pais et colls, augmentez la luminosit ; si les caractres apparaissent fins et partiels, rduisez-la. Une fois les modifications requises effectues, renumrisez la page.

Inacceptable
Tolrable

Bonne Optimale Bonne Tolrable Inacceptable

52

Traitement des documents

Chapitre 3

Numriser avec un chargeur ADF


La meilleure mthode pour numriser des documents multipages est de faire appel un chargeur de feuilles automatique (ADF). Placez les pages dans lordre requis dans le chargeur. Si vous souhaitez enregistrer votre document dans plusieurs fichiers de sortie laide de loption Crer un fichier aprs chaque page blanche, insrez galement des pages blanches dans la pile. Voir Enregistrement des rsultats de lOCR , page 85. Si le document traiter comporte un nombre de pages excdant la capacit du chargeur ADF, slectionnez loption Demander automatiquement la suite des pages dans longlet Traitement de la bote de dialogue Options. Une bote de dialogue vous invite recharger l'ADF et signale la fin de la numrisation. Un chargeur ADF accepte galement la numrisation de pages recto verso. Si votre scanner ne gre pas ce genre dopration automatiquement, slectionnez loption Numriser pages recto verso (onglet Scanner de la bote de dialogue Options). Cette option permet de numriser le document en quelques passes en sparant les pages paires des pages impaires. OmniPage SE se charge de la fusion de lensemble des pages.

Numriser sans chargeur ADF


Mme si votre scanner plat ne dispose pas de chargeur ADF, vous pouvez numriser efficacement des documents multipages. Slectionnez loption Numriser les pages automatiquement (onglet Scanner de la bote de dialogue Options) et dfinissez une valeur de pause en secondes. Ainsi le scanner effectue les passes de numrisation automatiquement, en marquant une pause de dure spcifie entre chaque numrisation pour vous permettre de charger la page suivante. Une bote de dialogue vous donne la possibilit de raccourcir ou de prolonger cette pause et de signaler la numrisation de la dernire page. OmniPage Pro 12 vous permet de numriser simultanment deux pages d'un livre. Le programme divise les images entrantes en deux pages distinctes qu'il redresse sparment. Cette fonction n'est pas propose dans OmniPage SE.

Dfinition de la source des images de page

53

Dfinition de la mise en page du document


Avant de commencer la reconnaissance dun document, OmniPage SE vous demande de dcrire la mise en page de celui-ci dans le but de faciliter le traage de zones automatique. Lorsque vous faites appel lassistant OCR, la fonction de dcoupage en zones automatique est toujours active. Cette fonction sapplique galement en cas de traitement automatique, moins que vous nayez spcifi un gabarit ne contenant aucune zone ou fond valeur Traiter. Lors dun traitement manuel, le traage de zones automatique est parfois activ. Reportez-vous la rubrique Quand excuter le dcoupage en zones automatique de l'aide en ligne. Pour dcrire le document original, vous disposez des options suivantes : Automatique Choisissez cette option pour laissez OmniPage SE le soin deffectuer le dcoupage en zones automatique. Le programme dtermine si llment est du texte en colonnes, un graphique, du texte reconnatre ou un tableau conserver. Choisissez loption Automatique si le document contient des pages dont la mise en page est htrogne ou de type inconnu. Slectionnez cette option pour une page colonnes multiples et comportant un tableau, et pour toutes pages comportant plus dun tableau. Colonne unique sans tableau Choisissez cette option si les pages du document contiennent une seule colonne de texte et aucun tableau, comme cest le cas des circulaires et pages de livre. Slectionnez cette option pour une page dont les mots et nombres sont agencs en colonnes et si vous ne souhaitez pas les placer dans un tableau ni les sparer en plusieurs colonnes distinctes. Cette option permet la dtection des graphiques. Colonnes multiples sans tableau Choisissez cette option si certaines de vos pages contiennent du texte en colonnes que vous souhaitez disposer sans colonnes ou dans des colonnes distinctes (correspondant la mise en page originale). Pour conserver les colonnes au moyen de cadres dans le document de sortie, slectionnez le format True Page lors de l'exportation. La fonction de formatage des pages en continu d'OmniPage Pro 12 permet galement de conserver les colonnes sans cadres. En cas de donnes tabulaires, celles-ci seront le plus probablement traites comme une colonne unique. Cette option permet la dtection des graphiques. Colonne unique avec tableau Choisissez cette option si vos pages contiennent une seule colonne de texte et un tableau. La fonction de traage de zones automatique nessaie pas didentifier des colonnes mais de dtecter un tableau et de le placer dans une grille dans lditeur de texte. Vous pouvez spcifier par la suite si vous souhaitez exporter le document sous la forme de grille ou de colonnes de texte spares par tabulation. Cette option permet la dtection des graphiques.

54

Traitement des documents

Chapitre 3
Feuille de calcul Choisissez cette option si lintgralit de la page se prsente sous la forme dun tableau que vous souhaitez exporter dans une feuille de calcul ou en tant que tableau unique. Les colonnes uniques et les graphiques ne sont pas dtects. Personnalis Choisissez cette option pour contrler au maximum le droulement du traage de zones automatique. Vous pouvez configurer la dtection de colonnes, de graphiques et/ou de tableaux. Effectuez les rglages appropris dans longlet Mise en page personnalise de la bote de dialogue Options. Gabarit Choisissez un fichier de gabarit de zones si vous souhaitez appliquer une valeur de fond, avec ses zones et proprits, toutes les pages importes. Les zones de gabarit sont galement appliques la page actuelle, en remplacement des zones existantes, ainsi qu'aux pages prexistantes sans zones au moment de leur (nouvelle) reconnaissance. Voir Utilisation des gabarits de zone , page 64. Si le dcoupage en zones automatique produit des rsultats inattendus, utilisez le traitement manuel pour redfinir les zones sur les pages individuelles et relancer leur reconnaissance.

Zones et fonds
Les zones dfinissent les sections de la page destines tre traites ou ignores. Elles peuvent prendre une forme rectangulaire ou irrgulire (avec des cts verticaux et horizontaux). Les images de page d'un document possdent une valeur de fond : Traiter ou Ignorer (cette dernire tant la plus rpandue). Vous pouvez utiliser les outils indiqus pour modifier les valeurs de fond. Vous pouvez galement utiliser les outils indiqus pour tracer des zones sur les fonds de page :
Fonds Zones Traiter Traiter Ignorer Ignorer Texte Tableau Graphique

Traiter le document est dcoup automatiquement en zones (dans les zones ou les fonds de type Traiter) lors de son envoi pour reconnaissance. Ignorer les zones (dans les zones et fonds de type Ignorer) sont exclues du traitement. Le texte n'est pas reconnu et aucune image n'est transfre.

Zones et fonds

55

Dcoupage en zones automatique


Le dcoupage en zones automatique permet au programme de dtecter les lments de page (blocs de texte, en-ttes, images et autres) et de les inclure dans une zone. OmniPage attribue des types et des proprits ces zones. Le dcoupage en zones automatique s'applique aux pages entires dans le cas d'un traitement automatique, sauf si vous avez charg un gabarit, et lors de lutilisation de l'Assistant OCR. Vous pouvez galement spcifier le dcoupage en zones automatique dans le cadre d'un traitement manuel, en procdant comme suit : Dcouper automatiquement une page entire en zones Importez une page ; celle-ci saffiche avec un fond de type Traiter. Ne tracez aucune zone et vrifiez dans la liste droulante de description de la mise en page qu'aucun gabarit de zone n'est charg. Cliquez sur le bouton Excuter l'OCR. Vous pouvez slectionner plusieurs pages sans zones afin de les dcouper automatiquement et de les reconnatre. Dcouper automatiquement en zones une partie de page Importez une page ; celle-ci saffiche avec un fond de type Traiter. Tracez une zone. La valeur de fond passe Ignorer. Tracez les zones Texte, Tableau ou Graphique afin de dlimiter manuellement les zones de type voulu. Tracez les zones valeur Traiter afin de dlimiter les zones affecter du traitement automatique. l'issue de la reconnaissance, les zones valeur Traiter seront remplaces par une ou plusieurs zones Texte, Tableau ou Graphique. Dcouper automatiquement un fond de page en zones Importez une page ; celle-ci saffiche avec un fond de type Traiter. Tracez une zone. La valeur de fond passe Ignorer. Tracez les zones Texte, Tableau ou Graphique afin de dlimiter manuellement les zones de type voulu. Cliquez sur l'outil Fond valeur Traiter (voir illustration) afin de dfinir un fond de ce type. Tracez des zones valeur Ignorer sur les parties inutiles de la page. l'issue de la reconnaissance, la page rapparat : elle comprend un fond valeur Ignorer et de nouvelles zones encadrant tous les lments du fond.

Traage de zones manuel


Cette section prsente d'abord deux exemples relatifs aux zones et aux fonds, dcrit ensuite les types de zone, et enfin, indique les mthodes appliquer pour tracer et utiliser les zones. Pour ces exemples, les nombres renvoient au tableau de la page suivante.

56

Traitement des documents

Chapitre 3
Tracer des zones sur un fond valeur Ignorer :

Avant la reconnaissance :

Aprs la reconnaissance : Le fond conserve la valeur Ignorer.

La zone 4 correspond un groupe de zones, permettant en l'occurrence de grer trois colonnes de texte et une photo.

Tracer des zones sur un fond valeur Traiter :

Avant la reconnaissance :

Aprs la reconnaissance : La valeur de fond passe Ignorer. La zone 6 est incluse dans le fond. Les zones figurant dans la partie gauche de la page ont t cres automatiquement.

Numro 1 2 3 4 5 6 7

Type Zone Texte Zone Tableau Zone Graphique Zone valeur Traiter Fond valeur Traiter Zone valeur Ignorer Fond valeur Ignorer

Rsultat L'OCR est excut et gnre le texte. L'OCR est excut et le texte est plac dans une grille de tableau. L'image est incorpore dans la page reconnue. Le dcoupage en zones automatique cre une ou plusieurs zones, leur attribue un type et en traite le contenu. Aucun rsultat

Zones et fonds

57

Les zones traces automatiquement et les zones de gabarit ont des bordures pleines :

Les zones traces manuellement et les zones modifies ont des bordures en pointills :

Aucun ordre de lecture n'est attribu aux zones. Vous pouvez rordonner les lments reconnus dans l'diteur de texte. Voir dition du texte et des images , page 77. Le chapitre 4 prsente le traage de zones en direct . Voir dition en direct , page 79.

Types et proprits de zone


Chaque zone est affecte dun type, et les zones comportant du texte peuvent galement prsenter un paramtre de contenu de zone : alphanumrique ou numrique. Le type et le contenu d'une zone reprsentent les proprits de la zone . Pour modifier les proprits dune zone, cliquez dessus avec le bouton droit pour afficher son menu contextuel et effectuez les slections souhaites. Pour changer les proprits de plusieurs zones simultanment, slectionnez le groupe de zones requis (combinaison Maj.+clic) avant de choisir les nouvelles valeurs. La barre d'outils Image propose cinq outils de traage de zones (un pour chaque type). Le type d'une zone est indiqu par l'icne place dans son angle suprieur gauche, ainsi que par la couleur de cette icne et celle de la bordure de la zone. La liste ci-aprs indique les outils et les couleurs disponibles : Zone valeur Traiter (vert olive) Cet outil permet de tracer une zone valeur Traiter, afin de dfinir une section qui sera soumise au traage de zones automatique. l'issue de la reconnaissance, cette zone est remplace par une ou plusieurs zones dont les types sont dtermins automatiquement. Vous tracez normalement les zones valeur Traiter sur un fond valeur Ignorer. Tracez une zone valeur Traiter pour entourer les colonnes de texte traiter automatiquement. Le texte sera affich sous une seule colonne dans le mode Aucun formatage et Conserver le formatage polices/paragraphes de l'diteur de texte, mais les colonnes seront conserves en mode True Page.

58

Traitement des documents

Chapitre 3
Zone valeur Ignorer (gris) Cet outil permet de tracer une zone valeur Ignorer, afin de dfinir une section ne pas transfrer vers l'diteur de texte. La fonction de dcoupage en zones automatique omet ces zones pendant le traitement. Pour exclure une section donne d'un grand nombre de pages (par exemple, un en-tte ou les numros de page), placez une zone valeur Ignorer dans un gabarit. Vous tracez normalement les zones valeur Ignorer sur un fond valeur Traiter. Zone Texte (marron) Cet outil permet de tracer une zone Texte sur un bloc de texte unique. Le contenu des zones est assimil un enchanement de texte, sans aucune colonne. Pour assurer le traitement automatique des colonnes de texte, entourez-les d'une zone valeur Traiter. Zone Tableau (bleu) Utilisez ce type pour traiter le contenu de la zone en tant que tableau. Les grilles du tableau peuvent tre dtectes automatiquement ou places manuellement (voir la section suivante). Les zones de type Tableau doivent tre rectangulaires. Lditeur de texte affiche le tableau dans une grille ditable. Pour la plupart des types de fichier de sortie, vous pouvez exporter le tableau sous la forme de grille ou de colonnes de texte spares par tabulation. Zone Graphique (vert) Utilisez ce type pour entourer une illustration, un diagramme, un dessin, une signature et tout autre lment que vous souhaitez transmettre lditeur de texte en tant quimage incorpore plutt que texte reconnu. Les images incorpores peuvent tre exportes avec le document vers les applications cibles supportant les graphiques.

Les zones Texte et Tableau sont affectes d'un rglage de contenu. Le contenu alphanumrique valide tous les caractres ncessaires pour votre slection linguistique. Le rsultat de la reconnaissance dune zone numrique comporte uniquement des nombres et leur ponctuation. Toute lettre est ignore. Le menu contextuel de la zone vous permet de modifier ce rglage. Pour afficher le menu contextuel correspondant lensemble de limage, cliquez avec le bouton droit en dehors de toute zone. Les commandes de ce menu permettent deffectuer un zoom avant et arrire, et de faire pivoter limage. La rotation dune image supprime toutes ses zones traces.

Zones et fonds

59

Gestion des zones


La barre doutils Image propose des outils ddition des zones. Un des ces outils est toujours slectionn ; pour modifier la slection en cours, cliquez sur un autre outil. Certains de ces outils sont groups. Dans ce cas, seul le dernier outil slectionn dans le groupe est visible. Pour slectionner un outil visible, cliquez dessus. Pour slectionner un outil masqu, positionnez la souris sur le triangle plac dans l'angle infrieur droit de l'outil visible, appuyez sur le bouton de la souris et maintenez-le enfonc jusqu' ce que d'autres outils apparaissent, puis cliquez sur l'outil voulu. Tracer une zone unique Slectionnez l'outil de traage de zone du type voulu, puis cliquez et faites glisser le curseur. Dans ces exemples, cette procdure est illustre par le dplacement de la flche de A vers B. Vous pouvez aussi effectuer ce mouvement de l'angle suprieur gauche vers l'angle infrieur droit. Vous pouvez uniquement tracer des zones rectangulaires ; les zones traces ( l'exception des zones Tableau) peuvent tre converties en zones irrgulires. Pour redimensionner une zone, slectionnez-la (en cliquant dessus), amenez le curseur sur un ct ou un angle, activez une poigne et amenez-la l'emplacement voulu. Pour dplacer une zone, slectionnez-la l'aide d'un outil de slection de zone et dplacez-la selon vos besoins. Vous ne pouvez pas dplacer une zone pour la superposer sur une autre. Crer une zone irrgulire par addition Tracez une zone recouvrant partiellement une autre zone du mme type :
Zone existante Zone rsultante

Nouvelle zone

60

Traitement des documents

Chapitre 3
Joindre deux zones du mme type Tracez une zone recouvrant des deux zones du mme type.

Zones existantes

Nouvelle zone

Zone rsultante

Crer une zone irrgulire par soustraction Tracez une zone recouvrant une autre zone du mme type que le fond. (Dans cet exemple, il y a un fond valeur Ignorer).
Zone existante sur un fond valeur Ignorer Nouvelle zone valeur Ignorer

Zone rsultante

Diviser une zone Tracez une zone du mme type que le fond divisant une autre zone. (Dans cet exemple, il y a un fond valeur Traiter).
Zones Texte existantes sur un fond valeur Traiter Zones rsultantes Nouvelle zone valeur Traiter

Zones et fonds

61

Les formes de zone suivantes sont interdites :


Retrait le long de la partie infrieure Retrait le long de la partie suprieure Avec trou

Pour agrandir une zone plus rapidement qu'au moyen des poignes de redimensionnement, entourez cette zone d'une zone du mme type. La plus petite des zones est remplace par la plus grande. Pour remplacer un groupe de zones (quel que soit le type) par une zone unique, entourez ces zones d'une zone plus grande du type voulu. Les zones plus petites sont toutes remplaces par la plus grande. Lorsque la nouvelle zone trace recouvre partiellement une zone existante d'un type diffrent, une superposition complte ne se produit pas ; la nouvelle zone remplace seulement la partie recouverte de la zone existante. Pour plus de dtails, reportez-vous la rubrique Tracer des zones manuellement de l'aide en ligne.

Gestion des grilles du tableau dans limage


lissue dun traitement en mode automatique, OmniPage SE peut placer des zones de type Tableau sur la page traite. Ces zones comportent une icne de zone Tableau dans leur angle suprieur gauche. Vous pouvez modifier le type affect une zone rectangulaire via son menu contextuel. Vous pouvez galement tracer des zones de type Tableau, mais elles doivent toujours tre rectangulaires. La cration ou le dplacement des lignes de sparation verticales et horizontales d'un tableau permet de dterminer lemplacement de la grille lors du placement du tableau dans lditeur de texte. Vous pouvez tracer ou redimensionner une zone Tableau ( condition de conserver sa forme rectangulaire) pour liminer les colonnes ou les ranges inutiles des bords extrieurs d'un tableau. Chaque fois que la page actuelle comporte une zone de type Tableau, les cinq outils de gestion de tableau de la barre doutils Image deviennent actifs. Si l'outil voulu n'est pas visible, cliquez sur le triangle plac dans l'angle infrieur droit de l'outil visible pour afficher tous les outils, puis cliquez sur l'outil voulu.

62

Traitement des documents

Chapitre 3
Utilisez les outils de tableau et leurs curseurs comme suit : Insrer sparation de ranges Cliquez sur cet outil puis sur lemplacement dans la zone Tableau o vous souhaitez placer une sparation de ranges. vitez de placer des sparations qui divisent un texte. Insrer sparation de colonnes Cliquez sur cet outil puis sur lemplacement dans la zone Tableau o vous souhaitez placer une sparation de colonnes. Dplacer sparation Cliquez sur cet outil et placez le curseur sur la sparation de ranges ou de colonnes requise. Le curseur prend la forme dune flche double. Faites glisser la sparation dans la direction souhaite (sans dpasser les limites des sparations voisines). vitez de placer des sparations qui divisent un texte. Supprimer sparation Cliquez sur cet outil puis sur la sparation individuelle de range ou de colonne supprimer. Cette opration est utile pour liminer une sparation mal place ou pour modifier lapparence du tableau dans le document final. Ainsi, vous pouvez regrouper deux colonnes de donnes en une seule en supprimant leur trait de sparation. Insrer/Supprimer les sparations Cliquez sur cet outil, puis sur son icne de curseur lintrieur dune zone Tableau sans sparations. Les sparations sont dtectes et places automatiquement. Pour les liminer, placez le curseur dans un tableau avec sparations et cliquez sur cet outil. Pour placer, dplacer ou supprimer une sparation dans la cellule actuelle uniquement, utilisez la combinaison Ctrl+clic. Vous pouvez spcifier le formatage de lignes pour les bordures et les grilles de tableau partir d'un menu contextuel. Vous disposerez de davantage d'options d'dition des bordures et de fond dans l'diteur de texte l'issue de la reconnaissance.

Gestion des grilles du tableau dans limage

63

Utilisation des gabarits de zone


Un fichier de gabarit contient une valeur de fond de page, un groupe de zones et leurs proprits. Pour appliquer les zones dun gabarit lors de la reconnaissance, chargez un fichier de gabarit de zone via la liste droulante du bouton de description de la mise en page ou laide du menu Outils. Lorsque vous chargez un gabarit, son fond et ses zones sont insres :
x x x

Sur la page actuelle (les zones dj insres sont remplaces) Sur toutes les pages importes par la suite Sur les pages prexistantes envoyes pour (nouvelle) reconnaissance sans aucune zone

En mode de traitement manuel, vous pouvez afficher et modifier les zones de gabarit dans les deux premiers cas avant la reconnaissance. En mode de traitement automatique, vous ne pouvez afficher et modifier les zones de gabarit qu'aprs la reconnaissance. Ce comportement demeure tant que le gabarit est charg. Les gabarits acceptent les zones et les fonds valeur Ignorer et Traiter. Par consquent, ils peuvent tre trs utiles pour dfinir les parties de la page destines au traitement l'aide du dcoupage en zones automatique et les parties ignorer. Pendant la reconnaissance, vous pouvez remplacer les zones ou les fonds valeur Traiter par un groupe de zones plus petites, auxquelles seront attribus des types de zones spcifiques. Enregistrer un gabarit de zones Slectionnez une valeur de fond et dfinissez les zones d'une page, puis vrifiez leur emplacement et leurs proprits. Cliquez sur Gabarit de zones dans le menu Outils. Dans la bote de dialogue affiche, slectionnez [zones sur la page] et cliquez sur Enregistrer ; entrez le nom voulu et cliquez sur OK. Modifier un gabarit de zone Chargez un gabarit et importez une image au moyen dun traitement manuel. Le zones de gabarit apparaissent sur limage. Modifiez les zones et/ou les proprits selon vos besoins. Ouvrez la bote de dialogue Fichiers de gabarit de zones. Le gabarit actuel est slectionn. Cliquez sur Enregistrer puis sur Fermer. Dcharger un gabarit de zones Slectionnez une option non associe un gabarit dans la liste droulante de description de la mise en page du document. Les zones du gabarit ne sont pas supprimes de la page actuelle ou des pages existantes, mais le gabarit nest plus configur pour utilisation lors des futurs traitements. Vous pouvez galement ouvrir la bote de dialogue Fichiers de gabarit de zones, slectionner [nant] et

64

Traitement des documents

Chapitre 3
cliquer sur le bouton Dfinir comme actuel. Dans ce cas, l'option de description de la mise en page reprend la valeur Automatique. Remplacer un gabarit de zones Slectionnez un autre gabarit dans la liste droulante de description de la mise en page, ou ouvrez la bote de dialogue Fichiers de gabarit de zones, slectionnez le gabarit souhait et cliquez sur le bouton Dfinir comme actuel. Les zones du nouveau gabarit sont galement appliques la page actuelle, en remplacement des zones existantes ; elles s'appliquent galement comme indiqu ci-dessus. Supprimer un gabarit de zones Ouvrez la bote de dialogue Fichiers de gabarit de zones. Slectionnez un gabarit et cliquez sur le bouton Supprimer. Notez que les zones dj cres laide de ce gabarit ne sont pas supprimes.

Les gabarits sont disponibles dans Direct OCR, mais non dans lAssistant OCR.

Utilisation des gabarits de zone

65

66

Traitement des documents

Chapitre 4

Vrification et dition
Les rsultats de la reconnaissance sont placs dans lditeur de texte. Il peut s'agir d'un texte reconnu, de tableaux et de graphiques incorpors. L'diteur aux capacits d'affichage fidle ( WYSIWYG ) offre les fonctions numres ci-dessous et dcrites en dtail dans le prsent chapitre :
x x x x x x x x

Modes daffichage de lditeur de texte Vrification des rsultats de lOCR Vrification du texte reconnu Dictionnaires utilisateur Apprentissage dition du texte et des images dition en direct Lecture du texte voix haute

OmniPage SE Manuel dutilisation

67

Modes daffichage de lditeur de texte


Lditeur de texte affiche le texte reconnu et, en fonction de vos rglages, signale les mots qui ont t considrs comme douteux pendant la reconnaissance, en les soulignant d'une ligne ondule.
x

Vert Mots absents du dictionnaire : La reconnaissance est sre, mais ces mots ne se trouvent dans aucun dictionnaire actif (standard, utilisateur ou spcialis). Bleu Mots comportant un caractre douteux : Ces mots contiennent des caractres non reconnus ; ils peuvent galement figurer dans un dictionnaire, mais contiennent des caractres pour lesquels la reconnaissance n'est pas aussi sre. Rouge Mots douteux : Ces mots, vraisemblablement absents du dictionnaire, contiennent au moins un caractre douteux. Le problme peut cependant tre imputable une autre raison.

Vous pouvez activer ou dsactiver les marques des mots absents du dictionnaire dans longlet Vrification de la bote de dialogue Options. Les marques peuvent tre affiches ou masques selon les options slectionnes dans longlet diteur de texte de cette mme bote. Vous pouvez galement afficher ou masquer les caractres non imprimables et les indicateurs den-tte et de bas de page. Longlet diteur de texte permet aussi de dfinir l'unit de mesure du programme et de configurer le retour la ligne automatique dans tous les modes de lditeur de texte, lexception du mode Sans Formatage. OmniPage SE peut afficher les pages selon trois niveaux de formatage. Pour passer d'un niveau l'autre, slectionnez l'un des trois boutons prsents dans langle infrieur gauche de lditeur de texte ou utilisez le menu Affichage. Les graphiques et les tableaux sont compatibles avec tous les modes disponibles. Les modes de lditeur disponibles prsentent les caractristiques suivantes : Aucun formatage Pour afficher le texte en une seule colonne aligne gauche et appliquer un seul style et corps de police, tout en conservant les sauts de ligne de loriginal. La plupart des boutons et des botes de dialogue de formatage sont dsactivs. Les rgles ne sont pas affiches. Ce mode s'avre gnralement utile pour la vrification et ldition du texte. Conserver le formatage polices/paragraphes Pour afficher le texte en une seule colonne et appliquer des styles de police et de paragraphe. La rgle horizontale est affiche. Ce mode s'avre gnralement utile pour la vrification et ldition du texte et des styles utiliss.

68

Vrification et dition

Chapitre 4
True Page Le mode True Page permet de conserver au maximum le formatage du document original. Les styles de caractre et de paragraphe sont conservs et tous les lments de page, y compris les colonnes, sont placs dans des blocs et des cadres. L'ordre de lecture peut tre indiqu par des flches (voir partir de la page 77). Le niveau de formatage pour l'exportation est choisi sparment au moment de l'exportation.

Vrification des rsultats de lOCR


lissue de la reconnaissance dune page, les rsultats de lopration apparaissent dans lditeur de texte. La vrification dmarre automatiquement si cette option a t active dans longlet Vrification de la bote de dialogue Options ou par l'intermdiaire de lAssistant OCR. Vous pouvez galement lancer l'OCR manuellement au moment de votre choix. Procdez comme suit : 1. Cliquez sur l'outil Vrifier lOCR dans la barre doutils Standard ou choisissez Vrifier lOCR dans le menu Outils. 2. La vrification dmarre au dbut du document, mais omet le texte dj vrifi. Si un mot douteux est dtect, la bote de dialogue Vrification de lOCR affiche ce mot dans son contexte, assorti de limage originale correspondante.
Raison pour laquelle le mot est marqu. Fentre d'dition : Le mot marqu est affich en couleur (rouge, bleu ou vert). Limage du mot douteux est contraste.

Fentre prsentant le fragment correspondant de limage originale. Cliquez dedans pour agrandir ou rduire laffichage.

Pour redimensionner la bote de dialogue, faites glisser un angle ou le bord infrieur.

Vrification des rsultats de lOCR

69

3. Si le mot reconnu est correct, cliquez sur Ignorer ou Ignorer tout pour passer au mot douteux suivant. Cliquez sur Ajouter pour lajouter au dictionnaire utilisateur actuel et passer au mot douteux suivant. 4. Si le mot reconnu est erron, tapez la version correcte dans la fentre d'dition ou slectionnez une suggestion du dictionnaire. Cliquez sur Remplacer ou Remplacer tout pour valider votre correction et passer au mot douteux suivant. Cliquez sur Ajouter pour ajouter le mot corrig au dictionnaire utilisateur actuel et passer au mot douteux suivant. 5. Au fur et mesure que les mots douteux affichs dans lditeur de texte sont vrifis, les marques de couleur les accompagnant disparaissent. Lors de la vrification, vous pouvez passer la fentre de lditeur de texte pour y effectuer les corrections requises. Pour relancer la vrification, utilisez le bouton Reprendre. Pour arrter la vrification avant datteindre la fin du document, cliquez sur Fermer.

La vignette de toute page entirement vrifie porte l'icne de vrification dans le gestionnaire de documents. Si vous avez masqu les marques dans l'diteur de texte au lancement de la vrification ou activ l'option Rechercher prochain mot douteux, les marques apparaissent et restent affiches aprs la vrification. Si l'option Marquer les mots absents des dictionnaires est dsactive dans longlet Vrification de la bote de dialogue Options, la vrification signale uniquement les mots marqus en rouge ou en bleu, mais non les mots absents des dictionnaires. Cette fonction est utile pour les pages qui contiennent un fort pourcentage de mots absents des dictionnaires, par exemple, des catalogues de produits avec codes et des bibliographies avec noms propres. L'option Revrifier la page actuelle du menu Outils permet de lancer une nouvelle vrification orthographique sur une page dj vrifie. Vous pouvez ainsi contrler les mots qui ont t taps ou colls dans l'diteur de texte aprs la vrification. Cette fonction s'applique mme si l'option Marquer les mots absents des dictionnaires est dsactive dans longlet Vrification.

Vrification du texte reconnu


Une fois la reconnaissance dune page effectue, vous pouvez comparer tout lment du texte reconnu avec la partie correspondante de limage originale afin de contrler la prcision de lopration. Procdez comme suit :

70

Vrification et dition

Chapitre 4

Action requise
Activer le vrificateur Dsactiver le vrificateur Activer/dsactiver temporairement le vrificateur Afficher le vrificateur jusqu'au prochain appui sur une touche Zoom avant Zoom arrire Dfinir le mode du vrificateur : dynamique ou ancr/flottant Contexte dynamique (faire dfiler 3 valeurs)

Squence utilise
F9 ou outil Vrificateur chap, F9 ou outil Vrificateur F8 : appuyer et maintenir la touche enfonce Double-cliquer sur le mot Alt + Num + ou cliquer dans le vrificateur Alt + Num ou cliquer dans le vrificateur Alt + Num / Alt + Num *

L'outil Vrificateur se trouve dans la barre d'outils de formatage. Vous pouvez galement lactiver/le dsactiver partir du menu Outils. Placez le curseur sur la fentre du vrificateur pour afficher sa barre d'outils. Utilisez cet outil pour effectuer les oprations suivantes :
Outil Vrificateur (activ/dsactiv)

Passez de flottant ancr (et inversement)

Pour activer le mode flottant ou ancr (rtablissement du dernier mode activ)


Quel niveau de contexte pour le vrificateur dynamique ? Un mot Trois mots (le mot actuel + le mot prcdent et le mot suivant) Ligne d'image complte

Barre doutils du vrificateur : Zoom avant/arrire Mode dynamique

diteur de texte

Vrification du texte reconnu

71

Il est conseill de vrifier lOCR et contrler le texte reconnu avant de procder une dition importante. Si vous coupez et collez de grands fragments de texte, les liens entre les mots et limage originale peuvent tre perdus. Le module Texte-parole d'OmniPage Pro 12 vous permet de vrifier le texte reconnu l'aide d'une lecture voix haute. La lecture peut porter sur les lettres, les mots, les lignes ou les phrases ou seffectuer sur lensemble de la page. Reportez-vous la section Lecture du texte voix haute , page 80. Veuillez noter que ce module n'est pas disponible dans OmniPage SE.

Dictionnaires utilisateur
OmniPage SE intgre des dictionnaires en plusieurs langues, qui facilitent la reconnaissance et peuvent proposer des suggestions pendant la vrification de lOCR. Les dictionnaires intgrs peuvent tre remplacs par les dictionnaires crs par lutilisateur. Vous pouvez enregistrer plusieurs dictionnaires utilisateur, mais ne pouvez charger qu'un seul dictionnaire la fois. Le programme propose aussi vos dictionnaires utilisateur de Microsoft Word : un dictionnaire personnalis et le dictionnaire utilisateur Word par dfaut. Ouvrir un dictionnaire utilisateur Cliquez sur Ajouter dans la bote de dialogue Vrification de lOCR (aucun dictionnaire utilisateur n'tant charg), ou ouvrez la bote de dialogue Fichiers de dictionnaire utilisateur partir du menu Outils et cliquez sur Nouveau. Un message vous demande de nommer le dictionnaire. Charger ou dcharger un dictionnaire utilisateur Ralisez ces oprations depuis longlet OCR de la bote de dialogue Options ou partir de la bote de dialogue Fichiers de dictionnaire utilisateur. Pour le chargement, slectionnez un fichier dictionnaire ; pour le dchargement, slectionnez [nant]. diter ou supprimer un dictionnaire utilisateur Pour ajouter des mots un dictionnaire utilisateur, chargez-le et cliquez sur Ajouter dans la bote de dialogue Vrification de lOCR. Vous pouvez ajouter et supprimer des mots en cliquant sur dition dans la bote de dialogue Fichiers de dictionnaire utilisateur. Le bouton Supprimer permet de supprimer le dictionnaire utilisateur slectionn.
Lors de ldition dun dictionnaire utilisateur, vous pouvez optimiser lopration dajout de nouveaux mots en important la liste des mots requis partir dun fichier texte standard. Chaque mot doit tre plac sur une ligne spare et il ne doit tre ni prcd ni suivi d'aucun signe de ponctuation.

72

Vrification et dition

Chapitre 4
Des dictionnaires spcialiss sont disponibles dans OmniPage Pro 12 pour certaines langues et certaines professions (juridiques et mdicales, pour le moment). Ces dictionnaires ne sont pas proposs dans OmniPage SE.
Le programme identifie la langue utilise pour les textes reconnus et l'affiche dans la barre d'tat. Ces slections de langue sont exportes avec le document. Pour modifier la langue du texte slectionn, utilisez la commande Slectionner langue du menu Outils. Cette option n'a aucune incidence sur les langues de reconnaissance spcifies.

Apprentissage
L'apprentissage, le module IntelliTrain et les fichiers d'apprentissage ne sont pas supports par OmniPage SE. Ces fonctionnalits sont uniquement disponibles dans OmniPage Pro 12. Toutes les donnes d'apprentissage pouvant accompagner un fichier OPD seront ignores lors de son ouverture dans OmniPage SE. L'apprentissage correspond la procdure permettant de modifier les solutions d'OCR attribues aux caractres de l'image. Cette fonction est utile pour les documents prsentant une dgradation uniforme ou un type de police inhabituel dans la totalit de leur contenu. Elle ne produit pas daussi bons rsultats dans les documents prsentant des dformations ponctuelles et varies. Lexemple ci-dessous sappuie sur les diffrentes impressions de la lettre g :

Les deux premiers exemples nexigent pas l'apprentissage, car les formes de la lettre g utilises sont normales et le programme peut les traiter sans problme. Le troisime exemple pourrait bnficier de l'apprentissage, parce que la forme de la lettre g utilise est inhabituelle et que toutes les instances de celle-ci dans le texte auront probablement le mme aspect. Le quatrime exemple ne convient pas lutilisation de l'apprentissage, tant donn que la premire instance de la lettre g est partiellement imprime et quil est peu probable que cette forme se rpte dans le document. Vous pouvez utiliser l'apprentissage pour amliorer la reconnaissance des symboles spciaux, tels que @, et , ou pour accrotre la fiabilit de la reconnaissance des caractres accentus supports. L'apprentissage n'a pas pour but d'enseigner au programme la lecture des langues ou alphabets non supports.

Apprentissage

73

OmniPage Pro 12 propose deux types dapprentissage : manuel et automatique (via IntelliTrain). Les donnes provenant des deux types d'apprentissage sont combines et vous pouvez les enregistrer dans un fichier d'apprentissage. Lorsque vous fermez une page pour laquelle des donnes d'apprentissage ont t gnres, le programme vous demande de spcifier la manire de les appliquer aux autres pages existantes du document.

Apprentissage manuel
Pour lancer un apprentissage manuel, placez le point d'insertion devant le caractre ajouter ; vous pouvez aussi slectionner un groupe de caractres (un mot maximum) et choisir Nouveau caractre dans le menu Outils ou le menu contextuel. Une vue agrandie des caractres ajouter s'affiche, assortie de la solution d'OCR actuelle. Remplacez-la par la solution voulue et cliquez sur OK. Le programme accepte cet apprentissage et examine le reste de la page. S'il trouve des mots susceptibles dtre modifis, il les affiche dans la bote de dialogue Vrification de l'apprentissage. Vous devrez recommencer l'apprentissage des mots incorrects avant de valider la liste. Pour plus de dtails sur les botes de dialogue Nouveau caractre et Vrification de l'apprentissage, reportez-vous l'aide contextuelle ou la rubrique Apprentissage manuel de l'aide en ligne et ses rubriques connexes.

IntelliTrain
IntelliTrain reprsente une nouvelle forme dapprentissage automatis, capable de mmoriser les corrections effectues par lutilisateur lors de la vrification de lOCR. Lorsque vous effectuez une modification, IntelliTrain retient la forme du caractre concerne et la correction apporte. Par la suite le module parcourt le document la recherche des formes de caractre similaires, notamment parmi les mots douteux, et value la pertinence de la correction de lutilisateur. Le module IntelliTrain peut tre activ et dsactiv via longlet OCR de la bote de dialogue Options. Lillustration ci-dessous explique le fonctionnement dIntelliTrain. Cet exemple porte sur les lettres c et e . Avec certaines polices et dans certaines conditions de numrisation, la ligne horizontale de la lettre e risque de devenir trs fine et d'entraner des erreurs de reconnaissance, qu'IntelliTrain se chargera de corriger.

74

Vrification et dition

Chapitre 4

OmniPage Pro interprte ce mot en tant que intcrnationalc. Lors de la vrification, vous lavez remplac par internationale.

IntelliTrain retient la forme et la corrige :

Cette lettre nest pas un c , mais un e .

IntelliTrain remplace : contcnu par contenu souvcnt par souvent Asic par Asie et ainsi de suite.

IntelliTrain conserve les donnes d'apprentissage gnres par l'opration et les ajoute, le cas chant, l'apprentissage manuel que vous avez effectu. Vous pouvez les enregistrer dans un fichier d'apprentissage pour rutilisation avec des documents similaires.

Fichiers dapprentissage
Si vous souhaitez que le programme vous demande denregistrer les donnes dapprentissage non sauvegardes la fermeture dun document, slectionnez loption correspondante dans longlet Vrification de la bote de dialogue Options. Les donnes d'apprentissage non enregistres sont stockes dans un document OmniPage. Si vous n'enregistrez pas le document dans un fichier OPD, tout apprentissage non enregistr est limin lorsque vous fermez le document. Vous pouvez enregistrer des donnes dapprentissage dans un fichier, ainsi que charger, diter et dcharger des fichiers dapprentissage via la bote de dialogue Fichiers dapprentissage. Ouvrez cette fentre partir de longlet Vrification de la bote de dialogue Options ou depuis le menu Outils.

Apprentissage

75

Slectionnez cette entre, cliquez sur Enregistrer et tapez un nom pour crer un fichier dapprentissage.

Cliquez sur ce bouton pour diter le fichier d'apprentissage slectionn dans la bote de dialogue Modification du fichier d'apprentissage. Ce bouton permet aussi denregistrer de nouvelles donnes dapprentissage dans le fichier charg. Le fichier adopte le nom :<Nom de fichier> [modifi].

Slectionnez cette entre pour dcharger un fichier dapprentissage.

Des donnes dapprentissage non enregistres peuvent tre dites dans la bote de dialogue Modification du fichier dapprentissage ; un astrisque saffiche dans la barre de titre la place du nom de fichier. Les donnes ne sont pas sauvegardes la fermeture de la bote de dialogue Modification du fichier d'apprentissage. Enregistrez-les dans la bote de dialogue Fichiers d'apprentissage. Vous pouvez galement diter un fichier dapprentissage ; dans ce cas, son nom apparat dans la barre de titre. Si des donnes dapprentissage non enregistres ont t ajoutes au fichier, son nom est accompagn dun astrisque. Les donnes dapprentissage non enregistres et modifies sont sauvegardes la fermeture de la bote de dialogue. La bote de dialogue Modification du fichier d'apprentissage affiche des cadres comportant une forme de caractre et la solution dOCR qui lui est assigne. Cliquez sur un cadre pour le slectionner. Vous pouvez ensuite le supprimer laide de la touche Suppr ou modifier la solution propose. Pour passer au cadre prcdant ou suivant, utilisez les touches flches.
Vous ditez des donnes dapprentissage non enregistres.

Ce cadre est gris car il a t supprim. Pour annuler sa suppression, reslectionnez-le et appuyez sur la touche Suppr. Les caractres marqus en tant que supprims ne sont effacs qu la fermeture de la bote de dialogue.

Cliquez deux fois sur un cadre ou appuyez sur Entre pour modifier la solution dOCR associe. Tapez la nouvelle solution dans la zone de texte qui saffiche et appuyez sur Entre. Les assignations modifies apparaissent en rouge.

Ce cadre est slectionn. La partie suprieure affiche la forme provenant de limage. La partie infrieure affiche la solution dOCR propose.

76

Vrification et dition

Chapitre 4

dition du texte et des images


L'diteur de texte d'OmniPage SE est dot de capacits daffichage fidles ( WYSIWYG ), et ses fonctions ddition sont trs proches des possibilits offertes par les applications de traitement de texte les plus courantes. dition de caractres Les modes de lditeur autres que le mode Sans Formatage permettent de modifier le type, le corps et les attributs (gras, italique, soulign) de la police appliqus au texte slectionn. Utilisez la barre doutils de formatage ou la bote de dialogue Police accessible par le biais du menu Format. (Cette bote de dialogue offre galement les options dindice, dexposant et de texte/fond de couleur.) En mode Aucun formatage, vous pouvez utiliser la barre doutils de formatage pour spcifier un seul type et une seule taille de police appliquer lensemble du document. Ce rglage nest pas utilis pour l'exportation, ni transmis aux autres modes ; ceux-ci gardent leurs anciens paramtres. Ouvrez la bote de dialogue Mappage des polices (via longlet OCR de la bote de dialogue Options) avant deffectuer la reconnaissance pour spcifier les polices utiliser dans les textes affichs dans lditeur de texte. dition de paragraphes Les modes de lditeur autres que le mode Sans Formatage permettent de modifier lalignement des paragraphes slectionns et de les formater avec des puces. Utilisez la barre doutils de formatage ou la bote de dialogue Paragraphe accessible depuis le menu Format. Cette bote de dialogue permet de modifier le retrait, l'interligne et l'espacement des paragraphes. Grce la rgle horizontale de lditeur de texte, vous pouvez dfinir les emplacements de retrait et de tabulation en toute facilit. Les options de tabulation volues peuvent tre spcifies dans la bote de dialogue Tabulations (accessible depuis le menu Format). Styles de paragraphe Les styles de paragraphe prsents dans un document sont dtects automatiquement pendant la reconnaissance. Une liste des styles est cre et prsente dans une bote de slection dans la partie gauche de la barre doutils de formatage. Cette liste permet dattribuer un style aux paragraphes slectionns. Pour renommer/modifier un style ou pour dfinir un nouveau style, utilisez la bote de dialogue Style (accessible depuis le menu Format). Lors de lenregistrement dun document dans un fichier, vous pouvez exporter galement ses styles de paragraphe. Cette option est disponible uniquement si lapplication cible supporte les styles de paragraphe. Graphiques Pour diter des zones graphiques dans OmniPage SE, votre ordinateur doit tre quip dun diteur dimage. Choisissez la commande diter limage dans le menu Outils. Cette slection active lditeur dimage associ au format BMP sur

dition du texte et des images

77

votre systme Windows et charge le graphique. Modifiez le graphique, puis fermez lditeur dimage pour rintgrer le graphique dans l'diteur de texte. Ne modifiez pas la taille, la rsolution ou le type de graphique, car ces actions empchent la rintgration. Tableaux Les tableaux saffichent dans lditeur de texte sous forme de grilles. Pour modifier un tableau, placez le curseur dans une zone de type Tableau ; il change daspect et vous pouvez dplacer les traits de la grille. Vous pouvez galement utiliser les rgles de lditeur de texte. Modifiez lemplacement du texte dans les cellules d'un tableau laide des boutons dalignement de la barre doutils de formatage et des commandes de tabulation de la rgle. Lors de lenregistrement du document dans certains types de fichiers spcifiques, vous pouvez exporter les tableaux en tant que grilles ou colonnes spares par des tabulations ou par des espaces. Hyperliens Les adresses de courrier lectronique et celles des pages Web peuvent tre dtectes et places en tant que liens dans le texte reconnu. Pour diter un lien existant ou pour en crer un nouveau, choisissez Hyperlien dans le menu Format. Ce nouveau lien peut renvoyer une page Web ou un fichier. Pour supprimer un lien, utilisez le menu contextuel. dition dans True Page Les lments de page sont placs dans des blocs de texte, de tableau et d'image, correspondant gnralement aux zones Texte, Tableau et Graphique dans l'image. Cliquez dans un lment pour afficher la bordure du bloc ; la couleur est identique dans les zones correspondantes. La rubrique True Page de l'aide en ligne propose des dtails sur les oprations dcrites ci-aprs. Les cadres ont des bordures grises et contiennent au moins un bloc. Ils sont placs lorsqu'une bordure visible est dtecte dans une image. Vous pouvez dfinir les bordures et les dgrads d'un cadre et d'un tableau au moyen du menu contextuel ou de la commande Tableau du menu Format. Pour spcifier le dgrad d'un bloc de texte, utilisez le menu contextuel. Pour afficher un menu contextuel, cliquez avec le bouton droit de la souris dans un lment autre qu'un mot marqu. Les zones multicolonnes prsentent des bordures roses et contiennent au moins un bloc. Dtectes automatiquement, elles indiquent le texte qui sera trait comme un enchanement de colonnes au moment de l'exportation. Les menus contextuels permettent de dgrouper les cadres et les zones multicolonnes afin de modifier leurs lments. Vous pouvez aussi grouper les lments en cadres ou en zones multicolonnes. L'ordre de lecture peut tre affich et modifi. Pour visualiser les flches indiquant cet ordre, cliquez sur l'outil Afficher ordre de lecture dans la barre d'outils de formatage. Cliquez de nouveau pour supprimer les flches. Pour remplacer la barre d'outils de formatage par un groupe de boutons de

78

Vrification et dition

Chapitre 4
ragencement, cliquez sur l'outil Changer lordre de lecture. Leur utilisation est dcrite dans laide contextuelle et dans la rubrique Ordre de lecture de l'aide en ligne. L'ordre est modifi dans les fentres Aucun formatage et Conserver le formatage polices/paragraphes. Ce changement modifie le mode de dplacement du curseur dans la page, lorsque le document est export au format True Page.

dition en direct
Cette fonction vous permet de modifier une page reconnue par un nouveau dcoupage de zones, sans devoir traiter une nouvelle fois la page entire. Lorsque l'dition en direct est active, les changements de zone (suppression, dfinition, redimensionnement, changement de type) s'appliquent immdiatement la page reconnue. De mme, lorsque vous modifiez des lments dans la fentre True Page de l'diteur de texte, les changements effectus sont rpercuts sur les zones de la page. Vous pouvez aussi utiliser le dcoupage en zones en direct sur les pages non reconnues. Deux outils lis de la barre d'outils Image contrlent le dcoupage en zones en direct. L'un de ces outils est toujours actif lorsque aucune reconnaissance n'est en cours. Cliquez sur ce bouton pour activer l'dition en direct. La couleur rouge indique qu'aucune modification de dcoupage en zones nest stocke. Cliquez sur ce bouton pour dsactiver l'dition en direct. Les modifications apportes au dcoupage en zones sont stockes et l'outil affiche la couleur verte. Pour appliquer ces modifications, effectuez l'une des oprations suivantes : Cliquez sur l'outil ddition en direct dot de la couleur verte. Les modifications apportes au dcoupage en zones sont rpercutes dans l'diteur de texte. Cliquez sur le bouton Excuter lOCR pour reconnatre la page entire, avec les changements de zone. Pour plus de dtails sur le traitement des changements dans le cadre du dcoupage de zones en direct, ainsi que sur leur effet dans les fentres de l'diteur de texte, reportez-vous la rubrique Traitement en direct dans l'aide en ligne.

dition en direct

79

Lecture du texte voix haute


Le module Texte-parole nest pas disponible dans OmniPage SE. Ce module nest disponible que dans OmniPage Pro 12. La fonction de lecture du texte reconnu est avant tout destine aux personnes malvoyantes ; toutefois, elle peut galement faciliter les processus de vrification de lOCR et de contrle du texte reconnu tout utilisateur dOmniPage Pro. La lecture voix haute est contrle par les mouvements du point dinsertion dans lditeur de texte (via la souris ou le clavier).
Modalits de lecture
Un seul caractre la fois, lecture avant ou arrire Mot actuel Mot suivant vers la droite Mot suivant vers la gauche Une ligne Ligne suivante Ligne prcdente Phrase actuelle Depuis le point dinsertion jusqu la fin de la phrase Depuis le dbut de la phrase jusquau point d'insertion Page actuelle Depuis le dbut de la page actuelle jusquau point d'insertion Depuis le point dinsertion jusqu la fin de la page actuelle Page prcdente, suivante ou la page de votre choix Caractres saisis

Touches utilises
Flche Droite ou Gauche. Les noms de lettre, de nombre et de signe de ponctuation sont prononcs. Ctrl + Un du bloc numrique (1) Ctrl + flche Droite Ctrl + flche Gauche Placez le point dinsertion dans la ligne Flche Bas Flche Haut Ctrl + Deux du bloc numrique (2) Ctrl + Six du bloc numrique (6) Ctrl + Quatre du bloc numrique (4) Ctrl + Trois du bloc numrique (3) Ctrl + Dbut Ctrl + Fin Ctrl + PgPrec, PgSuiv ou boutons de navigation Chaque caractre saisi est prononc individuellement, y compris les signes de ponctuation.

80

Vrification et dition

Chapitre 4
La fonction de synthse vocale est active ou dsactive via la commande Mode synthse vocale du menu Outils ou via la touche F5. Le sous-menu Rglages de synthse vocale permet de slectionner le type de voix (masculine ou fminine dans une langue donne) et de configurer le dbit et le volume pour la lecture. Les trois touches principales utilises pour la lecture voix haute sont regroupes sur le bloc numrique.

Pour lire le Pour lire la Pour lire la mot actuel phrase page actuelle actuelle

Vous disposez galement des squences clavier suivantes :


Action requise
Interrompre/Reprendre Augmenter le dbit Rduire le dbit Rtablir le dbit

Squence utilise
Ctrl + Cinq du bloc numrique (5) Ctrl + Signe plus du bloc numrique (+) Ctrl + Signe moins du bloc numrique (-) Ctrl + Astrisque du bloc numrique (*)

Le programme de synthse vocale devrait tre propos dans les langues suivantes : anglais, franais, allemand, italien, portugais et espagnol. Pour obtenir les dernires informations ce sujet, consultez le fichier ReadMe/ LisezMoi. Une seule version linguistique est installe avec OmniPage Pro, en fonction de la slection effectue au lancement de linstallation. Si vous spcifiez une langue ne disposant pas de la fonction de synthse vocale, la version anglaise est installe. Si votre ordinateur est muni de systmes de synthse vocale compatibles avec la norme SAPI pour d'autres langues, ceux-ci sont dtects et mis votre disposition. Leurs voix sont proposes dans la bote de dialogue Rglages de synthse vocale. Ds qu'une voix a t attribue une langue donne, OmniPage Pro retient cette slection et passe la voix indique en fonction de la langue de reconnaissance spcifie pour votre document.

Lecture du texte voix haute

81

82

Vrification et dition

Chapitre 5

Enregistrement et exportation
Aprs avoir import au moins une image dans un document, vous pouvez procder lexportation des images acquises vers un fichier. lissue de la reconnaissance dau moins une page, vous pouvez exporter les rsultats de lOCR (une seule page, les pages slectionnes ou le document entier) vers lapplication cible de votre choix laide dune des mthodes suivantes : enregistrement du document dans un fichier, copie du document dans le Presse-papiers ou ajout du document un e-mail en tant que pice jointe. Vous pouvez galement enregistrer le fichier en tant que document OmniPage. Ce chapitre traite les sujets suivants : x Enregistrement des images originales x Enregistrement des rsultats de lOCR Enregistrement dun document lors dune session de travail Slection dun niveau de formatage Slection des options d'enregistrement volues Enregistrement dun document au format PDF x Copie des pages dans le Presse-papiers x Ajout de pages un e-mail comme pice jointe Le document tant conserv dans OmniPage SE aprs lexportation, vous pouvez enregistrer, copier ou envoyer ses pages plusieurs reprises en appliquant, le cas chant, diffrents niveaux de formatage, types de fichiers, noms ou emplacements. Vous pouvez galement y ajouter de nouvelles pages, relancer lOCR des pages traites ou modifier le texte reconnu. Dans le cas du traitement laide de lAssistant OCR et en mode automatique, vous spcifiez la premire destination denregistrement avant dentamer le

OmniPage SE Manuel dutilisation

83

processus. l'issue de la reconnaissance (ou de la vrification, selon vos rglages) de la dernire page disponible, la bote de dialogue d'exportation s'affiche. Vous pouvez configurer lexportation pour toute priode pendant laquelle le programme nest pas occup. Si vous essayez dexporter un document comportant des pages non reconnues, un message vous demande si vous souhaitez procder dabord leur reconnaissance. Si vous slectionnez loption Non, seuls les rsultats de lOCR des pages reconnues sont exports. Si vous avez modifi des zones sur des pages reconnues, le programme vous demande de relancer lOCR des pages concernes avant lexportation.

Enregistrement des images originales


Les images originales dun document peuvent tre enregistres sur disque sous diffrents types de fichiers. Voir Types de fichier pour louverture et lenregistrement des images , page 100. 1. Choisissez Enregistrer image dans le menu Fichier. Dans la bote de dialogue affiche, slectionnez un emplacement de dossier et un type de fichier pour vos images. Indiquez le nom du fichier. 2. Slectionnez l'enregistrement de l'image de zone actuelle uniquement, de l'image actuelle, des images de pages slectionnes ou de toutes les images du document. Dans ces deux derniers cas, vous pouvez placer lensemble des images dans un seul fichier image multipage, condition de spcifier le type de fichier TIFF, MAX ou DCX. Sinon, chaque image est place dans un fichier spar. OmniPage SE ajoute des suffixes numriques aux noms de fichiers fournis afin de gnrer des noms uniques. 3. Cliquez sur OK pour enregistrer la ou les images selon les rglages spcifis. Les zones et le texte reconnu ne sont pas enregistrs. Si possible, le fichier conserve les proprits daffichage : noir et blanc, niveaux de gris ou couleur. Les images en noir et blanc sont enregistres avec la rsolution originale. Dans le cas des images en niveaux de gris et en couleur, la rsolution est rduite environ 150 ppp.
Pour afficher la taille et la rsolution originale d'une image, placez le curseur sur sa vignette dans la fentre d'image. Vous pouvez enregistrer vos documents dans cinq versions du format PDF dans OmniPage Pro. Deux de ces versions permettent d'enregistrer les images originales, tandis que les autres enregistrent les rsultats de l'OCR. Pour plus dinformations, reportez-vous aux sections suivantes. L'enregistrement au format PDF n'est pas pris en charge par OmniPage SE.

84

Enregistrement et exportation

Chapitre 5

Enregistrement des rsultats de lOCR


Les images reconnues dun document peuvent tre enregistres sur disque sous diffrents types de fichiers. Voir Types de fichier pour lenregistrement des rsultats de lOCR , page 102. 1. Choisissez Enregistrer sous dans le menu Fichier, ou cliquez sur le bouton Exporter les rsultats dans la bote outils OmniPage avec loption Enregistrer sous slectionne dans sa liste droulante. 2. La bote de dialogue Enregistrer sous apparat (voir lillustration ci-dessous).

Cochez cette case pour ouvrir automatiquement le fichier enregistr dans lapplication cible. Slections possibles : Toutes les pages Page actuelle Pages slectionnes Slectionnez les pages au moyen des vignettes ou dans le gestionnaire de documents.

Cliquez sur volu pour afficher la partie infrieure de la fentre, et sur Standard pour la masquer. Cliquez sur ce bouton pour afficher et modifier les options de sortie pour le type de fichier actuel. Slections possibles : Regrouper les pages en un seul fichier Crer un fichier par page Crer un fichier aprs chaque page blanche Crer un fichier par image

3. Slectionnez un emplacement de dossier et un type de fichier pour votre document. Le type de fichier OPD (Document OmniPage) apparat en dernire position dans la liste des types disponibles. Slectionnez ensuite un niveau de formatage pour le document. Voir Slection dun niveau de formatage , page 87. 4. Indiquez le nom du fichier. Cliquez sur le bouton volu pour spcifier un intervalle de pages, une option de sparation de fichiers ou d'autres options d'enregistrement et slectionnez les options voulues. Voir Slection des options d'enregistrement volues , page 88.

Enregistrement des rsultats de lOCR

85

5. Cliquez sur OK. Le document est enregistr sur disque selon les rglages spcifis. Si l'option Enregistrer et lancer est active, le fichier export apparat dans son application cible, c.--d. l'application associe ce type de fichier dans Windows ou dans les options d'enregistrement volues pour le filtre du type de fichier slectionn.
Les graphiques, les grilles de tableaux et les autres proprits sont enregistrs dans le document uniquement si le type de fichier slectionn les supporte, et s'ils sont configurs pour conservation dans les paramtres volus (Options de filtre) du type de fichier actuel. Si plusieurs fichiers dexportation sont crs, OmniPage SE ajoute des suffixes numriques aux noms de fichiers fournis afin de gnrer des noms uniques. Si, lors de l'importation des fichiers image, vous activez l'option Crer un fichier aprs chaque page blanche, vous pouvez placer des pages blanches dans le document. Voir Importer des fichiers image , page 50. Si vous activez l'option Crer un fichier par image, aucun nom de fichier nest requis. Le nom du fichier de sortie est obtenu partir du fichier d'entre qui l'a gnr ; seule l'extension change.

Enregistrement dun document lors dune session de travail


Cliquez sur l'outil Enregistrer dans la barre doutils Standard ou choisissez Enregistrer dans le menu Fichier pour stocker les modifications apportes au document actuel lors dune session de travail. Si vous traitez un document sans titre, la bote de dialogue Enregistrer sous apparat. Dans le cas dun document nomm, la commande Enregistrer effectue une sauvegarde sous le nom et le type de fichier du dernier enregistrement, tel quindiqu dans la barre de titre. Ces donnes s'affichent uniquement si le document entier a t enregistr. Si le document est au format Document OmniPage, les images nouvelles ou modifies, les zones modifies, les rsultats de lOCR et les donnes dapprentissage sont enregistres. Si le document est dans un autre format, seules les modifications apportes aux rsultats de lOCR sont enregistres. Si vous souhaitez retraiter un document dans OmniPage SE lors dune session ultrieure, enregistrez-le en tant que Document OmniPage. Ce format reprsente un type de fichier de sortie permettant de sauvegarder limage originale, ainsi que les rsultats de lOCR, les rglages et les donnes dapprentissage. Voir Documents OmniPage , page 31. Les rfrences aux donnes d'apprentissage ne s'appliquent pas OmniPage SE.

86

Enregistrement et exportation

Chapitre 5
La bote de dialogue Enregistrer sous affiche les types de fichier disponibles dans la liste droulante Enregistrer sous. Le type de fichier Document OmniPage apparat en dernire position dans la liste. Si vous enregistrez dabord le document au format Document OmniPage (par exemple, memo.opd), puis le modifiez et lenregistrez au format texte (par exemple, memo.txt), puis le remodifiez et cliquez sur Enregistrer, les dernires modifications sont enregistres dans le fichier memo.txt, et non dans le fichier OPD. Lorsque vous fermez le document ou quittez le programme, vous tes invit enregistrer le fichier s'il na pas t enregistr en tant que document OmniPage ou si des modifications ont t effectues depuis la dernire sauvegarde au format OPD.

Slection dun niveau de formatage


Le niveau de formatage pour l'exportation est dfini au moment de lopration, dans la bote de dialogue Enregistrer sous, Copier dans le Presse-papiers ou Envoyer comme e-mail. Trois de ces niveaux correspondent aux fentres de formatage du mme nom dans l'diteur de texte. Cependant, le niveau appliquer pour l'enregistrement ne dpend pas de la fentre de formatage affiche dans l'diteur de texte. Lorsque vous exportez vers un fichier ou un e-mail, commencez par spcifier le type de fichier : ce choix dtermine les niveaux de formatage disponibles. Vous trouverez un rcapitulatif dans un tableau du chapitre 6. Voir Types de fichier pour lenregistrement des rsultats de lOCR , page 102. Les niveaux de formatage sont les suivants : Aucun formatage Pour afficher le texte en une seule colonne avec alignement gauche, dans un seul style et corps de police. Les lments graphiques et les tableaux ne sont pas supports pour l'exportation vers des fichiers de type Texte ou Unicode. Vous pouvez exporter le texte brut vers pratiquement tout type de fichier et application cible ; dans ce cas, vous pouvez conserver les lments graphiques, les tableaux et les puces. Conserver le formatage polices/paragraphes Pour afficher le texte en une seule colonne et conserver les styles de police et de paragraphe, avec des lments graphiques et des tableaux. Cette option est disponible pour la plupart des types de fichier. Pages en continu Pour conserver la mise en page du document original (y compris la disposition en colonnes). Si possible, les colonnes et les retraits, et non les cadres ou les blocs de texte, sont utiliss pour assurer lenchanement du texte. La fonction de

Enregistrement des rsultats de lOCR

87

formatage des pages en continu nest pas propose dans OmniPage SE. Elle nest disponible que dans OmniPage Pro. True Page Pour conserver la mise en page du document original (y compris la disposition en colonnes). Les cadres et les blocs de texte, dimage et de tableau sont utiliss. Cette option concerne uniquement les applications cibles supportant ce type dopration. Feuille de calcul Cette option exporte les rsultats de l'OCR dans un tableau, adapt pour les applications de feuille de calcul. La conversion du texte en une colonne unique pour les exportations en mode Aucun formatage et Conserver le formatage polices/paragraphes s'effectue de gauche droite et de haut en bas :
Page originale Rsultat sans colonnes

Avant l'exportation, assurez-vous que l'ordre sans colonnes des lments est correct dans la fentre Aucun formatage et Conserver le formatage polices/ paragraphes. Si tel n'est pas le cas, passez True Page et cliquez sur l'outil Afficher ordre de lecture pour indiquer lordre voulu par des flches. Pour spcifier un ordre diffrent, utilisez l'outil Changer lordre de lecture. Les zones multicolonnes indiquent les colonnes lies. Si ces liens ne sont pas adapts, dgroupez la zone et modifiez l'ordre des lments qu'elle inclut.

Slection des options d'enregistrement volues


Pour disposer d'un contrle prcis sur l'exportation, cliquez sur le bouton Options de filtre dans la section volu de la bote de dialogue Enregistrer sous. Une bote de dialogue portant le nom du type de fichier actuel s'affiche. Elle propose une srie d'options adaptes ce type de fichier. En premier lieu, confirmez ou modifiez le niveau de formatage ; ces donnes dterminent les autres options affiches. Slectionnez ensuite les options voulues. Vous trouverez la description de ces oprations dans l'aide en ligne. Pour appliquer les paramtres modifis l'enregistrement actuel uniquement, cliquez sur Appliquer.

88

Enregistrement et exportation

Chapitre 5
Pour rtablir la valeur par dfaut de tous les paramtres du type de fichier actuel, cliquez sur Valeurs par dfaut. Pour appliquer les paramtres modifis l'enregistrement en cours et les stocker en tant que paramtres utiliser ultrieurement, si ce type de fichier est encore une fois slectionn pour enregistrement, cliquez sur Enregistrer.

Le programme actuellement associ au type de fichier choisi pour la fonction Enregistrer et lancer s'affiche au bas de la bote de dialogue. Pour spcifier un programme diffrent, cliquez sur le bouton portant les points de suspension. Pour crer votre propre filtre personnalis, dfinissez vos paramtres, cliquez sur Nouveau filtre, entrez le nom voulu, puis cliquez sur OK. Vous pouvez aussi commencer par nommer le filtre, puis modifier les paramtres et cliquer sur Enregistrer. Les filtres personnaliss sont utiles pour les tches rptitives, par exemple, la publication d'un hebdomadaire. Vous pouvez ainsi exporter toutes les pages reconnues, avec un formatage adapt leur utilisation prvue. Pour un type de fichier donn, vous pouvez aussi crer un groupe de filtres personnaliss dfinissant les options d'enregistrement appropries pour chaque niveau de formatage, par exemple : RTF Aucun formatage, RTF Conserver le formatage polices/paragraphes et RTF True Page. Il est possible de modifier les options de filtre sans effectuer aucun enregistrement dans un fichier. Ouvrez la bote de dialogue Filtres d'exportation partir du menu Outils. Slectionnez le filtre voulu et cliquez sur le bouton Options. Le bouton Appliquer n'est pas disponible dans ce cas.

Enregistrement des rsultats de lOCR

89

Enregistrement dun document au format PDF


Cette section ne s'applique pas OmniPage SE. Dans OmniPage Pro 12, lors de lenregistrement au format PDF (Portable Document Format), vous avez le choix entre cinq options : PDF (format standard) Les pages exportes conservent lapparence du mode True Page de lditeur de texte. Le fichier PDF peut tre affich et recherch dans une visionneuse PDF, et dit dans un diteur PDF. PDF dit Utilisez cette option si vous avez effectu un grand nombre de modifications d'dition dans les rsultats de l'OCR. Vous disposez de trois options pour le niveau de formatage, dont True Page. Le fichier PDF peut tre affich, explor et dit. PDF avec image sur texte Le fichier PDF peut tre affich, mais il ne peut tre modifi dans un diteur PDF. Les images originales sont exportes, mais les images sont toutes assorties d'un fichier texte li pour permettre d'effectuer une recherche dans le texte. Tout mot trouv est contrast dans limage. PDF avec substitution dimage Ce format est similaire au format PDF standard, mais l'image originale se substitue aux mots contenant des caractres de rejet et douteux, ce qui assure un affichage identique au document original. Le fichier PDF peut tre affich, explor et dit. PDF avec image uniquement Les images originales sont exportes. Le fichier PDF peut tre affich, mais le texte ne peut tre ni modifi ni explor dans un diteur PDF.

Copie des pages dans le Presse-papiers


Vous pouvez copier les rsultats de l'OCR dans le Presse-papiers, partir de la page actuelle, des pages slectionnes ou de toutes les pages du document. Le processus de copie est suivi par une jauge de progression. Vous pouvez ensuite coller le contenu du Presse-papiers dans une autre application. Le formatage du texte (gras, italique, etc.) est conserv si la copie est ralise vers une application compatible avec le format RTF 6.0/95. Sinon, seules les donnes textuelles ou Unicode sont copies. Les graphiques sont conservs dans les applications grant linsertion dimages.

90

Enregistrement et exportation

Chapitre 5

w Pour copier des pages dans le Presse-papiers :

Dans le cas dun traitement automatique, slectionnez la commande Copier dans le Presse-papiers dans la liste droulante Exporter les rsultats de la bote outils OmniPage ou dans la fentre de lAssistant OCR. La bote de dialogue Copier dans le Presse-papiers s'affiche ds que la dernire page disponible a t reconnue ou vrifie. Dans le cas dun traitement manuel, slectionnez la commande Copier dans le Presse-papiers dans la liste droulante Exporter les rsultats, puis cliquez sur le bouton correspondant. La bote de dialogue Copier dans le Presse-papiers s'affiche immdiatement. Spcifiez l'intervalle de pages et le niveau de formatage voulus, puis cliquez sur OK pour lancer la copie.
Vous pouvez utiliser la fonction Glisser-dplacer pour effectuer un copier-coller pour la page actuelle. Appuyez sur les touches Ctrl+Tab, et tout en les maintenant enfonces, cliquez sur la page actuelle dans la fentre d'image, puis faites glisser le curseur vers une application cible avec un document ouvert. Le contenu de la page est coll la position du curseur. La reconnaissance est excute, si ncessaire.

Ajout de pages un e-mail comme pice jointe


Si vous disposez dune application compatible MAPI, telle que Microsoft Outlook, vous pouvez envoyer les rsultats de la reconnaissance sous la forme dun ou plusieurs fichiers joints un message lectronique.

w Pour envoyer des pages comme pice jointe un e-mail :

Dans le cas dun traitement automatique, slectionnez la commande Envoyer comme e-mail dans la liste droulante Exporter les rsultats de la bote outils OmniPage. Ds que la reconnaissance ou la vrification de la dernire page disponible du document est termine, la bote de dialogue Envoyer comme e-mail apparat. Dans le cas dun traitement manuel, slectionnez la commande Envoyer comme e-mail dans la liste droulante Exporter les rsultats, puis cliquez sur le bouton correspondant. La bote de dialogue Envoyer comme e-mail saffiche sur-le-champ.

Ajout de pages un e-mail comme pice jointe

91

Pendant toute priode dinactivit du programme, vous pouvez afficher la bote de dialogue Envoyer comme e-mail en choisissant la commande Envoyer comme e-mail dans le menu Fichier.

1. Cette bote de dialogue permet de spcifier le type de fichier, un intervalle de page, un niveau de formatage et les options d'envoi : une pice jointe pour toutes les pages, une pice jointe par page, une pice jointe aprs chaque page vierge ou une pice jointe pour chaque fichier d'entre. Slectionnez les options voulues et cliquez sur OK. 2. Au besoin, connectez-vous votre application de messagerie. 3. La fentre qui souvre gnre un nouveau message et y joint la ou les pices spcifies. Les pices jointes adoptent le nom utilis lors du dernier enregistrement du document dans OmniPage SE ou emploient le nom OmniPage Sans titre . Lextension de fichier approprie est ajoute, ainsi que des suffixes numriques dans le cas de plusieurs pices jointes. 4. Spcifiez une ou des adresses de destinataire, tapez le texte du message et cliquez sur le bouton Envoyer.
Le programme peut dtecter des adresses lectroniques mesure qu'il reconnat les pages et qu'il les transmet l'diteur de texte. Si vous cliquez sur une adresse, votre application de messagerie s'ouvre ; elle affiche un nouveau message vide indiquant uniquement cette adresse.

92

Enregistrement et exportation

Chapitre 6

Informations techniques
Ce chapitre regroupe les informations sur le dpannage des problmes rencontrs lors de l'utilisation d'OmniPage SE et d'autres informations techniques relatives au logiciel. Consultez galement le fichier ReadMe/ LisezMoi et l'aide d'OmniPage SE, disponibles en ligne, ou visitez le site Web de ScanSoft. La section du site consacre aux scanners (Scanner Guide) fournit rgulirement des informations dtailles et mises jour sur la configuration et le support des diffrentes marques de scanner. Le fichier ReadMe/LisezMoi contient des informations de dernire minute concernant OmniPage SE. Pour accder au fichier ReadMe/LisezMoi et au site Web de ScanSoft, utilisez le menu Aide. Ce chapitre traite les sujets suivants :
x

Dpannage Solutions de premier recours Test de OmniPage SE Augmentation de la quantit de mmoire disponible Augmentation de l'espace disque Reconnaissance de texte incorrecte Reconnaissance de fax incorrecte Problmes de systme ou de performances pendant lOCR Support ODMA Fonctions volues du module Planifier OCR Types de fichier supports Types de fichier pour louverture et lenregistrement des images Types de fichier pour lenregistrement des rsultats de lOCR Dsinstallation du logiciel

x x x

OmniPage SE Manuel dutilisation

93

Dpannage
OmniPage SE est une application trs simple demploi, mais la diversit des configurations systme peut tre une source de problme. Lisez toujours attentivement les messages derreur ; leur nonc vous suggre souvent les mesures prendre vrifier les connexions, fermer toutes les autres applications pour librer de la mmoire, etc. Dans bien des cas, vous naurez pas besoin dautres renseignements de dpannage. Pour plus de dtails sur loptimisation de votre environnement et de vos applications, consultez la documentation Windows.

Solutions de premier recours


Si vous rencontrez un problme lors du lancement ou de lutilisation dOmniPage SE, commencez par vrifier les points suivants :
x x x

Vrifiez que la configuration de votre systme respecte les spcifications prsentes. Voir Environnement requis , page 12. Vrifiez que le scanner est sous tension et que ses cbles sont correctement connects. Pensez visiter le site Web de ScanSoft (www.scansoft.com), qui propose des notes techniques concernant les problmes les plus courants affrents l'utilisation d'OmniPage. Ces pages Web peuvent galement inclure des conseils sur l'installation et le dpannage du logiciel. teignez le scanner et lordinateur, puis rallumez-les (le scanner en premier). Vrifiez que vos applications habituelles fonctionnent correctement. Avant dutiliser votre scanner avec OmniPage SE, excutez le logiciel livr avec celui-ci pour vrifier quil fonctionne correctement. Vrifiez que votre systme dispose des versions correctes des pilotes de scanner, dimprimante et daffichage vido. Pour plus de dtails, visitez le site Web de ScanSoft (accessible via le menu Aide), notamment la page consacre aux scanners (Scanner Guide). Excutez lutilitaire ScanDisk (Windows 98 et Me) ou Check Disk (Windows NT, 2000 et XP) pour vrifier lintgrit du disque dur. Pour plus de dtails, reportez-vous laide en ligne de Windows. Dfragmentez le disque dur. Pour plus de dtails, reportez-vous laide en ligne de Windows. Dsinstallez et rinstallez OmniPage SE (voir la dernire section de ce chapitre, Dsinstallation du logiciel , page 103).

x x

x x

94

Informations techniques

Chapitre 6

Test de OmniPage SE
Le redmarrage de Windows 98, Me, 2000 et XP en mode sans chec ou de Windows NT en mode VGA permet de tester OmniPage SE sur un systme configuration simplifie. Cette solution est conseille en cas de blocage persistant du systme ou dOmniPage SE. Pour plus de dtails, reportez-vous laide en ligne de Windows.
Les scanners ne fonctionnent pas avec OmniPage SE en mode sans chec et en mode VGA ; ne testez pas les problmes de scanner sous ces modes. w

Pour tester OmniPage SE en mode sans chec (Windows 98, 2000, Me et XP) : 1. Redmarrez le systme : lorsque le message Dmarrage de Windows apparat, appuyez sur <F8>. 2. Lancez OmniPage SE et excutez lOCR dune image. Utilisez un fichier image existant, par exemple l'un des exemples de fichiers image. Si OmniPage SE ne dmarre pas ou ne fonctionne pas correctement en mode sans chec, cela signifie gnralement que le problme se situe au niveau de linstallation. Dsinstallez et rinstallez OmniPage SE (voir la fin de ce chapitre), puis excutez le programme en mode sans chec. Si OmniPage SE fonctionne correctement en mode sans chec, le problme provient sans doute dun conflit avec lun des pilotes de priphrique. Relancez Windows en mode de confirmation tape par tape. Pour plus de dtails, reportez-vous laide en ligne de Windows.

Pour tester OmniPage SE en mode VGA (Windows NT) : 1. Relancez lordinateur. 2. Slectionnez la commande correspondant au mode VGA et appuyez sur la touche Entre. 3. Appuyez sur Ctrl+Alt+Suppr et slectionnez Gestionnaire des tches. 4. Dans la fentre Gestionnaire des tches, slectionnez toutes les applications darrire-plan et cliquez sur Fin de tche. Pour plus de dtails, reportez-vous laide en ligne de Windows. 5. Lancez OmniPage SE et excutez lOCR dune image. Utilisez un fichier image existant, par exemple l'un des exemples de fichiers fournis.

Dpannage

95

Vous pouvez galement excuter OmniPage SE depuis une ligne de commande en mode sans chec. Choisissez Dmarrer Excuter, recherchez le fichier OmniPage.exe et ajoutez l'option de ligne de commande /safe. Cette opration lance le programme, mais sans prendre en compte les rglages enregistrs et sans essayer de rcuprer des documents ferms incorrectement.

Augmentation de la quantit de mmoire disponible


Lorsque la mmoire vive disponible (RAM) est insuffisante, les performances d'OmniPage SE se dgradent : cela se manifeste par l'affichage de messages derreur, un fonctionnement ralenti, de nombreux accs au disque dur, etc. Dans ce cas, appliquez les solutions suivantes :
x x x x x x

Relancez lordinateur. Fermez les autres applications pour librer de la mmoire. Fermez les fentres OmniPage superflues. Dfragmentez le disque dur (pour plus de dtails, consultez laide en ligne de Windows). Librez de lespace sur le disque dur. Augmentez la mmoire vive (RAM). La quantit de mmoire RAM conditionne la vitesse de la reconnaissance. Voir Environnement requis , page 12.

Augmentation de lespace disque


Si lespace disponible sur le disque dur est insuffisant, les performances dOmniPage SE risquent de se dgrader. Dans ce cas, appliquez les solutions suivantes :
x x

Videz la Corbeille de Windows. Quittez toutes les applications ouvertes et supprimez les fichiers *.tmp prsents dans le dossier Temp, (rsidant gnralement dans le dossier Windows). Excutez l'utilitaire ScanDisk ou Check Disk. Crez une copie de sauvegarde des fichiers superflus, puis supprimez ces fichiers du disque dur. Supprimez les applications Windows que vous nutilisez pas. Dfragmentez le disque dur. Videz le cache de votre navigateur Web et diminuez sa taille.

x x x x x

96

Informations techniques

Chapitre 6

Reconnaissance de texte incorrecte


Si une partie du document original nest pas convertie en texte correctement pendant lOCR, vous pouvez avoir recours aux solutions suivantes :
x

Examinez limage de page originale et vrifiez que tous les blocs de texte sont entours dune zone (tout bloc de texte non entour dune zone est ignor lors de la reconnaissance). Pour plus de dtails sur la cration et la modification de zones, consultez la section Gestion des zones , page 60. Vrifiez que les zones de texte sont identifies correctement. Si ncessaire, slectionnez dautres valeurs de type et/ou de contenu pour les zones existantes et relancez la reconnaissance du document. Voir Types et proprits de zone , page 58. Assurez-vous que vous navez pas charg un gabarit incorrect. Si les bords des zones empitent sur le texte, la qualit de la reconnaissance en est affecte. Ajustez les curseurs de luminosit et de contraste (onglet Scanner de la bote de dialogue Options) : vous devrez sans doute essayer plusieurs combinaisons de rglages pour obtenir le rsultat escompt. Vrifiez la rsolution de limage originale : placez le curseur sur la vignette de page voulue pour afficher une mini-fentre. Une rsolution bien suprieure ou infrieure 300 ppp risque daffecter la reconnaissance. Vrifiez que les langues du document ont t correctement slectionnes dans les rglages OCR ; seules les langues effectivement prsentes dans le document doivent tre slectionnes. Activez IntelliTrain et effectuez les corrections ncessaires. Cette fonction convient tout particulirement aux polices stylises et aux documents prsentant une dgradation uniforme. Si IntelliTrain tait actif lors de lOCR, dsactivez-le car il n'est pas destin certains types de documents trs dgrads. Les rfrences aux donnes d'apprentissage ne s'appliquent pas OmniPage SE. Excutez un apprentissage manuel ou ditez les donnes dapprentissage existantes pour supprimer toute valeur incorrecte. Si vous activez le mode True Page dans lditeur de texte pour laffichage ou lexportation, le texte reconnu est plac dans des cadres ou des blocs de texte. Si lun de ces blocs de texte est trop petit, une partie du texte peut tre masque. Pour afficher le texte cach, placez le curseur dans ce bloc de texte et utilisez les touches flches du clavier pour faire dfiler le texte dans la direction requise.

x x

Dpannage

97

Vrifiez la vitre, les miroirs et les objectifs du scanner. liminez les traces de doigt et de poussire.
OmniPage SE reconnat uniquement les caractres imprims (machine crire, imprimante laser, etc.). Le programme peut traiter les caractres matriciels, mais la prcision de lOCR risque dtre insatisfaisante pour les textes de qualit moyenne. Le programme naccepte pas les caractres manuscrits ; toutefois, vous pouvez lui demander de conserver un bloc de texte manuscrit (une signature, par exemple) en entourant celui-ci dune zone de type Graphique.

Reconnaissance de fax incorrecte


Pour amliorer la prcision de reconnaissance des fax, appliquez les solutions suivantes :
x x

Demandez votre correspondant dutiliser un document original propre, impression nette. Demandez votre correspondant de slectionner le mode Fin (ou quivalent) lors de lenvoi de fax. En gnral, la rsolution obtenue est de 200x200 ppp. Si votre PC et celui de votre correspondant sont quips dun fax-modem, demandez-lui de transmettre son fichier fax directement votre ordinateur. Vous pouvez ensuite enregistrer ce fax sous forme de fichier image, puis le charger dans OmniPage SE. Voir Importer des fichiers image , page 50.

Problmes de systme ou de performances pendant lOCR


Si le systme se bloque pendant la reconnaissance, ou si le traitement est particulirement lent, essayez les solutions suivantes :
x x x x

liminez les problmes dinsuffisance de mmoire vive et d'espace disque. Voir Test de OmniPage SE , page 95. Rduisez en icnes toutes les applications (ou appuyez plusieurs fois sur Alt+Tab) pour visualiser les ventuels messages derreur Windows. Vrifiez la qualit de l'image. Pour amliorer la qualit des images numrises, consultez la documentation de votre scanner. Simplifiez le traitement des images de page charges (texte dense, nombreux graphiques et/ou formatage complexe) en excutant la reconnaissance sur une partie dimage la fois. Tracez les zones

98

Informations techniques

Chapitre 6
manuellement ou modifiez les zones cres en mode automatique, puis lancez la reconnaissance sur une partie de page la fois. Voir Gestion des zones , page 60.
x

Relancez Windows 98, 2000, XP ou 2000 en mode sans chec (ou Windows NT en mode VGA), et testez OmniPage SE en effectuant la reconnaissance des exemples de fichiers image.

Le traitement est plus lent si vous excutez plusieurs tches simultanment (par exemple, OCR et impression).

Support ODMA
Ceci ne s'applique pas OmniPage SE. Si votre rseau local inclut un systme DMS capable de supporter les clients ODMA, OmniPage Pro peut vous permettre de l'utiliser. Une fentre ODMA s'affiche alors dans la bote de dialogue Options, vous permettant de spcifier les types de fichier autoriss et d'autres paramtres. Une interface ODMA remplace les botes de dialogue Charger un fichier image et Ouvrir un document OmniPage (*.OPD). Vous pouvez ainsi charger les fichiers image et OPD un par un, partir du systme de fichiers de rseau ou de votre ordinateur local. La bote de dialogue Enregistrer sous comporte le bouton Enregistrer dans DMS, qui permet d'enregistrer dans ce systme les documents reconnus. Pour plus de dtails, reportez-vous l'aide en ligne.

Fonctions volues du module Planifier OCR


Ceci ne s'applique pas OmniPage SE. Le module Planifier OCR vous permet de dsigner les fichiers d'entre pour un travail. Dans certaines ditions d'OmniPage Pro, vous pouvez spcifier le traitement de tous les fichiers d'un type donn dans un ou plusieurs dossiers. Ces versions proposent galement la fonction de la surveillance des dossiers. Le premier cran de l'Assistant de nouveau travail comprend deux boutons : Fichiers et Dossiers. Il inclut galement la case cocher Surveiller l'arrive de fichiers dans les dossiers. Slectionnez cette option et spcifiez au moins un dossier. Tous les fichiers du ou des types spcifis entrant dans le ou les dossiers slectionns seront traits l'arrive. Dans la cinquime fentre de l'Assistant, vous pouvez dfinir une heure de dpart et d'arrt pour la procdure de surveillance des travaux. Vous pouvez galement dcider de ne pas spcifier une heure d'arrt lors de la configuration dun travail. Dans ce cas, utilisez le bouton Modifier du module Planifier OCR pour entrer lheure d'arrt par la suite.

Support ODMA

99

Vous pouvez mettre les travaux en pause et les reprendre. Le bouton Affichage vous permet de visualiser, fichier par fichier, le journal des traitements termins dun travail slectionn. Pendant l'excution d'un travail, vous pouvez consulter le journal des travaux afin de suivre (fichier par fichier) la progression de l'opration et les problmes signals. La quatrime fentre de l'Assistant de nouveau travail vous permet de spcifier un type de fichier et de choisir les options de sparation des fichiers. Si vous choisissez l'option Un fichier de sortie pour chaque fichier d'entre, vous spcifiez uniquement un dossier ; les fichiers de sortie conservent leurs noms d'entre, mais avec d'autres extensions. Si vous choisissez une option exigeant plusieurs fichiers de sortie, vous indiquez un nom de fichier et le programme y ajoute automatiquement des suffixes numriques afin de gnrer des noms uniques. Si l'entre spcifie provient d'un groupe de fichiers, vous pouvez dfinir un dossier de sortie diffrent pour chaque dossier d'entre.

Types de fichier supports


OmniPage gre de nombreux types de fichier pour les images et le texte.

Types de fichier pour louverture et lenregistrement des images


Type de fichier BMP, bitmap DCX GIF JPEG MAX PCX PDF PNG TIFF compress G3 TIFF compress G4 TIFF compress LZW TIFF FX TIFF PackBits TIFF non compress Extension bmp dcx gif jpg max pcx pdf png tif tif tif xif tif tif Multipage Non Oui ND Non Oui Non ND Non Oui Oui ND Oui Oui Oui Ouverture/ Enreg. Ouvert. et enreg. Ouvert. et enreg. ND Ouvert. et enreg. Ouvert. et enreg. Ouvert. et enreg. ND (voir remarque) Ouvert. et enreg. Ouvert. et enreg. Ouvert. et enreg. ND Ouverture Ouvert. et enreg. Ouvert. et enreg. Noir et blanc, niv. de gris, couleur Tous Tous ND Niv. de gris, couleur Tous Tous ND Tous Noir et blanc Noir et blanc ND Tous Tous Tous

100

Informations techniques

Chapitre 6
Les fichiers image imports peuvent prsenter une rsolution maximale de 600 ppp, mais la valeur de 300 ppp (dans le sens horizontal et vertical) est recommande pour une prcision de reconnaissance optimale. Le programme stocke les images en noir et blanc avec leur rsolution originale ; toutefois, la rsolution denregistrement des images en niveaux de gris et en couleur ne dpasse gnralement pas 150 ppp. Cela signifie que ces images ne sont pas appropries pour un traitement d'OCR ultrieur. Placez le curseur sur une vignette de page pour afficher une mini-fentre indiquant la taille et la rsolution de limage originale.
Si vous tentez denregistrer une image en noir et blanc au format JPEG, le programme vous propose deffectuer une conversion en niveaux de gris. Dans le cas des formats TIFF G3 et G4, OmniPage suggre une conversion en noir et blanc. Seul OmniPage Pro 12 gre l'enregistrement au format PDF et propose l'utilisateur cinq versions de ce format, dont deux (Avec image uniquement et Avec image sur texte) permettent l'exportation des images originales. Vous pouvez slectionner le format requis dans la bote de dialogue Enregistrer sous. Voir Enregistrement dun document au format PDF , page 90. Veuillez noter que OmniPage SE ne gre pas les fonctionnalits PDF. OmniPage SE ne gre pas non plus les fichiers GIF et TIFF LZW.

Types de fichier supports

101

Types de fichier pour lenregistrement des rsultats de lOCR


Le tableau qui suit indique les niveaux de formatage disponibles pour chaque type de fichier.
Type de fichier Extension Aucun formatage Conserver le formatage polices/ paragraphes Pages en continu (1) True Page Feuille de calcul lments graphiques Tableaux

eBook (voir remarque1) Excel 97, 2000 Excel 3.0 7.0 FrameMaker 5.5.3 Freelance Graphics Harvard Graphics HTML 4.0 (voir remarques 1 et 2) HTML 3.2 (voir remarque 2) Microsoft PowerPoint 97 Microsoft Publisher 98 Microsoft Word 6.0, 97, 2000, XP PageMaker 6.5.2 Quattro Pro pour Windows 4.0, 8 PDF (format standard) (1) PDF dit (voir remarque 1) PDF avec image sur texte (1) PDF avec substitution d'image (1) PDF avec image uniquement (1) RTF Word 2000, 97, 95/6.0 (3) Ventura Publisher WordPad WordPerfect 8, 9, 10 WordPerfect 6.0, 6.1 WordPerfect 5.1, 5.2 XML (voir remarque1) Texte et Texte avec sauts de ligne (voir remarque 4) Texte avec donnes spares par des virgules (voir remarque 4) Texte format (voir remarque 4) Document OmniPage (5)

opf xls xls mif txt txt htm htm rtf rtf doc doc xls pdf pdf pdf pdf pdf rtf doc rtf wpd wpd wp5 xml txt csv txt opd

q q q q q q q q q q q q q

q q q q q q q q q q q q q q q q q q q q q

qq qq

q q q

qq

qq q q

qq qq qq qq qq qq

q q qq qq qq qq q

qq qq q q q qq q qq

q qq q q q qq qq qq qq qq qq

(q )
q

(q )
q q q q q q q q q q q q q q q q q q q q q q q q

qq qq qq q

(q )
q q

(q )
q q

Conserve les proprits d'affichage

102

Informations techniques

Chapitre 6
lments graphiques q Le type de fichier supporte les graphiques
qq Le type de fichier supporte les graphiques, avec la possibilit, au moment de l'exportation, de conserver ou d'omettre les graphiques.

Tableaux q Le type de fichier supporte les tableaux avec grilles, sans options de tableau
au moment de l'exportation qq Le type de fichier supporte les tableaux et vous pouvez choisir d'utiliser des grilles ou des colonnes spares par des tabulations q Le type de fichier ne supporte pas les grilles des tableaux ; vous pouvez choisir une conversion en colonnes spares par des tabulations ou des espaces

1 2 3 4

Ces formats et Pages en continu ne sont pas pris en charge par OmniPage SE. Lors de lenregistrement au format HTML, tous les graphiques sont enregistrs en tant que fichiers image spars, sous le format JPEG. Les rsultats de lOCR sont placs dans le Presse-papiers au format RTF 95/6.0, puis sont colls dans ce format si possible, et sinon, au format Unicode ou ASCII. Les formats de texte sont tous disponibles en tant que Texte ou Unicode. Le format Unicode est compatible avec le plus grand nombre de caractres accentus. Vous pouvez rouvrir les Documents OmniPage crs l'aide de l'dition standard ou spciale d'OmniPage Pro 12. Vous pouvez galement ouvrir dans OmniPage SE des fichiers OPD crs l'aide d'OmniPage Pro 10 ou de l'dition standard ou spciale d'OmniPage Pro 11. Ces fichiers sont imports en tant que documents sans nom. Pour conserver un fichier OPD sous son format d'origine et l'enregistrer dans un nouveau fichier OPD, choisissez un nom diffrent pour ne pas remplacer le fichier d'origine.

Dsinstallation du logiciel
Certains problmes peuvent tre rsolus en dsinstallant puis en rinstallant OmniPage SE. Veillez galement dsinstaller OmniPage SE avant d'installer OmniPage Pro 12 ou toute autre version d'valuation du programme. Le programme de dsinstallation dOmniPage Pro ne supprime pas les fichiers suivants : Fichiers de gabarit de zones (*.zon) Fichiers dapprentissage (*.otd) (Ne concerne pas OmniPage SE) Dictionnaires utilisateur (*.ud) Documents OmniPage (*.OPD)

Dsinstallation du logiciel

103

Pour dsinstaller OmniPage SE sous Windows NT, Windows 2000 ou Windows XP, vous devez ouvrir une session avec privilges dadministrateur.
w

Pour dsinstaller ou rinstaller OmniPage SE :


x x

Fermez OmniPage SE. Dans la barre des tches Windows, cliquez sur Dmarrer, choisissez Paramtres Panneau de configuration et cliquez deux fois sur Ajout/ Suppression de programmes. Slectionnez OmniPage SE et cliquez sur Ajouter/Supprimer. Dans la bote de dialogue qui apparat, cliquez sur Suivant. Slectionnez l'option de suppression ou d'annulation et cliquez sur Suivant. Suivez les instructions jusqu' la fin de la procdure.

x x x x

104

Informations techniques

N D E X

acqurir texte, rglages, 47 ADF, 33, 50, 53 afficher/masquer les marques, 68 aide contextuelle, 9, 25, 33 en ligne, 9 ajouter une zone, 61 apprentissage aux fichiers d'apprentissage, 76 des mots un dictionnaire utilisateur, pages un document, 41 alphanumrique, zone, 58 ancre/flottante barre doutils, 25 ancre/flottante, barre doutils, 70 apprentissage, 73 charger des fichiers dapprentissage, 76 crer des donnes dapprentissage, 76 dcharger des fichiers d'apprentissage, demander l'enregistrement des donnes, donnes dapprentissage non enregistres, 31 diter des fichiers d'apprentissage, 76 enregistrer des fichiers d'apprentissage, fichiers dapprentissage, 76 manuel, 74 Assistant configurer un scanner, 14 de nouveau travail, 49, 99 Planifier OCR, 49, 99 pour le traitement, 45 attributs, caractre, 77 Aucun formatage, mode, 68, 87 augmentation de lespace disque, 96 de la mmoire disponible, 96 automatique mise en page, 54 traitement, 27, 40 avantages de lapprentissage, 73 du format OPD, 32

Formatage, 24, 25 Image, 24, 25 barre des menus, 25 blocs, 26, 78 texte reconnu, 97 bote outils OmniPage, 24, 27, 40 bureau, 24

couleur images, 84 marques, 70 numriser, 52 crer des donnes dapprentissage, 76

70

76 31

cadres, 26, 78, 88, 97 caractres douteux, 68 non imprimables, 68 non reconnus, 68 changer de mode de traitement, 27, 43 charger dictionnaire utilisateur, 72 fichiers dapprentissage, 76 fichiers OPD, 31 gabarits de zones, 55, 64 Charger un fichier image, bote de dialogue, chargeur de feuilles automatique (ADF), 33, colonne unique avec tableaux, mise en page, 54 pages, 54, 58 colonnes dans le gestionnaire de document, 30 dans les tableaux, 63 de remarques dans le gestionnaire de documents, 30 colonnes multiples, mise en page, 54 combin, traitement, 43 Comparaison des fonctionnalits dOmniPage SE et de celles dOmniPage Pro, 8, 10, 19 comparer le texte reconnu limage originale, configurer Direct OCR, 47 un scanner, 14 conseils pour la rsolution des problmes, 94 conservation de la mise en page, 69 Conserver le formatage polices/paragraphes, mode, 68, 87 conserver les styles de paragraphe, 85 consultation de laide en ligne, 9 contextuelle, aide, 33 contraste, 33, 52, 97 contrle du traitement, 42 conversion dimages, 101 copier des pages dans le Presse-papiers, 90

50

50, 53

76

70

dcharger un dictionnaire utilisateur, 72 dcouper en zones en direct, 79 fond, 55 dgrouper les lments, 78 demander l'enregistrement des donnes d'apprentissage, 31 dmarrer le programme, 14 dpannage, 93, 94 dplacer sparations de tableau, 63 dsinstaller OmniPage SE, 103 dictionnaire, 45, 70 ajouter des mots, 70 charger, 72 dcharger, 72 dmarrer, 72 diter, 72 lgal, 70 mdical, 70 spcialis, 70 utilisateur, 70 diffrer le traitement, 31 Direct OCR, 46 Options, bote de dialogue, 33 tracer des zones, 47 diviser des zones, 58 documents avec mise en page variable, 54 copier dans le Presse-papiers, 45, 90 dans OmniPage SE, 23 emplacement des nouvelles pages, 34 enregistrer, 32, 83 enregistrer lors d'une session de travail, exporter, 23, 40, 43, 83 fermer, 31 grer, 28 mise en page, 54 mise en page htrogne, 54 non termins, 31 recto verso, 53, 54 terminer, 41 documents OmniPage, 86 avantages du format OPD, 32 contenu, 86 dfinition, 31 enregistrer sous, 32, 86

86

B
barre doutils ancre, 25 flottante, 25

OmniPage SE Manuel dutilisation

105

donnes dapprentissage, 31 dossiers surveills, 99

E
diter attributs de caractre, 77 attributs de paragraphe, 77 dans True Page, 78 dictionnaire utilisateur, 72 lments graphiques, 78 en direct, 79 et dcouper en zones en direct, 79 fichiers dapprentissage, 76 PDF, format dexportation, 90 tableaux, 62, 78 texte reconnu, 77 diteur de texte, 24, 26, 34, 68 lments graphiques dans lexportation, 85 dans les fichiers HTML, 103 diter, 78 exportation, 102 emplacement des nouvelles pages, 34 en instance, pages, 28 en ligne aide HTML, 9 enregistrer, 17 enregistres, pages, 28 enregistrer applications, Direct OCR, 47 au format OPD, 32, 85 dans un fichier, 46, 84 dictionnaire utilisateur, 72 documents, 83 documents lors dune session de travail, en tant que document OmniPage, 32, Enregistrer et lancer, option, 86 fichiers dapprentissage, 76 gabarits de zones, 64 images originales, 84, 100 OmniPage SE, 17 rsultats de l'OCR, 85 texte, 85 entendre le texte lu voix haute, 81 entre pour Planifier OCR, partir dun dossier, 99 environnement requis, 12 Envoyer comme e-mail, bote de dialogue, Excuter lOCR, bouton, 40, 43 exemples de lapprentissage, 73 fichiers image, 95 exporter dans le Presse-papiers, 90 dans un fichier, 85, 102 lments graphiques, 85, 103 Pages en continu, mode, 88 plusieurs fois, 83, 86 True Page, 88 types de fichiers et niveaux de formatage, 102

vers des applications cibles, 23, 42, 84 vers PDF, 90, 102 vers une messagerie, 91 Exporter le texte reconnu, bouton, 41 Exporter les rsultats, bouton, 43, 85

86 86

fax, reconnaissance incorrecte, 98 fentre dimage, 24, 26 fermer un document, 31 feuille de calcul, mise en page, 55 fichier PDF exportation, 101 importation, 50, 101 fichiers conservs aprs dsinstallation, 103 destination d'exportation, 84 en tant que source de limage, 50 options de sparation, 85, 92 types, 85 types pour lexportation, 87, 102 types supports, 100 fichiers d'apprentissage, dcharger, 76 fichiers image exemples, 36, 95 importer, 22, 50 ordre de lecture, 50 ouvrir, 50, 100 types, 100 fichiers image multipages, 50, 84 fichiers OPD avantages, 32 dfinition, 31 enregistrer, 32 fonctions, nouvelles, 17 fond, 26 valeur Ignorer, 55 valeur Traiter, 55

image originale, enregistrer, 84, 101 images conversion, 101 couleur, 84 diter, 78 enregistrer, 84, 100 fonds, 55 importer, 23, 42 niveaux de gris, 84 noir et blanc, 84 qualit, 52 rsolution, 29, 84, 97, 101 substitution dans les fichiers PDF, 90 taille, 29 importes, pages, 28 importer partir du scanner, 51 depuis des fichiers PDF, 50, 100 depuis un fichier image, 50 des images, 23, 42 Importer la page, bouton, 40, 42 Importer la page, liste droulante, 42 imprimer documents, 31 pages reconnues, 31 indicateurs den-tte et de bas de page, 68 informations techniques, 93 insrer des sparations dans un tableau, 63 insertion de nouvelles pages dans le document, 34 installer OmniPage SE, 13 scanners, 14 IntelliTrain, 34, 49, 97 apprentissage automatique, 74 apprentissage manuel, 74 interface, langue, 34 interrompre le traitement automatique, 41 irrgulires, zones, 60 italique, texte, 77

91

gabarits de zones, 55, 64, 97 dcharger, 64 modifier, 64 remplacer, 64 gnrer les sparations dun tableau, 63 grer des documents, 28 les zones, 60 gestionnaire de documents, 24, 28, 29 personnaliser les colonnes, 30 Gestionnaire des tches, 95 Graphique, type de zone, 59 gras, texte, 77 grouper les lments, 78 guide de dmarrage rapide, 36

J
joindre des pages un e-mail, 91 des zones, 61

L
lancer lapplication cible, 86 un dictionnaire utilisateur, 72 langues dinterface utilisateur, 34 de reconnaissance, 33, 45, 97 lien vers une page Web, 78 lire le texte voix haute, 80 ordre des fichiers image, 50 liste droulante Exporter les rsultats, 43 Importer la page, 42 livres, numrisation, 34 luminosit, 33, 52, 97

H I

hyperliens, 78 Ignorer, valeur des zones, 59

106

Index

M
manuel traage des zones, 42, 55 traitement, 27 marques, 68, 70 menus contextuels, 59 messagerie, 41, 91 messages lectroniques, pices jointes, 91 Microsoft Outlook, 91 minimum environnement requis, 12 mise en page automatique, 54 description, 40, 45, 54 modes Aucun formatage, 68 Conserver le formatage polices/ paragraphes, 68 de lditeur de texte, 26, 68 sans chec, 95 True Page, 69 VGA, 95 modifies, pages, 28 modifier ordre de lecture, 79 partie dune page, 79 types de zones, 59 mots absents du dictionnaire, 68 douteux, 68 marqus dans lditeur de texte, 68 multicolonnes, zones, 26, 78 multipages, fichiers image, 100

O
OCR Assistant, 39, 45, 46 dfinition, 22 Direct OCR, 33, 46 tapes, prsentation, 23 excuter lOCR, 23 Planifier OCR, 49 principales tapes, 23 problmes de performances, 98 rglages, 33 rglages, Direct OCR, 46 traitement automatique, 27, 40 traitement manuel, 27, 42 travaux, Planifier OCR, 49 vrifier les rsultats, 69, 70 omettre des graphiques lors de lexportation, OmniPage bureau, 24 OmniPage Pro nouvelles fonctions, 17 OmniPage SE comparaison de ses fonctionnalits avec celles dOmniPage Pro, 8, 10, 19 dmarrer, 14 dsinstaller, 103 documents dans, 23 enregistrer, 17 installer, 13 rinstaller, 103 tester, 95 versions antrieures, 13 optimiser la luminosit, 33, 52 options de traitement, 34 de vrification, 34, 69 Options, bote de dialogue, 33 ordre de lecture, 79 des lments de page, 79 ouvrir des fichiers image, 50, 100

85

parcourir, 28 plusieurs colonnes, 54 recommencer la reconnaissance, 43 reconnues, 28 relancer la reconnaissance, 41 rordonner, 28 slectionner plusieurs, 28, 29 supprimer, 28, 30 vrifies, 28 Pages en continu, mode, 88 PaperPort, 48 paragraphe conserver les styles de paragraphe, 86 diter les attributs, 77 styles, 77, 85 parcourir pages, 28 PDF, explorer, 90 performances, problmes pendant lOCR, personnalise, mise en page, 34, 55 personnaliser barres doutils, 25 colonnes dans le gestionnaire de documents, 30 pilotes TWAIN pour scanners, 14 Planifier OCR, 49 dossiers surveills, 99 entre partir de dossiers, 99 plusieurs pages, slectionner, 29 prcision amliorer, 51, 73, 74 incidence de la formation, 73 incidence du mode de numrisation, 51 influence de la luminosit, 52 prsentation document, 28 tapes de lOCR, 23 traitement, 38 Presse-papiers, 41, 90 principales tapes de lOCR, 23 problmes espace disque insuffisant, 12, 96 mmoire insuffisante, 12, 96 reconnaissance de fax, 98 systme ou de performances pendant lOCR, 98 proprits de zone, 58

98

niveaux de formatage, 49, 68, 102 types de fichiers, 102 niveaux de gris images, 84 numriser, 52 noir et blanc images, 84 numriser, 52 Nouveau fichier aprs chaque page blanche, option, 50 nouvel apprentissage, 74 nouvelles fonctions, 17 numrique, zone, 58 numrisation contraste, 33 livres, 34 luminosit, 33 sur deux pages, 34 numriser Assistant, 14 couleur, 52 images, 52 importer, 52 luminosit, 52 niveau de gris, 52 noir et blanc, 52

page Web, liens, 78 pages colonne unique, 54, 58 colonne unique avec tableaux, 54 colonnes multiples, 54 copier dans le Presse-papiers, 45, 90 diviser en zones, 28 en instance, 28, 79 enregistres, 28 tat, 28 feuille de calcul, 54 fichiers image multipages, 50, 84, 101 importes, 28 Importer la page, bouton, 40, 42 insertion dans le document, 34 joindre un e-mail, 91 mise en page, 54 modifies, 28 navigation, 24, 81 Nouveau fichier aprs chaque page blanche, option, 50

Q R

qualit de limage, 52 ranges dun tableau, 63 recherche mots absents du dictionnaire, 69 mots douteux, 69 reconnaissance acclrer, 98 enregistrer les rsultats, 85 excessivement lente, 98 excuter, 42 langues, 33, 45, 97 optique de caractres, 22

OmniPage SE Manuel dutilisation

107

prcision, 52, 73 reconnaissance de fax incorrecte, 98 reconnues, pages, 28 rectangulaires, zones, 60 redimensionner les zones, 60 rglages, 34 Acqurir texte, commande, 47 dans l'Assistant OCR, 46 dans la bote de dialogue Options, 33 Direct OCR, 47 types de zones, 62 rinstaller OmniPage SE, 103 relancer traitement automatique, 41 rordonner les pages, 28 rsolution, 29, 84, 97, 101 retour la ligne automatique, 34

dplacer des sparations, 63 diter, 78 gnrer les sparations, 63 insrer des sparations, 63 modifier les sparations, 62 ranges, 62 supprimer les sparations, 62 traiter un tableau dans lditeur de texte, terminer le traitement dun document, 41 tester OmniPage SE, 95 texte enregistrer, 85 impression matricielle, 98 texte reconnu, comparer limage originale, Texte, zone, 59 TIFF, fichiers image, 100 touches pour la lecture voix haute du texte reconnu, 81 traitement partir d'autres applications, 46 automatique, 27, 40 automatique, incomplet, 41 automatique, interrompre, 41 automatique, relancer, 41 avec l'Assistant OCR, 45 changer de mode de traitement, 27, 43 combin, 27, 43 tapes, prsentation, 38 manuel, 27, 42 par tapes, 23, 42 prsentation, 36 ultrieur des documents, 31 traitement automatique incomplet, 41 interrompre, 41 relancer, 41 Traiter, valeur des zones, 59 travaux, Planifier OCR, 49 True Page, 26 dition, 78 exporter, 88 mode, 69 types de fichier supports, 100 de zone, 58

unit de mesure, 34 URL, 78 utiliser Direct OCR, 47

78 zones, 59, 62

70

vrificateur dynamique, 70 vrification diffre, 31 options, 34, 69 ultrieure, 31 Vrification de lOCR, bote de dialogue, 69 vrifies, pages, 28 vrifier les rsultats de lOCR, 69, 70 vignettes, 24, 26, 28

scanners, 51, 98 configurer, 14 pilotes, 14 recto verso, 53 slectionner plusieurs pages, 29 solutions aux problmes de performances, 94 soulign, texte, 77 Soustraire de la zone, outil, 58 spcifier la mise en page du document, 40, Standard barre doutils, 24, 25 stocker les changements du dcoupage en zones, 79 suggestions pendant la vrification, 70 support DMS, 99 ODMA, 99 supprimer dictionnaire utilisateur, 72 fichiers dapprentissage, 76 gabarits de zones, 64 les sparations dun tableau, 63 pages, 28, 30 synthse vocale fonction, 13, 81

54

T
tableau colonnes, 63 dans les pages colonne unique, 54

zones, 26 valeur Ignorer, 59 ajouter , 61 alphanumriques, 58 automatiques, 26, 34, 40, 54, 59 dcharger un gabarit, 65 dfinir les types, 63 diviser, 59 enregistrer un gabarit, 64 gabarit, 55, 64, 97 grer, 60 Graphique, 59 irrgulires, 60 joindre, 61 manuelles, 55, 97, 99 modifier le type, 59 modifier un gabarit, 64 numriques, 58 proprits, 58 rectangulaires, 60 redimensionner, 60 remplacer un gabarit, 64 soustraire de, 59 supprimer un gabarit, 64 sur la page, 28 Tableau, 59, 62 Texte, 59 tracer dans Direct OCR, 47 Traiter, 59 types, 26, 58, 97 zoom, valeurs, 70

108

Index

Vous aimerez peut-être aussi