Vous êtes sur la page 1sur 113
Manuel de l'utilisateur
Manuel de l'utilisateur

AVIS JURIDIQUES

Copyright © 2013 Nuance Communications, Inc. Tous droits réservés. Aucune partie de cette publication ne peut être transmise, transcrite, reproduite ou stockée dans un système de récupération de données, ni traduite dans une langue ou un langage informatique sous quelque forme ou par quelque moyen que ce soit (mécanique, électronique, magnétique, optique, chimique, manuel, etc.) sans l'accord préalable par écrit de Nuance Communications, Inc., 1 Wayside Road, Burlington, Massachusetts 01803-4609, USA.

Le logiciel présenté dans ce manuel est fourni sous licence et son utilisation et sa copie sont soumises aux termes de la licence.

REMARQUE IMPORTANTE Nuance Communications, Inc. fournit cette publication « telle quelle », sans aucune garantie d'aucune sorte, ni expresse ni implicite, y compris mais non seulement, aucune garantie implicite de qualité commerciale ou d'adéquation à un usage particulier. Certains états et certaines juridictions n'autorisant pas l'exclusion de garanties expresses ou implicites dans certains types de transaction, il est possible que la déclaration ci-dessus ne vous concerne pas. Par ailleurs, Nuance se réserve le droit de réviser cette publication et d'en modifier le contenu sans être tenu d'avertir quiconque de ces révisions ou modifications.

MARQUES COMMERCIALES Nuance, ScanSoft, OmniPage, PaperPort, True Page, Direct OCR, Logical Form Recognition et RealSpeak sont des marques commerciales ou des marques commerciales déposées de Nuance Communications, Inc., aux États-Unis et/ou dans d'autres pays. Tous les autres noms de sociétés ou de produits cités peuvent être des marques de leurs propriétaires respectifs.

LICENCES/NOTICES DE PRODUITS TIERS Veuillez vous reporter à la fin de ce guide pour obtenir les reconnaissances/notices de produits tiers.

Nuance Communications, Inc.

1 Wayside Road Burlington, MA 01803-4609 États-Unis

Nuance Communications International BVBA

International Headquarters Guldensporenpark 32 Building D BE-9820 Merelbeke Belgique

T

ABLE

DES

MATIÈRES

BIENVENUE

5

Nouvelles fonctions d'OmniPage 18

7

Nouvelles fonctions d'OmniPage 17

9

Fonctions clés d'OmniPage Professional

11

INSTALLATION ET CONFIGURATION

12

Environnement requis

12

Configuration d'un scanner pour utilisation avec OmniPage

13

Lancement d'OmniPage

15

UTILISATION D'OMNIPAGE

17

Documents OmniPage

17

Bureau OmniPage et modes d'affichage

18

Principales étapes de l'OCR

24

Utilisation d'OmniPage avec PaperPort

25

TRAITEMENT DES DOCUMENTS

27

Méthodes de traitement

27

Définition de la source des images de page

31

Définition de la mise en page du document

37

Prétraitement des images

38

Zones et fonds

47

VÉRIFICATION ET ÉDITION

55

Affichage et niveaux de formatage de l'éditeur

55

Vérification des résultats de l'OCR

56

Vérification du texte reconnu

57

Table de caractères

58

Dictionnaires utilisateur

58

Langues

59

Apprentissage

62

Édition du texte et des images

64

Édition en direct

66

Marquage et biffure de texte

66

Lecture du texte à voix haute

67

Création et édition de formulaires

69

ENREGISTREMENT ET EXPORTATION

72

Enregistrement et exportation

72

Enregistrement des images originales

73

Enregistrement des résultats de l'OCR

73

Ajout de pages à un e-mail comme pièce jointe

79

Envoi vers un lecteur Kindle

80

Autres destinations d'exportation

81

FLUX DE TRAVAIL

83

Assistant Flux de travail

86

Batch Manager

88

Création d'un travail

89

Surveillance de dossiers

93

Surveillance de boîtes de réception

95

Traitement par détection de codes à barres

95

Assistant File-it

97

INFORMATIONS TECHNIQUES

99

Dépannage

99

Types de fichier pris en charge

103

INDEX

104

Bienvenue

Nous vous remercions de la confiance que vous portez à notre logiciel de reconnaissance OmniPage ® 18. La documentation citée ci-dessous est destinée à vous présenter le programme et à faciliter son utilisation.

Manuel de l'utilisateur

Le présent manuel fournit des informations relatives aux principes d'utilisation d'OmniPage 18 :

procédures d'installation et de configuration, description des commandes et zones de travail disponibles, instructions de réalisation de différentes tâches, méthodes de personnalisation et de gestion de traitement et diverses informations techniques. Les descriptions fournies dans le présent manuel se basent sur le système d'exploitation Windows 7™. Conformément à la politique environnementale de Nuance, ce manuel est uniquement disponible au format PDF. Pour obtenir une copie au format standard, nous vous recommandons d'imprimer deux pages par feuille en recto verso.

Ce manuel présuppose que vous maîtrisez les principes de travail dans l'environnement Microsoft Windows. Pour tous détails sur cet environnement (utilisation des boîtes de dialogue, des menus déroulants et contextuels, des barres de défilement, de la fonction Glisser- déplacer, etc.), reportez-vous à la documentation Windows correspondante. Vous devriez également connaître le fonctionnement de votre scanner et de son logiciel. Avant de procéder à la configuration du scanner avec OmniPage 18, assurez-vous qu'il est installé et qu'il fonctionne correctement. Reportez-vous, si nécessaire, à la documentation du scanner.

Guides d'apprentissage

Les guides d'apprentissage sont disponibles dans le menu Aide. Conçus pour vous permettre d'exploiter au plus vite le programme, ces mini-guides offrent une présentation concise des opérations les plus courantes que vous pouvez réaliser avec OmniPage, comme par exemple

l'importation de documents, la retouche d'images, la définition de zones, la reconnaissance, l'édition, la vérification, et bien plus encore !

l'édition, la vérification, et bien plus encore ! Aide électronique L'aide contient des informations sur

Aide électronique

L'aide contient des informations sur les fonctions, les paramètres et les procédures d'OmniPage. Elle inclut également un glossaire exhaustif, assorti d'un index alphabétique et d'une table des matières. Le système d'aide HTML a été conçu pour garantir une consultation aisée et rapide. Le système d'aide est disponible dès l'installation d'OmniPage.

Le module d'aide contextuelle très complet assure une assistance suffisante pour vous permettre d'accomplir au plus vite les opérations requises. Pour y accéder, appuyez sur la touche F1 depuis n'importe quelle boîte de dialogue. Si la boîte de dialogue sur laquelle vous souhaitez obtenir de l'aide dispose d'un bouton Aide, cliquez sur celui-ci.

Fichier Notes de version

Ce fichier contient des informations de dernière minute sur OmniPage. Il est vivement recommandé de le consulter avant d'utiliser le logiciel. Pour ouvrir ce fichier au format HTML, vous pouvez, à la fin de l'installation d'OmniPage, sélectionner l'option Notes de version, ou, à tout moment, choisir la commande correspondante dans le menu Aide.

Informations sur la numérisation et renseignements divers

Le site Web de Nuance ® (www.nuance.fr) fournit des informations actualisées sur le programme. La section « Scanner Guide » (en anglais) (http://www.nuance.com/ scannerguide/) contient des données régulièrement mises à jour et relatives aux scanners pris en charge et à d'autres questions afférentes. Nuance effectue des tests sur les 25 modèles les plus utilisés. Pour accéder au site Web de Nuance, vous pouvez, à la fin de l'installation d'OmniPage 18, sélectionner l'option d'accès au site Web, ou choisir à tout moment la commande correspondante dans le menu Aide.

Notes techniques

Le site Web www.nuance.com propose des conseils sur l'installation et le dépannage du logiciel. Ces pages Web peuvent également inclure des conseils sur l'installation et le dépannage du logiciel.

Nouvelles fonctions d'OmniPage 18

Si vous utilisiez auparavant la version 17, vous bénéficiez des innovations suivantes. Cliquez sur les liens pour obtenir plus d'informations.

Page d'accueil. À l'ouverture d'OmniPage, un écran d'accueil présente des options claires permettant d'ouvrir ou de numériser des documents, ou d'ouvrir des projets OmniPage. Cet écran affiche également des flux de travail prédéfinis qui permettent de réaliser des conversions en une seule étape simple.

Assistant eDiscovery pour PDF avec recherches. Cet Assistant est conçu pour créer des fichiers PDF avec recherches à partir de fichiers PDF constitués uniquement d'images ou contenant certains éléments ou pages de texte, et ce, sans altération du texte existant ni opération d'OCR. Tous les éléments textuels du PDF sont préservés, y compris ses métadonnées, annotations, tampons, etc. Le processus peut s'exécuter automatiquement ou sur demande de l'utilisateur, lors du traçage de zones ou de la vérification. Reportez-vous à la section « Assistant eDiscovery pour PDF avec recherches », page 78.

Connexion à des sites de stockage distants. Récupérez des fichiers à traiter depuis un ou plusieurs sites Web de stockage distants, puis renvoyez vos fichiers convertis vers ces sites, ou vers d'autres. OmniPage vous permet de vous connecter directement à Evernote et Dropbox. En outre, l'application intégrée Nuance Cloud Connector, vous permet d'accéder à un large éventail de services de stockage en ligne, parmi lesquels Microsoft Live SkyDrive, Google Documents, Box.net, des sites FTP, et bien d'autres encore. Pour une flexibilité optimale, Nuance Cloud Connector s'intègre directement à Microsoft Windows. Vous pouvez ainsi transférer par simple « glisser-déposer » des fichiers vers des espaces de stockage distants. Et si vous exigez des fonctionnalités de transfert plus complètes, vous pourrez mettre à niveau Nuance Cloud Connector vers Gladinet Cloud Desktop Pro. Cette version avancée permet notamment d'utiliser des

services de stockage en ligne pour la sauvegarde et la synchronisation automatiques de fichiers. Reportez-vous aux sections « Importation depuis un site de stockage en ligne », page 32 et « Autres destinations d'exportation », page 81.

Nouveaux outils de retouche automatique d'images (SET). Les algorithmes de suppression des points et des parasites des images numérisées, visant à accroître la précision de leur reconnaissance, ont été améliorés et proposent désormais différentes méthodes de nettoyage (Normal, Demi-teintes, Poivre et sel). Vous pouvez également recadrer automatiquement les pages pour détecter et réduire les marges, ou utiliser les outils de nettoyage des bordures et de suppression des perforations pour générer des pages aux marges propres, exemptes de toute note manuscrite ou ombre provoquée par la numérisation. Lorsque le contenu d'un tableau blanc est photographié avec un appareil numérique, le texte et les schémas capturés peuvent être améliorés pour en améliorer la lisibilité. Reportez-vous à la section « Outils de retouche d'images », page 40

Meilleure identification des pages blanches. Un nouveau paramètre de sensibilité permet de définir le seuil à partir duquel une page doit être considérée comme « blanche ». Ceci améliore l'identification des pages qui sont entièrement vides, mais qui sont parfois numérisées sous forme de pages grises ou légèrement colorées. Ce paramètre optimise ainsi l'utilisation de deux commandes d'OmniPage : la nouvelle option de pré-traitement Ignorer les pages blanches, et l'option d'enregistrement existante Créer un fichier dès qu'une page blanche est détectée.

Détection automatique de la langue. Lors de conversions automatiques, le programme peut affecter une langue d'OCR spécifique à chacune des pages à traiter. Reportez-vous à la section « Reconnaissance des langues asiatiques », page 60.

Validation des propositions de corrections à l'aide de raccourcis. Les suggestions du vérificateur sont numérotées. Au lieu de cliquer sur une suggestion pour la sélectionner, puis sur Remplacer par pour l'accepter, vous pouvez appuyer sur le numéro associé à la suggestion désirée tout en maintenant la touche Ctrl enfoncée. Reportez-vous à la section « Vérification et édition », page 55.

Scanners ISIS. Les scanners utilisant des pilotes ISIS peuvent être utilisés pour numériser des documents directement vers OmniPage.

Nouvelles fonctions d'OmniPage 17

Si vous utilisiez auparavant la version 16, vous bénéficiez des innovations suivantes. Cliquez sur les liens pour obtenir plus d'informations.

Reconnaissance des langues asiatiques. Des documents rédigés en japonais, coréen, chinois simplifié et chinois traditionnel peuvent être reconnus par OCR. Pour ces langues, le programme peut traiter des documents comportant du texte horizontal et vertical, ainsi que de courts passages de texte en anglais. Les résultats obtenus peuvent être affichés et contrôlés dans l'Éditeur de texte. Voir « Reconnaissance des langues asiatiques », page 60.

Texte vertical non-asiatique. La détection automatique du texte vertical dans deux rotations fonctionne à l'intérieur des cellules de tableaux et partout sur les pages PDF ou XPS, ainsi que dans certains autres types de fichiers image. Des outils permettent de tracer manuellement des zones de texte vertical. Le texte s'affiche verticalement et peut être modifié dans l'Éditeur de texte, avec le niveau de formatage True Page ® . Si vous utilisez d'autres niveaux de formatage, le texte s'affiche horizontalement.Voir

« Découpage en zones automatique », page 47 et « Types et propriétés de zone »,

page 49.

Chargeur express. À l'instar de l'Explorateur Windows, cet outil permet d'afficher le système de fichiers dans l'une des fenêtres d'OmniPage, de conserver les fichiers à

l'écran pendant que vous travaillez et de sélectionner rapidement les fichiers à charger. Une boîte de dialogue dotée d'une fonction de verrouillage permet de compiler une liste de fichiers avant de procéder au chargement. Utilisé en mode Conversion rapide, le Chargeur express accélère le chargement des fichiers et permet un traitement « en un clic ». Importation, reconnaissance et enregistrement : tout est automatique ! Voir

« Importation de fichiers avec le Chargeur express », page 32.

Prise en charge d'un plus grand nombre de systèmes de gestion documentaire. Des liens vers Hummingbird (OpenText) et iManage (Interwoven) sont disponibles. Avec SharePoint, les informations relatives au serveur, à la connexion et au mot de passe ne doivent être saisies qu'une seule fois par session et sont ensuite fournies lors de toutes les sessions ultérieures.

Prise en charge d'Office 2007 et 2010. Les boutons Direct OCR apparaissent dans un onglet d'OCR Nuance distinct, et non plus au côté des autres compléments.

Traitement par lots optimisé. Batch Manager ignore automatiquement les fichiers qui ne peuvent pas être traités, y compris ceux qui sont verrouillés par mot de passe, sans interrompre pour autant le flux de travail principal. La fenêtre Résultats du travail répertorie les fichiers exclus du traitement.

Exécution. La vitesse de lancement du programme est accrue et les performances enregistrent des progrès considérables sur les ordinateurs à plusieurs cœurs. Les ordinateurs à quatre cœurs sont désormais pris en charge.

Association des flux de travail aux boutons du scanner. Les fonctions et flux de travail d'OmniPage peuvent être associés aux boutons du scanner de façon à permettre le lancement du prétraitement, de la reconnaissance et du stockage des documents depuis le scanner. Voir « Numérisation vers OmniPage et utilisation des flux de travail », page 36.

Sortie vers Kindle. L'Assistant Kindle vous permet de créer des flux de travail pour envoyer les résultats d'OCR vers un compte Kindle hébergé sur le site Amazon, et de les afficher ensuite sur un appareil Kindle enregistré dans ce compte. Voir « Envoi vers un lecteur Kindle », page 80.

Autres améliorations. Les améliorations apportées au prétraitement des images contribuent à optimiser la conservation de la mise en page et la précision de reconnaissance globale, en particulier pour les fichiers XPS et les conversions entre documents. Le chargement d'images HD Photo (JPEG XR) est possible. L'intégration avec Microsoft Word, Excel et PowerPoint a été améliorée. Des fichiers PDF linéarisés peuvent être créés ; ils sont optimisés pour un affichage plus rapide sur le Web.

Fonctions clés d'OmniPage Professional

Fonctions clés d'OmniPage Professional Cette icône, utilisée tout au long de ce manue l, signale les

Cette icône, utilisée tout au long de ce manuel, signale les fonctions disponibles uniquement dans OmniPage Professional 18.

Extraction de données de formulaires remplis. Vos flux de travail peuvent désormais comporter une étape permettant l'extraction de données de formulaires remplis, et leur exportation vers des bases de données. Ces formulaires peuvent être des formulaires PDF actifs, des formulaires statiques dans divers formats d'images, ou des formulaires papier numérisés.

Marquage et biffure de texte. Des sections de texte peuvent désormais être mises en surbrillance, barrées ou biffées (noircies, donc illisibles) dans l'Éditeur de texte. La biffure s'avère très pratique pour des documents à caractère juridique ou contenant des informations confidentielles (des contrats, par exemple).

Assistant File-it. Un nouvel outil efficace pour créer et utiliser des flux de travail invoqués par des pages de garde sur lesquelles sont imprimés des codes à barres. Avec ces flux de travail, une simple pression d'un bouton de votre scanner permet de numériser, de traiter et d'archiver automatiquement vos documents papier.

Pour obtenir la liste complète des fonctionnalités, et connaître les différences entre les différentes versions d'OmniPage, reportez-vous à l'aide.

OmniPage 18 est disponible dans différentes versions d'entreprise, adaptées à une utilisation en réseau. OmniPage est également disponible dans différentes versions SE (Special Edition), réservées à certains fabricants de scanners et autres revendeurs sélectionnés. Les fonctionnalités offertes par ces versions peuvent varier en fonction des besoins des fournisseurs.

Installation et configuration

Ce chapitre contient les informations nécessaires à l'installation et au lancement d'OmniPage.

Environnement requis

Vous trouverez ci-dessous la configuration système minimale requise pour l'installation et l'exécution du programme :

Ordinateur équipé d'un processeur Intel ® Pentium ® cadencé à 1 GHz ou plus, ou processeur équivalent. Processeur double-cœur ou quadri-cœur recommandé.

Éditions 32 bits ou 64 bits de Microsoft Windows ® 8, éditons 32 bits ou 64 bits de Microsoft Windows ® 7 avec Service Pack 1, éditions 32 bits ou 64 bits de Windows Vista avec Service Pack 2, ou édition 32 bits de Microsoft Windows ® XPTM avec Service Pack 3.

2 Go de mémoire vive (RAM), 2 Go recommandé pour des performances avancées.

320 Mo d'espace disque disponible destiné aux fichiers d'application et aux modèles d'images, plus 100 Mo d'espace disponible lors de l'installation.

Moniteur couleurs 1024x768 pixels avec affichage couleurs en 16 bits ou carte vidéo supérieure.

Lecteur de CD-ROM pour l'installation ou accès à Internet requis pour le téléchargement.

Carte son et haut-parleur pour la lecture « à voix haute » des textes reconnus.

Souris (ou périphérique équivalent) compatible Windows.

Appareil photo d'une résolution minimale de 2 mégapixels avec fonction Autofocus, pour la capture de photos de documents. Pour plus d'informations, consultez l'aide en ligne.

Scanner compatible avec le pilote approprié pour la numérisation de documents (pilote de scanner WIA, TWAIN ou ISIS). Consultez le Scanner Guide, disponible sur le site Web de Nuance (www.nuance.com), pour connaître la liste des scanners compatibles.

Accès à Internet pour l'activation et la mise à jour automatique du logiciel, ainsi que pour Nuance Cloud Connector et la mise à jour de la base de données des scanners.

Pour afficher des documents en japonais, chinois ou coréen, vous devez installer la prise en charge des langues d'Extrême-Orient sur votre système d'exploitation (Panneau de configuration > Options régionales et linguistiques).

Configuration d'un scanner pour utilisation avec OmniPage

Tous les fichiers nécessaires à la configuration et à la prise en charge du scanner sont copiés automatiquement lors de l'installation du programme. Le scanner n'est toutefois pas configuré au moment de l'installation. Avant de numériser des documents à l'aide d'OmniPage, vous devrez vérifier que votre scanner est installé correctement, avec le pilote approprié, et tester son fonctionnement. Les pilotes du scanner ne sont pas fournis avec OmniPage. L'installation et la configuration d'un scanner s'effectuent par l'intermédiaire de l'Assistant de configuration de scanner. Vous pouvez lancer celui-ci en suivant la procédure ci-dessous. Cet Assistant apparaît également la première fois que vous tentez de lancer une numérisation. Procédez comme suit :

tentez de lancer une numérisation. Procédez comme suit : • Choisissez Démarrer > Tous les programmes

Choisissez Démarrer > Tous les programmes > KONICA MINOLTA > Unity Document Suite > OmniPage > Assistant de configuration de scanner (OmniPage) ou cliquez sur le bouton Configuration dans l'onglet Scanner de la boîte de dialogue Options. ou sélectionnez Numériser dans la liste Importer page(s) de la boîte à outils OmniPage, puis cliquez sur Importer page(s).

L'Assistant de configuration de scanner s'affiche. Si vous êtes connecté à Internet, la première fenêtre vous invite à mettre à jour la base de données des pilotes de scanners livrée avec le programme. Cliquez sur Oui ou sur Non, puis sur Suivant.

Choisissez Sélectionner et tester un scanner ou un appareil photo numérique et cliquez sur Suivant. Si un seul scanner est installé, il apparaît avec l'ensemble des scanners précédemment configurés avec OmniPage. Si le scanner que vous souhaitez utiliser ne figure pas dans cette liste, cliquez sur Ajouter un scanner

Une liste présentant l'ensemble des pilotes de scanners détectés apparaît. Cette liste peut contenir des périphériques de réseau. Sélectionnez un périphérique, puis cliquez sur OK. Pour installer un second périphérique, exécutez à nouveau l'Assistant.

L'Assistant indique si le modèle de scanner choisi est associé à des réglages de configuration dans la base de données des scanners. Si tel est le cas, vous n'aurez pas besoin de tester votre scanner. Dans le cas contraire, nous vous recommandons de le tester. Cliquez sur Suivant.

Si vous avez choisi de ne pas tester votre scanner, cliquez sur Terminé. Dans le cas contraire, cliquez sur Suivant pour tester la connexion au scanner. Si la connexion s'effectue correctement, un menu de tests complémentaires apparaît. Sélectionnez les tests que vous souhaitez effectuer. Nous vous recommandons d'effectuer un test élémentaire.

OmniPage utilise par défaut sa propre interface de numérisation, accessible via l'onglet Scanner de la boîte de dialogue Options. Si vous préférez utiliser l'interface de votre

scanner, cliquez sur Réglages avancés

de conseils

expérimenté ou si vous avez été invité à effectuer cette opération par le service de support technique.

et choisissez cette option. Choisissez Éditeur

puis Modifier les conseils uniquement si vous êtes un utilisateur

Cliquez sur Suivant pour lancer les tests. Pour réaliser un test élémentaire, placez une page dans votre scanner. L'Assistant procédera à la numérisation en utilisant le logiciel du fabricant du scanner. Cliquez sur Suivant. L'interface utilisateur native de votre scanner s'affiche.

Cliquez sur Numériser pour lancer la numérisation de la page de test.

Si nécessaire, cliquez sur Image manquante

ou sur Mauvaise orientation

et

effectuez les sélections appropriées.

Si l'image affichée dans la fenêtre est correcte, cliquez sur Suivant.

Effectuez les tests restants, en suivant les instructions qui apparaissent à l'écran.

Lorsque l'ensemble des tests requis ont été effectués avec succès, l'Assistant vous en informe et vous demande de cliquer sur Terminé.

Vous venez de configurer votre scanner en vue de son utilisation avec OmniPage 18 ! Pour modifier les réglages du scanner par la suite ou pour configurer ou supprimer un autre scanner, ouvrez de nouveau l'Assistant de configuration de scanner depuis le menu Démarrer de Windows ou depuis l'onglet Scanner de la boîte de dialogue Options. Pour tester et dépanner un scanner qui ne fonctionne pas correctement, lancez l'Assistant de configuration de scanner et sélectionnez Tester un scanner ou un appareil photo numérique, puis suivez la procédure décrite ci-dessus ou reportez-vous aux instructions communiquées par le service de support technique. Pour sélectionner un autre scanner à utiliser par défaut, ouvrez l'Assistant pour afficher la liste des scanners configurés. Sélectionnez le scanner que vous souhaitez utiliser par défaut, puis refermez l'Assistant en cliquant sur Terminé.

Pour obtenir les réglages les plus récents pour votre scanner, ouvrez l'Assistant, demandez le téléchargement de la base de données la plus récente, choisissez Utiliser les paramètres actuels avec le périphérique actuel, cliquez sur Suivant, puis sur Terminé.

Lancement d'OmniPage

Pour lancer OmniPage 18, effectuez l'une des opérations suivantes :

Dans la barre des tâches de Windows, choisissez Démarrer > Tous les programmes > KONICA MINOLTA > Unity Document Suite > OmniPage > OmniPage.

Cliquez deux fois sur l'icône OmniPage située dans le dossier d'installation
OmniPage située dans le dossier d'installation d'OmniPage ou sur le bureau de Windows (si vous l'y d'OmniPage ou sur le bureau de Windows (si vous l'y avez placée).

Cliquez deux fois sur l'icône ou le nom de fichier d'un document OmniPage
ou le no m de fichier d'un document OmniPage (OPD) pour le charger. Re portez-vous à (OPD) pour le charger. Reportez-vous à la section « Documents OmniPage » du chapitre suivant.

Cliquez avec le bouton droit sur l'icône ou sur le nom d'un ou de plusieurs fichiers image pour afficher un menu contextuel. Pointez sur Ouvrir avec OmniPage application. Les images sont alors chargées dans le programme. Lorsque vous ouvrez OmniPage, l'écran d'accueil du programme, puis la fenêtre de sélection de l'interface s'affichent. OmniPage dispose de trois interfaces standard. Pour plus d'informations, reportez-vous à la section « Bureau OmniPage et modes d'affichage » du chapitre suivant. Cette section présente les principales zones de travail du programme. Vous pouvez également exécuter le programme avec une interface limitée :

Utilisez le programme Batch Manager. Dans la barre des tâches de Windows, choisissez Démarrer > Tous les programmes > KONICA MINOLTA > Unity Document Suite > OmniPage > OmniPage Batch Manager. Reportez-vous au chapitre Flux de travail.

Dans une application déclarée dans Direct OCR™, choisissez Acquérir du texte dans le menu Fichier. Reportez-vous à la section « Configuration de Direct OCR » dans le chapitre « Traitement des documents ».

Cliquez avec le bouton droit sur l'icône ou le nom d'un ou de plusieurs fichiers image dans l'Explorateur Windows pour afficher un menu contextuel. Dans ce menu, pointez sur OmniPage 18, puis choisissez un format d'exportation, ou sélectionnez un flux de travail, ou cliquez sur Assistant Convertir maintenant. Les fichiers seront traités conformément aux instructions du flux de travail sélectionné. Reportez-vous au chapitre Flux de travail.

• Cliquez sur l'icône de l' Agent OmniPage contextuel qui s'affiche, sélectionnez un flux de

Cliquez sur l'icône de l'Agent OmniPage

contextuel qui s'affiche, sélectionnez un flux de travail pour démarrer le programme et

exécuter le flux de travail.

Pour ajouter des services d'OCR, utilisez OmniPage 18 avec PaperPort, le produit de gestion documentaire de Nuance. Reportez-vous à la section « Utilisation d'OmniPage avec PaperPort » du chapitre « Utilisation d'OmniPage ».

dans la barre des tâches. Dans le menu

Utilisation d'OmniPage

OmniPage 18 utilise la technologie de reconnaissance optique de caractères (OCR) pour transformer les informations contenues dans vos documents numérisés ou fichiers image en données électroniques éditables par vos applications habituelles. Outre le texte, OmniPage peut reconnaître les éléments et caractéristiques suivants de vos documents :

Éléments graphiques (photos, logos) Éléments de formulaires (cases à cocher, boutons radio, champs de texte, etc.) Informations de formatage du texte (caractères et paragraphes) Mise en page (disposition des colonnes, formats des tableaux, en-têtes, emplacement des éléments graphiques)

Documents dans OmniPage Dans OmniPage, un document comporte une ou plusieurs pages, chacune d'elles constituée par une image importée. Après la reconnaissance, le document comportera également le texte reconnu correspondant à ses images (affichable via l'Éditeur de texte) et éventuellement des graphiques, des tableaux ou des éléments de formulaire.

Documents OmniPage

Un document OmniPage (.opd) contient l'image de page originale (éventuellement prétraitée), ainsi que les zones tracées sur celle-ci. Après la reconnaissance, un fichier OPD comporte également le résultat de l'OCR. Un document OmniPage (fichier OPD) peut contenir différents éléments incorporés : dictionnaire utilisateur, fichier d'apprentissage, fichier de gabarit de zones ou fichier de modèle de retouche d'images. S'il génère des fichiers beaucoup plus volumineux, ce format améliore la portabilité et facilite l'échange des fichiers OPD. Pour incorporer un fichier, ouvrez la boîte correspondante depuis le menu Outils, sélectionnez le fichier désiré, puis cliquez sur Incorporer. Utilisez le bouton Extraire pour enregistrer localement une copie d'un fichier incorporé au sein d'un fichier OPD que vous avez reçu.

copie d'un fichier incorporé au sein d'un fichier OPD que vous avez reçu. Chapitre 2 Documents

Lors de l'ouverture d'un document OmniPage, ses réglages sont appliqués, remplaçant les paramètres du programme.

Bureau OmniPage et modes d'affichage

OmniPage propose trois interfaces distinctes, pour un confort d'utilisation optimal en fonction de la tâche que vous devez réaliser.

Mode Classique – Ce mode reprend l'interface des versions précédentes du programme.

Mode Flexible – Ce mode d'affichage présente les volets de fonctions empilés dans une vue mise en onglets, pour un gain d'espace optimal.

Mode Conversion rapide – Cette nouvelle interface est conçue pour réaliser rapidement des conversions de documents, sans qu'aucune connaissance approfondie du programme soit requise. Les options de conversion les plus importantes sont clairement présentées à l'écran. Utilisez les commandes du menu Fenêtre pour passer d'une interface à une autre, et pour enregistrer un mode d'affichage personnalisé (voir ci-dessous). Au démarrage d'une nouvelle session, le mode d'affichage et la disposition actifs lors de la dernière fermeture du programme sont utilisés. La configuration par défaut des trois modes d'affichage peut être réinitialisée à l'aide de la commande Réinitialiser vue actuelle du menu Fenêtre.

Volets du programme OmniPage se compose d'un ensemble de volets qui peuvent être ancrés (sous forme d'onglets ou en mosaïque), flottants, redimensionnés, réduits ou restaurés individuellement. Ces volets sont les suivants : Vignettes, Image de page, Éditeur de texte, Gestionnaire de documents, Chargeur express, État du flux de travail et Aide. Pour déplacer un volet, double-cliquez sur sa barre de titre ou son onglet. Pour restaurer le volet flottant dans sa position ancrée précédente, double-cliquez sur sa barre de titre. Pour l'ancrer à un nouvel emplacement, faites-le glisser vers ce nouvel emplacement. Un rectangle de couleur signale la position d'ancrage ; relâchez le bouton de la souris pour ancrer le volet. Pour afficher toutes les positions d'ancrage possibles (mosaïque et onglets) les unes à la suite des autres, faites glisser le volet sur la fenêtre principale d'OmniPage, en maintenant le bouton gauche enfoncé et en appuyant plusieurs fois sur la barre espace. Lorsqu'un rectangle de couleur apparaît à la position qui vous convient, relâchez le bouton de la souris. Pour déplacer un volet flottant sans affichage de l'ancrage, faites-le glisser tout en maintenant la touche CTRL enfoncée.

Mode Classique En mode Classique, le bureau OmniPage par défaut est composé de quatre zones de travail affichées en mosaïque et séparées par des barres de fractionnement : le Gestionnaire de documents, l'Éditeur de texte et les volets Image de page et Vignettes. Le volet Image de page est muni de la barre d'outils Image, et le volet Éditeur de texte de la barre d'outils Formatage.

Standard Barre d'outils Boîte à outils OmniPage Barre d'outils Formatage Vignettes Barre d'outils
Standard
Barre d'outils
Boîte à outils
OmniPage
Barre d'outils
Formatage
Vignettes
Barre d'outils Image
Gestionnaire
Image de page
Éditeur de texte
de documents
Barre d'état

Boîte à outils OmniPage : la boîte à outils d'OmniPage vous permet de gérer toutes les étapes du traitement.

Volet Vignettes : ce volet affiche les vignettes des pages de votre document.

Gestionnaire de documents : ce volet fournit un résumé d'informations sur un document sous la forme d'un tableau. Chaque rangée donne des informations sur une page. Les colonnes présentent des statistiques ou des informations d'état pour chaque page, et (quand cela est nécessaire) les totaux du document.

Image de page : ce volet affiche l'image de la page actuelle, et indique les zones tracées sur celle-ci. Lorsqu'une page est affichée, la barre d'outils Image est disponible.

Éditeur de texte : ce volet affiche les résultats d'OCR de la page en cours de traitement.

Vous pouvez réorganiser les volets à votre guise : verticalement ou horizontalement. Pour ouvrir les volets Chargeur express, État du flux de travail ou Aide, utilisez le menu Fenêtre. Les volets peuvent être réduits ou fermés, mais ne peuvent pas être organisés sous forme d'onglets. Pour restaurer le mode Classique par défaut, choisissez Réinitialiser vue actuelle dans le menu Fenêtre.

Mode Flexible Sélectionnez ce mode d'affichage pour optimiser l'espace de travail d'OmniPage en fonction de la tâche que vous devez réaliser. Par défaut, tous les volets apparaissent. Dans ce mode, cinq onglets sont affichés : Image de page (y compris Vignettes), Éditeur de texte, Chargeur express, État du flux de travail et Aide. Le Gestionnaire de documents apparaît dans un volet horizontal, situé en bas de la zone de travail. Vous pouvez détacher, déplacer, réduire, regrouper ou fermer les volets, selon la procédure décrite ci-dessus. Faites glisser un onglet vers la zone de travail pour obtenir un affichage en mosaïque semblable au mode Classique. Faites-le glisser de nouveau vers la barre des onglets pour rétablir les onglets, ou utilisez la barre espace selon la procédure décrite ci-dessus. Si les volets sont regroupés, le texte de l'onglet indique le volet actif. Pour restaurer le mode Flexible par défaut, choisissez Réinitialiser vue actuelle dans le menu Fenêtre. À l'instar de l'Explorateur Windows, le Chargeur express est un outil qui permet d'afficher et gérer les fichiers. Il peut rester ouvert pendant la session, permettant ainsi de sélectionner et regrouper rapidement les fichiers (reportez-vous au Chapitre 3, page 32).

Cas de figure possibles :

Espace de travail optimal (travail sur un seul écran) Chargez un document. Dans le menu Fenêtre, sélectionnez les volets avec lesquels vous souhaitez travailler. Faites glisser chacun de ces volets sur le bord de le volet actif, jusqu'à ce qu'ils prennent la forme d'onglets. De la même façon, vous pouvez ancrer l'aide pour ne pas avoir à manipuler deux fenêtres distinctes.

pour ne pas avoir à manipuler deux fenêtres distinctes. Chapitre 2 Bureau OmniPage et modes d'affichage

Manipulation des résultats de reconnaissance (travail sur un seul écran) Chargez un document, puis lancez sa reconnaissance. Refermez tous les volets, à l'exception du Gestionnaire de documents et de l'Éditeur de texte. Affichez ces deux volets horizontalement, sur toute la largeur de l'écran, réduisez la hauteur du Gestionnaire de documents, et ancrez-le dans la partie supérieure ou inférieure de la fenêtre. Vous pouvez dès lors passer les pages en revue, en cliquant deux fois dessus dans le Gestionnaire de documents, et inspecter les résultats de reconnaissance dans l'Éditeur de texte. Les informations fournies par le Gestionnaire de documents (nombre de mots douteux et de caractères de rejet) vous aideront à repérer rapidement les pages qui posent problème.

à repérer rapidement les pages qui posent problème. Traitement de documents volumineux (travail sur deux

Traitement de documents volumineux (travail sur deux écrans) Chargez le document sur lequel vous souhaitez travailler. Déplacez le volet Vignettes sur votre second moniteur, et affichez-le en plein écran pour disposer d'une large vue de votre document, et disposer d'un maximum de place pour la manipulation des vignettes.

maximum de place pour la manipulation des vignettes. Vérification (travail sur deux écrans) Placez le volet

Vérification (travail sur deux écrans) Placez le volet Image de page sur un écran, et l'Éditeur de texte sur l'autre. Vous disposerez ainsi d'un espace optimal pour vos travaux d'édition et de vérification. Disponible à tout moment, le volet Image de page vous permet de vérifier la reconnaissance de vos pages, d'y tracer des zones à la volée et d'en éditer le texte. Les cas de figure présentés ci-dessus ne sont que des exemples des possibilités offertes par le mode Flexible.

des exemples des possibilités offertes par le mode Flexible. Chapitre 2 Bureau OmniPage et modes d'affichage
des exemples des possibilités offertes par le mode Flexible. Chapitre 2 Bureau OmniPage et modes d'affichage

Mode Conversion rapide Le mode Conversion rapide vous permet de réaliser rapidement la reconnaissance et l'enregistrement de vos documents. Vous pouvez uniquement accéder au mode Conversion rapide lorsqu'aucun document n'est ouvert. De plus, ce mode d'affichage ne permet de ne travailler que sur un seul document d'entrée et de sortie à la fois.L'illustration ci-dessous affiche la disposition par défaut.

ci-dessous affiche la disposition par défaut. Image de page Titre du volet Image de page Boutons
ci-dessous affiche la disposition par défaut. Image de page Titre du volet Image de page Boutons
ci-dessous affiche la disposition par défaut. Image de page Titre du volet Image de page Boutons
ci-dessous affiche la disposition par défaut. Image de page Titre du volet Image de page Boutons
ci-dessous affiche la disposition par défaut. Image de page Titre du volet Image de page Boutons

Image de page

Titre du volet Image de page

par défaut. Image de page Titre du volet Image de page Boutons de traitement Options du

Boutons de

traitement

Options du mode Conversion rapide et onglet (fermé) du Chargeur express

Barre d'outils

Conversion

rapide

Options du mode Conversion rapide :

source et mise en page du document format du texte en sortie, type de formatage dossier de sortie et nom de fichier options d'enregistrement intervalle de pages

Par défaut, le Chargeur express apparaît sur un onglet dont l'affichage alterne avec celui du volet Options du mode Conversion rapide. Un volet Aide peut être ajouté, mais aucun autre volet n'est disponible dans cet affichage. Vous pouvez modifier les onglets pour séparer les volets et les réduire, comme dans les autres modes d'affichage. Après le chargement d'un fichier, nous vous recommandons de le convertir avant de procéder au chargement du fichier suivant. Lorsque la conversion d'une image est terminée, vous n'avez pas besoin de fermer cette image ; il vous suffit de charger un nouveau fichier. En mode Conversion rapide, le Chargeur express offre une fonctionnalité supplémentaire :

le traitement en un simple clic. Ouvrez le sous-menu Chargeur express dans le menu Traitement et sélectionnez Charger des fichiers ou Importer et convertir. Cette dernière

option permet de sélectionner plusieurs fichiers qui sont chargés, reconnus et enregistrés à l'aide des paramètres en cours. Pour cela, vous devez définir les noms des fichiers de sortie, de façon à ce qu'ils soient identiques aux noms des fichiers source. Pour plus d'informations, reportez-vous au Chapitre 6, page 32 et à l'aide. En mode Conversion rapide, le volet Image intègre la barre d'outils Conversion rapide, qui offre un accès aux opérations de traitement des images les plus utiles. Pour accéder aux fonctionnalités avancées, et notamment l'enregistrement des fichiers image, les outils SET, le traçage de zones en direct, la réorganisation des zones et le traçage manuel de zones pour le texte vertical, utilisez un autre mode d'affichage.

Modes d'affichage personnalisés Pour créer un mode d'affichage personnalisé, disposez les volets et les barres d'outils selon vos besoins, puis sélectionnez Fenêtre > Modes d'affichage personnalisés > Gérer. Cliquez sur Ajouter et donnez un nom à votre mode d'affichage. Vos modes d'affichage sont accessibles dans le sous-menu Modes d'affichage personnalisés. Le mode actuellement utilisé est indiqué par une case à cocher. Les modes d'affichage personnalisés ne permettent pas de rétablir l'affichage par défaut.

Changement de mode d'affichage Pour changer de mode d'affichage, utilisez le menu Fenêtre. Les volets sont affichés ou masqués et organisés de la même façon que lors de la dernière utilisation du mode d'affichage choisi. La rubrique d'aide affichée ne varie pas en fonction du mode d'affichage. Le Chargeur express mémorise l'emplacement des fichiers, quel que soit le mode d'affichage, et le volet État du flux de travail continue d'afficher des informations sur le dernier flux de travail exécuté. Au redémarrage du programme, l'aide affiche la rubrique de bienvenue et le Chargeur express le dossier par défaut ; le volet État du flux de travail est vide.

Barres d'outils Le programme dispose de onze barres d'outils principales. Le menu Affichage permet de les afficher, de les masquer et de les personnaliser. La barre d'état, affichée au bas de la fenêtre du programme, affiche une description de chacun des outils sélectionnés. Barre d'outils Standard : permet d'effectuer les opérations de base d'OmniPage.

Barre d'outils Image : permet d'effectuer les opérations sur les images, les zones et les tableaux. Parmi ces outils, trois groupes peuvent être manipulés séparément (mini barres d'outils) :

Barre d'outils Zones : pour le traçage de zones.

Barre d'outils Rotation : pour la rotation de pages.

Barre d'outils Tableau : pour l'insertion, le déplacement et la suppression de séparateurs de lignes et de colonnes. Barre d'outils Formatage : permet de formater le texte reconnu dans l'Éditeur de texte. Barre d'outils du vérificateur : permet de contrôler l'emplacement et l'aspect du vérificateur. Barre d'outils de réagencement : permet de modifier l'ordre des éléments dans les pages reconnues. Barre d'outils Marquage de texte : permet de marquer et de biffer du texte. Barre d'outils Conception de formulaires : permet de créer des éléments de formulaire. Barre d'outils Réorganisation de formulaires : permet de réorganiser et d'aligner les éléments de formulaire. Dans chacun des modes d'affichage, les barres d'outils peuvent être déplacées et personnalisées selon vos besoins, y compris en cas d'utilisation de deux écrans. Les barres d'outils Conception de formulaires, Réorganisation de formulaires et Marquage de texte (reportez-vous au Chapitre 4, page 66 pour plus d'informations) ne sont disponibles que dans OmniPage Professional 18.

ne sont disponibles que dans OmniPage Professional 18. • Principales étapes de l'OCR OmniPage propose trois

Principales étapes de l'OCR

OmniPage propose trois modes de traitement des documents : automatique, manuel ou par flux de travail. Ces trois modes impliquent globalement les mêmes étapes principales :

document papier (avec ou sans chargeur de feuilles automatique) ou charger un ou plusieurs fichiers image à partir de votre système de feuilles automatique) ou charger un ou plusieurs fichiers image à partir de votre système de fichiers, d'un site de stockage distant, d'un site FTP, etc.

1.

Importer des images de document dans OmniPage. Vous pouvez numériser un

vous pouvez détecter et corriger les erreurs éventuelles à l'aide du module de vérification de l'OCR et éditer le document dans reurs éventuelles à l'aide du module de vérification de l'OCR et éditer le document dans l'Éditeur de texte.

2.

Exécuter l'OCR pour obtenir du texte éditable. À l'issue de la reconnaissance,

3. Exporter le document vers la destination de votre choix. Une fois le document reconnu, vous pouvez l'enregistrer dans un fichie on de votre choix. Une fois le document reconnu, vous pouvez l'enregistrer dans un fichier (en spécifiant le nom et le type voulus), le copier dans le Presse-papiers, l'envoyer comme pièce jointe à un e-mail ou le publier. Un même document peut être enregistré plusieurs fois avec différents réglages d'emplacement, de type de fichier, de formatage, etc., selon vos besoins.

Avec OmniPage, vous pouvez choisir l'une des méthodes de traitement suivantes :

automatique, manuel, combiné ou par flux de travail. Vous pouvez lancer le processus de reconnaissance à partir d'autres applications en utilisant la fonction Direct OCR d'OmniPage, ou différer son lancement en planifiant son exécution à une heure précise. Les différents modes de traitement sont décrits dans le chapitre suivant, ainsi que dans l'aide du programme.

Réglages Les réglages OmniPage sont regroupés dans la boîte de dialogue Options. Vous pouvez y accéder depuis la barre d'outils Standard ou le menu Outils. Dans cette boîte Les réglages OmniPage s ont regroupés dans la boîte de dialogue, utilisez l'aide c ontextuelle pour de dialogue, utilisez l'aide contextuelle pour obtenir des informations détaillées sur chacune des options disponibles.

Utilisation d'OmniPage avec PaperPort

PaperPort® est un puissant logiciel de gestion de documents papier édité par Nuance. Ce programme permet de lier vos pages aux applications appropriées. Ces pages peuvent comporter des graphiques et/ou du texte. Si PaperPort est présent sur un ordinateur doté d'OmniPage, les services d'OCR de ce dernier viennent compléter les fonctionnalités de PaperPort. Pour choisir un programme d'OCR, cliquez avec le bouton droit sur le lien PaperPort d'application de texte, sélectionnez Préférences, puis spécifiez OmniPage 18 en tant que programme d'OCR à utiliser. À l'instar de Direct OCR, vous pouvez spécifier les réglages d'OCR de votre choix. PaperPort offre la solution la plus simple et la plus rapide pour toute personne qui souhaite transformer des documents papier en fichiers numériques faciles à gérer, à retrouver et à manipuler. PaperPort peut dialoguer avec des scanners, des imprimantes multifonction et des photocopieurs numériques en réseau pour transformer des documents papier en fichiers numériques. Par ailleurs, PaperPort propose un système de dossiers clair et pratique.

PaperPort propose un système de dossiers clair et pratique. Chapitre 2 Utilisation d'OmniPage avec PaperPort 25
PaperPort propose un système de dossiers clair et pratique. Chapitre 2 Utilisation d'OmniPage avec PaperPort 25

Grâce aux vignettes affichées sur le bureau PaperPort, vous pouvez réaliser visuellement le classement, la récupération et la manipulation des documents numérisés : fichiers Word, feuilles de calcul, fichiers PDF et photos numériques. Les outils d'édition de PaperPort transforment avec succès l'aspect de vos documents numérisés, alors que les outils d'annotation permettent d'ajouter vos commentaires à toute image numérisée afin de les mettre en valeur.

PaperPort est inclus dans Unity Document Suite. Pour obtenir plus d'informations sur cette application, reportez-vous à la documentation de PaperPort.

Lorsque PaperPort est disponible, sa structure de dossiers est proposée dans les boîtes de dialogue Charger depuis un fichier et Enregistrer dans un fichier d'OmniPage.

Traitement des documents

Ce chapitre décrit les modes de traitement des documents disponibles sous OmniPage et fournit des détails sur les principales étapes des procédures impliquées :

Méthodes de traitement

Avec OmniPage, vous pouvez choisir l'une des méthodes de traitement suivantes :

Automatique

Une solution simple et efficace de traiter un document consiste à laisser OmniPage s'en charger pour vous. Sélectionnez les réglages dans la boîte de Une solution simple et efficace de tr dialogue Options et les commandes dans la boîte à dialogue Options et les commandes dans la boîte à outils OmniPage, puis cliquez sur Lancer. OmniPage soumet chaque page à toutes les étapes du traitement, si possible effectuant plusieurs opérations en parallèle. Sous ce mode, le logiciel se charge également de tracer les zones.

Manuel

Le traitement manuel vous assure un contrôle plus précis du traitement de votre document. Vous pouvez traiter chLe traitement manuel vous assure un cont aque page individuellement avec différents réglages. Le programme s'ar aque page individuellement avec différents réglages. Le programme s'arrête à chaque étape du traitement :

acquisition des images, réalisation de l'OCR et exportation. Vous pouvez ainsi tracer des zones manuellem ent ou modifier les de l'OCR et exportation. Vous pouvez
réalisation de l'OCR et exportation. Vous pouvez ainsi tracer des zones manuellem ent ou modifier les ainsi tracer des zones manuellement ou modifier les langues de reconnaissance. Pour lancer une étape, cliquez sur l'un des trois boutons correspondants dans la boîte à outils OmniPage.

1. Utilisez le premier bouton pour importer des images.

2. Tracez manuellement les zones dans les pages dont vous ne voulez traiter qu'une partie ou pour lesquelles vous voulez fournir des instructions de zones précises. Appliquez la valeur Ignorer aux fonds ou aux zones que vous voulez exclure du traitement. Appliquez la valeur Traiter aux fonds ou aux zones pour lesquels vous voulez définir le découpage en zones automatique.

3.

Utilisez le deuxième bouton pour lancer la reconnaissance des pages.

4. Effectuez vos travaux de vérification et d'édition, selon vos besoins.

5. Utilisez le troisième bouton pour enregistrer les résultats de votre travail.

Lors du traitement manuel, toutes les pages affichées sont automatiquement sélectionnées par défaut. Un simple clic suffit ainsi pour reconnaître le contenu de toutes les nouvelles pages. Ce réglage par défaut peut être modifié via l'onglet Traitement de la boîte de dialogue Options.

Traitement combiné

Vous pouvez traiter un document automatiquement, puis afficher le résultat obtenu dans l'Éditeur de texte. Si la qualité de l'ensemble du document est bonne et que seules certaines pages sont insatisfaisantes, vous pouvez passer au traitement manuel pour modifier les réglages et relancer la reconnaissance des pages incorrectes. Vous pouvez aussi importer les images manuellement, tracer des zones sur tout ou partie d'entre elles, puis appliquer à toutes les pages le traitement automatique en appuyant sur le bouton Lancer et en choisissant de traiter les pages existantes.

Lancer et en choisissant de traiter les pages existantes. Flux de travail Un flux de travail

Flux de travail

Un flux de travail se compose d'une série d'étapes et de réglages s'y rapportant. Ils incluent généralement, mais pas obligatoirement, une étape de reconnaissance. Son déroulement peut ne pas se conformer au schéma de traitement traditionnel (« 1-2-3 »). Les flux de travail sont répertoriés dans la liste déroulante Flux de travail. Celle-ci comprend un certain nombre de flux de travail proposés par le système, en plus de ceux que vous avez créés. Les flux de travail vous permettent de gérer plus efficacement les tâches récurrentes. Les différentes étapes et leurs réglages y sont prédéfinis. Vous pouvez placer l'icône Agent OmniPage dans votre barre de tâches. Le menu contextuel associé répertorie vos flux de travail. Cliquez sur un flux de travail pour lancer OmniPage et exécuter ce flux. L'Assistant Flux de travail vous guide tout au long de la création de vos flux de travail. Il propose une série d'étapes et les réglages qui y sont associés. Après avoir défini une étape, cliquez sur Suivant pour en ajouter de nouvelles. L'Assistant vous assiste, si besoin, lors du traitement automatique. Reportez-vous à la section Assistant Flux de travail, au Chapitre 4, page 86.

Traitement différé

Le module OmniPage Batch Manager permet de différer la reconnaissance automatique des documents (par exemple, à une heure où vous n'utilisez pas votre ordinateur). La gestion et l'exécution des travaux s'effectuent dans Batch Manager. L'ordinateur doit simplement être allumé au moment du lancement d'un travail différé, mais vous pouvez l'éteindre entre le moment où le travail est créé dans Batch Manager et l'heure à laquelle débute le traitement planifié. Si le travail en question implique une numérisation, votre scanner doit être allumé au moment du démarrage du travail et les pages correspondantes doivent être placées dans le chargeur ADF. Lorsque vous sélectionnez l'option Créer un travail, l'Assistant Travail puis l'Assistant Flux de travail apparaissent. La sélection d'options et de réglages est légèrement modifiée dans le second assistant. La première fenêtre de l'Assistant Travail vous permet de définir le type et le nom du travail. Dans les fenêtres suivantes, vous pouvez spécifier une heure de lancement, la répétition du travail ou les instructions spécifiques de surveillance des dossiers. Un travail intègre un flux de travail pour lequel des instructions de planification ont été définies. Reportez-vous à la section Batch Manager, du Chapitre 6, page 88.

à la section Batch Manager, du Chapitre 6, page 88. Traitement à partir d'autres applications La

Traitement à partir d'autres applications

La fonction Direct OCR™ permet de faire appel aux services OCR d'OmniPage à partir des applications suivantes : Microsoft Office XP ou supérieur, Corel WordPerfect 12 ou X3. Avant de pouvoir utiliser cette fonction, vous devez activer l'option Activer Direct OCR sous Outils > Options > Général. Ensuite, deux boutons ajoutés à l'onglet d'OCR Nuance d'Office 2007 ou 2010 ou à une barre d'outils d'OmniPage permettent d'accéder aux services d'OCR.

Configuration de Direct OCR Démarrez l'application à lier à OmniPage. Lancez OmniPage, ouvrez la boîte de dialogue Options, puis l'onglet Général et sélectionnez Activer Direct OCR.

Général et sélectionnez Activer Direct OCR . Dans l'application cibl e, utilisez le bouton barre

Dans l'application cible, utilisez le bouton

barre d'outils d'OmniPage (dans Office 2007 ou 2010, ouvrez l'onglet d'OCR Nuance). Sélectionnez les options de votre choix dans les volets suivants :

Configuration d'acquisition du texte de la

OCR : langues, dictionnaires, mise en page, polices.

Traitement : prétraitement des images, options d'ouverture des PDF, conservation de la mise en page.

Format de sortie : définition d'un niveau de formatage.

Direct OCR : traçage manuel ou automatique des zones, activation ou désactivation de la vérification, source de l'image.

Scanner : configuration ou modification des paramètres du scanner. Les réglages effectués s'appliquent à l'ensemble des opérations futures de Direct OCR jusqu'à leur éventuelle modification ; ils ne sont pas pris en compte si vous utilisez OmniPage sans Direct OCR.

Utilisation de Direct OCR

1. Démarrez l'application et ouvrez un document. Pour importer dans le document les résultats des pages numérisées, placez celles-ci correctement dans le scanner.

2. Utilisez le bouton Configuration d'acquisition du texte

Utilisez le bouton Configuration d'acquisition du texte de la barre d'outils d'OmniPage ou la même commande

de la barre d'outils

d'OmniPage ou la même commande dans le menu Fichier de l'application cible (ou l'onglet OCR Nuance dans Office 2007 ou 2010) pour vérifier et modifier, si nécessaire,

les paramètres de reconnaissance ; le volet Direct OCR vous permet de spécifier si l'entrée provient du scanner, d'un fichier image ou d'un appareil photo numérique.

3. Utilisez le bouton Acquérir le texte

photo numérique. 3. Utilisez le bouton Acquérir le texte de la barre d'outils d'OmniPage ou la

de la barre d'outils d'OmniPage ou la même

commande dans le menu Fichier (dans Office 2007 ou 2010, utilisez l'onglet d'OCR de Nuance) pour acquérir des images à partir de la source spécifiée.

4. Si vous avez sélectionné l'option Définir les zones automatiquement dans l'onglet Direct OCR de la boîte de dialogue Options ou dans la fenêtre Configuration d'acquisition du texte, la reconnaissance est lancée immédiatement.

5. Si vous n'avez pas sélectionné l'option Définir les zones automatiquement, le programme vous propose de tracer des zones manuellement sur chaque image de page. Cliquez sur le bouton Exécuter l'OCR pour poursuivre la reconnaissance.

6. Si la fonction de vérification a été activée, cette opération suit l'OCR. Le texte reconnu est ensuite inséré dans votre application à l'emplacement du curseur, avec le niveau de formatage spécifié grâce à la commande Configuration d'acquisition du texte du volet Format de sortie.

Définition de la source des images de page

Les images peuvent provenir des trois sources suivantes : fichiers image, appareil photo numérique et scanner. Il existe essentiellement deux types de scanner : à plat et à alimentation feuille à feuille. Pour faciliter la numérisation des documents multipages, un scanner peut être équipé d'un chargeur automatique (ADF). Les images des documents numérisés peuvent être soit exportées directement dans OmniPage, soit enregistrées avec le logiciel du scanner, dans un format de fichier image utilisable dans OmniPage. La largeur ou la hauteur minimale des fichiers image est de 16 x 16 pixels. La largeur ou la hauteur maximale est de 8 400 pixels (71 cm/28 pouces pour une résolution comprise entre 201 à 600 ppp). Pour connaître toutes les limites en pixels, reportez-vous à l'aide.

Vous pouvez définir le mode d'ouverture des fichiers PDF sous Outils > Options > Traitement : affichage de la couche de texte ou ouverture en tant qu'image, importation des informations des balises pour conserver la mise en page et utilisation des polices du PDF ou des polices système mappées. Reportez-vous à la section Assistant eDiscovery pour PDF avec recherches pour savoir comment transformer des fichiers PDF constitués partiellement ou totalement d'images en PDF autorisant des recherches de texte complètes.

Importation de fichiers image

Vous pouvez créer un fichier image à partir de votre scanner, ou le recevoir par e-mail ou par fax. La liste des types de fichiers image compatibles avec OmniPage est très étendue. Sélectionnez Charger des fichiers dans la liste déroulante Importer page(s). Spécifiez les fichiers dans la boîte de dialogue Charger des fichiers. Celle-ci apparaît lorsque vous démarrez le traitement automatique. Lors d'un traitement manuel, cliquez sur le bouton Importer page(s) ou utilisez la commande appropriée du menu Traitement. Les réglages évolués, proposés dans la partie inférieure de la boîte de dialogue, peuvent être affichés ou masqués selon vos préférences.

Importation depuis un site de stockage en ligne

La liste Importer page(s) offre des connexions directes avec les sites de stockage en ligne suivants : Evernote et Dropbox. OmniPage 18 est fourni avec le composant Nuance Cloud Connector, dont la configuration s'effectue par le biais de l'élément correspondant du groupe Nuance Cloud Connector de Windows. Ce composant vous permet de configurer les sites de stockage en ligne auxquels vous souhaitez accéder, ainsi que les sites FTP à utiliser pour l'enregistrement des fichiers. Lors de l'importation de fichiers depuis des sites de stockage en ligne, vous devrez peut-être entrer des informations de connexion.

devrez peut-être entrer des informations de connexion. Avec OmniPage Professional, il est possi ble d'importer
devrez peut-être entrer des informations de connexion. Avec OmniPage Professional, il est possi ble d'importer

Avec OmniPage Professional, il est possible d'importer des fichiers depuis des sources Microsoft SharePoint 2003, 2007 et 2010, Hummingbird, iManage ou depuis un système de gestion documentaire automatisé (ODMA).

Importation de photos numériques

Vous pouvez importer des photos de documents en vue de le ur reconnaissance dans OmniPage. Assurez-vous tout d'abord que le pilote ents en vue de leur reconnaissance dans OmniPage. Assurez-vous tout d'abord que le pilote de votre appareil photo est installé correctement. Raccordez ensuite votre appareil photo, puis téléchargez vos images. Sélectionnez Charger des photos numériques dans la liste déroulante Importer page(s). Avec cette méthode, les traitements suivants sont automatiquement exécutés :

redressement 3D, amélioration de la résolution et redressement des lignes de texte. Vous pouvez également procéder à un redressement 3D manuel. Pour plus d'informations, reportez- vous à la section Outils de retouche d'images ci-après dans ce chapitre. Pour importer des photos numériques contenant du texte à l'aide de Direct OCR ou de PaperPort, activez la case à cocher Charger en tant que photo numérique. Les améliorations citées précédemment seront automatiquement appliquées. Pour obtenir des conseils sur la manipulation de photos numériques, reportez-vous aux Guides d'apprentissage et à l'aide.

Importation de fichiers avec le Chargeur express

Cet outil permet d'accéder à une interface semblable à celle de l'Explorateur Windows dans une fenêtre d'OmniPage. Dans les modes Flexible et Conversion rapide, le Chargeur express

apparaît par défaut. Sélectionnez Chargeur express dans le menu Fenêtre pour l'ajouter au mode Classique ou pour l'afficher ou le masquer dans les autres modes. Cet outil offre une alternative à la boîte de dialogue Ouvrir un fichier et vous permet de parcourir l'ensemble de votre système de fichiers et de sélectionner rapidement les fichiers que vous souhaitez charger dans OmniPage. Choisissez Traitement > Chargeur express > Dossier pour afficher les fichiers sous forme de listes, de vignettes, de mosaïques, d'icônes (organisées à votre guise) ou de façon détaillée, comme vous en avez l'habitude dans l'Explorateur Windows. Le Chargeur peut rester affiché pendant que vous travaillez. Pour lancer le Chargeur express, accédez au menu Traitement. Au lieu de sélectionner des fichiers et les envoyer directement dans OmniPage, vous pouvez choisir l'option Fenêtre de la file pour afficher une boîte de dialogue dotée d'une fonction de verrouillage. Activez le verrouillage pour compiler et réorganiser une liste de fichiers (même en provenance de différents dossiers). Le verrouillage s'applique à tous les fichiers collectés pour être ajoutés au document ouvert. Lorsque la liste est finalisée, désactivez le verrouillage pour démarrer le chargement. Si le verrouillage est désactivé dès le début, les fichiers sont uniquement répertoriés si leur sélection est effectuée plus rapidement qu'OmniPage ne peut les charger. Dans la pratique, vous pouvez charger quelques fichiers, lancer la reconnaissance et, pendant que cette opération est en cours, compiler le reste de la liste d'entrée. Si vous activez la commande de menu Afficher/Masquer automatiquement la fenêtre de la file, la fenêtre apparaît chaque fois que des fichiers sont en attente de chargement, et se ferme dès que la liste est vide. Le Chargeur express peut être utilisé dans les modes Classique et Flexible pour compiler des fichiers pour plusieurs documents. Activez le verrouillage, activez le document 1 et collectez les fichiers. Activez ensuite le document 2 et collectez les fichiers correspondants, et ainsi de suite. Lorsque vous avez terminé, désactivez le verrouillage. Chaque document possède son propre verrou, mais le menu Traitement dispose des options Verrouiller tout et Déverrouiller tout qui permettent de verrouiller ou libérer tous les fichiers de tous les documents. Vous pouvez supprimer les fichiers sélectionnés à l'aide de l'option Supprimer, ou supprimer tous les fichiers de la liste du document en cours à l'aide des options Supprimer tout ou Effacer du menu Traitement. Choisissez l'option Vider tout pour supprimer tous les fichiers de tous les documents ouverts. Reportez-vous au didacticiel de l'aide consacré au chargement de fichiers pour plusieurs documents.

Le Chargeur express est disponible sous la forme d'un volet dans le mode Conversion rapide. Le menu Traitement possède deux commandes spécifiques au mode Conversion rapide.

Importer et convertir permet un traitement « en un clic » : les fichiers sont chargés, traités par un programme d'OCR et enregistrés selon les paramètres actuellement définis. Dans ce seul cas, plusieurs fichiers peuvent être sélectionnés en mode Conversion rapide, et un document de sortie est créé pour chaque fichier d'entrée. Avant de commencer, sélectionnez Identique au nom de fichier source sous l'en-tête Nom de fichier en sortie.

Charger des fichiers charge les fichiers sans effectuer de procédure de reconnaissance, comme dans les autres modes d'affichage. En mode Conversion rapide, cette option permet de charger un seul fichier à la fois. Le traitement doit être achevé avant qu'un nouveau fichier d'entrée puisse être sélectionné. Dans ce cas, la fenêtre de la file et son verrou ne sont d'aucune utilité. Le Chargeur express peut traiter les photos numériques. Pour cela, définissez le paramètre correspondant dans le volet Options du mode Conversion rapide avant de démarrer le Chargeur express. Si l'importation est définie sur Numériser, ce paramètre est temporairement ignoré et les pages sont chargées comme des images normales (ne provenant pas d'un appareil photo numérique). Toutes les fonctionnalités de l'Explorateur Windows sont disponibles dans le Chargeur express. Par exemple, vous pouvez également sélectionner des fichiers et utiliser l'élément de menu contextuel OmniPage 18 pour les envoyer vers MS Excel, MS Word, PDF, RTF, un fichier au format texte et WordPerfect. Les paramètres existants sont utilisés et les fichiers générés sont placés, par défaut, dans le dossier d'entrée. Utilisez l'Assistant Convertir maintenant pour accéder aux paramètres de base et déterminer, par exemple, si les résultats doivent ou non être affichés dans l'application cible. Cet Assistant vous permet d'effectuer des conversions immédiates ou d'ouvrir l'Assistant Flux de travail pour accéder à tous les paramètres, ce qui permet notamment de modifier le nom et l'emplacement des fichiers cibles. Cet élément de menu contextuel permet également d'afficher tous les flux de travail comportant un fichier image en entrée.

Importation de documents à partir d'un scanner

Pour bénéficier de cette fonction, vous devez disposer d'un scanner compatible, opérationnel et correctement configuré en vue d'une utilisation avec OmniPage 18. Le programme offre plusieurs modes de numérisation que vous choisissez en fonction des deux facteurs suivants :

le type de graphique souhaité dans le document de sortie ;

le mode qui produira la reconnaissance la plus précise.

Numériser en noir et blanc Sélectionnez cette option pour la ncer une numérisation en noi r et blanc. La rapidité Sélectionnez cette option pour lancer une numérisation en noir et blanc. La rapidité de numérisation et de traitement ainsi que le moindre espace disque occupé représentent les deux principaux avantages de ce mode de numérisation par rapport aux deux autres.

Numériser en niveaux de gris Sélectionnez cette optio n pour lancer une numérisation en niveaux de gris. Pour de meilleurs Sélectionnez cette option pour lancer une numérisation en niveaux de gris. Pour de meilleurs résultats de reconnaissance, utilisez cette option pour les pages présentant un contraste variable ou réduit (peu de différence entre les zones claires et sombres) et un fond en couleur ou en dégradé.

Numériser en couleur Sélectionnez cette op tion pour lancer une numérisati on en couleur. Cette option n'est disponible Sélectionnez cette option pour lancer une numérisation en couleur. Cette option n'est disponible que si vous disposez d'un scanner couleur. Elle est particulièrement adaptée si vous souhaitez conserver les graphiques, le texte et les fonds en couleur dans le document de sortie. La numérisation en couleur offre une meilleure précision d'OCR que le mode en niveaux de gris, mais exige un temps de traitement plus long et une plus grande quantité de mémoire et d'espace disque.

Luminosité et contraste

Le réglage de la luminosité et du contraste joue un rôle important dans la précision de l'OCR. Vous définissez ces paramètres dans l'onglet Scanner de la boîte de dialogue Options ou par l'intermédiaire de l'interface de votre scanner. Dès le chargement d'une image, vérifiez son aspect. Si les caractères sont gras et compacts, augmentez la luminosité. Si les caractères sont fins et tronqués, assombrissez l'image. Une fois les modifications requises effectuées, renumérisez la page. Si la qualité de la numérisation vous paraît toujours décevante, ouvrez l'image numérisée dans la fenêtre Retouche d'une image et éditez-la à l'aide des différents outils proposés.

Numérisation avec un chargeur (ADF)

La meilleure méthode pour numériser des documents de plusieurs pages est d'utiliser un chargeur automatique. Placez les pages dans l'ordre requis dans le chargeur. Un chargeur ADF accepte également la numérisation de pages recto verso. Les scanners dotés de fonctions recto verso assurent un traitement automatique des pages.

Numérisation sans chargeur

Même si vous ne disposez pas d'un chargeur automatique, l'interface de numérisation d'OmniPage vous permet de numériser efficacement des documents multipages à l'aide de votre scanner à plat. Sélectionnez l'option Numériser les pages automatiquement (onglet Scanner de la boîte de dialogue Options) et définissez une valeur de pause en secondes. Ainsi le scanner effectue les passes de numérisation automatiquement, en marquant une pause de durée spécifiée entre chaque numérisation pour vous permettre de charger la page suivante.

Numérisation vers OmniPage et utilisation des flux de travail

Accédez à Outils > Options > Scanners pour choisir l'action exécutée lorsque vous appuyez sur un bouton de votre scanner local. Il peut s'agir d'une simple numérisation avec chargement des images dans OmniPage. Il est également possible de sélectionner un flux de travail de numérisation parmi ceux déjà créés, ou d'activer l'affichage d'un message invitant à sélectionner un flux de travail chaque fois que vous appuyez sur ce bouton. Utilisez le bouton Panneau de configuration pour associer OmniPage à un événement de scanner (pression exercée sur un bouton du scanner). Lorsque vous appuyez sur ce bouton, OmniPage démarre, exécute le flux de travail et envoie les résultats vers la cible définie, avec ou sans votre intervention. Avec OmniPage Professional, cette fonctionnalité peut également être utilisée pour lancer des flux de travail invoqués par codes à barres (voir Chapitre 6, page 89).

Conversion de documents

Outre des fichiers image, OmniPage Professional 18 permet d'ouvrir des documents créés dans des programmes de traitement de texte et d'autres applications similaires. (fichiers .doc, .xls, .ppt, .rtf, .wpd, etc.). Cliquez sur le bouton Charger des fichiers dans la boîte à outils OmniPage ou sélectionnez Charger des fichiers dans le sous- menu Importer page(s) du menu Fichier. Dans la boîte de dialogue qui apparaît, choisissez Documents. Lorsque vous avez terminé, choisissez votre format d'enregistrement parmi l'un des nombreux types de fichiers proposés. Pour réaliser ces conversions, Nuance PDF Create doit être installé.

des nombreux types de fichiers proposés. Pour réaliser ces conversions, Nuan ce PDF Create doit être

Définition de la mise en page du document

Avant de commencer la reconnaissance d'un document, OmniPage vous demande de décrire la mise en page de celui-ci dans le but de faciliter le traçage automatique des zones. Cette fonction s'applique également en cas de traitement automatique, à moins que vous n'ayez spécifié un gabarit ne contenant aucune zone ou fond à valeur Traiter. Lors d'un traitement manuel, le traçage de zones automatique est parfois activé. Reportez-vous à la rubrique Activation du traçage automatique de zones. Pour décrire le document original, vous disposez des options suivantes :

Automatique Choisissez cette option pour laisser le programme prendre toutes les décisions concernant la définition de Choisissez cette option pour laisser le programme prendre toutes les décisions concernant la définition des zones. Le programme détermine si l'élément est du texte en colonnes, un graphique, du texte à reconnaître ou un tableau à conserver.

Colonne unique sans tableau Choisissez ce réglage si vos pages contiennent une seule colonne de texte et aucun tableau. Choisissez ce réglage si vos pages contiennent une seule colonne de texte et aucun tableau. Ce type de mise en page est employé généralement dans les livres et les lettres commerciales.

Colonnes multiples sans tableau Choisissez cette option si certaines de vos pages contiennent du texte en colonnes que vous Choisissez cette option si certaines de vos pages contiennent du texte en colonnes que vous souhaitez disposer sans colonnes ou dans des colonnes distinctes (correspondant à la mise en page originale).

Colonne unique avec tableau Choisissez cette option si vos pages contiennent une seul e colonne de texte et un Choisissez cette option si vos pages contiennent une seule colonne de texte et un tableau.

Feuille de calcul Choisissez cette option si l'intégralité de la page se présente sous la forme d'un tableau Choisissez cette option si l'intégralité de la page se présente sous la forme d'un tableau que vous souhaitez exporter dans une feuille de calcul ou en tant que tableau unique.

Formulaire Choisissez cette option si l'intégralité de la page se présente sous la forme d'un formulaire Choisissez cette option si l'intégralité de la page se présente sous la forme d'un formulaire dont vous souhaitez reconnaître automatiquement les éléments. À l'issue de la reconnaissance, vous pouvez modifier les propriétés des éléments de formulaire, ajouter de nouveaux éléments ou modifier la mise en page du formulaire. Cette option n'est disponible qu'avec OmniPage Professional 18.

Cette option n'est disponi ble qu'avec OmniPage Professional 18. Chapitre 3 Traitement des documents 37

Document juridique Choisissez cette option pour reconnaître des documents juridiques. Les en-têtes sont détectés et supprimés Choisissez cette option pour reconnaître des documents juridiques. Les en-têtes sont détectés et supprimés automatiquement, et vous devez indiquer si vous souhaitez conserver ou pas les numéros de ligne.

Personnalisé Choisissez cette option pour contrôler au maximum le déroulement du traçage de zones automatique. Vous Choisissez cette option pour contrôler au maximum le déroulement du traçage de zones automatique. Vous pouvez désactiver ou forcer la détection de colonnes, de graphiques et/ou de tableaux. Sélectionnez les réglages requis dans l'onglet OCR de la boîte de dialogue Options.

Gabarit Choisissez un fichier de gabari t de zones si vous souhait ez appliquer une valeur Choisissez un fichier de gabarit de zones si vous souhaitez appliquer une valeur de fond, avec ses zones et propriétés, à toutes les pages importées. Les zones définies par le gabarit sont appliquées à la page actuelle, et remplacent les zones existantes.

Si le découpage en zones automatique produit des résultats inattendus, utilisez le traitement manuel pour redéfinir les zones sur les pages individuelles et relancer leur reconnaissance.

Prétraitement des images

Afin d'optimiser le processus d'OCR, vous pouvez utiliser les outils de retouche pour améliorer la qualité de vos images avant de procéder à leur découpage en zones et à leur reconnaissance. Cliquez sur le bouton SET - Retoucher l'image dans la barre d'outils Image pour ouvrir la fenêtre Retouche d'une image. Cette fenêtre affiche deux volets : l'un affiche l'image de départ (1), à gauche ; l'autre le résultat (2), à droite. Sélectionnez un outil (consultez les sections suivantes pour plus d'informations), puis déplacez les glissières ou ajustez les contrôles (3). Lorsque le résultat vous satisfait, cliquez sur Appliquer (4). Vous pouvez Ignorer la dernière modification (5) ou Ignorer toutes les modifications (6) pour revenir à l'image d'origine. Lorsque vous cliquez sur Appliquer, l'image de droite est transférée dans le volet de gauche, devenant ainsi la nouvelle image de départ que vous pouvez continuer à éditer. Les modifications sont répertoriées dans le volet Historique (7). Quand vous avez terminé,

sont répert oriées dans le volet Historique (7). Quand vous avez terminé, Chapitre 3 Traitement des

cliquez sur Page prête (8) pour charger la page suivante, ou sur Document prêt (9) pour terminer votre travail de retouche.

prêt (9) pour terminer votre trav ail de retouche. Il existe trois types d'image : Image

Il existe trois types d'image :

Image originale : image générée par numérisation ou incorporée dans un fichier électronique avant son importation dans le programme. Image primaire : état de l'image originale une fois chargée dans OmniPage. Cette image peut avoir été modifiée par des opérations de prétraitement automatiques ou manuelles. Image OCR : image en noir et blanc dérivée de l'image primaire, optimisée pour une reconnaissance optimale.

L'image primaire est utilisée en tant qu'entrée pour le processus de retouche d'images.

qu'en trée pour le processus de retouche d'images. Cet outil vous permet de basculer entre l'affichage

Cet outil vous permet de basculer entre l'affichage de l'image primaire et de l'image OCR. Certains outils affectent l'image primaire, tandis que d'autres s'appliquent à l'image OCR. Déterminez avec précision le type d'image qui sera modifié par le processus.

Le réglage de la luminosité et du contraste joue un rôle important dans la précision de l'OCR. Vous définissez ces paramètres dans l'onglet Scanner de la boîte de dialogue Options ou par l'intermédiaire de l'interface de votre scanner. Le diagramme ci-dessous illustre le réglage de luminosité optimal. Dès le chargement d'une image, vérifiez son aspect. Si les caractères sont gras et compacts, augmentez la luminosité. Si les caractères sont fins et tronqués, assombrissez l'image. Utilisez l'outil Luminosité de l'OCR pour optimiser l'image.

Lu minosité de l'OCR pour optimiser l'image. Inacceptable Tolérable Bonne Optimale Bonne Tolérable

Inacceptable

Tolérable

Bonne

Optimale

Bonne

Tolérable

Inacceptable

Outils de retouche d'images

Les outils de retouche d'images permettent également d'éditer des images primaires afin de les enregistrer en tant que fichiers image. Les outils suivants sont disponibles dans la barre d'outils (de gauche à droite) ; leurs fonctions sont détaillées ci-dessous :

P – Affecte uniquement l'image primaire. O – Affecte uniquement l'image OCR. PO – Peut être appliqué à l'image primaire ou à l'image OCR (ou aux deux). P+O – Une même action est appliquée à l'image primaire et à l'image OCR. P/O – Affecte les deux images. ENT – S'applique uniquement aux images entières. ZON – Peut être appliqué à certaines zones des images.

Pointeur (F5) - Le pointeur est un outil neutre qui perm et de réaliser différentes actions (comme - Le pointeur est un outil neutre qui permet de réaliser différentes actions (comme sélectionner une couleur de remplissage ou la ligne de redressement d'une image) selon les circonstances. PO.

Zoom (F6) - Cliquez sur cet outil, puis utilisez le bouton gauche de la souris pour agrandir - Cliquez sur cet outil, puis utilisez le bouton gauche de la souris pour agrandir l'image ou le bouton droit pour la réduire. Vous pouvez également utiliser la roulette de la souris pour agrandir ou réduire l'image à votre gré, y compris dans la vue inactive. Dans la vue active, les boutons « + » et « - » ont la même fonction. (P+O) ENT.

Sélectionner une zone (F7) - Cliquez sur cet outil, puis sur un outil pouvant être appliqué sur une zone - Cliquez sur cet outil, puis sur un outil pouvant être appliqué sur une zone spécifique de la page (indiqué par la mention « ZO »), et tracez votre sélection sur l'image. Par défaut, les outils de retouche d'images s'appliquent à la page entière. Il existe trois modes de sélection (accessibles via le menu Affichage) :

Normal, Additif et Soustractif. PO. ZON.

Image primaire/OCR - Cet outil permet de basculer entre l'affichage de l'image primaire et de l'image OCR - Cet outil permet de basculer entre l'affichage de l'image primaire et de l'image OCR dans la vue active. Les images primaires sont associées à n'importe quel mode image. En revanche, les images OCR (version noir et blanc des images primaires) sont générées uniquement pour la reconnaissance. P/O. ENT.

Synchroniser les vues - Cliquez sur cet outil pour appli quer à la vue inactive un facteur de - Cliquez sur cet outil pour appliquer à la vue inactive un facteur de zoom et une position de défilement identiques à ceux définis pour la vue active. Pour synchroniser de façon dynamique la vue inactive avec la vue active, choisissez la commande Maintenir la synchronisation dans le menu Affichage. PO. ENT.

Les outils SET suivants vous permettent de modifier le contenu de votre image :

Luminosité et contraste - Cet outil permet d'ajuster la luminosité et le contraste de toute ou partie de - Cet outil permet d'ajuster la luminosité et le contraste de toute ou partie de l'image primaire. Utilisez les glissières situées dans la partie inférieure de la fenêtre pour atteindre le résultat escompté. P. ZON.

Teinte / Saturation / Clarté - Cliquez sur cet outil, puis utilisez les glissières pour modifier la teinte, la saturation - Cliquez sur cet outil, puis utilisez les glissières pour modifier la teinte, la saturation et la clarté de l'image primaire. P. ZON.

Découper - Si vous décidez de n'utiliser qu'une certaine partie de l'image, cliquez sur l'outil Sélectionner - Si vous décidez de n'utiliser qu'une certaine partie de l'image, cliquez sur l'outil Sélectionner une zone puis sur l'outil Découper, et sélectionnez la zone de l'image que vous souhaitez conserver. Le reste de l'image sera alors supprimé. (P+O) ENT > ZON

Rotation - Utilisez cet outil pour faire pivoter (de 90, 180 ou 270 degrés) et/ou retourner - Utilisez cet outil pour faire pivoter (de 90, 180 ou 270 degrés) et/ou retourner l'image. (P+O) ENT.

Nettoyer - Cet outil permet de supprimer les para sites de l'image. L'outil de nettoyage opère - Cet outil permet de supprimer les parasites de l'image. L'outil de nettoyage opère sur l'image OCR à quatre niveaux. Vous pouvez également utiliser cet outil pour inverser le nettoyage et renforcer le contour des lettres. Pour ce faire, il vous suffit de cocher la case Inverser le nettoyage. O. ZON.

Luminosité d'OCR - Cet outil permet de définir la luminosité et le contraste de l'image OCR. Reportez-vous - Cet outil permet de définir la luminosité et le contraste de l'image OCR. Reportez-vous au diagramme du réglage de luminosité optimal à la section « Prétraitement des images » ci-avant. O. ZON.

Ignorer couleur - Cliquez sur cet outil et sélect ionnez une couleur prédéfinie (rouge, vert ou bleu) - Cliquez sur cet outil et sélectionnez une couleur prédéfinie (rouge, vert ou bleu) ou choisissez une couleur spécifique dans l'image primaire via l'outil Sélectionner une zone. les sections de l'image numérisée dans cette couleur deviendront transparentes. Cet outil s'applique à l'image OCR. Cette option permet d'ignorer une couleur spécifique lors de la numérisation ou du chargement de formulaires couleur pré-imprimés. Avec cette option, les éléments tels que les textes fixes et éléments de formulaires sont supprimés, de sorte que seules les réponses sont conservées, prêtes pour leur reconnaissance par OCR. P/O. ENT.

Résolution - Utilisez cet outil pour ré duire la résolution de l'ima ge primaire, indiquée en - Utilisez cet outil pour réduire la résolution de l'image primaire, indiquée en pourcentages. Notez qu'il est impossible de définir une résolution supérieure à celle de l'image originale. P. ENT.

Redresser - Certaines pages peuvent avoir été numérisées de trav ers. Dans ce cas, l'outil Redresser - Certaines pages peuvent avoir été numérisées de travers. Dans ce cas, l'outil Redresser vous permet de redresser manuellement les lignes de texte. Une option de redressement automatique est également disponible dans l'onglet Traitement de la boîte de dialogue Options. (P+O) ENT.

Redressement 3D - Utilisez cet outil pour supprimer la distorsion de perspective sur des images provenant d'un - Utilisez cet outil pour supprimer la distorsion de perspective sur des images provenant d'un appareil photo numérique. Utilisez cet outil pour vérifier les résultats de redressement 3D automatique, ou pour procéder à un redressement 3D manuel après une étape Charger des fichiers. (P+O) ENT.

Le redressement 3D fonctionne par l'alignement d'une image sur une grille de référence. Il vous suffit d'étirer manuellement cette grille pour que les coordonnées de l'image soient

modifiées en conséquence. Reportez-vous à l'illustration suivante pour plus d'informations (Avant / Après Redressement 3D).

plus d'informations (Avant / Après Redressement 3D). Remplir - Utilisez cet outil pour appliquer une couleur

Remplir - Utilisez cet outil pour appliquer une couleur à l'image ou à une partie de - Utilisez cet outil pour appliquer une couleur à l'image ou à une partie de l'image. PO. ZON.

Recadrer automatiquement - Détecte automatiquement les zones de marge de la page, et les réduit au minimum. - Détecte automatiquement les zones de marge de la page, et les réduit au minimum. Cette fonction permet d'homogénéiser les marges sur un groupe de pages comportant des zones de texte de tailles différentes. (P+O) ENT > ZON

Nettoyer les bordures - Supprime les ombres de numérisation, les poi nts parasites et les notes manuscrites des - Supprime les ombres de numérisation, les points parasites et les notes manuscrites des bordures de page (P+O). ENT, mais uniquement sur les bordures.

Supprimer les perforations - Remplace les trous de perforeuse par la couleur de fond de la page. (P+O) - Remplace les trous de perforeuse par la couleur de fond de la page. (P+O) ENT, mais uniquement sur les bordures.

Améliorer photo de tableau blanc - Affiche une glissière qui vous permet d'améliorer la lisibilité des textes et des schémas - Affiche une glissière qui vous permet d'améliorer la lisibilité des textes et des schémas capturés avec un appareil photo numérique sur un tableau blanc ou noir. Les images suivantes montrent le résultat qui peut être obtenu lorsque cet outil est utilisé avec l'outil Redressement 3D.

Voici une photo numérique typique d'un tableau blanc, prise de côté avec un faible contraste :

tableau blan c, prise de côté avec un faible contraste : L'image de droite montre le

L'image de droite montre le résultat obtenu après application du redressement 3D.

de droite montre le résultat obtenu après application du redressement 3D. Chapitre 3 Traitement des documents

La glissière de l'outil Amélioration de photo pour tableau blanc est utilisée pour améliorer le contraste de l'image. L'image de gauche représente la photo de départ ; celle de droite montre le résultat.

la photo de départ ; celle de droite montre le résultat. Certains de ces outils peuvent

Certains de ces outils peuvent également être utilisés lors du pré-traitement automatique de l'ensemble des images entrantes. Ils sont disponibles dans le volet Traitement de la boîte de dialogue Options.

Historique des retouches apportées aux images

L'historique de la fenêtre Retouche d'une image vous permet de valider ou d'annuler (individuellement ou globalement) les modifications apportées à vos images. Dès lors que vous avez modifié l'image de départ, la fenêtre de résultat affiche les modifications. Cliquez sur le bouton Appliquer, en regard de la liste Historique, pour confirmer les modifications. Les modifications qui n'ont pas été ajoutées dans l'historique à l'aide du bouton Appliquer ne seront pas validées. Cliquez sur le bouton Réinitialiser pour annuler les modifications effectuées à l'aide d'un outil spécifique, avant leur application. Pour restaurer l'image à son état d'origine, cliquez sur le bouton Ignorer toutes les modifications.

cliquez sur le bouton Ignorer toutes les modifications. Pour vérifier le résultat d'une action, cliquez deux
cliquez sur le bouton Ignorer toutes les modifications. Pour vérifier le résultat d'une action, cliquez deux
cliquez sur le bouton Ignorer toutes les modifications. Pour vérifier le résultat d'une action, cliquez deux

Pour vérifier le résultat d'une action, cliquez deux fois dessus dans la liste de l'historique. L'écran affiche le résultat de l'action en supprimant toutes les actions effectuées par la suite. Si vous appliquez une nouvelle modification à l'image affichée, toutes les modifications ultérieures figurant dans la liste Historique sont remplacées.

Enregistrement et application de modèles de retouche automatique

Si vous devez retoucher de la même manière un certain nombre d'images similaires, vous pouvez créer une liste d'actions de retouche qui seront appliquées à la totalité des images. Pour créer et enregistrer un modèle de retouche automatique d'images, affichez un fichier image dans la fenêtre Retouche d'une image, réalisez les actions de prétraitement souhaitées, puis ajoutez-les dans l'historique en cliquant sur le bouton Appliquer. Choisissez ensuite la commande Enregistrer le modèle de retouche automatique dans le menu Fichier de la fenêtre Retouche d'une image. Sélectionnez le dossier de destination de votre choix, puis enregistrez le fichier modèle (associé à l'extension .ipp). Pour appliquer à une autre image les modifications définies dans le fichier modèle, ouvrez la nouvelle image dans la fenêtre Retouche d'une image, puis choisissez Charger un modèle de retouche automatique dans le menu Fichier.

Intégration d'un processus de retouche d'images à un flux de travail

processus de retouc he d'images à un flux de travail Pour intégrer un processus de retouche

Pour intégrer un processus de retouche à un flux de travail, choisissez l'icône appropriée dans l'Assistant Flux de travail.

Vous avez le choix entre les options suivantes :

Afficher les images en vue d'une retouche manuelle - Lors de l'exécution d'un flux de travail, chaque image chargée sera affichée en vue d'une retouche manuelle. Appliquer un modèle de retouche automatique - Un modèle de retouche enregistré sera automatiquement appliqué à l'image traitée par le flux de travail. Appliquer un modèle de retouche automatique et afficher les images - Le flux de travail appliquera le modèle de retouche sélectionné et l'image sera affichée pour permettre d'éventuelles retouches supplémentaires.

Zones et fonds

Les zones définissent les sections de la page destinées à être traitées ou ignorées. Elles peuvent prendre une forme rectangulaire ou irrégulière (avec des côtés verticaux et horizontaux). Les images de page d'un document possèdent une valeur de fond : Traiter ou Ignorer (cette dernière étant la plus répandue). Vous pouvez utiliser les outils indiqués pour modifier les valeurs de fond. Les outils indiqués dans la section « Types et propriétés de zone » (voir ci-dessous) sont également disponibles pour tracer des zones sur des fonds de page.

Traiter – Le document est découpé automatiquement en zones (dans les zones ou les fonds de type Traiter) lors de son envoi pour reconnaissance. Ignorer – Les zones (dans les zones et fonds de type Ignorer) sont exclues du traitement. Le texte n'est pas reconnu et aucune image n'est transférée.

Découpage en zones automatique

Le découpage en zones automatique permet au programme de détecter les éléments de page (blocs de texte, en-têtes, images et autres) et de les inclure dans une zone.

Le tracé automatique des zones peut s'appliquer à toute la page ou à une partie seulement. Les zones tracées automatiquement et les zones de gabarit ont des bordures pleines ; les zones tracées manuellement et les zones modifiées ont des bordures en pointillés.

Tracé automatique de zones sur un fond de page Importez une page. Celle-ci s'affiche avec un fond de type Traiter. Tracez une zone. La valeur de fond passe à Ignorer. Tracez les zones Texte, Tableau ou Graphique afin de délimiter manuellement les zones de type voulu. Cliquez sur l'outil Fond à valeur Traiter (voir illustration) afin de définir un fond de ce type. Tracez des zones à valeur Ignorer sur les parties inutiles de la page. À l'issue de la reconnaissance, la page réapparaît : elle comprend un fond à valeur Ignorer et de nouvelles zones encadrant tous les éléments du fond.

Traçage automatique des zones de texte vertical Si la langue de reconnaissance est définie sur le japonais, le coréen ou le chinois, le traçage automatique des zones détecte les zones de texte et identifie l'orientation du texte. Le texte asiatique vertical apparaît horizontalement dans l'Éditeur de texte, mais peut être exporté verticalement. Reportez-vous à la section Chapitre 4, page 59.

Le traçage automatique des zones détecte le texte vertical rédigé dans des langues non- asiatiques à l'intérieur des cellules de tableaux et partout sur les pages PDF ou XPS. La détection sur plusieurs lignes est alors possible.

Pour les fichiers PDF et XPS constitués uniquement d'images et tous les autres fichiers de numérisation ou fichiers image en entrée, la détection automatique fonctionne dans les conditions suivantes :

auto matique fonctionne dans les conditions suivantes : • Une seule ligne de te xte doit

Une seule ligne de texte doit être présente

Le texte doit se trouver à droite ou à gauche d'un diagramme ou d'une image

Le texte doit se trouver sur le bord gauche ou droit de la page et ne doit pas s'étendre sur toute la hauteur de la page. Le texte vertical placé à l'extérieur des tableaux peut être découpé manuellement en zones, en suivant la procédure ci-dessous. Le traitement de plusieurs lignes verticales est ainsi optimisé.

Le texte vertical peut être affiché et édité avec un curseur vertical dans l'Éditeur de texte à l'aide de True Page. Avec les autres niveaux de formatage, le texte est placé horizontalement.

Types et propriétés de zone

Chaque zone est affectée à un type et les zones comportant du texte peuvent également présenter un paramètre de contenu de zone : alphanumérique ou numérique. Le type et le contenu d'une zone représentent les « propriétés de la zone ». Pour modifier les propriétés d'une zone, cliquez dessus avec le bouton droit pour afficher son menu contextuel et effectuez les sélections souhaitées. Pour changer les propriétés de plusieurs zones simultanément, sélectionnez le groupe de zones requis (combinaison Maj.+clic) avant de choisir les nouvelles valeurs.

La barre d'outils Image propose des outils de traçage de zones (un pour chaque type).

Zone Traiter Cet outil permet de tracer une zone à valeur Traiter, afin de définir une section Cet outil permet de tracer une zone à valeur Traiter, afin de définir une section qui sera soumise au traçage de zones automatique. À l'issue de la reconnaissance, cette zone est remplacée par une ou plusieurs zones dont les types sont déterminés automatiquement.

Zone Ignorer Cet outil permet de tr acer une zone à valeur Ignorer , afin de définir Cet outil permet de tracer une zone à valeur Ignorer, afin de définir une section à ne pas transférer vers l'Éditeur de texte.

Zone Texte Cet outil permet de tracer une zone Text e. sur un bloc de texte unique. Cet outil permet de tracer une zone Texte. sur un bloc de texte unique. Le contenu des zones est assimilé à un enchaînement de texte, sans aucune colonne. La zone Texte permet d'insérer du texte en caractères latins, grecs et cyrilliques, ainsi que des textes horizontaux en langue asiatique.

Zone Texte asiatique vertical Cet outil permet de tracer des zones Texte afin d'y in sérer du texte vertical Cet outil permet de tracer des zones Texte afin d'y insérer du texte vertical en japonais ou en chinois. Ces zones doivent être de forme rectangulaire.

Zone Texte vertical et pivoté vers la gauche Cet outil permet de tracer des zones Texte afin d'y insérer pivoté vers la gauche Cet outil permet de tracer des zones Texte afin d'y insérer du texte vertical pivoté vers la gauche (langues non-asiatiques uniquement). Les zones doivent être de forme rectangulaire.

Zone Texte vertical et pivoté vers la droite Cet outil permet de tracer des zones Texte pour insérer du texte ve rtical pivoté Cet outil permet de tracer des zones Texte pour insérer du texte vertical pivoté vers la droite (langues non-asiatiques uniquement). Les zones doivent être de forme rectangulaire.

Zone Tableau Utilisez ce type pour traiter le contenu de la zone en ta nt que tableau. Utilisez ce type pour traiter le contenu de la zone en tant que tableau. Les grilles du tableau peuvent être détectées automatiquement ou placées manuellement. Les zones Tableau doivent être de forme rectangulaire. Le texte vertical placé à l'intérieur des tableaux ne peut pas être découpé manuellement en zones ; il peut être détecté automatiquement dans les tableaux à cellules.

Zone Graphique Utilisez ce type pour entourer une ill ustration, un diagramme, un dessin, une signature et Utilisez ce type pour entourer une illustration, un diagramme, un dessin, une signature et tout autre élément que vous souhaitez transmettre à l'Éditeur de texte en tant qu'image incorporée plutôt que texte reconnu.

Zone Formulaire Utilisez ce type pour délimiter une zone de votre document contenant des éléments de formulaire, Utilisez ce type pour délimiter une zone de votre document contenant des éléments de formulaire, tels qu'une case à cocher, un bouton radio, un champ de texte ou tout autre élément que vous souhaitez transmettre à l'Éditeur de texte en tant qu'élément de formulaire. Vous pourrez ensuite, dans la vue True Page de l'Éditeur de texte, modifier la mise en page du formulaire ainsi que les propriétés de ses éléments. Les zones Formulaire ne sont prises en charge qu'avec OmniPage Professional.

sont prises en charge qu'avec OmniPage Professional. Manipulation de zones La barre d'outils Image propose

Manipulation de zones

La barre d'outils Image propose des outils d'édition de zones. Pour plus de La barre d'outils Image propose des outils commodités, des groupes d'outil s peuvent être détachés sous commodités, des groupes d'outils peuvent être détachés sous la forme de mini barres d'outils flottantes. Un de ces outils est toujours sélectionné ; pour modifier la sélection en cours, cliquez sur un autre outil. Certains de ces outils sont groupés. En cas d'ancrage comme outil unique, seul le dernier outil sélectionné du groupe est visible. Pour sélectionner un outil visible, cliquez dessus. Pour tracer une zone unique, sélectionnez l'outil de traçage de zone de type voulu, puis cliquez à l'emplacement requis et faites glisser le curseur dans la direction souhaitée. Pour redimensionner une zone, sélectionnez-la (en cliquant dessus), amenez le curseur sur un côté ou un angle, activez une poignée et amenez-la à l'emplacement voulu. La zone redimensionnée ne peut pas recouvrir une autre zone. Pour créer une zone irrégulière par addition, tracez une zone recouvrant partiellement une autre zone du même type.

Pour regrouper deux zones du même type, tracez une zone recouvrant une autre zone du même type (dans l'illustration suivante, les zones tracées figurent à gauche, tandis que la zone résultante apparaît à droite).

tandis que la zone résultante apparaît à droite). Pour créer une zone irrégulière par soustraction, tracez

Pour créer une zone irrégulière par soustraction, tracez une zone recouvrant une autre zone du même type que le fond. Pour diviser une zone, tracez une zone de division du même type que le fond. Pour obtenir des exemples d'illustration de traçage de zones, reportez-vous à l'aide. Lorsque la nouvelle zone tracée recouvre partiellement une zone existante d'un type différent, une superposition complète ne se produit pas ; la nouvelle zone remplace seulement la partie recouverte de la zone existante. Les types de zones suivants sont interdits :

zone existante. Les types de zones suivants sont interdits : Le tracé rapide de zones vous

Le tracé rapide de zones vous permet de définir rapidement des zones manuelles. Activez le curseur de sélection de zones, puis déplacez le curseur sur l'image de page. Des parties ombrées apparaissent. Elles indiquent les zones détectées automatiquement. Cliquez deux fois sur chaque partie ombrée pour la transformer en zone.

Gestion des grilles du tableau dans l'image

À l'issue d'un traitement en mode automatique, OmniPage peut placer des zones de type Tableau sur la page traitée. Ces zones comportent une icône de zone Tableau dans leur angle supérieur gauche. Vous pouvez modifier le type affecté à une zone rectangulaire via son menu contextuel. Vous pouvez également tracer des zones de type Tableau, mais elles doivent toujours être rectangulaires. La création ou le déplacement des lignes de séparation verticales et horizontales d'un tableau permet de déterminer l'emplacement de la grille lors du placement du tableau dans l'Éditeur de texte. Vous pouvez tracer ou redimensionner une zone Tableau (à condition de conserver sa forme rectangulaire) pour éliminer les colonnes ou les rangées inutiles des bords extérieurs d'un tableau. Les outils de tableau vous permettent d'insérer, de déplacer et de supprimer des séparations de rangées et de colonnes. Cliquez sur l'outil Insérer/Supprimer les séparations pour détecter automatiquement des séparations dans un tableau et créer de nouvelles séparations. Vous pouvez spécifier le formatage de lignes pour les bordures et les grilles de tableau à partir d'un menu contextuel. Vous disposerez de davantage d'options d'édition des bordures et de fond dans l'Éditeur de texte à l'issue de la reconnaissance.

de texte à l'issue de la reconnaissance. Utilisation de gabarits de zones Un fichier de gabarit
de texte à l'issue de la reconnaissance. Utilisation de gabarits de zones Un fichier de gabarit
de texte à l'issue de la reconnaissance. Utilisation de gabarits de zones Un fichier de gabarit
de texte à l'issue de la reconnaissance. Utilisation de gabarits de zones Un fichier de gabarit

Utilisation de gabarits de zones

Un fichier de gabarit contient une valeur de fond de page, un groupe de zones et leurs propriétés. Pour appliquer les zones d'un gabarit lors de la reconnaissance, chargez un fichier de gabarit de zone via la liste déroulante du bouton de description de la mise en page ou à l'aide du menu Outils. Vous pouvez charger les gabarits créés par d'autres utilisateurs et stockés sur un emplacement du réseau. Lorsque vous chargez un gabarit, son fond et ses zones sont appliqués dans les pages de différentes manières :

Dans la page actuelle, les zones du gabarit remplaçant les zones présentes dans la page.

Dans les pages importées par la suite.

Sur les pages préexistantes envoyées pour (nouvelle) reconnaissance sans aucune zone. Dans les deux premiers cas, le traitement manuel permet de consulter et modifier les zones tracées à l'aide du gabarit avant la reconnaissance.

En traitement automatique, les zones tracées à l'aide du gabarit peuvent être consultées et modifiées seulement après la reconnaissance. En traitement par flux de travail, utilisez l'étape Définir des zones sur des images qui combine une étape de chargement d'un gabarit et une étape de traçage manuel de zones. Pour utiliser un gabarit de zone, cliquez sur le bouton Ajouter dans la fenêtre appropriée de l'Assistant Flux de travail, puis sélectionnez le fichier de gabarit de zones souhaité. Choisissez ensuite si vous souhaitez afficher les images en vue du traçage manuel des zones, appliquer le gabarit de zone ou appliquer le gabarit de zone et afficher les images. Les gabarits acceptent les zones et les fonds à valeur Ignorer et Traiter. Par conséquent, ils peuvent être très utiles pour définir les parties de la page destinées au traitement à l'aide du découpage en zones automatique et les parties à ignorer. Pendant la reconnaissance, vous pouvez remplacer les zones ou les fonds à valeur Traiter par un groupe de zones plus petites, auxquelles seront attribués des types de zones spécifiques.

Enregistrement d'un gabarit de zones Sélectionnez une valeur de fond et préparez les zones de la page. Vérifiez l'emplacement et les propriétés de ces zones. Cliquez sur Gabarit de zones dans le menu Outils. Dans la boîte de dialogue affichée, sélectionnez [zones sur la page] et cliquez sur Enregistrer ; entrez le nom voulu et, le cas échéant, un chemin d'accès différent. Sélectionnez un emplacement du réseau sur lequel installer le fichier de gabarit que vous souhaitez partager. Cliquez sur OK. Le nouveau gabarit de zone reste chargé.

Modification d'un gabarit de zones Chargez un gabarit et importez une image au moyen d'un traitement manuel. Les zones de gabarit apparaissent sur l'image. Modifiez les zones et/ou les propriétés selon vos besoins. Ouvrez la boîte de dialogue Fichiers de gabarit de zones. Le gabarit actuel est sélectionné. Cliquez sur Enregistrer puis sur Fermer. Déchargement d'un gabarit de zones Dans la liste Description de la mise en page, sélectionnez un élément autre qu'un gabarit. Les zones du gabarit ne sont pas supprimées de la page actuelle ou des pages existantes, mais le gabarit n'est plus configuré pour utilisation lors des futurs traitements. Vous pouvez également ouvrir la boîte de dialogue Fichiers de gabarit de zones, sélectionner [aucun] et cliquer sur le bouton Définir comme actuel. Dans ce cas, l'option de description de la mise en page reprend la valeur Automatique.

Remplacement d'un gabarit par un autre Sélectionnez un autre gabarit dans la liste Description de la mise en page, ou ouvrez la boîte de dialogue Fichiers de gabarit de zones, sélectionnez le gabarit souhaité et cliquez sur le bouton Définir comme actuel. Les zones définies par le nouveau gabarit sont appliquées à la page actuelle, et remplacent les zones existantes. Ces zones sont appliquées comme décrit précédemment.

Suppression d'un gabarit de zones Ouvrez la boîte de dialogue Fichiers de gabarit de zones. Sélectionnez un gabarit et cliquez sur le bouton Supprimer. Les zones déjà créées à l'aide de ce gabarit ne sont pas supprimées. Les gabarits de zones peuvent uniquement être supprimés depuis le système d'exploitation.

Incorporation d'un gabarit de zones au sein d'un fichier OPD Ouvrez un document, puis sélectionnez Gabarits de zones dans le menu Outils. Sélectionnez le fichier que vous souhaitez incorporer, puis cliquez sur Incorporer. Enregistrez ensuite votre document au format OPD. Ainsi, si votre fichier OPD est déplacé vers un autre emplacement, le gabarit sera transféré avec votre fichier. Lorsque le fichier OPD est ouvert ultérieurement, le gabarit de zone incorporé sera affiché dans la boîte de dialogue Gabarit de zones avec la mention [incorporé]. Il pourra être enregistré dans un fichier de gabarit sous un nouveau nom, à un nouvel emplacement.

Vérification et édition

Les résultats de la reconnaissance sont affichés dans l'Éditeur de texte. Il peut s'agir d'un texte reconnu, de tableaux, de formulaires et de graphiques incorporés. L'éditeur aux capacités d'affichage fidèle (« WYSIWYG ») fait l'objet d'une description détaillée dans le présent chapitre. Le traitement des textes asiatiques diffère quelque peu de celui des autres langues. Voir « Reconnaissance des langues asiatiques », page 60.

Affichage et niveaux de formatage de l'éditeur

L'Éditeur de texte affiche le texte reconnu et, en fonction de vos réglages, signale les mots qui ont été considérés comme « douteux » pendant la reconnaissance, en les soulignant d'une ligne ondulée rouge. Dans le module Vérification de l'OCR, ces mots sont affichés en rouge. Un mot est considéré comme « douteux » s'il ne figure dans aucun des dictionnaires actifs (standard, utilisateur ou spécialisés) ou s'il figure dans le dictionnaire actif mais qu'il n'a pas été correctement identifié à l'issue du processus d'OCR. Les caractères douteux sont signalés par une mise en surbrillance jaune, à la fois dans l'Éditeur de texte et dans le module Vérification de l'OCR.

Vous pouvez activer ou désactiver les marques des mots absents du dictionnaire dans l'onglet Vérification de la boîte de dialogue Options. Les marques peuvent être affichées ou masquées selon les options sélectionnées dans l'onglet Éditeur de texte de cette même boîte. Vous pouvez également afficher ou masquer les caractères non imprimables et les indicateurs d'en-tête et de bas de page. L'onglet Éditeur de texte permet également de définir l'unité de mesure du programme et de configurer le retour à la ligne automatique dans tous les niveaux de formatage de l'Éditeur de texte, à l'exception du niveau Texte brut. OmniPage peut afficher les pages selon trois niveaux de formatage. Pour passer d'un niveau à l'autre, sélectionnez l'un des trois boutons présents dans l'angle inférieur gauche de l'Éditeur de texte ou utilisez le menu Affichage.

Texte brut Pour afficher le texte en une seule colonne alignée à gauche et appliquer un seul style et corps de police, tout en conservant les sauts de ligne de l'original.

et corps de police, tout en conservant les sauts de ligne de l'original. Chapitre 4 Vérification

Texte formaté Pour afficher le texte en conservant les formats de caractères et de paragraphes, mais en Pour afficher le texte en conservant les formats de caractères et de paragraphes, mais en supprimant les mises en colonnes.

True Page True Page ® permet de conserver au maximum le formatage du document original. Les styles True Page ® permet de conserver au maximum le formatage du document original. Les styles de caractère et de paragraphe sont conservés. L'ordre de lecture peut être indiqué par des flèches.

Vérification des résultats de l'OCR

À l'issue de la reconnaissance d'une page, les résultats de l'opération apparaissent dans l'Éditeur de texte. La vérification démarre automatiquement si l'option correspondante a été activée dans l'onglet Vérification de la boîte de dialogue Options. Vous pouvez également lancer manuellement la vérification à n'importe quel moment. Procédez comme suit :

à n'importe quel moment. Procédez comme suit : 1. Cliquez sur l'outil Vérifier l'OCR dans la

1. Cliquez sur l'outil Vérifier l'OCR dans la barre d'outils Standard ou choisissez Vérifier l'OCR dans le menu Outils.

2. La vérification démarre au début du document, mais omet le texte déjà vérifié. Si un mot douteux est détecté, la boîte de dialogue Vérification de l'OCR affiche ce mot dans son contexte, assorti de l'image originale correspondante. Les caractères douteux sont signalés par une mise en surbrillance jaune. La description suivante : « Mot douteux » ou « Mot absent des dictionnaires » s'affiche.

3. Si le mot reconnu est correct, cliquez sur Ignorer ou Ignorer tout pour passer au mot douteux suivant. Cliquez sur Ajouter pour l'ajouter au dictionnaire utilisateur actuel et passer au mot douteux suivant.

4. Si le mot reconnu est erroné, tapez la version correcte dans la fenêtre d'édition ou sélectionnez une suggestion du dictionnaire. Cliquez sur Remplacer ou Remplacer tout pour valider votre correction et passer au mot douteux suivant. Cliquez sur Ajouter pour ajouter le mot corrigé au dictionnaire utilisateur actuel et passer au mot douteux suivant.

5. Au lieu de cliquer sur une suggestion pour la sélectionner, puis sur Remplacer par pour l'accepter, vous pouvez appuyer sur le numéro associé à la suggestion désirée tout en maintenant la touche Ctrl enfoncée.

6. Au fur et à mesure que les mots douteux affichés dans l'Éditeur de texte sont vérifiés, les marques de couleur les accompagnant disparaissent. Lors de la vérification, vous pouvez passer au volet de l'Éditeur de texte pour y effectuer les corrections requises. Pour relancer

la vérification, utilisez le bouton Reprendre. Cliquez sur Page prête pour passer à la page suivante ou sur Document prêt ou sur Fermer pour arrêter la vérification avant d'atteindre la fin du document.

7. La vignette de toute page entièrement vérifiée porte l'icône de vérification

vérifiée porte l'icône de vérification dans le Gestionnaire de documents. Sélectionnez

dans le

Gestionnaire de documents. Sélectionnez Revérifier la page actuelle Outils pour relancer la vérification de la page.

dans le menu

Vérification du texte reconnu

Lorsque la reconnaissance est terminée, vous pouvez en évaluer la précision en comparant les différentes parties du texte reconnu avec les parties correspondantes de l'image originale. L'outil Vérificateur se trouve dans la barre d'outils de formatage. Vous pouvez également l'activer/le désactiver à partir du menu Outils. Placez le curseur sur le volet du vérificateur pour afficher sa barre d'outils. Utilisez cet outil pour effectuer les opérations suivantes :

cet outil pour effectuer les opérations suivantes : Zoom avant/arrière Quel niveau de contexte pour le
cet outil pour effectuer les opérations suivantes : Zoom avant/arrière Quel niveau de contexte pour le

Zoom avant/arrière

Quel niveau de contexte pour le vérificateur dynamique ?

• Un mot

• Trois mots (le mot actuel + le mot précédent et le mot suivant)

• Ligne d'image complète

Pour activer le vérificateur, cliquez sur l'outil Vérificateur ou appuyez sur F9. Pour le désactiver, cliquez à nouveau sur l'outil Vérificateur ou appuyez une nouvelle fois sur F9. Vous pouvez également appuyer sur la touche Échap. Pour obtenir la liste complète des raccourcis clavier disponibles avec le vérificateur, consultez l'aide en ligne.

Table de caractères

Table de caractères La table de caractères est une barre d'outil s « ancrable » très

La table de caractères est une barre d'outils « ancrable » très utile lors de la vérification. Elle sert principalement à :

insérer, lors de la vérification et de l'édition de texte, des caractères qui sont absents ou difficilement accessibles sur le clavier. La table de caractères s'apparente à cet égard à la table de caractères système ;

afficher tous les caractères validés dans les langues de reconnaissance actuellement sélectionnées. Pour ouvrir la table de caractères, cliquez sur le bouton correspondant dans la barre d'outils Formatage ou sélectionnez Table de caractères dans le menu Affichage, puis cliquez sur Afficher. Dans le sous-menu Table de caractères, vous pouvez également choisir ne n'afficher que les caractères récents, ou différents jeux de caractères (par défaut, seuls deux sont affichés). Les caractères asiatiques ne sont pas pris en charge. Vous pouvez également ouvrir la table de caractères en procédant comme suit :

Sélectionnez Outils > Options, puis cliquez sur l'onglet OCR. Cliquez sur le bouton Caractères supplémentaires pour sélectionner les caractères à inclure lors de la vérification. Vous pouvez également modifier le caractère de rejet via la table de caractères.

Sélectionnez Nouveau caractère dans le menu Outils. Cliquez sur le bouton ( situé en regard du champ Corriger.

Dans l'Éditeur de texte, sélectionnez Nouveau caractère dans le menu contextuel d'un mot douteux ou absent des dictionnaires.

),

Dictionnaires utilisateur

OmniPage est livré avec des dictionnaires en plusieurs langues qui facilitent la reconnaissance et peuvent proposer des suggestions pendant la vérification de l'OCR. Ces dictionnaires intégrés peuvent être remplacés par des dictionnaires créés par l'utilisateur. Vous pouvez enregistrer plusieurs dictionnaires utilisateur, mais ne pouvez charger qu'un seul dictionnaire à la fois. Le dictionnaire Personnalisé est le dictionnaire utilisateur par défaut de Microsoft Word.

Lancement d'un dictionnaire utilisateur Cliquez sur le bouton Ajouter de la boîte de dialogue Vérification de l'OCR (aucun dictionnaire utilisateur n'étant chargé), ou ouvrez la boîte de dialogue Fichiers de dictionnaire utilisateur à partir du menu Outils et cliquez sur Nouveau. Chargement ou déchargement d'un dictionnaire utilisateur Réalisez ces opérations depuis l'onglet OCR de la boîte de dialogue Options ou à partir de la boîte de dialogue Fichiers de dictionnaire utilisateur. Édition ou suppression d'un dictionnaire utilisateur Pour ajouter des mots à un dictionnaire utilisateur, chargez votre dictionnaire puis cliquez sur le bouton Ajouter dans la boîte de dialogue Vérification de l'OCR. Vous pouvez ajouter et supprimer des mots en cliquant sur Édition dans la boîte de dialogue Fichiers de dictionnaire utilisateur. Vous pouvez également importer des mots à partir des dictionnaires utilisateur OmniPage (*.ud). Lors de l'édition d'un dictionnaire utilisateur, vous pouvez optimiser l'opération d'ajout de nouveaux mots en important la liste des mots requis à partir d'un fichier texte standard. Chaque mot doit être placé sur une ligne séparée et il ne doit être ni précédé ni suivi d'aucun signe de ponctuation. Le bouton Supprimer vous permet de supprimer le dictionnaire utilisateur sélectionné de la liste. Pour incorporer un dictionnaire utilisateur à un document OmniPage : chargez votre document, sélectionnez Outils > Dictionnaire utilisateur, sélectionnez le dictionnaire utilisateur que vous souhaitez incorporer à votre document, cliquez sur Incorporer, donnez un nom à votre dictionnaire, puis cliquez sur OK. Pour terminer, enregistrez votre fichier au format Document OmniPage.

Langues

OmniPage peut reconnaître plus de 120 langues dans de nombreux alphabets : latin, grec, cyrillique, chinois, japonais et coréen. La liste complète des langues prises en charge est disponible dans l'onglet OCR de la boîte de dialogue Options. Cette liste distingue les langues disposant d'un dictionnaire. Sélectionnez la ou les langues des documents à reconnaître. La sélection d'un très grand nombre de langues réduira la précision de l'OCR.

Vous trouverez également la liste de ces langues sur le site Web de Nuance.

L'option Choix auto. d'une langue unique évite d'avoir à définir manuellement les langues. Elle est conçue pour l'exécution de traitements autonomes impliquant des documents ou des formulaires rédigés dans des langues différentes. Lorsque cette option est sélectionnée,

OmniPage analyse chaque page entrante et lui affecte une langue de reconnaissance unique. Par conséquent, cette fonction n'est pas pas appropriée pour des pages contenant des textes rédigés en plusieurs langues. Le programme choisit parmi les langues associées à un dictionnaire et basées sur l'alphabet latin (ce qui exclut donc le russe et le grec) et, en option, les langues asiatiques. Choisissez parmi trois groupes de langues :

Langues basées sur l'alphabet latin (choisissez ce groupe pour visualiser les langues disponibles)

Langues asiatiques (japonais, coréen, chinois traditionnel et chinois simplifié)

Alphabet latin et Langues asiatiques. Lorsque cette fonction est activée, aucune sélection manuelle de langue n'est possible, et l'option Vérifier les choix de langues (voir plus bas) est indisponible.

En plus des dictionnaires utilisateur, le programme propose, pour certaines langues, des dictionnaires spécialisés (dans l'immédiat, domaines médical et juridique). Reportez-vous à la liste et effectuez les sélections voulues dans l'onglet OCR de la boîte de dialogue Options.

Reconnaissance des langues asiatiques