Vous êtes sur la page 1sur 108

AVISOS

LEGALES

Copyright 2002 ScanSoft, Inc. Reservados todos los derechos. El software descrito en esta publicacin se otorga bajo licencia y slo se puede usar o copiar segn los trminos establecidos en dicha licencia. AV I S O
IMPORTANTE

ScanSoft, Inc. proporciona esta publicacin "tal cual" sin garantas de ninguna ndole, ya sean expresas o implcitas, incluyendo, pero sin limitacin alguna, las garantas implcitas de comerciabilidad o idoneidad para fines particulares. Algunos estados o jurisdicciones no permiten la renuncia a garantas expresas o implcitas en ciertas transacciones, por lo tanto, esta afirmacin puede no aplicarse a su caso particular. ScanSoft se reserva el derecho de actualizar esta publicacin y de hacer cambios de vez en cuando en el contenido actual sin verse obligada a notificar a ninguna persona de dichas actualizaciones o cambios. MARCAS
COMERCIALES Y CRDITOS

ScanSoft, OmniPage, OmniPage SE, OmniPage Pro, PaperPort, Pagis, True Page y Direct OCR son marcas registradas o comerciales de ScanSoft, Inc., en los Estados Unidos y otros pases. Todos los dems nombres de empresas o productos aqu mencionados pueden ser marcas comerciales de sus respectivos titulares.

ScanSoft, Inc.
9 Centennial Drive Peabody, MA 01960 E.U.

ScanSoft Blgica BVBA


Guldensporenpark 32 BE-9820 Merelbeke Blgica

Ref. N 58-281201-04A

O N T E N I D O

BIENVENIDO
Uso de esta gua Obtener ayuda en lnea Ayuda en lnea HTML Ayuda contextual Notas tcnicas Glosario OmniPage SE

7
8 9 9 9 10 10 10

INSTALACIN Y CONFIGURACIN
Requisitos del sistema Instalacin de OmniPage SE Configuracin del escner con OmniPage SE Cmo iniciar el programa Registro del software Nuevas caractersticas de OmniPage Pro 12 OmniPage SE y OmniPage Pro 12

11
12 13 14 16 17 17 19

INTRODUCCIN
Qu es el reconocimiento ptico de caracteres? Funciones de OCR de OmniPage SE Documentos en OmniPage SE Pasos bsicos de procesamiento El escritorio de OmniPage Barra de mens

21
22 22 23 23 24 25

Gua del usuario de OmniPage SE

iii

Las barras de herramientas El Panel de imgenes El Editor de texto Caja de herramientas de OmniPage Administracin de documentos Miniaturas Administrador de documentos Personalizar columnas del Administrador de documentos Eliminar pginas de un documento Imprimir un documento Cerrar un documento Documentos de OmniPage Cmo guardar un archivo en formato OPD Parmetros

25 26 26 27 28 28 29 30 30 31 31 31 32 33

Por qu guardar el documento como tipo OPD 32

PROCESAMIENTO DE DOCUMENTOS
Gua de inicio rpido Carga y reconocimiento de archivos de imgenes de ejemplo Exploracin y reconocimiento de una sola pgina Generalidades del procesamiento Procesamiento automtico Procesamiento manual Procesamiento combinado Procesamiento con el Asistente de OCR Procesamiento a partir de otras aplicaciones Cmo configurar Direct OCR

35
36 36 36 38 40 42 43 45 46 47

Detener y reiniciar el procesamiento automtico41

iv

Contenido

Cmo usar Direct OCR Cmo usar OmniPage SE con PaperPort Procesamiento con Programar OCR Definicin del origen de imgenes de las pginas Entrada desde archivos de imagen Entrada desde escner Exploracin con un alimentador automtico de documentos Exploracin sin un alimentador automtico de documentos Descripcin del diseo del documento Zonas y fondos Separacin automtica de zonas Separacin manual de zonas Tipos y propiedades de zonas Trabajo con zonas Cuadrculas de tablas en la imagen Uso de plantillas de zonas

47 48 49 50 50 51 53 53 54 55 56 56 58 59 62 64

VERIFICACIN Y EDICIN
Pantalla y vistas del editor Verificacin de los resultados de OCR Verificar texto Diccionarios del usuario Capacitacin Capacitacin manual IntelliTrain Archivos de capacitacin Edicin de texto e imgenes Edicin inmediata Lectura de texto en voz alta

67
68 69 70 72 73 74 74 75 77 79 80

Gua del usuario de OmniPage SE

GUARDAR Y EXPORTAR
Guardar imgenes originales Guardar los resultados del reconocimiento Guardar un documento mientras trabaja Seleccionar un nivel de archivo Seleccionar opciones avanzadas de guardar Guardar en PDF Copiar pginas al Portapapeles Enviar pginas por correo

83
84 85 86 87 88 90 90 91

INFORMACIN TCNICA
Resolucin de problemas Soluciones iniciales Probar OmniPage SE Aumentar los recursos de memoria Aumentar el espacio de disco El texto no se reconoce correctamente Problemas con el reconocimiento de fax Problemas de sistema o rendimiento durante el OCR Compatibilidad con ODMA Caractersticas avanzadas en Programar OCR Tipos de archivo compatibles Tipos de archivos para abrir y guardar imgenes

93
94 94 95 96 97 97 98 99 99 100 101 101

Tipos de archivos para guardar los resultados del reconocimiento 102 Desinstalacin del software 103

vi

Contenido

Bienvenido
Bienvenido a OmniPage SE y gracias por preferir nuestro software. La siguiente documentacin se proporciona a modo de ayuda para comenzar y como resumen del programa. Esta Gua del usuario Esta gua es una introduccin al uso de OmniPage SE (Special Edition). Incluye las instrucciones de instalacin y configuracin, una descripcin de los comandos y reas de trabajo del programa, instrucciones especficas de tareas, mtodos para personalizar y controlar el procesamiento e informacin tcnica. La gua viene en formato PDF, lo que le permite utilizar saltos de hipervnculos en referencias cruzadas y otras herramientas de navegacin en su visor de PDF. Ayuda en lnea La ayuda en lnea de OmniPage SE contiene informacin acerca de las caractersticas, parmetros y procedimientos. La ayuda en lnea viene en formato HTML, y ha sido diseada para acceder a la informacin de manera rpida y sencilla. La completa ayuda contextual brinda la asistencia suficiente para permitirle seguir trabajando sin perder tiempo. Consulte Obtener ayuda en lnea en la pgina 9. Archivo Lame El archivo Lame contiene la informacin ms reciente acerca del software. Lalo antes de usar OmniPage SE. Para abrir este archivo HTML, seleccinelo en el Instalador de OmniPage SE o, bien, ms adelante en el men Ayuda. Exploracin y otra informacin En el sitio web www.scansoft.com de ScanSoft encontrar la informacin ms reciente acerca del programa. La Gua de escneres contiene la informacin ms actualizada acerca de los escneres compatibles y temas relacionados; ScanSoft prueba los 25 modelos de escner de uso ms frecuente. Tambin es posible acceder al sitio web de ScanSoft desde el Instalador de OmniPage SE o, bien, ms adelante en el men Ayuda.

Gua del usuario de OmniPage SE

Uso de esta gua


Esta gua est escrita dando por sentado que usted sabe cmo trabajar en el entorno de Microsoft Windows. Consulte la documentacin de Windows si tiene dudas acerca de cmo usar los cuadros de dilogo, comandos de men, barras de desplazamiento, funciones de arrastrar y colocar, mens rpidos, etc. Tambin suponemos que est familiarizado con su escner y el software del mismo, y que dicho equipo est instalado y funcionando correctamente antes de configurarlo con OmniPage SE. Consulte la documentacin respectiva del escner segn sea necesario. En esta gua se utilizan las siguientes convenciones: Negrita Cursiva Introduce nuevos trminos y presenta subapartados. Nombra temas en el sistema de Ayuda en lnea. Presenta texto ms detallado sobre las opciones de los cuadros de dilogo. Sirve para presentar nombres de archivos: sample.tif Una nota presenta un elemento de informacin adicional. Un consejo presenta ideas para usar caractersticas del programa a fin de efectuar tareas especficas. El icono SE seala en el documento las diferencias entre la versin Special Edition de OmniPage y OmniPage Pro 12. (Consulte OmniPage SE en la pgina 10.)

Non-serif

Bienvenido

Obtener ayuda en lnea


Adems de usar esta gua, puede utilizar la ayuda en lnea de OmniPage SE para informarse sobre nuevas caractersticas, parmetros y procedimientos. La ayuda en lnea est disponible tras instalar OmniPage SE.

Ayuda en lnea HTML


Abra la ayuda en lnea de OmniPage SE en el nivel superior escogiendo Temas de ayuda del men Ayuda. Esto permite ver los temas dispuestos en una Tabla de contenido, buscar en una lista alfabtica de palabras clave o hacer bsquedas de texto completo en los temas. Otros elementos del men Ayuda permiten acceder a temas o pginas web relevantes. Pulse F1 mientras trabaja con el programa para ver un tema de la ayuda en lnea que guarde relacin con el rea de la pantalla, cuadro de dilogo o mensaje de advertencia actual.

Ayuda contextual
Es posible ver una ventana emergente con informacin concisa y puntual sobre un elemento de men, botn de la barra de herramientas, rea de la pantalla o cuadro de dilogo particulares de OmniPage SE, de las siguientes maneras: Haga clic en la herramienta de Ayuda en la barra de herramientas Estndar para invocar el icono de ayuda. Haga clic en cualquier elemento del escritorio fuera del cuadro de dilogo o mensaje de advertencia. Pulse Mays + F1 para invocar el mismo icono de ayuda. Utilice Mays + F1 para obtener la ayuda contextual de los elementos de men rpido. Haga clic en el signo de interrogacin situado en la esquina superior derecha de un cuadro de dilogo y luego haga clic en un elemento de dicho cuadro de dilogo para ver una ventana emergente. Algunos cuadros de dilogo o mensajes de advertencia tienen su propio botn o texto de ayuda. Haga clic en el botn o texto para obtener informacin acerca del cuadro de dilogo o de mensaje. Haga clic en cualquier lugar para que desaparezca la ventana emergente de ayuda contextual.

Gua del usuario de OmniPage SE

Notas tcnicas
En el sitio web www.scansoft.com de ScanSoft encontrar notas tcnicas sobre temas comnmente mencionados al usar OmniPage. Las pginas web tambin pueden ofrecer asistencia acerca del proceso de instalacin y resolucin de problemas.

Glosario
Esta gua no contiene un glosario. La ayuda en lnea tiene un completo glosario, con su propio ndice alfabtico y una tabla de contenido. Consltelo si desea averiguar el significado de algn trmino utilizado en esta gua o en el programa.

OmniPage SE
Esta es la versin Special Edition del mundialmente conocido programa OmniPage Pro. Esta versin, desarrollada para ser distribuida con fabricantes de escneres seleccionados, cuenta con un conjunto reducido de las funciones incluidas en el producto OmniPage Pro 12. Esta Gua as como la Ayuda en lnea describen las funciones del producto completo, y un icono SE seala en el documento las diferencias entre las dos versiones.

Si le resultan ventajosas las funciones adicionales de la versin profesional, utilice las facilidades en lnea para actualizar su versin Special Edition 2.0 a OmniPage Pro 12. Consulte OmniPage SE y OmniPage Pro 12 en la pgina 19.

10

Bienvenido

Captulo 1

Instalacin y configuracin
Este captulo contiene informacin acerca de la instalacin e inicio de OmniPage SE. Se presentan los siguientes temas:
x x x x x x x

Requisitos del sistema Instalacin de OmniPage SE Configuracin del escner con OmniPage SE Cmo iniciar el programa Registro del software Nuevas caractersticas de OmniPage Pro 12 OmniPage SE y OmniPage Pro 12

Gua del usuario de OmniPage SE

11

Requisitos del sistema


Se necesitan los siguientes requisitos mnimos de sistema para instalar y ejecutar OmniPage SE 2.0:
x x

Un ordenador con procesador Pentium o superior Microsoft Windows 98 (segunda edicin o superior), Windows Me, Windows NT 4.0 (por lo menos con Service Pack 6), Windows 2000 o Windows XP 64 MB de memoria (RAM), se recomiendan 128 MB 90 MB de espacio libre en el disco duro para los archivos de la aplicacin, ms 5 MB de espacio de trabajo durante la instalacin 5 MB para Microsoft Installer (MSI) si no estuviera instalado (MSI est presente como parte del sistema operativo en Windows Me, Windows 2000 y Windows XP) Monitor SVGA con 256 colores, pero de preferencia a color de 16 bits (se describe como color de alta densidad en Windows 2000 y como color mediano en XP) y una resolucin de 800 x 600 pxeles Dispositivo sealador compatible con Windows Unidad de CD-ROM para la instalacin Un escner compatible, el cual debe contar con su propio software controlador si usted tiene pensado explorar documentos. En la gua de escneres en el sitio web de ScanSoft (www.scansoft.com) encontrar una lista de todos los escneres compatibles.
El rendimiento y velocidad aumentarn si el procesador, memoria y espacio disponibles en su equipo son superiores a los requisitos mnimos.

x x x

x x x

12

Instalacin y configuracin

Captulo 1

Instalacin de OmniPage SE
El programa de instalacin de OmniPage SE le guiar a travs de la instalacin mediante instrucciones en cada pantalla. Antes de instalar OmniPage SE:
x x x

Cierre todas las dems aplicaciones, especialmente programas antivirus. Regstrese en su equipo con privilegios de administrador si ha de instalar el programa en Windows NT, 2000 o XP.

Si su sistema ya tiene instalada una versin anterior de un programa OCR de ScanSoft, el instalador le solicitar la autorizacin para desinstalar dicho producto primero.

w Para instalar OmniPage SE:

1. Introduzca el CD-ROM de OmniPage SE en la unidad de CD-ROM. El programa de instalacin debiera iniciarse automticamente. De no ser as, busque la unidad de CD-ROM en el Explorador de Windows y haga doble clic en el programa Autorun.exe que aparece en el nivel superior del CDROM. 2. Elija el idioma a usar durante la instalacin. Este idioma se utilizar para el sistema texto a lenguaje y como el idioma de la interfaz del programa. El idioma de la interfaz del programa se utiliza para presentar los elementos de men, cuadros de dilogo, mensajes de advertencia, etc. Es posible cambiar el idioma de la interfaz posteriormente en OmniPage SE, pero su eleccin al momento de la instalacin determina qu sistema de texto a lenguaje se instalar en el programa. Consulte la segunda nota que aparece a continuacin. Las referencias a la funcin de lectura en voz alta no se aplican a OmniPage SE. 3. Siga las instrucciones en cada pantalla para instalar el software. Todos los archivos necesarios para la exploracin se copian automticamente durante la instalacin.
En algunas ocasiones la solucin puede consistir en desinstalar y luego volver a instalar OmniPage SE. Consulte Desinstalacin del software en la pgina 103. En OmniPage Pro 12, la funcin de lectura en voz alta est disponible para alemn, espaol, francs, ingls (britnico y estadounidense), italiano o portugus. No est disponible en OmniPage SE. Consulte Lectura de texto en voz alta en la pgina 80.

Instalacin de OmniPage SE

13

Configuracin del escner con OmniPage SE


Todos los archivos necesarios para la configuracin y respaldo del escner se copian automticamente durante la instalacin del programa. Antes de usar OmniPage SE para la exploracin, el escner debe estar instalado con su propio software controlador y se debe haber verificado su correcto funcionamiento. El software controlador del escner no viene incluido con OmniPage SE. La instalacin y configuracin del escner se efectan mediante el Asistente del escner. Lo puede iniciar por su cuenta, tal como se describe a continuacin. De otro modo, el Asistente del escner aparece al tratar de efectuar la primera exploracin. Siga estos pasos a fin de utilizar el Asistente del escner para configurar su equipo con OmniPage SE:
x

Elija InicioProgramasScanSoft OmniPage SE 2.0  Asistente del escner, o, bien, haga clic en el botn de configuracin en el panel Escner del cuadro de dilogo Opciones. O, en ltimo caso, elija un parmetro de exploracin en la lista desplegable Obtener pgina en la Caja de herramientas de OmniPage y haga clic en el botn Obtener pgina.

Se iniciar el Asistente de configuracin del escner. El primer panel aparece slo en la primera configuracin cuando se le invoca desde OmniPage SE. x Escoja Seleccionar escner o cmara digital y, luego, haga clic en Siguiente. Se mostrar una lista de todos los controladores de escner TWAIN detectados, y aparecer seleccionado el escner predeterminado del sistema. x Haga clic una vez para seleccionar el controlador del escner que desea utilizar. Haga clic en Otros controladores... si necesita explorar en busca de un controlador. Seleccione Configurar parmetros avanzados para que aparezca un panel adicional si desea que la propia interfaz de su escner quede oculta durante la exploracin o si desea modificar el mtodo de transferencia de imgenes. Haga clic en Siguiente. x Seleccione S para probar la configuracin de su escner y luego haga clic en Siguiente. El asistente probar la conexin desde el ordenador al escner. Una vez que haya finalizado, haga clic en Siguiente.

14

Instalacin y configuracin

Captulo 1

x x x x x x

x x x x

Inserte una pgina de prueba en el escner. El asistente est preparado para efectuar una exploracin bsica usando el software del fabricante del escner. Haga clic en Siguiente. Aparecer la interfaz del usuario propia del escner. Haga clic en el botn u opcin para explorar a fin de comenzar una exploracin de muestra. Si fuese necesario, haga clic en Imagen invertida o en Imagen faltante y haga las selecciones correspondientes. Una vez que la imagen aparezca correctamente en la ventana, haga clic en Siguiente. Seleccione el elemento que describa ms adecuadamente su escner y luego haga clic en Siguiente. Haga clic en Siguiente para seguir con el tamao de pgina. En la ventana aparecen los tamaos de pgina que el Asistente del escner considera compatibles con su escner. Para efectuar cambios en los tamaos de pgina, haga clic en Avanzadas, efecte los cambios y luego haga clic en Siguiente. Inserte una pgina con texto pero sin imgenes en su escner. Haga clic en Siguiente para comenzar a explorar en el modo blanco y negro. Si fuese necesario, haga clic en Imagen invertida o en Imagen faltante y haga las selecciones correspondientes. Una vez que la imagen aparezca correctamente en la ventana, haga clic en Siguiente. Si tiene un escner a color, inserte en l una fotografa en colores o una pgina con una imagen en colores. Haga clic en Siguiente para comenzar a explorar en el modo en colores. Si fuese necesario, haga clic en Imagen invertida o en Imagen faltante y haga las selecciones correspondientes. Una vez que la imagen aparezca correctamente en la ventana, haga clic en Siguiente. Si el escner no puede explorar en colores, omita este paso. Inserte en el escner una fotografa o pgina que contenga una imagen. Haga clic en Siguiente para comenzar una exploracin en escala de grises. Si fuese necesario, haga clic en Imagen invertida o en Imagen faltante y haga las selecciones correspondientes. Una vez que la imagen aparezca correctamente en la ventana, haga clic en Siguiente. Ha configurado satisfactoriamente su escner para que funcione con OmniPage SE. Haga clic en Terminar.

Para cambiar la configuracin del escner en otro momento o para configurar otro escner, vuelva a abrir el Asistente de configuracin del escner en el men Inicio de Windows o en el panel Escner del cuadro de dilogo Opciones. Para probar y reparar un escner que funcione inadecuadamente, abra el Asistente de configuracin del escner en el men Inicio y seleccione Probar escner o

Configuracin del escner con OmniPage SE

15

cmara digital en el primer panel y, luego, efecte el procedimiento que se describi anteriormente.

Cmo iniciar el programa


Para iniciar OmniPage SE, lleve a cabo uno de los siguientes procedimientos: x Haga clic en Inicio en la barra de tareas de Windows y seleccione ProgramasScanSoft OmniPage SE 2.0OmniPage SE 2.0.
x x

Haga doble clic en el icono OmniPage SE en la carpeta de instalacin del programa o en el escritorio de Windows si lo coloc ah. Haga doble clic en el icono o nombre de archivo de un documento de OmniPage (OPD); el documento se carga en el programa. Consulte Documentos de OmniPage en la pgina 31.

Al abrirlo, aparece la pantalla de ttulo de OmniPage SE y luego su escritorio. Consulte El escritorio de OmniPage en la pgina 24. Ah encontrar una introduccin a las principales reas de trabajo del programa. Hay muchos modos de ejecutar el programa con una interfaz limitada:
x

Utilice el programa Programar OCR. Haga clic en Inicio en la barra de tareas de Windows y elija ProgramasScanSoft OmniPage Pro 12.0 Programar OCR. Consulte Procesamiento con Programar OCR en la pgina 49. Esta caracterstica no est disponible en OmniPage SE. Haga clic en Obtener texto en el men Archivo de una aplicacin registrada con la funcin Direct OCR. Consulte Cmo configurar Direct OCR en la pgina 47. Haga clic con el botn derecho del ratn en el nombre o icono de un archivo de imagen para obtener un men rpido. Seleccione un elemento de submen de Convertir a... a fin de definir un destino. Utilice OmniPage SE con otros productos de administracin de documentos de ScanSoft tales como PaperPort o Pagis a fin de agregar servicios de OCR. Consulte Cmo usar OmniPage SE con PaperPort en la pgina 48.

16

Instalacin y configuracin

Captulo 1

Registro del software


El Asistente para el registro de ScanSoft se ejecuta al final de la instalacin. Se proporciona un sencillo formulario electrnico que se puede completar en menos de cinco minutos. Una vez lleno el formulario, y tras enviarlo, el programa buscar una conexin a Internet para efectuar inmediatamente el registro en lnea. Si no registra el software durante la instalacin, se le solicitar peridicamente que lo haga ms adelante. Tambin puede registrarse en lnea en nuestro sitio www.scansoft.com en Internet. Haga clic en Support y en la pantalla principal de apoyo tcnico elija la opcin para registrarse, situada en la columna izquierda. Para conocer la declaracin sobre el uso de los datos de registro, revise la poltica de confidencialidad de ScanSoft.

Nuevas caractersticas de OmniPage Pro 12


La familia de productos OmniPage ha sido ampliada con OmniPage Pro 12 y OmniPage SE. Esta seccin enumera las mejoras introducidas en el producto profesional OmniPage Pro 12. Algunas se encuentran tambin en OmniPage SE, tal y como describe la siguiente seccin. Nuevas caractersticas de OmniPage Pro 12 comparadas con OmniPage Pro 11 son:
x

Notable aumento en la exactitud La mayor sinergia entre los motores de reconocimiento, el respaldo de diccionarios profesionales y la capacidad para entrenar el programa a reconocer los caracteres escogidos por el usuario mejoran considerablemente la exactitud. Interfaz agilizada Los procesamientos automtico y manual ahora se efectan directamente desde la Caja de herramientas de OmniPage sin barras de herramientas independientes. Consulte la pgina 27. Las miniaturas ahora se ven en el Panel de imgenes; escoja ver la pgina actual, miniaturas o ambas. Consulte la pgina 28. La anterior vista de detalles se transforma en el Administrador de documentos e incluye una columna de notas para comentarios y para buscar palabras clave. Nuevos conceptos de separacin de zonas La asignacin inmediata de zonas permite procesar cambios de zonas inmediatamente sin tener que volver a reconocer toda la pgina. Consulte la pgina 79. Los fondos de pginas se definen como de procesar (zonas automticas) o de ignorar, de modo que todas las

Registro del software

17

instrucciones de asignacin de zonas aparecen en la pgina y se pueden guardar como plantillas de zonas. Consulte la pgina 55. Se pueden dibujar zonas irregulares y las zonas se pueden dividir y unir de manera ms sencilla, sin necesidad de usar herramientas especiales. Consulte la pgina 59.
x

Revisin y verificacin mejoradas El cuadro de dilogo Verificacin muestra ahora los caracteres dudosos en un contexto ms amplio. Un verificador dinmico puede mantenerse activo mientras se revisa el texto, con la imagen y la ventana siguiendo la posicin de edicin. Consulte la pgina 69. Niveles de formato para ver y guardar Hay tres niveles de formato para la visualizacin del Editor de texto. Consulte la pgina 68. El nivel de formato de salida se escoge ahora al momento de exportar; las alternativas dependen del tipo de archivo especificado. La alternativa de exportacin Flujo de pginas es una versin mejorada de la antigua vista Mantener flujo de columnas. Mantiene el diseo de pgina sin cuadros ni marcos cada vez que es posible, de modo que el texto fluya entre las columnas. Consulte la pgina 87. Anlisis superior de pginas La transferencia del formato de tabla se ha perfeccionado, en particular la deteccin de tablas sin cuadrculas en las pginas originales. Las direcciones de Internet y de correo electrnico se pueden detectar y transferir al Editor de texto, y se pueden insertar hipervnculos. El orden de lectura ahora se puede ver y cambiar tras efectuar el reconocimiento en la vista True Page del Editor de texto. Consulte la pgina 77. Mejor manipulacin de archivos PDF OmniPage Pro 12 busca el texto de fondo en los archivos PDF que abre, para lograr una ptima exactitud en el reconocimiento. Un nuevo tipo de archivo PDF editado permite una buena retencin de formato en las pginas que se modificaron en el Editor de texto tras efectuarse el reconocimiento. Opciones avanzadas de guardar Se ofrece un mayor margen de opciones de guardar para cada tipo de archivo de salida. Se pueden crear tipos de archivos de salida definidos por el usuario con configuracin personalizada. Consulte la pgina 88. Si su edicin de OmniPage Pro 12 incluye los nuevos formatos de guardado XML y eBook, consulte la pgina 102.

18

Instalacin y configuracin

Captulo 1

OMNIPAGE SE Y OMNIPAGE PRO 12


El listado siguiente enumera caractersticas que no han sido incluidas en OmniPage SE. Puede disponer de ellas cuando actualiza a la versin OmniPage Pro 12: x Mejora significativa de la precisin en el reconocimiento. x Acceso a la capacitacin, IntelliTrain y archivos de capacitacin para reconocimiento de caracteres. x Posibilidad de abrir y leer el contenido de archivos PDF. x Posibilidad de guardar documentos reconocidos a formato PDF. x Programe el OCR para procesar automticamente los trabajos de OCR a ciertas horas definidas. x Funcin de exploracin simultnea de dos pginas para explorar libros con mayor facilidad. x Nivel de formato de salida de flujo de pginas para mantener mejor el diseo de la pgina. x Reconocimiento de archivos de imagen en formato TIFF LZW y GIF en la entrada y en la salida. x Exportacin a formatos eBook y XML. x Compatibilidad con el formato HTML 4.0 para salida WYSIWYG. x El nmero de idiomas reconocidos asciende de unos 50 a un centenar. x Acceso a diccionarios profesionales legales y mdicos, en ciertos idiomas. x Acceso a software de lectura en voz alta RealSpeak, que permite leer en voz alta los textos reconocidos. Para obtener ms informacin o actualizar su versin, visite la direccin www.scansoft.com.

OmniPage SE y OmniPage Pro 12

19

20

Instalacin y configuracin

Captulo 2

Introduccin
Probablemente usted utiliza su ordenador para procesar correspondencia comercial, elaborar informes, manipular datos y llevar a cabo un nmero cada vez mayor de tareas. El desafo es que, a pesar de la revolucin digital, ciertas fuentes de informacin an circulan en papel o formato impreso, por lo que no se pueden procesar inmediatamente en un ordenador. Por ejemplo, si desea incorporar informacin acerca del artculo de una revista en un informe que est preparando, de algn modo tiene que incorporar el texto del artculo en su equipo. Ciertamente, la engorrosa redigitacin del artculo no es la solucin ms atractiva. Este captulo le presenta la solucin ideal: reconocimiento ptico de caracteres (OCR). Describe la forma en que OmniPage SE utiliza la tecnologa OCR para transformar texto de pginas exploradas o archivos de imgenes en texto que podr editar con sus aplicaciones informticas favoritas. Se presentan los siguientes temas:
x

Qu es el reconocimiento ptico de caracteres? Documentos en OmniPage SE Pasos bsicos de procesamiento

x x x x

El escritorio de OmniPage Administracin de documentos Documentos de OmniPage Parmetros

Gua del usuario de OmniPage SE

21

Qu es el reconocimiento ptico de caracteres?


El reconocimiento ptico de caracteres es el proceso de extraccin de texto de una imagen. Esta imagen puede obtenerse a partir de la exploracin de un documento en papel o de la apertura del archivo electrnico de una imagen. Las imgenes no tienen caracteres editables de texto, sino muchos puntos diminutos (pxeles) que en conjunto producen formas de caracteres. stos presentan una imagen del texto en una pgina. Durante el OCR, OmniPage SE analiza las formas de los caracteres presentes en una imagen y define las soluciones para producir texto editable. Tras el OCR, se puede guardar el texto resultante en una gran variedad de aplicaciones de procesamiento de texto, autoedicin u hojas de clculo.

Funciones de OCR de OmniPage SE


Adems del reconocimiento de texto, OmniPage SE puede mantener los siguientes elementos en un documento mediante el procedimiento de OCR. Grficos Ejemplos de grficos son las fotografas, logotipos y diagramas. Formato de texto Tipos, tamaos y estilos de fuente (tales como negrita, cursiva y subrayado) son ejemplos de formato de caracteres. Sangras, tabuladores, mrgenes y espaciado entre lneas son ejemplos de formato de prrafo. Formato de pgina Estructura de columnas, formatos de tablas y colocacin de grficos y encabezados son ejemplos de formato de pgina. Los elementos de formato de grficos, texto y pgina que mantiene OmniPage SE se determinan segn los parmetros que seleccione el usuario. En la seccin de Pautas de parmetros de la Ayuda en lnea encontrar ms informacin acerca de la seleccin de parmetros.
OmniPage SE slo reconoce caracteres generados por mquina tales como impresoras offset o lser, o texto digitado en una mquina de escribir. Sin embargo, puede mantener texto manuscrito, tal como una firma, como un grfico.

22

Introduccin

Captulo 2

Documentos en OmniPage SE
OmniPage SE puede trabajar con un solo documento a la vez. Cuando obtenga la primera imagen (del escner o a partir de un archivo) se generar un nuevo documento. Las imgenes subsiguientes se irn agregando al mismo documento, hasta que lo guarde y lo cierre. Un documento en OmniPage SE consta de una imagen por cada pgina del documento. Tras efectuar el OCR, el documento tambin contendr el texto reconocido, visualizado en el Editor de texto, posiblemente junto con los grficos y tablas. Consulte El escritorio de OmniPage en la pgina 24.

Pasos bsicos de procesamiento


Hay dos formas principales de manipular los documentos: con procesamiento automtico o procesamiento manual. Consulte las secciones Procesamiento automtico en la pgina 40 y Procesamiento manual en la pgina 42. Los pasos bsicos para ambos mtodos de procesamiento son muy similares: 1. Abra un conjunto de imgenes con OmniPage SE. Podr explorar un documento en papel con o sin un alimentador automtico de documentos o, bien, cargar uno o ms archivos de imgenes. Las imgenes resultantes pueden aparecer como miniaturas en el Panel de imgenes junto con la imagen de la primera pgina introducida. Las pginas del documento se resumen en el Administrador de documentos. Consulte Definicin del origen de imgenes de las pginas en la pgina 50. 2. Realice el OCR para generar texto editable. Durante el OCR, OmniPage SE crea zonas alrededor de los elementos en la pgina que se procesar y, luego, interpreta los caracteres de texto o grficos en cada zona. Tambin es posible efectuar una separacin de zonas manual o por plantilla. Despus del OCR, se puede revisar y corregir los errores en el documento utilizando el Verificador de OCR y editar el documento mediante el Editor de texto. 3. Exportar el documento a la ubicacin deseada. Al guardar el documento se le puede designar un tipo y nombre de archivo especficos, colocarlo en el Portapapeles o, bien, adjuntarlo a un mensaje de correo electrnico. Se puede guardar como documento de OmniPage (OPD), tal como se describir ms adelante. Se puede guardar el mismo documento varias veces en diferentes destinos, como diferentes tipos de archivo y con diferentes parmetros y niveles de formato. Consulte Guardar y exportar en la pgina 83.

Qu es el reconocimiento ptico de caracteres?

23

El escritorio de OmniPage
El escritorio de OmniPage tiene una barra de ttulo y una barra de mens en su parte superior, y una barra de estado en la parte inferior. Tiene tres reas de trabajo principales, separadas por divisores: el Administrador de documentos, el Panel de imgenes y el Editor de texto. Cada una de ellas tiene botones para cerrar, maximizar y restaurar en su parte superior derecha. El Panel de imgenes tiene una barra de herramientas Imagen y el Editor de texto tiene una barra de herramientas de formato.
Barra de herramientas Estndar Caja de herramientas de OmniPage Las miniaturas muestran una imagen de cada pgina en el documento. La pgina actual tiene el icono de un ojo. Esta pgina ya ha sido reconocida. Barra de herramientas Imagen Barra de herramientas de formato

Botones de navegacin de pginas Arrastre estos divisores para cambiar el tamao de las reas de trabajo. Panel de imgenes Sirve para mostrar la imagen de la pgina actual, junto con sus zonas. El Panel de imgenes puede mostrar la pgina actual, miniaturas o ambas. Los botones de la vista del Editor de texto ofrecen tres niveles de formato. Editor de texto Sirve para mostrar los resultados del reconocimiento para la pgina actual en la vista True Page.

Botones para mostrar u ocultar el Administrador de documentos, el Editor de texto y las miniaturas del Panel de imgenes y la visualizacin de la pgina actual. Esto tambin se puede hacer en el men Ver.

24

Introduccin

Captulo 2

El programa aparece con un documento de tres pginas. La pgina uno es la pgina actual, que se ha reconocido y verificado. La pgina dos se ha reconocido pero an no se ha verificado. La pgina tres se ha obtenido y separado manualmente por zonas, pero an no se ha reconocido. Los iconos situados en la parte inferior de las imgenes de miniatura muestran el estado de la pgina. Los botones de la barra de estado permiten mostrar u ocultar las reas de la pantalla principal y desplazarse a otras pginas del documento. Al hacer clic con el botn derecho del ratn en cualquier rea de la pantalla se obtiene un men rpido con los comandos ms tiles para dicha rea.

Barra de mens
Para obtener informacin concisa acerca de algn elemento de men, haga clic en el botn de ayuda contextual y luego en el elemento de men que desee. El texto emergente le explicar la funcin del elemento de men en cuestin. Haga clic en cualquier lugar para cerrar el cuadro emergente.

Las barras de herramientas


El programa tiene tres barras de herramientas principales; todas las cuales se pueden desplazar. Utilice el men Ver para mostrar, ocultar o personalizarlas. En la ayuda contextual se explica el objetivo de todas las herramientas. Hay dos barras de herramientas ms que sirven para tareas especficas.
Barra de herramientas
Estndar

Ubicacin predeterminada

Otras posiciones de acoplamiento


Cualquier borde del escritorio de OmniPage Verticalmente a la derecha de la imagen de la pgina actual

Objetivo
Efectuar funciones bsicas del programa. Consulte la pgina 31 y pgina 69. Imagen, separacin de zonas y operaciones de tablas. Consulte la pgina 55 y pgina 62. Formato de texto reconocido en el Editor de texto. Consulte la pgina 77. Controlar la ubicacin y aspecto del verificador. Consulte la pgina 70. Modificar el orden de los elementos en las pginas reconocidas. Consulte la pgina 77.

Barra horizontal bajo Men

Imagen

Verticalmente a la izquierda de la imagen de la pgina actual Horizontal en la parte superior del Editor de texto

Formato

Ninguna

Verificador

Pose el cursor sobre la ventana del verificador para ver esta barra de herramientas desplazable. Haga clic en la herramienta para cambiar el orden de lectura. Esta barra de herramientas reemplaza a la barra de herramientas de formato.

Reordenar

El escritorio de OmniPage

25

El Panel de imgenes
Cuando esto muestra la imagen de la pgina actual, queda disponible la barra de herramientas Imagen. Todas las imgenes de pginas tienen un valor de fondo: procesar o ignorar. Las zonas se pueden dibujar manualmente en imgenes de pginas o, bien, se pueden colocar automticamente tras su reconocimiento. Hay cinco tipos de zonas: Procesar, ignorar, texto, tabla y grficos. A las reas que quedan dentro de las zonas de procesar y en un fondo de procesar situado fuera de otras zonas, se les dibujan sus zonas automticamente y el tipo de zona se determina durante el procesamiento. Consulte Zonas y fondos en la pgina 55. Si la imagen de la pgina actual est oculta, aparecen las miniaturas en filas para darle el mejor uso al espacio disponible.

El Editor de texto
Esto muestra los resultados del reconocimiento en cualquiera de los tres niveles de formato: x Vista Sin formato (NF) x Vista Mantener fuentes y prrafos x True Page True Page mantiene el diseo de pgina utilizando cuadros y marcos de texto, tabla e imagen. Puede mostrar reas de varias columnas, para exhibir bloques de texto que se puedan tratar como flujo de columnas al momento de exportar. True Page tambin es un nivel de formato de exportacin, junto con Flujo de pginas, que mantiene el diseo de la pgina sin cuadros ni marcos. Consulte Pantalla y vistas del editor en la pgina 68. OmniPage SE no permite la salida de flujo de pginas.

26

Introduccin

Captulo 2

Caja de herramientas de OmniPage


Esta caja de herramientas permite controlar el procesamiento. De forma predeterminada, est situada en la parte superior del escritorio de OmniPage, justo sobre las reas de trabajo. Se puede desplazar y acoplar a la parte inferior del escritorio.
Botn Iniciar Botn Obtener pgina Botn Realizar OCR Botn Exportar resultados

Lista desplegable Obtener pginas

Lista desplegable Descripcin del diseo

Lista desplegable Exportar resultados

Se inicia el Procesamiento automtico, el cual se puede detener y reiniciar con el botn Iniciar (1-2-3). Consulte Procesamiento automtico en la pgina 40. El Procesamiento manual le permite procesar documentos pgina por pgina y paso a paso. Comience cada paso con los tres botones principales: el botn Obtener pgina (1), el botn Realizar OCR (2) y el botn Exportar resultados (3). Consulte Procesamiento manual en la pgina 42. Se puede alternar entre el procesamiento automtico y manual en cualquier momento en que el programa no est ocupado en algn tipo de procesamiento. Eso significa que se puede alternar entre ambos modos mientras est trabajando en algn documento. Es posible procesar automticamente algunas pginas y, luego, agregar ms pginas con el procesamiento manual. Tras procesar un grupo de pginas en forma automtica, se pueden revisar los resultados y volver a procesar ciertas pginas manualmente. Este procedimiento se describe en el Captulo 3. Consulte Procesamiento combinado en la pgina 43. El Asistente de OCR est diseado para los usuarios nuevos. Consulte Procesamiento con el Asistente de OCR en la pgina 45. Si tiene un documento abierto cuando inicie el Asistente de OCR, el documento se cerrar despus de que se le solicite guardarlo. Cuando haya utilizado el Asistente de OCR para procesar y guardar un documento, permanece en el programa y se puede procesar posteriormente (agregar ms pginas, volver a reconocer pginas, etc.) con el procesamiento manual o automtico.

El escritorio de OmniPage

27

Administracin de documentos
La administracin de documentos se puede efectuar con miniaturas en el Panel de imgenes o mediante el Administrador de documentos, situado junto a la parte inferior del escritorio de OmniPage. Ambas resumen las pginas del documento y estn sincronizadas: Nuestras imgenes muestran las dos vistas con el mismo documento de siete pginas. Las pginas 1 y 2 estn seleccionadas y la pgina 4 es la pgina actual; es decir, la que aparece en el Panel de imgenes. El estado de la pgina aparece de la siguiente manera:
Pgina
1 2

Estado
Obtenido Reconocido Reconocido, verificado Modificado Modificado, verificado Pendiente Guardado

Icono

La imagen de pgina se ha...


adquirido pero an no reconocido. reconocido, pero no verificado o, bien, la verificacin se interrumpi en la pgina. reconocido, y la verificacin ha llegado al final de la pgina. reconocido con al menos un cambio de edicin o formato hecho en el Editor de texto. reconocido, editado en el Editor de texto, y la verificacin ha llegado al final de la pgina. adquirido, probablemente reconocido, algunos cambios de zona se almacenaron pero an no se procesan. reconocido y guardado por lo menos una vez.

4 5 6 7

Miniaturas
stas presentan un conjunto de imgenes en miniatura numeradas, una para cada pgina del documento. Desplcese para ver las pginas segn sea necesario. La pgina actual tiene el icono de un ojo. Se pueden seleccionar varias pginas en el documento, las cuales tendrn un aspecto distintivo. Utilice miniaturas para las operaciones de la pgina, de la siguiente manera: Pasar a una pgina: Haga clic en el icono de la pgina deseada. Reordenar una pgina: Haga clic en la miniatura de la pgina que desee mover, luego arrstrela y colquela sobre el nmero de la pgina deseada. Las pginas se vuelven a numerar automticamente. Eliminar una pgina: Seleccione la miniatura de la pgina que desee suprimir y pulse la tecla Eliminar.

28

Introduccin

Captulo 2

Seleccionar varias pginas: Mantenga pulsada la tecla Mays y haga clic en dos miniaturas para seleccionar todas las pginas entre ellas (inclusive). Mantenga pulsada la tecla Ctrl cuando haga clic en las miniaturas para agregar pginas individualmente a la seleccin. Es posible mover o eliminar las pginas seleccionadas como grupo o, bien, enviarlas para su reconocimiento. Tambin puede exportar las pginas seleccionadas.
Obtenga informacin de una imagen de entrada posando el cursor sobre su miniatura (siempre y cuando estn habilitadas las Sugerencias). El texto emergente mostrar el tamao de la imagen en pxeles y en la unidad de medicin del programa. Tambin aparece la resolucin de la imagen.

Administrador de documentos
Proporciona una vista general del documento con una tabla. Cada fila representa una pgina. Las columnas presentan informacin estadstica o de estado para cada pgina y (cuando corresponde) los totales del documento. La imagen muestra columnas que ha especificado un usuario.

Coloque el cursor en el icono de estado de la pgina para ver una miniatura de la misma.

Introduzca los comentarios o palabras clave que desee buscar aqu.

La pgina actual aparece con el icono de un ojo. Puede utilizar el Administrador de documentos para las operaciones de la pgina, tal como se indica a continuacin: Pasar a una pgina: Haga clic en el extremo izquierdo de la fila de la pgina o doble clic en cualquier lugar de su fila. Reordenar una pgina: Haga clic en la fila de la pgina que desee mover y arrstrela a la ubicacin deseada. Un indicador en la izquierda muestra dnde se insertar la pgina. Las pginas se vuelven a numerar automticamente. Eliminar una pgina: Seleccione la fila de la pgina que desee suprimir y pulse la tecla Eliminar. Seleccionar varias pginas: Mantenga pulsada la tecla Mays y haga clic en dos filas de pgina para seleccionar todas las pginas entre ellas (inclusive). Mantenga pulsada la tecla Ctrl cuando haga clic en las filas para agregar pginas individualmente a la seleccin. Es posible mover o eliminar las pginas

Administracin de documentos

29

seleccionadas como grupo o, bien, enviarlas para su reconocimiento. Tambin puede exportar las pginas seleccionadas. Cuando se seleccionen varias pginas, la pgina indicada como actual no cambiar. Todas las pginas seleccionadas quedan resaltadas.

Personalizar columnas del Administrador de documentos


Es posible especificar cules columnas de informacin desea ver en el Administrador de documentos. Haga clic en Personalizar columnas... en el men Ver para invocar el siguiente cuadro de dilogo:

Este elemento se resalta. Haga clic en la casilla de verificacin de un elemento para seleccionarlo. Los tamaos de las imgenes se expresan en pxeles.

Resalte un elemento y utilice estas flechas para cambiar el orden de las columnas.

Defina el ancho de un elemento resaltado.

Defina cules columnas deben aparecer, sus anchos y el orden. En el apartado Personalizar columnas del Administrador de documentos de la ayuda en lnea se clarifica lo que se presenta en cada columna. Es posible cambiar fcilmente el ancho de las columnas en el Administrador de documentos; para ello arrastre los separadores de columna en la barra de ttulo.

Eliminar pginas de un documento


La eliminacin de pginas se debe confirmar y se puede deshacer. Suprima la pgina actual slo mediante el elemento Eliminar la pgina actual en el men Editar. Para suprimir todas las pginas seleccionadas en el Administrador de documentos o de las miniaturas, se debe pulsar la tecla Eliminar o usar el comando de men rpido Borrar.

30

Introduccin

Captulo 2

Imprimir un documento
Es posible imprimir el documento con el elemento Imprimir en el men Archivo. Elija si desea imprimir imgenes o texto (es decir, los resultados del reconocimiento tal como aparecen en el Editor de texto). Puede imprimir todas las pginas o algunas de ellas. La herramienta Imprimir en la barra de herramientas estndar permite imprimir imgenes o texto, dependiendo de si est activo el Panel de imgenes o el Editor de texto.

Cerrar un documento
Seleccione Cerrar en el men Archivo para cerrar un documento. Se le solicitar que guarde el documento si no lo ha hecho o si lo ha modificado desde la ltima vez que lo guard. Consulte la siguiente seccin sobre cmo guardarlo como documento de OmniPage (*.opd). Tambin se le solicitar guardar los datos de capacitacin que no se hayan guardado si es que seleccion Interrogar antes de guardar datos de capacitacin al cerrar un documento en el panel Verificacin del cuadro de dilogo Opciones. La frase anterior no se aplica a OmniPage SE.

Documentos de OmniPage
El documento de OmniPage es el tipo de archivo original del programa y tiene la extensin .opd. Es uno de los tipos de archivo ofrecidos al guardar un documento como archivo. Guarde el documento como archivo tipo OPD si desea trabajar con l nuevamente en OmniPage SE durante una sesin futura. Luego puede procesar pginas sin terminar, agregar ms pginas y verificar o editar resultados reconocidos. Un documento de OmniPage contiene imgenes de las pginas originales (autoalineadas y preprocesadas) con las zonas que stas contengan. Tras el reconocimiento, el documento OPD tambin contendr los resultados del reconocimiento. Los caracteres reconocidos se almacenan junto con sus datos de coordenadas e ndices de certeza. Ello conserva los vnculos entre imagen y texto, de modo que la verificacin est disponible al volver a abrir el documento OPD en sesiones futuras. Al guardar un documento de OmniPage, tambin se almacenan los parmetros actuales (y la informacin de capacitacin no guardada). Al abrir un documento de OmniPage, se aplican sus parmetros, reemplazando los existentes en el programa.Los documentos OmniPage creados en OmniPage SE no incluyen datos de capacitacin y si se abran en OmniPage SE, no se tienen en cuentalos.

Documentos de OmniPage

31

Por qu guardar el documento como tipo OPD


No es necesario guardar los documentos como archivos tipo OPD. Esto se hace normalmente por las siguientes razones:
o o

No se puede terminar de trabajar con el documento en la sesin actual. Se debe pasar el documento a otros usuarios que tengan OmniPage SE u OmniPage Pro. Por ejemplo, se puede pasar un archivo OPD a un especialista para su verificacin. En la red de una oficina, se puede contar con un escner que genere imgenes para reconocimiento y realizar la verificacin en diversas estaciones de trabajo. Se desea archivar los documentos reconocidos cuyas imgenes originales continen siendo accesibles. Los textos reconocidos permiten buscar por palabras clave y otras tcnicas de recuperacin de documentos.
Los resultados del reconocimiento se deben guardar a partir de archivos OPD antes de instalar alguna actualizacin de OmniPage. Puede que estos archivos no sean compatibles con las versiones ms recientes de los formatos de archivo OPD o posiblemente slo se conserven las imgenes al actualizar los archivos. Cuando abra un documento OPD creado con OmniPage Pro 10, slo se cargarn las imgenes. Cuando abra un documento de OPD creado en OmniPage Pro 11 o su version Special Edition, se cargarn las imgenes y las pginas reconocidas, pero no se conservarn las zonas.

Cmo guardar un archivo en formato OPD


Si desea crear un documento OPD, puede guardarlo en este formato desde un comienzo, para fines de proteccin. Utilice el botn Guardar para irlo guardando peridicamente a medida que vaya trabajando. Gurdelo nuevamente al final de la sesin. El botn Guardar permite guardar el documento con el mismo nombre y tipo de archivo que tena la ltima vez que se almacen. Se puede guardar el documento varias veces en diferentes formatos. Si lo almacen la primera vez en otro formato (por ejemplo, .doc), utilice el elemento Guardar como... en el men Archivo para guardarlo como OPD. Si un documento se guarda como OPD, y luego lo guarda con otro formato, no se volver a almacenar automticamente como OPD. Al cerrar el documento o salir del programa, se le solicitar guardar el documento como OPD. La barra de ttulo muestra el nombre de archivo del documento completo guardado ms recientemente.

32

Introduccin

Captulo 2

Parmetros
El cuadro de dilogo Opciones es la ubicacin central para los parmetros de OmniPage SE. Se puede acceder a l desde la barra de herramientas Estndar o del men Herramientas. La ayuda contextual proporciona informacin sobre cada parmetro. En general, los paneles de parmetros son los siguientes: OCR Utilice esta opcin para especificar los idiomas del reconocimiento, un diccionario del usuario o profesional, un carcter de rechazo y la coincidencia de fuentes. Haga clic en la casilla de verificacin antes del idioma para seleccionarlo o anular su seleccin. La seleccin mltiple es posible; para ello escoja slo los idiomas que aparezcan en el documento que se ha de reconocer. Los elementos superiores son los idiomas seleccionados recientemente. Escriba las iniciales de cada idioma para saltar a l. OmniPage SE no ofrece diccionarios profesionales. Escner Utilice esta opcin para definir el tamao de pgina y la orientacin de exploracin. Tambin se pueden fijar ajustes de brillo y contraste, y definir opciones para explorar documentos de varias pginas, sin importar si se cuenta con un alimentador automtico de documentos (ADF). Es posible cambiar los parmetros de configuracin del escner, instalar un nuevo escner o, bien, cambiar el escner predeterminado. Consulte Entrada desde escner en la pgina 51. Este panel no est disponible si usted solicit ver la interfaz TWAIN original de su escner cuando configur dicho aparato. Consulte Configuracin del escner con OmniPage SE en la pgina 14. Direct OCR Esta caracterstica proporciona servicios de OCR directamente desde su procesador de texto favorito u otra aplicacin similar. Utilice este panel para registrar y eliminar el registro de las aplicaciones para Direct OCR, as como para habilitar o inhabilitar este servicio. Tambin se puede especificar la separacin de zonas automtica o manual y si se desea la verificacin. Consulte Cmo configurar Direct OCR en la pgina 47. Proceso Utilice esta opcin para definir dnde se colocarn las nuevas imgenes en el documento, para establecer que se le soliciten ms pginas al explorar, para especificar la exploracin de dos pginas para manipular libros, y otros parmetros. Aqu tambin se puede cambiar el idioma de la interfaz. OmniPage SE no admite la exploracin simultnea de dos pginas.

Parmetros

33

Verificacin Utilice esta opcin para definir si la verificacin debe comenzar automticamente tras el reconocimiento. Defina tambin si se debe ejecutar IntelliTrain, y utilcela para cargar o trabajar con un archivo de capacitacin. Consulte Verificacin de los resultados de OCR en la pgina 69. Las referencias a la capacitacin y IntelliTrain no son aplicables a OmniPage SE. Diseo personalizado Utilice esta opcin para describir en forma precisa el diseo de las pginas del documento de entrada. Esto permite el mximo control sobre el proceso de separacin automtica de zonas, indicndole que busque o ignore las columnas, grficos y tablas. Consulte Descripcin del diseo del documento en la pgina 54. Editor de texto Utilice esta opcin para mostrar u ocultar ciertas caractersticas en el Editor de texto, para definir la unidad de medicin que se va a utilizar y para activar o desactivar la acomodacin de texto. Consulte Edicin de texto e imgenes en la pgina 77.

En OmniPage Pro 12, si tiene acceso al Sistema de administracin de documentos desde su equipo y la edicin de OmniPage Pro 12 incluye la compatibilidad ODMA, es posible que tambin aparezca un panel ODMA. Consulte Compatibilidad con ODMA en la pgina 99.

Algunos parmetros surten efecto slo en el reconocimiento futuro. Se pueden citar como ejemplos los idiomas de reconocimiento, un archivo de capacitacin o el brillo del escner. Estos parmetros se deben ajustar correctamente antes de comenzar el procesamiento. Para aplicar los cambios en estos parmetros a pginas ya reconocidas, se deber volver a reconocerlas. Los dems parmetros surten efecto inmediatamente en todas las pginas existentes. Ello ocurre, por ejemplo, con parmetros del Editor de texto tales como la acomodacin de texto o las unidades de medicin.

34

Introduccin

Captulo 3

Procesamiento de documentos
En este captulo del tutorial se describen diferentes formas en que se puede procesar un documento y, adems, se proporciona informacin acerca de los aspectos fundamentales de estos tipos de procesamiento.
x x x x x x x x

Gua de inicio rpido Generalidades del procesamiento Procesamiento automtico Procesamiento manual Procesamiento combinado Procesamiento con el Asistente de OCR Procesamiento a partir de otras aplicaciones (Direct OCR, PaperPort) Procesamiento con Programar OCR

Los temas detallados son: x Definicin del origen de imgenes de las pginas x Descripcin del diseo del documento x Zonas y fondos Separacin automtica de zonas Separacin manual de zonas Tipos y propiedades de zonas Trabajo con zonas x Cuadrculas de tablas en la imagen x Uso de plantillas de zonas

Gua del usuario de OmniPage SE

35

Gua de inicio rpido


Esta seccin muestra paso a paso el proceso bsico de OCR.

Carga y reconocimiento de archivos de imgenes de ejemplo


Encontrar ejemplos de archivos de imgenes en la carpeta del programa, tanto archivos de una pgina como de varias pginas. Primero intente leer estos archivos utilizando el procedimiento que se indica a continuacin, pero ignorando las referencias al escner. Consulte Entrada desde archivos de imagen en la pgina 50. Los resultados le proporcionarn un parmetro sobre la calidad del reconocimiento que puede esperar a partir de sus propios archivos de calidad similar. A continuacin, intente explorar una pgina con su escner.

Exploracin y reconocimiento de una sola pgina


Encienda el escner y cercirese de que funciona correctamente. Seleccione una pgina con texto ntido de buena calidad para esta prueba. Se da por sentado que se fijaron los parmetros predeterminados de OmniPage SE y que el documento est en el idioma que se especific para la interfaz durante la instalacin. Abra el cuadro de dilogo Opciones en el men Herramientas y elija la opcin Predeterminados si no est utilizando el programa por primera vez. Procesar el documento en forma automtica y se guardarn los resultados de reconocimiento en un archivo. Podr verificar el documento, pero no editar su contenido en el Editor de texto.

36

Procesamiento de documentos

Captulo 3

Accin
1. 2. 3. 4. Configure el escner utilizando el Asistente del escner, si an no lo ha hecho.

Resultado
Configura OmniPage SE para que funcione con su escner.

Seleccione Inicio Programas ScanSoft OmniAbre OmniPage SE en su equipo. OmniPage SE 2.0 Page SE 2.0 Coloque el documento correctamente en el escner. En la lista desplegable Obtener pgina, seleccione una opcin de exploracin para el documento: blanco y negro, escala de grises o color. En la lista desplegable Descripcin del diseo, verifique que est seleccionada la opcin Automtico. Esta es la mejor opcin para procesar una gran variedad de documentos. Permite determinar la forma en que se vern las imgenes, texto de color y fondos en el documento exportado. La exploracin en colores necesita un escner en color. Configura el programa en cuanto a cmo debe colocar zonas en la pgina y decide sus propiedades en forma automtica.

5.

6.

En la lista desplegable Exportar resultados, veriEsto significa que podr nombrar el archivo de exporfique que est seleccionada la opcin Guardar tacin tras haber verificado el documento. como archivo. Haga clic en el botn Iniciar. OmniPage SE comenzar a explorar el documento. Aparecer una miniatura con un indicador de progreso. Aparecer el Verificador de OCR. El Verificador de OCR funciona como el corrector ortogrfico de un procesador de texto, pero adems contiene ciertas caractersticas especficas de OCR. Elimina las marcas de las palabras que usted verifique. Cada vista del Editor de texto define un nivel de formato. Esto le ayuda a determinar qu nivel escoger al momento de guardar.

7.

8.

Utilice el Verificador de OCR para modificar las palabras que el programa sospeche que no se reconocieron correctamente.

9.

Haga clic en el Editor de texto. Seleccione las vistas del Editor de texto una tras otra, para ver el aspecto que tendr la pgina en cada una de ellas. Haga clic en Continuar para reiniciar la verificacin. Cuando aparezca el mensaje La verificacin del reconocimiento est completa, haga clic en Aceptar. Escoja un nombre, tipo y ruta de archivo, as como el nivel de formato para guardar el documento reconocido. Haga clic en Aceptar. Revise el documento en el procesador de texto.

10.

Con esto termina el proceso del Verificador de OCR. Aparecer el cuadro de dilogo Guardar como. De forma predeterminada, est activada la opcin Guardar e iniciar, de modo que el documento se abrir automticamente en el procesador de texto asociado con el tipo de archivo que seleccione. Ha utilizado satisfactoriamente OmniPage SE para reconocer el documento y abrirlo en la aplicacin de destino

11.

12.

Gua de inicio rpido

37

Si obtuvo resultados satisfactorios a partir de los archivos de imgenes de ejemplo, pero no con una pgina explorada, revise la instalacin y parmetros del escner: en especial el brillo y la resolucin de la imagen. Consulte Entrada desde escner en la pgina 51. Ah encontrar un modelo de brillo ptimo. Consulte tambin los temas de la ayuda en lnea sobre Configuracin del escner y Resolucin de problemas del escner.

Generalidades del procesamiento


El siguiente diagrama de flujo resume los pasos del procesamiento:
Obtener pginas desde un archivo pgina 50 desde el escner pgina 51 Separacin automtica de zonas pgina 56 Separacin manual de zonas pgina 56 Exportar pginas Verificar y editar pgina 70 Verificar pgina 69 a un archivo pgina 85 al Portapapeles pgina 90 va correo pgina 91

Describir el diseo de pgina pgina 54 Aplicar una plantilla pgina 64

Realizar OCR con los parmetros actuales pgina 33

A continuacin aparece un resumen de los mtodos de procesamiento que se pueden utilizar. En las siguientes pginas encontrar una gua detallada para cada uno de ellos. Automtico La manera ms rpida y sencilla de procesar documentos es dejar que OmniPage SE lo haga automticamente. Seleccione los parmetros en el cuadro de dilogo Opciones y en las listas desplegables de la Caja de herramientas de OmniPage y luego haga clic en Iniciar. El programa procesar cada pgina por todo el procedimiento de principio a fin, efectuando pasos en paralelo cada vez que sea posible. Generalmente separar de manera automtica las zonas de las pginas. Manual El procesamiento manual le brinda un control ms preciso sobre la forma de manipulacin de las pginas. Podr procesar el documento pgina por pgina con diferentes parmetros para cada una de ellas. El programa tambin se detiene entre paso y paso: obtencin de imgenes, reconocimiento, exportacin. Esto permite, por ejemplo, dibujar zonas manualmente o cambiar el idioma o idiomas de reconocimiento. Debe comenzar cada paso haciendo clic en los tres botones de la Caja de herramientas de OmniPage.

38

Procesamiento de documentos

Captulo 3

Combinada Podr procesar un documento automticamente y ver los resultados en el Editor de texto. Si la mayora de las pginas estn en orden, pero algunas no quedaron como se esperaba, podr pasar al procesamiento manual para ajustar los parmetros y efectuar nuevamente el reconocimiento slo de las pginas problemticas. Alternativamente, puede obtener imgenes con el procesamiento manual, dibujar zonas en algunas de ellas y, luego, enviar todas las pginas para el procesamiento automtico. Uso del Asistente de OCR El Asistente de OCR le guiar a travs de la seleccin de parmetros y comandos mediante una serie de preguntas. Luego iniciar el procesamiento automtico. sta es una buena manera de comenzar si an no tiene mucha experiencia en el uso de OmniPage SE.

En otras aplicaciones Podr usar la caracterstica Direct OCR para recurrir a los servicios de reconocimiento de OmniPage SE mientras trabaja en su procesador de texto usual u otra aplicacin similar. OmniPage SE se vincula automticamente con los programas de administracin de documentos PaperPort y Pagis de ScanSoft.

Generalidades del procesamiento

39

Posteriormente Podr programar trabajos de OCR para que se efecten posteriormente de manera automtica, incluso sin que sea necesaria su presencia ante el equipo. El Asistente para trabajo nuevo en Programar OCR permite especificar los parmetros y una hora de inicio. OmniPage SE no admite el uso de la funcin Programar OCR.

Procesamiento automtico
El procesamiento automtico constituye una manera eficiente de manipular documentos, especialmente aqullos de gran tamao. Primero seleccione todos los parmetros necesarios, luego podr usar el botn Iniciar de la Caja de herramientas de OmniPage para procesar un nuevo documento de principio a fin o, bien, reiniciar y terminar el procesamiento de un documento abierto.
Botn Iniciar Botn Obtener pgina Botn Realizar OCR Botn Exportar resultados

Lista desplegable Obtener pginas

Lista desplegable Exportar resultados

Lista desplegable Descripcin del diseo

1. Seleccione en la lista desplegable el parmetro deseado de Obtener pgina. Podr definir el origen del documento, el cual puede provenir de archivos de imgenes o de un escner. Consulte Definicin del origen de imgenes de las pginas en la pgina 50. 2. Seleccione un parmetro de la lista desplegable Descripcin del diseo, tal como se indic anteriormente. Esto gua al programa para la separacin automtica de zonas de las pginas. Podr describir las pginas entrantes o

40

Procesamiento de documentos

Captulo 3

especificar un archivo de plantilla de zonas. Consulte Descripcin del diseo del documento en la pgina 54. 3. Seleccione un parmetro de la lista desplegable Exportar resultados. Usted puede guardar el archivo como un documento de OmniPage. Puede guardar pginas (actuales, seleccionadas o todas) en un archivo, copiarlas al Portapapeles o enviarlas como documentos adjuntos de correo. Consulte Guardar y exportar en la pgina 83. 4. Elija en la barra de herramientas Estndar u Opciones en el men Herramientas y compruebe que los parmetros sean adecuados para su documento. Es posible, por ejemplo, especificar los idiomas de reconocimiento y si desea verificar el documento. Consulte Parmetros en la pgina 33. 5. Haga clic en el botn Iniciar o seleccione Iniciar procesamiento automtico en el men Proceso. Cada pgina del documento se procesar y terminar una tras otra. El programa puede efectuar tareas individualmente; por ejemplo, puede iniciar la carga y reconocimiento de una nueva pgina a medida que vaya verificando la pgina anterior.

Detener y reiniciar el procesamiento automtico


Detener: Cuando el procesamiento automtico est en progreso, el botn Inicio se transforma en Detener. Haga clic en l para interrumpir el procesamiento automtico. Le convendr hacer esto si encuentra que se deben cambiar algunos parmetros. Reiniciar: Cuando el procesamiento automtico ha finalizado, se restaura el botn Iniciar. Haga clic en l para reiniciar el procesamiento. El cuadro de dilogo Procesamiento automtico permite especificar lo que desea hacer: x Finalizar el procesamiento de las pginas no reconocidas ni verificadas y luego exportar los resultados. x Exportar nuevamente un documento ya guardado, tal vez con cambios, a otro tipo, nombre o ubicacin de archivo o, bien, con otro nivel de formato. x Agregar ms pginas del mismo origen o de otro, con parmetros cambiados o intactos. x Volver a procesar todas las pginas para desechar todos los resultados del reconocimiento y volver a reconocer todas las pginas en el documento con parmetros diferentes. Podr especificar la separacin automtica de zonas o un archivo de plantilla. Debe hacerlo si un parmetro inadecuado provoc resultados deficientes en todas las pginas. Un ejemplo es la eleccin del idioma incorrecto, lo que puede hacer que aparezcan casi todos los caracteres marcados como dudosos durante la

Procesamiento automtico

41

verificacin. Esta opcin permite efectuar nuevamente el reconocimiento sin tener que explorar, cargar ni efectuar nuevamente la separacin de zonas de todas las imgenes.

Procesamiento manual
El procesamiento manual le brinda un control ms preciso sobre la forma de manipular las pginas. Podr procesar el documento pgina por pgina con diferentes parmetros para cada una de ellas. El programa tambin se detiene entre paso y paso: obtencin de imgenes, reconocimiento, exportacin. Esto permite, por ejemplo, cambiar el fondo de la pgina y dibujar zonas manualmente en cada pgina. Debe comenzar cada paso del proceso haciendo clic en los tres botones numerados de la Caja de herramientas de OmniPage.

1. Haga clic en en la barra de herramientas Estndar o en Opciones en el men Herramientas para marcar o seleccionar los parmetros del cuadro de dilogo Opciones. Consulte Parmetros en la pgina 33. 2. Seleccione el valor deseado para el botn Obtener pgina de la lista desplegable. Podr definir el origen del documento, el cual puede provenir de archivos de imgenes o de un escner. Al explorar, seleccione el modo de exploracin y utilice los paneles Escner y Proceso del cuadro de dilogo Opciones para seleccionar los parmetros. Consulte Definicin del origen de imgenes de las pginas en la pgina 50. 3. Haga clic en el botn Obtener pgina. Esto invoca el cuadro de dilogo Cargar archivo de imagen, permitindole nombrar archivos de imgenes o, bien, inicia la exploracin. Las imgenes en miniatura de cada pgina pueden aparecer en el Panel de imgenes, junto con la imagen de la pgina actual. Utilice los botones de la barra de estado para mostrar u ocultar cualquiera de stas. Las pginas se resumen en el Administrador de documentos. 4. Todas las imgenes de pginas ingresan al programa con un fondo de procesar. Siempre y cuando no se dibujen zonas en estas pginas, se les efectuar la separacin automtica de zonas cuando se solicite el reconocimiento. 5. Puede dibujar manualmente y modificar zonas en una o ms imgenes y asignar propiedades. Los botones de la barra de estado permiten pasar a otras pginas. Cuando dibuje una zona en una pgina, sta adoptar un fondo de ignorar. Usted puede especificar la separacin automtica de zonas de una

42

Procesamiento de documentos

Captulo 3

pgina dibujando zonas de procesar. Consulte Zonas y fondos en la pgina 55. 6. Seleccione un valor para el botn Realizar OCR. Podr describir el diseo de las pginas entrantes. Este valor influye si la separacin automtica de zonas se efecta en un nmero determinado de pginas. Consulte Descripcin del diseo del documento en la pgina 54. Tambin se puede seleccionar una plantilla para colocar sus zonas en la pgina actual. Consulte Uso de plantillas de zonas en la pgina 64. 7. Haga clic en el botn Realizar OCR para reconocer la pgina actual. Para volver a reconocer las pginas seleccionadas, haga una seleccin mltiple en el Administrador de documentos (Consulte Administracin de documentos en la pgina 28.) Luego haga clic en el botn Realizar OCR. Las pginas reconocidas aparecen en el Editor de texto. 8. Si solicit verificacin, el cuadro de dilogo Verificador de OCR mostrar los caracteres dudosos uno tras otro en la pgina o pginas reconocidas. Podr verificar y editar el texto reconocido. Consulte Verificacin de los resultados de OCR en la pgina 69. 9. Contine cargando pginas, efectuando el OCR, editando, verificando y revisando segn lo desee. Puede cambiar el orden de lectura de los elementos de pgina en el Editor de texto. Consulte Edicin de texto e imgenes en la pgina 77. 10. Seleccione un valor para el botn Exportar resultados. Usted puede guardar el archivo como un documento de OmniPage. Puede guardar pginas (actuales, seleccionadas o todas) en un archivo, copiarlas al Portapapeles o enviarlas como documentos adjuntos de correo. Haga clic en el botn Exportar resultados. Consulte Guardar y exportar en la pgina 83.

Procesamiento combinado
El procesamiento automtico proporciona velocidad y eficacia. El procesamiento manual requiere ms atencin, pero otorga un mayor control sobre los resultados. Es posible aprovechar ambos beneficios al procesar un solo documento. Iniciar automticamente y terminar manualmente: Cuando tenga un documento de gran tamao que contenga slo algunas pginas a las que se deba prestar especial atencin, no es necesario procesar manualmente

Procesamiento combinado

43

todo el documento. Podr procesarlo automticamente y ver los resultados en el Editor de texto. Luego podr determinar qu pginas estn en orden y cules necesitan parmetros diferentes o separacin manual de zonas. Despus de ajustar los parmetros y/o modificar zonas, utilice el procesamiento automtico para volver a reconocer slo aquellas pginas. 1. Prepare el documento y efecte el procesamiento automtico, tal como ya se describi. 2. Si cierra o termina la verificacin, se le solicitar que guarde el documento. Esto es lo que se recomienda hacer, aun cuando no sea su forma final. 3. Seleccione una pgina que necesite una nueva separacin de zonas y elimine o modifique las zonas existentes en el Panel de imgenes. Tambin podr cargar una plantilla para dejar que sus zonas reemplacen las existentes. Dibuje nuevas zonas segn desee. Consulte Zonas y fondos en la pgina 55. 4. Cambie otros parmetros segn sea necesario para la pgina actual. Consulte Parmetros en la pgina 33. 5. Haga clic en el botn Realizar OCR para volver a reconocer la pgina actual. Confirme que se deben sobreescribir los resultados del reconocimiento anterior. Alternativamente, puede utilizar el procesamiento inmediato para manipular los cambios en la separacin de zonas sin volver a reconocer toda la pgina. Consulte Edicin inmediata en la pgina 79. 6. Para volver a efectuar el reconocimiento de ms de una pgina, seleccione las pginas necesarias en las miniaturas o en el Administrador de documentos antes de hacer clic en el botn Realizar OCR. 7. Cuando haya vuelto a reconocer todas las pginas con resultados aceptables, guarde el documento nuevamente. Iniciar manualmente y terminar automticamente: 1. Prepare los parmetros y obtenga las pginas del documento haciendo clic en el botn Obtener pgina. 2. Examine las pginas para asegurarse de que tengan el brillo, orientacin y contenido adecuados. Vuelva a explorar o gire las imgenes incorrectas. Reordene las pginas segn desee.

44

Procesamiento de documentos

Captulo 3

3. Efecte la separacin de zonas en pginas donde desee procesar slo parte de la pgina o si desea dar instrucciones precisas de separacin de zonas. Utilice fondos o zonas de ignorar para excluir reas del procesamiento. Utilice fondos o zonas de procesar para especificar las reas a las que se les efectuar la separacin automtica de zonas. 4. Haga clic en el botn Iniciar y luego escoja Finalizar procesamiento de pginas actuales en el cuadro de dilogo Procesamiento automtico. 5. Despus de la verificacin (si se le solicita), usted podr guardar o exportar el documento.

Procesamiento con el Asistente de OCR


El Asistente de OCR se puede utilizar para comenzar a procesar un nuevo documento. Si lo selecciona con un documento abierto, ste se cerrar. El Asistente le lleva por los cinco paneles de parmetros, para ayudarle a fijar los parmetros del documento y, luego, inicia el procesamiento automtico. Existe ayuda contextual en todos los paneles del asistente. Haga clic en el botn Asistente de OCR en la Caja de herramientas de OmniPage para ver la primera pantalla del asistente: 1. El primer panel permite definir el origen del documento: escner o archivo de imagen. Consulte Definicin del origen de imgenes de las pginas en la pgina 50. Responda la pregunta de la primera pantalla y haga clic en Siguiente. 2. El segundo panel le solicita que describa el diseo del documento de entrada, para ayudarle en la separacin automtica de zonas. Consulte Descripcin del diseo del documento en la pgina 54. 3. El tercer panel permite definir los idiomas del reconocimiento. Los idiomas que cuenten con diccionario tienen un icono de libro abierto. Las selecciones recientes aparecen en la parte superior de la lista. 4. El cuarto panel le pregunta si desea verificar el texto antes de exportarlo. Si elige S tambin podr editar el texto antes de guardar el documento. Tambin podr decidir si desea crear y utilizar datos de IntelliTrain durante la verificacin. Consulte IntelliTrain en la pgina 74. La referencia a IntelliTrain no es aplicable a OmniPage SE.

Procesamiento con el Asistente de OCR

45

5. El ltimo panel le solicita que defina la alternativa de exportacin: guardar en un archivo o copiar al Portapapeles. Tras fijar la opcin, haga clic en Terminar para cerrar el asistente y comenzar el procesamiento automtico. 6. Si solicit la verificacin y el texto contiene caracteres dudosos, aparecer el cuadro de dilogo Verificador de OCR. Cuando haya finalizado o se haya cerrado la verificacin, el cuadro de dilogo Copiar al Portapapeles o Guardar como le permitirn especificar los parmetros de exportacin del archivo, incluyendo un rango de pginas y un nivel de formato. 7. El documento permanece en OmniPage SE. Podr editar los resultados del reconocimiento y volver a guardarlos en otros formatos. Podr cambiar las zonas manualmente o modificar otros parmetros y, luego, utilizar el procesamiento manual para volver a reconocer pginas independientes del documento. Y tambin podr agregar pginas mediante el procesamiento automtico o manual.
Los paneles del asistente presentan los parmetros tal como estaban la ltima vez que se modificaron en el programa. Adems, OmniPage SE recordar los parmetros que se configuren en los paneles del Asistente de OCR y los aplicar a los procesamientos futuros, ya sean automticos o manuales, hasta que los vuelva a cambiar. De modo que si tiene ms documentos para los cuales sean adecuados los parmetros del Asistente de OCR, basta con hacer clic en Iniciar en la Caja de herramientas de OmniPage. Los parmetros pertinentes que no ofrece el Asistente de OCR adoptan los valores que se fijaron la ltima vez en el programa. Esto concierne principalmente a los parmetros del escner, un diccionario del usuario o un archivo de capacitacin. No es posible usar plantillas de zonas con el Asistente de OCR. Si al iniciarse el Asistente de OCR se estableci un archivo de plantilla, ste se descargar y se fijar la opcin Automtico como descripcin de entrada. No es posible exportar un documento reconocido adjunto a un mensaje de correo electrnico. En ese caso, utilice el procesamiento automtico o manual.

Procesamiento a partir de otras aplicaciones


Puede usar la caracterstica Direct OCRTM para recurrir a los servicios de reconocimiento de OmniPage SE mientras trabaja en su procesador de texto usual u otra aplicacin similar. Primero se debe establecer la conexin directa con la aplicacin. Luego, dos elementos del men Archivo dan paso a las funciones de OCR.

46

Procesamiento de documentos

Captulo 3

Cmo configurar Direct OCR


1. Inicie la aplicacin que quiere conectar a OmniPage SE. Inicie OmniPage SE, abra el cuadro de dilogo Opciones en el panel Direct OCR y seleccione Activar Direct OCR. 2. Seleccione las opciones de proceso para la verificacin y la separacin de zonas. stas se aplicarn en los trabajos futuros de Direct OCR hasta que las vuelva a cambiar; pero no se aplicarn cuando se utilice OmniPage SE por s solo. 3. Aparece el panel Sin registrar que muestra las aplicaciones registradas anteriormente o en ejecucin. Seleccione las que desee y haga clic en Agregar. Podr examinar en busca de una aplicacin que no aparezca en la lista.

Cmo usar Direct OCR


1. Abra la aplicacin registrada y trabaje en un documento. Para obtener resultados de reconocimiento a partir de pginas exploradas, colquelas correctamente en el escner. 2. Utilice el elemento de men Obtener parmetros del texto... del men Archivo de la aplicacin de destino para especificar los parmetros que se utilizarn durante el reconocimiento. Los parmetros que no se presenten, adoptan sus valores segn los ltimos que se utilizaron con OmniPage SE. Los parmetros cambiados para Direct OCR se cambian tambin en OmniPage SE. 3. Utilice el elemento de men Obtener texto del men Archivo para obtener imgenes provenientes del escner o archivo. 4. Si seleccion Zonas automticas en el panel Direct OCR del cuadro de dilogo Opciones o, bien, en Obtener parmetros del texto..., el reconocimiento se efectuar de inmediato. 5. Si no seleccion Zonas automticas, se presentar la imagen de cada pgina, permitindole dibujar zonas manualmente. Haga clic en el botn Realizar OCR para continuar con el reconocimiento. 6. Si se especific la verificacin, sta se llevar a cabo tras el reconocimiento. Luego el texto reconocido se colocar en la posicin del cursor en la aplicacin, con el nivel de formato especificado en Obtener parmetros del texto... .

Procesamiento a partir de otras aplicaciones

47

Si se est ejecutando OmniPage SE al momento de invocar Direct OCR desde una aplicacin de destino, se iniciar una segunda instancia de OmniPage SE. En los temas de Direct OCR de la Ayuda en lnea encontrar mayor informacin. stos incluyen un tema denominado Preguntas y respuestas sobre OCR. En el archivo Lame y en el sitio Web de ScanSoft se puede encontrar informacin ms reciente sobre aplicaciones de destino especficas.

Cmo usar OmniPage SE con PaperPort


PaperPort es un software de ScanSoft para la administracin de documentos. Permite vincular pginas con aplicaciones afines. Las pginas pueden contener imgenes, texto o ambas cosas. Si PaperPort se encuentra instalado en un equipo con OmniPage SE, sus servicios de OCR quedarn disponibles y ampliarn la capacidad de PaperPort. Podr elegir un programa de OCR haciendo clic con el botn derecho del ratn en un enlace de PaperPort para aplicaciones de texto, seleccionando Preferencias y, luego, OmniPage SE 2.0 como paquete de OCR. Los parmetros de OCR se pueden especificar, tal como en el caso de Direct OCR.
:

Aqu se ha seleccionado OmniPage SE como el paquete de OCR para MS Word 2000. Ahora puede arrastrar imgenes de pginas desde el escritorio de PaperPort al vnculo de MS Word en PaperPort. Mientras se reconoce el texto, slo aparecer un monitor indicando el progreso de dicho procedimiento. Si se solicita, aparecern la ventana de separacin manual de zonas de OmniPage SE o la funcin de verificacin. Los resultados de reconocimiento se colocan en un nuevo documento sin nombre en la aplicacin de destino.

48

Procesamiento de documentos

Captulo 3

Procesamiento con Programar OCR


OmniPage SE no admite el uso de la funcin Programar OCR. El texto siguiente es aplicable exclusivamente a OmniPage Pro. Podr programar trabajos de OCR para que se efecten automticamente en cualquier momento dentro de los prximos ocho das. En cada trabajo se procesa un documento. Las pginas del documento pueden provenir de archivos de imgenes o de un escner con alimentador automtico de documentos. No es necesario estar frente al ordenador en el momento de iniciar el trabajo, ni tampoco que OmniPage Pro est en funcionamiento. No importa si su equipo se apaga despus de configurar el trabajo, siempre y cuando est funcionando a la hora de inicio. Si se han de explorar pginas, el escner debe estar funcionando en el momento de iniciar el trabajo, con las pginas cargadas en el alimentador automtico de documentos. A continuacin se indica cmo configurar un trabajo: 1. Haga clic en Programar OCR en el men Proceso o en el men Inicio de Windows: seleccione Programas#ScanSoftOmniPage Pro 12.0# Programar OCR. 2. Aparecer el cuadro de dilogo Programar OCR. Haga clic en Nuevo... a fin de invocar el Asistente para trabajo nuevo. El programa le guiar por seis paneles, similares al Asistente de OCR. 3. En el primer panel podr definir el origen de la imagen: escner con alimentador automtico de documentos o archivo. 4. Los dos paneles siguientes son similares a los del Asistente de OCR, pero tambin puede especificar un diccionario del usuario o profesional y un archivo de capacitacin. La ejecucin de IntelliTrain depende de cmo est fijado en OmniPage Pro el parmetro correspondiente al momento de iniciar el trabajo. 5. Los siguientes paneles permiten especificar el nombre, tipo y ubicacin de un archivo de exportacin, una opcin de separacin y un nivel de formato para dicho archivo. 6. El ltimo panel permite definir la hora de inicio del trabajo y (donde corresponda) una hora de detencin, y mantener o eliminar los archivos de entrada despus del procesamiento. Haga clic en Terminar para cerrar el asistente.

Procesamiento con Programar OCR

49

El cuadro de dilogo Programar OCR enumera cada trabajo e indica si su estado es Esperando, Ejecucin, Pausa, Error o Completo. Utilice la opcin Modificar trabajo... para cambiar los parmetros de un trabajo en espera. Podr ver, modificar y volver a utilizar los trabajos terminados para procesar nuevos trabajos que necesiten parmetros similares. Tambin podr eliminar los trabajos finalizados cuando ya no los necesite.

Definicin del origen de imgenes de las pginas


Hay dos posibles orgenes de imgenes: desde archivos de imgenes y desde un escner. Existen dos tipos principales de escneres: plano o con alimentacin de hojas. Un escner puede tener un alimentador automtico de documentos incorporado o agregado, el cual facilita la exploracin de documentos con varias pginas. Las imgenes de los documentos explorados se pueden introducir directamente en OmniPage SE o, bien, guardar con el propio software del escner en un archivo de imagen, que se puede abrir posteriormente con OmniPage SE.

Entrada desde archivos de imagen


Puede crear archivos de imagen desde su propio escner, o recibirlos por correo electrnico o como archivos de fax. OmniPage SE puede abrir una gran variedad de tipos de archivos de imagen. Consulte Tipos de archivos para abrir y guardar imgenes en la pgina 101. Seleccione Cargar archivo de imagen en la lista desplegable Obtener pginas. Los archivos se especifican en el cuadro de dilogo Cargar archivo de imagen. ste aparece al iniciar el procesamiento automtico. En el procesamiento manual, haga clic en el botn Obtener pgina o use el men Proceso. En la parte inferior del cuadro de dilogo aparecern los parmetros avanzados, los cuales se pueden dejar a la vista u ocultar. A continuacin aparece su aspecto.

50

Procesamiento de documentos

Captulo 3

sta es la carpeta actual. Haga clic mientras pulsa la tecla Mays o, bien, la tecla Ctrl a fin de colocar ms de un archivo en el cuadro de texto Nombre de archivo. Especifique el tipo o tipos de archivo que desea ver.

Seleccione esta opcin para ver una miniatura del archivo seleccionado. No disponible cuando se seleccionan mltiples archivos.

Esto se puede usar para archivos TIFF, DCX y MAX de varias pginas.

Haga clic en Avanzadas para abrir el panel inferior y en Bsicas para cerrarlo. Utilice esta opcin para agregar archivos de carpetas diferentes y controlar de manera precisa el orden de los archivos. Utilice estas flechas para cambiar el orden de los archivos.

Normalmente el botn Agregar coloca cada archivo en la parte inferior de la lista de archivos. Para colocar un archivo en alguna otra posicin, resalte el archivo en la lista. El nuevo archivo se agregar justo a continuacin del archivo resaltado que est ms abajo.

Entrada desde escner


Se debe contar con un escner en buen estado, compatible e instalado correctamente con OmniPage SE. Consulte Configuracin del escner con OmniPage SE en la pgina 14. Se ofrecen varios modos de exploracin. Al elegir uno, se deben considerar dos aspectos fundamentales:
x x

El tipo de salida que se desea para el documento de exportacin El modo que proporcionar la mayor exactitud de OCR

Explorar en blanco y negro Seleccione esta opcin para explorar en blanco y negro. Esta opcin no es la ms idnea si desea color en el documento de salida, ni tampoco si desea que las imgenes tengan un aspecto similar al de fotografas en blanco y negro: en ese caso se recomienda la exploracin en escala de grises. Para una mayor exactitud de OCR, utilice esta opcin para texto oscuro ntido o sobre un fondo blanco o

Definicin del origen de imgenes de las pginas

51

plido. Las imgenes en blanco y negro se pueden explorar y manipular ms rpidamente que las dems y ocupan menos espacio de disco. Explorar en escala de grises Seleccione esta opcin para usar la exploracin en escala de grises. Elija esta opcin para conservar fotografas blanco y negro en el documento de salida. Para una mayor exactitud de OCR, utilice esta opcin en pginas con contraste variable o bajo (donde no haya mucha diferencia entre tonos claros y oscuros) y con el texto sobre fondos de color o sombreados. Explorar en color Seleccione esta opcin para explorar en color. Esto funcionar slo con escneres a color. Elija esta opcin si desea obtener grficos, texto o fondos en color en el documento de salida. Para mayor exactitud de OCR, esta opcin no ofrece mayores beneficios que la escala de grises (para una resolucin determinada), pero exigir mucho ms tiempo, recursos de memoria y espacio de disco. Brillo y contraste Los parmetros correctos de brillo y contraste juegan un importante papel en la exactitud de OCR. Fije stos en el panel Escner del cuadro de dilogo Opciones o en la interfaz de su escner. El diagrama ilustra un ajuste ptimo de brillo. Tras cargar una imagen, revise su aspecto. Si los caracteres son gruesos y se superponen, aclare el brillo. Si los caracteres son finos y difusos, oscurezca el brillo. Luego vuelva a explorar la pgina.

Deficiente

Tolerable Buena ptima Buena Tolerable Deficiente

52

Procesamiento de documentos

Captulo 3

Exploracin con un alimentador automtico de documentos


La mejor manera de explorar documentos de varias pginas es con un alimentador automtico de documentos. Basta con cargar las pginas en el orden correcto en el alimentador. Coloque las pginas en blanco si desea guardar su documento en varios archivos de salida, utilizando la opcin Crear un archivo nuevo despus de cada pgina en blanco. Consulte Guardar los resultados del reconocimiento en la pgina 85. Si tiene un documento que supere la capacidad del alimentador automtico de documentos, seleccione Pedir automticamente ms pginas en el panel Proceso del cuadro de dilogo Opciones. Luego, un cuadro de dilogo le permitir agregar ms lotes de pginas e indicar cuando se hayan explorado todas las pginas. Podr explorar documentos por ambas caras con un alimentador automtico de documentos. Un escner dplex administrar esta funcin de manera automtica. Para los escneres sencillos, seleccione la opcin Explorar pginas de dos caras en el panel Escner del cuadro de dilogo Opciones. Luego podr explorar el documento en apenas algunas pasadas, agrupando las pginas pares e impares. OmniPage SE fusionar las pginas de manera automtica.

Exploracin sin un alimentador automtico de documentos


Tambin es posible explorar eficazmente documentos de varias pginas en un escner plano, incluso sin contar con un alimentador automtico de documentos. Seleccione la opcin Explorar pginas automticamente en el panel Escner del cuadro de dilogo Opciones, y defina un valor de pausa en segundos. Luego el escner efectuar las pasadas de exploracin de manera automtica, haciendo pausas entre cada exploracin segn el nmero de segundos que usted haya definido, lo que le dar tiempo de colocar la pgina siguiente. Un cuadro de dilogo le permitir terminar la pausa antes o, bien, solicitar una pausa ms prolongada y especificar cundo explorar la ltima pgina. En OmniPage Pro 12 es posible explorar dos pginas de un libro a la vez. El programa dividir las imgenes entrantes en dos pginas y las enderezar de manera independiente. Esta caracterstica no est disponible en OmniPage SE..

Definicin del origen de imgenes de las pginas

53

Descripcin del diseo del documento


Antes del reconocimiento se le solicitar que describa el diseo de las pginas entrantes para ayudar al proceso de separacin automtica de zonas. Cuando utilice el Asistente de OCR, siempre se ejecutar la separacin automtica de zonas. Al efectuar el procesamiento automtico, siempre se efectuar la separacin automtica de zonas a menos que especifique una plantilla que no contenga una zona o fondo de procesar. Cuando efecte el procesamiento manual, a menudo se ejecutar la separacin automtica de zonas. Consulte el tema Cundo ejecutar separacin automtica de zonas? de la ayuda en lnea. A continuacin aparecen las opciones de descripcin de entradas: Automtico Elija esta opcin para que el programa tome todas las decisiones de separacin automtica de zonas. El programa decide si el texto est en columnas, si un elemento es un grfico o texto que se reconocer y si se deben colocar tablas. Elija Automtico si el documento contiene pginas con diseos distintos o desconocidos. Elija esta opcin para una pgina con varias columnas y una tabla, y para pginas que tengan ms de una tabla. Columna nica, sin tabla Elija este parmetro si las pginas contienen slo una columna de texto, pero no una tabla. Las cartas comerciales o pginas de un libro normalmente tienen estas caractersticas. Elija esta opcin tambin para una pgina con palabras o nmeros dispuestos en columnas si no desea que stos se coloquen en una tabla, que se pierdan las columnas o dejarlos como columnas independientes. Es posible detectar grficos. Varias columnas, sin tabla Escoja esta opcin si algunas de las pginas contienen texto en columnas y desea hacer desaparecer las columnas o, bien, conservarlas en columnas independientes, similares al diseo original. Es posible mantener las columnas en el documento de salida usando marcos, si se selecciona True Page en el momento de la exportacin. La exportacin con flujo de pginas de OmniPage Pro 12 mantiene las columnas sin requerir el uso de marcos. Si hay datos tabulados, es probable que se traten como texto de corrido. Es posible detectar grficos. Columna nica, con tabla Elija esta opcin si la pgina contiene slo una columna de texto y una tabla. La separacin automtica de zonas no buscar columnas pero tratar de buscar una tabla y colocarla en una cuadrcula en el Editor de texto. Posteriormente se puede especificar si desea exportarla en una cuadrcula o como columnas de texto separadas por tabulaciones. Es posible detectar grficos.

54

Procesamiento de documentos

Captulo 3

Hoja de clculo Elija esta opcin si desea que toda la hoja quede convertida en una tabla que se exportar a un programa de hojas de clculo, o tratarla como una sola tabla. No se detectar flujo de texto ni zonas de grficos. Personalizado Elija esta opcin para tener el mximo control sobre la separacin automtica de zonas. Podr evitar o estimular la deteccin de columnas, grficos y tablas. Fije los parmetros en el panel Diseo personalizado del cuadro de dilogo Opciones. Plantilla Elija un archivo de plantilla de zonas si desea aplicar el valor de su fondo, sus zonas y propiedades a todas las pginas obtenidas de aqu en adelante. Las zonas de plantillas tambin se aplican a la pgina actual, reemplazando las zonas existentes. Tambin se aplicarn a las pginas preexistentes sin zonas cuando se vuelvan a reconocer. Consulte Uso de plantillas de zonas en la pgina 64. Si la separacin automtica de zonas produjo resultados de reconocimiento inesperados, utilice el procesamiento manual para volver a efectuar la separacin de zonas en pginas individuales y llevar a cabo nuevamente su reconocimiento.

Zonas y fondos
Las zonas definen las reas de la pgina que se han de procesar. Las zonas son rectangulares o irregulares, con lados verticales y horizontales. Las imgenes de pginas en un documento tienen un valor de fondo: procesar o ignorar (el ltimo es ms tpico). Los valores de fondo se pueden cambiar con las herramientas mostradas. Las zonas se pueden dibujar en los fondos de pgina con las herramientas mostradas:
Fondos Zonas Procesar Procesar Ignorar Ignorar Texto Tabla Grfico

A las reas de procesar (en las zonas o fondos de procesar) se les efecta la separacin automtica de zonas cuando se envan para el reconocimiento. Las reas de ignorar (en las zonas o fondos de ignorar) no se procesan. No se reconoce texto ni se transfieren imgenes.

Zonas y fondos

55

Separacin automtica de zonas


La separacin automtica de zonas permite que el programa detecte bloques de texto, encabezados, imgenes y otros elementos en una pgina y dibujar zonas para encerrarlos. Asigna tipos de zona y propiedades a estas zonas. La separacin automtica de zonas se ejecuta en pginas completas cuando efecta el procesamiento automtico, a menos que haya una plantilla cargada. Se ejecuta cuando usted utiliza el Asistente de OCR. Usted tambin puede especificar la separacin automtica de zonas al efectuar el procesamiento manual, de la siguiente manera: Separacin automtica de zonas en una pgina completa Obtener una pgina: Aparece con un fondo de procesar. No dibuje zonas en ella y verifique en la lista desplegable Descripcin del diseo que no haya cargada ninguna plantilla de zona. Haga clic en el botn Realizar OCR. Puede seleccionar pginas sin zonas para que se les separen las zonas automticamente y reconocerlas al mismo tiempo. Separacin automtica de zonas en una parte de una pgina Obtener una pgina: Aparece con un fondo de procesar. Dibuje una zona. El fondo cambia a ignorar. Dibuje las zonas de texto, tabla o grfico de modo que encierren reas que desee separar por zonas manualmente. Dibuje zonas de proceso para encerrar las reas a las que desee que se efecte la separacin automtica de zonas. Despus del reconocimiento, las zonas de procesar se reemplazarn por una o ms zonas de texto, tabla o grficos. Separacin automtica de zonas en el fondo de una pgina Obtener una pgina: Aparece con un fondo de procesar. Dibuje una zona. El fondo cambia a ignorar. Dibuje las zonas de texto, tabla o grfico para que encierren reas que desee separar por zonas manualmente. Haga clic en la herramienta Fondo de proceso (que aparece) para establecer un fondo de procesar. Dibuje zonas de ignorar sobre las partes de la pgina que no necesita. Tras el reconocimiento la pgina volver con un fondo de ignorar y nuevas zonas alrededor de todos los elementos encontrados en el fondo.

Separacin manual de zonas


Primero presentamos dos ejemplos en las zonas y fondos. Luego detallamos los tipos de zonas. Finalmente explicamos cmo dibujar y trabajar con las zonas. En estos ejemplos los nmeros se refieren a la tabla en la siguiente pgina.

56

Procesamiento de documentos

Captulo 3

Dibujar zonas en un fondo de ignorar:

Antes del reconocimiento:

Despus del reconocimiento: El fondo permanece como de ignorar.

La zona 4 vuelve como un grupo de zonas, en este caso para manipular tres columnas de texto y una fotografa.

Dibujar zonas en un fondo de procesar:

Antes del reconocimiento:

Despus del reconocimiento: El fondo cambia a ignorar.

La zona 6 se absorbe en el fondo. Todas las zonas en la parte izquierda de la pgina se crearon automticamente.

No. 1 2 3 4 5 6 7

Tipo Zona de texto Zona de tabla Zona grfica Zona de procesar Fondo de procesar Zona de ignorar Fondo de ignorar

Resultado: El OCR se efecta y genera texto. El OCR se efecta y el texto se coloca en una cuadrcula de tabla. La imagen se incrusta en una pgina reconocida. La separacin automtica de zonas crea una o ms zonas, decide los tipos y procesa el contenido. Nada

Zonas y fondos

57

Las zonas dibujadas automticamente y las de plantilla tienen bordes slidos:

Las zonas dibujadas manualmente o modificadas tienen bordes punteados:

Las zonas no tienen un orden de lectura. El reordenamiento de los elementos reconocidos se pueden efectuar en el Editor de texto. Consulte Edicin de texto e imgenes en la pgina 77. La separacin inmediata de zonas se describe en el Captulo 4. Consulte Edicin inmediata en la pgina 79.

Tipos y propiedades de zonas


Cada zona es de un tipo determinado. Las zonas que contienen texto tambin pueden tener un parmetro que describe su contenido: alfanumrico o numrico. El tipo y el contenido de la zona constituyen sus propiedades. Haga clic con el botn derecho del ratn en una zona para usar el men rpido que permite cambiar sus propiedades. Seleccione varias zonas haciendo clic con la tecla Mays para cambiar sus propiedades de una sola vez. La barra de herramientas Imagen proporciona cinco herramientas para dibujar zonas, una para cada tipo. Un tipo de zona se dibuja mediante un icono en su parte superior izquierda, y mediante el icono y el color del borde de la zona. A continuacin aparecen las herramientas y los colores: Zona de procesar (verde oliva) Utilice esta zona para dibujar una zona de procesar, para definir un rea de una pgina donde se efectuar la separacin automtica de zonas. Tras el reconocimiento, esta zona se reemplazar por una o ms zonas con tipos de zonas determinados automticamente. Normalmente se dibujan zonas de procesar en un fondo de ignorar. Dibuje una zona de procesar para encerrar columnas de texto a fin de manipularlas automticamente. Se les quitarn las columnas en las vistas NF y RFP del Editor de texto, pero mantendrn sus columnas en la vista True Page. Zona de ignorar (gris) Utilice esta opcin para dibujar una zona de ignorar y definir un rea de una pgina que no desee transferir al Editor de texto. La separacin automtica de zonas no colocar zonas aqu. Para excluir un rea de pgina determinada de muchas pginas (por ejemplo un encabezado o nmeros de pgina), coloque una zona de ignorar en una plantilla. Normalmente se dibujan zonas de ignorar en un fondo de procesar.

58

Procesamiento de documentos

Captulo 3

Zona de texto (marrn) Utilice esta opcin para dibujar una zona de texto. Dibjela sobre un solo bloque de texto. El contenido de la zona se tratar como flujo de texto, sin que se encuentren columnas. Si desea manipular las columnas de texto automticamente, encirrelas en una zona de procesar. Zona de tabla (azul) Utilice esta opcin para que el contenido de la zona sea tratado como una tabla. Es posible detectar automticamente las cuadrculas de la tabla o, bien, colocarlas en forma manual tal como se describe en la siguiente seccin. Las zonas de tablas deben ser rectangulares. El Editor de texto muestra la tabla en una cuadrcula editable. Para muchos tipos de archivos de salida, podr elegir si desea exportar tablas en cuadrculas o en columnas separadas por tabulaciones. Zona grfica (verde) Utilice esta opcin para encerrar una imagen, diagrama, dibujo, firma o cualquier otro elemento que desee transferir al Editor de texto como una imagen incrustada, y no como texto reconocido. Las imgenes incrustadas se pueden exportar con el documento a aplicaciones de destino que permitan el uso de grficos.

Las zonas de texto y de tabla tienen un parmetro de contenido de zona. El contenido alfanumrico valida todos los caracteres necesarios para el idioma elegido. Los resultados del reconocimiento de una zona numrica contendrn slo cifras y la puntuacin que les sea pertinente. No se colocarn letras. Utilice el men rpido de zona para cambiar este parmetro. Haga clic con el botn derecho del ratn fuera de una zona para obtener un men rpido diseado para toda la imagen. ste permite acercar, alejar o girar la imagen. Al girar una imagen, se eliminan todas las zonas que sta contiene.

Trabajo con zonas


La barra de herramientas Imagen proporciona herramientas para la edicin de zonas. Siempre hay una seleccionada. Cuando ya no desee utilizar una herramienta, haga clic en otra. Algunas herramientas de esta barra estn agrupadas. Slo se ve la ltima herramienta seleccionada del grupo. Para seleccionar una herramienta visible, haga clic en ella. Para seleccionar una herramienta escondida, mantenga pulsado el botn del ratn en la parte inferior derecha de la herramienta visible hasta que aparezcan las herramientas adicionales y, luego, haga clic en la herramienta que desee.

Zonas y fondos

59

Dibujar una sola zona Seleccione la herramienta para dibujar zonas del tipo deseado y, luego, haga clic y arrastre el cursor. En estos ejemplos, esto lo muestra la flecha que va de A a B. Tambin es posible arrastrarla desde la esquina superior izquierda a la inferior derecha. Slo se dibujarn las zonas rectangulares; las zonas (excepto las de tabla) se pueden hacer irregulares despus de dibujarlas. Para cambiar el tamao de una zona, haga clic en ella para seleccionarla, mueva el cursor a un lado o esquina, tome un manipulador y muvala a la ubicacin deseada. Para mover una zona, seleccinela con la herramienta para seleccionar zonas y muvala segn desee. No puede mover una zona para ponerla encima de otra. Hacer una zona irregular por adicin Dibujar una zona del mismo tipo que se superponga parcialmente:
zona existente zona resultante

nueva zona

60

Procesamiento de documentos

Captulo 3

Unir dos zonas del mismo tipo Dibujar una zona del mismo tipo que se superponga:

zonas existentes

nueva zona

zona resultante

Hacer una zona irregular por sustraccin Dibuje una zona del mismo tipo que el fondo que se superponga (en este ejemplo, en un fondo de ignorar).
zona existente en un fondo de ignorar nueva zona de ignorar

zona resultante

Dividir una zona Dibuje una zona que se divida del mismo tipo que el fondo (en este ejemplo, en un fondo de procesar).
zona de texto existente en un fondo de procesar nueva zona de procesar

zonas resultantes

Zonas y fondos

61

Las siguientes formas de zonas estn prohibidas:


Con sangras en la parte inferior Con sangras en la parte superior Con un hueco en el medio

Para expandir una zona ms rpidamente que utilizando sus manipuladores de cambio de tamao, dibuje una zona del mismo tipo para encerrarla completamente. La zona ms pequea es reemplazada por la ms grande. Para reemplazar un conjunto de zonas de cualquier tipo por una sola zona, dibuje una zona ms grande del tipo que desee de modo que encierre completamente las otras. Todas las zonas ms pequeas sern reemplazadas por la ms grande. Cuando dibuje una nueva zona que se superponga parcialmente con una zona existente de otro tipo, en verdad no se traslaparn; la nueva zona reemplazar la parte superpuesta de la zona existente. Los diagramas del tema de la Ayuda en lnea Dibujar zonas manualmente clarifican estos temas.

Cuadrculas de tablas en la imagen


Tras el procesamiento automtico es posible que vea las zonas de tablas colocadas en una pgina. stas se indican con un icono de zona de tabla en la esquina superior izquierda de la zona. Para conferir o quitar la designacin de zona rectangular de tabla a una zona dada, utilice su men rpido. Tambin puede dibujar tipos de zonas de tabla, pero stas deben seguir siendo rectangulares. Los separadores de tabla se dibujan o mueven para determinar dnde aparecern las lneas de las cuadrculas al colocar la tabla en el Editor de texto. Puede dibujar o cambiar el tamao de una zona de tabla (siempre y cuando siga siendo rectangular) para eliminar las columnas o filas innecesarias de los bordes exteriores de una tabla. Las cinco herramientas agrupadas para la manipulacin de tablas de la barra de herramientas Imagen se pueden usar si la pgina actual contiene una zona tipo tabla. Si la herramienta que usted necesita no est visible, haga clic en el tringulo en la parte inferior derecha de la herramienta visible para apreciar todas las herramientas y, luego, haga clic en la que desee.

62

Procesamiento de documentos

Captulo 3

Utilice las herramientas de tablas y los cursores de la siguiente manera: Introducir separadores de fila Haga clic en esta herramienta y luego en la posicin de una zona de tabla donde desee colocar un separador de fila. Evite colocar un separador de modo que corte el texto. Introducir separadores de columna Haga clic en esta herramienta y luego en la posicin de una zona de tabla donde desee colocar un separador de columna. Mover separadores Haga clic en la herramienta y mueva el cursor al separador de fila o columna que se ha de mover. Aparecer una flecha de dos puntas. Arrastre el separador segn se desee. No podr arrastrarlo ms all de la zona vecina. Evite colocar separadores de modo que corten el texto. Eliminar separadores Haga clic en esta herramienta y luego en un solo separador de fila o columna que desee eliminar. Hgalo si un separador est colocado incorrectamente o si desea cambiar el aspecto de la tabla en el documento final. Por ejemplo, puede colocar dos columnas de datos en una sola columna, eliminando el separador entre las dos columnas originales. Colocar/eliminar todos los separadores Haga clic en esta herramienta y luego en el icono del cursor dentro de una zona de tabla sin separadores. Los separadores se detectarn y colocarn automticamente. Haga clic en una tabla con separadores para hacerlos desaparecer todos. Pulse la tecla Ctrl al hacer clic si desea colocar, mover o eliminar un separador slo en la celda actual. Puede especificar el formato de lnea para los bordes y las cuadrculas de la tabla en un men rpido. Tendr una mayor eleccin para editar los bordes y el sombreado en el Editor de texto tras el reconocimiento.

Cuadrculas de tablas en la imagen

63

Uso de plantillas de zonas


Una plantilla contiene un valor de fondo de pgina y un conjunto de zonas con sus propiedades, almacenadas en un archivo. Un archivo de plantilla de zonas se puede cargar para usar las zonas de la plantilla durante el reconocimiento. Cargue un archivo de plantilla en la lista desplegable Descripcin del diseo o en el men Herramientas. Cuando cargue una plantilla, se colocarn su fondo y zonas:
x x x

en la pgina actual, reemplazando las zonas que ya estn ah en todas las pginas adquiridas a futuro en las pginas preexistentes enviadas para el reconocimiento sin ninguna zona.

Con el procesamiento manual se pueden ver y modificar las zonas de plantilla en los primeros dos casos antes del reconocimiento. Con el procesamiento automtico se pueden ver y modificar las zonas de plantilla slo despus del reconocimiento. Este comportamiento contina hasta que se descarga la plantilla. Las plantillas aceptan zonas y fondos de ignorar y procesar. Por lo tanto, pueden ser de gran utilidad para definir qu partes de las pginas se procesarn con la separacin automtica de zonas y cules se ignorarn. Las reas de las zonas de procesar o del fondo de procesar en una plantilla se pueden reemplazar durante el reconocimiento por un conjunto de zonas ms pequeas, y se les asignarn tipos de zonas especficos. Cmo guardar una plantilla de zona Seleccione un valor de fondo y prepare las zonas en una pgina. Revise sus ubicaciones y propiedades. Haga clic en Plantilla de zonas... en el men Herramientas. En el cuadro de dilogo, seleccione [zonas en la pgina] y haga clic en Guardar; despus de esto asigne un nombre y haga clic en Aceptar. Cmo modificar una plantilla de zona Cargue la plantilla y obtenga una imagen adecuada mediante procesamiento manual. Aparecern las zonas de la plantilla. Modifique las zonas y/o propiedades segn desee. Abra el cuadro de dilogo Archivo de plantilla de zonas. Se seleccionar la plantilla actual. Haga clic en Guardar y luego en Cerrar.

64

Procesamiento de documentos

Captulo 3

Cmo descargar una plantilla Seleccione un parmetro sin plantilla en la lista desplegable Descripcin del diseo. Las zonas de plantilla no se eliminan de las pginas actuales o existentes, pero tampoco se utilizarn para procesamientos futuros. Tambin puede abrir el cuadro de dilogo Archivos de plantilla de zonas, seleccionar [ninguno] y hacer clic en el botn Establecer como actual. En este caso, el parmetro de la descripcin del diseo vuelve a Automtico. Cmo reemplazar una plantilla por otra Seleccione una plantilla diferente en la lista desplegable Descripcin del diseo o, bien, abra el cuadro de dilogo Archivos de plantilla de zonas, seleccione la plantilla deseada y haga clic en el botn Establecer como actual. Las zonas de la nueva plantilla se aplican a la pgina actual, reemplazando las zonas existentes. Tambin se aplicarn tal como se explic anteriormente. Cmo eliminar un archivo de plantilla Abra el cuadro de dilogo Archivos de plantilla de zonas. Seleccione una plantilla y haga clic en el botn Eliminar. Las zonas ya colocadas por esta plantilla no se eliminarn.

Las plantillas estn disponibles en Direct OCR, pero no en el Asistente de OCR.

Uso de plantillas de zonas

65

66

Procesamiento de documentos

Captulo 4

Verificacin y edicin
Los resultados del reconocimiento se colocan en el Editor de texto. stos pueden ser texto o tablas reconocidos y grficos incrustados. El nuevo editor WYSIWYG (que significa lo que se ve es lo que se obtiene) ofrece las siguientes caractersticas, que se detallan en el presente captulo:
x x x x x x x x

Pantalla y vistas del editor Verificacin de los resultados de OCR Verificar texto Diccionarios del usuario Capacitacin Edicin de texto e imgenes Edicin inmediata Lectura de texto en voz alta

Gua del usuario de OmniPage SE

67

Pantalla y vistas del editor


El Editor de texto muestra los textos reconocidos y puede marcar las palabras que se consideraron dudosas durante el reconocimiento mediante un subrayado ondulado.
x

Verde Palabras que no estn en el diccionario: stas se reconocieron con confianza, pero no se encontraron en ningn diccionario activo: estndar, del usuario o profesional. Azul Palabras con caracteres dudosos: stas contienen caracteres no reconocidos o son palabras aprobadas por el diccionario que contienen caracteres reconocidos con un menor grado de confianza. Rojo Palabras dudosas: Suelen ser palabras que no estn en el diccionario con uno o ms caracteres dudosos, pero que tambin pueden ser dudosas por otras razones.

Escoja marcar las palabras que no estn en el diccionario o que no estn en el panel Verificacin del cuadro de dilogo opciones. Todos los marcadores pueden aparecer o estar ocultos segn lo que se haya seleccionado en el panel Editor de texto, dentro del cuadro de dilogo Opciones. Tambin podr mostrar u ocultar caracteres no imprimibles e indicadores de encabezado y pie de pgina. El panel Editor de texto tambin permite definir una unidad de medicin para el programa y un parmetro de acomodacin de texto en todas las vistas del Editor de texto salvo en la vista Sin formato. OmniPage SE puede exhibir pginas con tres niveles de formato. Se puede alternar libremente entre ellos con los tres botones de la parte inferior izquierda del Editor de texto o del men Ver. Los grficos y tablas pueden aparecer en todas las vistas. A continuacin se mencionan las principales diferencias entre las vistas: Vista Sin formato Muestra el texto normal sin columnas y alineado en la izquierda con un solo tipo y tamao de fuente, con los mismos saltos de lnea que el documento original. La mayora de los botones de formato y cuadros de dilogo estn desactivados. Tampoco se ven las reglas. Esta vista puede resultar prctica para verificar y editar el texto. Vista Mantener fuentes y prrafos Muestra pantallas con texto sin columnas y con estilo de fuente y prrafo. Aparece la regla horizontal. Esta vista puede resultar prctica para verificar, editar y modificar el texto junto con su estilo. Vista True Page La vista True Page trata de conservar lo ms posible el formato del documento original. Se mantienen los estilos de caracteres y prrafo. Todos los elementos de

68

Verificacin y edicin

Captulo 4

las pginas, incluyendo las columnas, se colocan en cuadros y marcos. El orden de lectura se puede ver mediante flechas. Consulte la pgina 77. El nivel de formato para la exportacin se escoge en forma independiente al momento de exportar.

Verificacin de los resultados de OCR


Tras el reconocimiento de una pgina, los resultados aparecern en el Editor de texto. La verificacin comienza automticamente si se solicit en el panel Verificacin del cuadro de dilogo Opciones en el Asistente de OCR. Se puede comenzar la verificacin manualmente en cualquier momento. Funciona de la siguiente manera: 1. Haga clic en la herramienta Verificar OCR en la barra de herramientas Estndar o, bien, seleccione Verificar OCR... en el men Herramientas. 2. La verificacin se inicia al comienzo del documento, pero se salta el texto ya revisado. Si se detecta un posible error, el cuadro de dilogo Verificador de OCR colorear la palabra dudosa en su contexto, y proporcionar una imagen del aspecto original en la imagen.
Esto indica por qu se marca la palabra. Panel Editar: La palabra marcada se muestra en el color de su marcador: rojo, azul o verde.

La imagen de la palabra dudosa aparece resaltada.

Esta ventana muestra la parte pertinente de la imagen original. Haga clic dentro de ella para agrandar o reducir la pantalla.

Arrastre una esquina o la parte inferior del cuadro de dilogo para cambiar su tamao.

3. Si la palabra reconocida es correcta, haga clic en Ignorar o Ignorar todo para pasar a la siguiente palabra dudosa. Haga clic en Agregar para aadirla al diccionario actual del usuario y pasar a la siguiente palabra dudosa.

Verificacin de los resultados de OCR

69

4. Si la palabra reconocida no es correcta, modifquela en el panel Editar o seleccione una sugerencia del diccionario. Haga clic en Cambiar o en Cambiar todo para que el cambio surta efecto y poder pasar a la palabra dudosa siguiente. Haga clic en Agregar para aadir la palabra cambiada al diccionario actual del usuario y pasar a la siguiente palabra dudosa. 5. Los marcadores de color se eliminan de las palabras en el Editor de texto a medida que son verificadas. Podr pasar al Editor de texto durante la verificacin para hacer las correcciones all. Utilice el botn Continuar para reiniciar la verificacin. Haga clic en Cerrar para detener la verificacin antes de llegar al final del documento.
Si la verificacin se ejecut hasta el final de una pgina, sta se marca con el icono de verificacin en su miniatura y en el Administrador de documentos.

Si los marcadores estaban ocultos en el Editor de texto al iniciarse la verificacin, o si se escoge Buscar siguiente duda, los marcadores se pueden apreciar y permanecen a la vista despus de la verificacin. Si est desactivada la opcin Marcar palabras que no estn en el diccionario en el panel Verificacin del cuadro de dilogo Opciones, la verificacin se detendr slo en las palabras marcadas con rojo o azul, y no en las palabras que no estn en el diccionario. Esto es muy til al revisar pginas con muchas palabras que no estn en el diccionario, tales como catlogos de productos que contengan cdigos, y bibliografas que contengan muchos nombres propios. Utilice la opcin Volver a revisar la pgina actual en el men Herramientas para ejecutar una nueva revisin ortogrfica en una pgina que ya se haya revisado. Hgalo para revisar palabras escritas o pegadas en el Editor de texto tras efectuar la verificacin. Esto funciona incluso si la opcin Marcar palabras que no estn en el diccionario est desactivada en el panel Verificacin.

Verificar texto
Tras efectuar el OCR, podr comparar cualquier parte del texto reconocido con su correspondiente en la imagen original a fin de verificar que el texto se haya reconocido correctamente. Funciona de la siguiente manera:

70

Verificacin y edicin

Captulo 4

Para hacer esto:


Activar el verificador Desactivar el verificador Activar/desactivar temporalmente el verificador Mostrar el verificador hasta que se pulse la prxima tecla Acercar pantalla Alejar la pantalla Hacer el verificador dinmico o acoplado/ desplazable Contexto dinmico (desplazarse por 3 valores)

Utilice lo siguiente:
F9 o herramienta de verificacin Esc o F9 o la herramienta de verificacin F8: pulsar sin soltar Hacer doble clic en una palabra Alt + Num + o hacer clic en el verificador Alt + Num + o hacer clic en el verificador Alt + Num / Alt + Num /

La herramienta de verificacin est en la barra de herramientas de formato. El verificador tambin se puede controlar desde el men Herramientas. Pose el cursor sobre una pantalla del verificador para invocar la barra de herramientas del verificador. Utilcela de la siguiente manera:
Herramienta de verificacin (activar/desactivar)

Arrastre entre el desplazamiento y el acoplamiento

para desplazar o acoplar (vuelve al ltimo estado) Cunto contexto para el verificador dinmico? una palabra tres palabras (la actual + 2 vecinas) lnea de toda la imagen a dinmico

Barra de herramientas del verificador: acercar/alejar

Editor de texto

Verificar texto

71

Deber verificar el texto antes de volver a editar a gran escala. Si corta y pega grandes bloques de texto, se pueden alterar los vnculos entre el texto e imagen. Podr utilizar la funcin de texto a lenguaje de OmniPage Pro 12 para que el texto reconocido se lea en voz alta como otra manera de verificarlo. Podr escuchar el texto letra por letra, palabra por palabra, lnea por lnea, oracin por oracin o en pginas completas. Consulte la seccin Lectura de texto en voz alta en la pgina 80. Esta caracterstica no est disponible en OmniPage SE.

Diccionarios del usuario


El programa contiene diccionarios incorporados para numerosos idiomas. Estos diccionarios ayudan al reconocimiento y pueden ofrecer sugerencias durante la verificacin. Pueden ser complementados por otros diccionarios del usuario. Podr guardar la cantidad de diccionarios del usuario que desee, pero podr cargar slo uno a la vez. Tambin estn disponibles los diccionarios del usuario de Microsoft Word; el diccionario denominado Personalizado es el predeterminado para Microsoft Word. Iniciar un diccionario del usuario Haga clic en Agregar en el cuadro de dilogo Verificador de OCR sin tener cargado ningn diccionario del usuario ni haber abierto el cuadro de dilogo Archivos del diccionario del usuario en el men Herramientas y, luego, haga clic en Nuevo. Se le solicitar que nombre el diccionario de inmediato. Cargar o descargar un diccionario del usuario Esto se realiza en el panel OCR del cuadro de dilogo Opciones o desde el cuadro de dilogo Archivos del diccionario del usuario. Seleccione un archivo de diccionario para cargarlo o, bien, [ninguno] para descargar un diccionario del usuario. Editar o eliminar un diccionario del usuario Para aadir palabras debe cargar un diccionario del usuario y luego hacer clic en Agregar en el Verificador de OCR. Podr agregar y eliminar palabras haciendo clic en Editar en el cuadro de dilogo Archivos del diccionario del usuario. El botn Eliminar permite suprimir el diccionario del usuario seleccionado.
Al editar un diccionario del usuario, podr importar una lista de palabras desde un archivo de texto normal para agregar palabras rpidamente al diccionario. Cada palabra debe estar en una lnea independiente y carecer de puntuacin tanto al comienzo como al final.

72

Verificacin y edicin

Captulo 4

OmniPage Pro 12 ofrece diccionarios especializados para ciertas profesiones (por el momento, diccionarios legales y mdicos) en algunos idiomas. stos diccionarios no estn disponibles en OmniPage SE.
El programa identifica el idioma del texto reconocido y lo muestra en la barra de estado. Esta marca de idioma se exporta con el documento. Utilice Definir idioma... en el men Herramientas para cambiar la marca del idioma del texto seleccionado. Esto no cambia el o los idiomas del reconocimiento.

Capacitacin
OmniPage SE no es compatible con las funcines capacitacin y IntelliTrain ni con los archivos de capacitacin. Estas caractersticas slo estn disponibles en OmniPage Pro 12. Al abrir un archivo OPD, OmniPage SE pasa por alto cualquier informacin de capacitacin incluida el archivo. La capacitacin es el proceso de cambio de las soluciones de OCR asignadas a las formas de caracteres en la imagen. Es muy til para documentos en mal estado o cuando se usa un tipo de letra poco comn en todo el documento. La capacitacin ser menos til para textos con distorsiones espordicas. A continuacin aparece un ejemplo, basado en la letra g, que se puede imprimir de diferentes maneras:

Los primeros dos ejemplos no requieren de capacitacin, ya que ambas formas son normales para la letra g y el programa las puede manejar. En el tercer ejemplo se podra aprovechar la capacitacin ya que la forma de la g es poco comn, y es probable que todas las veces que aparezca la g en el texto se parezcan a sta. El cuarto ejemplo no es bueno para el uso de la capacitacin, ya que la primera g no est bien impresa, y es poco probable que aparezca esa forma nuevamente en el documento. Puede utilizar la capacitacin para mejorar el reconocimiento de smbolos especiales tales como @, y o, bien, para reconocer letras acentuadas de manera ms fiable. El objetivo de la capacitacin no es ensearle al programa a leer caracteres de idiomas o alfabetos no compatibles. OmniPage Pro 12 ofrece dos tipos de capacitacin: la capacitacin manual y la automtica (IntelliTrain). Los datos provenientes de ambos tipos de

Capacitacin

73

capacitacin se combinan y se ofrecen para guardarlos en un archivo de capacitacin. Al salir de una pgina en la cual se generaron datos de capacitacin, se le consultar cmo aplicarlos a otras pginas existentes en el documento.

Capacitacin manual
Para efectuar la capacitacin manual, coloque el punto de insercin en la parte delantera del carcter que desea capacitar o seleccione un grupo de caracteres (hasta una palabra) y escoja Carcter de capacitacin... en el men Herramientas o el men rpido. Aparecer una vista ampliada de los caracteres que se capacitarn, junto con la solucin de OCR actual. Cambie esto a la solucin deseada y haga clic en Aceptar. El programa tomar esta capacitacin y examinar el resto de la pgina. Si encuentra posibles palabras que cambiar, stas aparecern en el cuadro de dilogo Revisar capacitacin. Las palabras incorrectas se deben capacitar antes de que se apruebe la lista. Para obtener informacin sobre el uso de los cuadros de dilogo Carcter de capacitacin y Revisar capacitacin, consulte su ayuda contextual respectiva o el tema Capacitacin manual en la ayuda en lnea y sus temas relacionados.

IntelliTrain
IntelliTrain es una forma automatizada de capacitacin. Analiza las correcciones que usted haga durante la verificacin. Cuando haga un cambio, esta funcin recordar la forma del carcter en cuestin y el cambio en la verificacin. Buscar otras formas de caracteres similares en el documento, especialmente en palabras dudosas; y evaluar si corresponde aplicar la correccin del usuario. Puede activar o desactivar IntelliTrain en el panel de OCR en el cuadro de dilogo Opciones. El siguiente ejemplo muestra cmo funciona IntelliTrain, utilizando la imagen original. En nuestro ejemplo se utilizan las letras c y e. Con algunos tipos de letra y parmetros de exploracin, la lnea horizontal en la e puede quedar muy delgada, induciendo a OCR a cometer errores que IntelliTrain puede reparar.

74

Verificacin y edicin

Captulo 4

OmniPage Pro leer esta palabra como rcsultados. Usted la cambi durante la verificacin a resultados.

IntelliTrain recordar esta forma y la regla:

Esta no es una c. Es una e.

IntelliTrain cambiar:

sobrc a sobre rccicntcs a recientes sclcccin a seleccin,


etc.

IntelliTrain recuerda los datos de capacitacin que recopila, y los agrega a toda capacitacin manual que usted haya hecho. Esta capacitacin se puede guardar en un archivo de capacitacin para uso futuro con documentos similares.

Archivos de capacitacin
Si desea que se le consulte si desea guardar los datos de capacitacin al cerrar el documento, seleccione dicha opcin en el panel Verificacin del cuadro de dilogo Opciones. Los datos de capacitacin no guardados se almacenan en un documento de OmniPage. Si no guarda el documento como OPD, la capacitacin no guardada se desechar cuando se cierre el documento. Las operaciones para guardar la capacitacin en un archivo, as como cargar, editar y descargar archivos de capacitacin se efectan en el cuadro de dilogo Archivos de capacitacin. bralo en el panel Verificacin del cuadro de dilogo Opciones o el men Herramientas.

Capacitacin

75

Seleccione esta opcin, haga clic en Guardar y escriba un nombre para guardar un nuevo archivo de capacitacin. Seleccione esta opcin para descargar un archivo de capacitacin.

Haga clic aqu para editar el archivo de capacitacin seleccionado en el cuadro de dilogo Editar capacitacin. Utilice esta opcin para guardar la nueva capacitacin en un archivo de capacitacin cargado. Aparecer como: <Nombre del archivo> [modificado]

Los datos de capacitacin no guardados se pueden editar en el cuadro de dilogo Editar capacitacin; aparecer un asterisco en la barra de ttulo en vez del nombre del archivo de capacitacin. Permanecer sin guardar cuando cierre el cuadro de dilogo Editar capacitacin. Gurdelo en el cuadro de dilogo Archivos de capacitacin. Un archivo de capacitacin tambin se puede editar; su nombre aparecer en la barra de ttulo. Si se le han agregado datos de capacitacin sin guardar, aparecer un asterisco a continuacin de su nombre. Tanto los datos de capacitacin no guardados como los modificados se guardarn al cerrar el cuadro de dilogo. El cuadro de dilogo Editar capacitacin muestra marcos que contienen la forma de un carcter y una solucin de OCR asignada a dicha forma. Haga clic en un marco para seleccionarlo. Luego podr suprimirlo con la tecla Eliminar o, bien, cambiar la asignacin. Utilice las teclas de direccin para pasar al marco siguiente o al anterior.
Est editando los datos de capacitacin no guardados. Este marco aparece en gris. Significa que se ha eliminado. Para recuperarlo, seleccinelo nuevamente y pulse la tecla Eliminar. Los caracteres marcados como eliminados se borrarn efectivamente al cerrar el cuadro de dilogo.

Haga doble clic en un marco o pulse Intro para cambiar su solucin OCR. Introduzca la nueva solucin en el cuadro de texto que aparece y pulse Intro. Las asignaciones cambiadas aparecern en rojo. Este marco est seleccionado. En la parte superior aparece la forma tomada de la imagen. En la parte inferior aparece la solucin de OCR asignada.

76

Verificacin y edicin

Captulo 4

Edicin de texto e imgenes


OmniPage SE tiene un Editor de texto tipo WYSIWYG (lo que se ve es lo que se obtiene), el cual proporciona muchas funciones de edicin. stas funcionan de manera muy similar a las de los principales procesadores de texto. Editar atributos de caracteres En todas las vistas, salvo en Sin formato, es posible cambiar el tipo, tamao y atributos de fuente (negrita, cursiva, subrayado) del texto seleccionado. Utilice la barra de herramientas de formato o el cuadro de dilogo Fuente en el men Formato. Este ltimo tambin ofrece caracteres de subndice, superndice, as como texto o fondo en color. En la vista Sin formato, utilice la barra de herramientas de formato para especificar un tipo y tamao de fuente y aplicarla a todo el documento. Esto no se utiliza para exportar ni transferir a otras vistas, sino que se restauran sus parmetros anteriores. Abra el cuadro de dilogo Coincidencia de fuentes en el panel OCR del cuadro de dilogo Opciones antes de efectuar el OCR, para especificar qu fuentes se usarn en los textos que se introduzcan en el Editor de texto. Editar atributos de prrafo En todas las vistas salvo en la Sin formato, podr cambiar el alineamiento de los prrafos seleccionados y aplicar vietas a los prrafos. Utilice la barra de herramientas de formato o el cuadro de dilogo Prrafo en el men Formato. Este ltimo permite modificar sangras, espaciado entre lneas y entre prrafos. La regla horizontal del Editor de texto permite definir fcilmente las posiciones de sangras y tabuladores. Los ajustes avanzados de tabulacin se efectan en el cuadro de dilogo Tabuladores en el men Formato. Estilos de prrafo Los estilos de prrafo se detectan automticamente durante el reconocimiento. En un cuadro de seleccin situado a la izquierda de la barra de herramientas de formato se acumula y presenta una lista de estilos. Utilcela para asignar un estilo a los prrafos seleccionados. Utilice el cuadro de dilogo Estilo del men Formato para cambiar de nombre o modificar un estilo y definir otro nuevo. Al guardar un documento en un archivo, podr elegir si exportar los estilos de prrafo con el documento. Esto es vlido slo si la aplicacin de destino es compatible con los estilos de prrafo. Grficos Podr editar el contenido de una zona de grfico seleccionado si cuenta con un editor de imgenes en su equipo. Haga clic en Editar imagen en el men Herramientas. Esto activar el editor de imgenes asociado con los archivos BMP en su sistema Windows y cargar el grfico. Edite el grfico y luego cierre el editor para volver a incrustar la imagen en el Editor de texto. No cambie el tamao del grfico ni su resolucin o tipo, ya que esto impedir la reincrustacin.

Edicin de texto e imgenes

77

Tablas Las tablas aparecen en el Editor de texto en forma de cuadrculas. Mueva el cursor al rea de una tabla. Cambiar su aspecto, permitindole mover las lneas de las cuadrculas. Tambin podr usar las reglas del Editor de texto para modificar una tabla. Modifique la colocacin de texto en las celdas con los botones de alineacin de la barra de herramientas de formato y los controles de tabulacin de la regla. Al guardar el documento en algunos tipos de archivo, podr elegir si va a exportar las tablas en cuadrculas o como columnas separadas por tabuladores o por espacios. Hipervnculos Las direcciones de pginas Web y de correo electrnico se pueden detectar y colocar como vnculos en el texto reconocido. Escoja Hipervnculo... en el men Formato para editar un vnculo existente o crear uno nuevo. Un nuevo vnculo puede ser a una pgina Web o a un archivo. Utilice un men de acceso rpido para eliminar un vnculo. Editar en True Page Los elementos de pginas estn contenidos en los cuadros de texto, de imagen y de tabla. stos generalmente corresponden a zonas de texto, de tabla y grficos en la imagen. Haga clic dentro de un elemento para ver el borde de la imagen; los elementos tienen los mismos colores que las zonas correspondientes. En el tema True Page de la ayuda en lnea encontrar detalles sobres las operaciones que aqu se resumen. Los marcos tienen bordes grises y encierran uno o ms cuadros. Se colocan cuando se detecta un borde visible en una imagen. Para dar formato al marco y a los bordes y sombreado de la tabla, utilice un men rpido o escoja Tabla... en el men Formato. El sombreado del cuadro de texto se puede especificar desde su men rpido. Para invocar un men rpido, haga clic con el botn derecho del ratn dentro de un elemento lejos de la palabra marcada. Las reas de varias columnas tienen bordes rosados y encierran uno o ms cuadros. Se detectan automticamente y muestran cul es el texto que se tratar como columna al exportar. Utilice mens rpidos para desagrupar reas y marcos de varias columnas, permitiendo la modificacin de sus elementos. Tambin puede agrupar elementos en marcos o reas de varias columnas. La opcin Orden de lectura se puede ver y cambiar. Haga clic en la herramienta Mostrar orden de lectura en la barra de herramientas de Formato para que el orden aparezca indicado mediante flechas. Haga clic nuevamente para quitar las flechas. Haga clic en la herramienta Cambiar orden de lectura para un conjunto de botones de reordenamiento en lugar de la barra de herramientas de formato. La ayuda contextual explica su uso, as como el Orden de lectura en la Ayuda en lnea. En las vistas NF y RFP se aplica un cambio de orden. Modifica la forma en que el cursor se mueve a travs de una pgina cuando se exporta como True Page.

78

Verificacin y edicin

Captulo 4

Edicin inmediata
Esto permite modificar una pgina reconocida mediante la nueva separacin de zonas, sin tener que volver a procesar toda la pgina. Cuando est habilitada la edicin inmediata, los cambios de zona (eliminacin, dibujo, cambio de tamao y de tipo) surten efecto inmediatamente en la pgina reconocida. Por el contrario, cuando modifique elementos en la vista True Page en el Editor de texto, esto cambia las zonas en dicha pgina. La separacin inmediata de zonas tambin se puede utilizar con las pginas no reconocidas. Dos herramientas vinculadas en la barra de herramientas Imagen controlan la separacin inmediata de zonas. Una de estas herramientas siempre est activa cada vez que no se est efectuando el reconocimiento. Haga clic aqu para activar la edicin inmediata. La seal roja muestra que no hay cambios almacenados en la separacin de zonas. Haga clic aqu para desactivar la edicin inmediata. Los cambios en la separacin de zonas se almacenan y las herramientas inmediatas exhiben una seal verde para mostrar que hay cambios almacenados. Para activar estos cambios, lleve a cabo uno de los siguientes procedimientos: Haga clic en la herramienta inmediata con una seal verde. Los cambios en la separacin de zonas surtirn su efecto en el Editor de texto. Haga clic en el botn Realizar OCR para que se vuelva a reconocer toda la pgina, incluyendo sus cambios de zona. Para obtener detalles sobre cmo se manipulan los cambios en la separacin inmediata de zonas y cmo esto afecta a las vistas del Editor de texto, consulte la seccin Procesamiento inmediato en la Ayuda en lnea.

Edicin inmediata

79

Lectura de texto en voz alta


La facilidad de lectura en voz alta no est incluida en OmniPage SE. Est disponible en OmniPage Pro 12. Esta funcin de lenguaje est diseada para discapacitados visuales, pero tambin puede ser muy til para cualquier persona durante la revisin y verificacin de texto. El habla se controla mediante movimientos del punto de insercin en el Editor de texto, ya sea mediante el ratn o el teclado.

Para escuchar texto:


Un carcter a la vez, hacia adelante o hacia atrs Palabra actual Una palabra a la derecha Una palabra a la izquierda Una sola lnea Lnea siguiente Lnea anterior Oracin actual Desde el punto de insercin al final de la oracin Desde el inicio de la oracin al punto de insercin Pgina actual Desde el inicio de la pgina al punto de insercin Desde el punto de insercin al final de la pgina actual Pgina anterior, siguiente o cualquier otra Caracteres mecanografiados

Utilice estas teclas:


Flecha derecha o izquierda. Se nombran las letras, nmeros o signos de puntuacin. Ctrl + 1 teclado numrico Ctrl + flecha derecha Ctrl + flecha izquierda Coloque el punto de insercin en la lnea Flecha abajo Flecha arriba Ctrl 2 teclado numrico Ctrl 6 teclado numrico Ctrl 4 teclado numrico Ctrl 3 teclado numrico Ctrl + Inicio Ctrl + Fin Ctrl + RePg, AvPg o botones de navegacin Cada carcter mecanografiado se pronuncia, uno por uno, incluyendo la puntuacin.

La funcin de texto a lenguaje se activa o desactiva en el elemento Modo de lenguaje hablado del men Herramientas o con la tecla F5. Un segundo elemento de men Parmetros de lenguaje hablado... permite seleccionar una voz (por ejemplo, hombre o mujer para un determinado idioma), una velocidad de lectura y el volumen.

80

Verificacin y edicin

Captulo 4

Las tres teclas bsicas para el lenguaje hablado estn juntas en el teclado numrico.

1
Leer palabra actual

2
Leer oracin actual

3
Leer pgina actual

Tambin contar con los siguientes controles de teclado:

Para hacer esto:


Pausa/Reanudar Aumentar la velocidad Disminuir velocidad Restablecer velocidad

Utilice lo siguiente:
Ctrl 5 teclado numrico Ctrl + signo + teclado numrico Ctrl + signo - teclado numrico Ctrl + * teclado numrico

Se tiene pensado proporcionar programas de lenguaje hablado para los siguientes idiomas: Ingls, francs, alemn, italiano, portugus y espaol. En el archivo Lame encontrar la informacin ms reciente. Slo se instalar un sistema de lenguaje hablado en OmniPage Pro, dependiendo del idioma elegido al comienzo de la instalacin. Si especifica un idioma que no disponga de un sistema de lenguaje hablado, se instalar el ingls. Si en su equipo tiene sistemas de lenguaje compatibles con SAPI para otros idiomas, stos sern detectados y quedarn disponibles para su uso. Sus voces quedarn disponibles en el cuadro de dilogo Parmetros de lenguaje hablado. Una vez que ha asociado una voz con un idioma, OmniPage Pro lo recordar y cambiar las voces segn el idioma de reconocimiento del documento.

Lectura de texto en voz alta

81

82

Verificacin y edicin

Captulo 5

Guardar y exportar
Una vez que haya obtenido por lo menos una imagen para un documento, podr exportarla a un archivo. Una vez que ha reconocido por lo menos una pgina, podr exportar los resultados del reconocimiento una sola pgina, pginas seleccionadas o todo el documento a una aplicacin de destino, para lo cual debe guardarlas en un archivo, copiarlas al Portapapeles o enviarlas a una aplicacin de correo. Siempre es posible guardar como documento de OmniPage. Este captulo presenta los siguientes temas:
x x

x x

Guardar imgenes originales Guardar los resultados del reconocimiento Guardar un documento mientras trabaja Seleccionar un nivel de archivo Seleccionar opciones avanzadas de guardar Guardar en PDF Copiar pginas al Portapapeles Enviar pginas por correo

Un documento permanece en OmniPage SE tras la exportacin. Esto permite guardar, copiar o enviar sus pginas varias veces; por ejemplo, con diferentes niveles de formato, utilizando diferentes tipos de archivos, nombres o ubicaciones. Tambin podr agregar o volver a reconocer las pginas o modificar el texto ya reconocido. Con el procesamiento automtico y utilizando el Asistente de OCR, usted especifica el primer destino donde se guardar el archivo antes de comenzar dicho proceso. Cuando se reconoce (o se verifica, si ello fue solicitado) la ltima pgina disponible, aparece un cuadro de dilogo de exportacin. Podr especificar la exportacin en cualquier momento en que no est ocupando el programa. Si solicita exportar un documento con pginas no reconocidas, se le

Gua del usuario de OmniPage SE

83

consultar si primero desea reconocerlas. Si su respuesta es No, slo se exportarn los resultados de las pginas reconocidas. Si se han modificado zonas en las pginas reconocidas, se le solicitar que vuelva a reconocer dichas pginas antes de exportar.

Guardar imgenes originales


Podr guardar imgenes originales en el disco en una gran variedad de tipos de archivos. Consulte Tipos de archivos para abrir y guardar imgenes en la pgina 101. 1. Seleccione Guardar imagen... en el men Archivo. En el cuadro de dilogo que aparece, seleccione la ubicacin de la carpeta y un tipo de archivo para las imgenes. Escriba un nombre de archivo. 2. Seleccione guardar slo la imagen de la zona actual, la imagen de la pgina actual, las imgenes de las pginas seleccionadas o todas las imgenes en el documento. En los ltimos dos casos puede guardar todas las imgenes en un solo archivo de imagen de varias pginas, siempre y cuando elija TIFF, MAX o DCX como tipo de archivo. De lo contrario cada imagen se colocar en un archivo independiente. OmniPage SE agregar sufijos numricos al nombre de archivo que se proporcione, para generar nombres de archivo exclusivos. 3. Haga clic en Aceptar para guardar las imgenes segn se especifique. Las zonas y el texto reconocidos no se guardan con el archivo. Si es posible, el archivo se guarda tal como se ve: es decir, en blanco y negro, escala de grises o en color. Las imgenes en blanco y negro se guardan con su resolucin original. Las imgenes en escala de grises y en color se reducen aproximadamente a 150 ppp.

Para ver el tamao y la resolucin original de una imagen, pose el cursor sobre su miniatura en el Panel de imgenes. En OmniPage Pro puede guardar el documento con cinco variantes de PDF. Dos de stas guardan las imgenes originales, las dems guardan los resultados del reconocimiento. Consulte las prximas secciones. Guardar a PDF no est disponible en OmniPage SE.

84

Guardar y exportar

Captulo 5

Guardar los resultados del reconocimiento


Podr guardar pginas reconocidas en el disco en una gran variedad de tipos de archivos. Consulte Tipos de archivos para guardar los resultados del reconocimiento en la pgina 102. 1. Seleccione Guardar como... en el men Archivo o, bien, haga clic en el botn Exportar resultados en la Caja de herramientas de OmniPage con la opcin Guardar como archivo seleccionada en la lista desplegable. 2. Aparecer el cuadro de dilogo Guardar como, tal como se indica en su forma expandida.

Seleccione esta opcin para abrir automticamente el archivo guardado en su aplicacin de destino. Posibles alternativas: Todas las pginas Pgina actual Pginas seleccionadas Seleccione las pginas con miniaturas o en el Administrador de documentos.

Haga clic en Avanzadas para abrir el panel inferior y en Bsicas para cerrarlo. Haga clic aqu para ver y cambiar las opciones de salida del tipo de archivo actual. Posibles alternativas: Crear un solo archivo para todas las pginas Crear un archivo por pgina Crear un archivo nuevo despus de cada pgina en blanco Crear un archivo nuevo para cada archivo de imagen

3. Seleccione una ubicacin de carpeta y un tipo de archivo para el documento. El tipo de archivo OPD especial es el ltimo en la lista de tipos de archivo. Luego seleccione el nivel de formato para el documento. Consulte Seleccionar un nivel de archivo en la pgina 87.

Guardar los resultados del reconocimiento

85

4. Escriba un nombre de archivo. Haga clic en el botn Avanzadas si desea especificar un rango de pginas, una opcin de separacin de archivo u otras opciones de guardar. Seleccione la opcin deseada. Consulte Seleccionar opciones avanzadas de guardar en la pgina 88. 5. Haga clic en Aceptar. El documento se guardar en el disco segn se especifique. Si se selecciona Guardar e iniciar, el archivo exportado aparecer en la aplicacin de destino, que es la asociada con el tipo de archivo seleccionado en su sistema Windows o en las opciones de guardar avanzadas del convertidor del tipo de archivo seleccionado.

Los grficos, cuadrculas de tablas y otras propiedades se guardan en el documento slo si el tipo de archivo seleccionado es compatible con ellas, y si se especifica su retencin en los parmetros avanzados (Opciones de convertidor) para el tipo de archivo actual. Si se crea ms de un archivo de exportacin, OmniPage SE agregar sufijos numricos al nombre de archivo a fin de crear nombres de archivo exclusivos. Si selecciona Crear un archivo nuevo despus de cada pgina en blanco con una entrada de archivos de imagen, puede colocar archivos de imgenes en blanco en el documento. Consulte Entrada desde archivos de imagen en la pgina 50. Si selecciona Crear un nuevo archivo para cada archivo de imagen, no se requiere un nombre de archivo. Cada archivo de salida recibir el nombre del archivo de entrada que lo gener y cambiar slo su extensin.

Guardar un documento mientras trabaja


Haga clic en la herramienta Guardar en la barra de herramientas Estndar o, bien, seleccione Guardar en el men Archivo para guardar los cambios en el documento actual mientras trabaja. Si lo hace con un documento sin ttulo, aparecer el cuadro de dilogo Guardar como. Con un documento con nombre, el comando Guardar lo almacena con el nombre y tipo de archivo de la ltima vez que se guard, tal como se aprecia en la barra de ttulo. stos aparecen slo si se ha guardado todo el documento. Si el documento se guard la ltima vez como documento de OmniPage, el comando para guardar lo actualizar: se guardarn las imgenes nuevas o cambiadas, la separacin de zonas modificada, los resultados del reconocimiento y los datos de capacitacin. Si el documento se guard por ltima vez como cualquier otro tipo de archivo, slo se guardarn los cambios de los resultados del reconocimiento. Las referencias a la capacitacin no son aplicables a OmniPage SE.

86

Guardar y exportar

Captulo 5

Si desea trabajar nuevamente con su documento en OmniPage SE en una sesin futura, gurdelo como documento de OmniPage. Este es un tipo especial de archivo de salida. Guarda las imgenes originales del archivo junto con los resultados del reconocimiento, los parmetros y los datos de capacitacin. Consulte Documentos de OmniPage en la pgina 31. El cuadro de dilogo Guardar como muestra los tipos de archivo disponibles en la lista desplegable Guardar como archivo de tipo. El documento de OmniPage es el ltimo formato de esa lista. Si guarda el documento por primera vez como documento de OmniPage (por ejemplo, llamndolo memo.opd), lo puede modificar guardndolo posteriormente como archivo de texto (por ejemplo, memo.txt), y volver a hacerle cambios, para luego hacer clic en Guardar; los cambios recientes se guardarn en el archivo memo.txt, no en el archivo OPD. Al cerrar el documento o salir del programa, se le solicitar que guarde el documento si no lo ha guardado como un documento de OmniPage, o si hay cambios desde la ltima vez que lo almacen como OPD.

Seleccionar un nivel de archivo


El nivel de formato de la exportacin se define al momento de exportar, en los cuadros de dilogo Guardar como, Copiar al Portapapeles o Enviar como correo. Tres de los niveles corresponden a las vistas de formato homnimas en el Editor de texto. Sin embargo, el nivel que se ha de aplicar al guardar es independiente de la vista de formato que se aprecia en el Editor de texto. Al exportar a un archivo o correo, primero especifique un tipo de archivo. Esto determina cules niveles de formato estn disponibles. Esto se resume en una tabla del Captulo 6. Consulte Tipos de archivos para guardar los resultados del reconocimiento en la pgina 102. Los niveles de formato son los siguientes: Sin formato (NF) Esto exporta el texto normal sin columnas y alineado a la izquierda, con un solo tipo y tamao de fuente. Al exportar a tipos de archivo de texto o Unicode, no se permite el uso de grficos ni tablas. Puede exportar texto normal a prcticamente todos los tipos de archivo y aplicaciones de destino; en estos casos se pueden conservar grficos, tablas y vietas. Mantener fuentes y prrafos (RFP) Sirve para exportar el texto sin columnas con el estilo de fuente y prrafo, junto con grficos y tablas. Esta opcin est disponible para prcticamente todos los tipos de archivos.

Guardar los resultados del reconocimiento

87

Flujo de pginas (FP) Esta opcin mantiene el diseo original de las pginas, incluyendo las columnas. Esto se efecta cada vez que es posible con parmetros de columnas y sangras, no con cuadros de texto ni marcos. El texto fluir de una columna a otra, lo que no ocurre cuando se utilizan cuadros de texto. OmniPage SE no permite la salida de flujo de pginas. Esta funcionalidad slo est disponible en OmniPage Pro. True Page (TP) Esta opcin mantiene el diseo original de las pginas, incluyendo las columnas, y se efecta con cuadros y marcos de texto, imagen y tabla. Se ofrece slo para aplicaciones de destino que sean compatibles con estas caractersticas. Hoja de clculo Esta opcin sirve para exportar los resultados del reconocimiento en formato de tabla, adecuado para usar en aplicaciones de hoja de clculo. La eliminacin de las columnas en la exportacin NF y RFP se efecta de izquierda a derecha y de arriba hacia abajo:
Pgina original Resultado sin columnas

Antes de la exportacin, revise en la vista NF o RFP que el orden sin columnas de los elementos sea correcto. De no serlo, cambie a la vista True Page y haga clic en la herramienta Mostrar orden de lectura para que aparezca el orden de lectura mediante flechas. Utilice la herramienta Cambiar orden de lectura para especificar un orden distinto. Las reas de varias columnas muestran cules de ellas estn vinculadas. Si este vnculo no es adecuado, desagrupe el rea y cambie el orden de los elementos encerrados.

Seleccionar opciones avanzadas de guardar


Haga clic en el botn Opciones del convertidor en la parte avanzada del cuadro de dilogo Guardar como para tener un control preciso de la exportacin. Esto invoca un cuadro de dilogo con el nombre del tipo de archivo actual. Presenta una serie de opciones diseadas para este tipo de archivo. Primero, confirme o cambie el nivel de formato, porque influye en qu otras opciones se presentan. Seleccione las opciones deseadas. Este procedimiento se describe detalladamente en la Ayuda en lnea.

88

Guardar y exportar

Captulo 5

Haga clic en Aplicar para que los nuevos parmetros surtan efecto slo en la grabacin actual. Haga clic en Predeterminados para que toda la configuracin vuelva a los valores predeterminados del tipo de archivo actual. Haga clic en guardar para aplicar los parmetros cambiados a la grabacin actual y tambin se almacenen como parmetros que se han de aplicar a futuro cada vez que se seleccione este tipo de archivo nuevamente para guardarlo.

El programa asociado actualmente con el tipo de archivo escogido para la caracterstica Guardar e iniciar aparece en la parte inferior del cuadro de dilogo. Haga clic en el botn de los tres puntos para especificar un programa distinto. Para crear su propio convertidor personalizado, prepare los parmetros, haga clic en Nuevo convertidor, proporcione un nombre y luego haga clic en Aceptar. Alternativamente, nombre primero el convertidor, luego cambie los parmetros y despus haga clic en Guardar. Los convertidores personalizados son muy tiles para tareas repetidas como, por ejemplo, para publicar una revista semanal. Luego todas las pginas reconocidas se podrn exportar con su formato diseado para su uso especfico. Tambin puede crear un conjunto de convertidores personalizados para un tipo de archivo determinado que defina las opciones de guardar para cada nivel de formato de salida, por ejemplo: RTF sin formato, RTF mantener fuentes y prrafos y RTF True Page. Usted puede cambiar las opciones de convertidor sin guardar nada en un archivo. Abra el cuadro de dilogo Convertidores de exportacin en el men Herramientas. Seleccione el convertidor deseado y haga clic en el botn Opciones. En este caso, el botn Aplicar no est disponible.

Guardar los resultados del reconocimiento

89

Guardar en PDF
Esta seccin no es aplicable a OmniPage SE. En OmniPage Pro 12 contar con cinco opciones al guardar en archivos de Formato de documento porttil (conocido como PDF). PDF (Normal): Las pginas se exportan tal como aparecieron en el Editor de texto en la vista True Page. Este archivo PDF se puede ver y buscar con el visor de PDF y modificar en un editor de PDF. PDF editado: Utilice esta opcin si ha efectuado cambios de edicin importantes en los resultados del reconocimiento. Usted tiene tres alternativas de niveles de formato, incluyendo True Page. El archivo PDF se puede ver, buscar y editar. PDF con imagen en texto: El archivo PDF slo se puede ver pero no modificar en un editor de PDF. Las imgenes originales se exportan, pero hay un archivo de texto vinculado detrs de cada imagen, de modo que se pueda buscar el texto. La palabra buscada se resalta en la imagen. PDF con sustitutos de imagen: Tal como en el caso de PDF (Normal), pero las palabras que contienen caracteres rechazados y dudosos tienen superposiciones de imagen, de modo que estos caracteres inciertos aparezcan como estaban en el documento original. El archivo PDF se puede ver, buscar y editar. PDF, slo imagen: Se exportan las imgenes originales. El archivo en PDF slo se puede ver pero no modificar en un editor de PDF y tampoco es posible buscar texto.

Copiar pginas al Portapapeles


Usted puede copiar al Portapapeles los resultados del reconocimiento desde la pgina actual, las pginas seleccionadas o todas las pginas del documento. El proceso de copia se indica mediante un monitor que refleja su progreso. Podr pegar el contenido del Portapapeles en otra aplicacin. El formato del texto, como negrita y cursiva, se mantiene al pegar el contenido en otra aplicacin compatible con la informacin RTF 6.0/95. De lo contrario, slo se pegar el texto normal o Unicode. Los grficos se mantienen si la aplicacin es compatible con la insercin de imgenes.

90

Guardar y exportar

Captulo 5

w Para copiar pginas al Portapapeles:

Con el procesamiento automtico, seleccione el parmetro Copiar al Portapapeles de la lista desplegable Exportar resultados en la Caja de herramientas de OmniPage o en el Asistente de OCR. Aparecer el cuadro de dilogo Copiar al Portapapeles apenas se reconozca y verifique la ltima pgina disponible. Con el procesamiento manual, seleccione el parmetro Copiar al Portapapeles en la lista desplegable Exportar resultados y luego haga clic en su botn. Aparecer de inmediato el cuadro de dilogo Copiar al Portapapeles. Especifique un rango y nivel de formato a utilizar y luego haga clic en Aceptar para empezar a copiar.

Usted puede efectuar una operacin de cortar y pegar para la pgina actual mediante el procedimiento de arrastrar y colocar. Pulse sin soltar las teclas Ctrl+Tab a medida que hace clic en la pgina actual en el Panel de imgenes y arrastre el cursor a una aplicacin de destino con un documento abierto. El contenido de la pgina se pegar en el lugar donde se encuentre el cursor. El OCR se ejecuta si es necesario.

Enviar pginas por correo


Podr enviar los resultados del reconocimiento como uno o ms archivos adjuntos a un mensaje de correo electrnico si tiene instalada una aplicacin de correo compatible con MAPI como, por ejemplo, Microsoft Outlook.

w Para enviar pginas por correo electrnico

Con el procesamiento automtico, seleccione el parmetro Enviar como correo en la lista desplegable Exportar resultados de la Caja de herramientas de OmniPage. Aparecer el cuadro de dilogo Enviar como correo apenas se reconozca o verifique la ltima pgina disponible del documento. Con el procesamiento manual, seleccione el parmetro Enviar como correo en la lista desplegable Exportar resultados y luego haga clic en su botn. Aparecer de inmediato el cuadro de dilogo Enviar como correo.

En cualquier momento en que no est ocupado el programa, seleccione Enviar como correo en el men Archivo para invocar el cuadro de dilogo Enviar como correo.

Enviar pginas por correo

91

1. Este cuadro de dilogo permite especificar un tipo de archivo, un rango de pginas, un nivel de formato y las opciones para adjuntar documentos: un adjunto para todas las pginas, un adjunto por cada pgina, un nuevo adjunto cada vez que haya una pgina en blanco o un adjunto por cada archivo de entrada. Fije todas las opciones y haga clic en Aceptar. 2. Regstrese en su aplicacin de correo electrnico si se le solicita hacerlo. 3. La aplicacin de correo aparecer con el documento o documentos adjuntos en un nuevo mensaje vaco. Los adjuntos toman el mismo nombre utilizado la ltima vez que se guard el documento en OmniPage SE o, bien, aparecen como Sin ttulo desde OmniPage. Se agrega la correspondiente extensin de archivo y los sufijos numricos en caso de haber ms de un documento adjunto. 4. Escriba la direccin de destino de su mensaje de correo, agregue texto al mensaje si lo desea y luego haga clic en el botn Enviar.

El programa puede detectar direcciones de correo electrnico a medida que reconoce pginas y las transmite al Editor de texto. Si hace clic en una direccin, su aplicacin de correo aparece con un nuevo mensaje vaco que contiene slo la direccin de correo electrnico.

92

Guardar y exportar

Captulo 6

Informacin tcnica
En este captulo se proporciona informacin sobre resolucin de problemas y dems informacin tcnica acerca del uso de OmniPage SE. Consulte tambin el archivo en lnea Lame y los dems temas de la ayuda o visite las pginas web de ScanSoft. La seccin del escner contiene informacin detallada y actualizada regularmente acerca de la configuracin y respaldo del escner. El archivo Lame contiene la informacin ms reciente acerca de OmniPage SE. Podr acceder al archivo Lame y a las pginas web de ScanSoft mediante el men Ayuda. Este captulo contiene la siguiente informacin:
x

Resolucin de problemas Soluciones iniciales Probar OmniPage SE Aumentar los recursos de memoria Aumentar el espacio de disco El texto no se reconoce correctamente Problemas con el reconocimiento de fax Problemas de sistema o rendimiento durante el OCR Compatibilidad con ODMA Caractersticas avanzadas en Programar OCR Tipos de archivo compatibles Tipos de archivos para abrir y guardar imgenes Tipos de archivos para guardar los resultados del reconocimiento Desinstalacin del software

x x x

Gua del usuario de OmniPage SE

93

Resolucin de problemas
Si bien OmniPage SE est diseado para un fcil uso, en ocasiones ocurren problemas. Muchos de los mensajes de error contienen descripciones autoexplicativas de lo que se debe hacer: revisar las conexiones, cerrar otras aplicaciones para liberar memoria, etc. En ocasiones bastar con esas indicaciones. En la documentacin de Windows encontrar informacin para optimizar su sistema y el rendimiento de las aplicaciones.

Soluciones iniciales
Intente estas soluciones si experimenta problemas al iniciar o usar OmniPage SE:
x x x

Cercirese de que su sistema cumpla todos los requisitos enumerados. Consulte Requisitos del sistema en la pgina 12. Cercirese de que el escner est enchufado y que todas las conexiones de cables estn fijas. En la seccin de asistencia tcnica del sitio web www.scansoft.com de ScanSoft encontrar notas tcnicas sobre temas comnmente mencionados al usar OmniPage. Nuestras pginas web tambin pueden ofrecer asistencia acerca del proceso de instalacin y resolucin de problemas. Apague su equipo y el escner, encienda nuevamente este ltimo y luego reinicie su equipo. Cercirese de que las dems aplicaciones estn funcionando correctamente. Utilice el software que viene con el escner para verificar que ste funciona correctamente antes de usarlo con OmniPage SE. Cercirese de contar con los controladores correctos para el escner, la impresora y la tarjeta de vdeo. Encontrar ms informacin al respecto en la seccin de escneres de la pgina web de ScanSoft, a la cual se puede acceder mediante el men Ayuda. Ejecute ScanDisk para Windows 98 o Me, o Check Disk para Windows NT, 2000 y XP a fin de revisar si la unidad de disco duro presenta errores. Encontrar ms informacin en la ayuda en lnea de Windows. Haga una defragmentacin en el disco duro. Encontrar ms informacin en la ayuda en lnea de Windows. Desinstale y reinstale OmniPage SE, tal como se describe en la ltima seccin, Desinstalacin del software en la pgina 103.

x x

x x

94

Informacin tcnica

Captulo 6

Probar OmniPage SE
Al reiniciar Windows 98, Me, 2000 o XP en el modo a prueba de errores o Windows NT en el modo VGA se podr probar OmniPage SE en un sistema simplificado. Esto se recomienda si no puede resolver problemas de bloqueo del sistema o si OmniPage SE ha dejado de funcionar por completo. Encontrar ms informacin en la ayuda en lnea de Windows.
El escner no funcionar con OmniPage SE en el modo a prueba de errores o en el modo VGA, de modo que no intente diagnosticar problemas con el escner en esta configuracin. w

Para probar OmniPage SE en el modo a prueba de errores (Windows 98, 2000, Me o XP): 1. Reinicie su equipo en el modo a prueba de errores pulsando F8 inmediatamente despus de que aparezca el mensaje que indica que se est reiniciando Windows. 2. Inicie OmniPage SE y trate de efectuar el OCR con una imagen. Utilice un archivo de imagen conocido como, por ejemplo, uno de los archivos de imagen de ejemplo suministrados. Si OmniPage SE no se inicia ni funciona correctamente en el modo a prueba de errores, puede que haya un problema en la instalacin. Desinstale y reinstale OmniPage SE (consulte la parte final de este captulo) y, luego, ejectelo en el modo a prueba de errores de Windows. Si OmniPage SE se ejecuta correctamente en el modo a prueba de errores, entonces puede que un controlador de dispositivos del sistema est interfiriendo con el funcionamiento de OmniPage SE. Solucione el problema reiniciando Windows en el modo de confirmacin paso a paso. Encontrar ms informacin en la ayuda en lnea de Windows.

Para probar OmniPage SE en el modo VGA (Windows NT): 1. Reinicie su equipo. 2. Seleccione la estacin de trabajo Windows NT versin 4.00 [modo VGA] y pulse Intro. 3. Pulse Ctrl+Alt+Supr y seleccione el Administrador de tareas. 4. En el cuadro de dilogo Administrador de tareas, seleccione todas las aplicaciones en segundo plano y haga clic en la opcin para terminar el proceso. Encontrar ms informacin en la ayuda en lnea de Windows.

Resolucin de problemas

95

5. Inicie OmniPage SE y trate de efectuar el OCR con una imagen. Utilice un archivo de imagen conocido como, por ejemplo, uno de los archivos de ejemplo suministrados.
Tambin puede ejecutar OmniPage SE desde una lnea de comando en su propio modo a prueba de errores. Seleccione Inicio Ejecutar, explore en busca del archivo OmniPage.exe y agregue la opcin /safe a la lnea de comandos. Esto iniciar el programa, pero ignorar los parmetros almacenados anteriormente y no intentar recuperar un documento proveniente de la finalizacin anormal del programa.

Aumentar los recursos de memoria


OmniPage SE puede ejecutarse deficientemente en condiciones de memoria insuficiente. Esto se puede indicar mediante diversos mensajes de error o si OmniPage SE funciona lentamente y accede al disco duro con mucha frecuencia. Intente las siguientes soluciones para los casos de memoria insuficiente:
x x x x

Reinicie su equipo. Cierre las dems aplicaciones para liberar memoria. Cierre aplicaciones innecesarias de OmniPage. Defragmente el disco duro para liberar bloques contiguos de espacio en el disco. Encontrar ms instrucciones en la ayuda en lnea de Windows. Aumente la cantidad de espacio libre en el disco. Aumente la memoria fsica (RAM) de su equipo. De esa manera podr optimizar el rendimiento de OCR. Consulte Requisitos del sistema en la pgina 12.

x x

96

Informacin tcnica

Captulo 6

Aumentar el espacio de disco


Si al sistema le queda poco espacio libre en el disco duro, se pueden producir problemas. Intente las siguientes soluciones en caso de que surjan problemas por espacio de disco insuficiente:
x x x x x x x

Vace la Papelera de reciclaje de Windows. Cierre todas las aplicaciones y elimine los archivos *.tmp en la carpeta Temp. sta generalmente se encuentra dentro de la carpeta Windows. Ejecute ScanDisk o Check Disk. Realice una copia de seguridad de los archivos que no necesite en disquetes o en otros medios y elimnelos del disco duro. Elimine aplicaciones de Windows que no use. Haga una defragmentacin en el disco duro. Borre la cach para el explorador web y limite su tamao.

El texto no se reconoce correctamente


Intente estas soluciones si parte del documento original no se convierte en texto correctamente durante el OCR:
x

Observe la imagen de la pgina original y cercirese de que todas las reas de texto queden delimitadas por zonas de texto. Si un rea no queda delimitada en una zona, generalmente ser ignorada durante el OCR. Consulte la seccin acerca de cmo crear y modificar zonas, Trabajo con zonas en la pgina 59. Cercirese de identificar correctamente las zonas de texto. Vuelva a identificar tipos y contenidos de zonas, si fuese necesario, y vuelva a llevar a cabo el OCR en el documento. Consulte Tipos y propiedades de zonas en la pgina 58. Cercirese de no haber cargado una plantilla incorrecta por error. Si los bordes de la zona cortan texto, el reconocimiento ser deficiente. Ajuste los controles deslizantes del brillo y el contraste en el panel Escner del cuadro de dilogo Opciones. Puede que sea necesario experimentar con diferentes combinaciones de parmetros para obtener los resultados deseados. Compruebe la resolucin de la imagen original. Pose el cursor sobre la miniatura de una pgina para ver una pantalla emergente. Si la resolucin es considerablemente superior o inferior a 300 ppp, es probable que el reconocimiento sea deficiente.

x x

Resolucin de problemas

97

Cercirese de seleccionar los idiomas correctos para los documentos en el panel OCR del cuadro de dilogo Opciones. Slo se deben incluir los idiomas incluidos en el documento. Active IntelliTrain y efecte algunas correcciones de verificacin. Es probable que esto ayude ms en el caso de fuentes estilizadas o documentos que estn deteriorados uniformemente. Si ya estaba activado IntelliTrain, intente desactivarlo; en algunos tipos de documentos deteriorados puede que esta aplicacin no resulte de gran ayuda. Efecte una capacitacin manual o edite la capacitacin existente para eliminar una capacitacin incorrecta. Las referencias a la capacitacin no son aplicables a OmniPage SE. Si utiliza True Page como vista del Editor de texto o para la exportacin, el texto reconocido se colocar en marcos (cuadros de formato). Parte del texto puede quedar oculto si un marco es muy pequeo. Para ver el texto, coloque el cursor en el marco del texto y utilice las teclas de direccin del teclado para desplazarse hacia arriba, hacia abajo a la izquierda o a la derecha del marco. Verifique que el cristal, espejos y lentes del escner no tengan polvo, manchas ni estn rayados. Lmpielos si fuese necesario.
OmniPage SE slo reconoce caracteres de texto impresos, tales como mecanografiados o generados en una impresora lser. Puede manejar caracteres impresos mediante matriz de puntos, aun cuando el nivel de exactitud puede disminuir en el caso de texto con calidad de borrador; pero no tiene la capacidad para leer impresin manual o texto manuscrito. Sin embargo, s puede mantener firmas u otro texto manuscrito, en forma de grfico.

Problemas con el reconocimiento de fax


Intente estas soluciones para mejorar la exactitud del OCR en imgenes de fax:
x x

Solicite a los remitentes que en lo posible usen documentos limpios y originales. Solicite a los remitentes que seleccionen el modo Fino u ptimo cuando le enven un fax. Esto produce una resolucin de 200 x 200 ppp. Solicite a los remitentes que transmitan los archivos directamente a su equipo va fax mdem si cuenta con dicho aparato. Podr guardar imgenes de fax como archivos de imagen y luego cargarlos en OmniPage SE. Consulte Entrada desde archivos de imagen en la pgina 50.

98

Informacin tcnica

Captulo 6

Problemas de sistema o rendimiento durante el OCR


Intente estas soluciones si se produce un bloqueo durante el OCR o si el procesamiento tarda demasiado:
x x x

Resuelva los problemas de baja memoria y espacio de disco insuficiente. Consulte Probar OmniPage SE en la pgina 95. Minimice todas las aplicaciones o haga clic en Alt+Tab para ver si hay mensajes de error de Windows. Revise la calidad de las imgenes. Consulte la documentacin del escner para averiguar formas de mejorar la calidad de las imgenes exploradas. Divida imgenes de pginas complejas (mucho texto y grficos o formato complicado) en trabajos ms pequeos. Dibuje zonas manualmente o modifique las zonas creadas automticamente y efecte el OCR en un rea de una pgina a la vez. Consulte Trabajo con zonas en la pgina 59. Reinicie Windows 98, Me, 2000 o XP en el modo a prueba de errores o, bien, en Windows NT en el modo VGA y pruebe OmniPage SE efectuando un OCR en los archivos de imgenes de ejemplo incluidos.

Si est efectuando varias tareas simultneamente, tales como reconocer e imprimir, puede que el OCR tarde ms.

Compatibilidad con ODMA


Esta seccin no es aplicable a OmniPage SE. Si su red local incluye el Sistema de Administracin de documentos (DMS) que sea compatible con clientes ODMA, OmniPage Pro 12 Office puede trabajar con ella. Luego aparecer un panel ODMA en el cuadro de dilogo Opciones que le permitir especificar los tipos de archivos y otros parmetros permitidos. Una interfaz ODMA reemplazar los cuadros de dilogo Cargar archivo de imagen y Abrir documento de OmniPage (OPD). Esto le permite cargar archivos de imagen y OPD de a uno a la vez desde el sistema de archivos de red o su equipo local. El cuadro de dilogo Guardar como proporcionar un botn denominado Guardar en el sistema DMS para almacenar los documentos reconocidos en dicho sistema. Para averiguar mayores detalles, consulte la Ayuda en lnea.

Compatibilidad con ODMA

99

Caractersticas avanzadas en Programar OCR


Esta seccin no es aplicable a OmniPage SE. Programar OCR permite especificar archivos de entrada para un trabajo. Algunas ediciones de OmniPage Pro 12 permiten especificar que se procesen todos los archivos de un tipo determinado en una o ms carpetas. Estas ediciones tambin ofrecen trabajos en carpetas observadas. La primera pantalla del Asistente para trabajo nuevo tiene dos botones: Archivos y Carpetas. Tambin muestra una marca de verificacin Buscar archivos entrantes en las carpetas. Seleccione esta opcin y especifique una o ms carpetas. Luego todos los archivos de los tipos especificados que se introduzcan en la carpeta se procesarn de inmediato. En el quinto panel del asistente puede especificar una hora de inicio y otra de detencin para el proceso de observacin del trabajo. Puede escoger no especificar una hora de detencin cuando configure el trabajo. En ese caso, utilice el botn Modificar de Programar OCR para introducir una hora de detencin posteriormente. Tambin puede detener momentneamente y reanudar los trabajos. El botn Ver permite apreciar un registro archivo por archivo de todo el procesamiento que haya concluido dentro de un trabajo seleccionado. Cuando se est ejecutando un trabajo, aparece una ventana con el registro del trabajo, la cual exhibe el progreso archivo por archivo e informa sobre problemas del procesamiento (si los hubiere). El cuarto panel del Asistente para trabajo nuevo permite especificar un tipo de archivo y escoger las opciones de separacin de archivos. Si escoge Un nuevo archivo de salida para cada archivo de entrada, usted especifica slo una carpeta, los archivos de salida conservan sus nombres de entrada con las extensiones modificadas. Si escoge una opcin que requiera mltiples archivos de salida, usted proporciona un nombre de archivo y el programa agrega sufijos numricos para generar nombres de archivo exclusivos. Si especifica una entrada de un conjunto de carpetas, puede especificar una carpeta de salida distinta para cada carpeta de entrada.

100

Informacin tcnica

Captulo 6

Tipos de archivo compatibles


El programa es compatible con una gran variedad de tipos de archivos de imagen y texto.

Tipos de archivos para abrir y guardar imgenes


Tipo de archivo BMP, mapa de bits DCX GIF JPEG MAX PCX PDF PNG TIFF comprimido G3 TIFF comprimido G4 TIFF comprimido LZW TIFF FX TIFF PackBits (bits empaquetados) TIFF sin comprimir Extensin bmp dcx gif jpg max pcx pdf png tif tif tif xif tif tif Varias pginas No S N/A No S No N/A No S S N/A S S S Abrir / Guardar Abrir y guardar Abrir y guardar N/A Abrir y guardar Abrir y guardar Abrir y guardar N/A (ver nota) Abrir y guardar Abrir y guardar Abrir y guardar N/A Abrir Abrir y guardar Abrir y guardar Blanco y negro, escala de grises, color Todos Todos N/A Escala de grises, color Todos Todos N/A Todos Blanco y negro Blanco y negro N/A Todos Todos Todos

Los archivos de imagen de entrada pueden tener resoluciones de hasta 600 ppp, pero se recomiendan 300 ppp (tanto horizontal como verticalmente) para una exactitud ptima de OCR. El programa almacena imgenes en blanco y negro con su resolucin original, pero las imgenes en escala de grises y en color generalmente no se guardan con ms de 150 ppp. Eso significa que no hay buenos candidatos para un futuro procesamiento de OCR. Coloque el cursor sobre una imagen para que aparezca una ventana emergente mostrando el tamao y la resolucin de la imagen original.
Si intenta guardar una imagen en blanco y negro con formato JPEG, el programa le sugerir la conversin a escala de grises. Con TIFF G3 y G4 le sugerir la conversin a blanco y negro. En OmniPage Pro 12 es posible guardar en formato PDF, con cinco opciones. Dos de stas, Slo imagen e Imagen en texto, exportan imgenes originales. Esto se efecta en el cuadro de dilogo Guardar como. Consulte Guardar en PDF en la pgina 90. No est disponible la opcin guardar a PDF en OmniPage SE. OmniPage SE tampoco puede utilizar los formatos de archivo GIF y TIFF LZW.

Tipos de archivo compatibles

101

Tipos de archivos para guardar los resultados del reconocimiento


En esta tabla aparecen los niveles de formato que estn disponibles para cada tipo de archivo.
Tipo de archivo eBook (ver nota1) Excel 97, 2000 Excel 3.0 a 7.0 FrameMaker 5.5.3 Freelance Graphics Harvard Graphics HTML 4.0 (ver nota 1,2) HTML 3.2 (ver nota 2) Microsoft PowerPoint 97 Microsoft Publisher 98 Microsoft Word 6.0, 97, 2000, XP PageMaker (6.5.2) Quattro SE para Windows 4.0, 8 PDF (Normal) (ver nota1) PDF editado (ver nota1) PDF con imagen en texto (1) PDF con sustitutos de imagen (1) PDF, slo imagen (1) RTF Word 2000, 97, 95/6.0 (3) Ventura Publisher WordPad WordPerfect 8, 9, 10 WordPerfect 6.0, 6.1 WordPerfect 5.1, 5.2 XML (ver nota1) Texto y texto con saltos de lnea (ver nota 4) Texto separado por comas (4) Texto con formato (4) Documento de OmniPage (5) Extensin opf xls xls mif txt txt htm htm rtf rtf doc doc xls pdf pdf pdf pdf pdf rtf doc rtf wpd wpd wp5 xml txt csv txt opd
q q q q q q q q q q q q q q q q q q q q q q q q q

Sin formato
q q q q q q q q q q q q q

RFP
q q q q q q q q q q q q q

Flujo de pginas
(ver nota 1)

True Page

Hoja de clculo

Grficos
qq

Tablas
q q q

q q

qq

qq

qq q q

q q

qq qq qq qq

q q qq qq qq qq q

qq qq q

q q

qq qq q q q qq q qq qq qq qq q

q qq q q q qq qq qq qq qq qq

(q )
q

(q )
q

(q )
q q

(q )
q q

Se guarda como se ve

102

Informacin tcnica

Captulo 6

Grficos
q Tipo de archivo compatible con grficos qq Tipo de archivo compatible con grficos, con opcin de exportacin para conservar o desechar grficos. Tablas q Tipo de archivo compatible con tablas en cuadrculas, sin opciones de manipulacin de tablas al momento de la exportacin qq Tipo de archivo compatible con tablas, escoja esta opcin para usar cuadrculas o columnas separadas por tabuladores q Tipo de archivo no compatible con cuadrculas de tablas, escoja esta opcin para convertir a columnas separadas por tabuladores o espacios

1 2 3

Estos tipos de archivo y el formato Flujo de pginas no estn disponibles en OmniPage SE. Al guardar archivos en formato HTML, se almacenan todos los grficos como archivos de imagen JPEG independientes. Los resultados del reconocimiento se envan al Portapapeles y en este formato se pegarn en RTF si ello es posible o, de lo contrario, como texto Unicode o ASCII. Todos los formatos de texto estn disponibles como texto o Unicode. Este ltimo acepta la ms amplia variedad de caracteres acentuados. Puede abrir los documentos de OmniPage creados en OmniPage Pro 12 y su version Special Edition. OmniPage SE accepta tambien documentos OPD creados en OmniPage Pro 10, 11 o su version Special Edition. Estos archivos ingresan al programa como documentos sin nombre. Para mantener un archivo OPD en el formato antiguo y tambin guardarlo como nuevo documento OPD, escoja un nombre distinto para evitar sobrescribir el archivo antiguo.

4 5

Desinstalacin del software


En algunas ocasiones la solucin puede consistir en desinstalar y luego volver a instalar OmniPage SE. Tambin conviene desinstalar OmniPage SE antes de instalar OmniPage Pro 12 o cualquier programa OmniPage de evaluacin. El programa de desinstalacin de OmniPage SE no eliminar ninguno de los siguientes archivos creados por el usuario: Plantillas de zonas (*.zon) Archivos de capacitacin (*.otd) (Esto no es aplicable a OmniPage SE.) Diccionarios del usuario (*.ud) Documentos de OmniPage (*.opd) Para desinstalar el producto en Windows NT o Windows 2000, debe registrarse en su equipo con privilegios de administrador.

Desinstalacin del software

103

Para desinstalar o reinstalar OmniPage SE:


x x x x x x

Cierre OmniPage SE. Haga clic en Inicio en la barra de tareas de Windows y escoja el Panel de control y, luego, Agregar o quitar programas. Seleccione OmniPage SE y haga clic en Cambiar. Haga clic en Siguiente en el cuadro de dilogo que aparecer a continuacin. Seleccione la opcin para eliminar o reparar todo y luego Siguiente. Siga las instrucciones hasta terminar el procedimiento.

104

Informacin tcnica

N D I C E

Abrir archivos de imagen, 50, 101 Acercar o alejar pantallas, 24, 70 Acomodacin de texto, 34 Acoplamiento y desplazamiento de barras de herramientas, 25, 70 Actualizacin a la versin OmniPage Pro, 19 Administracin de documentos, 28 Administrador de documentos, 24, 28, 29 personalizar columnas en, 30 Administrador de tareas, 95 Agregar a zonas, 61 capacitacin a archivos de capacitacin, 76 pginas a un documento, 41 palabras a un diccionario del usuario, 70 Agrupar elementos, 78 Alfanumrica, zona, 58 Alimentador automtico de documentos, 33, 50, 53 Almacenar cambios en la separacin de zonas, 79 Alternacin entre el procesamiento manual y automtico, 27, 43 Archivos adjuntos a mensajes de correo electrnico, 91 como destino de exportacin, 84 como fuente de imagen, 50 conservar tras la desinstalacin, 103 opciones de separacin, 85, 92 tipos, 85 tipos compatibles, 101 tipos para la exportacin, 87, 102 Archivos de imagen abrir, 101 ejemplos, 36, 95 entrada, 50 orden de lectura, 50 tipos, 101 varias pginas, 50, 84, 101 Archivos OPD definicin, 31 guardar en OPD, 32 objetivo de, 32 reas de varias columnas, 26, 78 Asistente configuracin del escner, 14 procesamiento, 45

Programar OCR, 49, 100 trabajo nuevo, 49, 100 Atributos de caracteres, 77 Aumentar espacio de disco, 97 recursos de memoria, 96 Avanzadas, opciones de guardar, 88 Ayuda contextual, 9, 25, 33 en lnea, 9 en lnea registro, 17 HTML, 9

Barra de mens, 25 Barras de herramientas acoplamiento, 25 desplazables, 25 Estndar, 24, 25 formato, 24, 25 Imagen, 24, 25 Blanco y negro exploracin, 52 imgenes, 84 Botones Exportar resultados, 41, 43, 85 Obtener pgina, 40, 42 Realizar OCR, 41, 43 Brillo, 33, 52, 97 Buscar palabras dudosas, 69 palabras que no estn en el diccionario, 69 salida en PDF, 90

Caja de herramientas de OmniPage, 24, 27, 40 Calidad de las imgenes, 52 Cambiar orden de lectura, 78 parte de una pgina, 79 tamao de las zonas, 60 tipos de zonas, 59 Capacitacin, 73 archivos de capacitacin, 76 automtica, 74 cargar archivos de capacitacin, 76 crear datos de capacitacin, 76 datos de capacitacin no guardados, 31

descargar archivos de capacitacin, 76 editar archivos de capacitacin, 76 guardar archivos de capacitacin, 76 IntelliTrain, 74 interrogar antes de guardar datos, 31 manual, 74 Caracteres dudosos, 68 no imprimibles, 68 no reconocidos, 68 Caractersticas nuevas en la versin 12 de OmniPage Pro, 17 Carga archivos de capacitacin, 76 Archivos OPD, 31 de un diccionario del usuario, 72 plantillas de zonas, 55, 64 Carpetas observadas, 100 Cerrar documentos, 31 Colocar grficos desde la exportacin, 86 nuevas pginas en el documento, 33 Color exploracin, 52 imgenes, 84 marcadores, 70 Columnas de notas en el Administrador de documentos, 30 en el Administrador de documentos, 30 en tablas, 63 Comparacin de las palabras reconocidas con las originales, 70 Compatibilidad DMS, 99 ODMA, 99 Configuracin Direct OCR, 47 escner, 14 Consejos sobre problemas, 94 Contenido de documentos de OmniPage, 86 Contraste, 33, 52, 97 Control sobre el reconocimiento, 42 Conversin de imgenes, 101 Convertidores de exportacin, 88 Copiar pginas al Portapapeles, 45, 90 Correo, 41, 91 Crear datos de capacitacin, 76 Cuadros, 26, 78 texto reconocido, 98 Cuadros de dilogo

Gua del usuario de OmniPage SE

105

Cargar archivo de imagen, 50 Enviar correo, 91 Opciones, 33 Verificador, 69 Cursiva, texto, 77

E
Edicin y separacin inmediatas de zonas, 79 Editar archivos de capacitacin, 76 atributos de caracteres, 77 atributos de prrafo, 77 diccionarios del usuario, 72 en True Page, 78 grficos, 77 inmediatamente, 79 Salida en PDF, 90 tablas, 62, 78 texto reconocido, 77 Editor de texto, 24, 26, 34, 68 Efecto de los parmetros, 34 Ejemplos de capacitacin, 73 Eliminar archivos de capacitacin, 76 diccionarios del usuario, 72 pginas, 28, 30 plantillas de zonas, 64 separadores de tabla, 63 Entrada desde archivos PDF, 50, 101 desde carpeta para Programar OCR, 100 desde el escner, 51 desde un archivo de imagen, 50 Enviar pginas por correo, 91 Escala de grises exploracin, 52 imgenes, 84 Escneres, 51, 98 configuracin, 14 controladores, 14 dobles, 53 Escritorio, 24 OmniPage, 24 Escuchar lectura de texto en voz alta, 80 Espacio de disco, 12, 97 Exactitud influencia de la capacitacin, 73 influencia en el brillo, 52 influencia en el modo de exploracin, 51 mejoramiento, 51, 73, 97 Exploracin a color, 52 Asistente, 14 blanco y negro, 52 brillo, 33, 52 contraste, 33 dos pginas, 33 entrada desde, 52 escala de grises, 52 imgenes, 52 libros, 33 Exportaciones mltiples, 83, 86

Datos de capacitacin no guardados, 31 Desagrupar elementos, 78 Descargar archivos de capacitacin, 76 diccionario del usuario, 72 plantillas de zonas, 64 Descripcin diseo, 41, 45, 54 diseo del documento, 41, 54 Desinstalacin del software, 103 Desplazarse entre pginas, 28 Deteccin automtica, diseo, 54 Detencin del procesamiento automtico, 41 Dibujar zonas en Direct OCR, 47 Diccionarios, 45, 70 legales, 70 mdicos, 70 profesionales, 70 Diccionarios del usuario, 69, 72 agregar palabras, 69 cargar, 72 descargar, 72 editar, 72 inicio, 72 Direct OCR, 46 panel Opciones, 33 Diseo deteccin automtica, 54 personalizado, 34, 55 Dividir zonas, 58 Documentos administracin, 28 ambas caras, 53, 54 cerrar, 31 colocar pginas nuevas, 33 con diseo variado, 54 copiar al Portapapeles, 45, 90 descripcin del diseo, 54 en OmniPage SE, 23 exportar, 23, 41, 43, 83 guardar, 32, 83 guardar mientras trabaja, 86 sin terminar, 31 terminar, 41 Documentos de OmniPage contenido, 86 definicin, 31 guardar como, 32, 87 objetivo de los archivos OPD, 32

Exportar a aplicaciones de destino, 23, 42, 84 a PDF, 90, 102 a un archivo, 85, 102 al correo, 91 al Portapapeles, 90 flujo de pginas, 88 grficos, 86, 103 tipos de archivo y niveles de formato, 102 True Page, 88 varias veces, 83, 86 Exportar resultados, botn, 41, 43, 85

Filas en tablas, 63 Flujo de pginas, 88 Fondos ignorar, 55 procesar, 55 separacin automtica de zonas, 26, 55 Funcin texto a lenguaje, 80 Funciones de OmniPage SE, 19

G
Generalidades documento, 28 pasos del procesamiento, 23 procesamiento, 36, 38 Generar separadores de tablas, 63 Grficos editar, 77 en archivos HTML, 103 en la exportacin, 86, 102 Guardadas, pginas, 28 Guardar a un archivo, 46, 84 archivos de capacitacin, 76 como documento de OmniPage, 32, 87 diccionarios del usuario, 72 documentos, 83 documentos mientras trabaja, 86 en formato OPD, 32, 85 guardar e iniciar, 86 imgenes originales, 84, 101 opciones, 88 plantillas de zonas, 64 resultados del reconocimiento, 85 texto, 85 Gua inicio rpido, 36 teclado para escuchar texto, 81

Hipervnculos, 78

106

ndice

I
Idiomas interfaz del usuario, 33 reconocimiento, 33, 45, 98 Imgenes a color, 84 archivos de entrada, 22 blanco y negro, 84 calidad, 52 conversin, 101 editar, 77 escala de grises, 84 fondos, 55 guardar, 84, 101 guardar originales, 84, 101 obtener, 23, 42 resolucin, 29, 84, 97, 101 sustitutos en PDF, 90 tamao, 29 Imprimir documentos, 31 pginas reconocidas, 31 Indicadores de encabezado y pie de pgina, 68 Informacin tcnica, 93 Iniciar aplicacin de destino, 86 diccionario del usuario, 72 programa, 14 Insertar separadores de tabla, 63 Instalacin escneres, 14 OmniPage SE, 13 IntelliTrain, 34, 49, 74, 98 Interrogar antes de guardar datos de capacitacin, 31 Interrupcin del procesamiento automtico, 41 Irregulares, zonas, 60

Modificadas, pginas, 28 Modificar plantillas de zonas, 64 Modo a prueba de errores, 95 VGA, 95 Mover separadores de tabla, 63 MS Outlook, 91

verificacin, 34, 69 Optimizar brillo, 33, 52 Orden elementos de pgina, 78 lectura, 78

P
Pginas archivos de imagen de varias pginas, 50, 84, 101 botn Obtener pgina, 40, 42 copiar al Portapapeles, 45, 90 de hojas de clculo, 55 desplazamiento entre, 28 eliminar, 28, 30 enviar como correo, 91 estado, 28 guardadas, 28 hojas de clculo, 54 modificadas, 28 navegacin, 24, 81 nuevo archivo en pgina en blanco, 50 obtenidas, 28 pendientes, 28, 79 reconocidas, 28 reordenar, 28 seleccionar varias, 28, 29 separadas por zonas, 28 ubicacin en el documento, 33 una columna, 54, 58 una sola columna con tablas, 54 varias columnas, 54 verificadas, 28 volver a reconocerlas todas, 41 Palabras marcadas en el Editor de texto, 68 que no estn en el diccionario, 68 Panel de imgenes, 24, 26 PaperPort, 48 Para, 19 Parmetros Asistente de OCR, 46 cuadro de dilogo Opciones, 33 Direct OCR, 47 efecto, 34 Obtener texto, 47 tipos de zonas, 62 Prrafo editar atributos, 77 estilos, 77, 86 mantener estilos, 86 Pasos bsicos de procesamiento, 23 PDF, archivo de salida, 101 Pendientes, pginas, 28 Personalizar barras de herramientas, 25 columnas del Administrador de documentos, 30 convertidores de exportacin, 88

Negrita, texto, 77 Niveles de formato, 49, 68, 102 tipos de archivo, 102 Nuevas caractersticas en la versin 12 de OmniPage Pro, 17 Nuevo archivo en pgina en blanco, 50 Numrica, zona, 58

O
Objetivo archivos OPD, 32 capacitacin, 73 Obtener ayuda en lnea, 9 imgenes, 23, 42 texto, elementos de men, 47 Obtenidas, pginas, 28 OCR Asistente, 39, 45, 46 definicin, 22 Direct OCR, 33, 46 parmetros, 33 parmetros de Direct OCR, 46 procesamiento automtico, 27, 40 procesamiento manual, 27, 42 Programar OCR, 49 realizar OCR, 23 rendimiento deficiente durante, 99 resultados de la verificacin, 69 trabajos en Programar OCR, 49 verificacin de los resultados de OCR, 70 Ocultar o mostrar marcadores, 68 OmniPage Pro actualizacin a la versin, 19 nuevas caractersticas, 17 OmniPage SE, 19 caractersticas comparadas con OmniPage Pro, 10, 19 desinstalacin, 103 documentos en, 23 funciones, 19 inicio, 14 instalacin, 13 prueba, 95 registro, 17 reinstalacin, 103 versiones anteriores, 13 Opciones guardar, 88 procesamiento, 33

Juntar zonas, 61

L
Lectura orden de los archivos de imagen, 50 texto en voz alta, 80 Lista desplegable Exportar resultados, 43 Obtener pginas, 42

Mantener estilos de prrafo, 86 Marcadores, 68, 70 Marcos, 26, 78, 88, 98 Mejorar la exactitud, 51, 74, 97 Mens rpidos, 59 Miniaturas, 24, 26, 28

Gua del usuario de OmniPage SE

107

Portapapeles, 41, 90 Probar OmniPage SE, 95 Problemas reconocimiento de fax, 98 rendimiento durante el OCR, 99 sistema o rendimiento durante el OCR, 99 Procesamiento a partir de otras aplicaciones, 46 alternacin entre el procesamiento manual y automtico, 27, 43 automtico, 27, 40 automtico incompleto, 41 combinado, 27, 43 con el Asistente de OCR, 45 detencin del procesamiento automtico, 41 diferido, 31 documentos en futuras sesiones, 31 interrumpir el procesamiento automtico, 41 manual, 27, 42 paso a paso, 23, 42 pasos bsicos, 23 pasos, generalidades, 23, 38 reiniciar el procesamiento automtico, 41 Programar OCR, 49 carpetas observadas, 100 entrada de carpetas, 100 Propiedades de zonas, 58

Reordenar pginas, 28 Requisitos memoria, 12, 96 mnimos del sistema, 12 sistema, 12 Resolucin, 29, 84, 97, 101 Resolucin de problemas, 93, 94 Retencin del diseo, 69

Unidad de medicin, 34 URL, direcciones, 78 Uso de Direct OCR, 47

V
Verificacin opciones, 34, 69 remota, 31 resultados de OCR, 69, 70 sesiones futuras, 31 Verificadas, pginas, 28 Verificador dinmico, 70 Verificar texto, 70 Vnculos a pginas Web, 78 Vistas Editor de texto, 26, 68 Mantener fuentes y prrafos, 68, 87 Sin formato, 68, 87 True Page, 69 Volver a reconocer pginas, 43

Seleccin de varias pginas, 29 Separacin automtica de zonas, 26, 34, 41, 54, 59 inmediata de zonas, 79 Soluciones en caso de rendimiento deficiente, 94 Special, 10 Subrayado, texto, 77 Sugerencias durante la verificacin, 70

T
Tablas columnas en, 63 editar, 78 editar separadores, 62 eliminar separadores, 62 en pginas de una sola columna, 54 filas en, 62 generar separadores, 63 insertar separadores, 63 manipular tablas en el Editor de texto, 78 mover separadores, 63 zonas, 59, 62 Terminar un documento, 41 Texto con matriz de puntos, 98 guardar, 85 TIFF, archivos de imagen, 101 Tipos archivos compatibles, 101 zonas, 58 Trabajos Programar OCR, 49 zonas, 59 True Page, 26 edicin, 78 exportar, 88 vista, 69 TWAIN, controladores para escneres, 14

W Z

Web, vnculos a pginas, 78 Zonas, 26 agregar a, 61 alfanumricas, 58 cambiar el tamao, 60 cambiar tipos, 59 descargar plantillas, 65 dibujar en Direct OCR, 47 dividir, 59 eliminar plantillas, 64 en una pgina, 28 establecer tipos, 63 grficas, 59 guardar plantillas, 64 ignorar, 59 irregulares, 60 manuales, 55, 97, 99 modificar plantillas, 64 numricas, 58 plantillas, 55, 64, 97 procesar, 59 propiedades, 58 quitar de, 59 rectangulares, 60 reemplazar plantillas, 64 separacin manual, 43, 55 tabla, 59, 62 texto, 59 tipos, 26, 58, 97 trabajo con, 59 unir, 61

Q R

Quitar de zonas, 58 Re-capacitacin, 74 Reconocidas, pginas, 28 Reconocimiento aumentar velocidad, 98 efectuar, 42 exactitud, 52, 73, 97 fax, 98 guardar los resultados, 85 idiomas, 33, 45, 98 lento, 99 ptico de caracteres, 22 problemas con el reconocimiento de fax, 98 Rectangulares, zonas, 60 Reemplazar plantillas de zonas, 64 Registro aplicaciones de Direct OCR, 47 OmniPage SE, 17 Reinicio del procesamiento automtico, 41 Reinstalacin de OmniPage SE, 103

Ubicacin de pginas nuevas, 33 Una columna pginas, 54, 58 pginas con tablas, 54

108

ndice

Vous aimerez peut-être aussi