Opciones: OCR

Este cuadro de diálogo se utiliza para seleccionar los parámetros de OCR. Puede mostrarse

  • en OmniPage;  

  • desde aplicaciones de Microsoft Office y WordPerfect utilizando Direct OCR;

  • en PaperPort (si está instalado).

Cómo mostrar este cuadro de diálogo en OmniPage

Cómo mostrar este cuadro de diálogo para Direct OCR (en aplicaciones de Microsoft Office y en WordPerfect)

  • Haga clic en el botón Configuración de obtención de texto Omnipage icon acquire text settings OCR en una barra de herramientas de OmniPage (o desde el menú Archivo) en WordPerfect o en versiones anteriores de Microsoft Office, desde la ficha Nuance OCR en una aplicación de Microsoft Office 2007 o 2010, o desde el menú Archivo.

Cómo mostrar este cuadro de diálogo en PaperPort

  1. Haga clic con el botón secundario del mouse en el icono de Microsoft Word en la barra Enviar a de PaperPort y seleccione Opciones de Enviar a… Aparecerá el cuadro de diálogo Opciones de Enviar a.

  2. Seleccione OmniPage 18 en el cuadro de selección Convertir imagen en texto (OCR) con y luego haga clic en el botón Configuración… Aparecerá el cuadro de diálogo Opciones con el panel OCR abierto.

El panel OCR ofrece los siguientes parámetros:

Descripción del diseño

Utilice estos parámetros para influir en el proceso automático de separación de zonas.

Automático: En la mayoría de los casos la opción Automático es adecuada y permite que el programa se encargue de tomar todas las decisiones de separación de zonas. Elija Automático si su documento contiene páginas con diferentes diseños. También elija esta opción para una página con varias columnas y una tabla, y para cualquier página con más de una tabla.

Columna única, sin tabla: Elija este parámetro si sus páginas contienen sólo una columna de texto y ninguna tabla. Las cartas comerciales o páginas de un libro normalmente tienen estas características. Elíjala también para una página con palabras o números organizados en columnas si no desea que éstos se coloquen en una tabla o que se eliminen las columnas o que se los considere como columnas separadas.

Varias columnas, sin tabla: Elija este parámetro si algunas de las páginas contienen texto en columnas y desea eliminar las columnas o mantenerlo en columnas separadas.

Columna única, con tabla: Elija este parámetro si su página contiene sólo una columna de texto y una tabla.

Hoja de cálculo: Elija este parámetro si la página entera consiste en una tabla que desea exportar a un programa de hoja de cálculo, o tratar como una tabla. No se detectarán zonas de flujo de texto.

Formulario: Seleccione este parámetro si sus páginas contienen formularios.

Documento jurídico: Seleccione este parámetro para documentos jurídicos.

Personalizado (definido por el usuario): Escoja esta opción para describir con precisión el diseño de las páginas en un documento. Luego haga clic en el botón Diseño personalizado a fin de especificar los parámetros en el cuadro de diálogo Diseño personalizado para modificar el flujo de texto y la detección de tablas y gráficos durante la separación automática de zonas.  

Plantilla: Utilice esta opción para realizar la separación de zonas mediante una plantilla especificada.

Optimizar proceso de OCR para…

Haga clic en Velocidad para optimizar el reconocimiento en cuanto a la velocidad. El uso de ‘Velocidad’ en documentos de buena calidad también puede producir un nivel aceptable de precisión. Haga clic en Precisión para optimizar el reconocimiento en cuanto a la precisión. Cuando selecciona ‘Velocidad’, no se pueden conservar características avanzadas de formato, tales como fondos o textos en colores o bien texto invertido.

Idiomas y diccionarios

Idiomas en el documento

Seleccione el idioma o idiomas que aparecen en el documento que va a procesar. Estos son los idiomas que buscará OmniPage durante el OCR. Para lograr un reconocimiento más rápido y mejor, y obtener mejores sugerencias de verificación, seleccione sólo los idiomas que estén en el documento.

Los idiomas en la parte superior de la lista corresponden a sus elecciones más recientes. A continuación aparecen enumerados los idiomas en orden alfabético. Escriba una letra para pasar a la misma.

Omnipage icon dict OCR

Este icono denota un idioma con asistencia de diccionario. El diccionario se consulta para ayudar al proceso de OCR, para ofrecer sugerencias durante la revisión y la detección automática de idiomas.

La configuración de los idiomas japonés, coreano y chino invocan un motor de reconocimiento especializado. Se debe seleccionar solo uno de estos idiomas por vez y no se deben combinar con ningún idioma que no sea asiático. Los textos breves en inglés se pueden reconocer sin que esté seleccionado el idioma inglés como idioma de reconocimiento. Consulte Reconocimiento de idiomas asiáticos.

Detectar un idioma individual automáticamente

Esto está diseñado para el procesamiento sin intervención del usuario cuando el idioma de los documentos entrantes no se puede determinar con anticipación. Cuando está habilitado, no es posible otra opción de idioma. Puede funcionar con todos los idiomas compatibles con un diccionario que use un alfabeto latino más cuatro idiomas asiáticos. No se incluyen el ruso ni el griego. 

Se ofrecen tres grupos de idiomas en la lista desplegable que figura debajo de la marca de verificación: 

  • Idiomas con alfabeto latino (elíjalo para ver los idiomas habilitados).

  • Idiomas asiáticos (chino tradicional, chino simplificado, japonés y coreano).

  • Alfabetos latinos e idiomas asiáticos (todos los mencionados anteriormente).

A medida que llegan las páginas, sus textos se analizan y se les asigna un idioma de reconocimiento válido individual a cada página. Cuando esta opción está habilitada, la siguiente opción no se encuentra disponible.

Verificar selección de idioma

Seleccionar esta marca de verificación invoca la detección automática de idiomas que advierte las diferencias entre el idioma detectado y el parámetro de idioma. Esta opción funciona en el nivel de página e identifica cuatro categorías: japonés, chino, coreano y no asiáticos. No puede distinguir entre chino tradicional y simplificado, ni entre idiomas no asiáticos. La última categoría quiere decir que no se detectaron los caracteres japoneses, chinos ni coreanos. La verificación se realiza durante el preprocesamiento de imágenes, de modo que se debe seleccionar el idioma de reconocimiento requerido antes de cargar la imagen. La detección es más precisa con, al menos, varias líneas de texto y un mínimo de texto en inglés incorporado.

Diccionarios profesionales

Haga clic en la casilla de verificación junto al nombre de un diccionario para seleccionarlo. Las opciones son: Holandés jurídico, holandés médico, inglés jurídico, inglés médico, inglés financiero (sólo en Omnipage Professional), francés jurídico y francés médico, alemán jurídico, alemán médico. Para anular la selección de un diccionario profesional hágale clic una vez más.

Diccionario del usuario

Seleccione un diccionario del usuario si lo desea. Éste es un diccionario personal al que podrá añadir palabras. Sirve de complemento a los diccionarios incorporados en el programa, tanto para ayudar en el proceso de OCR como para hacer sugerencias durante el procesamiento. Un diccionario del usuario es útil para evitar que el programa sugiera como dudosos algunos nombres propios o términos especializados de los documentos. Podrá crear y guardar los diccionarios del usuario que desee.

Haga clic en el botón situado a la derecha del cuadro de selección para crear, modificar, agregar o quitar un diccionario del usuario. Seleccione [ninguno] para descargar un diccionario del usuario.

Puede buscar en la red u otras ubicaciones para cargar y guardar diccionarios del usuario.

También aparecen aquellos diccionarios del usuario de Microsoft Word detectados en el sistema. Puede que aparezca un diccionario denominado Personalizado; es su diccionario de Word predeterminado.

Los diccionarios del usuario no se pueden utilizar con el reconocimiento asiático.

Fuentes y caracteres

Coincidencia de fuentes

Haga clic en el botón Coincidencia de fuentes… para seleccionar las fuentes del sistema que quedarán disponibles para usar al hacer coincidir o representar las fuentes de sus documentos. La coincidencia de fuentes no tiene efecto en el reconocimiento asiático. En estos casos, se configura una fuente que admite idiomas asiáticos.

Caracteres adicionales

Introduzca aquí caracteres acentuados que desee validar para que sean reconocidos, además de los ya válidos en el idioma seleccionado. Introduzca los caracteres utilizando el teclado o el mapa de caracteres.

Haga clic en Omnipage tb f charmap OCR para abrir el mapa de caracteres.

Carácter de rechazo

Los caracteres no reconocibles se representan en el Editor de texto mediante un carácter rojo de rechazo (la opción predeterminada es ~). Por ejemplo, si OmniPage no pudo reconocer la H en RECHAZO y ~ es el carácter de rechazo, la cadena REC~AZO aparecería en su documento.

Escriba el carácter que desee usar en el cuadro de edición Carácter de rechazo. Trate de escoger un carácter que no aparezca en los documentos.

Haga clic en Omnipage tb f charmap OCR para abrir el mapa de caracteres.

Mapa de caracteres

Utilícelo para copiar y pegar letras acentuadas en el cuadro de edición. Los caracteres atenuados en el mapa de caracteres indican que su reconocimiento no está habilitado, aunque se pueden introducir en el cuadro de modificación. Haga clic con el botón secundario en una zona vacía debajo del mapa de caracteres y use el menú contextual para mostrar u ocultar conjuntos de caracteres. No se admiten caracteres asiáticos.

//

OCR