Mejorar la precisión

Estas sugerencias están pensadas para aumentar la precisión del OCR en OmniPage.

Seleccione los parámetros que mejorarán la precisión en el cuadro de diálogo Opciones.

Seleccione Opciones en el menú Herramientas o haga clic Omnipage tb st options Mejorar la precisión en la barra de herramientas Estándar. A continuación, haga clic en la ficha en el cuadro de diálogo Opciones para los parámetros que desee cambiar:

  • Seleccione Precisiónbajo Optimizar proceso de OCR para… en el panel OCR.

  • Ajuste los controles deslizantes de Brillo y Contraste en el panel Escáner. Haga clic aquí para ver un ejemplo de brillo óptimo.

  • Mejore imágenes para propósitos de OCR mediante las herramientas SET.

  • Si su único criterio es la precisión del OCR, es preferible utilizar la digitalización en blanco y negro para documentos de buena calidad con texto negro nítido sobre un fondo blanco. Elija la digitalización en escala de grises si está digitalizando páginas con texto sobre fondos coloreados o sombreados, o para el caso de documentos degradados con un contraste bajo o variable.

  • Seleccione Archivo de capacitación en el panel Verificación para utilizar un archivo de capacitación de caracteres para ayudar a reconocer caracteres especiales o estilizados durante el OCR. En la sección Archivos de capacitación encontrará mayor información. No rige para los idiomas asiáticos.

Utilice los asistentes de reconocimiento apropiados

  • Si tiene un documento extenso y no dispone de un archivo de capacitación apropiado, realice una capacitación en algunas páginas típicas. Active IntelliTrain en el panel de Verificación del cuadro de diálogo Opciones y después reconozca tres o cuatro páginas y revise el texto. Inspeccione la calidad de la capacitación en el cuadro de diálogo Modificar capacitación y después guárdela en un archivo.

  • Si está obteniendo resultados deficientes con un archivo de capacitación cargado, verifique su contenido en el cuadro de diálogo Modificar capacitación. Asegúrese de que sea apropiado para el documento actual. Si no es así, cárguelo o modifique su contenido para eliminar la capacitación de formas de caracteres mal formados. Una capacitación deficiente puede rendir peores resultados que no tener ningún tipo de capacitación en absoluto.

  • Si la verificación está pasando por alto demasiadas palabras inapropiadas y usted tiene cargado un diccionario del usuario, verifique su contenido con el cuadro de diálogo Modificar diccionario del usuario. Elimine cualquier entrada añadida por error, especialmente palabras escritas incorrectamente.

Identifique las zonas correctamente

  • Al procesar las páginas manualmente, asegúrese de identificar correctamente las zonas antes de realizar el OCR.

  • Al procesar las páginas automáticamente, asegúrese de que el parámetro de diseño original sea el óptimo para el documento. Inspeccione los resultados del reconocimiento. Si hay defectos debidos a una separación defectuosa de zonas en algunas páginas, cambie las propiedades de las zonas y/o sus ubicaciones y vuelva a reconocer aquellas páginas.

  • Asegúrese de no tener cargado un archivo de plantilla de zonas que no sea el apropiado para sus páginas actuales.

  • Para conservar texto escrito a mano, por ejemplo una firma, identifíquelo como zona de gráfico.

Utilice imágenes de alta calidad

  • Por lo general, trate de usar páginas originales cuando esté digitalizando documentos. Las imágenes de páginas tipografiadas e impresas con alta calidad proporcionarán la mejor precisión posible del OCR. Es posible que la precisión del OCR no sea tan precisa con páginas de menor calidad.

  • En el caso de algunos originales de poca calidad, es posible que una fotocopia de buena calidad proporcione mejores resultados del OCR. Puede suceder esto en documentos con poco contraste o en aquellos impresos en papel muy fino. Por otra parte, las fotocopias de mala calidad con rayas, manchas o un brillo poco uniforme, por lo general, darán resultados peores.

  • Solicite a los remitentes que seleccionen el modo Fino u Óptimo cuando le envíen un fax.

  • Las imágenes de página no deben tener notas, líneas ni garabatos. Cualquier cosa que no sea un carácter impreso causará demoras en el reconocimiento y cualquier carácter distorsionado por una marca no será reconocible. Trate de no incluir tales marcas en las zonas o enciérrelas en una zona para ignorar.

  • El texto de las imágenes de página debería ser razonablemente limpio y nítido. Los caracteres deben estar separados entre sí y no emborronados ni superpuestos.

  • Si tiene influencia en el estilo utilizado en los documentos que desea reconocer, evite el uso del subrayado. Es difícil reconocer texto subrayado porque la línea de subrayado cambia los trazos inferiores de las letras q, g, y, p y j.

  • Si está obteniendo resultados deficientes de sus archivos de imagen, verifique su calidad y resolución colocando el cursor sobre las miniaturas. La resolución ideal para el OCR es de 300 ppp. Es probable que las imágenes con menos de 200 ppp o más de 400 ppp proporcionen una precisión mucho menor. Si tiene los documentos impresos en papel, digitalícelos nuevamente con una mejor configuración. En caso contrario, pídale a las personas que le suministran las imágenes que utilicen un valor de 300 ppp.

//

Mejorar la precisión