¿Qué es el reconocimiento óptico de caracteres?

El reconocimiento óptico de caracteres (OCR) es el proceso de extracción de texto a partir de la imagen de una página. Esta imagen de página es una imagen electrónica de texto y puede contener otros elementos tales como encabezados e imágenes. Las imágenes de páginas pueden obtenerse a partir de la digitalización de un documento en papel o de la apertura de un archivo electrónico de imagen. Podrá recibir estos archivos por correo electrónico o desde una máquina de fax, o bien desde su propio escáner.

Las imágenes no tienen caracteres de texto modificable; tienen muchos puntos pequeños (píxeles) que, en conjunto, forman una imagen del texto. El proceso de OCR examina la imagen de texto y crea a partir de él texto modificable en ordenador, de modo que no tenga que reescribir manualmente el texto.

El OCR toma una imagen: Omnipage s ¿Qué es el reconocimiento óptico de caracteres? y crea texto: Omnipage s2 ¿Qué es el reconocimiento óptico de caracteres?

Durante el OCR, OmniPage utiliza los parámetros seleccionados en la Caja de herramientas de OmniPage para determinar el flujo de texto de una página, y crea zonas ordenadas alrededor de áreas de una página para identificar las zonas que se reconocerán como texto o se retendrán como gráfico. Tras el OCR, se puede guardar el texto resultante en formatos compatibles con una gran variedad de aplicaciones de procesamiento de texto, diseño de página y hojas de cálculo.

Capacidades de OCR en OmniPage

Además del reconocimiento de texto, OmniPage puede mantener los siguientes elementos en un documento durante el OCR.

Gráficos

Ejemplos de gráficos son las fotografías, logotipos y diagramas.

Formato de texto

Los tipos, tamaños y estilos de fuente (por ejemplo, negrita o cursiva) son ejemplos de formato de caracteres de texto. El espaciado entre párrafos, sangrías, tabulaciones, espaciado entre líneas y alineación son ejemplos de formato de párrafo.

Formato de página

La estructura de columnas, la colocación de párrafos, la manipulación de tablas y las posiciones de gráficos son ejemplos de formato de página.

Vistas del Editor de texto

Los resultados del reconocimiento se colocan en el Editor de texto. El editor ofrece tres vistas y permite definir la cantidad de formato que desee ver.

  • OmniPage sólo reconoce caracteres impresos a máquina como, por ejemplo, texto mecanografiado o impreso con láser. Sin embargo, puede mantener texto manuscrito, tal como una firma, como un gráfico.

//

¿Qué es el reconocimiento óptico de caracteres?