O que é OCR?

O reconhecimento óptico de caracteres (OCR) é o processo de extrair texto da imagem de uma página. A imagem da página é uma figura eletrônica do texto e pode trazer outros elementos, como títulos e figuras. A imagem da página pode ser obtida mediante a digitalização de um documento em papel ou a abertura de um arquivo de imagem eletrônica. Esses arquivos também podem ser recebidos por e-mail, de uma máquina de fax ou do seu scanner.

Essas imagens não possuem caracteres de texto editáveis; elas possuem diversos pontos minúsculos (pixels) que juntos formam uma figura do texto. O processo de OCR examina a imagem do texto e cria um texto editável por computador a partir dela, para que você não tenha que redigitar o texto manualmente.

O OCR obtém a imagem: Omnipage s O que é OCR? e cria um texto: Omnipage s2 O que é OCR?

Durante o OCR, o OmniPage usa as configurações selecionadas na Caixa de ferramentas do OmniPage para determinar o fluxo de texto em uma página e cria zonas ordenadas ao redor de áreas da página para identificar o que será reconhecido como texto ou mantido como imagem. Depois do OCR, você pode salvar o texto resultante em vários aplicativos de processamento de texto, de editoração eletrônica ou planilhas.

Os recursos de OCR no OmniPage

Além de reconhecer texto, o OmniPage pode manter os seguintes elementos de um documento durante o processo de OCR.

Imagens

Fotos, logos e desenhos são exemplos de imagens.

Formatação de texto

Tipos, tamanhos e estilos de fontes (como negrito ou itálico) são exemplos de formatação dos caracteres do texto. O espaçamento entre parágrafo, recuos, tabulações, espaçamento e alinhamento de linha são exemplos de formatação de parágrafo.

Formatação de página

A estrutura das colunas, colocação de parágrafos, tratamento de tabelas e localização de imagens são exemplos de formatação de página.

Visualizações do Editor de Texto

Os resultados do reconhecimento são apresentados no Editor de Texto. Ele oferece três visualizações, o que lhe permite definir quais elementos da formatação você quer exibir.

  • O OmniPage só reconhece caracteres impressos por máquina, como texto impresso a laser ou datilografado. Entretanto, ele é capaz de preservar texto escrito à mão, como uma assinatura, na forma de uma imagem.

//

O que é OCR?