O texto não é reconhecido corretamente
Tente estas soluções se uma parte do documento original não for convertida para texto adequadamente durante o OCR.
-
Observe a imagem da página e assegure-se de que todas as áreas de texto estão associadas a zonas de texto. Se uma área não estiver delimitada por uma zona, ela será ignorada durante o OCR.
-
Certifique-se de que as zonas de texto estão identificadas corretamente. Identifique novamente os tipos de zona e o conteúdo, se necessário, e efetue OCR no documento novamente. Consulte Tipos de zonas e conteúdo para obter mais informações.
-
Certifique-se de que você não carregou um gabarito inadequado por engano. Se as bordas de zona cortarem o texto, o reconhecimento será prejudicado.
-
Ajuste os controles deslizantes de brilho e contraste no painel Scanner da caixa de diálogo Opções. Você pode precisar experimentar combinações de configurações diferentes para chegar aos resultados desejados.
-
Aperfeiçoe imagens para fins de OCR usando as ferramentas SET.
-
Verifique a resolução na imagem original. Passe o cursor sobre uma miniatura de página para exibir uma janela popup. Se a resolução estiver significativamente acima ou abaixo de 300 dpi, provavelmente o reconhecimento será afetado.
-
Certifique-se de que os idiomas corretos do documento estão selecionados no painel OCR na caixa de diálogo Opções. Somente os idiomas incluídos no documento devem ser selecionados. Em particular, definir um idioma asiático para textos não-asiáticos (e vice-versa) provavelmente produzirá resultados inúteis.
-
Se você tiver ativado a opção ‘Detectar automaticamente idioma único’, a análise automática atribuirá um idioma a cada página de entrada; faça um novo reconhecimento manual das páginas com vários idiomas ou das páginas que tenham sido atribuídas a um idioma errado.
-
Os resultados do reconhecimento em japonês, coreano e chinês só podem ser visualizados e salvos se seu sistema tiver suporte para idiomas do leste asiático.
-
Ative o IntelliTrain e faça algumas correções. Provavelmente, isto ajudará com as fontes estilizadas ou com documentos deteriorados de maneira uniforme. Se o IntelliTrain estava funcionando, experimente desativá-lo – em alguns tipos de documentos deteriorados, ele pode não ajudar.
-
Execute treinamento manual ou edite o treinamento existente para remover treinamentos mal sucedidos.
-
Se você usar True Page como nível de formatação do Editor de Texto ou para exportação, o texto reconhecido será colocado em caixas de texto ou quadros. Pode haver texto oculto se houver uma caixa de texto muito pequena. Para visualizar o texto, coloque o cursor na caixa de texto e use as teclas de seta no seu teclado para rolar para a parte superior, inferior, esquerda ou direita da caixa.
-
Verifique se há poeira, sujeira ou arranhões no vidro, nos espelhos e nas lentes de seu scanner. Limpe-os se necessário.
-
O OmniPage reconhece apenas caracteres impressos por máquinas, como impressão a laser ou texto escrito por máquina de escrever. Ele pode lidar com caracteres matriciais, apesar de que a precisão pode ser inferior em textos de qualidade baixa. Ele não pode ler texto escrito à mão. Entretanto, pode reter assinaturas e outros textos escritos à mão como uma imagem.