Aperfeiçoamento de imagem para OCR
Quando suas imagens primárias forem em tons de cinza ou em cores, serão geradas imagens de OCR em preto e branco para fins de OCR. Essas imagens podem ser visualizadas e modificadas. Embora tolere imagens de baixa qualidade, o processo de OCR deve, preferivelmente, conter caracteres bem formados, sem “ruído” (p. ex., pontos, manchas ou linhas laterais sombreadas).
Você pode usar as três ferramentas a seguir da barra de ferramentas SET para aperfeiçoar uma imagem para fins de OCR: Remover Ruído, Brilho do OCR e Ignorar Cor. As alterações se aplicam a toda a imagem, a menos que alguma área seja selecionada.
Remover Ruído
Use esta ferramenta em imagens PB para remover pontos ou manchas de 1 ou 2 pixels. Mova o controle deslizante para obter o melhor resultado. Tome cuidado com a remoção de ruídos, porque se for intensa demais, a própria forma do caractere poderá ser destruída. Escolha entre a remoção de ruído Normal, de Meio-tom e Sal e Pimenta.
Brilho do OCR
Esta ferramenta tem efeito sobre imagens PB, mas só será útil quando a imagem primária for em cores ou tons de cinza, porque o programa gera uma nova imagem de OCR usando a configuração alterada. O aplicativo não consegue aprimorar a qualidade quando a imagem primária é PB. Nesses casos, você deve redigitalizar o documento.
O brilho desempenha um papel importante na precisão do OCR. Após carregar uma imagem, verifique sua aparência. Se os caracteres estiverem espessos e se tocando, use mais brilho. Se os caracteres estiverem finos e com falhas, use menos brilho. Use a ferramenta Brilho do OCR para otimizar a imagem. O diagrama ilustra uma configuração de brilho ideal.
Você também pode usar a ferramenta Brilho do OCR em áreas de imagem selecionadas, para que o brilho possa ser ajustado de formas diferentes em partes diferentes de uma imagem. O ajuste do brilho se refere aos caracteres e ao fundo. Em geral, as margens da imagem são mais escuras. Nesse caso, selecione a área mais escura e clique na ferramenta Brilho do OCR à esquerda da escala de brilho para clareá-la.
Ignorar Cor
É usada para formulários coloridos já impressos em que uma cor diferente define o texto fixo. Isso permite que somente os dados respondidos sejam reconhecidos, ignorando-se instruções de formulário, nomes de itens, caixas e outros formatos.
Você pode selecionar uma cor predefinida (vermelho, verde ou azul) ou uma área colorida na imagem. Use a ferramenta de seleção de área para definir um retângulo, incluindo a cor de fundo da página e a cor a ser ignorada. A cor selecionada ficará invisível na imagem de OCR.
Outras ferramentas afetam tanto a imagem primária quanto a do OCR e podem também melhorar a precisão do OCR.
//