Treinamento automático
O treinamento automático, chamado IntelliTrain, usa como entrada as correções feitas pelo usuário durante a revisão. O programa lembra a forma do caractere e a solução alterada para esta forma e procura outras formas semelhantes de caractere no documento.
Para gerar dados de treinamento, a opção Ativar IntelliTrain precisa estar selecionada no painel Revisão da caixa de diálogo Opções. Você também precisa fazer alterações à medida que revisa o texto, ou por meio da caixa de diálogo Revisor do OCR ou usando o menu de atalho em uma palavra suspeita. Outras formas de edição não geram dados de treinamento. Mesmo as alterações de revisão nem sempre geram dados de treinamento – o IntelliTrain decide quais alterações conservar.
Vejamos um exemplo do funcionamento do IntelliTrain.
O OmniPage poderia interpretar este bitmap como ‘dircçõcs’. Durante a revisão, você altera ‘dircçõcs’ para ‘direções’. O IntelliTrain lembra a forma deste caractere problemático e a regra: isto não é um ‘c’, é um ‘e’. O IntelliTrain procura outras formas semelhantes de caractere no documento e considera alterá-las:
Formas semelhantes de caractere para ‘e’ no mesmo documento |
Palavras |
Palavras alteradas |
|
ocstc |
oeste |
|
Rcalmcntc |
Realmente |
Para que dados de treinamento sejam gerados pelo IntelliTrain:
-
Abra a caixa de diálogo Opções no painel Revisão e ative o IntelliTrain.
-
Selecione três ou quatro páginas do início de um documento extenso, cujo tipo de fonte e qualidade são representativos do resto do documento.
-
Reconheça e depois revise essas páginas. Faça as correções necessárias.
-
Abra a caixa de diálogo Editar treinamento e examine as formas de caractere e as soluções de OCR atribuídas a elas. Consulte Arquivos de treinamento para obter mais informações sobre a edição de dados de treinamento.