Treinamento automático

O treinamento automático, chamado IntelliTrain, usa como entrada as correções feitas pelo usuário durante a revisão. O programa lembra a forma do caractere e a solução alterada para esta forma e procura outras formas semelhantes de caractere no documento.

Para gerar dados de treinamento, a opção Ativar IntelliTrain precisa estar selecionada no painel Revisão da caixa de diálogo Opções. Você também precisa fazer alterações à medida que revisa o texto, ou por meio da caixa de diálogo Revisor do OCR ou usando o menu de atalho em uma palavra suspeita. Outras formas de edição não geram dados de treinamento. Mesmo as alterações de revisão nem sempre geram dados de treinamento – o IntelliTrain decide quais alterações conservar.

Vejamos um exemplo do funcionamento do IntelliTrain.

Omnipage eng train aut1 Treinamento automático

O OmniPage poderia interpretar este bitmap como ‘dircçõcs’. Durante a revisão, você altera ‘dircçõcs’ para ‘direções’. O IntelliTrain lembra a forma deste caractere problemático e a regra: isto não é um ‘c’, é um ‘e’. O IntelliTrain procura outras formas semelhantes de caractere no documento e considera alterá-las:
 

 

Formas semelhantes de caractere para ‘e’ no mesmo documento

Palavras
reconhecidas

Palavras alteradas
pelo IntelliTrain

Omnipage eng train aut2 Treinamento automático

ocstc

oeste

Omnipage eng train aut3 Treinamento automático

Rcalmcntc

Realmente

 

Para que dados de treinamento sejam gerados pelo IntelliTrain:

  1. Abra a caixa de diálogo Opções no painel Revisão e ative o IntelliTrain.

  2. Selecione três ou quatro páginas do início de um documento extenso, cujo tipo de fonte e qualidade são representativos do resto do documento.

  3. Reconheça e depois revise essas páginas. Faça as correções necessárias.

  4. Abra a caixa de diálogo Editar treinamento e examine as formas de caractere e as soluções de OCR atribuídas a elas. Consulte Arquivos de treinamento para obter mais informações sobre a edição de dados de treinamento.

 

Treinamento automático