Training automatico

Il training automatico, chiamato IntelliTrain, riceve l’input dalle correzioni effettuate dall’utente durante la verifica. Il programma ricorda la forma di un carattere e la soluzione modificata per questa forma, e ricerca altre forme simili nel documento.

Per generare dati di training, è necessario selezionare Attiva IntelliTrain nella scheda Verifica della finestra di dialogo Opzioni. Si devono anche effettuare modifiche durante la verifica del testo, sia mediante la finestra di dialogo OCR Proofreader o utilizzando il menu di scelta rapida su una parola incerta. Modifiche di altro tipo non generano dati di training, e anche le modifiche apportate da questa finestra non sempre generano dati di training: IntelliTrain decide quali modifiche conservare.

L’esempio che segue illustra come funziona IntelliTrain.

Omnipage eng train aut1 Training automatico

OmniPage potrebbe leggere questo bitmap come ‘rcndcrla’. Durante la verifica ‘rcndcrla’ è stato modificato in ‘renderda’. IntelliTrain ricorda la forma di questo carattere incerto e adotta la regola: questa non è una ‘c’, ma una ‘e’. IntelliTrain va a cercare altre forme di caratteri simili nel documento e procede alla loro modifica:
 

 

Forme simili per ‘e’ nel medesimo documento

Riconosciute
parole

Parole modificate
dal IntelliTrain 

Omnipage eng train aut2 Training automatico

dcllc

delle

Omnipage eng train aut3 Training automatico

apprcndcrc

apprendere

 

Per generare dati di training con IntelliTrain:

  1. Aprire la scheda Verifica della finestra di dialogo Opzioni e abilitare IntelliTrain.

  2. Selezionare tre o quattro pagine iniziali di un documento lungo, che siano rappresentative, per tipo di carattere e qualità, dell’intero documento.

  3. Riconoscere tali pagine e poi sottoporle a verifica. Effettuare le correzioni necessarie.

  4. Aprire la finestra di dialogo Modifica training ed esaminare le forme dei caratteri e le soluzioni OCR associate ad esse. Vedere File di training per ulteriori informazioni sulla modifica dei dati di training.

 

Training automatico