Training

Il processo di training consiste nel modificare le soluzioni OCR assegnate alle forme dei caratteri nell’immagine. Il training permette di migliorare la precisione di riconoscimento su documenti lunghi e con caratteri di stile simile. Può essere utile eseguire il training su qualsiasi carattere o simbolo che venga ripetutamente riconosciuto in modo errato o non venga riconosciuto, nonché su caratteri e simboli poco comuni. Il training automatico, detto IntelliTrain, ricava dati di training dalle correzioni apportate durante il controllo ortografico nell’editor del testo. Il training manuale consente di eseguire il training per i caratteri selezionati, dopo il riconoscimento.

È possibile salvare tutti i dati del training in un file di training da caricare e usare in futuro quando necessario. Un file di training contiene un insieme di forme di caratteri, ciascuna associata a una soluzione dell’OCR. Quando viene caricato un file di training, queste forme memorizzate sono confrontate con forme dubbie trovate sulle pagine delle quali è in corso il riconoscimento. Le soluzioni associate ad esse vengono applicate ove appropriato.

I dati di training possono esistere ed essere utilizzati anche se non vengono salvati in un file di training. I dati di training non salvati vengono conservati all’interno di un documento OmniPage. Se tuttavia non si salva il documento come file OPD, ma si desidera conservare i dati di training in un file, allora è necessario salvarli prima di chiudere il documento. Quando si chiude un documento o si passa ad un altro documento senza aver eseguito il salvataggio dei dati del training, viene visualizzata una finestra di dialogo che consente di effettuare l’operazione.

Il training non può essere applicato alle lingue giapponese, cinese e coreana. Non eseguire il training manuale e, prima di riconoscere queste lingue, verificare che IntelliTrain sia disattivato nel pannello Controllo ortografico della finestra di dialogo Opzioni. Verificare altresì che nessun file di training sia caricato, poiché l’OCR delle lingue dell’Asia orientale rischierebbe di comprometterne il contenuto.

//

Training