Apprentissage

L’apprentissage correspond à la procédure permettant de modifier les solutions d’OCR attribuées aux caractères de l’image. L’apprentissage permet d’améliorer la précision de la reconnaissance dans les documents longs et de présentation relativement uniforme. En général, il est conseillé de soumettre à l’apprentissage les formes des caractères et des symboles qui sont reconnues de manière incorrecte ou non reconnues. L’apprentissage automatique (« IntelliTrain ») déduit les données d’apprentissage à partir des corrections apportées par l’utilisateur pendant la vérification du texte reconnu dans l’Éditeur de texte. L’apprentissage manuel permet à l’utilisateur de déclarer au programme de nouveaux caractères.

Vous pouvez enregistrer l’ensemble des données d’apprentissage dans un fichier d’apprentissage, en vue de leur réutilisation ultérieure. Un « fichier d’apprentissage » contient un ensemble de formes de caractères, chacune associée à une solution d’OCR. Lorsqu’un fichier d’apprentissage est chargé, ces formes sont comparées aux problèmes de forme rencontrés sur les pages soumises à la reconnaissance. Les solutions d’OCR assignées sont alors appliquées en conséquence.

Des données d’apprentissage peuvent être générées et utilisées sans être enregistrées dans un fichier d’apprentissage. Les données d’apprentissage non enregistrées sont stockées dans un document OmniPage. Si vous n’enregistrez pas le document sous la forme d’un fichier OPD et que vous souhaitez conserver les données d’apprentissage dans un fichier, vous devez les enregistrer avant de fermer le document. Lorsque vous fermez un document, ou basculez vers un autre document, alors que des données d’apprentissage n’ont pas été enregistrées, une boîte de dialogue apparaît, vous invitant à les enregistrer.

La fonction d’apprentissage n’est pas compatible avec les caractères japonais, coréen ou chinois. N’effectuez pas d’apprentissage manuel et, avant de lancer la reconnaissance sur des textes dans ces langues, assurez-vous que l’option IntelliTrain est désactivée dans l’onglet Vérification de la boîte de dialogue Options. Vérifiez également qu’aucun fichier d’apprentissage n’est chargé. En effet, l’OCR de textes en langues asiatiques risquerait d’en rendre le contenu inexploitable.

//

Apprentissage