Vérifier l’OCR

À l’issue de la reconnaissance d’une page, les résultats de l’opération apparaissent dans l’Éditeur de texte. La vérification de l’OCR démarre automatiquement si l’option correspondante a été activée dans l’onglet Vérification de la boîte de dialogue Options. Vous pouvez également lancer la vérification manuellement dès que le programme n’est pas occupé. Le module de vérification s’arrête sur tout mot douteux (mots marqués par une couleur). Les mots marqués sont destinés à être contrôlés pendant la vérification. Au fur et à mesure que les mots douteux affichés dans l’Éditeur de texte sont vérifiés, les marques de couleur les accompagnant disparaissent.

Marques

Les marques se présentent sous la forme de traits ondulés rouges et de mises en surbrillance jaune sombre. Les traits de soulignement ondulés rouges désignent à la fois des mots absents du dictionnaire et des mots douteux. Les mises en surbrillance jaune sombre indiquent des caractères douteux.

Mots absents du dictionnaire : Ces mots ont été reconnus avec certitude par OmniPage, mais ils ne figurent dans aucun des dictionnaires actifs (standard, utilisateur ou spécialisés). Cette mise en valeur apparaît uniquement avec les langues associées à un dictionnaire. Pour savoir quelles langues sont associées à un dictionnaire intégré, cliquez ici.

Exemple de mot absent des dictionnaires :

Omnipage eng non dict%20word Vérifier lOCR

Ces mots sont repérés seulement si la case Marquer tous les mots absents des dictionnaires de l’onglet Vérification a été cochée. Les mots absents des dictionnaires apparaîtront probablement soulignés d’un trait rouge, même s’ils ont été reconnus avec certitude par le moteur de reconnaissance. Le marquage est également appliqué aux mots saisis ou collés dans l’Éditeur de texte après la reconnaissance. Si cette option est désactivée, la vérification ne s’arrêtera que sur les mots douteux, marqués d’un trait de soulignement rouge et éventuellement d’une mise en surbrillance jaune sombre.

Mots avec caractère(s) douteux : il peut s’agir de mots dont certains caractères n’ont pas pu être reconnus, ou qui figurent dans les dictionnaires actifs tout en contenant un ou plusieurs caractères reconnus avec une moins grande certitude.

Exemple de caractère douteux :

Omnipage eng suspect%20char Vérifier lOCR

Les caractères impossibles à reconnaître sont remplacés par un « caractère de rejet » rouge. (Le tilde ~ est le caractère de rejet par défaut, mais vous pouvez spécifier tout autre caractère dans l’onglet OCR de la boîte de dialogue Options.)

Mots douteux : Ces mots sont généralement absents des dictionnaires et contiennent un ou plusieurs caractères douteux, mais ils peuvent également être douteux pour d’autres raisons. Les mots qui sont absents des dictionnaires mais qui sont reconnus avec certitude par les logiciels d’OCR (ou qui apparaissent à plusieurs reprises dans un document) ne sont pas nécessairement soulignés d’un trait rouge.

Exemple de mot douteux :

Omnipage eng suspect%20word Vérifier lOCR

Ces marques peuvent être affichées ou masquées à partir de l’onglet Éditeur de texte de la boîte de dialogue Options. Chaque fois que vous lancez la vérification ou que vous choisissez Rechercher prochain mot douteux, les marques sont réactivées. Les marques ne sont pas exportées avec le texte mais elles sont enregistrées dans le document OmniPage (même si elles sont masquées).

  • Il est conseillé d’insérer dans un dictionnaire utilisateur votre nom, votre adresse, les noms de société et de produits ou les abréviations que vous employez régulièrement, pour éviter que leur présence ne ralentisse la vérification.

Pour vérifier et corriger les résultats de l’OCR

  1. Cliquez sur le bouton Vérifier l’OCR Omnipage tb st proofread Vérifier lOCR, ou choisissez vérifier l’=”" ocr=”" boîte de dialogue vérification de l’=”" ocr=”" ignorer tout (pour ignorer toutes les occurrences de ce mot dans le document) : omnipage s’=”" arr=”" ête=”" sur=”" le=”" prochain=”" mot=”" douteux.=”"

    remplacer ou remplacer tout, et le prochain mot douteux s’=”" affiche=”" automatiquement.=”"

lors de la vérification, vous pouvez passer au volet de l’=”" éditeur=”" de=”" texte=”" pour=”" y=”" effectuer=”" les=”" corrections=”" requises.=”" pour=”" relancer=”" la=”" v=”" érification,=”" utilisez=”" le=”" bouton=”"

si vous avez saisi ou collé manuellement du texte après la vérification, vous pouvez choisir revérifier la page actuelle dans le menu outils.

si un mot est coupé à la fin d’=”" une=”" ligne=”" ,=”" le=”" module=”" de=”" v=”" érification=”" tentera=”" de=”" regrouper=”" les=”" deux=”" parties=”" du=”" mot.=”" si=”" le=”" mot=”" est=”" toujours=”" douteux=”" ,=”" la=”" fen=”" être=”" d=”" ‘image affiche les deux parties du mot. le module de vérification recollera les deux parties de l’=”" image=”" afin=”" de=”" reformer=”" le=”" mot=”" entier.=”"

ou appuyez sur F4 pour rechercher le mot douteux suivant sans afficher la fenêtre de vérification.

 

  • Si les marques n’étaient pas visibles dans l’Éditeur de texte lorsque vous avez lancé la vérification, ou si vous avez choisi Rechercher prochain mot douteux, les marques apparaissent et restent visibles après la vérification.

 

  • Les pages entièrement vérifiées sont affectées des icônes Omnipage icon proofed Vérifier lOCR et Omnipage icon mod proofed Vérifier lOCR (sur leur vignette et dans le Gestionnaire de documents).

 

  • La vérification de l’OCR ne doit pas être utilisée sur des documents en japonais, chinois ou coréen. Désactivez la vérification automatique de l’OCR sous Outils > Options > Vérification.

 

 

Vérifier l’OCR