Retoucher une image pour OCR
Des images OCR en noir et blanc (N/B) sont générées pour les images primaires à niveaux de gris ou couleur, à des fins d’OCR. Vous pouvez afficher et modifier les images OCR créées. Le processus OCR peut traiter les images de qualité médiocre, mais il est préférable que les images traitées contiennent des caractères lisibles sans parasites (points, taches ou autres marques).
Pour améliorer la qualité d’une image pour la reconnaissance, utilisez les trois outils suivants, disponibles dans la barre d’outils SET : Nettoyer, Luminosité d’OCR et Ignorer couleur. Les modifications seront appliquées sur toute l’image, sauf si des zones spécifiques ont été sélectionnées.
Nettoyer
Cet outil permet de supprimer les parasites de 1 ou 2 pixels des images en noir et blanc. Déplacez le curseur pour améliorer le résultat. Utilisez cette fonction avec prudence car, si vous choisissez un niveau d’intensité trop élevé, vous risquez d’altérer la forme du caractère. Les options de nettoyage disponibles sont les suivantes : Normal, Demi-teintes, Poivre et sel.
Luminosité d’OCR
Cet outil, qui s’applique à l’image en noir et blanc, est utile uniquement lorsque l’image primaire est en couleur ou à niveaux de gris, car le programme génère une nouvelle image OCR en fonction des nouveaux réglages choisis. Cette fonction n’a aucun effet sur les images primaires en noir et blanc. Vous devez, dans ce dernier cas, numériser à nouveau le document.
La luminosité joue un rôle important dans la précision de l’OCR. Dès le chargement d’une image, vérifiez son aspect. Si les caractères sont gras et compacts, augmentez la luminosité. Si les caractères sont fins et tronqués, assombrissez l’image. Utilisez l’outil Luminosité de l’OCR pour optimiser l’image. Le diagramme ci-dessous illustre le réglage de luminosité optimal.
Vous pouvez également utiliser l’outil Luminosité d’OCR sur des zones spécifiques de l’image et définir ainsi des réglages de luminosité différents sur différentes parties d’une image. Le réglage de luminosité s’applique à la fois aux caractères et au fond. Les marges de l’image apparaissent généralement plus sombres. Si tel est le cas, sélectionnez la zone la plus sombre de l’image, cliquez sur l’outil Luminosité d’OCR, puis déplacez la glissière vers la gauche pour augmenter la luminosité d’OCR.
Ignorer couleur
Cet outil s’applique aux formulaires en couleur pré-imprimés, pour lesquels les textes fixes apparaissent dans une couleur spécifique. Les données collectées auprès des correspondants peuvent ainsi être reconnues indépendamment des instructions du formulaire, des noms d’éléments, des zones de texte et autres formes intégrées au formulaire.
Vous pouvez sélectionner une couleur prédéfinie (rouge, vert ou bleu) ou une zone colorée sur l’image. Utilisez l’outil Sélectionner une zone pour tracer un rectangle contenant la couleur de fond et la couleur à ignorer La couleur sélectionnée deviendra totalement invisible sur l’image OCR.
Les autres outils ont un effet sur l’image primaire et l’image OCR. Ils peuvent également permettre d’améliorer la précision de reconnaissance.
//