Assistant Flux de travail – Reconnaître des images

Description de la mise en page : Pour sélectionner une description de mise en page pour les pages entrantes, de manière à influencer le traçage automatique de zones effectué par OmniPage. Sélectionnez Automatique pour laisser faire OmniPage. Cette solution est généralement la meilleure, surtout lorsque le document comporte différents types de mise en page. Si les pages sont similaires, sélectionnez le réglage qui correspond le mieux à l’ensemble du document.

Optimiser l’OCR pour la vitesse / la précision : Sélectionnez cette option pour privilégier la vitesse ou la précision lors de la reconnaissance. Si vous privilégiez la vitesse sur des documents de bonne qualité, vous obtiendrez tout de même de bons résultats.

Langues et dictionnaires

Langues du document : Dans cette liste, sélectionnez la ou les langues présentes dans les pages à reconnaître. Pour améliorer l’OCR, sélectionnez uniquement la ou les langues figurant dans les pages à traiter. Les langues du haut correspondent à vos dernières sélections ; les langues qui suivent sont présentées par ordre alphabétique. Pour sélectionner une langue, tapez la lettre correspondante.

Dictionnaire utilisateur : Sélectionnez le dictionnaire à utiliser pour vérifier les résultats d’OCR. Le dictionnaire Personnalisé peut également figurer dans cette liste ; il s’agit du dictionnaire utilisateur par défaut de Microsoft Word.

Dictionnaires spécialisés : Sélectionnez cette option pour sélectionner un ou plusieurs dictionnaires spécialisés (juridique, médecine, informatique, etc.). OmniPage consulte les dictionnaires spécialisés en plus des dictionnaires standard et utilisateur.

Vérifier les choix de langues : Sélectionnez cette option pour afficher des avertissements en cas de conflits entre les langues sélectionnées et les langues détectées dans les documents à traiter. Cette option fait la distinction entre les catégories suivantes : japonais, chinois, coréen et langues « non asiatiques ». Consultez la rubrique Reconnaissance des langues asiatiques.

Choix d’une langue unique : Lorsque vous sélectionnez cette option, vous n’avez pas besoin de définir préalablement les langues de vos documents. Elle s’avère particulièrement utile pour le traitement autonome de documents susceptibles de comporter plusieurs langues. Elle affecte une langue à chaque page entrante. Consultez la rubrique Options d’OCR. Cochez cette case pour afficher les langues prises en charge. Lorsque cette option est activée, vous ne pouvez pas définir de langues manuellement.

Groupe de langues : Cette option vous permet de définir les groupes de langues pris en compte pour la détection de langue unique. Vous pouvez choisir les langues basées sur l’alphabet latin et associées à un dictionnaire, les quatre langues asiatiques, ou ces deux groupes.

Polices et caractères

Mappage des polices… : Cliquez sur ce bouton pour définir les mappages entre polices OmniPage et polices détectées dans le document. Cette option ne s’applique qu’aux langues « non asiatiques ».

Caractère de rejet : Tapez le caractère qui devra être utilisé par OmniPage en remplacement des caractères non reconnus. Les caractères de rejet (par défaut, le tilde <~>) apparaissent en rouge dans le document reconnu.

Caractères supplémentaires : Entrez ici les autres caractères accentués acceptés lors de la reconnaissance, en plus de ceux validés par la/les langue(s) que vous avez choisie(s). Entrez ces caractères à l’aide de votre clavier ou depuis la table de caractères. Le bouton avec trois points permet d’ouvrir cette table de caractères.

Éléments à conserver

Rechercher les en-têtes/bas de page : Cochez cette case pour que les en-têtes et les bas de page soient détectés et disponibles lors de l’export ; décochez-la pour traiter les en-têtes et les pieds de page comme du texte ordinaire.

Rechercher les hyperliens : Sélectionnez cette option pour détecter les hyperliens, les afficher sous la forme de liens actifs dans l’Éditeur de texte et les conserver à l’export.

Conserver couleur de police et de fond : Si vous cochez cette case, le programme détecte et conserve les caractères et les fonds de couleur, les affiche dans l’Éditeur de texte et les met à votre disposition lors de l’export. Cette option est grisée si l’option Optimiser l’OCR pour la vitesse est activée.

Conserver le texte inversé : Sélectionnez cette option pour conserver du texte inversé (lettres blanches ou claires sur fond noir ou foncé). Désélectionnez-la si vous préférez que le texte inversé soit converti en texte normal. Cette option est grisée si l’option Optimiser l’OCR pour la vitesse est activée.

Utiliser les polices du PDF : Sélectionnez cette option pour ignorer chaque fois que possible vos instructions de mappage des polices lors de l’ouverture de fichiers PDF. OmniPage analyse les polices utilisées dans les fichiers PDF, recherche ces polices sur votre système et les applique au document reconnu.

 

Assistant Flux de travail – Reconnaître des images