Paramètres de mise en page personnalisée

Pour sélectionner les réglages de mise en page du document, cliquez sur le bouton Mise en page personnalisée… dans l’onglet OCR de la boîte de dialogue Options.

Omnipage tb st options Paramètres de mise en page personnalisée

Ouvrez la boîte de dialogue Options par le biais du bouton Options de la barre d’outils Standard ou à partir du menu Outils.

La boîte de dialogue Mise en page personnalisée vous permet de décrire avec précision l’aspect du document à traiter. Vous contrôlez ainsi au maximum le processus de définition automatique des zones et la mise en page du texte reconnu.

Le traçage automatique des zones s’exécute toujours sur les pages envoyées pour reconnaissance, sur lesquelles aucune zone n’a été tracée. Pour plus d’informations, voir Activation du traçage automatique de zones.

OmniPage offre plusieurs réglages de mise en page de document prédéfinis, qui apparaissent en haut de la liste déroulante du bouton Exécuter OCR. Les réglages disponibles sont présentés ci-dessous :

  • Automatique (réglage par défaut)

  • Colonne unique sans tableau

  • Colonnes multiples sans tableau

  • Colonne unique avec tableau

  • Feuille de calcul

  • Formulaire

  • Document juridique

  • Personnalisé

  • Gabarits de zones (tous les gabarits enregistrés sont disponibles)

Pour plus de détails sur les différents choix, voir Décrire la mise en page originale. Pour plus de détails sur l’utilisation des gabarits de zones, voir Gabarits de zones.

Si aucun des réglages prédéfinis ne correspond à la mise en page du document, vous pouvez choisir l’option Personnalisé, puis ouvrir l’onglet Mise en page personnalisée de la boîte de dialogue Options. Vous précisez dans cette fenêtre le nombre de colonnes, ainsi que la présence ou l’absence de tableaux et de graphiques dans les pages importées. Les valeurs précisées ici ne prennent effet que lorsque vous définissez la description de la mise en page originale sur Personnalisé.

La spécification d’une mise en page personnalisée est particulièrement utile dans le cas d’un travail de reconnaissance important destiné à être exécuté sans intervention de l’utilisateur, en mode de traitement automatique ou avec le module Batch Manager par exemple. Dans ces circonstances, les types de zones créés pour chaque page ne sont pas examinés par l’utilisateur, et il est donc important que la définition automatique des zones soit conforme à vos souhaits.

Choisissez parmi les options suivantes :

Enchaînement du texte

Aucune colonne

Choisissez cette option lorsque les pages importées ne comportent pas d’enchaînements de texte. Les pages reconnues contiendront uniquement des graphiques ou des tableaux. Cette option indique au programme de traiter tout le texte trouvé sur la page comme faisant partie d’un tableau.

Colonne unique

Choisissez cette option si vos pages contiennent une seule colonne de texte ; ce type de mise en page est utilisé généralement dans les rapports et les lettres commerciales.

Auto

Choisissez cette option si les pages importées contiennent du texte disposé en partie en colonnes. Ce réglage indique au programme de rechercher les colonnes présentes. Utilisez l’Éditeur de texte pour déterminer si le texte doit apparaître ou non en colonnes.

Tableaux

Aucun tableau

Choisissez cette option si vous voulez que toutes les zones de texte soient traitées en tant que texte avec enchaînements. Ce réglage convient même aux pages importées contenant un tableau dont vous souhaitez conserver le contenu, mais pas la mise en forme. Le programme ne place pas le texte dans une grille ; le texte est conservé ou non en colonnes, ce qui vous permet de le reformater à votre convenance.

Tableau unique

Le programme tente de détecter un tableau sur chaque page. Il place dans une grille dans l’Éditeur de texte toutes les données séparées par une tabulation. Vous pouvez spécifier par la suite si vous souhaitez exporter le document sous la forme de grille ou de colonnes de texte séparées par tabulation.

Auto

Choisissez cette option pour demander au programme de détecter les tableaux. Ce réglage convient aussi bien aux pages contenant plusieurs tableaux qu’aux documents contenant un petit nombre de tableaux répartis sur quelques pages.

Graphiques

Aucun graphique

Sélectionnez cette option pour désactiver la recherche et la détection des graphiques. La page ne comportera aucune zone de type Graphique. Le programme traitera toutes les zones détectées automatiquement comme des zones de texte et tentera de lire leur contenu. Aucune sorte d’image (une photographie, par exemple) n’est détectée. Le choix de cette option risque de ralentir l’OCR si les pages contiennent des dessins au trait ou des diagrammes. Cette option indique au programme de reconnaître le texte figurant dans un diagramme, ou de ne pas interpréter une zone en tant que graphique, par exemple.

Graphique unique

Choisissez cette option lorsque chaque page d’un document contient un graphique.

Auto

Sélectionnez cette option pour demander au programme de déterminer les éléments à reconnaître en tant que graphiques et en tant que texte. Ce réglage convient aussi bien aux pages contenant plusieurs graphiques qu’aux documents contenant un petit nombre de graphiques répartis sur quelques pages.

Les descriptions de mise en page disponibles qui correspondent aux combinaisons prédéfinies de réglages personnalisés sont récapitulées ci-dessous :

Description de la mise en page

Enchaînement du texte

Tableaux

Graphiques

Automatique

Auto

Auto

Auto

Colonne unique sans tableau

Colonne unique

Aucun tableau

Auto

Colonnes multiples sans tableau

Auto

Aucun tableau

Auto

Colonne unique avec tableau

Colonne unique

Auto

Auto

Feuille de calcul

Aucune colonne

Tableau unique

Aucun graphique

La modification de la description de mise en page ne change pas les valeurs personnalisées. Autrement dit, vous pouvez définir un réglage personnalisé unique, toujours disponible, ou créer de nouveaux réglages personnalisés au fur et à mesure des besoins.

Paramètres de mise en page personnalisée