Exécuter la reconnaissance

La reconnaissance optique de caractères (OCR) est une opération qui consiste à convertir une image électronique en texte éditable sur ordinateur. Dans la documentation et l’aide en ligne OmniPage, les termes reconnaissance et OCR sont utilisés de manière interchangeable. Pour reconnaître un document, vous pouvez cliquer sur le bouton Lancer (traitement automatique) ou sur le bouton Exécuter l’OCR (traitement manuel). Pour un traitement à l’aide de flux de travail, utilisez l’étape Reconnaître des images.

  • OmniPage reconnaît uniquement les caractères imprimés, tels que les sorties imprimante ou le texte tapé. Vous pouvez toutefois conserver un bloc de texte manuscrit (une signature, par exemple), en l’entourant d’une zone de type Graphique.

Pour exécuter l’OCR en traitement automatique

  1. Sélectionnez les paramètres nécessaires au traitement des pages dans les listes suivantes :

    • Liste Importer une page

    • Liste Description de la mise en page

    • Liste Exporter les résultats

    • Onglets de la boîte de dialogue Options (affichable à partir du menu Outils)

  1. Cliquez sur le bouton Omnipage tbxb start Exécuter la reconnaissance Lancer avec 1-2-3 sélectionné dans la liste déroulante Flux de travail.

Les pages sont importées, soumises au traçage automatique des zones et reconnues l’une après l’autre. Si vous l’avez configurée, la vérification de l’OCR démarre ensuite. Lorsque la dernière opération (reconnaissance ou vérification) est terminée, la boîte de dialogue d’export apparaît.

Pour exécuter l’OCR en traitement manuel

  1. Sélectionnez 1-2-3 dans la liste déroulante Flux de travail.

  2. Dans la liste Importer une page, sélectionnez le mode d’acquisition des pages (source) : numérisation à l’aide du scanner connecté ou chargement de fichiers image existants.

  3. Lorsque vous cliquez sur le bouton Importer une page (n°1), les pages sont importées dans OmniPage à partir de la source spécifiée.

  4. Cliquez au besoin sur l’icône Retoucher l’image Omnipage tb imt ienhance Exécuter la reconnaissance de la barre d’outils Image afin de retoucher votre image à des fins d’OCR. Effectuez les modifications de votre choix, puis cliquez sur Page prête.

  5. Dans les différents onglets de la boîte de dialogue Options, choisissez les autres paramètres requis (par exemple la ou les langues de reconnaissance).

  6. Dans la liste Description de la mise en page, sélectionnez la valeur décrivant le mieux les caractéristiques des pages entrantes (si vous préférez que cette analyse soit effectuée par OmniPage, sélectionnez Automatique).

  7. Si vous le souhaitez, tracez les zones manuellement (OmniPage trace ensuite des zones automatiquement sur toute page que vous laissez sans zone).

  8. Cliquez sur Exécuter l’OCR Omnipage tbxb ocr Exécuter la reconnaissance pour lancer la reconnaissance de la page actuelle ou des pages sélectionnées. Cette configuration vous permet de modifier les paramètres pour chaque page.

  9. La vérification de l’OCR démarre ensuite (si elle a été demandée).

  10. Exportez les résultats des pages reconnues : sélectionnez la cible requise dans la liste Exporter les résultats et cliquez sur Exporter les résultats (n°3).

Le document est conservé dans OmniPage pour pouvoir être modifié ou enregistré avec des paramètres différents, recevoir d’autres pages ou être reconnu à nouveau.

Pour exécuter l’OCR à l’aide de flux de travail

  • Créez un flux de travail dans l’Assistant Flux de travail.

  • Ajoutez l’étape Reconnaître des images après celle d’importation ou de numérisation d’images ou d’ouverture d’un document OmniPage contenant des images de pages, puis exécutez le flux de travail.

Pour plus de détails sur le traitement automatique, consultez la rubrique Premiers pas.

Vous pouvez importer des fichiers à l’aide du Chargeur express.

Consultez les rubriques Traitement automatique, Traitement manuel et Modes de traitement.

//

Exécuter la reconnaissance