À propos de l’extraction des données de formulaires

Omnipage pro À propos de lextraction des données de formulaires

Cette rubrique d’aide ne concerne que la version Professional d’OmniPage.

OmniPage vous permet d’extraire des données provenant de plusieurs formulaires remplis, afin de les exploiter dans des bases de données ou des feuilles de calcul. Dans OmniPage, une étape de flux de travail permet l’extraction de données de formulaires.

La nature et l’emplacement des éléments de formulaires sont définis dans un fichier de modèle de formulaire. Pour pouvoir être traités, les formulaires doivent avoir été remplis électroniquement ou par un moyen mécanique. Il n’est pas possible d’extraire automatiquement des données de formulaires remplis à la main. Les données extraites sont enregistrées dans un fichier texte avec données séparées par des virgules (.csv) qui peut être ouvert comme une feuille de calcul dans un tableur. Chaque élément de formulaire correspond à une colonne de tableau ; les données extraites de chaque formulaire sont affichées sur une ligne distincte. Les éléments de formulaires sont généralement des champs de texte remplissables, des cases à cocher et des boutons radio.

Fichiers de modèles de formulaires

Le modèle de formulaire est un formulaire PDF actif (pas une image) présentant les différents éléments figurant sur les formulaires à traiter. Il peut être rempli ou non. Il peut également comporter plusieurs pages, auquel cas un intervalle de pages pourra être spécifié afin d’éliminer les pages inadéquates, comme celles contenant des instructions de remplissage. Pour connaître la façon dont un intervalle de pages est interprété selon les différents types de traitements, voir ci-dessous.

Vous pouvez utiliser OmniPage Professional ou un éditeur PDF tel que Nuance PDF Converter Professional pour générer un fichier de modèle. Consultez la rubrique À propos de la création de formulaires et enregistrez le formulaire au format PDF.

Création du flux de travail

Vous devez utiliser l’Assistant Flux de travail. En règle générale, votre flux de travail comportera trois étapes, à savoir : une étape de chargement de fichiers, une étape d’extraction des données de formulaires et une étape d’enregistrement. Consultez la rubrique Extraire des données de formulaires dans l’Assistant Flux de travail.

Traitement de formulaires PDF remplis

Ce traitement concerne tous les formats PDF, à l’exception du format PDF Image. Il peut s’agir de formulaires PDF statiques ou actifs. Dans ce cas, chaque formulaire doit être enregistré dans un fichier PDF distinct. Si un intervalle de pages a été défini pour le modèle, cet intervalle est appliqué à tous les fichiers PDF traités.

Traitement de formulaires remplis enregistrés en tant que fichiers image

Ce traitement concerne tous les formats de fichiers image pris en charge par OmniPage, y compris le format PDF Image. Dans ce cas, les fichiers à traiter doivent contenir le nombre de pages défini par l’intervalle de pages choisi pour le fichier modèle. Par exemple, si l’intervalle de pages “2 à 4″ a été défini pour le modèle, chaque formulaire à traiter doit contenir trois pages.

Chaque formulaire à traiter peut être un fichier indépendant, mais il est également possible de traiter un groupe de formulaires regroupés dans un fichier image de plusieurs pages. Dans l’exemple précédent, les pages 1-3, 4-6, 7-9, etc. seront considérés comme des formulaires distincts.

Traitement de formulaires numérisés remplis

Pour un résultat optimal, nous vous recommandons de numériser des formulaires remplis à l’aide d’un chargeur automatique. Numérisez uniquement les pages des formulaires remplis, telles que défini dans le modèle de formulaire (y compris par l’intervalle de pages, le cas échéant). Lors de la numérisation d’une importante quantité de formulaires multipages, aucune page de séparation n’est nécessaire.

//

À propos de l’extraction des données de formulaires