Formulardaten extrahieren

Omnipage pro Über Formulardatenextraktion

Dieses Thema bezieht sich nur auf OmniPage Professional.

Formulardaten können aus einem Satz ausgefüllter Formulare extrahiert und zur weiteren Verarbeitung in Datenbanken oder Arbeitsblätter kopiert werden. Das Extrahieren von Formulardaten wird als Schritt in einem Arbeitsprozess von OmniPage ausgeführt.

Layout und Position von Formularelementen werden mithilfe einer Formular-Vorlagendatei definiert. Die zu verarbeitenden Formulare müssen per Computer oder Schreibmaschine ausgefüllt sein, nicht handschriftlich. Die Ausgabe erfolgt als Datei mit kommagetrennten Werten (csv), die als Tabelle in einem Tabellenkalkulationsprogramm geöffnet werden kann. Jedes Formularelement wird zu einer Tabellenspalte, und die Daten aus jedem Formular werden in einer eigenen Zeile eingefügt. Die Formularelemente sind im Allgemeinen ausfüllbare Textfelder, Ankreuzkästchen und Optionsfelder.

Formular-Vorlagendateien

Die Formularvorlage muss ein aktives, nicht bildbasiertes PDF-Formular sein, das die Formularelemente der zu verarbeitenden Formulare korrekt wiedergibt. Sie kann ein ausgefülltes oder unausgefülltes Formular sein. Sie kann mehrere Seiten umfassen, und zum Ausschluss von Seiten ohne Formularinhalt, wie z. B. Ausfüllanleitungen, kann ein Seitenbereich angegeben werden. Im Folgenden wird erläutert, wie bei den verschiedenen Verarbeitungsformen ein Seitenbereich interpretiert wird.

Wenn Sie eine Vorlagendatei selbst anlegen müssen, können Sie hierzu OmniPage Professional oder einen PDF-Editor wie Nuance PDF Converter Professional verwenden. Siehe Hilfethema Formularverarbeitung. Speichern Sie das Formular als PDF-Datei.

Arbeitsprozess einrichten

Sie müssen den Arbeitsprozess-Assistenten verwenden. Im Allgemeinen sind hierbei drei Schritte beteiligt: ein Schritt zum Laden der Dateien, ein Schritt zum Extrahieren der Formulardateien und ein Schritt zum Speichern. Siehe Formulardaten extrahieren im Arbeitsprozess-Assistenten.

Ausgefüllte PDF-Dateien verarbeiten

Hierzu gehören alle PDF-Dateitypen außer PDF-Bilddateien. Die PDF-Dateien können statisch oder aktiv sein. In diesem Fall muss jedes Formular in einer eigenen PDF-Datei vorhanden sein. Wird für die Vorlage ein Seitenbereich gewählt, wird dieser auf alle verarbeiteten PDF-Dateien angewendet.

Ausgefüllte Formulare verarbeiten, die als Bilddateien gespeichert sind

Hierzu gehören alle Bilddateiformate, die OmniPage unterstützt, auch PDF-Bilddateien. In diesem Fall müssen die zu verarbeitenden Dateien so viele Seiten umfassen, wie es im Seitenbereich der Vorlagendatei definiert ist. Ist der Seitenbereich beispielsweise 2-4, muss jedes zu verarbeitende Formular drei Seiten enthalten.

Jedes zu verarbeitende Formular kann in einer separaten Datei gespeichert werden. Es ist jedoch auch möglich, mehrere Formulare in einer einzigen, mehrseitigen Bilddatei zu speichern. Im obigen Beispiel würden die Seiten 1-3, 4-6, 7-9 usw. Als separate Formulare interpretiert.

Ausgefüllte gescannte Formulare verarbeiten

Ausgefüllte Formulare lassen sich am besten mit einem ADFscannen. Scannen Sie nur die ausgefüllten Formularseiten, die in der Formularvorlage definiert sind (unter Berücksichtigung des Seitenbereichs, falls angegeben). Beim Scannen eines solchen Stapels mehrseitiger Formulare müssen keine Trennblätter verwendet werden.

//

Über Formulardatenextraktion