Извлечение данных формы

Omnipage pro Извлечение данных формы

Данный раздел относится только к OmniPage Professional.

Функция извлечения данных формы позволяет получать данные из набора заполненных форм для дальнейшей обработки в базах данных или электронных таблицах. Извлечение данных формы выполняется как этап рабочего процесса в OmniPage.

Компоновка и положение элементов формы определяется файлом шаблона формы. Формы для обработки должны быть заполнены на компьютере или аналогичном устройстве, а не выполнены от руки. Результаты обработки выводятся в виде файла со значениями, разделенными запятыми (CSV), который можно открыть как таблицу в программе обработки электронных таблиц. Для каждого элемента формы в таблице определяется столбец, а данные каждой формы отображаются в отдельной строке. Типичными элементами форм являются заполняемые поля, флажки и кнопки выбора.

Файлы шаблонов форм

В качестве шаблона формы следует использовать активную форму PDF (не изображение), правильно отображающую элементы, которые могут быть обнаружены в обрабатываемых формах. Она может быть как заполненной, так и незаполненной. Шаблоном может быть многостраничная форма. Можно указать диапазон страниц, чтобы страницы без элементов формы, например содержащие инструкции по заполнению, не использовались. Далее описано, как интерпретируется диапазон страниц при различных типах обработки.

Собственный файл шаблона можно создать с помощью программы OmniPage Professional или редактора PDF, например Nuance PDF Converter Professional. Сведения о создании форм и их сохранении PDF-файл см. в разделе Создание форм

Настройка рабочего процесса

Для настройки следует использовать помощник рабочего процесса. Обычный рабочий процесс включает три этапа: этап загрузки файлов, этап извлечения данных из формы и этап сохранения. См. раздел Извлечение данных формы в помощнике рабочего процесса.

Обработка заполненных файлов PDF

К ним относятся любые разновидности PDF, кроме изображений в формате PDF. Файлы PDF могут быть как статическими, так и активными. В этом случае для каждой формы должен использоваться отдельный файл PDF. Если для шаблона выбран диапазон страниц, такой же диапазон применяется ко всем обрабатываемым файлам PDF.

Обработка заполненных форм, сохраненных как файлы изображений

К ним относятся все форматы файлов изображений, поддерживаемые программой OmniPage, включая изображения в формате PDF.  В этом случае файлы для обработки должны содержать количество страниц, определяемое диапазоном страниц файла шаблона. Например, если диапазон страниц шаблона составляет 2-4, в каждой обрабатываемой форме должно быть три страницы.

Каждая обрабатываемая форма может быть представлена отдельным файлом. Однако возможна так же обработка форм с помощью одного многостраничного файла изображений. В приведенном выше примере страницы 1-3, 4-6, 7-9 и т.д. будут рассматриваться как отдельные формы.

Обработка заполненных отсканированных форм

Заполненные формы лучше всего сканировать с помощью устройства автоматической подачи. Следует сканировать только заполненные страницы формы, указанные в шаблоне (включая страницы из диапазона, если указан). При сканировании такой пачки многостраничных форм разделители листов не требуются.

//

Извлечение данных формы