Описание исходного макета
Для упрощения автоматического выделения областей рекомендуется задать описание макета исходного документа. См. раздел Когда запускается автоматическая разметка областей?
На панели инструментов OmniPage имеется раскрывающийся список Описание макета.
Выберите в нем пункт, который наилучшим образом описывает вид исходного документа. Здесь же можно указать, как именно следует обрабатывать макет. По умолчанию используется значение Автоматически, и в большинстве случаев это самый быстрый и простой способ. Другие параметры дают больший контроль над обработкой макета.
Все они описаны ниже.
Автоматически
Выберите этот параметр, чтобы программа автоматически выделила все области. В этом случае программа определит, разбит ли текст на колонки, является ли элемент изображением или текстом, который нужно распознать, и имеются ли в тексте таблицы. Автоматическое распознавание форм не поддерживается. Для обработки форм (только в версии Professional) следует явным образом задать макет страницы «Форма» или выделить область формы.
Выберите значение Автоматически, если:
-
нужно быстро обработать документ;
-
документ содержит страницы с разными или неизвестными макетами;
-
на странице имеется несколько столбцов и таблица;
-
на странице имеется несколько таблиц.
Одна колонка без таблиц
Выберите этот вариант, если страницы содержат по одной колонке текста и не содержат таблиц. Обычно это относится к деловым письмам или страницам книги. Этот же параметр можно выбрать для страниц с колонками, которые не нужно помещать в таблицу или в колонки. Изображения в этом режиме могут определяться автоматически.
Несколько колонок без таблиц
Выберите этот вариант, если на некоторых страницах текст разбит на колонки, и это разбиение нужно убрать или сохранить отдельные столбцы, как в исходном макете. Колонки в выходном документе можно сохранить. Во время сохранения можно указать, что для этого нужно использовать: рамки или колонки с поточным текстом. Таблицы в этом случае размещаются в колонках, а не в сетке. Изображения в этом режиме могут определяться автоматически.
Одна колонка с таблицей
Выберите этот вариант, если на странице имеется только одна колонка текста и таблица. Алгоритм автоматического выделения областей не будет искать колонки, однако попытается найти таблицу и представить ее в сетке в текстовом редакторе. Позднее можно будет указать порядок экспорта таблицы: в виде сетки или в виде разделенных табуляцией столбцов текста. Изображения в этом режиме могут определяться автоматически.
Электронная таблица
Выберите этот вариант, если вся страница представляет собой таблицу, которую нужно экспортировать в редактор электронных таблиц или просто обрабатывать как таблицу. В этом случае поточный текст и изображения определяться не будут. Для получения сведений о сохранении документов в программе Excel см. раздел Уровни форматирования.
Форма
Выберите этот вариант, если страница содержит форму. В этом случае на странице будут определяться объекты формы. (Доступно только в OmniPage Professional.)
Настройка
Выберите этот вариант, чтобы получить максимальный контроль над автоматическим выделением областей. В этом случае можно будет включить или выключить определение столбцов, изображений и таблиц. Измените настройки в диалоговом окне Пользовательский макет. Чтобы открыть это окно, нажмите кнопку «Пользоват
ельский макет…» на панели «Распознавание» диалогового окна «Параметры».
Шаблон
Выберите файл шаблона областей. Его значение фона, а также области и их свойства будут применены ко всем последующим получаемым страницам. При обработке вручную области шаблона также применяются к текущей странице и заменяют все существующие на ней области. Дополнительные сведения см. в разделе Шаблоны областей.
//