Типы и содержание областей
Тип области и ее содержание определяют то, каким образом область будет обрабатываться.
Тип области
Каждая область страницы имеет тип. Можно выбрать один из следующих типов.
Обрабатываемая область
Для автоматического определения областей. Функция автоматического выделения областей работает только на участках, определенных как обрабатываемые области. Если в качестве обрабатываемой области была выделена неоднородная область, то программа OmniPage может заменить ее на ряд более мелких областей. Текст будет извлечен из колонок, будут определены таблицы и изображения.
Используйте виды текстового редактора: Простой текст или Форматированный текст — для просмотра текста, не разбитого на колонки. Если необходимо сохранить разбивку текста на колонки, используйте вид Фактическая страница.
При необходимости выберите инструмент Изменить порядок обхода на Панели инструментов «Форматирование» текстового редактора в режиме «Фактическая страница».
Пропускаемая область
Для тех областей страницы, которые не нужно обрабатывать. Пропускаемые области отображаются как затененные (серые на белой странице). Они, как правило, выделяются на обрабатываемом фоне. Пропускаемые области можно сделать частью шаблона, чтобы не проводить распознавание определенных областей всех страниц документа (например, повторяющийся логотип или нумерация страниц).
Область текста
Для работы с областями текста, расположенными в одну колонку. Кроме того, эту функцию можно использовать для работы с текстом, который не требуется разбивать на колонки. Этот тип области используется также для ручной разметки областей горизонтального текста на японском, китайском и корейском языках.
Область вертикального азиатского текста
для вертикального текста на японском или корейском языке. Для этих языков может быть автоматически определено направление текста, но этот параметр можно использовать для принудительной обработки текста как вертикального. Не используйте его для других языков. Все вертикальные области текста должны быть прямоугольной формы.
Область вертикального текста, повернутого влево
для вертикального неазиатского текста, повернутого влево. См. пример в конце раздела Разметка областей вручную. В некоторых (но не всех) случаях эти области могут быть определены автоматически. Этот тип областей нельзя использовать для вертикального текста в ячейках таблицы. Это можно выполнить только при автоматической разметке областей.
Область вертикального текста, повернутого вправо
для вертикального неазиатского текста, повернутого вправо. Здесь также применима информация, представленная выше.
Область таблицы
Для работы с текстом или с цифровыми областями, содержащими данные в виде строк и столбцов, которые необходимо обрабатывать как таблицу. Сетка таблицы может обнаруживаться автоматически при распознавании или может размещаться вручную перед началом распознавания. После распознавания все таблицы в текстовом редакторе выводятся с сетками. Сетки можно редактировать. Элемент Таблицы в окне Параметры конвертера экспорта позволяет определить способ экспорта данных таблицы: в виде сетки или, например, в виде разделенных табуляцией столбцов.
Область изображения
Для работы с фотографиями, рисунками, подписями и теми областями текста, которые нужно сохранить в текстовом редакторе в виде изображений. Встроенные области изображения могут быть экспортированы вместе с документом в конечные приложения, в которых поддерживается графика. В этом случае следует выбрать параметр конвертера экспорта Сохранять изображения. Изображения можно также копировать в буфер обмена.
Область формы
Для работы с формами, которые нужно распознать таким образом, чтобы после экспорта их можно было заполнять. Формы можно редактировать в текстовом редакторе, а затем экспортировать в формат pdf, rtf, html или xsn (Microsoft Office InfoPath 2003). Области формы поддерживаются только в версии OmniPage Professional.
Изменение типа существующей области
Щелкните правой кнопкой мыши по области, выберите Тип области, а также соответствующий элемент в контекстном меню.
Определение типа новой области
Выберите соответствующий инструмент создания областей на панели инструментов «Изображение», а затем выделите область.
Содержимое области
Все текстовые области и области таблиц на странице также имеют параметр «Содержимое области». Он задает символы, которые программа OmniPage будет искать в области при обработке страницы. В качестве параметра содержимого области можно выбрать Буквы и цифры или Цифры.
Например, если в области представлены только цифры и математические знаки, то для ее содержания можно установить параметр Цифры. В этом случае при распознавании данной области программа OmniPage будет генерировать только решения, содержащие цифры и связанные с ними знаки пунктуации.
Изменение содержимого области
Щелкните правой кнопкой мыши по области, выберите Содержимое области, а также соответствующий элемент в контекстном меню.
-
Программа OmniPage назначает тип каждой области, созданной при автоматической разметке областей. Кроме того, программа OmniPage назначает содержимое текстовых областей. Обычно свойства области изменять не требуется. Исключением являются случаи, когда нужно изменить способ обработки элементов страницы при ее повторном распознавании.
//