Текст распознается неправильно
Если какая-либо часть исходного документа в процессе распознавания неправильно преобразуется в текст, воспользуйтесь следующими рекомендациями.
-
Откройте изображение всей страницы и убедитесь в том, что все текстовые участки включены в текстовые области. Если участок не заключен в область, то в процессе распознавания он, как правило, пропускается.
-
Проверьте, правильно ли выделены текстовые области. При необходимости заново определите типы и содержимое областей и повторите распознавание документа. Для получения дополнительных сведений см. раздел Типы и содержание областей.
-
Убедитесь, что по ошибке не загружен неподходящий шаблон. Если границы областей в тексте обрезаны, возможны ошибки распознавания.
-
Отрегулируйте яркость и контрастность на панели «Сканер» в диалоговом окне «Параметры». Для достижения желаемых результатов можно поэкспериментировать с различными комбинациями параметров.
-
Оптимизируйте изображения для распознавания с помощью инструментов оптимизации изображения.
-
Проверьте разрешение исходного изображения. Переместите курсор на миниатюру страницы для вызова всплывающего окна. Если разрешение значительно отличается от 300 точек на дюйм, вероятнее всего, это отрицательно скажется на распознавании.
-
Обязательно выберите необходимые языки документа на панели «Распознавание» в диалоговом окне «Параметры». Следует выбирать только те языки, которые включены в документ. В частности, установка азиатского языка для текста не на азиатском языке приведет у получению непригодного результата.
-
Если включен параметр «Автоматически определять один язык», каждой входной странице будет автоматически назначен один язык. Можно также назначить повторное распознавание для многоязычных страниц или страниц с неправильно определенным языком.
-
Результаты распознавания на японском, корейском и китайском языках можно просмотреть и сохранить, только если в системе включена поддержка восточноазиатских языков.
-
Включите функцию IntelliTrain и внесите некоторые правки. В основном это помогает при работе с художественными шрифтами или с документами, отличающимися более низким качеством. Если функция IntelliTrain активизирована, попробуйте выключить ее, так как для документов некоторых типов с ухудшенными характеристиками она может не работать.
-
Создайте вручную несколько эталонов или измените существующие, чтобы удалить те из них, которые оказались неудачными.
-
Если в текстовом редакторе или для экспорта используется уровень форматирования «Фактическая страница», то распознанный текст будет помещен в текстовые блоки или рамки. Если текстовый блок будет слишком маленьким, какая-то часть текста может оказаться скрытой. Чтобы просмотреть текст, поместите курсор в текстовый блок и с помощью клавиш со стрелками на клавиатуре прокрутите содержимое блока вверх, вниз, влево или вправо.
-
Проверьте стекло, зеркальные поверхности и линзы сканера на наличие пыли, загрязнений и царапин. При необходимости очистите их.
-
Программа OmniPage распознает только символы машинописного текста (например, напечатанного на машинке или распечатанного на лазерном принтере). Она также может обрабатывать растровые знаки, однако при работе с текстами среднего качества точность может быть снижена. Программа не позволяет распознавать тексты, написанные от руки. Однако подписи и другие написанные вручную символы можно сохранить в качестве изображений.