Текст распознается неправильно

Если какая-либо часть исходного документа в процессе распознавания неправильно преобразуется в текст, воспользуйтесь следующими рекомендациями.

  • Откройте изображение всей страницы и убедитесь в том, что все текстовые участки включены в текстовые области. Если участок не заключен в область, то в процессе распознавания он, как правило, пропускается.

  • Проверьте, правильно ли выделены текстовые области. При необходимости заново определите типы и содержимое областей и повторите распознавание документа. Для получения дополнительных сведений см. раздел Типы и содержание областей.

  • Убедитесь, что по ошибке не загружен неподходящий шаблон. Если границы областей в тексте обрезаны, возможны ошибки распознавания.

  • Отрегулируйте яркость и контрастность на панели «Сканер» в диалоговом окне «Параметры». Для достижения желаемых результатов можно поэкспериментировать с различными комбинациями параметров.

  • Оптимизируйте изображения для распознавания с помощью инструментов оптимизации изображения.

  • Проверьте разрешение исходного изображения. Переместите курсор на миниатюру страницы для вызова всплывающего окна. Если разрешение значительно отличается от 300 точек на дюйм, вероятнее всего, это отрицательно скажется на распознавании.

  • Обязательно выберите необходимые языки документа на панели «Распознавание» в диалоговом окне «Параметры». Следует выбирать только те языки, которые включены в документ. В частности, установка азиатского языка для текста не на азиатском языке приведет у получению непригодного результата.

  • Если включен параметр «Автоматически определять один язык», каждой входной странице будет автоматически назначен один язык. Можно также назначить повторное распознавание для многоязычных страниц или страниц с неправильно определенным языком.

  • Результаты распознавания на японском, корейском и китайском языках можно просмотреть и сохранить, только если в системе включена поддержка восточноазиатских языков.

  • Включите функцию IntelliTrain и внесите некоторые правки. В основном это помогает при работе с художественными шрифтами или с документами, отличающимися более низким качеством. Если функция IntelliTrain активизирована, попробуйте выключить ее, так как для документов некоторых типов с ухудшенными характеристиками она может не работать.

  • Создайте вручную несколько эталонов или измените существующие, чтобы удалить те из них, которые оказались неудачными.

  • Если в текстовом редакторе или для экспорта используется уровень форматирования «Фактическая страница», то распознанный текст будет помещен в текстовые блоки или рамки. Если текстовый блок будет слишком маленьким, какая-то часть текста может оказаться скрытой. Чтобы просмотреть текст, поместите курсор в текстовый блок и с помощью клавиш со стрелками на клавиатуре прокрутите содержимое блока вверх, вниз, влево или вправо.

  • Проверьте стекло, зеркальные поверхности и линзы сканера на наличие пыли, загрязнений и царапин. При необходимости очистите их.

  • Программа OmniPage распознает только символы машинописного текста (например, напечатанного на машинке или распечатанного на лазерном принтере). Она также может обрабатывать растровые знаки, однако при работе с текстами среднего качества точность может быть снижена. Программа не позволяет распознавать тексты, написанные от руки. Однако подписи и другие написанные вручную символы можно сохранить в качестве изображений.

Текст распознается неправильно