Распознавание текста на азиатских языках

Приложение поддерживает четыре азиатских языка: японский и корейский, а также традиционное и упрощенное письмо китайского языка. Идеальный размер шрифта для основного текста составляет 12 пт, а разрешение сканирования — 300 тчк/дюйм. При этом полученные символы будут иметь размер около 48 x 48 пикселей. Минимальный размер символов — 30 x 30 пикселей (10,5 пт при разрешении 300 тчк/дюйм). Чтобы получить символы меньшего размера, используйте разрешение 400 тчк/дюйм.

Текст на японском или китайском языке может располагаться горизонтально (слева направо) или вертикально (сверху вниз, справа налево). Корейский текст всегда является горизонтальным.

Вот примеры текста на китайском Omnipage chinese sample Распознавание текста на азиатских языках и корейском Omnipage korean sample Распознавание текста на азиатских языках языках.

Пример текста на японском языке представлен ниже.

Операционные системы, поддерживаемые приложением OmniPage 18, могут работать с азиатскими языками. Однако если во время установки системы не была выбрана поддержка восточноазиатских языков, ее необходимо включить, установив флажок «Панель управления» > «Язык и региональные стандарты» > «Языки» > «Дополнительная языковая поддержка» > «Установить поддержку языков с письмом иероглифами». Может потребоваться вставить установочный диск Windows.

Четыре азиатских языка перечислены в алфавитном порядке вместе с другими языками на панели «Параметры» > «Распознавание». Эти языки рекомендуется выбирать по отдельности, не сочетая их с другими языками. При обработке текста на азиатских языках могут быть распознаны небольшие фрагменты английского текста без явного указания этого языка. Однако данная функция не предназначена для больших текстов на английском или других западных языках.

 

Вертикальный японский или китайский текст может содержать фрагменты на английском языке, расположенные в различных направлениях.

Друг над другом

С поворотом вправо

Бок о бок

Omnipage asian vertical neon Распознавание текста на азиатских языках

Omnipage asian vertical right Распознавание текста на азиатских языках

Omnipage asian vertical sidebyside Распознавание текста на азиатских языках

 

Выходной текст

 

Программа может обрабатывать все эти варианты. На выходе будет получен текст, повернутый вправо.

Проверка языка

Кроме отображения списка языков, функция Проверить выбранные языки запускает автоматическую проверку языка, которая предупреждает о различиях между определенным и указанным языками. Эта функция работает на уровне страницы и может определить четыре категории языков: японский, китайский, корейский и неазиатский. Однако она не различает традиционное и упрощенное письмо китайского языка, а также неазиатские языки. Функция относит язык к четвертой категории, если ей не удается найти в тексте японские, китайские или корейские иероглифы. Проверка выполняется во время предварительной обработки изображения, поэтому нужный язык распознавания необходимо задать до загрузки изображения. Определение дает более надежные результаты при использовании нескольких строк текста и минимальном количестве вставок на английском языке.

Определение одного языка

Азиатские языки можно обрабатывать с использованием параметра Автоматически определять один язык. Это полезно при автоматической обработке входных документов, которые могут быть на разных языках. См. раздел Параметры распознавания. Выберите в раскрывающемся списке пункт Азиатские языки или Латиница и азиатские языки, чтобы в ходе определения учитывались эти языки. Вместе с данным параметром нельзя использовать функцию Проверить выбранные языки. Кроме того, невозможно выбрать отдельный язык.

Макет и разметка областей

Для страниц на азиатских языках рекомендуется использ

Распознавание текста на азиатских языках