Языки и алфавиты
Программа поддерживает более 120 языков на основе различных алфавитов: латиницы и кириллицы, а также греческого, китайского, японского и корейского. Список языков можно просмотреть на панели «Распознавание» в диалоговом окне «Параметры». Этот список также можно найти на веб-узле Nuance.
Этим значком отмечаются языки, для которых имеются словари. В настоящее время это: английский, венгерский, греческий, датский, испанский, итальянский, каталанский, немецкий, нидерландский, норвежский, польский, португальский, русский, словенский, финский, французский, чешский, шведский и эсперанто. Эти, а также пользовательские и профессиональные словари используются во время распознавания. Кроме того, из них предлагаются варианты при проверке.
Список доступных профессиональных словарей, а также описание параметров Автоматически определять один язык и Проверить выбранные языки см. на панели Распознавание в диалоговом окне «Параметры».
Распознавание текста на нескольких языках возможно почти для всех языков с поддержкой словаря. В этом случае при распознавании будут использоваться все словари для всех языков документа, и возможные варианты будут браться из всех словарей.
Можно настроить программу так, чтобы несловарные слова в текстовом редакторе выделялись подчеркиванием. Во время проверки вы сможете увидеть и проверить их. Иногда слова не помечаются как “несловарные”, даже если они не содержатся ни в одном словаре. Это может произойти, если несколько средств распознавания создают одинаковый результат с высокой достоверностью, или если “несловарное” слово отображается в документе много раз.
Если выбрано несколько языков, при распознавании учитываются все используемые в них символы. Можно также задать дополнительные символы, которые будут использоваться при распознавании вместе с алфавитом выбранного языка.
При выборе нескольких языков с поддержкой словарей подгружаются и учитываются все словари, поэтому будут предлагаться варианты на нескольких языках.
Словари, проверка и эталоны недоступны для японского, корейского и китайского языков. Эти языки нельзя использовать в сочетании с другими. См. раздел Распознавание текста на азиатских языках.
Латинский алфавит
Этот алфавит используется в большинстве поддерживаемых языков. При выборе одного или нескольких языков распознавания все необходимые буквы с диакритическими знаками будут включены в набор символов для распознавания.
Греческий алфавит
Этот алфавит используется в греческом языке. Программа OmniPage поддерживает распознавание букв греческого алфавита в классическом начертании. Так выглядит текст на древнегреческом языке:
Так выглядит текст на современном греческом языке:
Список поддерживаемых символов:
При распознавании греческого текста буквы английского алфавита также будут распознаны. Текст на греческом языке можно читать, редактировать и проверять после распознавания, даже если на компьютере не установлены греческие шрифты и поддержка греческой кодовой страницы. Однако для корректного экспорта греческого текста необходимо установить поддержку греческого языка.
Кириллический алфавит
Этот алфавит используется в следующих языках: русском, белорусском, болгарском, кабардинском, македонском, молдавском, сербском, украинском, чеченском.
Так выглядит текст на русском языке:
При распознавании кириллического текста буквы английского алфавита также будут распознаны. Иногда в середине слова, написанного кириллицей, могут встречаться латинские буквы. Программа OmniPage может распознавать такие слова.
Кириллический текст можно читать, редактировать и проверять после распозна