Langues et alphabets

OmniPage peut reconnaître plus de 120 langues dans de nombreux alphabets : latin, grec, cyrillique, chinois, japonais et coréen. La liste des langues prises en charge est disponible dans l’onglet OCR de la boîte de dialogue Options. Vous trouverez également la liste de ces langues sur le site Web de Nuance.

Omnipage icon dict Langues et alphabets

Cette icône indique qu’une langue est associée à un dictionnaire. Les langues associées à un dictionnaire sont l’allemand, l’anglais, le catalan, le danois, l’espagnol, l’espéranto, le finlandais, le français, le grec, le hongrois, l’italien, le néerlandais, le norvégien, le polonais, le portugais, le russe, le slovène, le suédois et le tchèque. Ces dictionnaires sont utilisés conjointement à des dictionnaires utilisateur et des dictionnaires spécialisés pour faciliter la reconnaissance (OCR) et afficher des suggestions pendant la vérification de l’OCR.

Pour consulter la liste des dictionnaires spécialisés disponibles et obtenir des explications sur les options Choix auto. d’une langue unique et Vérifier les choix de langues, affichez l’onglet OCR de la boîte de dialogue Options.

Avec la plupart des langues prises en charge par un dictionnaire, OmniPage peut faire appel à plusieurs moteurs d’OCR. Le programme consulte les dictionnaires des différents moteurs actifs pendant la reconnaissance et peut extraire des suggestions de n’importe lequel d’entre eux.

Vous pouvez demander au programme de souligner dans l’Éditeur de texte les mots ne figurant pas dans les dictionnaires pour les mettre en évidence. Il est possible qu’un mot absent des dictionnaires ne soit pas signalé comme tel, par exemple, si plusieurs moteurs d’OCR ont généré sans difficulté des résultats identiques, ou si un document comporte de nombreuses occurrences du mot non trouvé.

Si vous indiquez que le document à reconnaître contient des textes écrits en plusieurs langues, l’ensemble des caractères de ces langues seront acceptés lors de la reconnaissance. Vous pourrez valider manuellement d’autres caractères individuels afin de compléter ceux valides pour les langues que vous aurez choisies.

Si vous avez sélectionné plusieurs langues associées à un dictionnaire, l’ensemble des dictionnaires seront interrogés lors de la vérification. Il est donc possible que les suggestions de corrections apparaissent en différentes langues.

Les dictionnaires, les options de vérification de l’OCR et les fonctions d’apprentissage ne sont pas disponibles pour le japonais, le coréen ou le chinois. Par ailleurs, ces trois langues ne doivent pas être combinées avec d’autres langues. Consultez la rubrique Reconnaissance des langues asiatiques.

Alphabet latin

C’est l’alphabet de la majorité des langues prises en charge. Si vous sélectionnez plusieurs langues d’OCR, toutes les lettres accentuées nécessaires sont validées pour la reconnaissance.

Alphabet grec

Il s’agit, comme son nom l’indique, de l’alphabet de la langue grecque. OmniPage gère la reconnaissance des caractères du grec classique, dont voici un exemple :

Omnipage lang greek%20classical Langues et alphabets

Voici un exemple de grec moderne :

Omnipage lang greek%20modern Langues et alphabets

 

Voici les caractères pris en charge :

Omnipage lang cp greek Langues et alphabets

Lors de l’analyse d’un texte grec, les lettres de l’alphabet anglais sont reconnues. Vous pouvez lire, éditer et vérifier un texte grec, que votre ordinateur soit doté ou non de fichiers de polices grecques, ou du jeu de codes de caractères grecs. Par contre, la gestion correcte d’un texte grec exporté suppose la prise en charge de cette langue et de son jeu de caractères.

Alphabet cyrillique

Les langues suivantes s’écrivent en caractères cyrilliques : biélorusse, bulgare, kabarde, macédonien, moldave, russe, serbe, tchétchène et ukrainien.

Voici un exemple de texte russe :

Omnipage lang russian Langues et alphabets

Lors de l’analyse d’un texte en caractères cyrilliques, les lettres de l’alphabet anglais sont reconnues. OmniPage gère les textes en caractères cyrilliques clairsemés de mots écrits avec l’alphabet latin.

Vous pouvez lire, éditer et vérifier un texte en caractères cyrilliques, que votre ordinateur soit doté ou non de fichiers de polices cyrilliques, ou du jeu de codes de caractères cyrilliques. Par contre, la gestion correcte d’un texte cyrillique exporté suppose la prise en charge de cet alphabet et des codes de page correspondants.

Le tableau suivant présente les caractères cyrilliques pris en charge. Il est à noter que tous ne sont pas implicitement validés pour le russe ou toute autre langue unique sélectionnée.

Omnipage lang cp12ru%20cyrillic Langues et alphabets

 

La prise en charge des langues asiatiques (japonais, chinois, coréen) est décrite dans une rubrique distincte.

 

//

Langues et alphabets