Sprachen und Alphabete
Das Programm kann über 120 Sprachen in folgenden Alphabeten erkennen: Lateinisch, Griechisch, Kyrillisch, Chinesisch, Japanisch und Koreanisch. Die Liste der verfügbaren Sprachen ist im Dialogfeld Optionen im Register OCR aufgeführt. Diese Liste kann auch auf der Nuance-Website eingesehen werden.
Dies Symbol kennzeichnet Sprachen, für die Wörterbücher zur Verfügung stehen. Hierbei handelt es sich um folgende Sprachen: OmniPage bietet gegenwärtig Wörterbuchunterstützung für Deutsch, Dänisch, Englisch, Esperanto, Finnisch, Französisch, Griechisch, Italienisch, Katalanisch, Niederländisch, Norwegisch, Polnisch, Portugiesisch, Russisch, Slowenisch, Spanisch, Schwedisch, Tschechisch und Ungarisch. Die Wörterbücher für diese Sprachen werden zusammen mit den Anwenderwörterbüchern und professionellen Wörterbüchern verwendet, um die Erkennung zu verbessern und Vorschläge bei der Prüfung zu machen.
Die Liste der verfügbaren professionellen Wörterbücher sowie eine Erklärung der Optionen Automatisch eine einzige Sprache erkennen und Sprachauswahl überprüfen ist im Dialogfeld Optionen im Register OCR aufgeführt.
Für fast alle Wörterbuchsprachen können Sie die Erkennung mit mehreren Erkennungsprogrammen durchführen. Bei der Erkennung werden die Wörterbücher jedes laufenden Erkennungsprogramms verwendet und aus jedem davon können Vorschläge gemacht werden.
Sie können festlegen, dass Wörter, die nicht im Wörterbuch enthalten sind, im Texteditor unterstrichen werden. Diese Wörter sehen Sie dann bei der Prüfung. Manchmal werden Wörter nicht als „nicht im Wörterbuch enthalten“ markiert, selbst wenn keines der Wörterbücher das Wort enthält. Dies kann passieren, wenn mehrere Erkennungsprogramme ein identisches Ergebnis mit hoher Verlässlichkeit generieren, oder wenn ein als „nicht im Wörterbuch enthalten“ markiertes Wort häufig im Dokument vorkommt.
Falls Sie mehrere Sprachen auswählen, werden bei der Erkennung alle Zeichen, die in den ausgewählten Sprachen verwendet werden, berücksichtigt. Sie können neben den durch Ihre Sprachauswahl unterstützten Buchstaben auch einzelne Buchstaben validieren.
Wenn Sie mehr als eine Sprache mit Wörterbuchunterstützung auswählen, werden alle zur Verfügung stehenden Wörterbücher konsultiert, so dass Sie unter Umständen Vorschläge aus mehreren Sprachen enthalten.
Wörterbücher, Prüfung und Training sind nicht verfügbar für Japanisch, Koreanisch und Chinesisch, und diese Sprachen sollten auch nicht mit anderen kombiniert werden. Siehe Erkennung asiatischer Sprachen.
Lateinisches Alphabet:
Dieses Alphabet wird in den meisten der unterstützten Sprachen verwendet. Wenn Sie eine oder mehrere Sprachen zur Erkennung auswählen, gelten alle darin verwendeten Sonderzeichen als mögliche Erkennungsergebnisse.
Griechisches Alphabet:
Das griechische Alphabet wird in der griechischen Sprache verwendet. OmniPage unterstützt die Erkennung von Zeichen, die in altgriechischen Texten verwendet werden. Hier sehen Sie ein Beispiel für einen altgriechischen Text:
Hier sehen Sie ein Beispiel für einen neugriechischen Text:
Folgende Zeichen werden unterstützt:
Beim Verarbeiten griechischer Texte werden auch die Buchstaben des lateinischen Alphabets erkannt. Sie können griechische Texte auch dann erkennen, bearbeiten und prüfen, wenn auf Ihrem Computer keine griechischen Schriftarten oder Codeseiten installiert sind. Sie benötigen allerdings Unterstützung für Griechisch, um den exportierten Text korrekt weiter zu verarbeiten.
Kyrillisches Alphabet:
Folgende Sprachen verwenden das kyrillische Alphabet: Russisch, Bulgarisch, Weißrussisch, Tschetschenisch, Kabardinisch, Mazedonisch, Moldawisch, Serbisch und Ukrainisch.
Hier sehen Sie ein Beispiel für einen russischen Text:
Beim Verarbeiten von Texten in kyrillischer Schrift werden auch die Buchstaben des lateinischen Alphabets erkannt. Es kann vorkommen, dass ein Text in kyrillischer Schrift Worte in lateinischer Schrift enthält. OmniPage verarbeitet diese Worte korrekt.
Sie können kyrillische Texte auch dann erkennen, bearbeiten und prüfen, wenn auf Ihrem Computer keine kyrillischen Schriftarten oder Codeseiten installiert sind. Sie benötigen allerdings Unterstützung für das kyrillische Alphabet, um den exportierten Text korrekt weiter zu verarbeiten.
Die folgende Tabelle enthält die unterstützten kyrillischen Zeichen. Diese Zeichen stammen aus mehreren Sprachen, es sind also nicht alle Zeichen in einer einzigen der aufgeführten Sprachen enthalten.
Die Unterstützung für asiatische Sprachen (Japanisch, Chinesisch, Koreanisch) wird in einem eigenen Thema abgehandelt.
//