Arbeitsprozess-Assistent – Bilder erkennen

Layout-Beschreibung: Wählen Sie eine Layout-Beschreibung für die automatische Bereichseinteilung auf den eingehenden Seiten. Mit Automatisch überlassen Sie diese Entscheidung dem Programm. In den meisten Fällen ist dies die beste Wahl, besonders, wenn die Seiten im Dokument unterschiedliche Layouts haben. Wenn alle Seiten ähnlich sind, wählen Sie die Einstellung, die dem Dokument am ehesten entspricht.

OCR-Prozess optimieren für Geschwindigkeit / Genauigkeit: Legen Sie fest, ob bei der Erkennung die Geschwindigkeit oder die Genauigkeit im Vordergrund steht. Wenn Sie die Option Geschwindigkeit bei Dokumenten mit guter Druckqualität verwenden, können Sie immer noch eine akzeptable Genauigkeit erzielen.

Sprachen und Wörterbücher

Sprachen im Dokument: Wählen Sie alle Sprachen aus, die auf den zu erkennenden Seiten vorhanden sind. Das beste Erkennungsergebnis erzielen Sie, wenn Sie nur Sprachen auswählen, die tatsächlich auf der/den Seite/n auftreten. Oben in der Liste stehen die zuletzt ausgewählten Sprachen, darunter in alphabetischer Reihenfolge alle Sprachen. Durch Eingeben eines Buchstabens können Sie zum entsprechenden Anfangsbuchstaben springen.

Anwenderwörterbuch: Wählen Sie das Anwenderwörterbuch aus, das für die Überprüfung der OCR-Ergebnisse verwendet werden soll. Möglicherweise wird das Wörterbuch Benutzerdefiniert angezeigt, dies ist das voreingestellte Benutzerwörterbuch für Microsoft Word.

Professionelle Wörterbücher: Hiermit wählen Sie auf bestimmte Fachgebiete spezialisierte Wörterbücher, beispielsweise Recht und Medizin. Diese Wörterbücher werden zusätzlich zu den Standard- und Anwenderwörterbüchern zu Rate gezogen.

Sprachauswahl überprüfen: Aktivieren Sie diese Option, falls bei Konflikten zwischen den gewählten Sprachen und den Sprachen in den eingehenden Dokumenten eine Warnmeldung ausgegeben werden soll. Unterschieden werden folgende Sprachen: Japanisch, Chinesisch, Koreanisch und nichtasiatisch. Siehe Erkennung asiatischer Sprachen.

Eine einzige Sprache erkennen: Ist Eine einzige Sprache erkennen ausgewählt, muss vor der Erkennung keine Sprache ausgewählt werden. Dies ist nützlich, wenn Sie z. B. während Ihrer Abwesenheit automatisch Dokumente verarbeiten lassen, die in unterschiedlichen Sprachen abgefasst sein können. Jeder eingehenden Seite wird dabei eine Sprache zugeordnet. Siehe OCR-Optionen. Markieren Sie dieses Kontrollkästchen, um anzuzeigen, welche Sprachen verarbeitet werden können. Ist diese Option aktiviert, kann die Sprache nicht mehr individuell ausgewählt werden.

Sprachgruppe auswählen: Mit dieser Option können Sie definieren, welche Sprachgruppen für die Erkennung einer einzigen Sprache zur Verfügung stehen: die Sprachen mit Wörterbuchunterstützung, die das lateinische Alphabet verwenden, die vier asiatischen Sprachen oder beide Gruppen.

Schriftarten und Zeichen

Schriftartzuordnung: Hiermit geben Sie an, wie den im Dokument erkannten Schriften die Schriftarten zugeordnet werden. Diese Option ist nur für nichtasiatische Sprachen verfügbar.

Auslassungszeichen: Geben Sie hier das Zeichen an, das in OmniPage anstelle nicht erkennbarer Zeichen eingesetzt werden soll. Dieses Auslassungszeichen (in der Standardeinstellung ist dies die Tilde ≶~>) wird im erkannten Dokument rot dargestellt.

Zusätzliche Zeichen: Neben den durch Ihre Sprachauswahl unterstützten Akzentbuchstaben, können Sie hier zusätzliche Akzentbuchstaben eingeben. Geben Sie die Buchstaben über Ihre Tastatur oder mithilfe der Zeichentabelle ein. Klicken Sie auf die Schaltfläche mit den drei Punkten, um diese Option aufzurufen.

Beibehaltungsoptionen

Nach Kopf- und Fußzeilen suchen: Wählen Sie diese Option, damit Kopf- und Fußzeilen erkannt werden und für den Export zur Verfügung stehen. Deaktivieren Sie diese Option, damit Kopf- und Fußzeilen als normaler Text behandelt werden.

Nach Hyperlinks suchen: Wählen Sie diese Option aus, damit Hyperlinks erkannt und im Texteditor als funktionsfähige Links angezeigt und für den Export zur Verfügung gestellt werden.

Text- und Hintergrundfarben beibehalten: Wählen Sie diese Option aus, wenn farbige Texte und Hintergründe erkannt, im Texteditor angezeigt und für den Export zur Verfügung gestellt werden sollen. Diese Option ist nicht verfügbar, wenn die Einstellung OCR-Prozess optimieren für Geschwindigkeit aktiv ist.

Invertierten Text beibehalten: Wählen Sie diese Option, um invertierten Text, d. h. Text, bei dem helle Buchstaben auf dunklem Hintergrund gedruckt sind, beizubehalten. Deaktivieren Sie diese Option, damit invertierter Text als normaler Text wiedergegeben wird. Diese Option ist nicht verfügbar, wenn die Einstellung OCR-Prozess optimieren für Geschwindigkeit aktiv ist.

PDF-Schriften verwenden: Wählen Sie diese Option, wenn die Schriftartzuordnung, wenn möglich, beim Öffnen von PDF-Dateien außer Kraft gesetzt werden soll. OmniPage kann die Schriftartliste in PDF-Dateien lesen, diese Fonts auf Ihrem System suchen und dann für das konvertierte Dokument verwenden.

 

Arbeitsprozess-Assistent – Bilder erkennen