Text wird nicht korrekt erkannt

Probieren Sie folgende Lösungsmöglichkeiten aus, falls ein Teil des Originaldokuments durch die OCR nicht korrekt in Text umgewandelt wird:

  • Sehen Sie sich das Originalbild an, und vergewissern Sie sich, dass sämtliche Seitenbereiche mit Text in Textbereichen liegen. Liegt eine Fläche nicht innerhalb eines Bereichs, wird sie in der Regel bei der OCR übergangen.

  • Vergewissern Sie sich, dass Textbereiche korrekt identifiziert werden. Definieren Sie ggf. Bereichstypen und -inhalte neu und führen Sie die Zeichenerkennung erneut aus. Weitere Informationen finden Sie unter Bereichstypen und Bereichsinhalte.

  • Vergewissern Sie sich, dass nicht versehentlich eine falsche Vorlage geladen wurde. Wenn Bereichsgrenzen durch Text verlaufen, ist die Erkennung beeinträchtigt.

  • Stellen Sie die Schieberegler für Helligkeit und Kontrast im Dialogfeld Optionen im Register Scanner ein. Um die gewünschten Ergebnisse zu erzielen, müssen Sie eventuell verschiedene Einstellungen ausprobieren.

  • Bearbeiten Sie die Bilder für die OCR mit den SET-Werkzeugen.

  • Überprüfen Sie die Auflösung des Originalbilds. Bewegen Sie den Cursor auf die Miniaturansicht einer Seite, bis ein Popup-Fenster angezeigt wird. Liegt die Auflösung deutlich unter oder über 300 DPI, verschlechtert dies wahrscheinlich die Erkennungsergebnisse.

  • Vergewissern Sie sich, dass die richtigen Dokumentsprachen im Dialogfeld Optionen im Register OCR ausgewählt sind. Nur Sprachen, die im Dokument enthalten sind, sollten ausgewählt werden. Insbesondere sollten Sie keine asiatische Sprache angeben, wenn sie nicht im Text vorkommt (und umgekehrt), da die OCR-Ergebnisse dadurch mit hoher Wahrscheinlichkeit beeinträchtigt werden.

  • Wenn Sie die Option Automatisch eine einzige Sprache erkennen aktiviert haben, weist die automatische Analyse jeder eingehenden Seite eine Sprache zu. Mehrsprachige Seiten oder Seiten, auf denen unter Umständen die Sprache nicht richtig erkannt wurde, müssen dann erneut manuell erkannt werden.

  • Die Erkennungsergebnisse für Japanisch, Koreanisch und Chinesisch können nur angezeigt und gespeichert werden, wenn Ihr System Unterstützung für ostasiatische Sprachen bietet.

  • Schalten Sie die IntelliTrain-Funktion ein und geben Sie einige Korrekturen ein. Dies hilft am besten bei ungewöhnlichen Schriftarten und Dokumenten von gleichmäßig geringer Qualität. Wenn IntelliTrain aktiv war, deaktivieren Sie es versuchsweise. Bei manchen Arten von Dokumenten schlechter Qualität hilft die Funktion möglicherweise nicht.

  • Führen Sie ein manuelles Training durch oder bearbeiten Sie vorhandene Trainingsdaten, um Ergebnisse eines nicht erfolgreichen Trainings zu löschen.

  • Wenn Sie True Page als Formatierungsgrad im Texteditor für den Export verwenden, wird erkannter Text in Textfelder oder -rahmen gestellt. Einige Textteile werden möglicherweise verdeckt, falls ein Textfeld zu klein ist. Um diesen Text anzuzeigen, setzen Sie den Cursor in das Textfeld und blättern mit den Pfeiltasten der Tastatur im Feld nach oben, unten, rechts oder links.

  • Untersuchen Sie Glas, Spiegel und Linsen Ihres Scanners auf Staub, Schmutz und Kratzer. Reinigen Sie die betroffenen Teile, falls erforderlich.

  • OmniPage erkennt nur maschinell gedruckte Textzeichen (z. B. per Laserdrucker oder auf einer Schreibmaschine produzierten Text). Punktmatrixzeichen kann OmniPage Pro ebenfalls verarbeiten, allerdings kann es sein, dass die Erkennungsgenauigkeit bei Texten in Entwurfsqualität leidet. Handschriftliche Texte, auch in Druckschrift, können nicht von OmniPage Pro erkannt werden. Unterschriften oder andere handschriftliche Dokumente können jedoch in Form von Grafiken gespeichert werden.

Text wird nicht korrekt erkannt