Genauigkeit verbessern
Mit den folgenden Tipps können Sie die OCR-Genauigkeit von OmniPage erhöhen.
Einstellungen im Dialogfeld Optionen, mit denen die Genauigkeit verbessert werden kann
Wählen Sie Optionen im Menü Extras oder klicken Sie in der Standardwerkzeugleiste auf . Klicken Sie anschließend im Dialogfeld Optionen auf das Register mit den Einstellungen, die Sie ändern möchten.
-
Wählen Sie im Register OCR unter OCR-Prozess optimieren für die Option Genauigkeit.
-
Verändern Sie die Einstellung der Schieberegler für Helligkeit und Kontrast im Register Scanner. Wenn Sie hier klicken, sehen Sie Beispiele für optimale Helligkeit.
-
Bearbeiten Sie die Bilder für die OCR mit den SET-Werkzeugen.
-
Wenn es Ihnen im Wesentlichen um die Erkennungsgenauigkeit geht, sollten Sie für Dokumente in guter Druckqualität mit gestochen scharfem, schwarz gedruckten Text auf weißem Hintergrund in Schwarzweiß scannen. Verwenden Sie Graustufen, wenn Sie Seiten scannen, deren Text auf farbigem oder schattierten Hintergrund gedruckt ist, oder für Dokumente in schlechter Druckqualität mit geringem oder wechselndem Kontrast.
-
Wählen Sie Trainingsdatei im Register Prüfung, um mithilfe einer Trainingsdatei die Erkennung von Sonderzeichen oder Zeichen in einer ungewöhnlichen Schriftart zu verbessern. Weitere Informationen finden Sie unter Trainingsdateien. Dies gilt nicht für asiatische Sprachen.
Geeignete Erkennungshilfen verwenden
-
Wenn Sie ein langes Dokument verarbeiten und keine dafür geeignete Trainingsdatei haben, führen Sie anhand einiger typischer Seiten ein Training durch. Aktivieren Sie im Register Prüfung des Dialogfelds Optionen die Funktion IntelliTrain, führen Sie eine Erkennung für drei oder vier Seiten durch und prüfen Sie den Text. Überprüfen Sie die Trainingsqualität im Dialogfeld Training bearbeiten und speichern Sie die Trainingsdaten anschließend in einer Datei.
-
Wenn Sie zwar eine Trainingsdatei geladen haben, aber dennoch schlechte Ergebnisse erzielen, überprüfen Sie den Inhalt der Datei im Dialogfeld Training bearbeiten. Vergewissern Sie sich, dass diese Daten für das aktuelle Dokument geeignet sind. Ist dies nicht der Fall, deaktivieren Sie das Training oder bearbeiten Sie es, damit beim Training keine schlecht geformten Zeichen verwendet werden. Mit nicht geeigneten Trainingsdaten erzielen Sie unter Umständen schlechtere Ergebnisse als ganz ohne jedes Training.
-
Falls die Prüfung zu viele nicht geeignete Worte überspringt und Sie ein Anwenderwörterbuch geladen haben, überprüfen Sie den Inhalt des Wörterbuchs im Dialogfeld Anwenderwörterbuch bearbeiten. Löschen Sie alle versehentlich darin aufgenommenen Einträge, insbesondere falsch geschriebene Worte.
Bereiche richtig kennzeichnen
-
Wenn Sie Seiten manuell verarbeiten, sorgen Sie dafür, dass Bereiche vor der Erkennung richtig gekennzeichnet sind.
-
Vergewissern Sie sich bei automatischer Verarbeitung, dass die ursprünglichen Layout-Einstellungen die für das Dokument am besten geeigneten Einstellungen sind. Überprüfen Sie die Erkennungsergebnisse. Falls einige Fehler auf eine schlechte Bereichseinteilung einiger Seiten zurückzuführen sind, ändern Sie die Eigenschaften oder Positionen dieser Bereiche und führen Sie eine erneute Erkennung der betreffenden Seiten durch.
-
Vergewissern Sie sich, dass nicht die Datei einer Bereichsvorlage geladen ist, die für die aktuellen Seiten nicht geeignet ist.
-
Um handschriftlichen Text, wie beispielsweise eine Unterschrift, beizubehalten, sollten Sie diesen als Grafikbereich kennzeichnen.
Hochwertige Bilder verwenden
-
Verwenden Sie nach Möglichkeit nur Originaldokumente zum Scannen. Mit einem hochwertigen Druckbild erzielen Sie die höchste OCR-Genauigkeit. Bei Bildern von geringerer Qualität ist die OCR-Genauigkeit möglicherweise nicht so gut.
-
Wenn die Originale von schlechter Qualität sind, kann es sein, dass Sie mit einer guten Fotokopie bessere OCR-Ergebnisse erzielen. Das kann bei Dokumenten, die nur geringen Kontrast aufweisen oder auf dünnem Papier gedruckt sind, der Fall sein. Vergessen Sie allerdings nicht, dass schlechte Fotokopien mit Streifen, Flecken oder unregelmäßiger Helligkeit in der Regel zu noch schlechteren Ergebnissen führen.
-
Beim Versenden sollte die Auflösung „Fein“ bzw. die höchstmögliche Auflösung ausgewählt werden.
-
Die zu scannenden Seiten sollten frei von Anmerkungen, Strichen oder Kritzeleien sein. Alle Zeichen, die keine Druckbuchstaben sind, verlangsamen die Erkennung. Zeichen, an denen eine Markierung vorgenommen wurde, sind möglicherweise nicht erkennbar. Übernehmen Sie solche Zeichen möglichst nicht in einen Bereich oder umschließen Sie sie mit einem Bereich des Typs „Ignorieren“.
-
Der Text auf den zu scannenden Seiten sollte relativ klar und sauber sein. Die Zeichen sollten klar voneinander getrennt sein, also nicht ineinander übergehen oder sich überlappen.
-
Falls Sie Einfluss auf Formatierung in den Dokumenten, die Sie scannen möchten, nehmen können, sorgen Sie dafür, dass möglichst keine Unterstreichungen verwendet werden. Unterstrichener Text ist schwer zu erkennen, da die Unterstreichungen die Form der Unterlängen von Buchstaben verändern (z. B. q, g, y, p, j).
-
Falls Sie mit Bilddateien schlechte Ergebnisse erzielen, überprüfen Sie deren Qualität und Auflösung, indem Sie mit dem Cursor auf die Miniaturansichten zeigen. Für die optische Zeichenerkennung sind 300 DPI die optimale Auflösung. Bei Bildern mit weniger als 200 oder mehr als 400 DPI wird die Genauigkeit wahrscheinlich deutlich sinken. Falls Sie die Dokumente in gedruckter Form vorliegen haben, scannen Sie sie erneut mit geeigneteren Einstellungen. Falls dies nicht möglich ist, bitten Sie die Personen, von denen Sie die Bilder erhalten, eine Auflösung von 300 DPI zu verwenden.
//