Training
Beim Training werden die OCR-Zuordnungen für Zeichenformen des Bilds geändert. Die Erkennungsgenauigkeit bei langen Dokumenten und Dokumenten, in denen ähnliche Schriftarten verwendet werden, wird dadurch verbessert. Es lohnt sich meistens, wiederholt falsch erkannte, nicht erkannte oder ungewöhnliche Zeichen oder Symbole zu trainieren. Beim automatischen Training, IntelliTrain, werden Trainingsdaten aus den Korrekturen des Benutzers gewonnen, die dieser beim Prüfen des Texts im Texteditor vornimmt. Beim manuellen Training kann der Benutzer nach der Erkennung bestimmte Zeichen zum Training auswählen.
Alle Trainingsdaten können in einer Trainingsdatei gespeichert werden, die später verwendet und bei Bedarf geladen werden kann. Eine Trainingsdatei enthält eine Reihe von Zeichenformen, die jeweils einer OCR-Lösung zugeordnet sind. Wenn eine Trainingsdatei geladen wird, werden die darin gespeicherten Formen bei der Erkennung mit problematischen Formen auf den erkannten Seiten verglichen. Die zugeordneten Lösungen werden dann in geeigneten Fällen angewendet.
Trainingsdaten können auch genutzt werden, ohne in einer Trainingsdatei gespeichert zu sein. Ungespeicherte Trainingsdaten werden in einem OmniPage-Dokument beibehalten. Wenn Sie das Dokument nicht als OPD-Datei speichern möchten, aber die Trainingsdaten behalten möchten, müssen Sie diese vor dem Schließen des Dokuments speichern. Wenn Sie ein Dokument schließen oder zu einem anderen Dokument wechseln, wird ein Dialogfeld zum Speichern von ggf. nicht gespeicherten Trainingsdaten eingeblendet.
Für Japanisch, Koreanisch und Chinesisch ist kein Training verfügbar. Führen Sie bei diesen Sprachen kein manuelles Training aus, und vergewissern Sie sich, dass im Dialogfeld Optionen im Register Prüfung die Option IntelliTrain deaktiviert ist, bevor Sie eine Erkennung für diese Sprachen durchführen. Darüber hinaus darf keine Trainingsdatei geladen sein, da der Inhalt durch die OCR asiatischer Sprachen beschädigt werden kann.
//