Tekst nie jest prawidłowo rozpoznawany
Jeśli jakiś fragment oryginalnego dokumentu nie został podczas procesu OCR poprawnie przekonwertowany na tekst, wypróbuj następujące rozwiązania:
-
Obejrzyj obraz strony i upewnij się, że wszystkie obszary tekstu znajdują się w strefach tekstu. Jeśli jakiś obszar nie znajduje się w strefie, jest zwykle ignorowany podczas procesu OCR.
-
Sprawdź, czy strefy tekstu zostały właściwie zidentyfikowane. W razie potrzeby dokonaj ponownej identyfikacji typów i zawartości stref, a następnie ponownie przeprowadź proces OCR na dokumencie. Więcej informacji zawiera temat Typy i zawartości stref.
-
Sprawdź, czy przez pomyłkę nie załadowano nieodpowiedniego szablonu. Jeśli obramowania stref przecinają tekst, jakość rozpoznawania jest gorsza.
-
Ustaw odpowiednio suwaki jasności i kontrastu w panelu Skaner okna dialogowego Opcje. Konieczne może być wypróbowanie różnych ustawień w celu uzyskania zadowalających rezultatów.
-
Obrazy można ulepszyć na potrzeby rozpoznawania OCR za pomocą narzędzi SET.
-
Sprawdź rozdzielczość oryginalnego obrazu. W tym celu umieść kursor nad miniaturą strony. Jeśli rozdzielczość jest znacznie wyższa lub znacznie niższa od 300 dpi, jakość rozpoznawania może ulec pogorszeniu.
-
Sprawdź w panelu OCR okna dialogowego Opcje, czy wybrane zostały właściwe języki dokumentu. Wybrane powinny być tylko języki faktycznie występujące w dokumencie. W szczególności ustawienie języka azjatyckiego dla tekstów nieazjatyckich (i odwrotnie) może spowodować, że uzyskane wyniki będą bezużyteczne.
-
Jeśli włączono opcję Automatycznie wykryj pojedynczy język, w wyniku automatycznej analizy do każdej strony przychodzącej zostaje przypisany jeden język. Strony wielojęzyczne i strony z przypisanym niewłaściwym językiem należy ponownie rozpoznać ręcznie.
-
Wyniki rozpoznawania w języku japońskim, koreańskim i chińskim można wyświetlać i zapisywać tylko w przypadku, gdy w systemie zainstalowano obsługę języków wschodnioazjatyckich.
-
Włącz moduł IntelliTrain i wprowadź kilka poprawek korekcyjnych. Bardzo prawdopodobne jest, że poprawi to wyniki rozpoznawania w przypadku stylizowanych krojów czcionek lub dokumentów o złej jakości. Jeśli moduł IntelliTrain był włączony, wyłącz go — w przypadku niektórych dokumentów o złej jakości może on nie być w stanie poprawić wyników rozpoznawania.
-
Zastosuj uczenie ręczne lub dokonaj edycji istniejących danych uczenia w celu usunięcia nieprawidłowych danych.
-
W przypadku używania opcji True Page jako poziomu formatowania Edytora tekstu lub na potrzeby eksportowania rozpoznany tekst umieszczany jest w polach tekstowych lub ramkach. Jeśli pole tekstowe jest zbyt małe, część tekstu może być ukryta. Aby wyświetlić ukryty tekst, umieść kursor w polu tekstowym i przewiń tekst w górę, w dół, w lewo lub w prawo za pomocą klawiszy ze strzałkami.
-
Sprawdź, czy szyba, lustra i soczewki skanera nie są zakurzone, zabrudzone ani zarysowane. W razie potrzeby wyczyść je.
-
Program OmniPage rozpoznaje tylko znaki drukowane, na przykład tekst napisany na maszynie lub wydrukowany za pomocą drukarki laserowej. Może obsługiwać znaki drukowane na drukarkach igłowych, ale dokładność rozpoznawania może być gorsza w przypadku wydruków o jakości roboczej. Program nie rozpoznaje znaków pisanych odręcznie. Podpis lub inny tekst odręczny może jednak zostać zachowany jako grafika.