Ulepszanie obrazów na potrzeby procesu OCR
Obrazy podstawowe są obrazami w skali odcieni szarości lub obrazami kolorowymi, zaś dla potrzeb procesu OCR są generowane czarno-białe obrazy OCR. Te obrazy można wyświetlać i modyfikować. Wprawdzie dla potrzeb procesu OCR można używać obrazów niskiej jakości, jednak powinny one zawierać znaki o prawidłowym kształcie bez zniekształceń (np. kropek, zabrudzeń lub cieniowanych linii).
Aby ulepszyć obraz na potrzeby procesu OCR, można użyć trzech następujących narzędzi na pasku narzędzi SET: Usuń szum, Jasność obrazu OCR i Usuń kolor. Jeśli nie zaznaczono żadnych obszarów, zmiany zostaną zastosowane do całego obrazu.
Usuń szum
To narzędzie umożliwia usuwanie kropek lub plamek o rozmiarze 1 lub 2 pikseli z czarno-białych obrazów. W celu uzyskania najlepszego wyniku należy przesunąć suwak. Podczas usuwania szumu należy zachować ostrożność, ponieważ ustawienie zbyt wysokiej wartości może spowodować zniekształcenie samych znaków. Dostępne są następujące metody usuwania szumu: Normalna, Półtony oraz Sól i pieprz.
Jasność obrazu OCR
To narzędzie można stosować do obrazów czarno-białych, ale jest przydatne tylko wtedy, gdy obraz podstawowy jest obrazem kolorowym lub obrazem w skali odcieni szarości, ponieważ program wygeneruje nowy obraz OCR przy użyciu zmienionego ustawienia. Jakość obrazu nie ulegnie poprawie w sytuacji, gdy obraz podstawowy jest czarno-biały. W takim przypadku należy ponownie zeskanować dokument.
Jasność ma duże znaczenie dla dokładności rozpoznawania OCR. Po załadowaniu obrazu należy sprawdzić jego wygląd. Jeżeli znaki są grube i nakładają się na siebie, należy zwiększyć jasność. Jeżeli znaki są cienkie i przerywane, należy zmniejszyć jasność. Za pomocą narzędzia Jasność obrazu OCR można zoptymalizować obraz. Na rysunku przedstawiono optymalne ustawienie jasności.
Narzędzia Jasność obrazu OCR można również używać w odniesieniu do zaznaczonych obszarów obrazu, co umożliwia osobne dostosowywanie jasności w różnych częściach obrazu. Dostosowywana jest jasność znaków i tła. Zazwyczaj marginesy obrazu są ciemniejsze. W takiej sytuacji należy zaznaczyć ciemniejszy obszar obrazu, kliknąć narzędzie Jasność obrazu OCR i przeciągnąć suwak na skali w lewą stronę, aby zwiększyć jasność.
Usuń kolor
To narzędzie jest używane w odniesieniu do wydrukowanych formularzy kolorowych, w których użyto różnych kolorów dla stałego tekstu. Umożliwia to rozpoznanie tylko danych wprowadzonych przez osoby, które wypełniły formularz, bez instrukcji, nazw elementów, ramek i innych kształtów.
Na obrazie można wybrać wstępnie zdefiniowany kolor (czerwony, zielony lub niebieski) albo kolorowy obszar. Narzędzie Zaznacz obszar umożliwia narysowanie prostokąta obejmującego kolor tła strony i kolor do usunięcia. Wybrany kolor stanie się niewidoczny na obrazie OCR.
Pozostałe narzędzia dotyczą obrazu podstawowego oraz obrazu OCR i również mogą poprawić dokładność rozpoznawania OCR.
//