Ulepszanie obrazów na potrzeby procesu OCR

Obrazy podstawowe są obrazami w skali odcieni szarości lub obrazami kolorowymi, zaś dla potrzeb procesu OCR są generowane czarno-białe obrazy OCR. Te obrazy można wyświetlać i modyfikować. Wprawdzie dla potrzeb procesu OCR można używać obrazów niskiej jakości, jednak powinny one zawierać znaki o prawidłowym kształcie bez zniekształceń (np. kropek, zabrudzeń lub cieniowanych linii).

Aby ulepszyć obraz na potrzeby procesu OCR, można użyć trzech następujących narzędzi na pasku narzędzi SET: Usuń szum, Jasność obrazu OCR i Usuń kolor. Jeśli nie zaznaczono żadnych obszarów, zmiany zostaną zastosowane do całego obrazu.

Omnipage tb ie despeckle Ulepszanie obrazów na potrzeby procesu OCR Usuń szum

To narzędzie umożliwia usuwanie kropek lub plamek o rozmiarze 1 lub 2 pikseli z czarno-białych obrazów. W celu uzyskania najlepszego wyniku należy przesunąć suwak. Podczas usuwania szumu należy zachować ostrożność, ponieważ ustawienie zbyt wysokiej wartości może spowodować zniekształcenie samych znaków. Dostępne są następujące metody usuwania szumu: Normalna, Półtony oraz Sól i pieprz.

Omnipage tb ie ocrbrightness Ulepszanie obrazów na potrzeby procesu OCR Jasność obrazu OCR

To narzędzie można stosować do obrazów czarno-białych, ale jest przydatne tylko wtedy, gdy obraz podstawowy jest obrazem kolorowym lub obrazem w skali odcieni szarości, ponieważ program wygeneruje nowy obraz OCR przy użyciu zmienionego ustawienia. Jakość obrazu nie ulegnie poprawie w sytuacji, gdy obraz podstawowy jest czarno-biały. W takim przypadku należy ponownie zeskanować dokument.

Jasność ma duże znaczenie dla dokładności rozpoznawania OCR. Po załadowaniu obrazu należy sprawdzić jego wygląd. Jeżeli znaki są grube i nakładają się na siebie, należy zwiększyć jasność. Jeżeli znaki są cienkie i przerywane, należy zmniejszyć jasność. Za pomocą narzędzia Jasność obrazu OCR można zoptymalizować obraz. Na rysunku przedstawiono optymalne ustawienie jasności.

Omnipage eng bright Ulepszanie obrazów na potrzeby procesu OCR

Narzędzia Jasność obrazu OCR można również używać w odniesieniu do zaznaczonych obszarów obrazu, co umożliwia osobne dostosowywanie jasności w różnych częściach obrazu. Dostosowywana jest jasność znaków i tła. Zazwyczaj marginesy obrazu są ciemniejsze. W takiej sytuacji należy zaznaczyć ciemniejszy obszar obrazu, kliknąć narzędzie Jasność obrazu OCR i przeciągnąć suwak na skali w lewą stronę, aby zwiększyć jasność.

Omnipage tb ie dropout color Ulepszanie obrazów na potrzeby procesu OCR Usuń kolor

To narzędzie jest używane w odniesieniu do wydrukowanych formularzy kolorowych, w których użyto różnych kolorów dla stałego tekstu. Umożliwia to rozpoznanie tylko danych wprowadzonych przez osoby, które wypełniły formularz, bez instrukcji, nazw elementów, ramek i innych kształtów.

Na obrazie można wybrać wstępnie zdefiniowany kolor (czerwony, zielony lub niebieski) albo kolorowy obszar. Narzędzie Zaznacz obszar umożliwia narysowanie prostokąta obejmującego kolor tła strony i kolor do usunięcia. Wybrany kolor stanie się niewidoczny na obrazie OCR.

Pozostałe narzędzia dotyczą obrazu podstawowego oraz obrazu OCR i również mogą poprawić dokładność rozpoznawania OCR.

//

Ulepszanie obrazów na potrzeby procesu OCR