Strefy, tła i automatyczne wyznaczanie stref
Odpowiednie oznaczenie stref oraz tła na obrazie strony umożliwia określenie sposobu przetwarzania poszczególnych elementów strony (tekstu, tabel czy grafiki), a także zdefiniowanie części strony, w których strefy zostaną wyznaczone automatycznie.
Strefami nazywane są obszary otoczone obramowaniami, wyznaczone na obrazie strony, którego tło może być oznaczone jako przetwarzane lub ignorowane. Strefy mogą być strefami tekstu, tabel, grafiki, a także przetwarzanymi i ignorowanymi.
Funkcja ręcznego wyznaczania stref umożliwia wybór dowolnego z wymienionych typów stref.
Do wyznaczania stref tekstu służy przycisk , do wyznaczania stref tekstu pionowego obracanego w lewo — przycisk , do wyznaczanie stref tekstu pionowego obracanego w prawo — przycisk , do wyznaczania stref pionowego tekstu azjatyckiego — przycisk , do wyznaczania stref tabel — przycisk , a do wyznaczania stref grafiki — przycisk (wszystkie przyciski znajdują się na pasku narzędzi Obraz).
Fragmenty obrazu z wyznaczonymi ręcznie strefami tekstu, tabel lub grafiki nie podlegają automatycznemu wyznaczaniu stref.
|
W programie OmniPage Professional do wyznaczenia stref formularzy w celu zdefiniowania obszarów, na których mają być wykrywane elementy formularza przy użyciu technologii LFR, służy przycisk . Funkcja automatycznego wykrywania stref nie wykrywa formularzy. |
Fragmenty obrazu przeznaczone do automatycznego wyznaczania stref można określić za pomocą stref (i tła) przetwarzanych i ignorowanych.
Fragmenty przetwarzane (strefy lub tła przetwarzane) są poddawane automatycznemu wyznaczeniu stref po przesłaniu obrazu do rozpoznawania. W trakcie rozpoznawania we fragmentach tych zostaną wyznaczone strefy tekstu, tabel lub grafiki.
Fragmenty ignorowane (strefy lub tła ignorowane) są wyłączone z przetwarzania. Tekst z tych stref nie jest rozpoznawany, a ich obraz nie jest przenoszony.
Działanie funkcji automatycznego wyznaczania stref wygląda następująco:
W ramach funkcji automatycznego wyznaczania stref program wykrywa bloki tekstu, nagłówki, ilustracje oraz inne elementy strony i wyznacza strefy otaczające te elementy. Poszczególne strefy są oznaczane jako strefy tekstu, tabel lub grafiki. Zawartość stref tekstu i tabel dzieli się na alfanumeryczną i liczbową.
Podczas przetwarzania automatycznego program wyznacza strefy na całych stronach (chyba że został załadowany szablon). Przebieg procesu automatycznego wyznaczania stref zależy od określonego opisu układu.
Poniżej przedstawiono sposoby przeprowadzania automatycznego wyznaczania stref przy przetwarzaniu ręcznym:
-
Automatyczne wyznaczenie stref na całej stronie. Strona nie może zawierać żadnych stref.
-
Automatyczne wyznaczenie stref na części strony. Odpowiednia część strony musi być oznaczona jako strefa przetwarzana.
-
Automatyczne wyznaczenie stref na tle strony. Tło strony musi być oznaczone jako tło przetwarzane.
Aby automatycznie wyznaczyć strefy na całej stronie
-
Pobierz stronę. Tło strony zostanie oznaczone jako przetwarzane.
-
Na liście rozwijanej Opis układu upewnij się, że nie został załadowany szablon stref.
-
Kliknij przycisk Wykonaj OCR.
Po przeprowadzeniu rozpoznawania wszystkie elementy strony będą znajdowały się w odpowiednich strefach, natomiast tło zostanie oznaczone jako ignorowane.
Obrazy przesłane do rozpoznania bez stref zostaną poddane automatycznemu wyznaczeniu stref.
-
Można wysłać kilka stron niezawierających stref do wspólnego automatycznego wyznaczania stref i rozpoznawania. Należy wówczas zaznaczyć te strony i kliknąć przycisk Wykonaj OCR.
Aby automatycznie wyznaczyć strefy na części strony
-
Pobierz stronę. Tło strony zostanie oznaczone jako przetwarzane.
-
Wyznacz strefę. Po ręcznym wyznaczeniu pierwszej strefy tło zostanie oznaczone jako ignorowane.
-
Wyznacz strefy tekstu, tabel lub grafiki (na tle ignorowanym) w celu utworzenia obszarów objętych ręcznym wyznaczaniem stref.
-
Wyznacz strefy przetwarzane (na tle ignorowanym) w celu utworzenia obszarów objętych automatycznym wyznaczaniem stref.
-
Kliknij przycisk Wykonaj OCR.
Po zakończeniu rozpoznawania strefy przetwarzane zostaną zastąpione strefami tekstu, tabel lub grafiki.
Strefy wyznaczone automatycznie są obramowane linią ciągłą, a strefy wyznaczone ręcznie — linią kropkowaną.
Aby automatycznie wyznaczyć strefy na tle strony
-
Pobierz stronę i wyznacz strefy ręcznie zgodnie z opisem w punktach 1–3.
-
Kliknij ikonę narzędzia Tło przetwarzane () na pasku narzędzi Obraz w celu oznaczenia tła jako przetwarzane.
Po przeprowadzeniu rozpoznawania wszystkie elementy strony, znajdujące się na tle przetwarzanym poza strefami wyznaczonymi ręcznie, zostaną przypisane do wygenerowanych automatycznie stref tekstu, tabel lub grafiki. Tło przetworzonej w ten sposób strony zostanie oznaczone jako ignorowane.
Aby wyłączyć z rozpoznawania określone części strony, należy wyznaczyć w ich miejscu strefy ignorowane na tle przetwarzanym (za pomocą narzędzia Wyznacz strefę ignorowaną — ).
Automatyczne wyznaczanie stref a tekst pionowy
Automatyczne wyznaczanie stref jest zalecane w przypadku rozpoznawania języków azjatyckich. Funkcja ta potrafi automatycznie wykryć kierunek tekstu. Możliwe jest jednak także ręczne wyznaczanie stref.
Funkcja automatycznego wyznaczania stref może także w wielu przypadkach wykryć tekst pionowy w językach nieazjatyckich. Więcej informacji zawarto w temacie Automatyczne wyznaczanie stref na tekście pionowym. Tekst pionowy w komórkach tabel można wykryć tylko automatycznie. W innych przypadkach można ręcznie wyznaczyć strefy tekstu pionowego.
//