Ustawienia niestandardowego układu strony

Ustawienia opisu układu stron dokumentu są dostępne po kliknięciu przycisku Układ niestandardowy w panelu OCR okna dialogowego Opcje.

Omnipage tb st options Ustawienia niestandardowego układu strony

Okno dialogowe Opcje można otworzyć za pomocą przycisku Opcje na pasku narzędzi Standardowe lub z poziomu menu Narzędzia.

Okno dialogowe Układ niestandardowy pozwala na bardzo dokładny opis stron wejściowych, co daje maksymalną kontrolę nad procesem automatycznego wyznaczania stref, a przez to nad układem wyników rozpoznawania.

Automatyczne wyznaczanie stref jest zawsze uruchamiane na stronach wysłanych do rozpoznawania bez wyznaczonych stref. Więcej informacji można znaleźć w temacie Kiedy jest wykonywane automatyczne wyznaczanie stref?

Program udostępnia wstępnie zdefiniowane ustawienia układu oryginału. Opcje te pojawiają się na początku listy rozwijanej pod przyciskiem Wykonaj OCR. Możliwe jest wybranie jednej z następujących opcji:

  • Automatycznie (ustawienie domyślne)

  • Jedna szpalta, bez tabel

  • Kilka szpalt, bez tabel

  • Jedna szpalta, z tabelą

  • Arkusz kalkulacyjny

  • Formularz

  • Urzędowy z numerami wierszy

  • Niestandardowy (zdefiniowany przez użytkownika)

  • Szablony stref (dostępne są wszystkie zapisane szablony stref)

Informacje o wstępnie zdefiniowanych ustawieniach zawiera temat Opisywanie układu oryginału. Informacje o korzystaniu z szablonów stref zawiera temat Szablony stref.

Jeśli żadne ze wstępnie zdefiniowanych ustawień nie jest odpowiednie do opisania dokumentu, można wybrać opcję Niestandardowy. Następnie należy kliknąć przycisk Układ niestandardowy w panelu OCR okna dialogowego Opcje. Umożliwia to określenie liczby szpalt oraz obecności tabel i grafiki na stronach wejściowych. Podane wartości zostaną zastosowane tylko po ustawieniu jako opisu układu oryginału opcji Niestandardowy.

Określenie układu niestandardowego jest najbardziej przydatne przy wykonywaniu dużych zadań rozpoznawania przy minimalnym udziale użytkownika, na przykład podczas przetwarzania automatycznego lub korzystania z Menedżera zadań. W takich przypadkach użytkownik nie ma możliwości sprawdzania typów stref utworzonych na każdej stronie. Dlatego tak ważne jest, aby proces automatycznego wyznaczania stref przebiegał zgodnie z życzeniem użytkownika.

Możliwy jest wybór następujących opcji:

Tekst ciągły

Bez szpalt

Ustawienie właściwe dla stron wejściowych bez tekstu ciągłego. Rozpoznane strony będą zawierać tylko grafiki lub tabele. Zaznaczenie tej opcji spowoduje, że program będzie traktował wszelki tekst znaleziony na stronie jako część tabeli.

Jedna szpalta

Ustawienie właściwe dla stron wejściowych zawierających tekst ciągły w jednej szpalcie, np. listów handlowych lub sprawozdań.

Automatycznie

Ustawienie właściwe dla stron wejściowych zawierających tekst ciągły rozmieszczony przynajmniej w części w kilku szpaltach. Program postara się wykryć te szpalty. Za pomocą widoków Edytora tekstu można zdecydować, czy tekst ma być rozszpaltowany, czy rozmieszczony w szpaltach.

Tabele

Bez tabel

Po zaznaczeniu tej opcji wszystkie fragmenty tekstowe będą traktowane jako tekst ciągły. Można jej użyć nawet wtedy, gdy na oryginalnej stronie znajduje się tabela, której zawartość ma zostać zachowana, lecz nie w formie tabeli. Oznacza to, że zawartość tabeli nie zostanie umieszczona w siatce. Może też zostać umieszczona w szpaltach lub jako tekst ciągły, umożliwiając jej późniejsze sformatowanie zgodnie z potrzebami.

Jedna tabela

Program będzie próbował wykryć tabelę na każdej stronie. Jeśli znajdzie on dane tabelaryczne, umieści je w siatce w Edytorze tekstu. Można następnie zdecydować, czy dane mają zostać wyeksportowane jako tabela, czy jako rozdzielone tabulatorami szpalty.

Automatycznie

Zaznaczenie tej opcji powoduje automatyczne wykrywanie przez program tabel. Opcję należy wybrać dla stron zawierających więcej niż jedną tabelę oraz dla dokumentów zawierających tabele tylko na niektórych stronach.

Grafika

Bez grafiki

Wybranie tej opcji spowoduje, że strefy grafiki nie będą wyszukiwane ani wykrywane. Strona nie będzie zawierać żadnych stref grafiki. Wszystkie wykryte automatycznie strefy będą traktowane jako tekstowe i program będzie próbował odczytać ich zawartość. Wszystkie grafiki, np. zdjęcia, zostaną pominięte. Wybranie tej opcji dla stron z grafiką liniową lub wykresami może spowolnić proces rozpoznawania. Opcję tę należy wybrać, aby został rozpoznany tekst znajdujący się w obrębie wykresów. Należy ją wybrać również wtedy, gdy fragment przeznaczony do rozpoznania może zostać niewłaściwe zinterpretowany jako grafika.

Jedna grafika

Opcję tę należy wybrać, jeżeli każda strona zawiera jedną grafikę.

Automatycznie

Zaznaczenie tej opcji umożliwi programowi automatyczne określanie fragmentów strony jako tekstu lub grafiki. Należy ją wybrać, jeżeli strona zawiera więcej niż jedną grafikę lub grafiki zawarte są tylko na niektórych stronach dokumentu.

Każdy z oferowanych opisów układu strony stanowi kombinację ustawień niestandardowych. Zostało to przedstawione w poniższej tabeli:

Opis układu

Tekst ciągły

Tabele

Grafika

Automatycznie

Automatycznie

Automatycznie

Automatycznie

Jedna szpalta, bez tabel

Jedna szpalta

Bez tabel

Automatycznie

Kilka
szpalt, bez tabel

Automatycznie

Bez tabel

Automatycznie

Jedna szpalta, z tabelą

Jedna szpalta

Automatycznie

Automatycznie

Arkusz kalkulacyjny

Bez szpalt

Jedna tabela

Bez grafiki

Wartości niestandardowe nie zmieniają się wraz z wybraniem innego opisu dokumentu wejściowego. Oznacza to, że w zależności od potrzeb, można zdefiniować jeden lub więcej niestandardowych układów strony.

Ustawienia niestandardowego układu strony