Informacje o wyodrębnianiu danych formularza

Omnipage pro Informacje o wyodrębnianiu danych formularza

Ten temat dotyczy tylko programu OmniPage Professional.

Proces wyodrębniania danych formularza umożliwia zebranie danych z zestawu wypełnionych formularzy do dalszego przetwarzania w bazach danych lub arkuszach kalkulacyjnych. Wyodrębnianie danych formularza jest wykonywane w ramach kroku przepływu czynności w programie OmniPage.

Układ i lokalizacja elementów formularza są zdefiniowane w pliku szablonu formularza. Formularze do przetwarzania muszą być wypełnione na komputerze lub podobnym urządzeniu — nie mogą być wypełnione ręcznie. Dane wyjściowe to plik z wartościami rozdzielanymi przecinkami (csv), który można otworzyć jako tabelę w arkuszu kalkulacyjnym. Każdy element formularza staje się kolumną tabeli. Dane z każdego formularza są przedstawione w jednym wierszu. Elementy formularza to zwykle pola do wypełnienia, pola wyboru i przyciski opcji.

Pliki szablonów formularza

Szablon formularza musi być aktywnym formularzem PDF niezawierającym obrazów, w którym są prawidłowo przedstawione elementy formularza występujące w formularzach do przetwarzania. Szablon może być wypełniony lub niewypełniony. Może być formularzem wielostronicowym. Można określić zakres stron w celu wyeliminowania stron niebędących częścią formularza, na przykład stron zawierających instrukcje dotyczące wypełniania. Poniżej podano informacje o sposobie interpretowania zakresu stron w różnych typach przetwarzania.

Aby samodzielnie utworzyć plik szablonu, można użyć programu OmniPage Professional lub edytora PDF, takiego jak program Nuance PDF Converter Professional. Informacje na ten temat zawarto w artykule Informacje o tworzeniu formularzy. Po utworzeniu pliku szablonu należy zapisać ten formularz w formacie PDF.

Konfigurowanie przepływu czynności

Aby skonfigurować przepływ czynności, należy użyć Asystenta przepływu czynności. Przepływ czynności zwykle zawiera trzy kroki: Załaduj pliki, Wyodrębnij dane formularza oraz krok zapisywania. Więcej informacji zawarto w artykule Wyodrębnianie danych formularza w Asystencie przepływu czynności.

Przetwarzanie wypełnionych plików PDF

W tym procesie mogą być przetwarzane wszystkie odmiany formatu PDF z wyjątkiem formatu Obraz PDF. Pliki PDF mogą być statyczne lub aktywne. W tym przypadku każdy formularz musi się znajdować w oddzielnym pliku PDF. Jeśli dla szablonu jest wybrany zakres stron, ten sam zakres stron jest stosowany do wszystkich przetwarzanych plików PDF.

Przetwarzanie wypełnionych formularzy zapisanych jako pliki obrazów

W tym procesie mogą być przetwarzane wszystkie formaty plików obrazów obsługiwane przez program OmniPage, w tym format Obraz PDF. W tym przypadku pliki, które mają być przetwarzane, muszą zawierać liczbę stron zdefiniowaną przez zakres stron określony dla pliku szablonu. Jeśli na przykład zakres stron szablonu to strony 2–4, każdy formularz, który ma być przetwarzany, musi zawierać trzy strony.

Każdy formularz, który ma być przetwarzany, może znajdować się w oddzielnym pliku, ale można także przetwarzać wiele formularzy umieszczonych w jednym wielostronicowym pliku obrazu. W powyższym przykładzie strony 1–3, 4–6, 7–9 itp. będą traktowane jako oddzielne formularze.

Przetwarzanie wypełnionych zeskanowanych formularzy

Do skanowania wypełnionych formularzy najlepiej użyć automatycznego podajnika dokumentów (ADF). Należy zeskanować tylko te wypełnione strony formularza, które są określone w szablonie formularza (uwzględniając jego zakres stron, jeśli jest określony). Podczas skanowania dużej liczby formularzy wielostronicowych nie są potrzebne arkusze separatora.

//

Informacje o wyodrębnianiu danych formularza