Uczenie automatyczne
Uczenie automatyczne, zwane IntelliTrain, polega na pobieraniu danych wejściowych z poprawek wprowadzanych przez użytkownika w trakcie przeprowadzania korekty pisowni. Program zapamiętuje kształt znaku i zmienione rozwiązanie dla tego kształtu, a następnie wyszukuje podobne kształty znaków w dokumencie.
Aby były generowane dane uczenia, w panelu Korekta okna dialogowego Opcje należy zaznaczyć pole wyboru Zastosuj IntelliTrain. Podczas przeprowadzania korekty należy też wprowadzać zmiany w oknie dialogowym Korektor OCR lub korzystając z menu skrótów danego wyrazu niepewnego. Inne czynności edycyjne nie powodują generowania danych uczenia. Nie wszystkie zmiany korekcyjne powodują generowanie danych uczenia — zachowywane są tylko zmiany wybrane przez moduł IntelliTrain.
Przykład działania modułu IntelliTrain:
W programie OmniPage taki kształt może zostać zinterpretowany jako „aktówcc”. Podczas przeprowadzania korekty użytkownik zmienia “aktówcc” na “aktówce”. Moduł IntelliTrain zapamiętuje kształt problematycznego znaku i zasadę: to nie jest „c”, to jest „e”. Następnie wyszukuje w dokumencie podobne kształty znaków i rozważa ich zmianę:
Kształty znaków w dokumencie podobne do „e” |
Rozpoznane |
Wyrazy zmienione |
|
bizncsowc |
biznesowe |
|
Niczalcżnic |
Niezależnie |
Aby były generowane dane uczenia IntelliTrain
-
Otwórz panel Korekta okna dialogowego Opcje i włącz moduł IntelliTrain.
-
Wybierz trzy lub cztery strony na początku długiego dokumentu. Powinny to być strony z typowym dla całego dokumentu krojem czcionki i jakością obrazu.
-
Rozpoznaj strony i dokonaj korekty wyników. W razie potrzeby wprowadź poprawki.
-
Otwórz okno dialogowe Edytowanie danych uczenia i sprawdź kształty znaków oraz przypisane do nich rozwiązania OCR. Więcej informacji dotyczących edytowania danych uczenia można znaleźć w temacie Pliki uczenia.