Uczenie automatyczne

Uczenie automatyczne, zwane IntelliTrain, polega na pobieraniu danych wejściowych z poprawek wprowadzanych przez użytkownika w trakcie przeprowadzania korekty pisowni. Program zapamiętuje kształt znaku i zmienione rozwiązanie dla tego kształtu, a następnie wyszukuje podobne kształty znaków w dokumencie.

Aby były generowane dane uczenia, w panelu Korekta okna dialogowego Opcje należy zaznaczyć pole wyboru Zastosuj IntelliTrain. Podczas przeprowadzania korekty należy też wprowadzać zmiany w oknie dialogowym Korektor OCR lub korzystając z menu skrótów danego wyrazu niepewnego. Inne czynności edycyjne nie powodują generowania danych uczenia. Nie wszystkie zmiany korekcyjne powodują generowanie danych uczenia — zachowywane są tylko zmiany wybrane przez moduł IntelliTrain.

Przykład działania modułu IntelliTrain:

Omnipage eng train aut1 Uczenie automatyczne

W programie OmniPage taki kształt może zostać zinterpretowany jako „aktówcc”. Podczas przeprowadzania korekty użytkownik zmienia “aktówcc” na “aktówce”. Moduł IntelliTrain zapamiętuje kształt problematycznego znaku i zasadę: to nie jest „c”, to jest „e”. Następnie wyszukuje w dokumencie podobne kształty znaków i rozważa ich zmianę:
   

 

Kształty znaków w dokumencie podobne do „e”

Rozpoznane
wyrazy

Wyrazy zmienione
przez moduł IntelliTrain

Omnipage eng train aut2 Uczenie automatyczne

bizncsowc

biznesowe

Omnipage eng train aut3 Uczenie automatyczne

Niczalcżnic

Niezależnie

 

Aby były generowane dane uczenia IntelliTrain

  1. Otwórz panel Korekta okna dialogowego Opcje i włącz moduł IntelliTrain.

  2. Wybierz trzy lub cztery strony na początku długiego dokumentu. Powinny to być strony z typowym dla całego dokumentu krojem czcionki i jakością obrazu.

  3. Rozpoznaj strony i dokonaj korekty wyników. W razie potrzeby wprowadź poprawki.

  4. Otwórz okno dialogowe Edytowanie danych uczenia i sprawdź kształty znaków oraz przypisane do nich rozwiązania OCR. Więcej informacji dotyczących edytowania danych uczenia można znaleźć w temacie Pliki uczenia.

 

Uczenie automatyczne