Języki i alfabety

Program może odczytywać teksty w ponad 120 językach korzystających z wielu alfabetów: łacińskiego, greckiego, cyrylicy, chińskiego, japońskiego i koreańskiego. Lista języków znajduje się w panelu OCR okna dialogowego Opcje. Jest ona również dostępna w witrynie firmy Nuance w sieci Web.

Omnipage icon dict Języki i alfabety

Powyższa ikona wskazuje na język z obsługą słownikową. Obecnie są to: angielski, czeski, duński, esperanto, fiński, francuski, grecki, hiszpański, holenderski, kataloński, niemiecki, norweski, polski, portugalski, rosyjski, słoweński, szwedzki, węgierski oraz włoski. Te słowniki wspomagają razem ze słownikami użytkownika i słownikami profesjonalnymi proces rozpoznawania oraz oferują sugestie podczas korekty pisowni.

Lista dostępnych słowników profesjonalnych oraz objaśnienia opcji Automatycznie wykryj pojedynczy język i Weryfikuj wybór języków znajdują się w panelu OCR okna dialogowego Opcje.

Dla prawie wszystkich języków ze słownikami dostępne jest rozpoznawanie za pomocą wielu mechanizmów. Podczas rozpoznawania używany jest słownik każdego uruchomionego mechanizmu rozpoznawania i sugestie są pobierane z każdego z nich.

Wyrazy, których nie ma w słownikach, mogą być podkreślane w Edytorze tekstu Wyrazy te będą wyświetlane podczas korekty. Czasami wyrazy nie są oznaczane jako wyrazy spoza słowników, mimo że nie ma ich w żadnym ze słowników. Może się tak zdarzyć, gdy kilka mechanizmów rozpoznawania wygeneruje taki sam wynik i rozpozna wyraz z dużą pewnością lub jeśli taki wyraz występuje w dokumencie wiele razy.

Jeżeli wybranych zostanie kilka języków, program będzie starał się rozpoznawać wszystkie znaki diakrytyczne tych języków. Można też zatwierdzać znaki pojedynczo, jako uzupełnienie znaków zatwierdzonych przez wybór języka.

Jeżeli wybranych zostanie kilka języków z obsługą słownikową, podczas rozpoznawania wykorzystywane będą wszystkie słowniki dla wszystkich zaznaczonych języków, mogą więc być oferowane sugestie w wielu językach.

Słowniki, funkcje korekty i uczenia nie są dostępne dla języków japońskiego, koreańskiego i chińskiego oraz nie należy łączyć tych języków z innymi językami. Więcej informacji zawiera temat Rozpoznawanie języków azjatyckich.

Alfabet łaciński

Alfabet ten jest używany w większości obsługiwanych języków. Po wybraniu jednego lub więcej języków dla rozpoznawanego dokumentu wszystkie znaki diakrytyczne tych języków są uznawane jako możliwe rozwiązanie w procesie OCR.

Alfabet grecki

Alfabet grecki jest używany w języku greckim. Program OmniPage obsługuje rozpoznawanie znaków klasycznej greki. Oto jak wygląda tekst napisany klasycznym alfabetem greckim:

Omnipage lang greek%20classical Języki i alfabety

A oto jak wygląda współczesny alfabet grecki:

Omnipage lang greek%20modern Języki i alfabety

 

Poniżej przedstawiony jest zestaw obsługiwanych znaków:

Omnipage lang cp greek Języki i alfabety

Podczas rozpoznawania tekstów w języku greckim wciąż możliwe jest rozpoznawanie liter angielskich. Teksty greckie można czytać, edytować lub poddawać korekcie, nawet jeżeli na komputerze nie ma greckich czcionek ani nie obsługuje on greckich stron kodowych. Obsługa alfabetu greckiego będzie potrzebna jedynie podczas wykorzystywania eksportowanego tekstu w innych aplikacjach.

Cyrylica

Następujące języki używają cyrylicy: rosyjski, białoruski, bułgarski, czeczeński, kabardyjski, macedoński, mołdawski, serbski i ukraiński.

Poniżej przedstawiono przykład tekstu w języku rosyjskim:

Omnipage lang russian Języki i alfabety

Podczas rozpoznawania języków pisanych cyrylicą wciąż możliwe jest rozpoznawanie liter angielskich. Zdarza się bowiem, że w tekstach pisanych cyrylicą niektóre wyrazy zapisano alfabetem łacińskim. Program OmniPage rozpoznaje również takie wyrazy.

Teksty pisane cyrylicą można czytać, edytować i poddawać korekcie, nawet jeżeli na komputerze nie ma odpowiednich czcionek ani nie obsługuje on stron kodowych. Obsługa cyrylicy będzie potrzebna jedynie podczas wykorzystywania eksportowanego tekstu w innych aplikacjach.

Poniższa tabela pokazuje znaki cyrylicy obsługiwane przez program. Nie wszystkie z tych znaków występują w języku rosyjskim, mogą bowiem występować w innych językach pisanych cyrylicą.

Omnipage lang cp12ru%20cyrillic Języki i alfabety

 

Informacje dotyczące obsługi języków azjatyckich (japońskiego, chińskiego i koreańskiego) są dostępne w osobnym temacie.

 

//

Języki i alfabety