Idiomas e alfabetos

O programa pode ler mais de 120 idiomas com vários alfabetos: latino, grego, cirílico, chinês, japonês e coreano. Consulte a lista no painel OCR da caixa de diálogo Opções. O site da Nuance na Web também dispõe de uma listagem.

Omnipage icon dict Idiomas e alfabetos

Este ícone indica um idioma com suporte de dicionário. Atualmente, existem os seguintes: catalão, checo, dinamarquês, holandês, inglês, esperanto, finlandês, francês, alemão, grego, húngaro, italiano, norueguês, polonês, português, russo, esloveno, espanhol e sueco. Esses dicionários são usados juntamente com os dicionários do usuário e os dicionários profissionais para ajudar no processo de reconhecimento e para oferecer sugestões durante a revisão.

Para obter uma lista dos dicionários profissionais disponíveis e uma explicação das opções Detectar automaticamente idioma único e Verificar opções de idioma, consulte o painel OCR da caixa de diálogo Opções.

O reconhecimento com vários mecanismos está disponível para quase todos os idiomas dos dicionários. Cada um dos dicionários do mecanismo de reconhecimento é consultado durante o reconhecimento e as sugestões podem vir de qualquer um deles.

Você pode determinar que todas as palavras que não constam no dicionário sejam sublinhadas no Editor de Texto. Durante a revisão você verá estas palavras. Nem sempre as palavras serão marcadas como “não consta no dicionário”, mesmo se não constarem de nenhum dicionário. Isto pode acontecer se vários mecanismos de reconhecimento gerarem um resultado idêntico com alto nível de confiabilidade ou se uma palavra “que não consta no dicionário” aparecer diversas vezes em um documento.

Se você optar pela seleção de vários idiomas, todos os caracteres necessários para os idiomas selecionados serão validados para reconhecimento. Também é possível validar caracteres individualmente, para complementar os validados por sua opção de idioma.

Se você selecionar mais de um idioma com suporte de dicionário, todos os dicionários envolvidos serão consultados e você poderá obter sugestões em mais de um idioma.

Não há dicionários, revisão ou treinamento disponíveis para japonês, coreano ou chinês, e esses idiomas não devem ser combinados com nenhum outro. Consulte Reconhecimento de idioma asiático.

Alfabeto latino:

Este é o alfabeto utilizado para a maioria dos idiomas compatíveis. Quando você seleciona um ou mais idiomas para reconhecimento, todas as letras acentuadas são validadas como soluções de OCR aceitáveis.

Alfabeto grego:

O alfabeto grego é usado no idioma grego. O OmniPage aceita o reconhecimento dos caracteres necessários para a leitura de grego antigo. Esta é a aparência de um texto em grego clássico:

Omnipage lang greek%20classical Idiomas e alfabetos

Esta é a aparência de um texto em grego moderno:

Omnipage lang greek%20modern Idiomas e alfabetos

 

Estes são os caracteres aceitos:

Omnipage lang cp greek Idiomas e alfabetos

Quando for feita uma leitura em grego, as letras do alfabeto inglês ainda poderão ser reconhecidas. Você pode ler, editar e revisar textos em grego mesmo se seu computador não possuir arquivos de fontes gregas ou suporte para página de código. Contudo, para lidar corretamente com o texto exportado, é necessário suporte ao alfabeto grego.

Alfabeto cirílico:

Os seguintes idiomas utilizam o alfabeto cirílico: russo, búlgaro, bielo-russo, chechene, cabardiano, macedônio, moldávio, sérvio e ucraniano.

Textos em russo possuem a seguinte aparência:

Omnipage lang russian Idiomas e alfabetos

Quando for feita uma leitura em cirílico, as letras do alfabeto inglês ainda poderão ser reconhecidas. Às vezes, palavras escritas com letras do alfabeto inglês podem ser encontradas no meio de textos em cirílico. O OmniPage pode manipulá-las.

Você pode ler, editar e revisar textos em cirílico mesmo se seu computador não possuir arquivos de fonte cirílicas ou suporte para página de código. Contudo, para lidar corretamente com o texto exportado, é necessário suporte ao alfabeto cirílico.

A tabela a seguir mostra quais caracteres cirílicos são compatíveis. Nem todos estes caracteres são validados para o russo ou outro idioma.

Omnipage lang cp12ru%20cyrillic Idiomas e alfabetos

 

O suporte para idioma asiático (japonês, chinês, coreano) é detalhado em um tópico separado.

 

//

Idiomas e alfabetos