Lingue e alfabeti
Il programma è in grado di leggere oltre 120 lingue con più alfabeti: latino, greco, cirillico, coreano, cinesi e giapponesi. Consultare l’elenco nella scheda OCR della finestra di dialogo Opzioni. L’elenco è inoltre disponibile sul sito Web di Nuance.
Questa icona indica le lingue supportate da dizionario. Attualmente sono le seguenti: catalano, ceco, danese, esperanto, finlandese, francese, greco, inglese, italiano, norvegese, olandese, polacco, portoghese, russo, sloveno, spagnolo, svedese, tedesco e ungherese. Tutti questi dizionari vengono utilizzati, insieme a quelli utente e professionali, per facilitare il riconoscimento e proporre alternative durante la verifica.
L’elenco dei dizionari professionali e la spiegazione delle opzioni Rileva automaticamente singola lingua e Verifica scelte linguistiche sono disponibili nel pannello OCR della finestra di dialogo Opzioni.
Il riconoscimento con più motori attivi è disponibile per quasi tutte le lingue supportate da dizionario. Ciascun motore di riconoscimento ha un proprio dizionario, che viene consultato durante il riconoscimento e dal quale possono essere ricavate proposte alternative.
Si può scegliere se le parole non presenti nel dizionario debbano essere sottolineate nell’editor di testo. Durante la verifica, tali parole saranno immediatamente visibili. A volte alcune parole non vengono contrassegnate come “non presenti nel dizionario” anche se nessun dizionario le contiene. Ciò può accadere se i vari motori di riconoscimento generano un risultato identico con un grado elevato di confidenza, oppure se una parola “non presente nel dizionario” è ripetuta molte volte nel documento.
Se si selezionano più lingue, tutti i caratteri necessari per le lingue selezionate saranno convalidati per il riconoscimento. È inoltre possibile convalidare i caratteri singolarmente, da aggiungere a quelli convalidati dalla lingua scelta.
Se si selezionano più lingue supportate da dizionario, verranno consultati tutti i dizionari interessati, pertanto le proposte alternative potranno essere in più lingue.
I dizionari, la verifica e il training non sono disponibili per il giapponese, il coreano o il cinese; evitare di combinare queste lingue con altre. Vedere Riconoscimento delle lingue dell’Asia orientale.
Alfabeto latino
Questo alfabeto è usato per la maggior parte delle lingue supportate. Quando si sceglie una o più lingue per il riconoscimento, tutte le necessarie lettere accentate saranno convalidate come soluzioni OCR accettabili.
Alfabeto greco
Questo alfabeto è usato solo per la lingua greca. OmniPage supporta il riconoscimento dei caratteri necessari per leggere il greco antico. Questo è un esempio di testo in greco classico:
Questo è un esempio di testo in greco moderno:
Questi sono i caratteri supportati:
Quando si legge un testo in greco, si possono riconoscere anche le lettere dell’alfabeto latino. Si possono leggere, modificare e verificare testi in greco anche se il computer non dispone di file di caratteri greci o di supporto Code Page (Tabella codici). Però è necessario il supporto del greco per gestire correttamente il testo esportato.
Alfabeto cirillico
Le seguenti lingue sono scritte nell’alfabeto cirillico: russo, bulgaro, bielorusso, ceceno, cabardo, macedone, moldavo, serbo e ucraino.
Questo è un esempio di testo in russo:
Quando si leggono lingue in cirillico, si possono riconoscere anche le lettere dell’alfabeto latino. A volte un testo in cirillico contiene parole scritte con le lettere dell’alfabeto latino: OmniPage è in grado di gestirle.
Si possono leggere, modificare e verificare testi in cirillico anche se il computer non dispone di file di caratteri cirillici o di supporto Code Page (Tabella codici). Però è necessario il supporto del cirillico per gestire correttamente il testo esportato.
La tabella che segue mostra quali caratteri cirillici sono supportati. Non tutti questi caratteri sono convalidati per il russo o per qualsiasi altra singola lingua.
Il supporto delle lingue dell’Asia orientale (giapponese, cinese, coreano) è illustrato in dettaglio in un argomento distinto.
//