Opzioni: OCR

Questa finestra di dialogo consente di selezionare le impostazioni OCR. Può essere visualizzata

  • in OmniPage  

  • dalle applicazioni di Microsoft Office e WordPerfect quando si usa Direct OCR e

  • in PaperPort (se installato).

Per visualizzare questa finestra di dialogo in OmniPage

Per visualizzare questa finestra di dialogo per Direct OCR (nelle applicazioni di Microsoft Office e Word Perfect)

  • Fare clic sul pulsante Impostazioni digitalizzazione testo Omnipage icon acquire text settings OCR in una barra degli strumenti di OmniPage (o usare il menu File) in WordPerfect o in precedenti versioni di Microsoft Office, o la scheda OCR di Nuance in un’applicazione Microsoft Office 2007 o 2010 oppure nel menu File.

Per visualizzare questa finestra di dialogo in PaperPort

  1. Fare clic con il pulsante destro del mouse sull’icona di Microsoft Word nella barra Invia a di PaperPort, quindi selezionare Opzioni di Invia a…. Viene visualizzata la finestra di dialogo Opzioni di Invia a.

  2. Scegliere OmniPage 18 nella casella di selezione Converti immagine in testo (OCR) con, quindi fare clic sul pulsante Impostazioni…. Viene visualizzata la finestra di dialogo Opzioni con la scheda OCR.

La scheda OCR propone le seguenti impostazioni.

Layout descrizione

Impostazioni per il processo di definizione automatica delle aree.

Impostazione automatica – Questa opzione è adatta nella maggior parte dei casi e lascia al programma il compito di definire le aree. Sceglierla se il documento contiene pagine con layout differenti. Sceglierla per una pagina con più colonne e una tabella e per qualsiasi pagina con più di una tabella.

Colonna singola, senza tabelle – Scegliere questa opzione quando le pagine contengono una sola colonna di testo e nessuna tabella. In genere sono di questo tipo le lettere commerciali o le pagine di un libro. Sceglierla inoltre quando le pagine contengono parole o numeri disposti su colonne, se si vuole evitare di disporre questi elementi in una tabella o di privarli delle colonne o di trattarli come colonne separate.

Più colonne, senza tabelle – Scegliere questa opzione se alcune delle pagine contengono testo in colonne e si vuole privarlo delle colonne o conservarlo in colonne separate.

Colonna singola, con tabelle – Scegliere questa opzione se la pagina contiene una sola colonna di testo e una tabella.

Foglio di calcolo – Scegliere questa opzione se l’intera pagina è costituta da una tabella che si vuole esportare in un foglio elettronico o trattare come tabella. Non verranno rilevate aree di testo continuo.

Modulo – Scegliere questa opzione se le pagine contengono moduli.

Documento legale – Scegliere questa opzione per i documenti legali.

Personalizzato (definito dall’utente) – Consente di descrivere con precisione il layout delle pagine in un documento. Fare clic sul pulsante Layout personalizzato per specificare le impostazioni della finestra di dialogo Layout personalizzato per regolare lo scorrimento del testo, il rilevamento delle tabelle e il rilevamento delle immagini durante la definizione automatica delle aree.  

Modello – Esegue la determinazione delle aree in base a un modello specificato dall’utente.

Ottimizza processo OCR per…

Fare clic su Velocità per ottimizzare il riconoscimento per la velocità. L’uso di “Velocità” per documenti di buona qualità può continuare a generare una precisione accettabile. Fare clic su Precisione per ottimizzare il riconoscimento per la precisione. Quando si sceglie “Velocità”, non è possibile mantenere la formattazione avanzata come i testi e gli sfondi colorati o il testo invertito.

Lingue e dizionari

Lingue nel documento

Selezionare la lingua (o le lingue) presenti nel documento da elaborare. OmniPage effettua l’OCR sulla base di queste lingue. Per un riconoscimento più veloce e sicuro e per avere durante il controllo ortografico proposte alternative più affidabili selezionare solo le lingue presenti nel documento.

Le lingue in alto nell’elenco sono quelle scelte recentemente. Quelle che seguono sono ordinate alfabeticamente. Digitare una lettera iniziale per passare alle lingue che iniziano con quella lettera.

Omnipage icon dict OCR

Questa icona indica le lingue supportate da dizionario. Il dizionario viene consultato per semplificare l’elaborazione OCR, per fornire suggerimenti durante il controllo ortografico e per il rilevamento automatico della lingua.

Le impostazioni delle lingue giapponese, coreana e cinese richiamano un motore di riconoscimento dedicato. È possibile selezionare solo una di queste lingue alla volta, senza combinarla con una lingua diversa da quelle dell’Asia orientale. Brevi testi incorporati in inglese possono essere riconosciuti senza che sia selezionato come lingua di riconoscimento. Vedere Riconoscimento delle lingue dell’Asia orientale.

Rileva automaticamente singola lingua

Questa opzione è utile durante l’elaborazione non assistita, quando la lingua dei documenti ricevuti non può essere stabilita in anticipo. Quando è attiva, non è possibile scegliere altre lingue. Può funzionare con tutte le lingue che dispongono del supporto del dizionario basate sull’alfabeto latino e con quattro lingue dell’Asia orientale. Russo e greco sono esclusi. 

Tre gruppi di lingue vengono proposti nell’elenco a discesa sotto il casella di controllo: 

  • Lingue con alfabeto latino (sceglierle per vedere le lingue attive)

  • Lingue dell’Asia orientale (cinese tradizionale e semplificato, coreano e giapponese)

  • Lingue con alfabeti latino e asiatici (summenzionate).

Quando pervengono le pagine, i loro testi vengono analizzati e a ogni pagina viene assegnata una singola lingua di riconoscimento convalidata. Quando questa opzione è attiva, l’opzione seguente non è disponibile.

Verifica scelte linguistiche

Selezionando questa casella di controllo si attiva il rilevamento automatico della lingua, che segnala le differenze tra la lingua rilevata e la sua impostazione. Funziona a livello di pagina e individua quattro categorie: giapponese, cinese, coreano e lingua diversa da quelle dell’Asia orientale. Non può distinguere tra cinese tradizionale e semplificato o tra lingue non estremo orientali. L’ultima categoria significa che i caratteri negli alfabeti giapponesi, cinese o coreano non vengono rilevati. La verifica ha luogo durante l’elaborazione preventiva delle immagini, pertanto la lingua di riconoscimento necessaria deve essere impostata prima del caricamento delle immagini. Il rilevamento fornisce risultati migliori con più righe di testo e il testo inglese incorporato ridotto al minimo.

Dizionari professionali

Fare clic sulla casella accanto al nome di un dizionario per selezionarlo. È possibile scegliere tra: Olandese legale, Olandese medicale, Inglese legale, Inglese medicale, Inglese finanziario (solo per la versione Professional), Francese legale, Francese medicale, Tedesco legale, Tedesco medicale. Per deselezionare un dizionario professionale, fare di nuovo clic su di esso.

Dizionario utente

Selezionare un dizionario utente se lo si desidera. Questo è il dizionario personale dell’utente, al quale è possibile aggiungere parole. Il dizionario utente integra i dizionari incorporati nel programma sia per facilitare il processo OCR, sia per offrire proposte alternative durante il controllo ortografico. Un dizionario utente è utile per evitare che il programma indichi come parole incerte nomi propri o termini specialistici presenti nel documento. Si possono creare e salvare quanti dizionari utente si vogliono.

Fare clic sul pulsante a destra della casella di selezione per creare, modificare, aggiungere o rimuovere un dizionario utente. Selezionare [assente] per scaricare un dizionario utente.

Cercare nella rete o altrove i percorsi per caricare e salvare i dizionari utente.

Saranno inoltre elencati tutti i dizionari utente di Microsoft Word rilevati sul sistema. Può essere visualizzato il dizionario denominato Personalizzato, ovvero quello predefinito di Word.

Il riconoscimento delle lingue dell’Asia orientale non consente di usare i dizionari utente.

Caratteri

Corrispondenza dei caratteri

Fare clic sul pulsante Corrispondenza dei caratteri… per selezionare quali caratteri nel sistema devono essere disponibili per la corrispondenza o la rappresentazione dei caratteri nei documenti. La corrispondenza dei caratteri non ha alcun effetto sul riconoscimento delle lingue dell’Asia orientale; in questi casi viene impostato automaticamente un carattere compatibile con tali lingue.

Caratteri aggiuntivi

Immettere le lettere accentate che si desidera convalidare per il riconoscimento, oltre a quelle già convalidate dalla lingua scelta. Immettere i caratteri dalla tastiera o dalla mappa caratteri.

Fare clic su Omnipage tb f charmap OCR per visualizzare la mappa caratteri.

Carattere sostitutivo

I caratteri non riconoscibili vengono rappresentati nell’editor di testo da un carattere sostitutivo rosso (quello predefinito è ~ una tilde). Per esempio, se OmniPage non riconosce la lettera J in REJECT, e il carattere sostitutivo è ~, nel documento compare la stringa RE~ECT.

Digitare il carattere che si vuole usare nella casella di modifica Carattere sostitutivo. È opportuno scegliere un carattere che non sia presente nei documenti.

Fare clic su Omnipage tb f charmap OCR per visualizzare la mappa caratteri.

Mappa caratteri

Consente di copiare e incollare le lettere accentate nella casella di testo. I caratteri in grigio nella mappa caratteri non sono attivi per il riconoscimento, ma possono essere inseriti nella casella di testo. Fare clic con il pulsante destro del mouse su un’area vuota sotto la mappa caratteri e usare il menu contestuale per visualizzare o nascondere i set di caratteri. Non sono supportati i caratteri delle lingue dell’Asia orientale.

//

OCR