Was ist OCR?
Optische Zeichenerkennung (OCR) bezeichnet den Vorgang, bei aus dem Bild einer Seite vorhandener Text herausgezogen wird. Dieses Seitenbild ist das elektronische Abbild eines Textes und möglicherweise weiterer Elemente wie Überschriften und Bilder. Solche Bilder entstehen beim Scannen eines Papierdokuments oder beim Öffnen einer Bilddatei. Sie können solche Dateien per E-Mail, von einem Faxgerät oder von einem Scanner erhalten.
Bilder bestehen nicht aus bearbeitbaren Textzeichen, sondern aus zahlreichen winzigen Punkten (Pixeln), die zusammen ein Abbild des Textes bilden. Während des OCR-Vorgangs analysiert das Programm das Bild und erstellt daraus Text, der direkt am Computer bearbeitet werden kann, so dass Sie ihn nicht mehr von Hand abtippen müssen.
Bei der OCR wird aus einem Bild Text erzeugt:
Während der OCR verwendet OmniPage die Einstellungen aus der OmniPage-Werkzeuggruppe, um den Textfluss auf einer Seite zu bestimmen, und erstellt in einer bestimmten Reihenfolge Bereiche um Teile der Seite, um festzulegen, was als Text erkannt oder als Grafik beibehalten werden soll. Nach der OCR können Sie den erkannten Text in verschiedensten Textverarbeitungs-, DTP- und Tabellenkalkulationsformaten speichern.
Die OCR-Funktionen in OmniPage
OmniPage kann bei der Zeichenerkennung nicht nur Text erkennen, sondern auch die folgenden Elemente eines Dokuments beibehalten:
Grafiken
Dazu gehören beispielsweise Fotos, Logos und Zeichnungen.
Textformatierung
Beispiele für Textformatierung sind Schriftarten, Schriftgrößen und Schriftstile (wie fett oder kursiv). Beispiele für die Absatzformatierung sind Abstände zwischen den Absätzen, Einzüge, Tabulatoren, Zeilenabstände und Ausrichtung.
Seitenformatierung
Beispiele für Seitenformatierung sind Spaltenformate, Absatzplatzierung, Tabellenbehandlung und die Positionen von Grafiken.
Texteditoransichten
OCR-Ergebnisse werden in den Texteditor gestellt. Hier stehen Ihnen drei Ansichten zur Verfügung. Mithilfe dieser Ansichten können Sie festlegen, wie viel Formatierung angezeigt werden soll.
-
OmniPage erkennt nur maschinell gedruckte Textzeichen, wie z. B. mit einem Laserdrucker ausgedruckten oder mit der Schreibmaschine geschriebenen Text. Das Programm ist aber in der Lage, handgeschriebenen Text, wie z. B. eine Unterschrift, als Grafik beizubehalten.
//