OCR nedir?

Optik karakter tanıma (OCR), bir sayfa görüntüsünden metin alıntılama işlemidir. Bu sayfa görüntüsü metnin elektronik resmidir ve başlıklar ve resimler gibi diğer öğeleri de içerebilir. Sayfa görüntüleri, bir kağıt belgenin taranmasıyla ya da bir elektronik görüntü dosyasının açılmasıyla elde edilebilir. Bu dosyaları e-postayla veya bir faks makinesinden ya da kendi tarayıcınızdan alabilirsiniz.

Bu görüntülerde düzenlenebilir metin karakterleri yoktur; bir araya geldiklerinde metnin resmini oluşturan çok sayıda minik nokta (piksel) vardır. OCR işlemi metin görüntüsünü inceler ve bu görüntüden bilgisayarda düzenlenebilir bir metin oluşturur; böylece metni elle yeniden yazmak zorunda kalmazsınız.

OCR görüntüyü alır:Omnipage s OCR nedir? ve metni oluşturur: Omnipage s2 OCR nedir?

OCR sırasında OmniPage, bir sayfadaki metin akışını belirlemek için OmniPage Araç Kutusu‘nda seçilen ayarları kullanır ve metin olarak tanınacak ya da grafik olarak korunacak öğeleri tanımlamak için sayfa alanları etrafında sıralı bölgeler oluşturur. OCR sonrasında, elde edilen metni çeşitli sözcük işleme, sayfa düzeni ve elektronik tablo uygulamalarına kaydedebilirsiniz.

OmniPage’teki OCR Özellikleri

OmniPage, metin tanımaya ek olarak, OCR sırasında bir belgenin şu öğelerini koruyabilir.

Grafikler

Fotoğraflar, logolar ve çizimler grafiklere örnek olarak verilebilir.

Metin biçimlendirme

Yazı tipleri, yazı tipi boyutları ve yazı tipi stilleri (kalın veya italik) metin karakteri biçimlendirmesi örnekleridir. Paragraflar arasında boşluk, girintiler, sekmeler, satır aralığı ve hizalama ve paragraf biçimlendirme örnekleri.

Sayfa biçimlendirme

Sütun yapısı, paragraf yerleşimi, tablo işleme ve grafik konumları sayfa biçimlendirme örnekleridir.

Metin Düzenleyicisi görünümleri

Tanıma sonuçları Metin Düzenleyicisi‘ne yerleştirilir. Burada üç görünüm sunulur ve görüntülenmesini istediğiniz biçimlendirme miktarını tanımlamanıza izin verilir.

  • OmniPage yalnızca lazer yazıcıyla veya daktiloyla yazılmış metinler gibi makineyle basılmış karakterleri tanır. Ancak, imza ve grafik gibi elle yazılmış metinleri de tutabilir.

//

OCR nedir?