Doğruluğu geliştirme

Bu ipuçları, OmniPage’de OCR doğruluğunu artırmak amacıyla tasarlanmıştır.

Doğruluğu geliştiren ayarları Seçenekler iletişim kutusundan seçin.

Araçlar menüsünde Seçenekler‘i belirleyin veya Standart araç çubuğunda Omnipage tb st options Doğruluğu geliştirme düğmesini tıklatın. Sonra, Seçenekler iletişim kutusunda değiştirmek istediğiniz ayarların sekmesini tıklatın:

  • OCR bölmesinde OCR işlemini şunun için iyileştir altından Doğruluk‘u seçin.

  • Tarayıcı bölmesinde Parlaklık ve Karşıtlık kaydırıcılarını ayarlayın. En uygun parlaklık örneği için burayı tıklatın.

  • SET araçlarını kullanarak görüntüleri OCR işlemleri için geliştirin.

  • Tek ölçütünüz OCR doğruluğu ise beyaz arka planda temiz net metni olan kaliteli belgeler için siyah beyaz taramayı tercih edin. Metnin renkli veya gölgeli arka planlarda olduğu sayfalar tarıyorsanız veya düşük ya da değişik karşıtlıklı degrade belgeler için gri tonlu taramayı seçin.

  • OCR sırasında özel veya stil verilmiş karakterlerin tanınmasına yardımcı olmak üzere bir karakter eğitim dosyasını kullanmak için Yazım Denetimi bölmesinde Eğitim Dosyası‘nı seçin. Daha fazla bilgi için Eğitim dosyaları‘na bakın. Bu özellik Asya dilleri için geçerli değildir.

Uygun tanıma yardımlarını kullanma

  • Uzun bir belgeniz var ve uygun bir eğitim dosyanız yoksa, tipik birkaç sayfa üzerinde biraz eğitim yapın. Seçenekler iletişim kutusunun Yazım Denetimi bölmesinde IntelliTrain‘i açın, sonra üç veya dört sayfayı tanıyıp metinde yazım denetimi yapın. Eğitimi Düzenle iletişim kutusunda eğitimin kalitesini denetledikten sonra dosyaya kaydedin.

  • Eğitim dosyası yüklüyken kötü sonuç alıyorsanız, Eğitimi Düzenle iletişim kutusunda içeriğini denetleyin. Geçerli belge için uygun olduğundan emin olun. Uygun değilse, ya kaldırın ya da kötü oluşmuş karakter şekillerinden eğitimi kaldırmak için içeriğini düzenleyin. Uygun olmayan eğitim, hiç eğitimin olmadığı durumdan daha kötü sonuçlar verebilir.

  • Yazım denetiminde uygun olmayan çok fazla sözcük atlanıyorsa ve yüklü bir kullanıcı sözlüğünüz varsa, Kullanıcı Sözlüğünü Düzenle iletişim kutusu ile içeriğini denetleyin. Yanlışlıkla eklenmiş tüm girişleri, özellikle yanlış yazılmış sözcükleri silin.

Bölgeleri Doğru Tanıma

  • Sayfaları elle işlerken, OCR öncesinde bölgelerin doğru tanındığından emin olun.

  • Otomatik işlemede, özgün düzen ayarınızın belge için en iyisi olduğundan emin olun. Tanıma sonuçlarını inceleyin. Bazı sayfalarda kötü bölge oluşturma nedeniyle kusurlar varsa, bölge özelliklerini ve/veya konumları değiştirin ve o sayfaları yeniden tanıyın.

  • Geçerli sayfalar için uygun olmayan bir bölge şablonu dosyasının yüklü olmadığından emin olun.

  • İmza gibi elle yazılmış bir metni korumak için onu grafik bölgesi olarak tanıtın.

Yüksek Kaliteli Görüntüler Kullanma

  • Belgeleri tararken genellikle orijinal sayfaları kullanmaya çalışın. Dizilmiş, yüksek kaliteli basılı sayfa görüntüleri en iyi OCR doğruluğunu verir. OCR doğruluğu, düşük kaliteli sayfalarda o kadar iyi olmayabilir.

  • Düşük kaliteli orijinallerde, bazen iyi kaliteli bir fotokopi daha iyi OCR sonuçları verebilir. Bu durum, düşük karşıtlıklı veya ince kağıda basılmış belgelerde söz konusu olabilir. Diğer yandan, çizgili, lekeli, parlaklığı dağınık olan kötü kaliteli fotokopiler de genellikle daha kötü sonuç verir.

  • Size faks gönderenlerden faks gönderdikleri zaman İyi veya En İyi Modu seçmelerini isteyin.

  • Sayfa görüntülerinde notlar, çizgiler veya karalamalar olmamalıdır. Basılı karakter olmayan her şey tanımayı yavaşlatır ve bir işaretle bozulan hiçbir karakter tanınmayabilir. Bölgelere bu gibi işaretler koymamaya çalışın veya onları yoksayma bölgesi içine alın.

  • Sayfa görüntülerindeki metnin son derece temiz ve düzgün olması gerekir. Karakterler birbirinden ayrılmış olmalı ve kesişmemeli ya da birbiriyle birleşip leke oluşturmamalıdır.

  • Tanımak istediğiniz belgelerde kullanılan stile etki edebiliyorsanız, alt çizgi kullanmaktan kaçının. Alt çizgiler q, g, y, p ve j harflerinin kuyruk şekillerini değiştirdiği için altı çizili metnin tanınması güçtür.

  • Görüntü dosyalarından kötü sonuçlar elde ediyorsanız, imleci küçük resimlerinin üzerine getirerek kalite ve çözünürlüklerini kontrol edin. OCR için ideal çözünürlük 300 dpi’dir. 200 dpi’den düşük veya 400 dpi’den yüksek çözünürlüklü görüntüler çok daha düşük doğruluk verebilir. Kağıt belgeleriniz varsa, onları da en iyi ayarlarla tarayın. Yoksa, size görüntü sağlayan kişilerden 300 dpi kullanmalarını isteyin.

//

Doğruluğu geliştirme