şükela:  tümü | bugün
  • optical character recognition.. scan edilmi$ bir image'in neural network benzeri bir sistemle text'e donu$turulmesi..
  • ocr yazılımlarının karakter tanımlaması icin temel olarak üc yöntem vardir.

    - matrix matching (matris esleme): bu yöntemde ocr yazilimi, karsilasmasi muhtemel tum karakterlerin goruntusunu iceriginde tutar. sonra taranmis dokumandaki karakterler ile icerigini karsilastirir ve olayi hizli bir sekilde tamamlar.

    - feature analysis (icerik analizi): bu yontemdeyse yazilim karakterlerin goruntusunu degil, tanimlarini aklinda tutar. yani karakteri tanimak icin bir cok ozelligine bakar: kac tane duz cizgi var, bunlarin kaci dikey kaci yatay, yuvarlak koselerin konumlari neler, karakterde delikler var mi vesaire gibi. tanimlama kriterleri böyle her karakter icin alisıldik olunca, genel kuralina uygun yazilmis hemen her karakterin taninmasi mumkun hale gelir. bu durumda karakterin sekli genel karakter kurallarina uydugu surece karakter tanimlama icin fontlarin onemi yoktur.

    - self-assertion (ozgun tanimlama): bu da yukaridaki iki yöntemin birlesmesidir. once dokuman icerik analizi yontemiyle taranarak genel bir tablo olusturulur ve bu sayede kesinligi yuksek karakterler bir kenara ayrilarak bunlardan bir matris olusturulur. daha sonra bu kez emin olmayan karakterler, bu yeni elde edilen matristeki karakter tablolariyla karsilastirilarak "benzetilmeye" calisilir. yani sistem once icerik analiziyle kesinlikle a olduguna emin oldugu bir a yakalayarak bunun fotografini ceker. daha sonra da bu a harfinin goruntusunu a oldugundan emin olamadigi, fakat a'ya benzedigini dusüundugu karakterlerle karsilastirip ortak noktalarina bakarak gercekten a olup olmadigina karar verir.

    (bkz: http://www.pcmagazine.com.tr/…i/nisan2001/kapak.htm)
  • (bkz: ocr a), (bkz: ocr b)
  • abby fine reader , docscan ve readiris en kullanisli olanlaridir. ozellikle kitap veya dergilerden alintilar yapmasi gereken insanlar icin olmazsa olmazlardir.
  • olurda ocr ile scanleyip final icin calisicaginiz textleriniz varsa altlarini kalem ile cizmeyin lakin ocr sapitabilir, uzulursunuz sonra. ben yedim siz yemeyin
  • metin okuma programıyla birlikte kullanıldığında görme engellilerin hayatını birçok yönden çok kolaylaştıran bir icattır.
  • bircok ocr yazilimi her tiff dosyasini acamamaktadir. bunlarin bozuk* deyip acamadigi tiff dosyalari normal tiff goruntulayici yazilimlar tarafindan kolayca acilabilmektedir.
    bu da "metin tanima" oraninin dusmesine sebep olmaktadir. (haliyle bozuk dedigi dosyadan metin cikartamiyorlar)
  • tez yazilir kavraminin tarih olmasi