ekşi sözlük

author identification

natural language processing in bir alt konunsudur. farklı yazarlara ait text örnekleri analiz edilerek yazarlara ait istatistiksel veriler elde edilir. daha sonra yazarı bilinmeyen bir text üzerinde benzer analizler yapılarak elimizdeki yazarlara ait istatistiklerle kıyaslanır ve bu textin yazarının kim olduğu tahminlenir. author identification ile kimin yazdığı bilinmeyen text lerin yazarı bulunabilir ya da bir texti o kişinin yazıp yazmadığı anlaşılabilir. bu tip yazılımlar kullanılarak okullarda kopya ödevlerin önüne geçilmeye çalışılır.

mevcut algoritmaların başarı oranları %85-%95 düzeyindedir. fakat bu algoritmalar her geçen gün geliştirilmekte ve yakında %100 e yakın doğru tahminleme oranlarına erişilmesi hedeflenmektedir.

ferish

22.04.2008 10:00

bildigim kadariyla klasik cozum yontemlerinden biri bag of words. ayrica, bir de goruntu isleme versiyonu var bunun: yazar toplulugunun el yazisi goruntuleriyle egitim kumesi elde ediliyor basta. sonra otomatik ogrenme sistemi bu kume uzerinde egitiliyor. ardindan, gelen yeni yazi goruntusunun hangi yazara ait oldugu tahmin edilmeye calisiliyor ('writer identification' diye de gecer). bu arada goruntu islemeye dayali oldugundan ogrenme sistemi dil bakimindan tamamen agnostik de kalabilir. yani dilden dile ozel ayar cekmek gerekmez.
(bkz: icfhr)

flexi

09.08.2013 20:56