şükela:  tümü | bugün
  • insanlarin yaptigi makinelerin, programlarin ceviri yapmasi processine verilen isim..
  • makine çevirme
  • (bkz: babelfish)
  • (bkz: tranexp)
  • işin bilgisayar kısmından çok dilbilim kısmında pürüzler çıkaran projelerin bir kısmı.
  • şöyle şeyler yaptığı görülmüştür:

    aslı: "the attendant will give a slip to the driver and another slip to you."
    çevirisi: "kayma, katılımcı verecek, sürücü ve başka bir kayar."
  • machine translation çok zevkli bir şey. en azından ilk bölümleri öyle. sonradan en optimal kurallarla bir cümleye 450 ayrı parse tree çıktığında biraz üzücü olabiliyor. nltk denen şeytan icadı ve herhangi bir eklenti olmaksızın ubuntu terminalini kullanarak ve biraz (şaka lan, biraz değil) generative linguistics bilgisiyle siz de evinizde kendi çeviri programınızı yazabilir, çevirmen arkadaşlarınızı "hepinizi işsiz bırakacam olum ahahaha" diyerek korkutabilirsiniz. gerçi bok bırakırsınız. en azından 20 yıldan önce bunu yapmanız zor. yapmak istiyorsanız da, bana göre önce ccg* öğrenmeniz gerekir, ki bunu öğrenmek bütün varoluşu sorgulamak gibi bir yaşam biçimine dönüşmedikçe pek sonuç vermez. ardından bir de information theory kasarsanız çevirmenlik mesleğini tarihe gömmeniz az da olsa mümkün olabilir. aslında ben de yeni öğreniyorum ve bombok işler. bununla uğraşacağınız sürede düz çevirmenlik yapsanız, küçük çaplı bir servet edinmeniz mümkün.
  • birkaç çevrimiçi servisin karşılaştırması için:

    https://anilozbek.blogspot.com/…i-karslastrmas.html
  • neural machine translation* büyük bir adımdı. farklı bir açığı kapatmak için şimdi de unsupervised machine translation çalışılıyor görünüyor.

    kendim için kısaca araştırdım.* şunları not ettim:

    eğiticisiz makine çevirisi

    makine çevirisinde sinir ağlarını kullanmaktaki en büyük sorun, her iki dilde de cümle çiftleri veri seti gerektirmesidir. ingilizce ve fransızca gibi yaygın olarak konuşulan diller için kaynak sorun olmayabilir, ancak diğer daha az yaygın diller için bu durum geçerli olmayacaktır. dil çifti verileri mevcut olsaydı, bu sorun eğiticili bir görevin konusu olurdu.

    yapılan son çalışmalarda bu eğiticili görevin eğiticisiz bir göreve nasıl dönüştürüleceği inceleniyor. bu yeni görevde gerekli olan tek veri, her iki dil için de iki rastgele bütünce* olacaktır.

    örneğin ingilizce'de herhangi bir kurgu romanı ve ispanyolca herhangi bir kurgu romanı gibi. iyice net anlaşılması için tekrar vurgulamak gerekirse: iki romanın aynı olması gerekmiyor! aynı romanın iki dilde kopyası olsa bile bunları hizalamanın bile bir iş olduğu düşünülürse bu muazzam bir şey.

    en soyut anlamda söylemek gerekirse araştırmacılar, iki dil arasında ortak olan bir gizli alanı nasıl kullanacaklarını keşfettiler.

    gizli alan, verilerin yani cümlelerin özelliklerini yakalar. bu nedenle eğer a diliyle beslendiği zaman b diliyle beslendiğindekiyle aynı özellikleri üretebilecek bir yer öğrenmek mümkün olsaydı, o zaman bunlar arasında bir çeviri yapmak mümkün olurdu.

    model doğru özellikleri öğrendiğinden, a dilinin kodlayıcısından kodlamak ve b dilinin kod çözücüsünü kullanarak kod çözmek, etkili bir şekilde çeviri yapılmasını gerektirecektir.

    tahmin edebileceğiniz gibi, araştırmacılar bir özellik alanını öğrenmek için otomatik kodlayıcıları gürültüden arındırılmış hale getirdiler. ayrıca, otomatik kodlayıcının eğiticisiz makine çevirisini gerçekleştirmek için ortak bir gizli alan (hizalanmış bir gizli alan olarak da adlandırılır) öğrenmesini de sağladılar.

    bu araştırmalar, örneğin, urduca'dan ingilizceye gibi çok çeviri örneği olmayan dilleri çevirmeyi kolaylaştıracak.

    https://buzzrobot.com/…ithout-the-data-21846fecc4c0
    https://code.fb.com/…anslations-for-more-languages/

    ayrıca bütünceler hakkında en azından şunları bilmek de konunun anlaşılmasına katkı sağlayacaktır:

    https://huseyindemirtas.net/…istics-ve-ceviribilim/