10 entry daha
  • neural machine translation* büyük bir adımdı. farklı bir açığı kapatmak için şimdi de unsupervised machine translation çalışılıyor görünüyor.

    kendim için kısaca araştırdım.* şunları not ettim:

    eğiticisiz makine çevirisi

    makine çevirisinde sinir ağlarını kullanmaktaki en büyük sorun, her iki dilde de cümle çiftleri veri seti gerektirmesidir. ingilizce ve fransızca gibi yaygın olarak konuşulan diller için kaynak sorun olmayabilir, ancak diğer daha az yaygın diller için bu durum geçerli olmayacaktır. dil çifti verileri mevcut olsaydı, bu sorun eğiticili bir görevin konusu olurdu.

    yapılan son çalışmalarda bu eğiticili görevin eğiticisiz bir göreve nasıl dönüştürüleceği inceleniyor. bu yeni görevde gerekli olan tek veri, her iki dil için de iki rastgele bütünce* olacaktır.

    örneğin ingilizce'de herhangi bir kurgu romanı ve ispanyolca herhangi bir kurgu romanı gibi. iyice net anlaşılması için tekrar vurgulamak gerekirse: iki romanın aynı olması gerekmiyor! aynı romanın iki dilde kopyası olsa bile bunları hizalamanın bile bir iş olduğu düşünülürse bu muazzam bir şey.

    en soyut anlamda söylemek gerekirse araştırmacılar, iki dil arasında ortak olan bir gizli alanı nasıl kullanacaklarını keşfettiler.

    gizli alan, verilerin yani cümlelerin özelliklerini yakalar. bu nedenle eğer a diliyle beslendiği zaman b diliyle beslendiğindekiyle aynı özellikleri üretebilecek bir yer öğrenmek mümkün olsaydı, o zaman bunlar arasında bir çeviri yapmak mümkün olurdu.

    model doğru özellikleri öğrendiğinden, a dilinin kodlayıcısından kodlamak ve b dilinin kod çözücüsünü kullanarak kod çözmek, etkili bir şekilde çeviri yapılmasını gerektirecektir.

    tahmin edebileceğiniz gibi, araştırmacılar bir özellik alanını öğrenmek için otomatik kodlayıcıları gürültüden arındırılmış hale getirdiler. ayrıca, otomatik kodlayıcının eğiticisiz makine çevirisini gerçekleştirmek için ortak bir gizli alan (hizalanmış bir gizli alan olarak da adlandırılır) öğrenmesini de sağladılar.

    bu araştırmalar, örneğin, urduca'dan ingilizceye gibi çok çeviri örneği olmayan dilleri çevirmeyi kolaylaştıracak.

    https://buzzrobot.com/…ithout-the-data-21846fecc4c0
    https://code.fb.com/…anslations-for-more-languages/

    ayrıca bütünceler hakkında en azından şunları bilmek de konunun anlaşılmasına katkı sağlayacaktır:

    https://huseyindemirtas.net/…istics-ve-ceviribilim/
3 entry daha
hesabın var mı? giriş yap