alphago

okuduklarimdan aklimda kalan ilginc noktalar:

- insanlar 19x19'luk go tahtasindaki taslari gruplar halinde ele alip analiz ediyor. alphago ise her tasi ayri ayri hesaba katabiliyor.
- alphago yuksek skor kasmiyor, sadece maci kazanma olasiligini optimize ediyor. ne kadar farkla kazandiginin bir onemi yok. bu yuzden ondeyken pozisyonunu guclendirmeyi, farki acmaya tercih ediyor. ornegin, hamle a: 20 puan farkla kazanacak %80 olasilikla. hamle b: 2 puan farkla kazacanak, %90 olasilikla. alphago ikincisini seciyor. bu hamleler insanlara garip geliyor.
- alphago her adimda kazanma olasiligini hesapliyor. ikinci macta, alphago oyunun ortalarinda kazandigini anlamis. maci takip eden ustalarin bunu farketmesi ise bir hayli zaman almis. 9p ustalardan biri "alphago, go'nun tanrisi gibi, olacak herseyi onceden biliyor" dedi.
- alphago bazen insanlardan beklenmeyen hamleler yapiyor, bu hamlelerin ne ise yaradigini insanlar 20 hamle sonra anliyor.
- go dogu dunyasinda sadece bir oyun degil. go tahtasindaki stratejiler, degisik tarzlar dogunun kultur ve derinliginin bir yansimasi olarak goruluyor. ornegin, iyi go hamlelerine "akillica" degil, "bilgece" diyorlar. bu yuzden ruhsuz, duygusuz ve batili alphago'nun zaferleri sok etkisi yaratmis.
- alphago ozellikle oyunun son kisimlarinda cok guclu. bunun sebebi kalan olasiliklarin gorece azalmasi ve aphago'nun hesabinin netlesmesi. bu yuzden lee bir sonraki oyunda acilista avantaj saglamaya calisacak.
- alphago 1920 islemci ve 280 grafik karti kullaniyor. 20 watt enerji harcayan insan beyni hala cok daha verimli.

lumina obscura

11.03.2016 01:02 ~ 02:09
madem bildigim yerden gelmis, dilim dondugunce aciklayayim.

1- makina kasparov'u yenen deepblue gibi monte carlo tree search (mcts ) kullaniyor. bu yontem su, herhangi bir hamleden once, baslangic noktasi olasi tum hamlelere dallaniyor. daha sonra bu dallanan her hamle icin bunu tekrarliyoruz. elimizde dallanip budaklanmis bir arama agaci oluyor. agacin her bir yapragi bir hamle dizisi sonrasi olusacak konumu gosteriyor. bu yapraklardaki her konuma bir skor veriliyor. skor bilgisi agacta yapraktan koke dogru gidiyor. makine en sonunda da en yuksek skoru veren alt-agaca dogru yoneliyor. satrancta bu adimlar kiyasla daha kolay i) olasi hamle sayisi daha az ii) tahta konumunu puanlamak daha kolay : taslarin degerleri var ve taslarin rolleri sayesinde birbirine olan konumlari skorlanabiliyor. alphago bu noktada devreye yapay sinir aglarini sokuyor.

2- go'da olasi hamle sayisi fazla oldugu icin agacin dallarini sezgisel olarak budamak cok onemli. alphago bunu kgs go'daki oynanmis amator ve pro oyunlarini kullanarak cozuyor. her oyun konfigurasyonu icin bir sonraki hamleyi tahmin eden bir policy network egitiliyor. bunun icin de gorsel datayi islemede en yaygin yontem olan convolutional neural network kullaniliyor. bu kismi ilginc zira, alphago oncesi iddialardan biri go sezgisel bir oyun makineler asla bu sezgiye sahip olamaz seklindeydi. makinedeki sezgisel parcalardan biri bu. policy network sayesinde makine en olasi hamleleri arama agacinda dallandirip zamandan tasarruf ediyor ve daha onceden benzer konumda kullanilmis hamleleri denemeyi tercih ediyor.

3- satranctan farkli olarak olasi bir konumu skorlamak icin elimizde net bir formul olmadigindan agacin yapraklarindaki konfigurasyonlarin skorlanmasi icin yeni bir cozume ihtiyac var. alphago value network ile bu isi cozuyor. yine policy network gibi cnn kullanarak olasi konumda kimin kazanacagina dair bir skor uretiyor. policy network'un urettigi olasi hamlelerin her biri icin bir skor var elimizde. bu skorlamayi ogrenmek icin de i) gercek oyunlardaki sonuclar kullaniliyor ii) makine kendi kendine oyunlar oynayip, oyun sonuclarini ve ara zamanlardaki konfigurasyonlari kullanarak value network'u egitiyor.

tum bu karmasik yapinin calisir hale gelmesi gercekten cok etkileyici. yine de seytanin avukatligini yapmak gerekirse:

i) daha onceki go oynayan makinelerin hic biri bu kadar cok hesaplama gucune sahip degildi. alphago onlarca gpu/cpu kullaniyor ve onlarca saatlik egitim almis durumda. soru su acaba ayni miktarda efor (insan saati & makine saati) diger makineler icin harcansaydi fark nasil olurdu?

ii) bir insanin 1 milyon mac yapabilmesi icin 40 yil boyunca gunde 70 mac yapmasi gerekiyor. acaba ayni miktarda mac deneyimiyle bir insani yenmek mumkun mu?

iii) insan faktorunu devreden cikarip, tamamiyle kendi kendine oynayan bir makinenin oyun tarzi bir insaninkine benzer miydi? ilk iki mactaki hamleleri ile bir turing testi yapilsa kimse hangisi makine hangisi insan fark edemezdi. zira yapilan farkli hamleler bile bir pro dan beklenecek farkli hamlelerdi (cilgin bir dizi hamle gormedik). bu durumda kendi kendine ogrenmis bir makineden yeni fuseki yada josekiler gormemiz mumkun mudur? yoksa su an bilinen hamle dizileri yeterince buyuk bir alt kume mi. bu kisim bir sonraki adim olacagina dair soylentiler duydum ve gercekten heyecan verici.

datsilaspatkom

11.03.2016 04:01
son maçını benle yapacak. insanlığın son umudu olarak tavlada eline vereceğim yazılım.

gaip

09.03.2016 13:42
lee sedol'e karşı ikinci oyununu da kazanmıştır. cumartesi sabahki üçüncü oyunu da kazanırsa 1 milyon dolarlık ödülün sahibi google olacak. resmi bir açıklama henüz yok ama söylentilere göre ödül unicef ve igf'e (uluslararası go federasyonu) bağışlanacakmış. biz de burada donu görünen balerin heykeliyle uğraşmaya devam edelim.

acilar dunyasi

10.03.2016 10:42

tum oyunlari canli izledim. oyunlar hakkinda yorumlarim soyle.

birinci oyun: lee sedol bu oyunda alphago'nun populer acilislar konusunda iyi oldugunu varsayip 7. hamlede beklenmedik bir hamle yapti. ardindan yasatmaya calistigi bir grup tas yuzunden oyunu kaybetti. bu oyunda cok iyi oynamadigini dusunuyorum. oyun boyunca icinden "oha insan gibi oynuyor serefsiz" diye gecirmistir.

ikinci oyun: bu oyunda sedol tam konsantre idi. oyunda alphago beklenmedik birkac hamle yapti ve bunlarin tumu oyun boyunca etkili oldu. cok yaratici hamlelerdi. oyun sonunda sedol'un suresi azaldi be merkezdeki bir savasta yeterince iyi okuma yapamadigini dusunuyorum. suresi olsaydi kazanacak miydi? emin degilim. alphago hatasiz ve kesin oynuyor. 20 puan farkla kazanma ihtimlari %90 olsa dahi, 1 puan farkla kazanma ihtimali %91 ise bu rotayi tercih ediyor.

ucuncu oyun: sedol ilk iki macin ardindan verilen bir gunluk aranin avantajini kullanarak ikinci oyun aksamindan sabah 6'ya kadar prolardan olusan dost meclisinde ilk iki maci calismislar. sedol'un daha territorial oynamasina ve tahtadaki savaslari alphago'nun baslatmasi gerektigine karar vermisler. bu oyunda savasi gercekten alphago baslatti ama sedol'un bu savastaki performansi alphago'dan iyi degildi. oyun sonunda alphago cok buyuk alan kapatti ve sedol'un bu alanda invasion yapma cabalari karmasik bir ko savasina dondu. alphago bazi dedikodularin aksine sedol karsisinda bu ko'yu oynamaktan hic cekinmedi ve sonunda sedol'un cekilmesiyle oyunu kazandi.

dorduncu oyun: ilk dort macin icinden en heyecanli olani buydu. sedol territorial oynayarak alphago'ya influence sahibi duvarlar verdi ve ince ince alphago'nun bu duvarlar arasinda olusturdugu moyoya zayiflatici hamleler yapti. bu macin sedol tarafinda yapilan 78. hamlesi tarihe gecti (sonradan yapilan aciklamaya gore alphago bu hamleye 1/10000 ihtimalle oynanacagini tahmin etmis ve bu hamleyi derinlemesine incelememis.). deepmind'dan hassabis'e gore alphago bu hamleye yanlis cevap verdi. ilk verdigi cevap %70 ihtimalle oyunu kendisine kazandiracakken 84. hamle sonrasinda alphago'nun hesapladigi kazanma yuzdesi dibe vurmus. bu noktadan sonra yuzdeyi arttirmak icin cilginca hamleler yapti ve geri donusu olmayan bir yola da girdi. sonunda alphago oyundan cekildi ve sedol ilk defa kazandi.

besinci oyun: bu oyunda oyun basinda profesyonel go oyuncularinin tumunun derinlemesine bildigi ama alphago'nun bilmedigi bir kucuk savas yasandi. sonucta alphago biraz geriye dustu. bundan sonra sedol sakin bir sekilde hep biraz onde oynadi. macin sonuna kadar ben de onde oldugunu zannediyordum. fakat alphago kazaniyormus gibi oynuyordu. su ana kadar ogrendigimize gore alphago kazanacagini tahmin ediyorsa risk almiyor ve aksi gerekmedikce beklenmedik hamle yapmiyor. mac sonu yaklastiginda yorumcu puanlari saymayi denediginde alphago'yu yarim puan onde hesapladi. alphago'nun kazanacagini ongormesi de buna isaret ediyordu zaten. bu andan kisa bir sure sonra da sedol oyundan cekildi.

muthis bir mac oldu. umarim alphago tekrar pro oyuncularla oynar.

su an icli kofte yiyorum

10.03.2016 19:29 ~ 15.03.2016 20:21
pro seviye maçlar nasıl oluyordur bilmiyorum ama kyu seviye maçlarda yaptığınız bazı hamlelerin cevabını pek bilmezsiniz. pek tabi rakibiniz de bilmez. yani siz bazen kazanmaya değil, karşınızdakinin insani bir tepkisi olan hata yaparak kaybetmesine oynarsınız.

sözü bile var. "go en iyi oynayanın değil, en az hata yapanın kazandığı bir oyundur."

belki lee sedol ilk oyunlarda rakibini hafife aldı ve insansı hatalar bekledi. ama alphago ilk hamleden itibaren her ihtimali hesaplıyor. oyunun başından itibaren üstünlük kurması da bundan.

belki de ilk 3 oyun sonunda lee sedol alphago'yu çözmüş durumdadır. kim bilir? ama dördüncü maçta insanevladı adına gelen galibiyet işi daha da eğlenceli hale getirmeye başladı.

bazilika

13.03.2016 11:16
ılk 3 macı kazanarak yapay zekanın insanoğlu zekasinı solladiğını kanıtlayan google tarafindan geliştirilmiş yapay zeka.
4. maçında rakibi lee'ye mağlup olmuş.
güney kore'de sevinc varmis.
ulan biz dağdaki itle savaşirken adamlar yapay zekayla savaşıp galibiyet kutluyor.
edit: ankarada patlama olmuş

kafkasorcun

13.03.2016 19:05 ~ 19:10
23-27 mayis tarihleri arasinda cin'de sangay'a bir saatlik mesafedeki wuzhen su kasabasinda alphago ile cinli ustalar karsilasacaktir.

uc tip karsilasma olacak:

1) pair go (26 mayis; cin saati ile 8:30-11:30)
gu li + alphago vs lian xiao + alpha

2) team go (26 mayis; cin saati ile 12:30-18:30)
shi yue, mi yuting, tang weixing, chen yaoye, zhou ruiyang vs alphago

3) ke jie vs alphago (23, 25, 27 mayis; cin saati ile 10:30-17:30)
uc oyundan olusan bir mac, her oyun 3 saat arti 1dk x 5 byo yomi

su an icli kofte yiyorum

13.05.2017 08:11 ~ 22.05.2017 12:27
lee sedol dördüncü oyunu kazanarak insanlık onurunu kurtarmıştır.

acilar dunyasi

13.03.2016 10:46
üçüncü maçı da başından sonuna kadar hükmeden bir oyunla lee sedol'e zor anlar yaşattıktan sonra kazanmıştır.

acilar dunyasi

12.03.2016 10:18