• (bkz: veri bilimi)
  • harvard business review demişki:
    (bkz: data scientist is the sexiest job of the 21st century)

    neyse bu iş türkiyede hala oturmadı. bu işi yapabilecek vatandaşlarımız şu an abd veya ingiltere çalışıyorlar. yarın bir gün, şirketlerin bir tarafı tutuşunca ülkeye adam toplamaya başlarlar.

    ahanda link: seksiler efendim
  • eski ismi istatistikçi olan meslek. böyle söyleyince kulağa hoş geliyor *.
  • veri bilimi konusundaki su entrym

    (bkz: #52447790)

    iki yil oncesine ait olmasina ragmen, sukelalar ve konu ile ilgili mesajlar yeni yeni gelmeye basladigina gore, turkiye'de de adindan soz ettiren yepyeni bir meslek grubu.

    son gunlerde hem yakin cevremden, hem sozluk uzerinden cok fazla mesaj aliyorum.
    bu meslegi icra etmek isteyen genclerden, bir yerden baslamak isteyip nereden baslayacagini bilemeyenlerden, baslamis olup nasil devam edecegini bilemeyenlerden, isi gucu birakip kariyer degisikligine gidecek olanlardan.

    bir amme hizmeti vermenin vakti gelmis sanirim.

    biraz tarihce:

    veri bilimi goreceli olarak cok yeni bir alan. henuz ne olup ne olmadigi oturmus degil. bir takim egitim programlarinin gecmisi 2-3 yil. bundan 4-5 yil once meslek adaylarini kaynak problemi ve derli toplu bir egitim imkanina ulasmak zorlar iken, su anda kaynak bollugu ve onerilen programlarin cesitliligi zorluyor. en cok aldigim sorular 'su su master programlarindan hangisini seceyim' ya da 'su su kitaplardan hangisini onerirsiniz'.
    alan cok hizli ilerliyor.
    egitim henuz yuksek lisans duzeyinde. lisans duzeyi cok yeni. 'data science' doktorasi diye birsey henuz yok*. bana sorarsaniz lisans duzeyi aslinda acilsa da olmayacak bir alan bu.

    peki neden?
    butun bu cilginlik nasil basladi?

    aslinda piyasada veri bilimi olarak uygulanan sey en genis anlami ile istatistik. psikologlar, sosyologlar, fizikciler, matematikciler ve alani istatistikle hasir nesir olan bircok arastirmacinin yillardir uyguladigi yontemler. veriyi bilgiye donusturme icin yapilan hinlikler, ornegin signal processingcilerin yillardir uyguladigi seyler.

    (parantez acalim: peki veri bilimi istatistik mi?

    istatistikten ibaret degil. yeri geldiginde istatistigi hunharca kullanan ama bazen de hic isi olmadan bir adim oteye tasiyan bir alan. bu veriye kimin baktigina cok bagli, yani subjektif. iste o sebepten veri bilimi'nin veri bilimi adi ile lisansi veya doktorasi olamaz dusuncesindeyim.
    suraya bir bakiniz, https://stats.stackexchange.com/…s-machine-learning)

    devam:

    internetin hayatimiza girmesi, sosyal medyanin, online alisveris sitelerinin devasa boyutlarda veri uretmesi, bu verileri depolama ve isleme kapasitemizin artmasi, yani bilgisayar donanimlarinin hem cok hizli gelismesi hem de cok hizli ucuzlamasi, istatistigin cok onemli bir ihtiyacina cevap verdi, buyuk boyutlarda, cok sayida veri. artik veriden 'sample' almak zorunda kalmamak.

    bu devasa veri boyutlari baska problemleri beraberinde getirdi. artik bildigimiz veri tabani islemleri yetmiyordu. ornegin, google, hangi kelimelerin ne kadar cok arandigini kolaylikla sayamiyordu.
    bildigimiz business intelligence yetmiyordu. ornegin, facebook, twitter gibi sosyal medya platformlari icin kac kisinin yeni uye oldugu sorusundan daha onemli sorular vardi, kimin kiminle arkadas oldugu, insanlarin baglanti profilleri.
    (facebook'ta bir toplanti sirasinda veriyle ugrasan insanlari adlandirmak icin o an uydurulmus all these data scientists... tanimi gelmis gecmis en cok sukse yapan bir meslegin adi oldu. data scientist in isim babasi facebook yani.)

    iste bu problemlere cozum aramak icin yeni yontemler gerekiyordu. belki ilk defa adinda bilim gecen bir alanda ozel sektor universitelerden ve akademik enstitulerden onde gitti. google, az once anlattigim problemini cozmek icin mapreduceu uretti, facebook graph theoryye yuklendi. butun bunlar hem donanim, hem altyapi, hem de teori dunyasini kendi ihtiyaclari dogrultusunda sekillendirdi.

    ayni zamanda butun bu gelismeler bilgiye ulasmanin hic olmadigi kadar kolay oldugu bir zamanda yasandi. open source araclar ilgili ve merakli herkesin kullanmakla kalmayip katki sundugu platformlar olduklarindan, bilgiye ulasmak da kolay oldugundan herkes ihtiyaci veya meraki dogrultusunda birseyler uretti ve piyasaya sundu. bilginin yayilmasi, birbiri uzerine eklenip ileri noktalara tasinmasi da akademik disiplinlerin hizi ile kiyaslandiginda roket hizinda oldu. bir is yaptiginizda onlarca literatur taramasina, bir akademik juriyi ikna etmeye, yayin icin aylardir hazirlanmaya ve yayinin kabul edilmesini beklemeye ihtiyaciniz yoktu. geleneksel bilim kistaslari hicbir sirketin umrunda degildi, bunun kotu yanlarini, iyi yanlarini tartismak istemiyorum, sadece bu ilerleme hizina ve sebeplerine dikkat cekmek istiyorum.

    eger bilim diyeceksek, veri bilimi, iste yukaridaki sebeplerle, mufredatli, planli programli akademik egitime gectigimizden ve bilimi hem yazili kati kurallarla, hem de yazili olmayan etik veya 'camia' kurallariyla akademisyenlerin tekelinde biraktigimizdan bu yana universite disinda gelismekte olan, universite disinda alip basini gitmis ilk alan.

    bu sebepten bir mufredat toparlamak, cilgincasina ilerleyen bu alani bilimsel formata sokmak, standarda sokmak o kadar kolay bir is degil. bana bakmam icin iletilen cesitli master programlarinda uc asagi bes yukari ozel sektorde sikca kullanilan yontemlerin, araclarin derli toplu bir ozetini goruyorum. fakat hicbir akademik programin bugun veri bilimi adi altinda icra edilen konularin tumunu kapsamasi mumkun degil. su an itibari ile bildigimiz anlamda bir lisans programi acilabilecegini de sanmiyorum. cunku veriyle neye cevap veriyoruz, soru nasil sorulur, nasil cevaplanir konulari sadece veri biliminin tekelinde degil, tum bilim dallarinin temel meselesi.

    peki nasil gelisiyor? nereye gidiyor?

    yukaridaki bir paragrafi suraya kopyalayarak devam edeyim:

    "ayni zamanda butun bu gelismeler bilgiye ulasmanin hic olmadigi kadar kolay oldugu bir zamanda yasandi. open source araclar ilgili ve merakli herkesin kullanmakla kalmayip katki sundugu platformlar olduklarindan, bilgiye ulasmak da kolay oldugundan herkes ihtiyaci veya meraki dogrultusunda birseyler uretti ve piyasaya sundu."

    buna ilk uyum saglayan elinde veri hazir olan ve veriyi paraya donusturme istahindaki internet teknoloji sirketleri, online satis platformlari ve sosyal medya oldu.

    ellerinde veri olmayanlar, ya da son derece geleneksel sirketler, ya da dunyadan haberi olmayan vizyonsuzlar gec uyanacakti, oyle de oldu.

    enerjiden sagliga, bankaciliktan, sigortaciliga, lojistikten medyaya her sektor ama her sektor ya veri biliminin nimetlerinden yararlanacakti, gucu yetmiyorsa ya da olayi kavrayamiyorsa yararlaniyormus gibi yapacakti, ya da yokolacakti. teknoloji ve kulaktan kulaga duyulan 'data science', 'big data', 'machine learning', 'artifical intelligence' kendi halinde ekmegini, gazetesini satan kucuk mahalle bakkallari disinda her isyerine secenek birakmadan donusmeye, degismeye zorluyordu.

    (burada da bir parantez acayim: bu degisimin kimin icin ne olcekte olmasi gerektigi, kimin bundan nasil yararlanabilecegi ayri bir entrynin konusu. kisisel fikrim, bircok isletmenin gereginden fazla etki altinda kaldigi ve sirf prestij icin ya da havasi olsun diye kendisine cok da getirisi olmayacak isler pesinde kostugu yonunde. veri elbette yarar saglar, ancak dogru kullanirsaniz. google olmak isteyen emmimgil hastanesi tadinda isyeri cok.)

    dolayisi ile burada cesitli duzeyde ihtiyaclar ortaya cikti.
    'elimde veri var, adam yok' diyen sirketler veriyi derinlemesine analiz edebilecek ve yeni yontemleri kullanabilecek kisileri ariyorlardi, ve bu kisilere data scientist deniyordu.

    'elimde veri olabilir, hic bakmadim, belki de vardir, simdi biz bunlari nasil yapalim' diyen sirketler eski model veri tabanlarini donusturecek, altyapi hazirlayacak, veri akisini adam edecek, ve akabinde birtakim islemlerini otomatiklestirebilecek birilerini ariyorlardi, ve bu kisilere de data scientist deniyordu.

    'elimde veri var, adam da var, ama bu adamlarin yerine ai istiyorum ben' diyen sirketler, musterilerini otomatik olarak gruplara ayiracak, siniflandiracak, ona gore muamele edecek, yanina da cay kahve getirecek bir simone yapacak kisileri ariyorlardi, ve bu kisilere de data scientist deniyordu.

    simdi bu uc basligi toplarsak,

    1. isin analiz, arastirma, veriyle yatip kalkma kismi
    2. isin altyapi, ve karmasik olmayan islemleri otomatiklestirme kismi
    3. isin herseyi otomatiklestirme becerisini otomatiklestirme kismi

    bunlarin ucu de data scientist olarak aniliyor.

    hangi yone gideyim diyen genc arkadaslara,

    sabriniz varsa, arastirmayi seviyorsaniz, kafaniz su an cok karisiksa ve neyi istediginizi tam bilemiyorsaniz, imkaniniz da varsa (burs, asistanlik, baba parasi, vs.) doktora yapin. sonra yonunuzu kendiniz bulursunuz. tercihen artificial intelligence doktorasi oneririm, ama cografi bilgi sistemleri gibi bir doktorayla, ya da medical imaging gibi bir doktorayla da epey bilgi kazanirsiniz. doktora secenekleriniz sonsuz. kafaniza gore, bolumunuze gore birseyler secin.

    imkaniniz var ama sabriniz yoksa, ya da kariyer degistiriyorsaniz, olan tecrubenizi tamamlayici bir master programi oneririm. bilgisayar bilimci iseniz, istatistik agirlikli, matematikci iseniz programlama agirlikli gibi.

    sektordeki gelismeleri takip ederek kendinize bir yon cizin. bu yon ilk buldugunuz isle de belirebilir, cunku benim de haberim olmayan 'aa ne ilginc problemmis' dedigim problemlerle is gorusmelerinde karsilasiyorum. sektorde uygulama alani sonsuz diyebilirim.

    o sebepten bir ongorumu de paylasayim: su anda gordugunuz programlarin cogunlugu online sektorun ihtiyaclari ve uygulamalari dogrultusunda duzenlenmis. yarin birgun diger sektorler de bu ise tam olarak katilim sagladiginda, o programlarin bir ise yaramamasi kuvvetle muhtemel.

    o sebepten temel bir bilimin egitimini alin, arastirma tecrubeniz olsun. yapabiliyorsaniz veri agirlikli bir doktora yapin.

    cok sevdiginiz bir is varsa, ya da cok sevdiginiz bir bolum varsa, sirf populer diye bu alana gecmeyin. gidin neyi seviyorsaniz onu okuyun. kismet, belki o alan patlama yasayacak, belki veri biliminin sahane bir uygulamasi o alanda olacak size ihtiyac duyulacak. sevmediginiz, sevemeyeceginiz isi sirf populer diye yapmaya calismayin.

    buraya kadar gayet objektif takildim. sira subjektif yorumumda.

    1. hayatinda bir kere bile veri temizlememis, bir kere bile veri karsisinda kafayi yememis insan veri bilimci olmamali.

    2. teknoloji devi olmadigi halde, insani aradan tamamen cikarma hevesindeki sirketler, ya da herseyi otomatiklestiririm kafasindaki yazilimcilar olayi gercekten hic anlamiyor.

    3. onlara su ornegi vereyim: akademisyen oldugum donemde herkes ama herkes biran once yayin yapmak pesindeydi. dolayisiyla kullandigimiz analiz arac gereclerinde neredeyse 'otomatik yayin' butonu ariyorlardi. veriyi temizleme isini ciddiye alan uc bes kisiydik, o asamayi seviyoduk. cunku kesfe en acik olan asama isin o kismidir. millet kod yazip binlerce veriye ayni islemleri uygularken, benim kidemli arkadas tek tek eliyle bakip gayet onemli bisey bulmustu. o buldugu sey onun kesif olarak bilim dunyasina yazdirdigi ve tum o otomatik yayin pesindekilerin de uzerine atlamaya calistigi birsey.

    4. bu is programming science degil, algorithm science degil, data science. 'veriyi hic gozum gormesin, sonuc ciksin' diyenler, siz haksizsiniz.

    notlar:
    *: data science doktora programi diye birseyler gordugum oluyor fakat program iceriginden bunu supervise edecek hocalarin da tam emin olamadigini goruyorum. endustriden gelen talep cercevesinde bir program aciyorlar, adi data science, fakat arastirma konusu olarak sececekleri sey bilgisayar bilimlerine de girebilir, istatistige de, yapay zekaya da.

    **: esasen facebook isim babasi degil, genel bilinen hikaye bu.

    sikca sorulan sorular editi:
    1. ne okudunuz?
    uzgunum, yanlis soru. cevabi size cok yardim etmez, ama merak ediyorsaniz veriyle cok icice bir alanda master ve doktora yaptim. uzerine akademik arastirmalar yaptim. ex-akademisyenim.

    2. ne okuyayim?
    sizi tanimadan, yeteneklerinizi, ilgi alanlarinizi, neyin sizi atesledigini bilmeden buna cevap veremem. matematik egitimi iyi olan, analitik dusunme yetenegi kazandiran, deneylerle icice, istatistik kullanan bir temel bilim dali okuyun. master, doktora yapin, ki bunlari yukarida anlatmistim zaten. bilimsel dusunmeyi data science programlari ile ogrenebileceginizi dusunmuyorum. kisisel fikrim data science lisans programi acilmasinin sacma oldugu.

    3. hangi programlama dilini ogreneyim?
    su an icin, analitikciler icin r, python, matlab uclusu. yarin ne olur bilemem.
    su an icin, backendci, automationcilar icin java, scala, spark. yarin ne olur bilemem.
    su an icin, altyapicilar icin database mantigi, nosql. yarin ne olur bilemem.
    hepsi: sql
    programlamanin mantigini ogrenin, kendinizi yeniliklere adapte olabilecek sekilde yetistirin. ben mezun olurken o donemlerin gozde meslegi quantitative analystlik, operation research'cilik, market research'culuk falandi. o donem c++ onemliydi, ogrendik. simdi unuttuk.

    sikca yapilan hatalar editi:

    1. data analystin data scientistten baska birsey oldugunu sanmak.

    kabul ediyorum, data scientist diyince daha bir havali duruyor. fakat su an uygulama acisindan cok rahatlikla soyleyebilirim ki, harvard business review'in '21. yuzyilin en seksi meslegi' diye tanimladigi data scientist'likten her neyi anliyorsaniz, iste onun aynisini data analyst resmi unvani ile icra edenler var. sizin bakkalin muhasebecisinin hesap makinesi ile yaptigini bilgisayarda yapip unvani data scientist olanlar da var.

    is secerken israrla data scientist pozisyonlarina bakip, 'data analyst' pozisyonlarina burun kivirirsaniz hata edersiniz.

    (konuya asina arkadaslar icin parantez: eski calistigim sirketlerden birinde yakin zamanda got korkusundan bir donem birlikte calistigim herkesin unvani data scientist olarak degistirildi, kampanya yoneticisi dahil. disaridan bakinca 20 tane data scientistten olusan dev bir ekip var gibi gorunuyor, fakat bu kisilerin hicbiri zaman zaman bana sorular soran ogrenciler kadar bilgi sahibi degil. distance matrix, poisson process, boosting algoritmalari, vs. gibi isleri birakin, standart sapma nedir haberleri yok, bazen neden kiyaslamalarda mutlak rakam degil de yuzde gereklidir haberleri yok. )

    2. ogrendiginiz $ık yontemleri her probleme uygulamaya kalkmak

    simdi bu, dun ogrenmeye basladiginiz bir dilde henuz cumle gramerini ogrenmeden, duydugunuz kelimeyi cumle icinde kullanmaya calismaya benziyor. sonuc: are you sex?

    her problemin dogasi farklidir, yapisi farklidir, ihtiyac duydugu veri farklidir, kisitlari farklidir. once problemi anlayacaksiniz, neye cevap vereceginizi anlayacaksiniz, ondan sonra veriye bakacaksiniz, veri size birsey anlatiyor mu, ihtiyacinizi cozebilir mi, onu anlayacaksiniz. yonteme sonra karar vereceksiniz. isin bu kismi biraz tecrubeyle kazaniliyor. iste o sebepten veriyle yatin kalkin. mumkunse doktora dememin sebebi bu, yontem kestirme isini insana en guzel ogreten sey doktora.

    (asina parantezi: binary sinifli gelmis historik veriye association rules uygulamak nedir yahu, ya da time series verisini evirip cevirip random forestla klassifikation yapmak?!? ya da biseyle biseyin arasinda gecen zamanin dagilimini discrete distributionla (poisson) aciklamaya calismak? niye? cunku derste onu gordun.)

    3. visualization kismini gereginden fazla onemsemek

    3 boyutlu yanarli donerli grafikler, firindan yeni cikmis bonibonlu muffinin uzerindeki bonibonlar gibi piril piril alev alev parlayan bubble chartlar, renk skalasini kimsenin anlamayacagina garanti verecegim konturlu heat mapler.
    hepsi cok guzel gorunuyorlar, kabul ediyorum, uretmesi de cok zevkli.
    fakat alanin bu hizda gelisip genisledigi bir cagda, bilginin pesinden yetismeye 24 saat yetmezken, vaktinizi kimsenin anlamayacagi renk cumbuslerine harcamak istediginizden emin misiniz?

    veriden anladiginizi anlatmanin bir yolu onu gorsellestirmek, grafikler yolu ile anlatmak. iyi bir grafik, minimum karisiklik, maksimum sadelikle, maksimum bilgiyi ileten grafiktir ve bunlar her zaman yaparken sizi cok eglendiren grafikler olmayabilir. siz visual effects uzmani degilsiniz, kariyerinize grafiker, cizgi film animatoru falan olarak devam etmek istemiyorsaniz bu konuya bu kadar zaman harcamayin.
  • bugün 3.500tl net maaşla teklif aldığım pozisyon. bunlar da ayağa düştüler.
  • linkedin tarafindan ustuste en seksi meslek secildigi icin olsa gerek yillar icinde bu meslek grubunu icra eden insanlar arasindaki kalitede gozle gorulur bir dusus var.

    bes yil oncesine kadar doktorali olmayan birine bu unvan kolay kolay verilmezdi. yuksek egitimi olmayanin maksimum cikacagi seviye data analyst olurdu ornegin. sonra zamanla data science odakli master programlari ortaya cikti, bunlar mezunlarina data scientist dediler. hadi o neyse daha sonra nanodegree denen sacmalik cikti. 3 ay python, r, scikit-learn vb. acip kapamayi ogrenen insanlar data scientist'im diye ortalikta geziyor.

    soyle bir problem var diyorsun, support vector machine yapayim abime, ordan biraz l2 regularization vereyim, tatli olarak da hidden markov yaptirayim mi abe? diye cevap veriyor. sen bunu neden yaptin diyince abe dataya iyi fit etti falan diyor. tek bi test data kullanip %95 accuracy buldum o yuzden bu modeli sectim diyor mesela. guler misin aglar misin.

    data scientist meslek tanimi yillar icinde degisti. istatistikten zerre anlamayan ya da sadece istatistikten anlayip alan bilgisi olmayan insanlar her yerde. tas atsan bunlardan birine carpiyor artik. sonra neymis yilin en seksi meslegi. he yavrum he.
  • her ne kadar python veya r bilginiz iyi de olsa domain knowledge(türkçesi her ne sikimse) ve istatistik temeliniz olmadan biraz zor olan meslektir
  • veri bilimciliği, cloud, big data gibi hype-tech atılımlarının çok daha öncesinde vardı. ancak bir title olarak önplana çıkması, sektörel yayılımlarla oldu. 20 yıl önce de istatistiksel analiz sistemleri kullanılıyordu, ancak data scientist olabilmek, bu alandaki uzmanlıktan ziyade bütün sistemleri kapsayan, akademik yanı ağır, bir çalışmaya dayanıyordu. daha da öncesinde, replication crisis gibi sebeplerle istatistik biliminin yapısal açmazlarına karşı çok daha açık olan sosyal bilimler için bile paketler vardı. evet, veri bilimi diye bir şey vardı ancak data scientist title'ı, hem akademik hem sektörel çevreler için bile belirli bir zamansal sınıra tabiydi.

    daha spesifik olarak frekans analistliği, yüzyıllar öncesine dayanan spektral analistlik de bir veri bilimciliğidir, böyle kabul görmüştür. ama bugün öyle bir noktaya gelindi ki tez için fmri set'leri kullanan, doktora öğrencileri bile data scientist olduklarını söyleyebiliyor. ya da reklam departmanlarında api'ler üzerinden analiz yapan, stajyer berke'ler bile linked.in profiline data scientist ibaresini eklemekten çekinmiyor.

    ml ve ai üzerindeki tartışmalar ise daha girift ve yapıcı. bugün gelinen noktada, matematiğin ve bilgisayar biliminin pragmatizm tartışmaları, artık felsefik bir boyut aldı. foton sayımları, radio burst gözlemleri artık frequentism vs. bayesianism tartışmalarıyla içiçe yürütülüyor.

    demem o ki, son 5-10 yılda ortaya çıkmadı data scientist'ler ve 5-10 yılda da görevlerini tamamlayıp çekilmeyecekler.

    bugün illa ki bir iş, o işin tanımı ve icrası tartışılacaksa buna çok daha açık olan alanlar var. örneğin feature engineering, hatta kendi işimdir ama "feature engineer ne aq!" derim yani. hele bu meslek türetme işini abartıp "data wrangler" gibi sikimsonik ve gereksiz title'lar üretenler bile var.
  • data science alaninda kendini gelistirmis kisilerin olusturdugu meslek grubu.

    bir ustteki yazar, algoritmanin neye hizmet ettigini anlamdan sadece basarisina odaklanan meslek grubu gibi bir tanim girmis. burada birkac cumle ile anlatmak istedigim seyler bulunuyor.

    su anda dunyada bu is iki farkli title altinda yapiliyor. bir tanesi burada bahsedilen data scientist digeri ise machine learning engineer. ikisi arasinda en bariz fark ise business expectations diye anilan isin ucunda yaratilacak olan katma degerin ne oldugunun dikkate alinip alinmadigi. data scientstolmanin en acili tarafi modellerin buyuk basari ile yaratilmasi ve deploy edilmesi degil yapilan modelin projeye katkisinin (business value) ne olacaginin olcumlenebilmesidir. machine learning engineer ise isin sadece model tarafini dikkate alindiginda gecerli olan kisimdir. bir data scientist sadece projenin beklentilerini degil, o projede yapilan isin yer aldigi sektor veya yapilan is ne ise o isin surecini de ogrenmek/bilmek zorundadir. bu sureci de nasil iyilestirecegini dile dokmek anlatmak ile de yukumludur.

    is ilanlarindaki bu ayrima dikkat cekmek icin ve farkindalik icin baska yerlerde de yazmak istemistim. ancak bu farkindaliga sahip bu isi yapanlar dahil olmak uzere ciddi bir kitle yok. data scientist ile machine learning engineer ayni isi yapiyor gibi gozukse de ayni meslekler degildir.

    buna istinaden yukaridaki arkadasin gozleminin aslinda buradaki farkindaligin olmamasi kaynakli oldugunu dusunuyorum. bunun yaninda bu isi yapan ve ilgi duyan kisilerin kullandigi kaggleadinda bir web sitesi var. bu site icinde algoritmalarin ve tekniklarin yaristigi bir ortam bulunuyor. buradaki yarismalarda guzel bir dogruluk orani ile bir model kursaniz dahi, bunu 0.0001 bile artiracak yeni teknik sizin siralamada one cikmanizi sagliyor. bunu goren yeni nesil ve bu isi ogrenmek isteyen insanlar da modelin basarisinin aslinda en onemli sey oldugunu dusunuyor.
    burada modelin basarisini tabii ki kucumsemiyorum. ama bir data scientist modelden once business value olarak tabir ettigim proje sonunda yer alan beklentileri ve aslinda modelin canliya alindiktan sonra kendinin veya kullanacak olan sirketin nasil bir katma deger ile bu projeyi kullanacagini bilmek zorundadir. bir model yaptiktan sonra ve ornegin bir siniflandirma algoritmasi ile 89% basari elde edildiyse ve bunu kullanmak proje beklentilerinin karsiliyorsa 95% basariya cikartmak icin harcayacagi zaman kazanc mi yoksa ters etki mi edecegini olcmek gereklidir. cogu gercek hayat probleminde de bununla karsilasmak cok olasidir. 85% aldiginiz orani 95% 'ye cikarmak cogu zaman oncesinde harcadiginiz zamandan daha fazla bir zaman alacaktir.

    ezcumle, yukaridaki arkadasin dedigi gibi proje beklentisi bilinmeden baslanan ve devam eden projeler gereksiz zaman kaybinin yaninda sonucunda bizi goturecegi yer ve katma degerin elde edilmesi noktasinda negatif maddi etkiler dogurmasi muhtemeldir. bu nedenle bu isi yapmak isteyen kisilerin proje yoneticisi ya da proje sahibi ile gercekten oturup beklentinin ne oldugu, sonucunda yaratilacak katma degerin etkilerinin uzerine anlasmalilardir. bir proje sadece algoritmadan olusmadigi gibi sadece modelin otomatik calisbilmesi ile de sinirli degildir.
  • kariyer değiştirip bu konuda hollanda'da iş bulmayı hedeflediğim meslek. bu entry altında da bu hedef ile ilgili günlük tutacağım.

    ön bilgi editi:
    --- spoiler ---
    özellikle bu işe girişmek isteyen arkadaşların iş bulma konusunda aklında soru işaretleri oluyor. doğal olarak buradaki yazıyı okuyup kendi durumları ile karşılaştırma yapma yoluna gidiyorlar. bu yüzden daha önce bahsetmediğim bir iki husus hakkında daha aydınlatıcı olmam gerektiğini düşündüm.
    +benim durumum için iş bulmanın ekstra bir zorluğu var. çünkü tokyo'da yaşıyorum ve hollanda'da iş bulmaya çalışıyorum. yani ab içinde veya türkiye'de bile olsam olay bir parça daha kolay olurdu. veya türkiye'de iş bulmaya çalışsam muhtemelen bulabilirdim. bulabilir miydim lan? oturup japonca öğrenmeye çalışsam burada da bulma şansım çalışma iznim olduğu için çok yükselirdi ama kendime göre sebeplerim yüzünden avrupa olsun diyorum.
    +niye hollanda? avrupa'da ingilizce konuşulan ülke. oecd rakamlarına göre en iyi çalışma hayatı orada. gerçi benim gönlüm almanya'dan yana ama bu kadar dezavantajın üstüne bir de almanca challange'ını eklemek çok saçma olur.
    +e niye irlanda değil? aslında irlanda da olur. ama her ülke'nin göçmenlik kanunlarını durumlarını incelemek çok fazla adam-saate mal oluyor. o yüzden ciddi bir avantajı yoksa her ülkeyi de inceleyemiyorum. öyle başta hollanda dedik orası hakkında araştırma yaptık.

    yani demek istediğim benim yolum biraz uzun sürecek. siz burayı kıstas alarak yav bu alanda kariyer değiştirip iş bulunmuyor gibi bir sonuç çıkarmanız çok doğru olmaz. selamlar saygılar.

    bu kadar çalışma ile türkiye'de iş bulunur mu sorusunun cevabı için 03.07.2021 tarihine bakın.
    --- spoiler ---

    şubat - mart - nisan 2020:
    --- spoiler ---
    11.02.20 editi:
    -önce istatistiğe saldırdım. hipotez testlerini falan yüzeysel de olsa tekrar hafiften tekrar ediyordum ki aslında data science işinde istatistiğin o kadar da öncelikli aranan bir alan olmadığını farkettim.
    -sonra udemy'den bir data science istatistiği dersi alıp oradan takip etmeye başladım. adamların istatistikten kasıtlarının sadece hipotez testleri değil aynı zamanda "olasılık" olduğunu farkettim.
    -biraz mülakat sorularında bulunan olasılık sorularını yumrukluyordum ki sql bilgisinin istatistikten daha önemli olduğunu farkettim. 10 tane iş ilanı indirip inceledim. en çok aranan sql. çalışma odağını sql'e çevirmeye karar verdim.
    -hackerrank diye bir site buldum, oradaki sql sorularını çözmeye başladım.
    -hackerrank'daki easy soruları biraz uğraştırsa da çözdüm. hatta tekrar edince bir gün içerisinde hepsini bitirdim. ama medium sorular zorladı. hatta ikinci kere üstlerinden geçmeye çalışsam bile kendimi rus topraklarında ilerleyen fransız ordusu gibi hissedip acı çektim. bu kadar uğraştan sonra birinci raund için bu kadar sql çalışmanın yeterli olduğunu düşünüyorum. ayrıca hackkerrank'da çok az medium soru var. odağı tekrar değiştireceğim. ama sonra geri dönüp tekrar sql çalışacağım. muhtemelen başka bir platformdaki soruları çözeceğim.
    -udemy'den python ile makine öğrenmesi dersi aldım. bir de sıfırdan python bakıyorum. acı verici. excel'in yapabildiği basit işlemleri için kütüphane falan kullanıyoruz. bakalım bir süre python üzerinde çalışıp python bilgisini beginner'e çıkardıktan sonra diğer alanlara geri döneceğim.

    25.02.20 editi:
    -ders çalışma konusunda kendime fazla yüklenince depresif bir ruh haline girdim. tekrar pc oynamaya başladım. lan sanırım 5. ayın sonunda mal mal dota oynamaya devam edeceğim şeklinde düşünmeye başladım.
    -yeni bir sistem getirdim, bu iş pc oynamayı bırakınca da olmuyor, çalıştığım kadar pc oynama hakkım olacak. bakalım işe yarayacak mı?
    -askerleri ayağa kaldırıp tekrar çalışmaya yüklendim. freecodecamp'de 300 saatlik javascript ile veri yapıları ve algoritma kursunu bitirdim. son problemler epey zorladı. tatmin olmayıp regexp konusunu tekrarladım. aslında bu sertifika data science ile birinci dereceden alakalı değil ama zamanında bir kere başlamıştım. en azından mülakatta algoritmalardan anlıyorum derim.
    -udemy'de sadi evren şeker'in python ile makine öğrenmesi dersini işliyorum. aslında öyle çok zor konular değil ama sıfırdan başka bir yazılım diline başlamak acı verici. motivasyon düşük durumda. kahve üstüne kahve içiyorum. şu 25 saatlik kursu bitirince ilk iş başvurularına başlayacağım. iş başvurularına başlamazsam motivasyon iyice düşer çünkü. bir kaç görüşme yapar ve red yersem biraz motive olur kendimi daha çok geliştiririm diye düşünüyorum.

    11.03.20 editi:
    -udemy'deki python ile makine öğrenmesi kursunu bitirdim. 3-4 gün dota ve mist diye bir oyuna sardıktan sonra bugün ilk iş başvurumu yaptım. bir kaç saat sonra adamlar, hollanda'da ikamet eden ve data science background'ı olan birini arıyoruz diye mail atmış. bu cevap hızlı ve net dönüş motivasyonumu arttırdı. bir mülakat için hazır değilim ama artık tek tük iş yerlerine deneyim amaçlı olarak başvuracağım.

    15.03.20 editi:
    -ilk iş reddimi yemiş oldum. hollanda'da başvurduğum bir firma şu anda hollanda içinden ve data scientist backgroundı olan aday arıyoruz diye geri dönüş yaptı. 2. başvurumu yaptım. her üç günde bir bir kaç başvuru yapıp aynı zamanda bilgimi geliştirmeye çalışacağım. şimdi algoritmaları kabataslak gördüm ama algoritmaları biraz daha detaylı çalışıyorum ki mülakatta üç beş cümle söyleyebileyim.
    bu arada kaggle isimli sitede bir challange buldum. ev fiyatlarını regresyon modelleri ile tahmin edin diyor. aslında bu çok iyi bir fırsat. udemy derslerinde durmadan pythonda işlem yaptık ama bu bilgiler bende çok soyut durumda. böyle bir problem üzerinde çalışıp pratik yaparsam öğrendiklerimi kalıcı hafızaya bir miktar daha iyi taşımış olurum.

    17.03.20 editi:
    -geçen bu konuda bir algoritma arayan arkadaşıma 2 saat falan machine learning algoritmalarını, python programını falan gösterdim. birisi ile çalışınca veya birisine öğretince gerçekten verim ve motivasyon artıyor. benim de bu zamazingoya birileri ile birlikte çalışmam lazım. 2 saat bile birlikte yapılan online bir çalışmada verim artıyor. istekliyseniz mesaj atın birlikte bakalım. bir veri kümesinin üzerinden python'da beraber tahmin yapmaya falan çalışırız. yalnız ben de öyle çok bilmiyorum, birlikte araştırmış oluruz. öte yandan algoritmayı bilmekle bunu python'da uygulamaya geçirmek apayrı şeyler. pratik deneyim olmadığı için ufak bir hata için yarım saat uğraşadabiliyoruz. ama en azından python nedir hiç görmemişseniz bir python görmüş olursunuz. tabi konu hakkında tamamen sıfır değilseniz de daha iyi olur.

    çalışma miktarım biraz düştü ama eğitim setini izledikten sonra şimdi en azından python üzerinde alıştırma yapmaya harcıyorum zamanımı. bir lineer regresyon tahmin ettirip bunun confusion matrix'ini almaya çalıştım 15 dakika boyunca. sonunda internetten bu niye hata veriyor diye araştırınca bir aydınlanma yaşadım. adam diyor ki birader sen sayı tahmin ettirmeye çalışıyorsun (aylar-maaşlar verisi), confusion matrix'de 1 veya 0 vardır program sana nasıl confusion matrix versin, senin r2 değerini hesaplatman gerekir diyor. ilginç valla.

    22.03.20 editi:
    -iki gündür skype'dan bir arkadaşla beraber çalışmaya başladık. kaggle'dan ev fiyatlarına dair bir veri seti indirdim onun üzerinde çalışıyorum. veri setinde 80'e yakın değişken var. lineer, polynomal, random forest, decision tree ve svg algoritmalarını uygulayıp bunların r2 değerlerine baktım. bir ara polynomal regresyonda yaptığım hatayı bulmak zorlasa da bir moladan sonra aslında hatanın çok basit olduğunu gördüm. aslında başta zorlasa da böyle hatalar yararlı. bu sayede kafada x_test nerede, y_train nerede kullanılacak gibi detaylar iyice oturmuş oluyor. ev fiyatlarını önce 5 tane değişken ile bulmaya çalıştım, %70'e kadar geldim. bir sonraki turda değişken sayısını 10'a çıkarmak daha sonra string şeklinde verilmiş değişkenleri inte dönüştürüp eklemek, bir sonraki safhada hepsini ekleyip sonucu değiştirmeyen değişkenleri çıkarmak mantıklı olabilir. ondan sonra da şu kaggle denilen naneye sonuçları yükleyebilirim. bu regresyon algoritmalarını bir tur pratiğini yaptıktan sonra sırada sınıflandırma algoritmaları var.

    23.03.20 editi:
    -biraz hollanda göçmenlik programına tekrar baktım. aslında ben her şirkete başvuruda bulunuyorum ama sadece sponsorlu şirketlere başvurmam gerekiyor, sponsorlu şirketlerin listesini çıkardım. ibm iş başvuruma olmaz diye mesaj göndermiş.
    kaggle'dan çektiğim 80 değişkenli data setine önce şöyle bir saldırayım, kategorik verileri inte çevireyim dedim. ama bir taraftan da bu iş çok zaman alır, normalde bunun böyle olmaması gerekir diye de düşünüyorum. diğer bir taraftan aslında sadi evren şeker'in eğitim setinde regresyon konusunda anlattıklarını da üç aşağı beş yukarı yapmış olmak bana bir "şimdi ne öğreneceğiz, bu iş bunla sınırlı olmamalı!" hissiyatı vermekteydi. deneme amaçlı olarak bir kaç kategorik veriyi sayısallaştırınca bu iş böyle olmaz aga dedim. şans eseri kaggle'dan hintli bir elemanın ilgili data seti ile ilgili çözüm videosunu buldum. benim bir kaç değişkeni ekleyerek bulduğum rmse sonucu 0.25'lerdeyken bu eleman 0.14 bulmuş. yani daha iyi bir sonuç. ama neredeyse her veriyi kullanmış. biraz bakınca olay anlaşıldı. eleman for döngüsü yazıp tüm kategorik verileri manuel değil otomatik olarak sayısala çevirmiş. data seti üzerinde eksik verileri falan da çok klas bir şekilde tırpanlamış. daha sonra bu elemanın github'daki kod satırlarını inceleyeceğim. ayrıca burada sadi evren şeker'in derslerinde anlatmadığı ve 23 saatte anlatmasının da mümkün olmadığı bir ipin ucunu yakalamış oluyoruz. zaten amacım da benim göremediğim çok kısıtlı keşfedilecek alanın ötesini görmekti. insan beş birim biliyorsa görüş alanı 9 birim olabiliyor. bilgi 8 birime gelirse ve görüş alanı hala 9 birim olursa heralde ben bunu öğrendim diyerekten motivasyonu düşer. bu hintli elemanın kodları ile görüş alanım 20'ye çıkmış oldu. gerçekte ise bulunduğum alanın 1000 birimlik bir çapa sahip olduğunu tahmin ediyorum.

    24.03.20 editi:
    bugün eu4'de norveç seçilip danimarka'ya karşı bağımsızlık kazanıldı. önceki oturumda çözüm yolu gösteren hintli elemanın kodları incelenip çözülmeye çalışıldı, çoğunlukla da çözüldü. onehot encoder yerine eleman başka bir algoritma kullanmış. sadi evren'in xgboost ve pickle dersleri tekrar edilip python'a xgboost yüklendi. şaka maka bir sonraki oturumda kaggle'a kendi profilimle tekrar ettiğim çözüm yolu sonucunda elde ettiğim verileri yükleyip bir puan alabilirim. kaggle'da bir competition'a bu kadar kısa sürede bir sonuç yükleyebileceğimi (çözüm yolu aslında başkasından taklit edilse de) hiç sanmıyordum.

    26.03.20 editi:
    ilerleyişimiz sürüyor. kaggle'a hintli elemanın izlediği çözüm yolunu izleyerek veri yükledik. sonuç kopya çektiğimiz arkadaştan daha yüksek çıktı. şaka maka kaggle'da ilk skorumu almış oldum. veri yükleyenlerin %50'si içerisine girmişim. aslında tahmini bir kaç puan öteye götürebilirsem ilk yüzde %10 veya %1 çok yakın. bu işin şöyle hoş bir tarafı var, bu kaggle competition'larındanki skorları linkedin ve cv'ye de yerleştirebilirim. bir kaç %1'lik elemanın linkedin profiline baktım öyle yapanlar var. böylece cv'mde somut bir deneyim de belgelenmiş oluyor.

    şöyle bir korkum var. kariyer değiştirdiğim için junior basamağından işe başlayacağım. girdiğim işte yapabildiğim kadar yüksek bir noktadan işe başlamam lazım. başıma 2 yıl önce bu işe başlamış ama benden az bilen birini getirirlerse iş tam bir kabus olabilir. problem çözmek, zorlukların üstesinden gelmek, o sırada yeni şeyler öğrenmek insanı motive ediyor ama herkes motive olmak için bu yolu seçmiyor. başımda durmadan kendimi frenlemek zorunda olduğum, "bunu da mı duymadınız aq" cümlelerimi yutmak zorunda kalacağım birileri olursa tam bir kabus olur. gerçi içimden bir his startuplar dışında iş yaşamı genelde bu şekilde diyor.
    merak ediyorum acaba böyle şeyleri mülakatta nasıl sorabilirim? "sizde her ilerlemeye engel olmaya çalışan mal çalışanlar var mı?" diyemem ya.. sanırım biraz görüşmede amirleri tartmaya çalışacağım, biraz da teklif gelirse linkedin hesabından o şirkette çalışan elemanların profiline falan bakarım. hollanda'ya gidebilirsem ilk beş yıl da o şirketin kölesi gibi bir şey olacağız mecburen. bakalım... öğrenmeye devam

    28.03.2020 editi:
    kaggle'daki ev fiyatlarını tahminden sonra bir tane de classification problemi çözmeye karar verdim. kaggle'dan yaptığım araştırma sonucu titanik competition'ı buldum. yolcu bilgilerinden yolcu ölecek mi yoksa kurtulacak mı bulmamız lazım. aslında önceki problemden daha basit gibi gözüküyor. fakat çözerken açıkçası zorlandım. bir sürü ön görmediğim küçük hatalarla karşılaştım. python biraz garip. bazı anlamsız mantıksızlıklar var.
    neyse bu ikinci problemi de yükledim ve ilk %28 içerisine girdim. %78 doğru tahmin etti modelimiz.
    bu aralar biraz çalışma dolayısıyla yorulmuş durumdayım. ama ilerlemekten başka yapacak bir şey de yok.

    29.03.2020 editi:
    birliklerimiz ilerleyişi sürdürüyor. microsoft'un bulduğu bişeylight algoritması varmış. xgboost'a göre çok hızlıymış. kategorik verileri dönüştürmeye gerek kalmıyormuş. onu şimdi çözmeye çalışıyoruz. titanic probleminden sonra kaggle'da biraz araştırma yaptım. 1 ve 0'ları tahmin edilmesini isteyen yapay bir data seti üzerinde çalışıyorum. ilk denemelerde epey başarı oranı çıktı. şimdi hyperparameter ile sonucu optimize etmeye çalışıyoruz. öte yandan kedilerle ilgili başka bir probleme geçtik. burada tüm parametreler kategorik. şu lightning zımbırtısını tam denemelik problem.. resident evil2 remake'i bitirdim. ada'nın peşinden salak gibi hive'a inen leon'a bir dolu küfür ettim.

    04.04.2020 editi:
    çalışmalar devam ediyor. house price, titanic, kediler ve sklearn problemlerini yeni öğrendiğimiz daha gelişmiş kodlarla tekrar çözmeye çalışıyoruz. yeni kodlar taş çağından tarım devrine geçiş gibi. önceden tek tek manuel olarak üzerinde işlem yaptığımız verileri artık otomatik döngülerle işlemeye başladık.
    bugün titanikle ilgili bir kişinin çözümünü inceledim. çok fantastik kodlar var. bir de bunları öğrenmek gerekecek. uyguladığı kodlar sonucu gelen sonuçlara göre titanikte fakirler ölmüş zenginler kurtulmuş. erkekler ölmüş kadınlar kurtulmuş. öte yandan yaşlılar ölürken en çok 0-16 yaş arası kurtulmuş.

    21.04.2020 editi:
    4 nisandan beri edit yapmamışım. bazı arkadaşlar mesaj attı geri dönüş yapamadım kusura bakmayın.
    4 nisandan beri birliklerimiz rusya stepleri içerisinde ilerlemeye aralıksız devam ediyor. uyku düzenim tamamen karambol olmuş durumda. house probleminde ilk yüzde 12, titanic'te ilk yüzde 8'e girmeyi başardık. çok kaleler ele geçiriyoruz, fakat her ele geçirdiğimiz kale sonrası aslında düşmanın daha çok kalesi olduğunu farkediyorum.
    ilerlemekten başka çare yok. 20 marttan beri bu işe 116 saat 30 dakika harcamışım. yeni bir cover letter yazdım. güzel oldu gibi. artık iş başvurularında bunu da yollayacağım. şimdiye kadar 6 tane yere başvurdum. biraz az oldu. bunu yakın zamanda 12'ye çıkarmam lazım.

    23.04.2020 editi:
    20 marttan beri 129 saat 30 dakika çalışmışım. aslında son günlerin ortalaması geçmişteki günlerden yüksek. ama daha fazla çalışmaya başladıkça sanki daha az çalışıyormuşum gibi hissediyorum. 7. şirkete başvurdum. hemen otomatik mail attılar 2 hafta içinde sana geri dönüş yapacağız diye.
    ilk defa kendimi anlatan 3-4 dakikalık bir video çekip alıştırma yaptım. biliyorum ki telefonla arayıp anlat hele deseler kilitlenip kalacağım. her bir iki günde bir, bir alıştırma videosu çekersem temas kurduğumda akıcı bir şekilde konuşabilirim. aslında günlük dil olarak ingilizce kullanıyorum ama telefonda sanki takılırım gibi hissediyorum.
    bu arada spark olayına bir giriş yaptım. büyük veri için spark gerekiyormuş. bir kurup iki üç deneme yapacağım.

    29.04.2020 editi:
    20 marttan beri 150 saat 30 dakika çalışmışım. spark giriş eğitimi bitti. acılı bir süreçti. basit basit şeyler için 50 tane hata aldım uğraştım. ama temel olarak spark nedirmiş, yenir mi içilir mi anlamış oldum. yaptığım analize göre her 10 iş ilanından 3 tanesinde apache spark istiyorlar. kısaca spark denilen nesne büyük miktarda veriyi analiz etmeye yarayan lokale veya başka bir yere kurduğun, spyder arayüzü ile kodlarını çalıştırabildiğin nane. farkı kodlarının biraz değişik olmasından geliyor. bir süre spark ile ilgili bir şey çalışmayacağım.

    şimdiye kadar hollanda'da 9 yere başvurdum. çoğundan ret içerikli cevap geldi. helal olsun adamlara. en son bir online satış şirketinden şöyle bir cevap geldi.

    we’ve made our shortlist for the position of data scienist search. unfortunately, your name isn’t on that list. we have other candidates who match the profile even better, for example based on recent work experience in similar positions and industries. this obviously does not diminish your own qualities and enthusiasm!

    you have our sincere thanks for the time and effort you put into your application. we also invite you to keep following us on linkedın.

    for now; thanks again for your interest and perhaps until next time!

    aklıma nedense şu thy'deki kadının yöneticilik listesini göndermişler!!!. ben ismim listede yok deyişi geliyor. kimsenin aklına kaizenüberalles bizim adamımızdır demek gelmemiş mi ya diyesim geliyor swh.

    30.04.2020 editi:
    20 marttan beri 152 saat 40 dakika çalışmışım. son çalışmada çok kısa sürede yüksek tempo ile çok ilerledik. şimdiye dek python çok bilmeden python üzerinde çalışılabilir diye düşünüyordum. sanırım python'ı da bilmek gerekiyor. daha önce görmediğim bazı sentaxları kullanmak zorunda kaldım. ingiliz redcoatların açtığı yaylım ateşi üzerine yürüyen prusya piyadesi gibiydim.

    her zaman disiplin, düzenli uyku saatleri, çok çalışma ve verimli çalışma övülür. iyi de bunlar bir biri ile çelişen istekler. evet bir önceki oturumda çok enerjik ve verimli çalıştım. ama çalışma bitince çok yoruldum. böyle çalışma oturumlarının sonunda zihnimde psikolojik bir acı hissediyorum. uyumamı engelliyor. uyuyamayınca da bütün uyku düzeni allak bullak oluyor. bu acı baş ağrısı gibi değil, sanki dayak yemişsin de daha hiç bir şey düşünmek istemiyormuşsun gibi.
    böyle durumlarda dikkat ettim açıp dota yerine resident evil falan oynuyorum. niye? sanki korkunca stres seviyem yükseliyor da bir müddet acıyı unutuyorum. evet acıyı unutmak için stres seviyemi yükseltiyorum.

    diyorlar ya çok çalış ve uyku saatlerin düzenli olsun. yalan dolan. ya çok çalışacaksın ya da uyku saatleri düzenli olacak. ya o ya o... belki de bu yüzden zihnin kullanılması gereken bir işte insanlar sebat gösterip çok çalışamıyor.

    aq böyle kavramlar için dilde kelimeler olmaması çok garip. oysa ki benden önce milyonlarca insanın aynı şeyleri yaşamış olması gerekiyor. bunlar kelimelere dökülseydi google'dan bu acıya ne iyi gelir diye aratırdım. şimdi ne diyeyim ders çalıştıktan sonra oluşan hiç bir şeye dikkat etmemeye insanı iten psikolojik acı mı diyeyim aq.

    --- spoiler ---

    mayıs - haziran- temmuz 2020:
    --- spoiler ---
    05.05.2020 editi:
    20 marttan beri 169 saat 50 dakika çalışmışım. yüksek lisansta master projesinde sentimental analizi yaparken bile 160 saat harcamıştım, böylece sentimental analizimden daha fazla çalışmış bir duruma gelmiş oldum. umarım 300 saatleri de görürüm.

    ilk kaggle kernel'imizi yükledik. kernel dediğimiz şey bir problem hakkındaki notlar ve kodlar. millet direkt o kodları çalıştırabiliyor. problemde oyun satış rakamlarını inceledik. görselleştirmelerini yaptık. japon pazarı kuzey amerika ve avrupa'ya göre farklar barındırıyor. en çok piyasaya aksiyon oyunu çıkıyorken en çok platform oyunu satıyor. diablo, dota, sims falan unutun gitsin, süper mario denen garabet oyun ve ardılları tüm piyasayı domine etmiş benim bu kadar basit bir bilgiden bu yaşıma kadar haberim yoktu.

    iş başvuru sayım 11'e ulaştı. bir şirket yine şakkadanak ret mailini gönderdi. ulan 10 tane ilanda en azından 1 firma şöyle bir telefonla arar, skype yapar da o seviyede ret verir diye düşünüyordum. gerçi cv de çok kötü değil niye böyle oluyor?

    bir de hollanda pazarında 1 ilan ingilizce ise belki 7 ilan dutch dilinde. bir kaç ay önce hafiften dutch öğrenmeye başlamıştım ama şimdi machine learning öğrenmeye başlayınca bu dil işini rafa kaldırmıştım ama tekrar mı başlasam?

    bir de hollanda'da bir iş ve işçi bulma kurumu bulmam lazım. onlara kaydolayım da bana yol göstersinler. bunlara ne deniliyor, recruit agency mi?

    dün 1 milyonluk bir veri ile uğraşıyorduk. missing valueları most frequent metodla doldur dedik bilgisayarı açık bırakmıştım bir günde bulamamış hala. nasıl iştir bu?

    21.05.2020 editi:
    20 marttan beri 218 saat 30 dakika çalışmışım. toplam 16 işe başvurdum hiç biri daha mülakata çağırmadı. en son girdiyi 5 mayısta girmişim, o zamandan beri ne yaptım acaba?
    5 mayıstan beri bir milyon satırlık veri ile uğraşmışız. ilk yüklediğimizde yüzde %88'lere girmiştik. o rakamı daha iyi seviyelere getirdik ama yarışma kapanmış. %88 bir kara leke olarak profilimizde kalmış oldu lol. büyük veri söz konusu olunca bazı trickler uygulamanız gerekiyor bunları az çok öğrenmeye başladık veya en azından öğrenmemiz gerektiğini öğrenmiş olduk.
    sonra rusya'daki shoplarda ne satalım gibi bir problem geldi. bu problemi çözerken nedense kendimi bir rus mafyasına çalışıyormuş gibi hissettim. rusya'nın geneline dağılmış dükkanlar ve bunların geçmiş verileri var. bu dükkanlarda ne satarsak profiti maksimize ederiz sorusu soruluyor.
    bu problem zor ama keyif aldığım bir problemdi. çünkü data seti hazır verilmemiş gerçek hayattaki gibi database'den çekilmiş gibi önümüze gelmişti. o yüzden önce biraz sql tarzı tablo falan birleştir vb. işlemler yaptık. problem hakkında en azından kalem de oynatabildik, fikir de yürütebildik. fakat çok da aşırı zaman harcamadan hazır çözümler üzerinden ilerledik. bu çözümlere bakınca "haaa zaman serisi diye bir şey varmış onu da öğrenmemiz gerekiyormuş" tarzı bir söylem ortaya çıktı. buradaki "haaaa!" ünlemi deyince aklıma hep "bu yüzük mü?" youtube videosundaki elrond komitesinin bir ara ortaklaşa çıkardığı "haaa" sesi aklıma geliyor. hazır çözümlere bakıp da kodları anlamayınca tam "lanet olası bir yüzük bulmuşlar" diyecekken "lanet olası şu kodlara bak" falan diyorum. data science'a 220 saat çalışmışsam bunun en azından şu "bu yüzük mü?" videosunun replikleri aklımdan geçiyordu.

    daha sonra birleşmiş milletlerin bir problemine çalıştık. veri setinde 79 tane farklı tahmin problemi vardı. önce "mehehehe bunları bir for döngüsüne koyar hepsini tahmin ettiririz nolcak" diyorduk ki zaman serileri konusunda biraz videolar izleyince her zaman serisine farklı bir yaklaşımda bulunmak gerektiğini farkederek olay yerini terk ettik. aslında arima modeli falan süper bilsek her serinin özelliklerini matematilsel hale getirip bunlar için ortak bir fonksiyon yazıp her seriyi bu fonksiyona sokabiliriz ama arimayı neyi daha çok bilmiyoruz. şimdilik taktiksel olarak ricat ettik.

    şimdi h1n1 diye bir aşı data setinde stack yöntemini uygulayıp hali hazırda yüksek olan puanı arttırmayı amaçlıyoruz. esas amaç şu stacking denilen metodu daha iyi öğrenmek. benim kafada bu metod bir kez uygulamış olmamıza rağmen çok flu. stack deyince aklıma dota'da supportların jungle'da creep stacklemesi geliyor.

    bu arada uyku düzenim biraz düzene girdi. gece uyuyabilmek çok hoş bir şey. sanırım bir kerede 3 saat ve fazlasını çalışırsam gece uyuyamıyorum. 2 saat çalışıp 2 saat ara verip tekrar 2 saat çalışırsam uyuyabiliyorum.

    25.05.20 editi:
    20 marttan beri 234 saat 50 dakika çalışmışım. toplam 16 işe başvurdum hiç biri daha mülakata çağırmadı. bir arkadaşın önerisi üzerine coursera'da bedava kurs alıp onların sertifikalarını biriktireyim diye bir yola girmiştim. dün ilk sertifikamı aldım. 3 haftalık kursu 3 günde bitirdik. kurs, zorluğu giriş seviyesi olan yarısı hikaye olan bir kurstu ama bir şeyler de öğrenmedim değil. ibm'in kursu olması nedeniyle ik'cıları geçmekte kullanılabilir. murtaza heidinger hoca durmadan data scientist olmak için skiller önemli değil merak önemli deyip durdu. buna katılmıyorum. yok öyle bir dünya. önemli olan skiller, toollar falan filan. kimse meraklısın diye sana yıllık 100.000 bin dolar vermiyor.

    bu aralar phantom assassin, faceless void ile safelane'de oynuyorum. ara sıra kaybedilmiş maçları döndürüyorum keyifli oluyor. genelde hard carry performansım düşüktü önceden. bir arkadaşın github hesabı hakkında tavsiyesi oldu. gelecek günlerde ara sıra github'a yaptığım dosyaları atmaya çalışacağım.

    26.05.20 editi:
    20 marttan beri 242 saat 20 dakika çalışmışım. toplam 16 işe başvurdum hiç biri daha mülakata çağırmadı. uzun süredir github hesabım atıl şekilde duruyordu. bugün ilk defa atıl duran github hesabıma bir proje attım. diğer projeleri de böyle böyle işleyerek atmam gerekiyor. sonunda sinir ağlarına giriş yaptım. coursera'da yapay sinir ağları ile ilgili intermediate bir derse başvurdum 15 gün sonra o sertifika programına da başlayacağım.

    01.06.20 editi:
    20 marttan beri 260 saat 50 dakika çalışmışım. toplam 17 işe başvurdum hiç biri daha mülakata çağırmadı. github'da önceden yaptığımız bir kaç proje birikmeye başladı, hoş oldu. sinir ağları ile bir problem çözdüm. problemi ikinci defa çözüp drivendata adlı yarışma sitesine yüklediğimde aldığım skorun 2 puan altını aldım. bu nasıl oldu ya? kod aynı kod.. elimdeki dosyalar çok karışmaya başladı. hangi dosya hangi versiyon. artık her dosya yaratışımda hepsine bir dosya açıklaması yazacağım ve her yeni değişikliği değişiklik ufak olsun büyük olsun ayrı bir versiyon adı ile kaydedeceğim. aslında programlama yaparken böyle çalışıyordum. data science konusunda da böyle bir disipline geri dönmek gerekiyor.

    bu aralar internet vasıtasıyla bu konuda birikim yapmış kişiler ile görüşüp sorular soruyorum. bu şekildeki oturumlar kafadaki soruları yanıtlamak adına iyi oluyor.

    bu aralar hollanda yanısıra almanya'da da mı iş arasam diye düşünmeye başladım. ama bunların da göçmenlik kurallarını araştırmak gerekiyor. teknik bir olay yerine şimdi oturup yasa kural araştırmak çok angarya geliyor.

    05.06.20 editi:
    20 marttan beri 279 saat 20 dakika çalışmışım. toplam 18 işe başvurdum hiç biri daha mülakata çağırmadı. bugün ilginç bir olay oldu. bir şirket mail atıp ek sorular sordu. başka bir şirket ön elemeyi geçtiniz şimdi bir üst makam cv'nize bakıyor dedi. soru soran şirket için cevap dokümanı hazırladım. bazen yazdığım cevaplara bakıp "vay canına ben mi yapmışım bunları?" diyorum. bir türlü inanamıyorum. ama metin olarak yazınca da hakkaten yapmışım demek ki diyorum. yazılım projeleri mi yönetmemişim... kendi başıma bilgi sistemleri mi yazmamışım... şirket için data pipelar mı inşa etmemişim... biri bana böyle cv açıklaması verse, "adam bu kadar detaylı yazdığına göre %70'i yalan olsa bile %30'unda bile tecrübe var" derdim. iyi ki direkt arayıp telefonla ne yaptın anlat demiyorlar. "iyi ya nolsun idare edioz" derdim.
    şimdi 19. başvuruda 2 kez karşı taraf duraksayıp tereddüt ettiyse 40. başvuruda tökezleyecek, 60. başvuruda afallayacak, 80. başvuruda son anda kurtulacak, 100. başvuruda ise beni işe almak zorunda kalacaklar diye düşünüyorum. bakalım mermer ile savaşmaya azimle devam edeceğiz.

    08.06.20 editi:
    20 marttan beri 292 saat çalışmışım. toplam 18 işe başvurdum hiç biri daha mülakata çağırmadı. bir önceki sefer bahsettiğim ek açıklama isteyen şirketin ik'cısı mail attı. şahsen cv'nizden çok etkilensem de şirket illa ki faang şirketlerinde çalışmış ve arama motoru geliştirmesinde çalışmış veri bilimcisi istiyor demiş. faang şirketleri dediği amazon, facebook, netflix falan. bence fena bir sonuç değil. en azından düşman ile çarpışarak geri çekilebilecek kadar kendimizi geliştirmişiz diye düşünüyorum. ,

    bu aralar kaggle'dan nlp problemi çözmeye çalışıyorum. nlp dediğimiz natural language processing yani dil işleme. atılan felaket tellalı tweetlerin gerçekten felaket haberi mi verdiği yoksa felaket kelimelerini mecazi anlamda mı kullandığını anlamaya çalışıyorum. bir taraftan nlp konusunda biraz ilerleyeyim diyorum. ama ingiltere dışındaki her ülke kendi dilinde nlp'ci aramaz mı? mesela almanca bilmeden almanya'daki bir işte nlp'ci olarak çalışabilir miyim? bundan tam emin değilim...

    09.06.20 editi:
    20 marttan beri 297 saat 30 dakika çalışmışım. toplam 18 işe başvurdum hiç biri daha mülakata çağırmadı. kaggle'daki "disaster or not?" nlp problemine devam ediyorum. ilk adımda çok basit bir model oluşturup yükledim ve ilk %40'a girdim. bence çok iyi bir sonuç çünkü yüklediğim model çok basitti. belki tek yaptığım noktalama işaretlerini silmekti. sonra bu konuda neredeyse here satırı doğru bilmiş bir arkadaşın çözümünü taklit ettim. glove diye bir nane öğrendim. eldeki veri seti ile bir sözlükteki kelimeleri karşılaştırıp senin veri kümendeki kelimelerin yüzde kaçının sözlükte bulunduğunu söylüyor. daha doğrusu yüzde kaçının muhtemelen yanlış yazıldığını buluyor. sen de o rakamlara bakıp veri temizleme yapıp doğru yazılmış kelime sayını arttırıyorsun.
    bir kaç saatlik çalışmanın sonunda şunu keşfettim, zaten yanlış yazılmış kelimelerin çoğunu noktalama işaretleri ile bitişik yazılmış kelimeler oluşturuyormuş. ben de ilk denememde noktalama işaretlerini silerek kat edilecek mesafenin çoğunu zaten kat etmişim. ilginç bir sonuç.

    uyku düzenim tekrar cortladı. geceye kadar veri bilimi çalışıyorum. çalışabilmek için kahve içiyorum. kahve içince gece uyuyamayıp dota oynuyorum. sabah uyumaya gidiyorum ama 8 saat uyuyamıyorum. anca 3-4 günde bir çok çöktüğüm için kahve içmiş olsam da gece 23:00 gibi uyuyorum. ama 3-4 günde bir... gerçi çok da şikayetçi değilim.
    ilginçtir, uykumu tam alıp kendimi zinde ve mutlu hissettiğim günler ders çalışmak daha zor oluyor.

    10.06.20 editi:
    20 marttan beri 303 saat 30 dakika çalışmışım. iş konusunda bir gelişme yok. nlp'de bert model diye bir yere geldim. neymiş bu bu bert model diye kodlara dalıyorum. bölüm sonu boss canavarına vuruyorum vuruyorum ölmüyor bir türlü. şimdilik geri çekildik. potion alıp tekrar geleceğiz.

    bugün cv'yi kontrol ederken aslında giriş yazısında iki tane yazım hatası olduğunu farkettim. off 18 yere de bunu göndermişim kötü oldu.

    13.06.20 editi:
    20 marttan beri 314 saat 40 dakika çalışmışım. toplam 19 işe başvurdum hiç biri daha mülakata çağırmadı. yalnız son başvurduğum linkedin profilime bakmış. eh çok yavaş ve yetersiz olsa da yavaş yavaş bir kıpırdanmalar oluyor gibi.

    nlp yaparken tf idf haline getirilmiş bir matrix'e diğer sayısal featurelar nasıl eklenir? belki 3-4 saat bunun mücadelesini verdim. neler denemedim ki? github'a yüklediğimde görsellik olsun diye jupyter'de çalışıyorum ama yemişim jupyter'i. iki veri karşılaştıracağım yok kod yaz. yok yazdığın koda ek kod ekle ki özet satırları değil tüm satırları göstersin. yok treshold infinitive deyince kernel kilitlensin. aldım tüm kodları tekrar spyder'a taşıdım. iki tıklıyorsun verinin üzerine mis gibi excel gibi görüyorsun.

    neyse araştırdığım twittler'de öyle featurelar buldum ki hakkaten iki sınıf arasındaki dağılımı çok farklı. problem şu: milletin attığı twittler'in felaket twiti olup olmadığını anlayacağız. mesela noktalama işareti çoksa büyük ihtimalle felaket twiti. çünkü haber ajanslarından alıntı yapılmış oluyor twit. ama bu ve bunun gibi yarım düzine feature'ı tf idf matrixi ile concat eyleyip modele soktum. belki 3-4 saat bunla uğraştım. sonuç bir gram ilerlemedi. bu nasıl iş böyle ya?

    daha sonra düz yapay sinir ağından daha verimli olduğu söylenen lstm ve bert modeller var ama mantık olarak bu yeni eklenen featurelar ile düz sinir ağının da iyi sonuç vermesi gerekirdi...

    16.03.20 editi:
    20 marttan beri 329 saat 50 dakika çalışmışım. toplam 19 işe başvurdum hiç biri daha mülakata çağırmadı.
    daha önce glove diye bir kütüphaneden bahsetmiştim. kendi data setimizdeki kelimeleri glove kütüphaneleri ile karşılaştırıp kendi kelimelerimizin yüzde kaçının glove sözlüğünde olduğunu bulmuştuk. yani kelimelerimizin aşağı yukarı yüzde kaçının anlaşılabilir kelimeler olduğunu... meğerse glove kütüphanesinin tek hüneri bu değilmiş. data setimizi tf-idf fonksiyonu gibi vektörel hale getirmeye de yarıyormuş. hem de her kelimeye tam 100 tane diğer boyut ekliyor. yani diğer kelimeler ile bu kelimenin ne kadar yakın olduğu bilgisini de modele veriyor.
    yetmedi modelde lstm de kullandık. lstm denilen şey o kelimeden önce gelen ve sonra gelen kelimeleri de göz önüne aldığı için bir hafızaya sahip olduğu söyleniyor. rivayetler bu yönde. güneş doğarken gerekli büyülü sözleri tekrar ettik. pentagram çizip tanrıça athena ismine zeytinyağı yeyip kafesteki bir baykuşu doğaya saldık. hiç bir etkisi olmadı. accurancy sonucu hala %78-%80 bandında dolaşıyor.

    model bir twitte yandı, bitti, yıkıldı, hortum çıktı gibi kelimeler geçiyorsa bunun felaket haberi olduğunu çok iyi tespit edebiliyor. ama negatif kelimelerin geçtiği bireysel bir cümle veya negatif kelimelerin geçtiği aslında pozitif anlama sahip bir cümle görünce model sapıtıyor. mesela "bugün dehşet iyi bir gün. sınav patladı, endişe yok oldu" cümlesini felaket cümlesi gibi algılıyor model.

    18.06.20 editi:
    20 marttan beri 340 saat 50 dakika çalışmışım. toplam 20 işe başvurdum hiç biri daha mülakata çağırmadı.
    kaggle'da uğraştığımız problem hakkında ilginç bilgilere ulaştık. twittler felaket twiti mi değil mi? aslında daha denenecek yollar var cephanemiz tükenmedi ama bu problemde ne denediysek 0.8 puan barajını geçemedik accuracy dalında. 1.0 yapanlar var. bir bunların çözümlere bakıyorum bir bizim denediğimiz yollara bakıyorum. günlerce aklımda "lan bunlar neyi bu kadar iyi yapmışlar ki 1.0 almışlar?" sorusu yankılandı durdu. biraz leaderboard datasını inceledim ve burda bir tuhaflık var dedim. bunla ilgili discussionlara bakınca problemin sonuçlarının sızdırılmış olduğunu farkettim. demek bu yüzden leaderboardda sıralama 0.85'den bir anda 1.0'e zıplıyor.

    ilerlemekten başka çare yok ama bu kadar uğraş verip sonuç alamamak değil ama "iş bulsam sanki ne olacak?" sorusu beni düşündürüyor. ne çalıştığım şirket, ne alacağım title, ne kazanacağım para beni pek motive etmiyor. böyle de bir sorun var. aslında bu yolda tek ilerleme gerekçem bir önceki iş yerindeki gibi insanlıktan nasibini almamış puşt yöneticiler ile bir daha çalışmayayım. çalışırsam da hemen istifa edip çok kalife olduğumdan başka bir yer bulayım. teknik anlamda o kadar kendimi geliştireyim ki insanlarla daha az sosyal mücadeleye gireyim.
    öte yandan beni hep birlik beraberlik içerisinde bir sosyal grupla bir amaç için çalışmak motive ediyor. bireysel çıkarlar için koşmaya pek istekli olmuyorum. öte yandan genellikle insan sayısı arttıkça bir grupla ilgili fikirsel çelişkilerim de geometrik şekilde artıyor bu yüzden de çok aşırı bireyci takılıyorum. grubun etiğine ve akıl yürütmesine güvenmiyorum. bunlar ne ipe sapa gelmez istekler ben bunları nasıl bir tek potada gerçekleyeceğim?

    belki iş bulup veri bilimi mesleğinde ilerleyince o konuda bir guild kurarız. mageler falan gelip üye olur. pratik sahasında fireball falan atarlar. türkiye'den eleman alıp yetiştiririz. üniversitede kurup arkadaşımla birlikte geliştirdiğim satranç kulübü (satrancı çok fazla sevmem) en disiplinli, kalite miktarı en yüksek organizasyon olmuştu(bana göre). yaptığımız bir panelde katılımcıya vereceğimiz çiçeğe, klima kumandasının kimde olacağına kadar planlama maddelerini şemalara çizip neredeyse murfi kanunlarının gerçekleşme oranını yüzde 0'lara yakın bir noktaya çekmiştik. bir önceki sözde çok fiyakalı işimdeki çok eğitimli yönetici de planlama konusunda kervan yolda düzülür falan diyordu. isteğim o ki bir daha böyle tiplerle aynı yerde bile olmayayım.

    24.06.20 editi:
    20 marttan beri 360 saat 05 dakika çalışmışım. toplam 20 işe başvurdum hiç biri daha mülakata çağırmadı.
    almanya'da bir insan kaynakları şirketi buldum. bize 100 dolar verin hem cv gibi konularda yardımcı olalım hem de cv'nizi 40 farklı insan kaynakları şirketine yollayalım diyorlar. böyle bir hizmet alabilirim aslında ve almam da gerekecek gibi duruyor. ama almanya'nın yeni göçmen yasası hakkında ilk önce tam bir araştırma yapıp almanya'ya gidebileceğimden emin olmam gerekiyor.
    bunun hollanda versiyonunu arıyorum ama bulamıyorum. orada insan kaynakları şirketleri var. her halde önce cv gönderiyor sonra iş bulunursa para alıyorlar. şöyle bir site buldum. hollanda'daki insan kaynakları şirketlerinin sıralı tam listesi:
    https://www.iamexpat.nl/…dutch-recruitment-agencies

    29.06.20 editi:
    20 marttan beri 399 saat 05 dakika çalışmışım. 22 işe ve 6 insan kaynakları şirketine başvurdum hiç biri daha mülakata çağırmadı.
    coursera'da deeplearning.ai'nin üç haftalık improving neural networks kursunu 1 haftada bitirdim. biraz zorladı ama bitti. daha çok neural networklerin teorik kısmı ile ilgili bilgi veriyor. verdiği her bilgi kafamda kalmadı ama bir çok yeni bilgi de öğrenmiş oldum.

    paraya kıyıp linkedin premium hesabı aldım. bir işe kaç kişinin başvurduğu gibi ilginç bilgileri de veriyor şimdi linkedin. ilk başta verileri görünce biraz moralim bozuldu. ben sanki sadece kendim işe başvuruyor gibi düşünüyordum oysa başkaları da başvuruyormuş. lol

    öte yandan ilginç bilgiler de var. hollanda'da bir ds işine 100-150 müracat oluyorsa kanada'da bu rakam 400'leri rahat buluyor. hollanda'da dutch diliyle yazılmış ilanlarda ise başvuru acayip düşük miktarda. 10-20 kişi. ya hollandaca işe girmeye çalışanlar linkedini daha az kullanıyor ya da hollanda'nın yerli nüfusunda ciddi ciddi işe talep çok az. lan bu kadar data science kasacağımıza acaba 1-2 ay hollandaca kasıp 1-2 kur yükselip ordan mı şansımızı denesek diye düşünmedim de değil. tabi her hollandaca ilan veren sponsorlu firmalar listesinde değildir ama bazıları da o listededir. hollandaca dediğin zaten ingilizce ile almancanın kırması bir dil. çok az beginner olarak biliyorum. valla ilginç bir fikir...

    bunun yanında teknik alanda rotayı tensorflow'dan pytorch diye bir kütüphaneye çevirdik. şimdiye kadar yaptığımız örneklerde de ilginçtir neural sinir ağları pek beklediğim etkiyi göstermedi. çoğu zaman random forest gibi klasik modeller daha iyi sonuç veriyor.

    bunun dışında cv konusu da üzerine çok kafa yorulması gereken apayrı bir alan. yavaş yavaş imaj inşa etmek gerekiyor. aslında zaman olsa evren yaratma konusunda başarılıyımdır. yarattığım evren kendi içinde çok tutarlı olur. eğer yeteri kadar zaman verilirse 10 numara bir imaj pazarlayabileceğimi düşünüyorum. ama daha çok yol var. öte taraftan da teknik konularda çalışma yapmak yerine teknik olmayan taraflara zaman tahsis etmek çok motive edici gelmiyor.

    cv'de bakıyorum da hala ufak tefek yazım yanlışları buluyorum. önceden cv iki sayfaydı. şimdi yaptığım yazılım ve data science projelerini ekleyince 4 sayfa oldu. tabi yazılım projeleri aslında önemli olsa da data scinece projeleri en fazla 20-30 saat harcadığım kaggle yarışmaları. bunları cv'ye koymalı mıyım? incelediğim web sayfaları cv 2 sayfa olmalı ve böyle çok detay içermemeli diyor. ama öteki türlü de sadece iş deneyimi ve okduğum bölüm ile insan kaynakları elemesini de geçemiyorum ki. bu konuda kararsızım.
    kısa ve öz bir cv mi olmalı yoksa beton döker gibi bir holywood filmi yapar gibi orada ilk elemeyi geçmek için 20-30 saat harcadığım projeleri bile yazmalı mıyım?

    şöyle bir durum var. insanoğlu çok bilinçli bir canlı değil. kıyaslamayı çok yüzeysel yapıyor. sokrates insan zihni durmadan yanılsar diyor. oradaki adamlar belki sadece keywordlere bakıp insan seçiyorlar. yaptığım cila biraz fazla parlak gibi dursa da yalan değil. o yüzden sanırım bu projeleri de biraz sadeleştirmekle beraber cv'de tutabilirim sanırım. öte yandan sadeleşme adına şöyle bir şey yapabilirim. 3 ay önce yokluktan yazdığım maddeler vardı. mesela udemy'den borsa teknik analiz sertifikası almışım bunu kaldırabilirim. öğrencilik dönemi kulüpçülük titlelarım çok parlak. ama bunu kaldırabilirim. hobi kısmını kaldırabilirim.
    ulan bu hobileriniz önemli, kulüpçülük işleriniz önemli geyiği kadar da yalan bir şey görmedim. hiç de önemli değil. yani önemlidir de dıdısının dıdısının dıdısı da eşit olacak ki orada bir fark yaratabilir. tabi ben kulüpçülüğü cv'ye yazmak için yapmadım ama cv'ye yazmak amaçlı yapsam kesinlikle atılan taş ürkütülen kurbağaya değecek bir iş değil.

    bana öyle geliyor ki üç ay sonra halen iş bulamamış halde olursam ki muhtemelen öyle olacağım, bu cv ve hikaye işini o kadar zırva bir hale getireceğim ki önceki işte tamamen data scientist olarak çalıştım çok da iyi çalıştım gibi bir senaryo uyduracağım. fakat uydurduğum hikayeye çok emek harcadığım ve data science işinde de teknik anlamda her geçen gün ilerlediğim için sonunda yazdığım hikaye de kendi içinde çok tutarlı bir hale gelecek ve herkes tarafından takdir görecek. okul yaşamında böyle oluyordu. ne zaman ki hayatı rasyonel bir şekilde tasvir etmekten kendimi azad edip gerçekleri hayal gücümle çarpıtmaya başlasam ödevi teslim ettiğim uzmanlar tarafından ödevim örnek proje olarak dillendirilmeye başlanıyordu. nedense yalanlar insanlar tarafından gerçeklerden daha tutarlı ve mantıklı görülüyor. aslında buna yalan da diyemeyiz. bir yalancı bir gerçeği %90 oranında çarpıtır. biz bir çok gerçeği bulup emek verip her birini %10 oranında çarpıttığımızda ortaya yalancının ürününden %80 daha gerçek ama gerçeğinden belki %50 daha yalan bir durum çıkmış olacak. kaliteli yalan emek ister, ölçülü olmalıdır. hmm.. ik'cılar platonun devlet kitabını ve decartes'in metod üzerine kitabını okuyup oradaki görüşleri yaşam stili haline getirmemişlerse 3 ay sonraki cv'm işe girmek için daha yeterli hale gelecek olabilir.

    01.07.20 editi:
    şu son bir iki gündür pek tadım tuzum yok. şöyle hissediyorum. sanırım mars'a adak adamam lazım.
    https://www.youtube.com/watch?v=o7rc_ezqxae

    02.07.20 editi:
    uzakdoğuda yaşıyorum. bugün buradaki bir recruitment agency faslı görevlisiyle konuştum. normalde hollanda'da iş arıyorum ama burda da bir şansımı deneyeyim dedim. lokal dili bilmiyorum. ingilizce pek iş yok ama şansımı denerim dedim. faslı arkadaş aslında data science, özellikle big data konusunda, mesela spark biliyorsan lokal dili bilmeni hiç umursamıyorlar dedi. big data ve spark'a vurgu yapması bir başka arkadaştan aldığım bilgilerle de örtüşüyor. o da spark bilirsen iş bulabilirsin demişti.

    05.07.20 editi:
    20 marttan beri 425 saat 45 dakika çalışmışım. recruit agency görevlisi ile görüşme biraz ilginçti. karşımda bulunduğum ülkenin iş kültürü nedeniyle aşırı kibar bir eleman beklerken buranın ortamına göre biraz agresif bir arkadaş çıktı. gerçi ajans sadece yabancılara iş bulma alanında çalıştığı için normal olabilir.
    ilk başta belirttiğim programları benim yazdığıma pek inanmadı. tek başına mı yazdın bunları, ekiptekiler yardım etmedi mi falan dedi. bu konuda hala aslında biraz tereddüt içindeyim. genelde ufak tefek dokunuşlar yaptılar. zaten 1-2 kişiydik it bölümü olarak. hatta olmasalar ben daha iyi programlar yazardım. ama yine de bir boşluk içindeyim. çünkü yazdığım bir program gerçekte hiç kullanılmadı. yazdığım ve çok kullandığım diğer programın ise daha sonra aslında proje görevleri açısından hiç gerekli olmadığının farkına vardık. böyle de garip bir proje yöneticimiz vardı. adam gerekli olmayan bir iş verip o iş için program yazmamıza neden olmuş.
    ama tabi bu kısımları anlatmama gerek yok ki. kardeşim ben bu programları yazdım mı? yazdım. tek başıma mı yazdım. tek başıma yazdım. tekrar yaz deseler yazar mıyım? yazarım. öyle çok hızlı yazamam ama yazarım.
    sebebini anlayamadığım şekilde bu konuda kendim de pek ikna olmuş halde değilim.

    bu arada cv'mi neredeyse baştan yazdım. önceki 4 sayfaydı şimdi 2.5 sayfa oldu. bence eskisine göre çok daha profesyonel hale geldi.

    bakalım neler olacak. hollanda'da da bir agency bulmalıyım çünkü iş hayatına uzak doğuda girmek istemiyorum.

    10.07.2020 editi:
    bir gaflete düşüp moskova üniversitesinden neural network kursu alma gafletinde bulundum. adamlar bir de introduction to nn demişler yanarım yanarım ona yanarım. kursun adı introduction değil "stalingrad neural network sağ kalım kursu" olmalıydı. ulan andrew diye bi adamdan da kurs almıştık. orada da formüllerin türevlerin içine giriyorduk ama o kadar zor değildi. şimdi son assignment sorularından birinde "hadi artık sana formülü vermiyoruz. en son gördüğün bir sürü farklı değişken bulunan formülün türevini kendin hesapla, bunu da kodla da görelim" dediler. kendimi stalingrad'da "al sana tüfek yok mermi ile düşmana karşı koş" denilmiş fedai asker gibi hissediyorum kendimi. besbelli ki moskova üniversitesi biz herkesi ölüme gönderelim aradan sağ çıkan bir kaç can bizimdir mantığı ile kurs hazırlamışlar.

    https://www.youtube.com/watch?v=kmjynked0u0

    18.07.2020 editi:
    20 marttan beri 476 saat 50 dakika çalışmışım. şimdiye kadar 39 yere başvurdum. aslında önceden de farkındaydım ama linkedin'de hızlı başvurma seçeneği var. artık genelde oradan başvuruyorum. daha az zamanda daha çok yere başvurmuş oluyorum.

    bu işe başladığımda 6 ay sonra ne durumda olurum acaba diye düşünmüştüm. 6 ayı mal mal sadece dota2 oynarak geçirmek de var diye düşünmüştüm. halen iş bulamadım veya bulmaya da çok yaklaşamadım ama epey yol da ilerlemiş bulunuyorum.

    geçende psikopat sovyet nöral network kursu matrislerin de türevlerini aldırma ödevi verdi. bu kurs beni çok zorluyor. tamam türev de sor ama namussuz öyle türevler soruyor ki amaç sanki türev konusunu iyi bildiğimi belgelemek. ya niye sen sinüsü kosünüsü karıştıyorsun araya? işin kötüsü oturup bu türev konusunu kurallarını da tekrar öğrenirim de iş hayatında işe yaramayacak ki bu nane? en azıdan benim gireceğim iş seviyesinde sormayacaklar bunu bana.

    son belki 10 gündür pytorch çalışıyorum. bir taraftan bigdata'cı olarak işe girmek daha kolay gözüküyor ama 500 saatin çok azını big dataya harcadım be. yani diğer alanda işe girme zorluğu x olsa, bigdatada işe girme zorluğu y olsa x - y < 500 saatte gidilen yol gibi geliyor bana.

    geçende "junior data scientist" maaşlarını araştırdım. "data scientist" maaşından çok daha az çıktı. 2500 euro nedir ya?? benim hollanda'ya gidebilmem için 4500 euro civarı maaşlı bir iş bulmam gerekiyor vize alabilmek için ki bu durum biraz hoşuma gitmedi.

    uzun bir süredir saat 15:00'de çalışmaya başlayıp 22:00'de bitiriyorum. sonra 07:00'ye kadar dota oynuyorum. 07:00'de uyuyup 15:00'de tekrar derse başlıyorum. ne sikimsonik bir yaşam biçimi. belki 1 aydır doğru düzgün dışarı çıkmadım bile. kendimi kanije kalesini müdafaa eden askerler gibi hissediyorum. istanbul'dan sadrazam denilen herif ne zaman yardıma gelecek?

    ileride 10 yıl çalışıp zengin olabilirsem sadece oturup satar mı satmaz mı kaygısı yaşamadan roman yazmak istiyorum.

    26.07.20 editi:
    an itibariyle stalingrad nöral network kursunun altıncı haftasının videolarını 4. kez izliyorum anlayabilip quiz'i geçmek için. exploding gradient problemi mi varmış ne varmış onları ve onlardan nasıl sakınılacağını anlatıyor hoca. vanishing gradient problemi vuku bulunca ne yapmak lazım onu anlatıyor. ya hollanda'daki bankalarda data scientist olarak çalışan ve computer science master degree yapmış elemanların profillerine linkedin'den bakıyorum. bu elemanlar vanishing gradient problemini nereden bilecekler ya? neyse sadece işe girmek için bu kadar detay bilgi bence gereksiz ama benim de kaliteye yönelik bir fetişim var. neyse makinalı tüfeklerin üzerine koşmaya devam. eninde sonunda almanlar yılacak.

    31.07.20 editi:
    bu yazının başına benim durumum ile ilgili bir ön bilgi editi yaptım. önceki günlerde nöral network demişim ama kursun asıl ismi introduction to deep learning olacak. evet stalingrad deep learning kursu bitti. 6 haftalık bir kurstu ve hafta başına 6-10 saat arası zaman gerekiyor demişler kurs ile ilgili. hiç gerçekçi değil. böylece temmuz ayı bitmeden cv'ye temmuz ayı tarihli bir kurs da eklemiş oldum. aslında böyle en az 2-3 kurs daha almam lazım diye düşünüyorum. ama bu kursun zorluğu, yavaş ilerlemeye sebebiyet vermesi motivasyonumu çok düşürdü. resmen bataklık arazide piyade yürüttük.

    bugün sabah saat 5 gibi bane ile oynayıp dota'da safelane'de rakibi perişan ettim. bane ile pek oynamamıştım aslında epey eğlenceli heroymuş. dışarıda hafiften yağmur yağıyordu. oyun bitince uzun süreden beri ilk defa şemsiyeyi alıp terliklerle dışarı çıkıp yürüyüş yaptım. dışarıya terlik ile çıkmak motivasyonumu olumlu yönde etkiliyor.
    --- spoiler ---

    ağustos- eylül - ekim 2020:
    --- spoiler ---
    02.08.20 editi:
    20 marttan beri 550 saat 15 dakika çalışmışım. şimdiye kadar 49 işe başvurdum. bugün eşimle dışarıda kahve içmeye gittik. maske ve yol biraz zorladı. fakat bu değişiklik iyi geldi. içtiğim espressonun etkisi ile ruh halim epey iyi durumda. herkeste aynı derecede etki ediyor mu bilmiyorum ama ne zaman espresso içsem mood'a +50 bonus veriyor.
    https://www.youtube.com/…0de0z0g241buso-xt&index=49

    geçen gün arkadaşla bakarken çok ilginç bir şey keşfettim. freecodecamp'den daha önce javascript algoritma sertifikası almıştım 300 saatlik. herhalde 100-150 saatte bitirmişimdir. siteye tekrar öylesine bir girdim. bir de baktım ki adamlar veri bilimi ile ilgili 2 tane kurs koymuşlar. çok sevindim. bu sitenin javascript algoritma kursundan epey memnun kalmıştım. şimdi 300 saatlik bu kursu da bitiririm gibi geliyor. javascripti çok bilmememe rağmen 1 ayda bitirmiştim. bakalım bu kursu ne kadar sürede bitirebilirim? tahminim 15-20 gün. bakalım göreceğiz. gerçi tüm zamanımı da kursa ayırmam ama neyse bakalım.

    07.08.20 editi:
    bu aralar bir kaç ingilizce konuşan japon şirketine başvurdum. onlardan da ret yanıtları geliyor. bu nasıl anlamadım valla. arada da linkedinden japonya'dan job haunterlar ekliyor senin için bir iş var diyorlar. en son biri daha eklemiş. bakalım bir de onla konuşacağım. bu nasıl iştir çözemedim ya.

    bu aralar pek çalışmıyorum. günlük 1-2 saat falan. neyse ya bu aralar varsın biraz az çalışayım biraz dinleneyim.

    12.08.20 editi:
    en son japonya'da bir insan kaynakları şirketindeki moğol bir hatun ile konuşmuştum. ne yalan söyleyeyim kız hoşuma gitti. baya da sıcak hatta bir derece sulu davrandı da diyebilirim. önce resmi cevaplar vereyim desem de bu resmiyetin bana pek de hoş olmayan sorular şeklinde döndüğünü görünce ben de işi bir parça belli belirsiz yavşama moduna çektim görüşme tekrar olumlu sorular ile devam etti swh.

    iş senior data scientist işiymiş. alla allah. biz junior'ını bulamıyoruz bunlar senior diye aramışlar. cv'm de gayet iş ile match ediyormuş. maaş kısmını kaçırdım kaç dediğini. kızın aksanı biraz kötüydü. sanırım yıllık 6 milyon yen dedi. aşağı yukarı heralde 55k dolara denk geliyor. eh data science işi için az bir rakam. ama evde dota oynayacağıma 1 yıl tecrübe kazanırım. veya bilmiyorum ya sanırım maaş kısmını yanlış anladım. ortalama geliri 45k olan ülkede senior data scientist nasıl 55k alıyor pek mantıklı değil.

    neyse zaten japanca istiyorlarmış. e ben japonca bilmiyorum demiştim. cv'mde bildiğim diller yazıyor. neyse böyle bir sosyallik muhabbet olmuş oldu en azından.

    japonya'da artık data science konusunda hangi işi görsem başvurayım en azından muhabbet ederim biraz aktivite olur diye düşünüyorum. nolcak ya en fazla gider işi dinler yok ben istemiyorum derim biraz bu alandaki mülakat deneyimim gelişsin.

    freecodecamp'daki data analysis kursuna devam ediyorum. sertifika için sadece iki proje kaldı. ama kurs kolpa çıktı ya swh. 300 saat diyor ama taş çatlasa 50 saatlik bir kurs bence. olsun cv'ye 300 saat diyorsa 300 saat yazarım lol.

    bu arada halen bir kafa karışıklığı yaşıyorum. bu "data science" dediğin çok farklı bir alan. data science analytics'ler var, data engineer'ler var bir de core data scientist'ler var machine learning engineer'lar gibi. ya bunların maaş skalası nedir, data science analytics'ler ile core arasında ne kadar maaş farkı var bunu hala öğrenemedim. youtubeda veri bilimi yazınca karşına gelen japon kökenli amerikalı eleman ben facebook'a junior olarak girdim 90k aldım diyor. bunun için sql bil neredeyse yeter diyor. alla allah. e aga madem sql yeterli o kadar algoritma phd falan gerekmiyor maaşlar niye yakın? valla bu konuda etrafta hep çelişkili rakamlar var. bir taraftan acaba analytics'i hedefleyip sonra mı machine learning'e geçsem falan diye buhranlarda... neyse ya taktik yok. linkedin'den iş açıklamasını bile okumadan her işe başvurmak bence daha iyi bir strateji. çünkü biraz şirketlerde çalışan elemanlara bakıyorum. hiç de öyle benden daha iyi biliyorlarmış gibi gözükmüyor. sanırım işe alım süreçlerinde çok da bir rasyonelite yok.

    17.08.20:
    20 marttan beri 605 saat çalışmışım. şimdiye kadar 60 işe başvurdum. 1 yer görüşmeye çağırdı. son başvurduğum yer tokyo'da uluslararası çalışanlı üç aylık bir data science staj yeriydi. evet adamlar gel görüşelim dediler. şu anda acayip strese girdim. gerilmiş ve hiç bir şey yapamaz durumdayım. ulan bunlara yazdığım motivasyon mektubunu hakkaten bu sefer araştırıp iyi yazmıştım. direkt geri dönüş yapmışlar.

    firmanın sahibi amerikalı. covid başladığından bu yana belki eşim dışında bir japonla bile muhabbet etmemişimdir. uzun süredir evden çıkmadan sadece veri bilimi çalışıp dota oynuyor arada bir markete falan gidiyordum. uzun süre japon görmeyince bir anda görünce biraz afallıyorum. bir de gidip şirkette bir sürü yerden insanla karşılaşacağım. önceki iş yerimde türkçe konuşanlarla anlaşamıyorken bakalım bir de yabancı dili katınca ne olacak..

    ulan her şeyi geç japonca bilmiyoruz bir de üstüne adamların ingilizcesini anlayabilecek miyim acaba? stres seviyem baya arttı.

    görüşmeden önce psikolojik olarak hazırlanmam gerekiyor. ulan aslında işe mişe girmek de istemiyorum. ne güzel dota oynayıp veri bilimi çalışıyordum ama mecburen bir girişim içerisinde yer almamız gerekiyor.

    18.08.20 editi:
    evet bugün ruh halim biraz düzeldi. ilk görüşme haberini duyunca strese girmiştim. adamların sayfasını, ilanı tekrar inceledim. aslında bu staj parasızdır demişler. yani para yok. excel'de veri girişi yaptırmayacağız stajyerlere hakikaten görev falan veriyoruz demişler ama pek güvenemiyorum. düşünüp duruyorum acaba üç ayımı bu adamlara para almadan harcamaya değer mi? yoksa zamanımı ucuza(aslında bedavaya) satıp hata mı yapıyorum?
    linkedin'den burada data scientistçi olarak çalışmış biri ile irtibat kurup soru sormuştum. adam 6 ay çalışırsan aslında daha iyi olur 3 ayda pek katkı yapmak zor olur. gerçi sen biraz deneyimlisin 3 ayda da bir şeyler yapabilirsin demişti. ulan bu beyan bana çok garip geliyor. neden 6 ay bedavaya çalışayım ya. türkiye'de bir iş veren olsa böyle saçma salak söylemlere girmesi mantıklı ama burada görüşmede sen 3 ay değil 6 ay çalış falan derlerse ne demeliyim? gerçi 6 ay bir yerde çalışırsam sonrasında kesin iş bulurum ama değerimi de bu kadar düşürmemeliyim sanırım. 3 aydan fazla çalış derlerse 3 aya kadar bedava ondan sonra yarım maaş isterim mi desem?

    yani firmada hep international elemanlar çalışıyor. belli ki ceo japonlardan pek hazzetmiyor. bunun için de para harcamaktan çekinmemiş demek ki adam. demek ki firmanın parası var. zaten firma katma değeri yüksek ürün üreten - az çalışana sahip bir firma. ama bu sayko bir yönetim anlayış ihtimalini de arttırıyor. kararsızlıklar içerisindeyim.

    ayrıca sonradan farkettim. firma sahibi amerikalı ama yunan kökenli gibi duruyor sonradan farkettim. tam da ege'de olaylar yaşanırken bakalım ilginç bir görüşme olabilir.
    ama anladığım kadarıyla firma çalışan sayısı az olduğu için biraz muhabbet havasında geçecek görüşme. hazırlıkları yapayım. ama kendimi de kimseye kanıtlamak zorunda değilim. öyle hissedince geriliyorum. biraz da aslında patavatısız konuşursam sanki daha iyi olur. tabi gerekli hazırlıkları yaparım. şimdiye kadar neye kaç saat çalıştığımı falan anlatırım.

    20.08.20 editi:
    bugün iki tane mülakattan geçtim. birincisi çok rahat iken ikincisinde ecel terleri döktüm. altı üstü staj için ama sanırım bir kaç ay çalıştıktan sonra işe alma ihtimalleri de var. bir de üçüncü mülakat varmış. tüm gücü tüketmiş durumdayım. burayı sonra yine editlerim.

    kendimi dayak yemiş gibi hissediyorum. psikolojim anca 2 gün eu4 oynarsam kendine gelir herhalde.

    21.08.20 editi:
    bugün kendimi oldukça yorgun hissediyorum. belki biraz tokyo sıcağının etkisi belki psikolojik etki. haftaya perşembe hong konglu data science takım lideri ile üçüncü mülakatı yapmış olacağım.

    düşünüyorum da dün aslında ikinci mülakat çok da kötü geçmedi. ama teknik mülakat konusunda hiç hazırlıklı değildim. sertifikaları alıp öyle cv'ye atıyordum. projeleri yapıp github'a yükleyip bir daha bakmıyordum. bu yaptıklarımın ilk kez sorgulanması beni çok şaşırttı ve şok etkisi yarattı. sanki bu yazdığım kodlar hiç kimse tarafından sorulmayacak gibi geliyordu. yani tabi ki sorulabileceğini biliyordum ama sanki sorulmayacak gibi geliyordu. mesela bir nlp kodunu açtık yarım saat ulan bu problem tam olarak neydi diye düşünüp durdum. kendi kodumun bazı kısımlarını hatırlayamadım bile. neyse ki bu kısımda şunu bu kısımda bunu yapmışız diyebildim.
    python'da bir paragraf içindeki büyük harflerin toplamının sayısını getir dedi. biraz zaman verilse ve stres altında olmasam çocuk oyuncağı(tabi google kullanarak). ama birden soru böyle gelince donup kaldım. gerçi sonra hemen google'dan bakıp yaptım ama bir iki yerde de mülakat yapan hatamı düzeltmiş oldu.

    işin diğer bir zor yanı da mülakat yapanın ne dediğini anlamaya çalışmak oldu. kafadaki işlemcinin belki %30'unu ingilizceyi anlamak harcadı. aslında herhalde öyle aksanı falan yoktu ama nedense ilk mülakatçıyı tam anlarken bu mülakatta 3-4 kere cümle tekrar ettirdim. adam problem soruyor ilk anda hiç bir şey anlamıyorum nedense 2 saniye geçtikten sonra ne dediğini anlıyorum.
    bir paragraf içerisindeki tüm büyük harfleri toplayıp bunların sayısını bastır dediğinde ilk anda "ananıskyim ne dedi bu şimdi" diye aklımdan geçti. belki de beni korkutan daha çok adamın ingilizcesini zor anlamak oldu.
    neyse zorlu bir mülakat olsa da en azından cv ve github'a attığım şeylerin tamamen kolpa olmadığını, az veya çok bu nanelerle uğraşmış olduğumu kanıtlamış olduğumu düşünüyorum. bu önemli bir nokta. birden fazla alanda kendini geliştirmeye çalışmanın dezavantajını belki ilk defa bu kadar yakından hissetmiş oldum. elimizdeki ordu hacim olarak gayet iyi durumdaydı ama senkronizsyon, ahenk, disiplin açısından çok da hakim değildik hissiyatı yaşadım.

    bu arada bir ara bu büyük harflerin gigabaytlarca veri olduğunu düşün. nasıl daha hızlı işlerdin gibi bir soru sordu. nasıl aklıma geldiyse biraz tekleyerek de olsa python veri değişkenleri veriyi 32 byte'lık kalıplarda tutuyor, numpy ise 8 bitlik kalıplarda tutuyor. bu yüzden verinin veri yapısının değiştirmeliyiz dedim. bunu dediğimde vay aq bu nerden aklıma geldi şimdi diye bir mutlu oldum. gerçi bunu da diyebilmem biraz sürdü. byte neydi bit neydi? 1 byte mı 8 bitti? kalıp ne demekti? gerçi bu cevap da tatmin etmedi. haa doğru ama numpy kullanmanın yasak olduğunu farzet dedi. muhtemelen oradan bigdata kısmına atlayacaktı ama başka bir cevap da o an aklıma gelmedi. hmm algoritmayı değiştirmemiz gerekir dedim. bu yazdığın algoritmayı nasıl değiştirirdin dedi. sonrası sessizlik.

    evet sonuç olarak birliklerimizi bir prusya birliği gibi yürütebilmemiz için sanırım böyle 5 tane falan teknik mülakat deneyimi edinip hazırlanmamız gerekiyor.

    27.08.20 editi:
    bugün stajyerlik için başvurduğum şirkette üçüncü mülakatımı yaptım. karşımda hong konglu data science takımının lideri ile orada 1.5 yıl çalışmış fransız daha mezun olmamış bir mühendis vardı. alman ordularının polonya'yı işgali gibi rahat ve neşeli geçti mülakat. karşı tarafta hassiktir bu çok biliyor ifadesi vardı.

    yalnız burada ters bir şey hissettim. birinci mülakatta şirket sahibinde garip bir sırıtış vardı. bence adam kendi data scientistlerini korkutmak/motive etmek için beni kullanma fikri aklına gelmiş. benim profili adamlarına biraz da yüksekten satmış. "dikkat edin mesih geliyor" şeklinde yansıtmış lol. o yüzden mülakat yaptıklarımın beklentisi biraz yüksekti. böylece çakal patron kendi adamlarını korkutup daha motive olacaklarını düşünmüş olmalı. ayrıca bakın piyasada ne adamlar var ben sizi istihdam ediyorum diyerek şirkete bağlılığı arttırmış olabilir.

    bizim eski puşt patronu hatırlıyorum. işe adam aldığında bize öyle bir anlatırdı ki derdik ki biz kepenkleri kapatıp kaçalım, totem gibi bir adam geliyor. benim yanıma aldığı it'ci elemanı öyle bir tarif etmişti ki düşünce balonunda cümleler değil sayılar geçiyor gibi algılamıştım. sonra gelen eleman bütün gün moda alışveriş sitelerinden başka hiç bir şey bilmediği ortaya çıktı. ama hatırlıyorum patronun bunları anlatırken yüzünde aynı pis sırıtış vardı.

    mülakat süresince abartmadan benim sizin işinizde gözüm yok. avrupa'da iş arıyorum mesajı vermeye çalıştım. fransız arkadaş çaktırmadan burda çalışıp çalışmak istemediğimi sordu. bundan sonraki planın ne? veya bu stajı ne için yapıyorsun dedi. cv'me böyle deneyimi koymak iş bulma şansımı arttıracak falan dedim. avrupa'da iş arıyorum dedim. oysa ki patronla yaptığım mülakatta bu şirket çok önemli, burada çalışmak isterim vurgusunu öne çıkarmıştım.

    bunun yanı sıra glove dedim tf-idf dedim lstm dedim bert model dedim adamlarda hiç bir tepki görmedim. lan bu adamlar nlp yaparken sanırım bunların hiç birinden haberdar değiller. çok garip.

    bunun yanı sıra fransız elemanın yaklaşımını takdir ettim. gayet centilmence bir tavır gösterdi. yerli bir şirket olsaydı tehdit altında hissettiğinde daha agresif yaklaşırlardı. o bildiklerin teori, biz burada neler gördük falan saçma sapan konuşurlardı. yurtdışı konusunda tek umudum önceki işimde karşılaştığım yavşak karakterlerin olduğu bir iş ortamına benzeyen bir yer ile karşılaşmamak.

    bunun yanı sıra bir yerde japonca biliyor musun dediler. bilmiyorum deyince güldüler. bizim cümleler japonca bu sorun yaratır mı dediler. gülüşlerinden kendilerinin de çok bilmediği sonucunu çıkardım. bunun hakkında çok düşünmedim falan dedim.

    ulan ne iştir ya gittik en çok nlp(natural language processing) çalıştık. iyi de japonca bilmiyoruz ki. adamların cümlelerini nasıl yapay zekaya sokup tahmin ettireceğiz? ulan her işim yarım yamalak ya swh.

    bu mülakat beni epey strese sokuyordu. sanırım bugün tatil yapabilirim. valla çok iyi oldu.

    02.09.2020 editi:
    evet arkadaşlar. amacımda ilk adımı sağlamış oldum. bugün japonya'daki çok uluslu küçük bir teknoloji şirketinde stajyer data scientist olarak 3 aylık staja başladım. bu yolda buradan destek veren herkese çok teşekkür ediyorum. veri bilimci olmak için sadece bir adım kaldı. inanıyorum ki 3 ay sonra işe girme şansımız daha yüksek olacak.

    bir parça uzun yolu seçtik. açıkçası böyle bir cv ile emeğimi 3 ay bedavaya satmak da ne kadar mantıklı bilmiyorum. iş bir gün dışında evden yapılacak. zaten staj olduğu için pek bir görev vereceklerini de sanmıyorum. hiç bir şey olmasa cv'de durması açısından iyi olur. zafere giden yolda bir parça daha uzun olan yolu seçtik!

    04.09.2020 editi:
    kendimi duvarın ötesinde çok iyi organize olmuş ve sonunda yavaş yavaş birleşik hale gelebilmiş ve bu sayede duvarı geçebilecek olan wildlingler gibi hissediyorum. japonya machine learning maaşına baktım. sanırım yıllık 7 milyon yen ortalama. yani aylık ortalama 7000 dolar diyebiliriz. gerçekten böyle bir şeyi başarabilecek miyiz?

    şimdiye dek ilginç denemelerim oldu. 5 yıl önce kaymakamlık sınavına hazırlandım. açık öğretimden kamu yönetimi bitirmiştim. 40 gün hazırlandım ve tam 1 soru ile kaçırdım. kendime 3 yıl hazırlanma süresi vermiştim. sınavı geçemeyince de hiç bozulmamıştım aslında. ama sınavdan önce kaymakamlıktan varoluşsal sebeplerle vazgeçtim (yasaları okuyunca anladım ki beni bir bahane ile harcarlar orada hiç kimse de farkında olmaz).

    sonra uluslararası ilişkiler yüksek lisansın girdim. doktora da yapıp akademisyen olayım dedim. orada da barınamadım. bir sebepten bölüm yönetimi bana kafayı taktı. 3 tane geçtiğim dersi falan sildi. yıldırmak için döndürmedikleri fırıldak kalmadı. en sonunda sikerim böyle aşkın ızdırabını deyip orada da tez aşamasında kayıt sildim. aslında iyi oldu. askerlik de geliyordu. gittim mühendislik alanında tekrar yüksek yaptım. gerçi o da veri bilimi ile çok alakalı değil.

    bu kadar eu4'de osmanlı ile oynadım. hadi bi kere de japonya ile oynayayım ayıp olmasın dedim. eşimin kafayı ütülüyorum şurayı aldım burayı aldım bir kez de kızın ülke ile oynayayım dedim. ilginçtir burada da durmadan fatih başarısızdı, osmanlı kötüydü gibi entryler girip duruyorum. bu da böyle ilginç bir çelişki. neyse o sırada avusturalya'yı kolonize ederken aklıma bir fikir geldi. neden hollanda yerine avusturalya üzerinde iş aramıyorum? görünen o ki en zor kısım ilk kez işe girmek. avusturalya maaş miktarı japonya'dan daha yüksek, işçi açığı hollanda'dan daha fazla gibi görünüyor. hem de ingilizce konuşuluyor ve japonya'daki gibi uzun çalışma saatleri yokmuş. en azından ilk araştırmada vardığım sonuçlar bunlar. e neden 1-2 yıllığına avusturalya olmasın?

    akşam avusturalya konusunu eşime açtım. avustralya'ya gidersek ve ikimiz çalışırsak sana havuzlu ev alırım dedim kabul etti. ben 7k alırsam, o da 3-5 bir şeyler alır da 10k'nın üzerine çıkarsak sanırım şöyle bir evin kirasını verebiliriz 1.2k civarında.
    https://sohoapp.com/…nue-belrose-nsw-2085-australia

    lan şaka maka böyle bir şey gerçekleşebilir mi acaba? eu4'den gelen ilhamla ülke hedefi değiştireceğiz galba.

    08.09.20 editi:
    avusturalya işi yaş. adamların öncelikli meslekler listesinde benim mezun olduğum mühendislik var. ama o alanda da deneyim sahibi olman falan lazım diyor. benim mezun olduğum bölüm farklı, tecrübe edindiğim alan farklı, şimdi yapmak istediğim data science işi daha da farklı. bir danışmanlık şirketine mesaj attım yardım edin diye. adamlar fiyat söyledi. biraz fazla geldi ama eyvallah. ama ilk aşamada dediler ki meslekler listesine bak orada mesleğin geçiyorsa para gönder sana analiz gönderelim en sonda da sorularını cevaplayalım. iyi de benim durum o kadar basit değil ki listeden seçip aha benim meslek bu diyeyim. ben kendi mesleğimi bilmiyorum ki. daha ilk aşamada da birilerinin bana yardım etmesi lazım.

    bugün stajda ilk online toplantıya katıldım. patron ha bismillah "sana bir test sorusu" deyip saçma bir soru sordu işle alakasız. veri bilimi kısmında iki eleman çalışıyor. biri lead data scientist sıfatı ile hong konglu bir istatistikçi. diğeri de bahsettiğim fransız daha mezun olmamış fransız arkadaş. hong konglu çok çekinik gibi geldi. ingilizcesi de kötü. fransız ise iyi ingilizceli ve çok dışa dönük gibi geldi. grup mesajlarında patronun mesajlarına ilk yanıt atanlar arasında. patron alakasız test sorusunu bana sorduktan sonra hemen fransıza da döndü aynı soruyu sordu.
    sallıyor da olabilirim. ama önceki patron da ben işe yeni girdiğimde sağ kolu bir kız vardı. bana arada çağırıp garip test soruları soruyor sonra direkt aynı soruları kıza soruyordu. bunu 3-5 kez yaptıktan sonra kızda doğal olarak bir rekabet, tehdit altındayım duygusu ortaya çıkmıştı. acaba diyorum bu yeni patron da fransızı dengelemek için beni mi kullanmak isteği içerisinde. işin kötüsü benim profil de tam asosyal hong konglu arkadaşa uyuyor. bu tür insan iletişimi gereken işlerde hiç motivasyona ve beceriye sahip değilim.

    acaba çalışanları bir birine karşı gazlama ve bölme yöntemi bizim patrona mı özgüydü, türkiye'ye mi özgüydü yoksa bu uygulanması gereken evrensel bir yönetim şekli mi bunu çok merak ediyorum, bu kafamda büyük bir soru? çalışanlar bir birine düşman olursa bu verimi düşürmez mi?

    toplantıdan sonra hong kongluya biraz data hakkında soru sordum. bana verdikleri örnek üzerinde keşif yapıyorum. gerçek data 5gb civarındaymış(daha çok petabyte dedi gibi algıladım ama muhtemelen telaffuz hatası 5gb'dır o). 200 civarında feature tahmin etmeye çalışıyorlarmış. sanırım ıbm'in bir app'ini kullanıyorlar. aaa yeni modeli kendileri yazmıyor mu? ama app'in sınırı 200 feature olduğu için 300'e bir şekilde arttırmaya çalışıyorlarmış.

    11.09.20 editi:
    buradan saf ve naif arkadaşlara bir kötü haberim var. lan burda da psikolojik baskı varmış sanırım. önceki entry'de yaptığım tahminler gayet de doğru. eee ben bu tür alavereler türkiye'ye özgü sanıyordum. lan yoksa hollanda da mı böyle çıkacak? o hayal ettiğim huzurlu iş ortamını hiç bulamayacak mıyım?

    bir taraftan da çok seviniyorum. psikolojik skilleri önceki iş yerinde arttırana kadar çok acı çektim. daha doğrusu arttırmak zorunda kaldım. eskiden otistik gibi hiç kimsenin hiç bir şeyi üzerine kafa yormayayım. ben mühendislik yapayım derdim. yaptırtmıyorlar. sosyal ilişkilere önem vermeli, diğer insanların kafalarından geçeni tahmin etmek zorundasın.
    işte şimdi yaptığım tahminlerin doğru çıkması bana acayip keyif veriyor. patronun daha ilk mülakattaki sırıtışından, benim becerilerimi sorgulayacak hiç bir soru sormamasından ve anlattığım gibi kabul etmesinden bu adamın beni başkasına karşı dengeleme niyeti olabilme ihtimalini düşünmüştüm.

    fransız arkadaş ile patron arasında çok da açık olmayan bir gerginlik var kesinlikle. bugünkü toplantının moderatörlüğünü bana yaptırdılar. patron direkt fransız ile konuşmaya başladı. fransız sana kötü haberlerim var diye olaya girdi alakasız bir şey anlattı. sesi çok kötüydü. fransız da belli çok alınmış ama çaktırmamaya çalışıyor. bu gerginliğin sebebinin fransız'ın patronun sosyal yönlendirmelerini çok takmamasından kaynaklandığını düşünüyorum. aynı zamanda bence patron bu eleman çok ters laflar etmedikçe bu elemandan vazgeçmez. muhtemelen daha sonra daha rütbeli çalışanlara karşı fransızı kullanır diye düşünüyorum.

    bunları neden anlatıyorum? birincisi sosyal gerginliklerden aşırı etkileniyorum. bazısı kan göremez, bazısı böcekten korkar benim de olayım bu sanırım. eğer örütülü gerginlikleri eşeleyip ne olay döndüğünü, kimle kimin takışık olduğunu bilmez isem çok daha fazla strese giriyorum. ikincisi daha önce söylediğim gibi sen allameyi cihan mühendis ol, bunları gözetmezsen sana mühendislik yaptırtmıyorlar.

    biraz da teknik alandan bahsedelim. benim senpai(şef gibi bir anlama geliyor) dün görev verdi. tfidf çıkar, stop wordsleri ele, most common keywordsleri bul bir de document term matrix(dtm)'i bul yarın(bugün) bana dosyayı gönder dedi. document term matrix dışında diğerlerini biliyordum ve hemen yaptım. dtm'yi oluştururken ise bellek hatası aldım. bugün dosyayı göndereyim mi dedim. bellek hatası alıyorsan daha az kelime ile dene dedi. bir de ibm'den bunları predict ettir dedi.
    eski kaizenuberalles olsa direkt işi yetiştirip göndermeye çalışır. yok anam valla. gittim şapkamı aldım dışarı yürümeye çıktım. şimdi de bilgisayar oynayacağım. hiç acelem yok. pazartesine kadar yapar gönderirim. kendimi kanıtlayacam diye kimsenin gözüne batıp hırslı gözükmenin alemi yok. bu stajyer bir parça da tembel gibi demeleri bu stajyer bize tehdit olabilir aman dikkat demelerinden çok daha iyi. zaten fransıza nispet olsun diye bu dönem muhtemelen normalden iyi davranıyorlar. gaza gelmenin alemi yok.

    20.09.20 editi:
    bu şef hoş görevler vermiyor. şimdi bir japonca sözlük yükle de öyle tokenize et(kelimelerin eklerini ayır) dedi. ya bu sözlük olayı ne zormuş. sadece internette linux ve mac os kodları var. sanırım windowsta çalışmıyor bile. lan öyle şey mi olur ya. sözlük dediğin bir dosya olur, onu da import edersin olur biter gibi bir şey olması lazım ama değil. internette zaten çok az kaynak var onlar da japonca. lanet gitsin böyle işe ya. şefe soru soruyorum eleman evet diye yanıt veriyor. ağzından çok laf da alamıyorum. hiç hoşuma gitmedi bu mecab-ipadic-neobişey sözlüğü müdür uzay mekiği midir ne sikimdir ya. bir sözlük neden linüxde çalışıp mac os da çalışıp windowsda çalışmaz ki? windowsla ne alakası var böyle basit bir şeyin. zamanında da zemberek diye türkçe bir sözlük vardı. allah belalarını versin.

    bu arada kayışı iyice kırdım. hangi ülke olursa olsun başvuru yapıyorum. en son ingiltere’de 8 işe başvurdum biri başvuruma bakmış. bu aralar bi de avustralya olayı var. adamlar endüstri müh diploman ve 3 yıl endü müh deneyimin varsa gel diyorlar. benim deneyim endü müh olarak değil. ama ssk’da endü müh olarak yazmışlar. ikilem içindeyim acaba benim o üç yılı endü müh olarak çalıştım diye kabul ederler mi?

    27.09.20 editi:
    geçen çarşamba iş yerine gittim. çarşamba günü toplanıyorlarmış. diğer günler home office. iş yeri 2 saat kadar uzakta maşallah. genel işlerden sorunlu kadın hal dili ile sen çok erken saatlerde gelme dedi. çünkü trenler kalabalık oluyor. korona tehlikesi var. neyse dedim ki bugün 1 saatliğine falan tanışmak için geleceğim. gittim.

    30.09.20 editi:
    gittiğimde oo meraba dedim. biraz büyükçe bir odanın içinde 10 kişiye yakın çalışıyorlardı. 3-5 dakika muhabbet faslı oldu. benim şef benim yaşlarda ama tam bir mühendis. adam gelip yalandan 3-5 geyik muhabbet edeceğine direkt sonuçlarla ilgili bir şeyler anlatmaya başladı. dur lan heyecanlıyım zaten. tabi ne ben ne dediğini çok anladım ne de o heyecanlı olduğu için düzgün konuşabildi. rahat olmayınca benim şefin ingilizcesi resmen çinceye kayıyor.

    orada bir kaç saat takıldım. ipad getirmiştim kurs videosu izlerim diye. önüme bir mac book koydular çok mutsuz oldum. içimden bu ne sikinsonik bir şey cümlesi çok defa geçti. mouse’unu bile yarım saatte çözemedim. zaten heyecanlıyım. yanımda fransız bir eleman var döndüm onla muhabbet edeyim dedim. hava çok nemli falan dedim pek oradan da bir muhabbet alamadım.
    buraya kadar her şey yine fena değil. şansıma o gün birinin doğumgünü varmış. bir saat ayakta dikilip grup muhabbetine dahil olamadım. masaya da geri dönemiyorum.

    neyse bunlar beklediğim şeylerdi. ilk günler böyle olur. o yüzden o gün oraya 1-2 saatliğine gitmiştim. ilk günden dünyayı kurtaracağım moduna girmeye gerek yok. eee geri nasıl döneceğim? tam ağzımı açıp hadi ben gidiyorum diyeceğim cesaret kalmamış. müdüre gidip çocuk gibi ben bugün erken çıkabilir miyim demek de yakışık almaz. sonra yanımdakine hadi görüşürüz dedim. sonra patrona gidip mehehe bugün ilk keşif günü ziyaretin kısası makbuldür falan gibi bir şeyler söyleyip espri yapmış gibi yaptım sonra eve geldim. kendimi toplamam iki gün aldı.

    aradan bir hafta geçti bugün tekrar ofise gidiyorum bakalım bugün nasıl geçecek. bugün yine tam mesai kalmayacağım iki saat erkenden döneceğim.

    bu arada bu güne kadar şefin bana verdiği iki japonca sözlüğü karşılaştır görevimi yaptım. sonuçlar aynen beklediğim gibi. binbir meşakatle yüklediğim mecab-ipadic-neologd sözlüğü default mecab sözlüğünden daha kötü sonuç veriyor. vermese şaşardım zaten. bu güne kadar veri biliminde daha gelişmiş hangi tekniğe zaman harcayıp denediysem hep daha kötü sonuç verdiler. sonuçları şefe attım. sanırım şu sıra inanmakta güçlük çekiyor olmalı. çeşitli parametreleri değiştirerek tekrar denetti yine olmadı. şimdi de modeli değiştireceğim logistic regression yerine random forest ile karşılaştıracağım.

    07.10.20 editi:
    bugün üçüncü defa ofise gittim şimdi de dönüyorum. benim oturduğum yeri değiştirmişler. tam yol girişine, masa balına koymuşlar. önce yadırgadım sonra çok hoşuma gitti. dikdörtgen masa başında olduğum, eşşek kadar da monitör olduğu için kimseyle yüz yüze çalışmıyorum. bu konsepti çok sevdim. iş sırasındaki tedirginliğim çok azaldı.
    güzel bir taraf daha var adamlar ya ingilizce ya japonca muhabbet ediyorlar. japonca zaten anlamıyorum. ingilizceyi de dikkat etmez isem kulağım yakalamıyor. çok süper ya.

    işte daha ilk ofiste türkiye’de iyi ki çalışmıyormuşum hipotezimi doğrulamaya başladım. türkiye’de çok iyi maaş alıyordum ama ofis düzeni berbattı. kafamı kaldırdığımda karşımdaki arkadaşımla göz göze geliyordum. biraz karşımdakiyle muhabbet etsem yönetici paralıyordu. başka yere gidip otursam laf ediyorlardı. öyle tüm gün diken üzerinde çalışıyorduk. burda valla baktım şota adlı arkadaş almış pc’yi gitmiş kanepede çalışıyor. valla süper ya. önceki çalıştığım ofisin dizaynını kim yaptıysa valla...

    bunun dışında farklı milletlerden çalışanların tepkilerini de gözlemliyorum. japon, çinli, amerikalı, turk hiç farketmiyor ya. genelde aynı koşullar altında aynı tepkileri veriyorlar. beklenen ama ilginç bir sonuç. japonların ofis ortamında benden çok da farklı hareket etmediklerini görmüş oldum.

    bu arada bizim şef arada görev vermeye devam ediyor onları da yapıyorum.

    14.10.20 editi:
    bugün dördüncü kez ofise gittin. çok kişi yoktu. yeni alman stajyer bir kız gelmiş. biraz onla konuştum. valla yine zamanımın büyük çoğunu ofiste sakinlik içinde geçirdim.

    bunun dışında benim şef neural network ile tahmin görevi verdi. bir diğer tahmin yapmam gereken model de lstm’li, grd layerlı neural network. bakalım, bir tarafta basit nn’yi bir tarafta lstm’li nn’yi karşılaştırarak aradaki farka bakabilirim.

    bunun dışında bugün de ofisten 2 saat erken çıktım. saat 4 olunca öyle ayağa kalkıp hazırlanıyorum. sonra görüşürüz deyip eve gidiyorum. staj ilanında stajyerlerin çalışma saati esnek olabilir diyordu. geçen hafta da ofisten görevli kadına saat dörtte çıkabilir miyim demiştim tabi demişti. ama acaba tüm haftalar için mi yoksa geçen hafta için mi tamam dedi? bundan tam emin değilim.

    öte yandan izin vermeyecek olularsa da varsın emri vaki olsun ya diyorum. adamlar para vermeden 1 yıl deneyimli stajyer çalıştırıyorlar. o kadar da talepkar olmazlar herhalde. full time isterlerse işe alırlar.
    --- spoiler ---

    kasım - aralık 2020 ve ocak 2021:
    --- spoiler ---
    06.11.20 editi:
    geçen hafta ofise gitmedim. biraz dengesiz alman stajyer bir kız var. acayip hastaydı. sesi online toplantıda çok kötü geliyordu. gerçi sonra alerji olduğu ortaya çıkmış ama hiç risk alıp ofise gitmedim corona olmuştur falan diye.
    her gün çalışmaya devam ediyorum ama çalışma süresini biraz azalttım. süreyi azaltınca şimdi hiç farkında olmadan geceleri daha erken uyumaya başladım.
    recursive modellerden bir sonuç çıkmadı. tekrar düz neural modellere döndük. benim hong konglu şef israrla sonucu değiştirmeyen modelleri denettirip denettirip duruyor.

    25.11.20 editi:
    şu anda nambu line ile ofise gidiyorum. aslında hiç gidesim yok ama stajımın son ofis günü. bence ofis işleri ile ilgili yapılabilecek her şeyi yaptım ve dokümante ettim. staj aralıkta bitiyor. şu son 3-5 günde her halde araştırma yapıyorum diye geçiştiririm.

    motivasyonum epey düşmüş durumda. sikerün science’ını modundayım. bu son üç ayda staj yüzünden sertifika alamadım ve çok iş başvurusunda bulunamadım ama bulunduklarım hala negatif dönüş yapıyor. motivasyonumun düşmesinde yaptığım finansal yatırımların başarıya ulaşmasında da büyük etkisi var. şu durumda iş bulmak benim için aç kalmamak için değil de kendini garantiye almak amaçlı bir şey gibi geliyor. valla kendimi biliyorum. muhtemelen 5 yıl çalışırım. data science’dan köşeyi dönünce türkiye’den 5-10 ev alıp onun kira parası ile finansal piyasalara atılırım. oradan da başarılı olursam ki olacağım muhtemelen, ondan sonra tarihi roman yazmak istiyorum.

    neyse şimdi gerçeklere dönelim. linkedin’den data scientistlere bakıyorum. ya hepsi değil ama çoğunun cv’si tırt. bu adamlar iş bulabiliyor da ben nasıl bulamıyorum garip valla. şu staj bitsin de avustralya’dan japonya’ya her yerde durmadan sadece iş arayacağım.

    motivasyonumun düşmesinin bir diğer sebebi artık kendimi iş bulmak için yeterli görmem. yani 2 sertifika hedefim daha var. bence bu kadar bilgiden sonra eldeki kaynakların %100’ünü iş başvurularına ayırsam kar fonksiyonunu maximize edebiliriz. azalan marjinal fayda diye bir şey var. bence sertifikaların bu noktadan sonra azalan faydası var. öncesinde %80 vakti eğitime belki %20 vakti iş başvurularına ayırıyordum.

    valla şimdi gidip ofiste ne yapacağım ya diye de düşünüyorum. bir de pasta kesecekler benim ve stajyer diğer bir kız için. dikkatler bana yönelecek. konuşmak zorunda kalacağım. neyse bakalım..

    lan...! düşünüyorum da.. önceki işim ile ilgili github’da bir proje uydurup yapabilirsem... önceki işimde de veri analizi ile ilgili uğraştım desem... belki iyi bir fikir olabilir. gidip gerçekten de böyle bir proje yapacağım için yalan söylemiş de hissetmem ve detaylı bir şekilde projeyi anlatabilirim. bunun üzerinde bir düşüneyim...

    26.11.20 editi:
    haftalardır ofise gitmemiştim. şimdi gidip 18:30'a kadar kaldım. çok ağır geldi ya. benim zihin 15:00 gibi ayrılan stajyerler için pasta kesince tükendi. türkçe bile grup konuşmalarına hiç katılamazdım. bir de ingilizce hiç çekilmiyor valla. çoğu zaman diyaloğu anlamıyorum bile. bizim hong-kong'lu şef de aynı durumda. o da ayrı bir sayko profili çiziyor. bir tane de web developer var. o bir tık daha sosyal olmasına rağmen o da suskunlar kulübünün üyesi. kesin diğer üyeler bu it'ciler böyle oluyor diye düşünüyordur.

    bu arada son 2-3 saat psikoloji takımı durmadan konuştu durdu ya. toplantı yapıyorlar aynı odada. lan bende konsantrasyon kalmıyor. bu normal bir şey mi? bana özgü mü yoksa merak ediyorum. gerçi haftalar sonra ilk kez ofise gitmenin de etkisi vardı ama çekilmez valla dır dır...

    06.12.20 editi:
    avustralya ile ilgili bir aracı kurumdan hizmet satın aldım. bakalım ne sonuç çıkacak.

    10.12.20 editi:
    20 marttan beri 800 saat civarı çalıştım. 120’ye yakın yere iş başvurusunda bulundum. aralık başından beri stajım da bitti. kendimi doğu almanya çökünce kendini alkole veren sovyet komiseri gibi hissediyorum. durmadan dota oynuyorum. gerçi halimden şikayetçi de değilim. keşke korona bu kadar olmasaydı da coco’s restoranta gidip sınırsız meyve suyu paketi alıp felsefe kitabı okusam. dota olunca hadi iş ile ilgili bir şey yapmıyorum tamam da kitap da okumuyorum. şunu anladım ki insan sosyal bir varlık. öğrenme de çoğunlukla sosyal bir süreç. yani sadece data science anlamında konuşmuyorum. okumak da sadece yetmiyor. insanlarla tartışmak da gerekiyor.

    neyse.. türkiye’ye gelip kyk yurdunda bütün gün online oyun oynayıp derslere gitmeyen rus moğol arkadaşlar tadında bir süre takıldıktan sonra tekrar çalışmaya asılırım. iyi ki tüm çalışmamın saatlerini not almışım. şimdi son haftalarda çalışmayı salsam da geriye baktığımda bu bir yıl boyunca iyi çalışmışım diyebiliyorum.

    12.12.20 editi:
    20 marttan beri 870 saat 40 dakika çalıştım. 116 yere iş başvurusunda bulundum. uzun bir aradan sonra tekrar çalışmaya başlıyorum. bitirmediğim bir sertifika olayı vardı. onu bitireyim.

    18.12.20 editi:
    sağ olsun bir arkadaş destek mesajı attı bir diğer arkadaş da devam hocam dedi. şu anda saat 05:30. bugünü de boş geçmedim gece 03:00 gibi 1:30 saat çalıştım. son bir kaç gündür bir problem üzerinde debeleniyordum. 2 gündür mesafe aldım. 4 tane bot var. bu 4 botu da taş-kağıt-makas oyununda yenecek bir bot yazmam lazım. yenecek derken %60 yensin yeterli. uğraştım uğraştım tam en son aşamadayken farkına vardım ki algoritmayı baştan kurmam gerekiyor. artık yarın bakarım.

    bugünlerde tekrar çalışmaya başladım. az da olsa yavaş yavaş başladım. motivasyonum medieval total 1'deki cihad ilan edince çıkan resim gibi. aşağıdaki videonun 4:43'deki atmosferi içindeyim. aklımın arka planında "el pikal", "eh vil hedef" gibi ifadeler geçiyor. bakalım şimdi hedef yarım kalmış bu iki sertifikayı almak, daha sonra yüksek lisansta türkçe yazdığım tezi ingilizceye çevirip internete, cv'ye yüklemek. ondan sonra sırf iş bulmaya odaklanacağım.

    https://youtu.be/qwhbvyre9uk?t=283

    bu arada avusturalya konusunda danışmanlık şirketinden rapor bekliyorum. eğer "aga sen buraya gidebilirsin" sonucu çıkarsa oturup ielts sınavını geçmem gerekecek.

    dün gece oturdum sadece akıllı şehirler olayını araştırdım. galba 2030'da akıllı şehirlerdeki evlerin fiyatları fırlayacak. türkiye'nin ilk akıllı şehrini de sanırım esenlerde yapacaklarmış. orada bir askerlik arazisi var oraya konut yapacaklarmış. google map'den araziye baktım. aslında toki ev falan yapmaya başlarsa daha ilk zamanlarda dahil olmak lazım sanırım.

    19.12.20 editi:
    şu anda saat gece 03:35(teknik olarak 20 aralık). 2 saate yakın taş-makas-kağıt botu üzerinde çalıştım. herhalde toplamda 10 saat falan olmuştur. bence son bir vuruş gerekiyor ama çok uykum geldi yarın bakarım. bu free code camp beni baya bir zamanımı aldı. baştaki videolar kolaydı ama beş problemin birincisini daha yeni bitiriyorum. daha bugün dota bile oynayamadım.

    bu arada avustralya danışmanlık firmasından rapor geldi. oturup okumaya üşeniyorum. öyle bir kenarda duruyor.

    bir kaç dakika sonra gelen edit:
    dersi bırakınca uykum açıldı. şu meşhur yönetmenin "gözleri kapalı" filmini izleyip komploları mı çözsem diye düşünüyorum. dolapta da kızartılmış balık var onu yerim.

    20.12.20 editi:
    şu anda saat sabah 07:30(teknik olarak 21 aralık). 3 saat taş makas hay taşını da makasını da... baya uğraştım ama an itibariyle beş problemden ilki olan taş makas projesini çözdüm. bunu daha sonra github'a da atacağım. yapay zeka kütüphanelerini kullanmadan yapay zeka yazdım. lanet olsun ya. resmen şafak vaktiyle yaptığımız taarruz ile taş-makas tepesini düşürdük. zaferi kutlamak için tişörtle dışarı çıkıp çöpleri atmaya gittim. hoş bir tokyo sabahı. koşa koşa geri döndüm.

    22.12.2020 editi:
    freecode camp'in ikinci problemine geçtim. bir fotonun kedi fotosu mu köpek fotosu mu olduğunu pc'ye tahmin ettirecek bir program yazmam lazım.
    görsel

    24.12.2020 editi:
    şu anda saat 00:30. içimden hiç mi hiç ders çalışmak istemiyor ama mecburen tekrar oturdum. kahve içip dota oynamak istiyorum. aklımda hep bir kerkük türküsü olan "felek sen ne feleksen" şarkısı dönüp dönüp duruyor. google map'den kerkük ile altınköprü arasındaki arazileri araştırmak istiyorum. şimdi data science gerçekten hiç makbul gelmiyor. ders çalışmak zorunda olunca böyle bir urfa sıra gecesine katılmak gibi bir ruh hali içerisine giriyorum. bir gün zengin olursam kar etmeyen bir think-tank kuruluşu kuracağım. gündüz gidip gençlerle toplantı yaparız. hergün dış politik gelişmeleri değerlendiririz valla hiç canım sıkılmaz. arada raporlar falan oluştururuz. 5 kişiye 3.500 liradan maaş versek aylık 20.000 falan tutar herhalde.

    neyse bu aralar ufaktan 1 saat, 1 saat ingilizce de çalışmaya başladım. freecode camp'deki ikinci probleme dönelim bakalım. bu iki sertifikayı bitirmeden iş başvurusu falan yapmayacağım.

    https://www.youtube.com/watch?v=owtvsi7lujk

    31.12.2020 editi:
    maksadım bir an önce yarım kalan sertifikaları bitirip iş aramaktı. ne var ki yine bu iş yarım kaldı. bu ara odak değiştirdik. sertifikaları bitirmeden önce son bir proje yapacağım. projenin ilk adımı bitcoin büyük düşüşlerini listelemek. ikinci adımında bir stop loss stratejisi belirleyip bu stratejiyi geçmiş düşüşlerde uygulamış olsaydık kar mı zarar mı ederdik onu hesaplamaya çalışacağız. yani trade botu gibi bir şey. hatta bunu masaüstü programı da oluyorsa onu yapalım diyoruz. veya çok basit bir şekilde internet sayfasını da yapabiliriz. ama bu mantık doğru mu diye trader, bu işi meslek olarak yapan bir arkadaşa danışmamız lazım. nereden bulacağız öyle birini?

    01.01.2021 editi:
    yıl başına girerken bitcoin geçmiş verilerden düzeltme yakalama algoritması çalıştım. sonra açtım sovyet sosyalist marşlar dinledim.
    https://www.youtube.com/watch?v=ybnco2skafu

    05.01.2021 editi:
    wolfenstein'da bira içip sallanarak horst wessel marşı söyleyen alman askerleri gibi sevinçliyim. bu bir haftayı gerçekten verimli kullandım. yeni bir projeyi, bitcoin düzeltme yakalama projesini bir haftada tamamladım, kaliteli denebilecek miktarda bug kontrolü yaptım. ingilizce makalesini yapıp medium'da yayınladım. bu benim internette data science hakkında yazdığım ilk makale oldu. valla fena da durmuyor. kapak resmi de çok şık oldu. bir haftada çok temiz bir iş ortaya çıktı.
    bugün gündüz 13:00'e kadar uyumadan rise of nations oynayıp 2021 videoları izledim. şimdi panjurları kapadım ve oturma odasında halının üzerinde uyuyacağım. neden yukarıda karanlık yatak odası varken halının üzerinde uyumaktan zevk aldığıma dair bir fikrim yok. arada bir daha rahatsız olsa da burada uyumak hoşuma gidiyor. die fahne hoch...

    ne yazık ki bu btc projesinin bitmesi ile yine lanet olası sertifika programlarını bitirme olayına geri döneceğim.

    09.01.2021 editi:
    ya şu freecodecamp'in 5 problemi ne kadar zor ya. taş makası geçtim. resimdeki kedi mi köpek mi problemini sonunda geçtim. şimdi de knn ile kitap önerme problemi var. karışık ayıklama işlemlerini yaptıktan sonra forumlara biraz bakayım dedim adamlar gidip matris oluşturmuşlar. benim hiç aklıma gelmezdi. eyvallah problemlerin çok zor olması fena değil ama sertifika ile alakasız yahu. bir de dersleri geçmek çocuk oyuncağıydı bunlar çok zor. sertfika acayip dengesiz olmuş. bu freecodecamp'in bi javascript kursu vardı. o kurs 10 numaraydı ya. şu an gece saat 05:15. şimdilik problemi burada bırakacağım yarın devam ederim. şu lanet sertifika bitse de bitcoin stop loss projesine devam edebilsem.

    10.01.2021 editi:
    saat gece 3'ü 55 geçe freecodecamp'in 3. problemini de geçtim. valla problemi sürüne sürüne geçtik. kaldı 2 problem. iş arama olayını bir süreliğine erteliyorum. önce şu sertifikayı alayım. sonra avustralya vize olayına bakacağım. sonra da finans piyasaları ile ilgili ikinci bir proje yapıp bunu internette yayınlayacağım. şimdi dota zamanı.

    11.01.2021 editi:
    sağ olsun bir arkadaş destek mesajı attı. çalışmalara devam ediyoruz. saat 05:40. dördüncü problem regresyon problemi. neredeyse tüm veri işleme kısmını yaptım. sadece algoritmayı koyup sonucu almak kaldı. ama test modülünde evaluation() diye bir kısım var. önce random forest regressor, linear regressor gibi ml algoritmalarını kullanmayı denedim ama onlarda evaluation() metodu yokmuş. ya tam evaluation() ne işe yarıyordu onu da tam hatırlayamadım. oysa ki 50 kere kullanmışımdır.
    neyse anladığım kadarıyla problem evaluation() koyduğuna göre neural network ile çözmemi istiyor problemi. galba neural network algoritmalarında vardı o metod. şöyle pytorch kodlarıma falan bakayım dedim ama onlar hep nlp içindi, regresyon için değil. bir taraftan da aklıma takıldı acaba evaluation() metodu sadece keras'da mı vardı? yoksa pytorch'da da var mıydı? o kadar geniş bir alan ki insan unutuyor. yarın devam ederim.

    aslında araştıracak çok proje var ama iş gücümüz sınırlı. acaba düşünüyorum da buradan bu işe yeni başlamak isteyen bir çok arkadaş var. hepsine tavsiye veriyoruz ama söz uçar yazı kalır. acaba beginner arkadaşlar için bir müfredat mı hazırlasam? mesela önce udemy'den şu kursu al sonra şu linkteki problemleri çöz falan gibi. mesela ilk 50 saatleri için. elder scroll morrowind'de böyle fighterlar guildi, magicianlar guildi falan vardı. biz de böyle bir loncalaşma yönünde ilk adımı mı atsak? yalnız öyle bir community olma yoluna gidersek rütbeli kişi sayısı çok az, beginnerlar ise sürüsüne bereket olduğu için hiç bir işe yaramayacak. oysa ki ortaya kendimizce bir müfredat koyup net olarak şu şu linkteki problemlere şu kadar zaman harcayın desek işe yarayabilir. mesela vakit olsa gıda endeksi ile toplumsal olaylar arasında bir regresyon var mı falan filan gibi cevap bulmamız gereken sorular var. veya gıda fiyatları 2021'de ne olur? tahıla yatırım yapalım mı falan filan gibi. bu mesele üzerine biraz düşünmem lazım. community'ye bir kaç deneyimli üye de bulursak deneyimli üyeler beginnerlara yol gösterir falan. ilginç bir oluşum olabilir.

    12.01.21 editi:
    evet problemi çözdüm. keras'da bir şey çözdürürken pytorch'da olduğu gibi ayrıca tensor'a çevirmek gerekmiyor. bunu otomatik yapıyor. eldeki data tiplerinin hepsini floata çevirince sorun çözüldü. önce yeterli scoru yakalayamadım. fazladan layer ekleyince dördüncü problem de bitmiş oldu.

    18.01.21 editi:
    4 gündür birşey yapmadım. oturum iznim bitmişti gittim onu yenilettim. sertifikanın son problemi kalmıştı. nlp hakkında. aslında güçlü olduğum bir alan. ama tf-idf yönetimini falan nasıl kullanacağımı biraz unutmuşum. tekrar yapınca şu lambda x olayını da nasıl kullanacağımı daha çok pekiştirmiş oldum. hep copy paste yapıyorum aklımdan silinip gidiyor.
    neyse biraz veriyi temizledim. problemde sms mesajlarının spam olup olmadığını tahmin etmemiz gerekiyor. bunun için de problem 7 tane mesaj verip bunları tahmin et diyor. biraz uğraştıktan sonra %88 gibi başarılı bir model kurdum. ama test 7 tanesini de doğru bil diyor. model olarak naive bayes kullandım. ya hadi 6 tanesini bilirim de 7'sini bilmek imkansız gibi bir şey nasıl bileyim ya. bu son problem uğraştıracak gibi duruyor. internette bir lstm ile bu problemin çözümü var. acaba lstm ile mi denesem? çözümler aslında o kadar karmaşık ve uzun ki diğer internetteki çözüme bakıp onu buraya uygulamak bile çok zor. yani kopyalama yapınca bile çok o problemi geçmeyi hak etmiş gibi hissediyorum. kopyalama yapınca gelen hataları çözebilmek için o çözümü anlamış olmak gerekiyor.

    19.01.21 editi:
    şu lstm çözümüne baktım. lstm olması yetmezmiş gibi bi-lstm. aslında arada sırada burada teknik bilgi de verelim. bi anlamı bileteral'den geliyor herhalde. yani ikili. yani çift taraflı. bir taraftan geliyor sonra diğer taraftan geliyor. böyle halı yıkar gibi. öyle yapınca daha iyi tahmin ediyor model. ilginç bir algoritma.
    öte yandan internetteki bu çözüme bakınca lan bunu kim uğraşacak da kopyalayacak şeklinde düşünüyordum. ben zaten şimdiye kadar lstm'in bir hayrını göremedim bir de bu adam kerasla çözmüş. ben pytorch biliyorum. niye keras değil de pytorch öğrendim? çünkü pytorch daha zor ve havalı. hele ki internette akademik araştırmacılar genelde pytorch tercih ediyorlar lafını görünce direkt pytorch bilmeliyim dedim. benim akademisyenlerden eksiğim nedir?

    neyse. gel zaman git zaman kodları incelerken gördüm ki data inbalanced şeklinde. aslında bunu kendim de farketmiştim. ama şimdi kim uğraşacak veri dengeleme ile dedim. dengesiz data nedir? 1000 tane "spam" sms örneği vermişken 5000 tane "gerçek" sms örneği vermiş. bilgisayarın kafası karışıyor öyle olunca. ben de dedim ki ya hiç bu kadar lstm falan yapmaya gerek yok. hele benim orjinal kodlardaki datayı bir dengeleyeyim bakalım ne olacak. valla oldu lan. başarı oranı %88'den %93'e çıktı ve 7 mesajı da doğru sınıflandırdı. ne veri temizliği yaptım, ne kopya satırları çıkardım, ne stop wordleri çıkardım. ne işaretlemeleri çıkardım. ne yanlış yazılmış kelimeleri düzelttim. hem de gittim basit bir naive bayes algoritması kullandım. hahahahaha

    bir süre sonra gelen edit: sonunda bu sertifika bitti. son problemde kopya çekmeme gerek kalmamış olması da beni sevindirdi.

    22.01.21 editi:
    bugün dün olduğu gibi uykumun yedinci saatinde uyandığım için sinir sistemim açılmamış durumda. 2 tane kahve içtim ama açmadı. şimdi üçüncüsünü içeceğim.

    bu sırada iki iş bulma ajansı iş ilanı atmış buna başvuralım mı diye. başvurun dedim. cv'yi güncelledim. aslında şöyle bir durum var. bu sıralar işe mişe girmek istemiyorum. bu aralar finansal yatırımlarım için kritik bir dönem. şu 6-12 ay doğru araştırmaları yapıp doğru hamlelerde bulunursam iyi para kazanabilirim. bu kadar uğraşmışken iş bulma konusunu ikinci önceliğe atmak hoşuma gitmiyor ama bunu yapmak zorundayım. tabi finansal piyasalar ile araştırma yaparken veri bilimi dosyaları oluşturuyorum. şubat ayında bir tane sertifika yarım kalmıştı bir de onu bitiririm.

    bunun dışında btc ile ilgili yaptığım bir çalışmayı paylaştım. tam büyük düşüşün olacağı gün düşüşleri analiz eden bir çalışma yayınladım. baya bi fav aldı. gerçekten çok anlamlı veriler ve sonuçlar içeriyor. öte yandan o entry ile ilgili baya bi insanla mesajlaştım. bu tam veri bilimi değil ama buna bussiness knowledge toplamak diyorlar. bu da önemli bir task.

    öte yandan btc ile ilgili bir stop-loss algoritması analizi yapmayı planlıyordum ama oradan ekmek çıkmaz gibi. çünkü manuel olarak önce bir düzeltmeyi inceleyeyim dedim. jupyterde verileri önüme getirip baktım. %40 düşüş olmuş. orada otomatik bir stop loss mekanizması ile kurtulabilir miydik diye bakayım dedim. yok adamlar 10 kere bizim stop loss çizgimizden endeksi geçirmişler gibi duruyor. iyi ekmek çıkabilecek bir proje olabilirdi ama olmaz gibi.

    bir taraftan da bu aralar pek işe başvurmayacağıma göre acaba master tezimi ingilizceye çevirip internete yükleyip cv'me eklesem mi diye düşünüyorum.

    27.01.21 editi:
    bu aralar finansal piyasaları araştırıyorum biraz. btc düzeltmelerine falan baktım.
    sanırım bizim bir community oluşturmamız gerekiyor. michael burry (büyük açık filmindeki tek gözlü eleman) tesla hissesini shortlamaya başlamış. bizim arkadaşlara araştıralım biz de shortlayalım dedim kimse oralı olmadı. bu konular ile ilgili bir araştırma arkadaş grubu falan olsaydı güzel olurdu. o community'de projeye dahil olmak isteyenlerden bir takım kurulur, her takım üyesi araştırmanın bir yerinden tutardı ve ortaya detaylı bir araştırma çıkardı. yavaş yavaş bir yazılı yeni başlayanlar için veri bilimi müfredatı hazırlasam fena olmaz.

    31.01.21 editi:
    birlikler bu aralar ilerleme hızını arttırdı. twitter'dan son 10 saattir data çekme üzerine odaklandım. data çekebildim ama istediğim gibi değil. twitter sınır koyuyor. tweepy diye bir kütüphane var. resmi sitesinde 3-5 bilgi var. oldtweet3 mü diye bir başka kütüphane var hata veriyor. internetteki örneklerin her biri başka bir stille kod yazmışlar.

    neyse ilerlemeye devam. böylece yepyeni bir kabiliyet kazanma yolunda ilerliyoruz:
    https://www.youtube.com/…0de0z0g241buso-xt&index=43
    --- spoiler ---

    şubat- mart ve nisan 2021:
    --- spoiler ---

    12.02.21 editi:
    geçen 2 haftada epey bi çalıştım. ruhen çok yoruldum. arkadaşın tatile gitmesini de fırsat bilerek biraz dinleneceğim. felsefe kitabı falan okurum bu sürede.
    peki 2 haftada ne yaptım? rakuten firmasının ik'cısı aradı konuşalım dedi. konuşmaya başlayınca biz "career break" vermiş kişileri data scientist olarak almıyoruz ama senin cv'ni yazılımcı olarak önerebilirim dedi. hiç fikrimi falan da sormadı direkt yazılım olayı ile devam etti. career break'li almıyoruz deyince çok sinirlendim ama sabırlı davrandım. sensin lan career break demek istedim. getir lan sizin junior veri bilimcilerin hangisi benden daha iyiymiş demek istedim. neyse... bu kadın, bana sormadan "yazılımcı" olayına geçince bir anda "hop ne oluyoruz" hissine kapıldım. "şu an için sadece veri bilimi pozisyonlarını değerlendiriyorum" dedim. veri bilimi olmaz ama dedi. e olsun olmasın ben sadece veri bilimi bakıyorum dedim.
    valla ilginç bir kadındı. gerçi bu rakutenin sanırım hindistan ik'sıydı galba. oradan yazılımcı buluyorlar. yani iyi de veri bilimci olarak bu kadar emek verip yazılıma bu kadar süre elini sürmemiş bir adamı nedir yazılımcı yapma şevki ve merakı anlamıyorum. yani ben 10x veri bilimi biliyorsam 1x kaldı hafızada yazılım bilgisi. adamlar yine de inatla yazılımcı yapmaya çalışıyorlar beni. siktirin lan yok yazılımcı mazılımcı.

    bu arada twitter'dan veri çekme olayına girdim. bu, öğrenmediğimiz bir alandı. sanırım bu konuda 3 tane daha medium makalesi yazdık. her iş ilanında uyduruk tableau veri görselleştirme bilgisi istiyorlar. onu da öğrendik. makalesini de yazdık. bu işler çok uğraştırdı. şu son dönem hakkaten verimli geçti ama biraz kafayı sıyırmak üzereydim. bu tatil olayı iyi oldu.

    bitcoin ile ilgili tableu kullanarak görselleştirme çalışması yapıp yayınladım. bence sunduğum bilgi muazzam bir data. ama beklediğim ilgiyi linkedin aleminde göremedim. alla allah. ben böyle analizler görsem kesinlikle çok iyi incelerdim. olsun en azından kendim için kullanırım.

    yarın mısır sergisine gideceğiz. bir haftadan beri espresso içmedim. mısır sergisinde espresso içebilirim.

    26.03.21 editi:
    uzun süredir entry girmedim. mısır sergisine gittik ve adamlar durmadan muska üretmişler. sanırım rahip sınıfı bu yolla durmadan firavundan para koparıyordu. sırf haraç kesmişler gibi olmasın diye de muhtemlen günümüze kadar gelen ürünleri üretmişler. o kadar boşuna ürün...

    yeni entry girmeden önce ikilemde kaldım. üç hafta boyunca data science çalışmadım. acaba günlük gibi aklıma ne gelirse onu mu yazayım yoksa sadece data science konusundaki olayları mı yazayım? galba alakasız konuları da yazmam daha iyi olacak öbür türlü biraz ara verdiğimde günlüğe de ara vermiş oluyorum.

    bu ara finansal yatırımları izlemek için bir kaç hafta ara vermiştim. iş de arayamıyorum bu yüzden. iki arada bir deredeyim. haziranda finansal kriz bekliyorum. o yüzden gümüş külçe alıp bankada kasaya yerleştirmeye çalışıyorum. (rte neden altınınızı bankaya yatırın diyor sanıyorsunuz?) ama çok zor bir türlü gümüş bulamadım. burada bu işler hele ki dil bilmeyen biri için çok zor. kim bilir kaç gün harcamışımdır bu iş için.

    kayın valide ve pederle tatile gittik. sabah japon kayın valideye "bankalar batacak hemen banka kasası kiralamamız lazım nereden bunu yaparız" dedim. kadın 5-6 saniye cevap vermedi. muhtemelen ne diyo bu bizim damat çıldırmış olmalı diye düşünmüştür. neyse sağolsun sonra gitti halletti o işi. bu aralar ne yazık ki finansal işler, iş bulma konusundan daha öncelikli. zaten 2019 yılında bu veri bilimi işine başlarken 2020-2021 gibi finansal kriz olacak. ama eğer olmaz da köşeyi dönemezsek diye bir b planım olsun diye veri bilimine başlamıştım.

    bu aralar bir youtube videosu çekip titanic problemini çözüyorum. sonraki hedef tekrar finansal konularda veri bilimini kullanarak analiz yapmak. yarın biraz ünlü bir iktisatçıya yanında veri bilimi stajı yapayım diye mail atacağım.

    şu anda gece 4 gibi birşey. geceleri tüm ışıkları kapatıp witcher3 oynuyorum. gündüz 13 gibi kalk. 14'e kadar kahvaltı ve yürüyüş. 14'de ders.

    07.04.21 editi:
    sanırım eski bir geleneği canlandırmanın zamanı geldi. tekrar karanlıkta duş almaya başladım..

    09.04.21 editi:
    çok güzel bir data science makalesi çıkarıp medium'da yayınladık. bitcoin boğa sezonu ne zaman bitecek? şimdilik veri bilimi çalışmalarını azaltıp ingilizceyi arttıracağım. arada aklıma geldikçe de veri bilimi makalesi yazar yayınlarım. aslında aklımda bir konu daha var. türkiye'deki reel faizler ve dolar kurunu araştırmak istiyorum. şu "rahip bronson olayı yüzünden dolar arttı" düşüncesinin tamamen bir saçmalık olduğunu düşünüyorum. verilere excelde şöyle bir kaba taslak baktık. genelde yapılan açıklamaların saçmalık olduğunu düşünüyorum. sadece abd, türkiye faizleri ve enflasyonunu baz alarak dolar kurunu tahmin etmeye çalışırım.

    ama bu aralar rota ingilizce kitap okumak. 3 tane elde kitap var. bunları biteriyim. zaten bunları okurken aklıma ilginç fikirler gelir.

    linkedin'de yazdığım makaleyi paylaştım. bu sefer ne kadar veri bilimi grubu varsa hepsine katılıp oralarda paylaştım. 100 kişi falan okumuş. geçmişteki makalelerin 2 katı. ama ben ciddi şekilde yazdığımız bitcoin analizinde çok önemli bir tespit yaptığımızı düşünüyorum.

    bugün full pc oynadım. yakınlarımdan çok pis resmen psikolojik kombo yedim. hiç kimseye bir yararım dokunmuyor. kurtaracaksam ancak kendimi kurtaracağım gibi duruyor. önce arkadaşımla yatırımla ilgili 1 saat konuştuk. adam gitti en sonda arabayı yenilemek en iyi yatırım dedi. eşime iş yerinde veri bilimci olmak isteyenler bugün mail atsın demişler. 3 yıl sürer falan demişler. kız biz nasılsa japonya'da durmayız 3 yıl diye başvurmamış. böyle kalbime nasıl oturdu anlatamam. papel casel'de oğlu cinayet işlemiş moskova gibi hissettim kendimi. alamancı çocuklara ne olmak istiyorsun diye soran muhabir gibi hissettim kendimi. "neden can çeltik niye neden?" diye isyan etmek istedim. ya siktir et 3 yılı, 3 yıla kim öle kim kala... dedimse de bir işe yaramadı. şirkete mail attı ama zaman geçti dediler. yıkıldım valla konuşamadım bile.. aga maaşı net 2 katına çıkaracaksın, hadi onu geç kolay iş bulacaksın. avrupa'ya gidince yüksek sınıf olacaksın. ben sana yardım eder öğretirim. neden can çeltik neden? ya zor desen zor da değil, ben biliyorum iki grafik çizdirecekler adın olacak veri bilimci..

    bir de valide aradı. evi satmak istiyor. tam bir finansal geri zekalılık. lan kanal istanbul'a 4km uzakta. bekleyin bare inşaat başlayınca satarsınız dedim. hay allahım ya..

    28.04.21 editi:
    bugünlerde günlerim ingilizce çalışarak ve kitap okuyarak çok güzel geçiyordu. güzel bir veri bilimi projesi de yapıp yayınlamıştım. onda da ara sıra bir şeyler yapıyorum. ne var ki bazı finansal işleri halletmem gerek. bu yüzden ingilizce çalışıp kitap okuma işini rafa kaldırdım. valla çok mutluydum. dışarı çıkıp yürürken kelime defterinden kelime ezberliyordum.

    --- spoiler ---

    mayıs- haziran ve temmuz 2021:
    --- spoiler ---

    13.06.21 editi:
    uzun süreden beri ilk kez tekrar bilgisayar oynamayı kısıtladım. sadece dota oynayabilirim. tek bir oyunu da fazla oynamıyorum. gündüz ışığında oyun oynamak çok keyif vermiyor. bilgisayar oynamayı azaltmak demek sürekli psikolojiye gelen +4 mutluluk kalkanını düşürmek anlamına geliyor. bir hafta boyunca üzgün rüyalar falan gördüm. ama şimdi enerjinin boşa çıkması ile çalışma/düşünme miktarımın tekrar artmaya başladığını hissediyorum.

    ne iş yaptığımı, ne yaptığımı halen net olarak tarif edemiyorum ama bir taraftan da çok mantıklı bir yolda ilerlediğimi düşünüyorum. amacım trade yaparak para kazanabilmek. bunun için de durmadan trade'e faydası dokunacak veri bilimi projeleri geliştirmeye çalışıyorum. durmadan hedef değiştirmem biraz ayran gönüllülük gibi görülebilir ama bence yeteneklerim geliştikçe daha iyi fırsatlar görüp o noktalardaki başarıları yakalamaya çalışıyorum.

    önümdeki proje macd indikatörünü kullanarak bir piyasada alım satım yapsaydık ne olurdu? sorusunun yanıtını bulmak. aklımda başka projeler de var. mesela faiz oranlarını hesaba kattığımızda doların değeri ne olmalı? teknik analiz formasyonlarını kullanarak trade yapsaydık karımız ne olurdu? direnç noktalarını ve pinbarları kullanarak trade yapsaydık karımız ne olurdu?

    tüm bu projeleri yapabilmek için bir orduya ihtiyacım var. şüphesiz ki çözdüğümüz her bir soru da bizi başka sorulara götürecek. belki orta vadede katılan her bir gönüllü ile bu projelerden birisi yaparız ve sonunda piyasaları yenebilecek bir trade girişimi yaratmış oluruz.

    bu aralar hipnotize olmuş gibi witcher ciri good ending videosunu izliyorum. pelerinden görünen tek göz ile "is it done?" sorusunun soruluşu çok hoşuma gidiyor. bu "is it done?" sorusu bir de red alert2'de vardı. is it done yuri?

    15.06.21 editi:
    son dönemlere kadar birlikte çalıştığım yeni mezun bir arkadaşım part-time iş ilanı bulmuş. ilanı açan bir akademisyen. sanırım bir proje için. hoca soruyu göndermiş. zaman serileri ile ilgili. şansa bak zaman serileri görüntü işlemeden sonra en az deneyimimiz olan veri bilimi alanı. ne var ki bir kaç tane problem de çözmüştük. arkadaş çözüp geri gönderdi bakalım ne olacak.

    16.06.21 editi:
    macd projesine başladım. macd dediğimiz şey finansal piyasalardaki bir indikatör. bu indikatöre göre al-sat yapsaydık karda mı olurduk zararda mı olurduk sorusunu inceliyorum. hazır bir kütüphane bulup oradan indikatörleri hazır olarak aldım. bunu önemli olarak görüyorum. çünkü her ne kadar bu indikatörlerin formülleri basit gibi görünse de geçmişte yaptığım hiç bir denemede benim hesapladığım indikatör değeri ile gerçek indikatör değeri uyuşmuyordu. dahası çoğu kişiyi de internette bu konu hakkında şikayet ederken görmüştüm.

    şimdi algoritma kısmı. python'u çok unutmuşum. bu algoritmayı yazmak biraz zaman alacak. diyeceğimiz şu: her satırı kontrol et. eğer o günde macd_mavi değeri macd_kırmızı değerinden küçükse ve sonraki gün macd_mavi değeri macd_kırmızı değerinden büyük hale geldiyse alım yap, bu durumun tam tersi geçerliyse satış yap.

    17.06.21 editi:
    macd projesinde ilerliyoruz. algoritma şunu buldu: bu kurala göre al sat yapsaydın 25k dolar kar ederdin. ama tabi burada bazı yanılgılar var. onları düzeltmeliyiz. mesela btc piyasası yerine yatay seyreden bir piyasada aynı kuralı denemeliyiz. rakam değil yüzdesel kar/zar bulmalıyız.

    19.06.21 editi:
    macd projesinin en önemli kısmı bitti. btc piyasasında bu taktikle para kazanılıyor. ama hiç işlem yapılmasaydı daha çok kazanılıyordu. yine de en olmadık zamanda para kaybetmeyi başaran amatör kitle için güzel bir algoritma bence. dolar-eur piyasasında ise %11 zarar veriyor bu taktik. acaba bunun tam tersini uygulayan biri kara mı geçmiş olacak? bu sadece kaba analiz. daha detaylı istatistikleri çıkaracağım.

    22.06.21 editi:
    macd algoritması ile btc alım satımında gelen karı biraz küçümsemiştim. aslında düşünüyorum da ayı sezonlarından kaçınmak isteyen bir yatırımcı için o kadar da kötü değil. fair enough bir algoritma olabilir. dolar/eur piyasası ise biraz ilginç sonuçlar verdi. 1999'dan beri şimdiye kadarki zamanı 4'e ayırırsak ilk dönem %12 kar, ikinci dönem kar, üçüncü ve dördüncü dönem ise zarar getiriyor. yani sadece macd'ye dayanarak piyasanın ne yapacağı pek belli olmuyor. bir de haftalık macd'lere mi baksam acaba?

    30.06.21 editi:
    şu aralar macd algoritmasının internet makalesini yazıyorum. insan makaleyle falan hiç uğraşmak istemiyor ama yaptığım işleri belgelemek gerekiyor. sadece kariyer olarak değil aynı zamanda kendim de girip önceki çalışmalarıma bakıyorum. yine de zor.

    03.07.21 editi:
    insanlar çoğu zaman bana iş bulma ile ilgili sorular soruyorlar. ben iş aramıyorum ama arayan bir arkadaşım vardı. bu günlüğün büyük bir bölümünde birlikte çalıştık. günlüğü okuyan okuyucuların kafasında acaba ben iş bulabilir miyim? sorusu dönüyordu. özellikle de iş ilanlarının çok daha az olduğu türkiye'de. benim birlikte çalıştığım arkadaş daha yeni elektronik mühendisliğinden mezun oldu. üniversite öyle en iyi üniversiteler arasında değil. dediğim gibi ilan sayısı da az. fakat arkadaş kendi tabiri ile daha diplomanın mürekkebi kurumadan "machine learning engineer" title'ı ile iş buldu. hem de istanbul dışında kendi ilinde. bence bu açıdan savaşı kazandık. 2020 mart ayından beri yazdığımız bu günlük iş bulma açısından bakıldığında amacına ulaşmış oluyor. bu yaptığımız çalışmaları linkedin'imize ekliyoruz. gerçekten de junior veri bilimci alınacağı zaman o arkadaşın cv'si varken gidip başkasını işe almak tam bir mallık olurdu. arkadaş neredeyse 0 ingilizce biliyordu. bu çalışmalar sırasında ielts de kasmaya başladı. benim fikrim şu. ielts'i de alınca yurt dışında yıllık 70k dolarlık bir işe girip de yapamaması için hiç bir sebep göremiyorum. hatta akranlarından daha ileride bile olacağından eminim. bu konuda iş bulmak konusunda isteği olan herkese kutlu olsun.

    https://www.youtube.com/…0de0z0g241buso-xt&index=35

    04.07.21 editi:
    macd makalesini bitirdim. son rütuşlardan sonra yayınlayacağım. kalitesi cillop gibi oldu. makalenin kalitesinin böyle olacağını çok tahmin etmiyordum.

    09.07.21 editi:
    kemal sunal'ın salak şakir diye bir filmi vardı. bu aralar o filmde "feza televizyonunu" yapan dayı gibi hissediyorum kendimi. bir trade algoritması var. şu kabloları da bir birine bağlarsak çok ilginç şeyler olabilir.

    12.07.21 editi:
    bulunduğumuz noktayı koruyup algoritma üzerinde çalışmaya devam ediyoruz. bu proje sanırım bir kaç ay sürebilir. moralim fena değil.

    21.07.21 editi:
    son dönemde çalışmanın biraz bokunu çıkardım. her yerde algoritma düşünüyorum. tuvalette, duş alırken, yemek yerken. dün gece yattım. uyuyamadım gece 3'de kalktım kodlama yaptım. bir taraftan da açıyorum ne kadar efkarlı şarkı varsa öyle sabah ediyorum.

    hal böyle olunca biraz psikoloji çöktü. oturdum dota oynadım. sanki kum yiyormuş gibi bir tat veriyor. keyif almıyorum. ahanda şu şarkıyı belki 50 kere tekrar dinlemişimdir:
    https://www.youtube.com/watch?v=d5ubtdggjea

    böyle bir taraftan gidip fuzuli şiirleri bulup okuyasım gibi hissetsem de üzerinde çalıştığım trading botu çok iyi sonuçlar veriyormuş gibi duruyor. valla ben hala da aslında çok inanamıyorum. bunun bu kadar iyi sonuçlar vermemesi lazım.

    yani bir taraftan somut olarak hayat süper bir istikamete giderken bir taraftan da psikoloji takke kuralım orada şiir falan yazalım moduna gidiyor. nasıl bir kafa ben de anlayamadım aq. para kazansam parayı napacağım diyordum geçende. bir taraftan cimri bir bünye olarak kazanılan parayı maksimize etmeye uğraşırken bir taraftan da para kazanmak yolunda uğraşmak beni çok da motive etmiyor.

    22.07.21 editi:
    algoritma üzerinde çalışmaya devam ediyoruz. bir gün zengin olursam şu hunk kostümünden satın alıp bir kıyafet etkinliğine katılacağım. o gaz maskesini de takacağım. uyku muyku düzeni diye birşey kalmadı.
    https://www.youtube.com/…0de0z0g241buso-xt&index=85

    02.08.21 editi:
    1 hafta boyunca mali işlerle uğraşmak zorunda kaldım. algoritma üzerinde çalışmaya geri dönebilirim. yalnız bir hata keşfettik. o kadar uzun programda bir satır yüzünden program bir nevi geleceği görüyormuş. hatayı düzeltince başarı oranları tekrar düştü. şimdi epey geriden tekrar devam etmek gerekiyor.

    23.08.21 editi:
    29 hazirandan beri trading bot'un üzerinde çalışmaya devam ediyorum. çok yavaş ilerliyoruz ve tamamlamamız gereken çok fazla task var ama yapacak bir şey yok. işin doğası böyle. bu aralar eski bir yazılım geliştirme alışkanlığımı tekrar uygulamaya başladım. dosyanın her versiyonunda yapılacak işler ve tamamlanan işler diye bir liste tutuyorum. bazen aklıma bir sürü madde geliyor. onları oraya kaydediyorum. sonra bazen de aklıma hiç yapılacak görev gelmiyor. bu liste işi hakkikaten yararlı.

    02.09.21 editi:
    ben kendi projem üzerinde çalışmaya devam ediyorum. ne yazık ki yazabileceğim çok farklı bir şey yok. kodlama yaparken arka planda cendere açıp dinliyorum. yaptığım iş monoton bir iş. gılgamış dünyanın sonuna gitmişti. oraya giderken bir tünelden geçmişti. o sırada sanırım haftalar boyunca hiç değişmeyen bir yolda ilerlemişti. aynen öyle bir şey işte. bıkkınlık da verdi ama yapacak bir şey yok.

    öte yandan beginner bir arkadaşla da ara sıra data science bakmaya devam ediyorum. arima model diye bir şey var. zaman serileri için bir model. zaman serileri benim en zayıf olduğum ama aslında önemli bir alan. finans piyasaları için de önemli. o alanda da yavaş da olsa bir şeyler öğreniyorum.

    14.09.21 editi:
    finansal işler nedeniyle 2 hafta kadar ara vermek zorunda kaldım. şimdi kaldığımız yerden devam.

    --- spoiler ---

    2021 sonundaki durum:
    --- spoiler ---
    bu kadar çalışmanın sonunda çalışmaya benimle birlikte başlayan arkadaşım türkiye'de işe girdi. ielts'i geçince yurtdışında da işe girebileceğinden eminim. benim de bu seviyede işe girebileceğimi düşünüyorum. ne var ki veri biliminde ilerledikçe bir trade algoritması yazabileceğimi ve başarılı olursa bu işten iyi para kazanabileceğimi düşündüm. bu sebeple iş arama sürecini bir kaç ay önce kapattım. algoritma meselesi veri biliminden farklı bir alan olduğu için de sanırım artık bu günlüğün konusu olmuyor. yani günlük burada son bulmuş oluyor. yılmayın. çalışın. öğrenin. sertifikaları alın ve cv'nize yaptığınız projeleri ekleyin. başarılı olacağınıza eminim.
    --- spoiler ---

    haziran - temmuz - ağustos 2022
    --- spoiler ---

    06.06.22 editi:
    günlüğü kapattığım tarihten beri 7 ay geçmiş. acaba tekrar yazmaya başlasam mı diye düşünüyorum. düzenli olarak ekşiden arkadaşlar günlüğün devam etmesi yönünde istekte bulunuyorlar. günlüğe başlarken tek bir çarem vardı. şimdi ihtimaller daha çeşitli. yani ilk baştaki tek hedef, tek çare konteksi şu anda mevcut değil. dolayısıyla günlüğün bundan sonraki kısmı o kadar da target oriented olmayabilir. acaba yine de yazsam mı? sanırım ara ara buradan yine paylaşımda bulunacağım.

    08.06.22 editi:
    bugün dün olduğu gibi trade algoritması üzerinde çalıştım. bitirmeye çok az kaldı. algoritma günlük bazda çalışıyordu. son olarak sadece 4h'lik mumlarda nasıl çalıştığına bakacağım. bu pazar veri bilimci olmak isteyen insan kaynaklarcı güney koreli bir arkadaşla konuşacağım. yol haritası falan soruyor. bu haritayla olacak iş değil ki ama bunu nasıl diyeceğim. gel işte makale yazalım. ne kadar makale yazarsan ve kurs bitirsen şansın o kadar artar.
    burada gerçek darboğaz yol haritası değil. başka şeyler. o başka şeylerden daha sonra bahsederim. çok zaman alacak bir açıklama. yol haritasına gelince veri bilimi çok genel bir ifade. daha spesifik olması gerekiyor. kaldı ki ben arkadaşa büyülü bir program verdiğimi düşünelim. azalan fayda kanunu diye bir şey var. sen mesela nlp dalını seçtin ve sadece o alana odaklandın. her level atlamanda sonraki levele geçmen için vermek zorunda olacağın çaba artacak. daha az sıklıkla öğrenmeden tatminiyet duyacaksın. çünkü birim çaba başına öğrenmen azalacak. sonra sen lvl9 nlp'ci olmuşken lvl1'de kalmış zaman serisi kabiliyetine bakacaksın. "lan şu problemlere biraz baksam" diyeceksin. oradaki lvl1 yeteneğin seni öyle veya böyle yoldan çıkartacak. çünkü lvl1'deki veri bilimi skill'in için birim çaba başına çok daha fazla öğrenme tatminiyeti yaşayacaksın. muhtemelen de bu isteğine saçma bir mantıklı açıklama getirip kendini kandıracaksın. o yüzden insanın doğası gereği tek bir alana odaklanmak, tek bir çalışma programına odaklanmak mümkün olmayacak. sanırım insanın uzman olması için odiseyus gibi kendini direğe bağlaması gerekiyor. neden direğe bağlama örneği verdiğimi daha sonra açıklayayım.

    10.06.2022 editi:
    canım sıkkın. ayaklarım yürümek istiyor ama gece 11 oldu. ara ara huzursuz bacak sendromu geliyor.
    bugün neredeyse trade algoritması bitti. neredeyse tam 1 yıl buna uğraşmışım. vay be ömrümün 1 yılı gitti. teoride çalışacak gibi duruyor ama hiç para yatırasım da yok. zaten halen trade bulmadı. eğer çalışırsa bir kaç yılda kazandıracak. yani öyle köşeyi dönme gibi bir durum yok.
    bugün arkadaşla konuştum. bu algoritmanın bulduğu trade sonuçlarının kalite testleri yapılması lazım, kalite kontrolden kim anlar dedim. endüstri mühendisi lazım dedi. aslında sorduğum sorunun yanıtını bilerek sordum. evet dedim istatistik de bilmesi lazım. var mı bildiğin endüstri mühendisi dedim. yok dedi. biz ikimiz de aslında endüstri mühendisiyiz. ben de istatistikten en yüksek notları alarak bitirdim yüksek lisansı ama şu anda istatistik namına hiç bir şey hatırlamıyorum.
    sanırım bu arada freelance veri bilimi işlerine bakacağım. bir taraftan da bir akademik bildiri yazmaya çalışıyoruz arkadaşla. bu arada hanıma veri bilimi öğrettim. 3 ayda iş buldu. şu aralar yapay zekaya yeni pokemon isimleri ürettiriyordu. kız benle tanıştığında uluslararası hukukta ödev için mao kitapları okuyordu şimdi türev mürev çalışıyor.
    bir taraftan da akademik başarı hakkında bir kitap yazmaya çalışıyorum ama zaman yok. akademik bildiri ve freelance daha öncelik.

    https://www.youtube.com/…de0z0g241buso-xt&index=145

    acaba düşünüyorum. almanya yaşam sahası istiyordu. e bunu fransa'yı işgal ederek zaten elde etmiş. romanya'yı alıp petrole de ulaşmışsın. insanları kuzey fransa'ya yerleştirsene sovyetlere neden saldırıyorsun kardeşim? çok saçma. tarih hakkında neredeyse her açıklamanın kolpa olduğunu düşünüyorum. acaba ww2'yi almanya kazansaydı fransa'ya ne olacaktı? bu konuda internette bir bilgi yok. yani adam ukrayna hakkında plan yapıyor ama fransa hakkında hiç bir tasarı yok.

    11.06.22 editi:
    güney koreli arkadaşla konuştum. portfolyoya eklemek için bir projesi varmış. birlikte yapalım yardımcı olurum dedim. bakalım ne olacak.
    bu aralar sanırım 2 tane medium makalesi yazdım. makale sayısı artıyor. bir tane solar enerji hakkında, bir tane ameliyathane planlaması hakkında.
    ols tablosu vardı. bunu unutmuşum. ols tablosu hakkında bir tane makale yazmak lazım. anova testleri falan vardı. bu testleri unutmuşum. bunlar önemli. bu testler hakkında da makale yazmam gerekiyor ki tekrar hatırlayayım.
    kafeinsiz kahve aldım. çok güzel kokuyor. bu aralar çalışmanın başında 1 veya 2 tane medium veri bilimi makalesi okuyorum.

    15.06.22 editi:
    bugün bir medium makalesinde data scientist olabilir misinizi olamaz mısınız şeklinde bir notebook modeli gördüm. verdiğiniz yanıtlara göre 1 veya 0 sonucu veriyor. ahanda . ben daha denemedim ama sonra denerim.
    bu arada arkadaşla bir akademik bildiri yazmaya çalışıyoruz. aslında makale de olabilir. nlp ile alakalı olacak. bir akademik dergide makale yayınlatamamak hep içimde ukte kalmıştır. yüksek lisans bitirme projesinden 10 numara makale olurmuş ama o dönem gücüm tükenmişti. keşke o dönem o projeyi yayınlatsaymışım derim hep.

    17.06.22 editi:
    moralim çok yüksek. ilerlemeye devam edeceğiz. teslim olmak yok.
    wir kapitulieren nie!

    18.06.22 editi:
    bugün yazdığımız akademik makale üzerine çalıştık. gelecek hafta sadece bu makale üzerine çalışacağım gibi duruyor. ama makale yayınlatmak, konferasa katılmak falan bu konularda hiç bir bilgim yok. kimden sorsam acaba?
    öte yandan eskiden çözdüğüm ama medium makalesi haline getirmediğim kodları şimdi arkadaşlarla tekrar çözüp makale haline getirmeye çalışıyorum. sonra da portfolyoya ekleyeceğim. eski kodları çözerken şimdi esas aldığım husus tüm problemleri aynı tip uslup ile çözmek. nasıl ki kanuni devrinden sonra camiler aynı tipte üretildiyse çözdüğüm problemler de aynı standart üslüp ile çözülmesi gerekiyor. eski kodlar ise savaş alanı gibi.

    19.06.22 editi:
    bugün bir nft datasından analiz yapan medium makalesi üzerinde çalışmaya devam ettik. makale neredeyse bitti gibi duruyor. haftaya yayınlamış oluruz. database'den en pahalı nft projelerini sıraladık ve görsellerine ulaştık.

    öte yandan akademik makale konusunda da ilerliyoruz. literetür araştırması hakkında geç de olsa bir şey farkettim. bazı makaleler diğer makalelerin derlemesinden oluşuyor, sırf literatürü özetliyor. aslında ilk olarak o makelelere bakmak lazımmış. türkçe için zemberek kütüphanesi var. onu kullanarak kelimeleri işleyeceğiz. bir de duygu kütüphanesi varmış. o kütüphaneyi de kullanıp modeli eğiteceğiz.

    bu aralar ikinci defa black summer dizisini izliyorum. görece gerçekçi bir zombi dizisi. walking dead'teki rick ve grubunu hiç sevmiyordum.

    geçende güneş ışıma patlaması olur da elektrikler tamamen giderse japonya'da ne yapmamız gerektiği hakkında konuştuk. sanırım öyle bir durumda okullar toplanma alanı oluyor. tek takılmaktansa hemen oralara gitmek lazım. ilk çeteler okullarda oluşacak. yemek stokları bitince bu kurtarma alanlarındaki insanlar vatandaştan çeteye evrilip çevredeki evleri yağmalamaya başlayacaklar. önce muhtemelen boş evleri yağmalayacaklar. bir süre sonra üye alımını durduracaklar. sonra kaynaklar azalınca dolu evleri de tahliye ettirmeye başlayacaklar. japon insanını yağmacı olarak gözümde canlandıramıyorum. ama insan doğasını çözdüysem eğer olayların böyle olacağından da eminim.

    20.06.21 editi:
    akademik makale çalışmasına devam ederken gayet kaliteli türkçe bir makale okudum. yayınlandığı dergiye baktım dandik bir dergi. garip geldi. makale bir literatür araştırma makalesiydi. bir alanda ilk defa makale yazacaksanız bence en iyi başlangıç bir literatür tarama makalesi yazmak. sonra yazarını merak edip araştırdım. kel alaka bir bölümde kariyerinin başında bir akademisyen. önceki makalelerine baktım tamamen kel alaka konular. o an çok heyecanladım. "aha" dedim. "tahmin ettiğim gibi bu akademisyen machine learning" alanına geçmeye çalışıyor. o an afrika'da çok ucuza yetenekli futbolcu keşfetmiş kulüp başkanı gibi heyecanlandım. muhtemelen bu akademisyen kodlamadan da hiç anlamıyor. bu kişi ile gelecekte irtibata geçip birlikte makale yazabiliriz. benim şu an birlikte çalıştığım arkadaş da katılır. bizim kodlama tarafımız güçlü. ama konferans falan filan akademik tarafı çok bilmiyorum. bu arkadaş da literatür tarafını halleder. gelecekte iyi bir makale çıkarabiliriz.

    nlp konusunda iki yöntem var. biri duygu kütüphanesi kullanmak(lexical based) ikincisi de labellanmış veri kullanmak(machine learning based). ahan da şurada iyi bir etiketlenmiş hazır data buldum: http://humirapps.cs.hacettepe.edu.tr/
    bunun dışında veri setinizi, kelimelerinizi işlemeniz gerekecek. işte ekleri atmak olsun, yazım yanlışlarını düzeltmek olsun.. bunun için de zemberek kütüphanesi var. gerçi zemberek'e karşı epey bir negatif duygularım var. bir de bu kütüphane javada yazılmış. python'da nasıl kullanılacağı ile ilgili araştırma yapmak gerekiyor.

    arkadaşlar gayret etmeye devam. sonunda avrupa kapılarını aşacağız. hem de gittiğimizde avrupa toplumunun görece zengin ve prestijli bireyleri olarak yaşayacağız. ülkemizdeki ekmek yiyip şükredin diyen sikimsonik dedelerin tersine umarım haftasonları machine learning engineer maaşı ile yelkinli bot sürme kursuna katılacağız. bir cnc tezgahında saatte binlerce metanın üretilebildiği bir teknoloji çağında hiç kimse ekmek yemekle yetinmek zorunda değil. mevcut teknolojik üretim araçları insanoğlunun refah içerisinde yaşamasına olanak sağlıyor.
    https://www.youtube.com/watch?v=s9rukrpl028

    21.06.21 editi:
    yavaş yavaş hangi makale kalitelidir hangisi değildir ayırt edebilmeye başladım. daha önceden endonezya'daki dergilerde yayınlanmış makalelere bakıp "lan biz bunlardan daha iyisini yaparız" diyordum. şöyle bir makaleyi okuyorum. biraz moralim bozuldu. biz standart bir bag of word yöntemini kullanacağız adamlar neler neler yapmış. zaten anlattıklarını anlamam için üç kere falan baştan okumam lazım. bir de yayınladıkları dergiye baktım. citeskor diye bir şey var. 11.5 mi neydi. bir de yazarın profiline baktım. kadın lisansta, yüksek lisansta, doktorada aynı konu üzerine çalışmış halen de google'da çalışıyor. ulan biz kimlerle rekabet etmeye çalışıyoruz dedim. ama yılmak yok ilerlemeye devam etmek lazım.

    22.06.21 editi:
    bugün de makale okumaktan yaşam sevinci kalmadı. gerçi öyle çok okuyamıyorum çok zaman harcıyorum ama olsun çok yavaş olsa da ilerliyoruz. bir bildiri yayınlamamamız için hiç bir sebep yok.

    https://www.youtube.com/…d06pbs52tdo0&start_radio=1

    artık sabahları çok sıcak oluyor hava. eskiden 07:00'de 1 saat yürüyordum. artık anca 18:00'de çıkıp yürüyorum.

    23.06.21 editi:
    bugün de makale okumakla falan geçti. yavaş da olsa ilerliyoruz. makale okumak çok mutluluk düşürücü.

    makale olayından bağımsız olarak aklımda şöyle bir soru var ama araştırmaya üşeniyorum. daha ilk kez data science öğrenirken sadi evren'in kursunda hangi sütunların modele ekleneceğine karar verirken ileri ve geri birşey yöntemi kullanıp p value'lara bakıyorduk. çoğu şeyi unuttum ama az çok hatırlar gibiyim. muhtemelen, %95 güven aralığında o sütunun modele etkisi olup olmadığını görmek için bu işlemi yapıyoruz. peki bu çok a-pratik bir yöntem değil mi? yani gerçekten önemli bir projede bu yöntem uygulanır ama acaba benim yaptığım kısa alıştırmalarda böyle mi yapmalıyım? yoksa, ben direkt şak diye korelasyon matrisine bakıyorum. belli bir düzeyin üzerinde korelasyonu olan sütunları modele ekliyorum. acaba hiç böyle yapmasam, korelasyona etkisi olmayan 1 milyon sütun olsa. direkt tüm sütunları modele eklesem bunun ne zararı olur? performans dışında bir zararı olur mu? mesela alakasız bu 1 milyon sütun modelin başarısını düşürür mü yoksa bir etkisi olmaz mı? bir etkisi olmaz ise niye ole tablosunda p-value'lara bakıyoruz da sütunları tek tek ekliyoruz? bence bir etkisi olmaz diye düşünüyorum. yani sadece modeli yavaşlatır. yine de bu sorunun cevabını birisi mesaj atarsa buraya ekleyebilirim.

    24.06.22 editi:
    bugün biraz akademik konferanslara bakayım, nereye paper göndermeliyim diye araştırma yapayım demiştim. waset diye bir site vardı. cillop gibi tüm konferanslar orada listeli. çok iyi bir konferans veritabanı bulduk diye seviniyordum. biraz araştırmaya devam edince waset olayının scam olduğunu öğrendim. puff.

    öte yandan şöyle bir korkum var. bir yerde bir youtuber'dan bildiri göndermek için para ödemek gerekiyor gibi bir laf duydum. nasıl ya? hem paper'ımız kabul edilecek hem de para mı ödememiz lazım? bunu da araştırmak lazım. bir de artık korona'dan sonra konferanslar fiziksel olarak değil online olarak gerçekleşiyor diye duymuştum. benim öyle bir konferansa katılmam lazım. veya hiç olmadı türkiye'de bir konferans olursa arkadaş katılır sunumu yapar. veya belki tokyo'da bir konferans bulurum. ama para falan ödemiyor olmamız lazım. öteki türlü çok saçma olur. acaba bu konferansların listesini hangi web sitesinden bulabilirim?

    25.06.22 editi:
    konferansa bildiri göndermek için para ödemek gerekiyormuş ya. tam da tokyo'da bir konferans bulmuştum. doğaçlama sunumum berbattır ama hazırlandığım(saatlerce) sunumlarda şov yaparım. tam da dedim ki tokyo'daki mekana gidip akademisyenlerin aklını alacağım, ingilizce sunumu yapacağım... orada 500 dolares yazısını görünce hassiktir dedim.

    sonra arkadaşla konuştuk. türkiye'de sunumlar daha ucuz gibi duruyor. verelim parasını cv'mizde bir bildiri olsun dedik. makale yazıp yazmama konusunda ise daha sonra karar vereceğiz. acaba değer mi akademik makale yazmak?

    27.06.22 editi:
    türkiye'de ucuz bir konferans bulduk. ona kayıt olacağız. hayaller tokyo, osaka, kanada konferansları gerçekler ege'de bir konferans swh. bir tane de trakya'da vardı ama ona fiziksel olarak gitmek gerekiyormuş. bu konferansta seçilen bildiriler aynı zamanda makale olarak basılacakmış. bir taraftan diyorum ki kaliteli bir bildiri yaparsak dergide de makalemiz olur. iki işi bir kerede yapmış oluruz. ama siz de biliyorsunuz, çakal hocalar kimin bildirisinin dergide yayınlanacağı ile ilgili kontenjanları kendi aralarında çoktan paylaşmamışlar mıdır?

    dün arkadaşla biraz ml algoritmalarının içeriğine dair konuştuk. epeyce unutmuşum. onları bi tekrar hatırlamak lazım. sanırım bir tane de a/b testi hakkında medium makalesi yazmak gerekiyor. onu da unutmuşum bilgilerimi pekiştirmem lazım. öyle bir makale medium'da iyi ziyaretçi alır. çünkü herkes ilk olarak a/b testini araştırıyor. zamanında internette aratmıştım çok uyduruk örnekler vardı.
    hele ki bir de teknik dilde yazıyorlar ki uyuz oluyorum. ya bu anlatım dilleri niye bu kadar kötü? adamlar mesela bir matematik teorisini öyle bir şekilde anlatıyorlar ki rocket science sanıyorsun, korkuyorsun. sonra çalışıp anlayınca "ha siktir, bu kadar basit bir şeyi mi bu kadar soyut bir dille anlatıyorlarmış" diyorsun. konuyu anlayınca oradaki bir-iki cümlelik tanım gerçekten anlamlı geliyor ama iyide gardaşım ben o tanıma konuyu anlamak için bakıyorum. keşke matematik konuları "ahanda bunu alıp buraya koyacaksın" şeklinde konuları anlatsa.

    bir ara cv'deki fotomu değiştirip gülen bir foto ekleyeceğim. gülen bir foto iyi olabilir. şimdiki foto ciddi duruyor. bir de loom.com varmış. orada kısa video yapıp linkini ekliyormuşsun. ondan da yapacağım. kendimi kısaca tanıtan bir video oluşturup linkini cv'ye ekleyeceğim. ya esasında böyle genetik ile falan ilgili high-tech firmalarda çalışmayı çok istiyorum ama oralara beni almazlar herhalde phd olmadan. ah.. ah..

    30.06.22 editi:
    makaleleri okudukça kızıyorum ve hayıflanıyorum. ben 2017'de daha türkçe çok literatür de yokken cillop gibi yüksek lisans bitirme projesi yapmışım nlp üzerine. ama bu çok kaliteli değildir diye, bir taraftan da gücüm tükendiği için makalesini yazmamıştım. çok da kaliteliymiş be. bunun data setini internete yükleyebilirmişim. hocam biraz ittirse bunun makalesini yazarmışım. hoca bir destek atmamakla ayıp etmiş resmen ya. güzelim proje boşa gitmiş. kendimi biraz walter white gibi hissediyorum. veri bilimi camiasına karşı bir hıncım var. en iyi konum ne ise, yapılabilecek en kaliteli iş neyse onu yapmak istiyorum. ne kadar sertifika varsa onları da alacağım. kendimi sınırlamam için söylenmiş her söz küfür gibi geliyor bana.

    bir taraftan içimi dökerken bir taraftan teknik bir bilgi de vereyim. nlp konusunda iki yaklaşım var. lexicon type ve machine learning type. lexicon type konusunda sözlükler var. bu sözlüklerde her kelimeye önceden bir duygu puanı vermişler. siz bu sözlüğü veri setinize uygulayınca tek tek her kelimenin puanını ölçüyor ve çat diye tüm cümlelerin duygu puanını veriyor. diğer yöntem machine learning stili. burada da olumlu/olumsuz diye labellanmış yorumlara ihtiyacınız var. böyle önceden etiketlenmiş data setleri var. bunları algoritmaya verip öğren diyeceksiniz. algoritma öğrenecek. yapılan çalışmalara göre lexicon based, ml based yaklaşımları arasında çok başarı farkı yok. ama bunları harman ederseniz orada başarı daha artıyormuş.

    03.07.22 editi:
    makaledeki çalışmada word embeded tekniği olarak word2vec kullanıyoruz. ben tf-idf'e daha aşinayım ama kod kısmındaki arkadaş word2vec kullanmış. şimdi biraz kafam karıştı. her word2vec yerde word2vec'in klasik tanımları ve örnekleri var. evet w2v kelimeler arasındaki ilişkiyi içeren bir matris oluşturur falan filan. yani aslında train edilmesine gerek yok? veya bir corpus ile train edilebilir? o zaman aslında labellanmış cümlelere ihtiyaç duymuyor? eee biz hacettepe'nin labellanmış sinema yorumlarını verdik oldu. nasıl oldu? kafam karıştı biraz. ne yani, acaba o cümlelerin hangisinin olumlu hangisinin olumsuz olduğunu söylemeseydik, w2v yine de bir sonuç bulabilecek miydi? bu word embedding tekniği pratikte nasıl kullanılıyor halen tam anlamadım.

    bir de neredeyse hiç bir akademik çalışma standart ml algoritmalarının dışında bir şey kullanmamış. niye kullanmıyorsunuz olum? özel bir sebebi mi var? anca bir iki tane lstm var onun dışında ne optimizasyon yapmışlar ne de stacking yapmışlar. acaba bu şeyler zor olduğu için mi yapmıyorlar? benim bilmediğim bir şey mi var? niye israrla svm falan kullanıyorsunuz stack etsenize, harmanlasanıza modelleri.

    öte yandan verilerini kullandığımız 3 tane youtube kanalına mesaj attık. böyle böyle çalışma yapıyoruz. sizle de bir konuşmak isteriz diye. ses seda yok. bir tane akademisyene mesaj attım. konuşalım dedi.

    bugünlerde sabah acayip sıcak olduğu için yürüyüşe gidemiyorum. bu çok kötü. ama bazen akşamları dışarı çıkıyorum. bugün 17:30 sularında yürüyüşe çıktım. yolun ortasında sıcak havada sağnak yağmur yağmaya başladı. sağnak yağmurda ilerlemekten bir keyif almadım değil. gelecek için umutluyum. umuyorum bir iki ay sonra çok daha iyi durumda olacağız.

    https://www.youtube.com/watch?v=q_qyabf4suc

    04.07.22 editi:
    ya word2vec bir kelimenin öncesinde hangi kelime gelebilir, sonrasında hangi kelime gelebilir onu tahmin eden bir şey. pozitiflik, negatiflik bunları nasıl tahmin ediyor acaba diye düşünmeye devam ediyorum.
    akademik makalelere github repository linki eklemiyorlar. neden? repository'siz makale mi olur? bence olmamalı. adam şöyle yaptım böyle yaptım sonuç şu geldi diyor. ne bilelim? bilimde deneylerin tekrarlanabilmesi esas değil midir? bence akademinin bu alanında kesinlikle böyle bir gelenek olmalı.
    bir çok makalede adamlar tekrar tekrar kullandıkları algoritmaları açıklıyorlar. bu gerçekten sayfa israfı değil mi? yeni bulduğun bir algoritmayı anlatıyorsan tabi ki anlat. ama 1980'lerde bulunan, herkesin kolayca matematik formülüne erişebileceği bir formülü acaba paper'a tekrar yazmak zorunlu mu?

    05.07.22 editi:
    bugün valideden bir mesaj aldım. çok uzun zamandır konuşmadığım bir çocukluk arkadaşım vafat etmiş. aramızda bir ilişki kalmamıştı ama yine epey üzüldüm. uzun süreden beri ilk defa gece uyuyamadım. ama yapacak bir şey yok. mecbur olarak ilerlemeye devam edeceğiz.

    06.07.22 editi:
    word2vec olayını anladım. word2vec sadece tf-idf'in farklı bir versiyonu imiş. doğru anladıysam okul kelimesini word2vec haline getirirseniz "okul" ifadesi yerine 100 sütunlu bir satır oluyor mesela. o 100 sütun diğer kelimeleri ifade ediyor. sonra da modeli eğitmek için önce bu word2vec haline getirilmiş veriyi veriyoruz. aynı anda bu cümlelerin labellarını da veriyoruz, model öğreniyor. peki tf-idf mi daha iyi sonuç veriyor yoksa word2vec yöntemi mi? bu arada bu yöntemlere word embedding metodları deniliyor. bir makalede bunu karşılaştırmışlar. genelde tf-idf bir tık daha iyi gibi. bir sır vereyim. bir makaleye göre bu iki yöntemi harmanlamak daha iyi sonuç veriyormuş. bu iki yöntem nasıl harmanlanır? hiç bir fikrim yok.

    https://www.youtube.com/watch?v=75p0qgi3ro0

    07.07.22 editi:
    ara ara farklı data scientistlerin portfolyolarına, web sayfalarına bakıyorum, kendi portfolyomu veya daha geniş bir ifade ile imaj yönetimimi örnek aldığım kişilere benzetmeye falan çalışıyorum. imaj yönetimi gerçekten çok önemli. bunu herkes söylüyor. ama sayısal olarak "çok önemli" nin karşılığı nedir? valla belki de harcanan emeğin %20'si imaja gitmesi gerekiyor. 1000 saat harcıyorsak 200 saat de imaj için harcanacak. bu da işin, kariyerin bir olmazsa olması sayılması gerek.

    ara ara "lan acaba cv'yi abarttım mı?" diye kendi kendime soruyordum. neredeyse cv için beton döktüm. dökmek de gerekiyor. elin hollandalısı japonu benim mezun olduğum okulu nereden bilsin, benim gidip 9 ay emek harcadığım bilgisayar mühendisliği sertifika programını nereden bilsin. yazmışım oraya ama gerçek olduğunu nereden bilsin. sonuçta hintliler de yazıyor da yazıyor. ben de gittim tüm her şeye link verdim. cv'deki her şey tıklanabilir olsun, ulaşılabilir olsun. bir türk'e sorsan abartmışsın der ama sanmıyorum. bu şirketler için gerçekten hayatımızı harcıyoruz. hakettiğimizden %20 kalitesiz sikko bir şirkete düşsek orada her gün gidip saatlerce oturacağız. saçma salak insanlarla muhattap olacağız. binlerce saatimizi oralarda harcayacağız. böyle bir durumda cv'ye 50 saat, 100 saat harcayıp da %20 daha kaliteli bir ortama girme fırsatını tepmeye değer mi?

    bugün bir cv'ye, profil sayfasına denk geldim. yüksek lisans yapan bir öğrenci. bence akademik çalışmaları dışında portfolio öyle acayip bir şey değil ama profil sayfası stili 10 numara. benim şimdiye kadar karşılaştığım en iyi örnek bu. zaman geçtikçe de oradan arak yapmaya çalışacağım:
    https://dilettagoglia.netlify.app/

    13.07.22 editi:
    bu aralar kulağım, gözüm falan ağrıyor. sanırım 20'lik dişin yüzünden. lanet olsun. ne zaman çalışma konusunda işler yolunda gitse böyle bir sağlık problemi ortaya çıkıyor. cuma günü dişçiye görüneceğim.

    bugün bildiri için gerekli kaynakça bölümünü hazırladım. çok zaman aldı ama bitti. şimdi geriye gerekli deneyleri yapıp paper'ı editlemek kalıyor.
    en basit tanımları paper'da yapmak istemiyorum. zaten 6 sayfa sınırı var. basit kavramları da tekrar edersem yer kalmaz. ayrıca çoğu paper'ı okurken de laf kalabalığı yapanlara ağır sövüyordum. adam 20 sayfa yazmış. oku oku bitmiyor. sonra bir bakıyorum ben yeni ne öğrendim. çok azcık hatta hiç bir şey. sonra gittim akademisyenlerin web sitesinde arattım. herkes demiş ki o paper'ı okuyanlar o konuya yabancı olabilir falan filan. "ya bi siktirip gidin ya" diyecektim. nlp researcherdan başka kim gider de akademik yapay zeka paper'ı okur? okuyan da bir zahmet temel kavramlara aşina olsun. bence çok az kişi okur. basit tanımlamaları falan yapmayacağım kardeşim. bence makale az ve öz olmalı. biri o konuyu da ilk defa araştırmak istiyorsa adres akademik paper olmamalı.

    bunun dışında bu aralar her sabah bir iki tane medium ml makalesi okuyorum. bunu bir kural haline getirdim. uzun vadede yararlı olacağını düşünüyorum. portfolyoya 1-2 tane proje ekledim ilerleyişimiz sağlık problemi dışında güzel gidiyor.

    14.07.22 editi:
    ilerleyişimiz devam ediyor. makalelerden nlp hakkında epey bilgi öğrendim. yalnız içimde bir ukte var. lan ben neden bu kadar zig zaglı bir yol çiziyorum ya. 33 yaşıma geldim. lan direkt lisansı bilg mühendisliği konusunda okusaymışım, yüksek ve doktorayı aynı konu üzerine yapsaymışım. off ne kadar enerji tasarruf edermişiz. neler okudum neler. bilginin, öğrenmenin zararı olmaz derler. bunlar hep işte iktisat bilmeyen toplumun yüzeysel lafları. alternatif maliyet diye bir şey var gardaşım... ne yazık ki hayat hakkında çoğu şeyi kendim keşfetmek zorunda kaldım. mesela insan doktoranın neden önemli oduğunu ve fonksiyonunu, iş hayatının ve ülke ekonomisinin dinamiklerini yıllar süren bir gözlemlerden sonra deneyimleyip kesin bir sonuç çıkarmadan nasıl bilebilir ki? bunlar normalde tek jenerasyonda olacak işler değil. ama yapacak bir şey yok. tek jenerasyonda gidebildiğimiz kadar ileriye gitmemiz lazım.

    bugün 2010 yılında yazılmış bir makalede ilginç bir teknik ile karşılaştım. adamlar machine learning based sentiment analysis yapmak istiyor. ama gidip de biz data label'lamayız diyorlar. bunun için önce lexical based yaklaşım ile hazır duygu sözlüğü kullanıp cümleleri labellıyorlar. sonra o label'lanmış cümleleri eğitim seti olarak kullanıp bir classifier'ı eğitiyorlar. sonra o classifier ile tahmin yaptırıyorlar. düz lexical based yapınca recall az çıkıyor. lexical ile eğitim datası hazırlayıp bunu ml modele verince recall ve f1 skor artıyor diyorlar. ilginç valla.

    bugün bir tane de hyperparameter optimizasyon ile ilgili bir makale indirdim. hayvan herifler iki kişi 132 kaynak kullanmışlar. nlp makalelelrinde pek hyperparameter optimizasyon ve stacking modeli yok. sanırım makalenin konusunu 100. kez tekrar değiştirip stacking türkçe sentiment analiz yazacağız.

    yarın dişçiye gideceğim. çenede disk kayması mı ne var. gözüm, kulağım, çenem falan ağrıyor. bu ne ya.

    https://www.youtube.com/watch?v=9rmbxmqmo94

    17.07.2022 editi:
    diş hekiminden ağrıları stres yapıyor yanıtını aldıktan sonra dün aylar sonra ilk defa pc oynadım. supp rolünde 5-6 kez yenildikten sonra midde medusa alıp kazandım. acayip bir sevinç oldu. ağrı mağrı kalmadı. ama çalışma motivasyonu da silindi gitti. dışarı çıkıp kendi kendime konuşup kendimi motive etmem gerekiyor. bilgisayar oynamamalıyım. yoksa 60 yıl loopa girmiş gibi pc oynarım.

    bu arada stres derken neyi kastediyoruz bu da önemli. stres sadece ansiyete gibi olumsuz duyguları mı kapsıyor? yoksa motive bir ruh hali de stres olmaya girer mi?

    akademik makalede ilginç bir şey bulduk. biz iki farklı sorunun çözümünü arıyormuşuz. olmaz öyle. bir probleme odaklanmak lazım. nasıl bunu nasıl farketmemişiz anlamadım. şimdi motçi yiyip yürüyüşe gideceğim.

    18.07.2022 editi:
    geçen gün arkadaştan bir kütüphane ile ilgili bilgi aldım. bu kütüphane bir classifier hakkında. olayı anlatan adres şu. adrese göre bu sunuflandırıcı diğer sınıflandırıcılardan daha iyi. biz yaptığımız denemede xgboost kadar iyi sonuç verdi. fakat bu sınıflandırıcının olayı performansında değil. sınıflandırıcı hangi feature' ı ne kadar kullandığı ile ilgili data veriyor. bu ne işe yarar? mesela algoritma problemi beklenmedik şekilde çok iyi tahmin ediyor. bir yerde leak olmalı. bir sütunda bir şekilde tahmin etmeye çalıştığımız şeyin dolaylı veya dolaysız şekilde bilgisi olması lazım. bu algoritmayı çalıştırıyoruz. algoritma diyor ki ben direkt olarak "şu" sütunu kullanarak sonucu buldum. "haaa o zaman" diyoruz "bu sütunda cevaplar olabilir". veya o sütun önemli ise o sütün hakkında daha çok veri işleme de yapabiliriz. güzel bir kütüphane.

    bir youtuber bulmamız lazım. kardeşim sen bu "like" ve "dislike" sayılarını, youtube analytics sana bunları "zamana göre değişen" şekilde veriyor mu vermiyor mu? 3 kanala mail attım geri dönüş yapmadılar. sanırım ben oturup youtube'daki youtube analytics eğitim videolarını izleyerek anlamaya çalışacağım. offff acayip angarya. akademik makaleyi bu olay üzerine kuracağımız için bu önemli.

    19.07.22 editi:
    bugün bu alana biraz yeni geçiş yapmış bir akademisyenle görüştüm. yalnız benden daha gençtir diye düşünüyordum. öyle olunca biraz da samimi şekilde arkadaşça muhabbet ederim falan diye düşünmüştüm. arada kodlama konusunda takılırsan yardım isteyebilirsin falan diyecektim. yeni makale yazarsan da bizim adımızı da yaz, kodlama kısmını biz yaparız falan diyecektim. sorularımı not etmiştim. benden daha büyük bir akademisyen geldi. direkt kitlendim. hem görüşme talebinde bulunan benim hem de görüşme başlayınca öyle pek bir şey diyemedim. biraz malca bir durumdu. tüm sorularıma yanıt bulamasam da bazı önemli sorulara yanıt buldum. mesela türkçe data üzerinde çalışsak bile uluslararası dergilerde yayın yapabilirmişiz. ben yapamayız diye düşünüyordum. bildiriler konusunda tübitak bir mali destek sunuyormuş. bir de bildiri gönderdiğimiz paper'ı aynı şekilde makaleye yollayamazmışız. ben yollayabiliriz sanıyordum.

    ben normalizasyon'u bir sütunun kendi içerisindeki değerleri bir birlerine yaklaştırıp algoritmanın sütun içerisindeki değerleri yanlış algılamasını engellemek için yapıyoruz sanıyordum. aynı zamanda lineer algoritmaların kullanıldığı regresyon problemlerinde normalizasyon yapılmazsa algoritma farklı sütunların katsayılarını da yanlış algılıyormuş. çok temel bir bilgi ama ben bunu bilmiyordum. yani doğru anladıysam a sütununda 1-10 arası sayılar var, b sütununda 10.000.000 ile 20.000.000 arasında değişen sayılar var. iki sütunun da bağımlı değişken ile korelasyonları 0.5 diyelim. model gidip de b sütununa daha çok katsayı veriyormuş.

    22.07.22 editi:
    birlikler ilerlemeye devam ediyor.
    sanırım yakın vadeli hedeflerimi sırası ile buraya yazmalıyım.
    1) akademik dergiye bir makale göndermek (3 hafta)
    2) aws practitioner ve aws machine learning engineer sertifikalarını ele geçirmek (6 hafta)
    3) kitap yazmak(bu kişisel hobi, ara ara bu işe zaman harcayacağım) (2 hafta)
    4) ielts'den süresi dolan sınav sonucumu yenilemek (bakalım önceki 6,5 puanı geçebilecek miyim?)(6 hafta)
    5) avrupa'da(veya amerika'da) iş aramaya başlamak

    eğer planlandığı gibi giderse 17 hafta sonra avrupa'da iş aramaya başlayacağım gibi duruyor. 5 hafta da güvenlik payı eklersek 22 hafta sonra iş arama çalışmalarına başlayabiliriz. kendimi ıssız adadan ayrılmaya hazırlanan robinson cruso gibi hissediyorum. japonya'yı gerçekten özleyeceğim. burada hayatım iyi, keyfim de yerindeydi. ama yaş ilerliyor. geç olmadan bu yeni kariyere ve avrupa'ya sıçrama yapmam gerekiyor. "ömrün sonsuz, yaşlanma yok" deseler machine learning çalışma falan hiç uğraşmam oturur bilgisayar oynardım. ama zaman geçiyor.

    https://www.youtube.com/watch?v=dlwt-cbfooa

    26.07.22 editi:
    geçmişten kalma bir lstm+glove+pytorch+nlp projesi vardı. ama bunun makalesi yazılmamıştı. yeni bir arkadaş ile bu işe giriştik. kodlar zorladı ama çoğunu çözdük gibi. helal olsun yeni arkadaş pytorch, glove, lstm kombinasyonu ile can verir diye düşünüyordum ama dayanabildi. güzel bir makale olacak gibi duruyor.
    zor bir konu ve kod ile karşılaşınca illa ki yumruk yiyip yere düşüyoruz. mutluluk 0'a düşüyor. bence mesele pes etmemek. ilk anda "bu ne ya?" diye "kaçın kendinizi kurtarın!" ruh hali ile incelediğim kodları dinlenip ertesi günler tekrar inceledikten sonra belki böyle böyle bir kaç oturumdan sonra "lan o kadar da zor değilmiş aslında" ruh hali ile çözdüğümü çok hatırlıyorum.

    28.07.22 editi:
    hyperopt diye bir model optimizasyon kütüphanesi keşfettik. çok süper bir şey. eskiden gridsearchcv kullanıyorduk. hyperopt hem çok daha hızlı hem de daha yüksek performans gösteriyor.
    yazdığım makale ilk defa bir şeye benzedi gibi hissediyorum. problemi gerçekten açıklayabildik gibi duruyor.

    29.07.22 editi:
    gece 03:00 gibi uyandım. biraz the settlers ii oynadım. 05:00'de bir saatlik yürüyüşe çıktım. o saatte bile yürürken ter içinde kalıyorum. kendimi kurtuluş dizisinde temmuz ayında iç anadolu'da, bozkır içerisinde, ankara'ya doğru yürüyen yunan askeri gibi hissediyorum. bir müzik eşliğinde yunan subayı şapkasını çıkarıp ufka doğru bakıyor ve yolun geri kalanı da böyleyse yandık diyordu. o müzik yankılanıyor kulağımda.

    f-score skoru hakkında düşünüyorum. geçenlerde arkadaş imbalanced data ile f1 skoru bulmak ne kadar mantıklı şeklinde bir soru sordu. f-score precision ve recall metriklerinin karıştırılması ile bulunuyor. bizim datasetimizin dengesizliğinden kaynaklı olarak precision'ımız yüksek, recall'ımız görece düşük. sanırım f1 skorunun parametreleri vardı. onları incelememiz gerekebilir. f1 skoru formülünde precision ve recall eşit miktarlarda skoru etkiliyor. acaba bunlar dengesiz bir data setinde f1 skorunu eşit miktarda mı etkilemeliler?

    01.08.22 editi:
    arkadaş ile precision, recall, f1 skoru gibi metriklerin göreceli metrikler olduğunu keşfettik. vay canına ya. iki yıl sonunda bunu yeni mi keşfettik diyorum. ama bir taraftan da akademik makale yazanların(en azından öğrencilerin) da ne kadar bildiğinden emin değilim. yani ne demek istiyorum? precision, recall, f1 görecelidir. sınıflı bir problemde, sınıflı dediğimde aklıma hep karl marx geliyor. evet sınıflı bir problemde bu metrikler "1" sınıfının metrikleridir. aynı günümüzdeki toplum değer yargılarının burjuva sınıfının değer yargıları olduğu... bilgisayar oynamak işte böyle dikkatimi toplamayı güçleştiriyor. evet precision diyoruz da kime göre neye göre precision sorusu geliyor akla. yani sen bir model inşa ettin, bu precision modeli mi temsil ediyor? etmiyor işte. o modelin "1" sınıfını ne kadar iyi bildiği ile ilgili bir metrik. ama bir model "1" lerden ibaret değildir. aslında şöyle diyelim, bu, sizin çözmeye çalıştığınız probleme göre değişir. eğer sentiment analiz yapıyorsanız pozitif cümleleri bulmak kadar negatif cümleleri de bulmak o iş yeri için önemliyse, o zaman siz gidip f1 skoru kullanırsanız bu f1 skoru modelin sadece "1" sınıfını tahmin etmekteki başarısını gösterir. sizin gidip f skoru hesaplamanız lazım. yani f1 skoru ile f2 skorunu hesaplayıp ortalamasını falan alacaksınız(eğer data dengeli ise). sklearn kütüphanesindeki f1 skor metriğinin weighted diye parametresi var. onu seçince sadece bir sınıfın f skorunu değil, modelin f scorunu, yani tüm sınıfların f skorlarını hesaplayıp onun ortalamasını alıyor. öte yandan şu var, bazı durumlarda her sınıfı değil de tek bir sınıfı tahmin etmek önemli olabilir. mesela hastalık tespiti böyle bir şey. o zaman işte sadece tek bir sınıfa dair precision ve reall metrikleri aynı zamanda sizin modelinizin başarısını da temsil eden metrikler olacaktır.
    bunu akademik makalenin en sonunda tespit ettik. verilmiş sadakamız varmış. böyle f1 skoru hesaplayıp sonuçlar kısmında bunu verseydik acayip rezil bir durum olacaktı. hatayı belki çoğu kişi anlamazdı ama az sayıda anlayan kişi de "muhaha" diye gülerdi diye tahmin ediyorum.

    (bkz: precision/@kaizenuberalles)
    (bkz: recall/@kaizenuberalles)

    03.08.22 editi:
    cross_val_score fonksiyonu üzerine düşünüyorum. kullanmadığım bir fonksiyondu ama şimdi bir sebepten dolayı ihtiyaç oldu. ya bu cross_val_score datayı otomatik olarak 5 parçaya bölüp her bir parçası ile train yapıp sonra validation'a sokup score mu buluyordu yoksa modeli verilen data ile 5 kez eğitip modelden gelen sonuçları mı veriyordu?
    görsel

    04.08.22 editi:
    biraz anomaly detection konusunda makale okudum. diyelim ki anomaly, fraud detection yapan bir şirkete görüşmeye gittiniz. fraud detection hakkında ne diyeceksiniz? fraud detection problemlerinde genellikle unbalanced data ile çalışılır. bu yüzden machine learning engineer (bkz: resampling/@kaizenuberalles) tekniklerini bilmelidir. (bkz: undersampling/@kaizenuberalles), (bkz: oversampling/@kaizenuberalles) tekniklerinin detaylarına hakim olmalıdır. metric trap'e düşmemelidir demeniz lazım. ya bunlar zaten bilinmesi gereken şeyler ama görüşmeye gidersiniz de aklınıza gelmez diye söylüyorum.

    05.08.22 editi:
    linkedin'den amazon japan ik'cısı mesaj yollayıp ilgileniyorsan senin için şu pozisyona başvuralım dedi. oha dedim. motivasyon mektubu gibi bir şey yazıp cv yolladım. henüz geri dönmedi. ilandaki az çok tüm şartları karşılıyorum ama aws machine learning sertifikası yok bende. onu da şu akademik paper'ı bitirdikten sonra alacağım. sektörde şu aws denilen illete biçilen değer çok fazla.

    08.08.22 editi:
    tmj denilen kronik bir çene ağrısı olayı başladı. stresten oluyormuş. ben böyle bir ağrı görmedim. bir süre çalışma disiplinini bırakıyorum. bol bol bilgisayar oynayıp biraz dinleneceğim.
    https://www.youtube.com/watch?v=jyevqyefqie

    09.08.22 editi:
    bu tmj denen illet ağzıma sıçtı. bir süre buraya yazmayacağım. biraz stres ve motivasyon azalsın. aslında stres de yoktu. ama motivasyon da bir çeşit stres değil mi? ağrıyı unutmak için ağzımı rom ile yıkayıp bütün gün dota oynuyorum. bu nasıl bir şey ya...

    14.08.22 editi:
    tam bir hafta geçmiş ya. valla bu tmj kırdı geçirdi ortalığı. şimdi hafif ağrı ve hassasiyet olsa da iyileştim gibi görünüyor. eu4'de savaş kaybedince 500km geriye çekilen ordu gibi hissediyorum kendimi. hayattan keyif alma durumum, oyun, multi vitamin, kahve nedeniyle arşa çıkmış olsa da ben şimdi nasıl ders çalışacağım ya. ovvv günde 7 saat çalışıyordum ben. makine öğrenmesi falan filan motivasyon zerre yok şu an. günde 7 saat makine öğrenmesi çalışmak kölelik gibi geliyor şu an.

    16.08.22 editi:
    bugün düzenli olarak çalışmaya geri döndüm. 2 gün önce kahve yasağını da delip kahve içtiğim için çok mutluydum. kahve beni çok etkiliyor. bir arkadaş ile güzel bir medium makalesi yayınladık. neredeyse towards data science'da yayınlanacaktı ama bence direkten döndü. bir dahaki sefere.

    bugün tekrar çalışmaya başladım. akademik makaleyi ingilizceye çeviriyorum. çalışmak kum yemek kadar tatsız. kahve olmadan, dota olmadan insanın ağlayası geliyor. ya böyle hayat mı olur? ama acayip para olsa, çalışmak zorunda olmasak yine sorun. bilgisayar oynamak ve kahve dopamin miktarını arttırıyor. beden o seviyeye bir kaç gün sonra alışıyor. ve o ilk haftaki mutluluk seviyesi kalıcı olmuyor. her şey istediğim gibi olsa en azından oturup kitap yazarak bir şeylerle uğraşmak gerekirdi. neyse çok ağlamadan çalışmaya devam.

    https://www.youtube.com/watch?v=perpumhcel4

    19.08.22 editi:
    makaleyi ingilizceye çevirdim. bakalım şimdi nerede yayınlatabiliriz safhası başlıyor. bu aralar sabahları kahve içiyorum. şu korona ve sıcaklar bitene kadar da pc oynamaya devam edeceğim.

    sözlükte f-score başlığı yokmuş. oraya bir kaç parça bir şey yazdım.

    22.08.22 editi:
    kovaryans ve korelasyon kavramlarına tekrar bir baktım. korelasyonu zaten biliyoruz da kovaryansı da hatırlamış oldum. tabi kafam karıştı. kovaryans sadece iki değişken arasındaki ilişkinin yönünü gösterir diyor. yani sonuç 1.4 çıktıysa iki değişken aynı yönde hareket ederler. -3 çıktıysa zıt yönlere hareket ederler. ama anladığım kadarıyla 1.4 veya 3 değerlerinin bir anlamı yok. yani bir büyüklük ifade etmezler. bir şiddet ifade etmezler. korelasyonda ise -1 ile +1 arasında sonuçlar değişir. +1 olursa aynı yöne çok benzer olarak, -1 olursa da zıt yöne çok benzer şekilde hareket ederler. yani burada sayının mutlak değerinin büyüklüğü değişkenler arasındaki ilişkinin kuvvetini gösterir. yani bu durumda korelasyon denilen nane kovaryansı da içermiş oluyor. bu durumda insanın istatistik camiasına çemkirip "madem korelasyon tek başına hem yönü hem şiddeti gösteriyor o halde ne diye kovaryans gibi bir terim icat edip bizim kafamızı karıştırıyorsunuz?" diyesi geliyor. ne var ki kovaryans denilen naneyi korelasyon hesaplamak için bir adım olarak kullanıyormuşuz. bu açıdan bakınca olay mantıklı.

    x ve y diye iki değişken olsun. bunlar bir dizi diyelim.
    korelasyonun formülü: kovaryans(x,y) / std(x)*std(y)

    bu formülü ezberlemeye gerek yok tabi. python'da hazır fonksiyon var. ama tabi formülü görünce olay daha netleşmiş oldu.

    şunu farkettim: çoğu istatistik kavramlarını unutmuş durumdayım. oysa ki endüstri mühendisliği okudum. sağlam bir istatistik eğitimi almış durumdayım. oturup bu kavramları tekrar tekrar öğrenirsem ki benim için öğrenmesi zamanında bildiğim için çok zor değil, mülakatlarda bu endüstri mühendisliği ve istatistik kartını sağlam bir kaldıraç olarak kullanabilirim.
    öte yandan.. bu günlüğün başında acaba istatistik ile mi başlasam dediğimi hatırlıyorum. bu alana girmeye çalışan her suser de bir klişe olarak acaba önce matematik/istatistik/olasılık'ı mı mükemmel hale getirmem lazım diyor. paçayı kurtarmış her yazılımcı veya data scientist önce matematik bilmek lazım der. ben "bi siktirin gidin ya" diyorum. farklı düşünüyorum. iyi ki de bu günlüğün başında ilk olarak oturup istatistik falanla zaman harcamamışım. ck2 oynayanlar bilecektir. her şeyin bir sırası var. öyle horde devletten zınk diye feudal devlete geçemezsiniz. önce otoriteyi arttıracaksınız, pagan dini reforme edeceksiniz falan filan. direkt feudal devlet olursanız feudal devletin avantajlarından yararlanamazsınız.

    bu kafayı suyun altında tutmak gibi. nefesimizi de motivasyon gibi düşünelim. sen daha kod yazamıyorken olaya temelden başlayacağım deyip istatistiğe başlarsan ölürsün. diyelim ki çalıştın 1,5 ay. az çok istatistik öğrendin ama gücün de tükendi. lan daha ortada bir tane prediction yok. veri bilimi modeli falan bilmediğin için istatistiği nerede niçin kullanacağını da bilmiyorsun. öğrendiğini neden öğrendiğini anlayamıyorsun. öğrendiğinin de tam olarak neresinin önemli olduğunu bilmediğin için kafa "siliyor". insan zihninin öyle bir özelliği var. öğrendiği bilgi ile diğer bilgiler arasında ilişki kurması lazım hafızada kalması için. bence yazılımcıların, veri bilimcilerin falan önce "temeller", önce "matematik" demeleri tamamen zırvalık. yani insan nefesi o kadar su altında kalmaya yetmez.

    bence önce biraz yanlış yunluş işin "kendisi" yapılır ve uygulanır. uyguladıkça insan somut bir şey başardığı için keyif alır, keyif aldığı için kafayı sudan kaldırıp nefes almış olur. daha sonra diğer alanları oturur öğrenir.

    23.08.22 editi:
    oturdum biraz hipotez testi olayını hatırlamaya çalıştım. ben istatistik derken aslında hipotez testini kastediyorum. yoksa mod, medyan falan bunlar biraz genel kültür diye kabul ediyorum.

    şurada youtube oynatma listesinde 6 tane soru videosu var. onları çözerseniz bence hipotez testi olayını biraz anlamış olursunuz. sanırım o oynatma listesinde 15. video ile 20. video arası.

    sırada biraz bu işin python'da kodlar ile nasıl yapıldığını hatırlamak geliyor. tekrar çalışmaya başladıktan sonra hayattan alınan keyif epey düştü. kahve yoksunluğu çekiyorum gibi hissediyorum. günde sadece 1 tane, onu da sabah içiyorum.

    24.08.22 editi:
    vikings dizisinde bir paris kuşatması sahnesi vardı. kendimi merdiveni itilmiş asker gibi hissettim biraz. akademik makaleyi neredeyse tamamladık sayılır. youtube kanalında sentiment analysis yapıyoruz. buraya kadar iyi. yalnız türkçe bir kanalı analiz etmiştik. sonra dedik ki neden ingilizce bir kanalı analiz edip çok daha fazla kişiye ulaşmayalım? hem akademik dergilerin yayınlama ihtimali önemli derecede artar. türk bir vlogger yerine international bir dallamanın videolarındaki yorumları oturduk çektik. eşşoğlu eşşeğin videolarında negatif yorum yok. türk vlogger'ın yorumlarında arada negatif commentler vardı. 2 saattir validation yapmak için comment labellamaya çalışıyorum. ulan 1 tane negatif comment çıktı sadece. great video, you inspired me yorumlarını gördükçe küfrediyorum. dallama acaba negatif yorumları mı silmiş diyeceğim ama videolara baktım çok steril. lanet olsun ya. adam suya sabuna dokunmamış hep pozitif hep fotojenik hep gülümsüyor. bizim gezi vlogger'ına bakıyorum arada bir gülümseme var. çekimler daha spontane. yerel halk ile daha çok konuşmuş. iki kanal da gezi kanalı, aynı temalı. bir kaç tane farklı international kanala baktım oralarda da negatif yorumlar pek göremedim.

    acaba tarih kanallarına mı baksam? ama belki de sorun şurada. biz doğal olarak en iyi kanallara bakıyoruz. en iyi kanallara değil de daha orta seviye kanallara mı bakmamız lazım? veya acaba ürün tanıtan youtube kanalları mı vardır? ama onlar da ürünlere saydıranların yorumlarını reklam falan aldıkları için siliyorlar mıdır? ya bu sorunu hiç düşünmemiştim bu duruma canım sıkıldı.

    26.08.22 editi:
    bir kanal buldum. arada ürün tanıtımı yapan bir influencer. kadının videolarında olumsuz yorumlar göreceli olarak fazla. ama veri çekmeden önce daha fazla örneklem almam lazım. normalde youtube yorumlarını çekmek için selenium kullanıyorduk. ama ben selenium'a çok aşina değilim. acaba youtube api mi kullansam. makaleleri okurken milletin daha çok api kullandığına şahit olmuştum. selenium'u bizzat kullanmadım ama nasıl çalıştığını biliyorum zamanında knime kullanmıştım. sanırım matrix filminin başında neo'nun bilgisayar başında uyuması gibi bir veri çekme prosesi var. bilgisayar kendi kendine tarayıcıyı açıyor scroll'u kaydırıyor falan filan. hani mr anderson'un kulağında kulaklıkla olduğu sahne var ya. orada neo data scrapping yapıyor.

    off youtube api de çok sıkıcı duruyor ya. ama yapacak bir şey yok. veriyi çekmemiz gerekiyor. mecbur youtube api öğreneceğiz. işte ahan da burada bir tutorial yazmışlar bununla ilgili.

    31.08.22 editi:
    verileri selenium ile çektik. neredeyse veri çekme işlemi tamamlandı. şimdi verileri tekrar işleyip bir sentiment analysis/@kaizenuberalles yapıp makaleyi editleyeceğiz. bakalım nasıl olacak.

    --- spoiler ---

    eylül - ekim - kasım - aralık 2022
    --- spoiler ---

    02.09.22 editi:
    bugün bir medium makalesi okudum. çok maaş alan data scientist neye göre yüksek maaş alıyor şeklinde. kaggle'daki bir data setinden çıkarılan sonuçlar:

    -abd, almanya ve kanada en çok maaşı ödeyen ülkeler
    -yüksek maaş alanlar kaynak olarak en çok coursera ve fast.ai adreslerini kullanıyormuş.
    -her ne kadar python bu işin temeli olsa da sql çok önemli. iyi sql bilgisi (veya sertifikası) yüksek ücrette belirleyici oluyor. eşimi çalıştırıp başka bir alandan data science alanına geçiş yapmasını sağlamıştım. onda da sql sertifikası vardı.
    şu da var, zamanında ben belli miktarda iş ilanını alıp ne istiyorlar diye incelemiştim. orada da çoğu ilanda sql bilgisi çıkmıştı.
    -para harcamadan para kazanılmaz mottosu burada da doğrulanmış oluyor. machine learning için 1000 dolar harcayanların yüksek ücret alma olasılıkları daha çok. tabi burada korelasyon nedensellik oluşturmayabilir lafını hatırlamak gerekiyor. belki de adamlar zaten yüksek ücret aldığı için bu işe para harcıyorlar. gerçi bana bu olay doğru gibi geliyor ama kesin öyledir de diyemeyiz. gerçi deriz ya ben arada akademik makale yazdığım için çok temkinli konuşuyorum öyledir öyledir.
    -master degree veya phd ünvanları daha çok para getiriyor. gerçi bu çok ilginç bir sonuç değil.
    -10k çalışanı olan şirketler daha çok para veriyor. kapağı büyük şirketlere atmaya çalışacaksınız. (ben de öyle düşünüyordum)
    -bir yerde 2 yıldır kullanılan machine learning modeli varsa orada data science ile ilgili 20 kişi oluyormuş. alla allah?

    12.09.22 editi:
    akademik makaleye devam ediyorum. kurtuluş dizisinin ikinci bölümünde sakarya savaşı sonrası şöyle bir replik geçer:
    oyuncu1: "ismet paşa kurtulduğumuzu görünce sevinecek."
    oyuncu2: "ama savaşın kaybedildiğini sanıp ordunun yarısının kaçtığını duyunca da sevinci kursağında kalacak."

    akademik makale bence kaliteli oldu, fena değil. ama harcadığım zamana da bakınca sevincim biraz kursağımda kalmıyor değil. aslında değer bundan eminim ama şu var: başarı, başarıyı hak eden süreden az zaman harcadığınızda sizde sevinç yaratır. eğer başarıyı, hak ettiği fiyattan satın alıyorsanız öyle acayip sevinmeniz için bir sebep de kalmıyor.

    bilinç altımda kendime karşı "çalışmaktan kaçmak için kendini oyalıyorsun" gibi bir suçlama var. evet gerçekten çalışmak istemiyorum(bir şirkette). ama izlediğim strateji yine de mantıklı. önce akademik makaleyi bitireceğim, sonra aws machine learning sertifikası alacağım, gerekiyorsa(hollanda çalışma vizesi için) ielts sınavından puan alacağım sonra da tüm gücümle iş arayacağım. bu iş hard carry rolü. bir parça daha team fight'a katılmadan jungle'da farm atacağım.

    bu aralar 11:00'den 18:00'e kadar 7 saat çalışıyorum. sonrasında ise gece 2'ye, 3'e kadar kardeşimle dota oynuyorum. bu aralar hiç dışarı çıkmıyorum. çok şikayetçi değilim. ama biraz sağlıksız hayat düzeni olabilir.

    biraz da veri bilimine dair bir şeylerden bahsedelim. geçende ab testleri ile ilgili biraz çalıştım. bir örneklemin normal dağılıp dağılmadığını bulmak için ya python ile ya kolmogorov-smirnov testi yapacaksınız ya da (bkz: shapiro wilk testi/@kaizenuberalles) uygulamanız lazım. ikinci linkte örnek bir python kodu da mevcut. peki niye normal dağılıma bakıyoruz? a/b testinde mesela iki web sayfasının ortalama bilmemne değerlerini karşılaştırıyoruz. a versiyonunun ortalama reklam miktarı daha fazla çıkıyor. bu fazlalık şans eseri mi geldi yoksa gerçekten istatistiksel olarak daha mı fazla diye test edebilmek için hipotez testi yapmamız lazım. hipotez testi yapmak için de örneklemin normal dağılıyor olması lazım, yamulmuyorsam eğer.

    13.09.22 editi:
    bugün şöyle bir şey öğrendim: pd.csv_read() derken bu fonksiyon içerisine url adresi yazabiliyormuşuz. valla çok basit ve beklendik bir şey ama aydınlandım. yani bir notebook'u kopyaladınız. illa ki csv dosyasını da locale indirmeye gerek yokmuş. tabi csv dosyası 2gb falan değilse. vay canına ya.

    bir diğer husus, kolmogorov-smirnov testi ve shapiro wilk testi hakkında. bir makale okudum. diyor ki shapiro wilk testi daha çok örneklem sayısının 1000'den az olduğu durumlarda sağlıklı sonuç veriyor. kolmogorov testi ise daha sağlam. şu arkadaş bence iyi şekilde açıklamış ve örnek kod yazmış:
    https://medium.com/…ewness-ve-kurtosis-a9e33399f084

    14.09.22 editi:
    sanırım vader maceramdan bahsetmemişim. vader diye bir lexical based yöntem var. çok pratik. veri temizlemeye falan neredeyse gerek kalmıyor. adamlar diyor ki bu yöntem twitter datasında 0.96 f scoru ile çalışır. bunu söyledikleri makale 3 bin falan atıf almış. lan biz youtube datasında yaptık 0.68 f score geldi. eee bu fark niye? özellikle negatif commentlerde durum kötü. pozitif commentlerde durum daha iyi. ne yani twitter datası ile youtube datası bu kadar farklı mı? yoksa makalenin yazarı biraz uydurmuş gibi geliyor bana. hem de 4200 tweet üzerinde validation yapmış. allahsız adam 0.96 nedir? yöntem pratik olması, emoji ve emoticonları ve tüm noktalama işaretlerini ve büyük küçük harfleri göz önüne alması ile parlak bir yöntem ama bence 0.96 f scoru yaptık ifadesi ile resmen sahtekarlık yapmışlar.

    ben bu akademik makalelerdeki f score olayını anlamıyorum. makalelerin %95'inde adamlar github sayfasını falan koymuyor, çalışmanın dosyasını sunmuyor. eee ne anladım öyle işten. şeffaflık ve denetlenebilirlik sıfır. ben senin oraya yazdığın f skorlarını uydurmadığını nereden bileyim. garip valla.
    gerçi asıl olay yöntem, teknik falan diyeceğim ama o kadar da değil yani.

    15.09.22 editi:
    akademik makale bitti gibi. şimdi dergilere gönderme safhası başlamış oluyor. youtube'dan biraz bu konu ile ilgili bilgi almak için video izledim. moralim bozuldu. bununla ilgili sektör varmış. ama şöyle: o konuda mesela sana danışman hoca atıyorlar. danışman şunları şunları oku diyor. araştırma konunu sunuyorsun mantıklı olup olmadığını söylüyorlar. biz mal gibi gittik hiç danışmadan olmadan başladık. 2-3 kere konu değiştirdik. yeri geldi yanlış makaleler okuduk. araştırma konumuz bence iyi. bana mantıklı geliyor. ama kabul görmeyebilir şeklinde içimde şüphe yok diyemem. ulan belki de ne kadar boşa enerji harcadık.

    yani işin kötü tarafı çok fazla angarya iş için de emek harcadık. oysa ki danışmanımız falan olsaydı fazladan iş yapmaz, o enerjiyi araştırmanın kalitesini yükseltmek için harcardık. ulan her işim böyle aykırı ya. yapılması gereken işleri yeri ve zamanında yapmıyorum. sonra çok zahmet çekiyorum. bu işin yeri üniversite zamanı. orada oturup tüm imkanlar varken iyi bir makale yazacaktım.
    bir taraftan da bakıyorum, ulan o bilinç yoktu ki o zaman. 20 yaşındaki bir çocukta nasıl o bilinç olsun. bunlar hep sosyal kapital.
    treni geriden koşup yakalamak isteyince de ekstra efor harcamış oluyoruz. ama bir taraftan da iyi bir özellik. en azından hırs var. daha iyisi olsun diyoruz. sınırları, kısıtları kabul etmiyoruz. yaşam kalitemizi şükür, nasip, kısmet demeden arttırmaya çalışıyoruz. yapabileceğimiz en iyisi neyse o olsun.

    tanımadığım ama hemşerim olan bir hocadan yardım istemiştim. sadece makaleye göz atıp kalitesi açısından hangi dergilere gönderebilirim diye sormak için. o an bunu kolay bir iş olarak gördüğüm için yardım eder diye düşündüm. ama sonra fark ettim ki aslında bu da zaman alan bir iş. böyle sorduğum için sonradan kendimi biraz kötü hissettim. bu öyle bir olay ki hem gayet iyilik olarak yapılabilir hem de gayet profesyonel olarak destek verilebilir. makale o zaman 6 sayfaydı şimdi 10 sayfa. ben bile okurken sıkılıyorum. ayıp mı ettim acaba diye düşünüyorum.

    20.09.22 editi:
    zamanında üniversite evindeyken belli kurallar vardı. kapıya tıklanıldığında içerideki kişi meşgul derse ne olursa olsun odaya girilemez ve kapıya tıklayan kişi sonrasında trip atamaz. çöpler hakkında yönetmelik. tek poşet varsa ne olur, çift poşet varsa ne olur, ev temizleme ne gibi şartlara sahiptir, kalabak su bitmişse ne olur, bitmiş ama sorumlu olan kişi yenisini almamış ise ne olur, kalabak su seviyesi belli bir sınırın altına inmişse, sırasını savmış olan kişi sıradaki kişiye karşı ne tür yaptırımlarda bulunabilir? bu hukuk sistemi gurur duyduğum bir şeydi.
    ne var ki kurallar hayattan kopuk değildi. hayattan kopuk olmadığı için de yasaya riayet ediliyordu. ama kopya edilmemiş, hayata dokunan yasa sistemlerinde şahsına nevi garip yasalar da olur. vize haftaları öncesinde ve sonrasında 1 hafta süreyle yasaların aciliyet arz edenleri dışında yürürlükten kalkması da bunlardan biriydi. hatırlıyorum da tabak, masa veya örtü olmadığı için halının üzerine serdiğimiz boy aynasının üzerinde kahvaltı yapıyorduk. ama bu doğru bir uygulamaydı. çünkü hemen sınav haftası ertesinde herkes tüm gücünü derslere harcadığı için toplumda yasalara uymak konusunda bir irade kalmıyordu. ben de bu aralar akademik makalenin (şimdilik) bitmesi ile böyle bir haleti ruhiye içerisindeyim. gerçi bu bir şey değil, daha koşulması gereken çok yol var ama ruh hali bu şekilde.

    3 gündür burada yağmur yağıyor. gece witcher oynuyorum. uzun süredir gündüz ders / akşam ve gece pc oyunu oynadığım için gün yüzü görmedim. yürüyüşe gitmedim. lan keşke gece şöyle bir kaç gün sürse de gün ışımasa. kahve ile enerji içeceği de içiyorum.

    bir taraftan da ulan bu nasıl çelişki diye düşünüyorum. bir kaç ay önce çok sağlıklı yaşıyordum. gündüz ders çalışıp sabahları ve akşamları yürüyüşe gidiyordum. kitap okuyordum, araştırma yapıyordum. ama en sonunda depresif bir moda girmiştim ve sonunda dişlerimi sıkarak 1 hafta çene hastalığına yakalandım. şimdi ise hayat daha monoton ama depresif bir mod yok.

    "totem, tabu, fetiş ve padişah" isminde bir kitap yazmak istiyorum. bu kitapta empati kurup sisteme vezir, yeniçeri, bürokrasi, ulama ve halkın gözünden bakarak padişahlık, krallık ve benzeri makamların neden sembolik gibi durmasa da özünde sembolik olmak zorunda olduğunu, başka bir yolun olmadığını göstermek istiyorum.

    21.09.22 editi:
    dün gece dota oynayacağım diye kahve içtim. belli ki uyurken iyi dinlenememişim. bugün çalışırken zorlanıyorum.

    bu aralar zaman serisi çalışıyorum. önceden bir kaç problem çözmüştüm. direkt arima kütüphanesini çağırıp geçiyordum. bu sefer biraz daha detaylı olarak bakıyorum. bir tık daha olayın teorik kısmını anlamaya çalışıyorum. mesela arima uygulayacak isek önce verinin bir trendi olup olmadığını anlamamız lazım ki ona göre katsayı verelim. data, stationary(sabit) mi değil mi diyorlar buna literatürde. eğer data sabitse, yani durağan ise arima modelde d katsayısına 0 veriyoruz. peki verinin stationary olduğunu nasıl bileceğiz? adf testi diye bir şey vardı. adf bana alman politik sistemi ile ilgili bir şeymiş gibi geliyor ama açılımı augmented dickey fuller testi. bunun örnek bir kod bloğuna buradan bakabilirsiniz. ne var ki verinin stationary olup olmadığını öğrenmenin başka bir yolu daha varmış. bu araca da autocorrelation function diyorlar.

    demand planner olarak büyük şirketlerde çalışan bir arkadaşım var. ama kodlama falan ile ilgili değil. sanırım başka araçlar kullanıyorlar. ona arimayı nasıl bilirsin? diye sordum. arima deyince böyle bir yüzünü ekşitti. arima'yı şirketlerin kullanacağını falan sanmıyorum dedi. neden öyle dedi merak ettim. nesi var arimanın? konu o sırada değişti her halde, bu sorularımı soramadım. sonra arima konusunu bir tekrar soracağım.

    31.09.22 editi:
    bugün aws certified cloud practitioner sınavına girdim ve geçtim. belki de 2 haftadır buna hazırlanıyordum. aslında kolay bir hazırlanma evresi olacağını sanıyordum ama öyle olmadı. özellikle son günler resmi kursun yeterli olmadığını görünce biraz telaşla çalıştım. ruhen acayip yorulmuş durumdayım. bir kaç gün sadece pc oynayacağım.

    akşam sınavı kutlamak için eşimle sizeria'ya gittik. pizza yiyip arjantin bira içtim. uzun süredir dışarı çıkmamıştım. bu yemek iyi geldi. şimdi saat 01:12. vücut enerjim çok zayıf durumda. uyumak da istemiyorum. ya dota oynarım ya da witcher oynarım. acaba bir çılgınlık yapıp sokaktaki otomattan enerji içeceği alsam mı diye düşünmüyor değilim.

    sırada makaleyi dergilere gönderme işi var. hoca konu pek inovatif değil dedi. mecburen biraz kıytırık dergilerde yayınlatmaya çalışacağım. ondan sonra da aws machine learning sertifikası var. ondan sonra da iş arayacağım sanırım.

    02.10.22 editi:
    22 temmuzda hedef planlama yapmışım. makaleyi akademik bir dergiye yollamaya 3 hafta ve iki tane aws sertifikasını almaya 6 hafta zaman vermişim. o zamandan bu zamana gerçekten de yaklaşık 9 hafta geçti sanırım. makaleyi bir dergiye gönderemedik henüz ve aws sertifikalarından sadece birini alabildik. önceki hoca makale pek iyi değil dedi. ama ben yine de yayınlatmak istiyorum. çünkü bu da bir öğrenme süreci. cv'de bence akademik bir yayın olursa çok iyi olur. ben iş veren olsam ve biraz düzgün bir şirket olsam derdim ki en azından bu arkadaş araştırma falan yapabiliyor. bu research pozisyonları için çok büyük bir artı.

    bir hoca daha buldum. makaleyi bir dergide yayınlamamıza yardım eder mi diye mail atacağım.

    zaman serilerinden bahsediyorduk. autocorrelation function'dan bahsettik. bir de partial autocorrelation function var. bu da şöyle bir şey. bu grafikte güven aralığını geçen kaç tane nokta varsa arima modeldeki p değeri ona eşit oluyormuş. yani bu örnekte modelin p değeri 4 gibi duruyor. tabi python bu pdq değerlerini kendi otomatik bulan fonksiyon olsa da yine de bilmekte fayda var.

    05.10.22 editi:
    bir kaç gün önce ljung box testiini öğrendim. bir datanın zaman serisi olup olmadığını test ederken kullanılan araç. tabi biraz kafam karıştı. acf, pacf testlerinde biz optimum parametre tahmin etmenin dışında datanın zaman serisi olduğunu göstermemiş miydik zaten. veya adf testinde? pmdarima diye bir kütüphane var. o kütüphane farklı pdq parametreleri ile deneme yaparak denemelerin aic(akaike information criterion) skorlarını veriyor. aic'si en az olan deneme dataya en çok uyan modeldir diyoruz.

    geçenlerde kaggle'da epey bir skor yapmış bir arkadaşla konuştum. kaggle profilinin iş bulma sürecinde çok yardımcı olduğunu söyledi. kendi çalışma sistemim hakkında düşünmeye başladım:

    1- ilk adımda sadece öğrenmeye çalışıyordum. bir problemi çözünce bundan hiç bir ürün elde etmiyordum (ki ölümcül bir yanlış)
    2- ikinci adımda çalışmalarımı belgelemem lazım dedim. github kodları tutmaya başladım.
    3- sonrasında github'a attığım bir projenin medium makalesini de yayınlamaya başladım. bu adım çok işime yaradı. çalışmalarımı belgeliyor olmanın ötesinde kodları metin olarak anlatırken yaptığım çalışmaları daha derinlemesine öğrenmeye başladım. bilgiler aklımda daha çok kalmaya başladı.
    4- medium makalesini yayınladığım projeleri portfolyoma da eklemeye başladım.

    yani git gide her projeden daha çok verim elde etmeye başladım.
    şimdi farkediyorum ki çözdüğüm problemleri aynı zamanda kaggle dosyası olarak falan da yayınlamam gerekirmiş.
    zamanımız kısıtlı. bu yüzden bir çalışmanın hem etinden, hem sütünden hem derisinden, her şeyinden yararlanmak gerekiyor. birim başına çabadan gelen hasılatı, faydayı maksimize etmek lazım. tabi ki bir çalışmayı kaggle'a yüklemek de epey zaman alacak. ama diyelim ki bir çalışmaya 9 birim zaman harcıyoruz ve öğrenme ,github, medium ve portfolyo başlıklarından toplam 3br fayda sağlıyoruz. 3/9 = %30 verim. oysa ki proje başına 1br daha harcasak fayda 4br'e çıkacak. verim 4/10 = %40 olmuş olacak.

    ben dahil herkes bir çalışmanın core kısmını tamamlayıp bu kısımları es geçmek eğiliminde oluyoruz. çünkü bizi harekete geçiren güdü "bu konuyu bilmiyorum, data scientist olmak için öğrenmem lazım" güdüsü. bu korku yok olunca bizi çalışmaya devam ettirecek motivasyon da kaybolmuş oluyor. oysa ki yaptığımız çalışmayı belgelemeden ne kadar öğrenirsek öğrenelim işe girmek zor. yani bir yanılgı içerisindeyiz. öğrenmek iş bulmak için yeterli olmayacak. iş bulamayınca da bir süre sonra öğrenmekten vazgeçeceiz. motivasyonumuzu "bu konuyu bilmiyorum, data scientist olmak için öğrenmem lazım" dan "bu konuyu bilmiyorum, data scientist olmak için öğrenmem ve bunu kaliteli bir şekilde belgelemem lazım"a evirmemiz lazım. futboldan aklımda tek kalan lucescu diye bir antrenör vardı. maçtan sonra futbolculara antreman yaptırıyordu. bu bence doğru bir yaklaşım.

    09.10.22 editi:
    akademik makale üzerinde uğraşmaya devam ediyorum. türkiye'deki bir derginin formatına çeviriyorum. bunu tamamlayınca sırada aws certified machine learning sertifikası var. ondan sonra da iş arayacağım.

    10.10.22 editi:
    bu aralar gece ışıkları kapatıp witcher3 oynuyorum. 2 tane dlc var onların görevlerini yapıyorum.
    şöyle ki akşam çalışmayı bitirdikten sonra enerji kalmıyor. bir süre otomatiğe bağlayıp total war1 oynuyorum. insan çalışmaktan yorulunca direkt olarak keyif alacağı güzel bir oyunu oynayamıyor. çünkü oyuna da kafa yormak gerekiyor. önce otomatiğe bağlayıp total war1 oynuyorum sonra dinlenmiş olursam dota2 veya witcher oynuyorum.
    bu günlerde epey yağmur yağıyor gece boyu. camı da açıyorum. öyle lanet kaldırıyorum. mezarlıktan ceset ressurrect edip düğüne falan gidiyorum.

    öte yandan büyük bir şirketin müdürü linkedin'den mesaj attı. yeni data science takımı kuruyoruz, iş var ilgilenir misin dedi. oo süper dedim. mail adresimi aldı. test yollayacağım bugün dedi. testteki konulara baktım. işi gücü bırakıp hemen sqlite çalışmaya başladım. lan sonra adam test mest göndermedi ya. bu nasıl iş ya. hevesim kursağımda kaldı.

    12.10.22 editi:
    cuma günü bir headhunter ile mülakat yapacağım. linkedinden bunların mesajlarından gına geldiği için gönderdiği ilanı çok incelemeden konuşalım demiştim. pozisyon bana daha çok data engineerlık gibi gelmişti. bugün tekrar baktım orada direkt olarak data engineer yazıyormuş. lanet olsun ya. data engineer kısmını görmemiştim. ama ilanda data engineerlık olmayan şeyler de var. mesela a/b test perform eder diyor. data engineer neden a/b test perform ediyor?

    sanırım ben stratejik bir hata yapıyorum. data scientist çoook genel bir kavram. sağlık çalışanı demek gibi bir şey mesela. mesela data analyst de data scientist olarak kabul ediliyor, bunun data engineer'ı da data science içinde. kardeşim benim direkt ve net olarak sanırım machine learning engineer olarak cv'mi değiştirmem lazım. o konuda sanırım daha spesifik olmak gerekiyor.

    ulan data engineerlık konusunda bilgim az ama ne zaman böyle ters bir durum olsa.. lan aramadığım bir pozisyon olunca mutlaka düşeş fırsat geliyor. en son hint bir head hunter zorla beni yazılımcı yapmaya çalışıyordu. kadına diyorum ki lan ben hatırlamıyorum php falan unuttum diyorum kadın diyor ki bu rakuten firması önce php'den başla sonra data science'a firma içinde geçiş yaparsın...

    13.10.22 editi:
    hipotez testi hakkında çok iyi bir görsel buldum. bu görseli çalıp burada yayınlıyorum. görsel. böyle görselleri ve zihin açan kod öbeklerini resim dosyası olarak bir klasörde tutup ara sıra açıp incelemek gerekiyor. mesela bir kod öbeğine paintte hemen bana ilginç gelen noktayı not alıp kaydediyorum. sanırım bu yararlı bir çalışma türü. mesela insan bir for döngüsünü farklı bir şekilde daha verimli bir şekilde inşa etmiş bir kod görürse onu kaydedip arada sırada incelemesi lazım.

    tabi görseli aldığımız arkadaşın medium makalesini de paylaşalım: https://medium.com/…or-data-scientists-6cef9c0e13f7

    hipotez testleri hakkında aklımda çözemediğim (eskiden sanırım çözmüştüm ama sonra unuttum) tek ve önemli bir soru var. h0 hipotezine yazdığımız cümle ile ha hipotezine yazdığımız cümlelerin sırasını neye göre yazıyoruz? mesela neden ha cümlesine "ortalamalar arasında fark yoktur" yazmıyoruz?

    14.10.22 editi:
    aws ml sertifikasına çalışıyorum. poisson dağılımından bahsediliyor. lan ben bunu lisansta anlamıyordum. nesini anlamadığıma şaşırıyorum. bu dağılım ortalaması bilinen bir olayın kaç kere olma olasılığını göstermiyor mu? aslında normal dağılımın nokta atışlı noktasının olasılığını gösteriyor gibi.

    15.10.22 editi:
    bugün hiç hazırlanmadan head hunter ile konuştum. 10dk'da biten head hunter interview'lerinden biri sandım. lan yanında da iki tane mühendis getirmiş. gerçek interview yapacağız dedi. biz data engineer arıyoruz dediler. lan ben data engineer olmak istemiyorum. bilmiyorum da spark falan. şu talihin işine bak ya. o kadar bildiğimiz machine learning'den mülakata çağırmazlar, bilmediğimiz data engineerlıktan mülakata çağırıyorlar. garip bir durum.

    böylece internship dışındaki ilk gerçek mülakatımı da yapmış olsun. artık kutlu olsun mu desem küfür mü etsem iki arada bir derede kalıyorum. beni zorla tokyo'da data engineer yapmaya çalışıyorlar.

    18.10.22 editi:
    zor bir durumdayım. biz sana maaş teklifinde bulunacağız. sonra bizim müşteri ile bir mülakat yapacaksın. onlar itirazda bulunmaz ise teklif geçerli olacak dediler.

    firma biraz büyük bir it servis sağlayıcı firma. yani kurumsal bir şey. ama mülakat süreci amatörce geldi bana. kafa karışıklığı var bende. acaba çok acil olduğu için mi böyle bir süreç oldu?

    öte yandan büyük bir hata yaptım. ilk mülakattan önce ik'cı ile yazışırken maaş en az şu kadar olursa fair olur dedim. keşke öyle bir şey söylemeseydim ya. olayın artıları var eksileri var. çok büyük bir kafa karışıklığı içindeyim. bunları buraya yazayım belki düşünceler biraz berraklaşır.

    artılar:
    1- proje fin/tech departmanındaymış. bankalara hizmet veriyorlar. mülakata katılan şirket it müdürünü gözüm tuttu. benim proje sorumlusu da iyi gibi duruyor. adam mesela pmp sertifikama vurgu yaptı.
    2- şirket iyi ve büyük bir şirket gibi.
    3- işte sql, python ve a/b testi icra edeceğim gibi. iş data engineer işi. a/b test ise veri bilimi işi. spark da var ama o olayı bilmiyorum.
    4- cv'mde bir yerde çalışıyor olmak bir sonraki iş için iyi olabilir.

    eksiler:
    1- çalışma ortamını videolardan falan gördüm. sevmedim. yan yana bilgisayarlar var. ben sıkış sıkış çalışmak istemiyorum. haşır huşur klavyede bir şeyler yazarken yanımdakinin bundan rahatsız olmasını istemiyorum. motiveyken öyle sessiz yavaşça da bir şey yazamıyorum. o ofis ortamını sevmedim. ben filmlerde herkesin yerinin belli olmadığı, farklı masalara gidip oturabildiğin yerlerden istiyorum. öte yandan biz fintech kısmında olduğumuz için acaba daha iyi bir ofiste olabilir miyiz?
    2- data engineer benim bildiğim bir alan değil. ben tüm çalışmalarımı data scientist olmak için yaptım. acaba aws ml sertifikasını aldıktan sonra kendim iş arasam data scientist bulamaz mıydım? yani 5puan gücünde bir data scientist olabilecekken 2puan gücünde bir data engineer olabilirim gibi geliyor.
    3- gereğinden düşük bir maaş kariyere yapışabilir. japonya'da önceki işinde aldığından daha fazla vermemek eğilimi var.

    nötr düşünceler, pozitif de negatif de olabilir:
    1- biraz data engineer skilleri öğrenmek acaba bir sonraki işte data science'a geçmek için faydalı olur mu? yoksa acaba farklı bir kolda biraz daha zaman harcamak hanemize eksi puan olarak mı yazılır?
    2- daha remote work olayı ne kadar diye konuşmadık. acaba evden çalışma olayı varsa boş zamanlarda veri bilimi bilgisini arttırmak için bir fırsat olabilir mi bu?
    3- en önemli kısım maaş kısmı. ben ilk linkedinden görüşürken en azından 6milyon yen/yıllık fair olur demiştim. ama o data science pozisyonu için demiştim. o da data science pozisyonu benim için önemli olduğu için. 6.000.000 yen vergiler düştükten sonra aylık 2500 dolar falan oluyor. data engineer maaşlarına baktım ortalama 7.600.00 yen gibi. aynı yerin data scientist pozisyonu vardı 10-12 milyon yen diyor. ama o 5 yıl deneyim istiyor ve sürüsüne bereket requirement yazmışlar. ayrıca data scientist olunca japonca da istiyorlar. şimdi şirket gidip bana 6 milyon veya 6.5 milyon yen teklif ederse ayıp ederler. ama edebilirler çünkü ben öyle söyledim. şimdi gidip desem ki o rakam data science pozisyonu içindi o da olmayacak. ama öte yandan japon çalışma kültüründe yüksek yaşa pozisyon tecrübesinden bağımsız olarak yüksek rakam verebiliyorlar. gidip 8 milyon teklif ederlerse tatmin olurum. bu şirket de düzgün bir yermiş derim. ederim de bence öyle bir şey olmalı.
    4- 6 veya 6.5 milyon teklif etmelerine karşılık negatiation yapmak için video izliyorum.
    ahan da şu video çok süper: https://www.youtube.com/watch?v=4vbjjkbethy

    pozisyon ile ilgili requirementlar dışında hiç bir şey bilmiyorum. kendi araştırmalarım sonucunda anladığım kadarıyla bankalara bazı analiz hizmetleri veriliyor. soracağım sorular var. ama teklif geldikten sonra bunları sorayım diye düşünüyorum.

    bir taraftan ik'cı arkadaş genç bir arkadaştı. süreç ise biraz amatörceydi. bu beni korkuttu. amatör bir ik, bana olabildiğince düşük fiyat teklif etmeye çalışacaktır. akıllı ve deneyimli ik ise olması gereken fiyatı teklif etmeye çalışacaktır. karar verici başkası olmalı diye düşünüyorum. bir de pozisyonlar için bir skala olması gerekir. ama firmada bazı pozisyonlara baktım. skala 5milyon - 25milyon arası yazmışlar. o nasıl bir skala lan. offf bizim ik'cı gidip "6 verelim ya, kendisi 6 demişti" derse o iş yaş. 6 milyon derlerse sanırım burada 4ay çalışıp 4. aydan sonra hollanda'da iş bakmak mantıklı olur.

    19.10.22 editi:
    bugün human resource ile linkedin'den yazıştık. ben nasıl fiyat yükseltirim diye düşünürken hr bana ilk başta söylediğim rakamın %20 aşağısını verebiliriz dedi. valla şöyle bir şok geçirdim. ben 6'ya fit değilken hr bana 4,6 dedi. biz 8 hayali kuruyorduk. bir şöyle etrafıma baktım kendime gelemedim. sonra hemen yönergeleri hatırladım. önceki gün linkini paylaştığım hintli kadının tavsiyelerini aklıma getirmeye çalıştım. kağıda yazmıştım kağıdı aradım. ben hiç pazarlık neyim yapamam. bir taraftan nasıl pazarlık yapacağım diyorum. bir taraftan japonya'da pazarlık yapılır mı diyorum. hintli ablanın öğütleri bir taraftan mantıklı geliyor ama bir taraftan da arkadaşları tarafından git kızla konuş şöyle şöyle de diye gaza getirilip hüsran yaşayan genç gibi de hissediyorum. eğer fiyat 5 milyon olursa aylık vergiler düştükten sonra 2.000 dolar ediyor. pazarlık yapmam lazım diyorum. aklıma aoe2'deki saladin campaign'indeki bir pasaj geliyor. the fight was fierce - the crusaders had to conquer or die. mostly they died.
    kağıdı bulup hazırladığım cümleleri yazmaya başladım. thank you so much. ı really appreciate your

    25.10.22 editi:
    fiyat yükseltelim deyince bir kaç gün cevap gelmedi. sonunda bugün 4.6'dan 5.2'e yükseltelim dediler. vergiler sonrası aylık 2k dolara denk geliyor.
    firmanın müşterisi ile de bir mülakat yapacağım. onlar da kabul ederse işi aldım demektir. büyük ihtimalle ederler.

    offf çok yorulmuşum ya. cidden 2020'den beri planladığımız kariyer değişikliğini 34 yaşında gerçekleştirmiş bulunuyorum. sanki uzun bir savaş bitmiş de terhis olmuşum gibi hissediyorum.
    https://www.youtube.com/watch?v=ddd_tkwvcwo

    12.11.22 editi:
    son bir haftadır ağız hastalığı ile boğuşuyordum. apse varmış. tmj sandım. cehennemi yaşadım. 3 gün sadece uyudum geçmedi. 1 hafta sabah, öğlen, akşam sadece mercimek çorbası içtim. sadece bir kaç kere arada yoğurt yedim. bugün gittim drenaj yaptılar. resmen içime yaşam enerjisi üflendi. feleğin çemberinden geçtik.

    https://www.youtube.com/watch?v=rgj9wzpzy_e

    21.11.22 editi:
    nice gün geçti. şu diş olayları çalışmalarımı aksattı. bu aralar toparladım ama hala apse falan olayları tedavisi devam ediyor. sanırım gece dişimi sıkıyorum. bu durum motivasyon hakkında beni düşünmeye itti. motivasyonu hep olumlu bir şey olarak görürüz. stres denilen şey tam olarak nedir? motivasyon denilen şey aynı zamanda bir "stres" unsurunu da mı barındırır? sanırım öyle. yani hayatı motive bir şekilde yaşamak da sanırım sağlığa zararlı etkisi oluyor. ben bunu yeni öğrendim ya. çünkü hayatımda ilk defa "disipline" faktörünü bu kadar arttırabilmeyi başarabilmiştim.

    öte yandan önemli bir şeyi itiraf edeceğim. itiraf demeyelim de yeni bir şey farkettim. biz sanırım bu günlüğü yanlış başlık altına yazmışız. data science çok çok genel bir kavram. cv'mde falan hep data scientist yazıyordu. abuk subuk bir sürü ilan için human resource firmaları benimle irtibat kuruyor. kardeşim ben data analyst olmayacağım. data analyst olacak olsam bunu daha lisans sonrasında olabilirdim. ben data engineer da olmayacağım. çünkü o alanda ilerlemedim. ben direkt olarak machine learning engineer olacağım. biriniz de bana machine learning konusunda iş ilanı gönderin.
    tabi bunu anlayınca bir aydınlanma yaşadım. sanırım direkt profile, cv'ye machine learning engineer yazıp data engineer ve data analyst ilanlarını elemine etmek gerekiyormuş.

    bir önemli gelişme daha var. önceki günlerde bir firma ile mülakat yapmıştım. onlar aradı dedi ki "hadi şimdi de bizim müşteri ile mülakat yapacaksın". iyi güzel. bizim şirketin ik'cısı inatla bana pozisyon hakkında bilgi vermiyor. bölük pörçük veriyor falan. halen pozisyon data science mı yoksa data engineer pozisyonu mu bilmiyorum. eyvallah dedim. verdikleri bilgilere göre data engineer'lıksa da yapayım. dediler ki "iki gün sonra müşteri ile mülakat var, ahan da bu da pozisyon ile ilgili detaylı ilan". "hasiktir" dedim. lan ben bu maddelerin çoğunu bilmiyorum ki. spark diyor bişey diyor. yani siz beni nasıl bir badireye itiyorsunuz. nasıl bir çalışma prosesiniz var anlamıyorum ki. bana "mülakatta pozitif ol. bilmiyorsan bilmiyorum ama öğrenirim de" dediler. lan bir maddeyi öğrenirsin iki maddeyi öğrenirsin. ben çok madde bilmiyorum. hem karşı taraftaki firma da şöyle demez mi? "kardeşim, kaizenuberalles. sen sapık mısın? machine learning konusunda çok güçlü bir cv hazırlamışsın. projeler falan yapmışsın. ama gelmiş kel alaka bir data engineer'lık pozisyonuna başvuruyorsun. amacın nedir?"

    yani böyle deseler haklılar. hani bu kadar zamanını data science'a harcayıp gidip data engineer mülakatına girmek nasıl bir ruh hali olabilir ki? tamam data engineer'lık çok uzak bir alan değil. ama neden? yani belki binlerce saat data science'a harcayıp sonrasında insan gidip neden data engineer mülakatına girer?

    neyse mülakata girdim. bizim firma dedi ki "karşı taraf zorlayacak. hep teknik sorular soracaklar.". eyvallah.
    mülakatta karşıya tek kişi değil de bir ekip geldi. aha dedim ki sıçtık. tam bir rezillik olacak. o kadar insan senin için toplanıyor ve soru soracaklar. onu bilmiyorum, bunu bilmiyorum... demezler mi "lan niye geldin o zaman" diye.

    ilk anda karşıma bir çinli mühendis geldi. ikinci bir "sıçtık" da oradan geldi. adamın mikrofonu falan çalışmıyor. ne dediği anlaşılmıyor. çalıştığı ofisteki milletin sesleri geliyor. daha selamlaşma kısmını bile geçemedik. biliyorum ki adamın mikrofonu düzelse de aksandan hiç bir şey anlamayacağım. diyor ki "ses düzeldi mi?". "git sessiz bir ortamdan bağlan" diyemem ki. bu adam bir de bana spark'daki bilmem ne fonksiyonunu soracak.

    neyse. birden diğer elemanlar da geldi. lan bunlar avrupalı. avrupalıları görünce çok sevindim. çin aksanına kalırsak yanarız. bir eleman soru sormaya başladı. lan bu data engineer'lık sorusu değil. bildiğin data science soruyorlar.
    50 dakika boyunca soru sordular. neredeyse hepsini de yanıtladım. baya da iyi yanıtladım lan. kendi kendime şaştım valla.
    logistic regression nasıl çalışır dediler, lineer reg algoritmasının çalışma şeklini anlat dediler, deep learning loss function nedir dediler. baya baya teknik soru geldi. hepsini de neredeyse yanıtladım. bakalım sonuç ne olacak.

    en sonda senin sorun var mı dediler. bizim şirket demişti ki "çok soru sorma. çünkü pozisyon ile ilgili bilgileri çok iyi anlamış olman bekleniyor". lan bana ilanı vermediniz ki okuyup bileyim. şimdi aklımda şu soru var: bu pozisyon ne pozisyonu allah aşkına? ilanda full data engineerlık var. siz bana full data science soruları sordunuz.
    tabi "şimdilik bir sorum yok" dedim anca. şunu düşünüyorum. bu mülakatta gerçekten data engineerlık hakkında böyle teknik sorular sorsalardı gerçekten rezalet bir durum yaşanırmış.

    mülakatın sonuncunun ne olacağı önemli değil. ben artık kendime kendimi kanıtladım. önemli olan buydu. böyle zor ve teknik bir mülakattan alnımın akı ile çıkmış olmak bana yeter. daha da ileriye gideceğiz.
    https://www.youtube.com/watch?v=xxd7lbsi7fs

    sırada sezar'ın galya hakkında yazdığı kitabı okumak var. yoksa cermanya mıydı? bir de aws machine learning sertifikasını alacağız.

    all gaul is divided into three parts, in one of which the belgae live, in another, the aquitaines, and in the third, the celts...

    29.11.22 editi:
    mülakattan sonuç çıkmadı. adamlar kabul etmemiş.
    bir kerede sonuca ulaşmayı beklemiyordum. illa böyle 3-4 kere finalden maç dönecektir. 5. denemede maçı alırız diyordum. ama mülakat iyiydi ya. niye kabul etmediler anlayamadım.
    gerçi dil bariyeri veya aklıma gelmediği için 1-2 soruyu yanıtlayamadım ama... mesela bir data science projesinin aşamaları nedir dedi benim kafa durdu. ne demek istiyor çok anlamadım. meğerse data temizliği, eda falan diyecekmişim... gerçi dedim ya. sonradan aklıma geldi anlattım.
    neyse. sorun değil. zaten aracı kurum maaşın önemli bir kısmını cukkalıyordu. ana firmanın bu pozisyona ödediği para 7 milyondan başlarken aracı firma bana 5.2 milyon veriyordu. sorun değil. çabalamaya devam.

    bu aralar aws machine learning sertifikasına çalışıyorum. udemy'den 4.5 puanlı bir kurs aldım onu izleyip duruyorum.

    geçen günlerin birinde cv'mi düzenliyordum. cv bence iyi oldu. bende artık cv geliştirmek falan fetiş gibi bir şey haline geldi. üniversite zamanlarımı düşünüyorum. amma çok fight clup izlerdim. aklıma hep tyler durden ile esas elemanın otobüsteki diyalogları geliyor. ama tyler durden haklı değil. tyler durden zamanında benim çalıştığım ofiste çalışıp o insanlarla muhattap olsaydı tövbe ederdi. dünya aptal ve şark kurnazı insanlar ile dolu. bu kadar kariyer manyağı haline gelmemin sebebi ikea'dan mobilya alabilmek tutkusu değil. tüketim ürünleri beni hiç motive etmiyor. tek amacım benzer insanların olmadığı bir noktaya yükselebilmek. para bu insanlardan kurtulabilmenin aracı.

    30.01.23 editi:
    nerdeyse iki ay geçmiş önceki güncellemenin üzerinden. süreç bu kadar uzayınca biraz da yazmaktan çekinmeye başladım. ne var ki bir taraftan da sürecin uzaması yanlış bir taktik izlediğimiz anlamına da gelmiyor. neyse biz her halükarda yazalım.

    aws ml sertifikasına çalışmaya devam ediyorum. yahu bu ne biçim bir sınavmış ya. resmen tuzağa düştük. ilerlerken botlarım çamura batmış gibi hissediyorum. ormanda ağaçların tepesinde ingiliz okçuları patikanın sağından solundan ok atıyor. testudo formasyonu aldık direnmeye çalışıyoruz. roma ordusunun germanya'da buna benzer bir pusuya düşme durumu var. bir tanesi de 1. haçlı seferinde dorlion muharebesinde oluyor. türk atlı okçuları haçlılara ok atıp atıp kaçıyorlar. haçlılar atlardan inip kalkanlarla çember oluşturup oklara karşı direniyorlar.

    yani geçmişte de zor denilen sınavlara girdim ama onlar o kadar zor değildi be. zor denilen pmp sertifikasında 1000 sayfalık çalışma kitabı falan vardı, sınavı geçmiştim. ielts'e çalışıp geçmiştim ama bu zorladı.
    bu sınavda şöyle bir oltaya geldik:
    1- bu sınavdan önceki ilk aşama sınavında 6 ay aws deneyimi istiyordu. deneyimsiz şekilde sadece ders izleyip, soru çözerek sınavı geçtim. oraya 3 hafta harcadıysam buna da en fazla 1.5 ay harcarım diyordum. sınav için aws 6 ay amazon deneyimi 2 yıl da machine learning deneyimi gerekir yazmış. bence tamamen yanıltıcı bilgi. tam tersine, 6 ay machine learning ama 2 yıl amazon ml deneyimi deseler daha doğru olurmuş.
    2- ilk kez sınav için önerilen kaynakların hiç de yeterli olmadığını görüyorum. tek bir kaynak kesinlikle yeterli değil. adamlar şu servis sayesinde şunu yaparsın diyor, sınavda şu servisin şu özelliğini hangi çağırdığın kod fonksiyonu nedir diyor. çüş yani. işin kötü yanı, biraz udemy kurslarına kandık. adamlar yüzeysel olarak anlatınca ben de sınav öyle yüzeysel olacak sandım.
    3- en çok tavsiye edilen bir kaynak var. bir udemy kursu. adamın aksanı bitirdi beni. telef olduk. anlayana kadar canım çıktı.
    4- sınav hakkında ortalıkta çok soru ve kaynak yok. kaynak olsa da bunları türkiye'deki gibi fotokopiciden bastıramıyorum. kitabını falan amazon'dan sipariş edeyim desem bankadan kredi çek derler. öyle bir kitap fiyatlandırma olayları var. ki kitap da çare değil. millet basit başlıklar var kitapta diyordu.

    öte yandan sınav soruları türkçe paragraf soruları gibi. bir taraftan da sorunun ingilizcesi ile uğraşıyorum. bazen paragrafı okurken avrupa yakasında volkan'ın kitabını okuyor gibi hissediyorum. orospu çocuğu sadede gel diyorum. anlatıyor anlatıyor anlatıyor bazen gidip son cümlede bambaşka bir şey soruyor.

    yapacak bir şey yok. ilerlemeye devam edeceğiz.

    04.02.23 editi:
    aws sertifikasına.
    [https://www.youtube.com/…0de0z0g241buso-xt&index=19 https://www.youtube.com/…0de0z0g241buso-xt&index=19]

    eskiden hem çok çalışıp hem de bilgisayar oynayamazdım. çok çalışmayı yorulduğumuz için kesmeyiz. mesela 1 gün iyi çalıştık, 1 hafta iyi tempoda çalıştık. ama sonra bu durur. disiplini kaybederiz. peki disiplini neden kaybederiz? çünkü mutsuzluk artar. yani bizi sınırlayan tembellik, yorulmak falan değildir. bünye depresyona girer ve çalışma azalır veya sonlanır. 1 ay iyi bir tempoda ders çalışamayız.

    ben bilgisayar oynayınca depresyona girmiyordum. ama şöyle bir olay var, bilgisayar oynarken çalışma arttıkça mutsuzluk artar. mutsuzluk arttıkça daha çok bilgisayar oynamaya başlarım. daha fazla pc oynadıkça yatma saatim geç olur. sonra bir bakarım ki uyku düzenim kaymış. sabah olmuş hala pc oynuyorum. ve böylece yine çalışma serim alt üst olur.

    şimdi bir arkadaşla çalıştığım için her gün aynı saatte çalışma masasına geçiyorum. böyle olunca pc oynama hep sınırlı kalıyor. mecburiyetten sabahlayamıyorum. aha dedim ki böylece bu olayı çözdük. hem pc oynayacağız hem düzenli çalışacağız.

    ne var ki yine olmadı. günde 7 saat çalışıp 6 saat falan pc oynuyordum. o da olmadı. bir şey farkettim. öncelikle hareketsizlikten sırt ağrıları başladı. en azından 13 saat aynı pozisyonda duruyoruz. ikinci olarak da ders çalışmak çok eziyet veriyor. çünkü pc oynamak kafa kimyamı bozuyor. akşam çok mutlu olunca sabah veya öğlen derse odaklanamıyorum. oysa ki akşam o kadar mutlu olmazsam bir süre sonra kafa otomatikman mutlu olma kimyasallarının üretimini arttırıyor. sözün özü şunu farkettim ki hem pc oynayıp hem ders çalışmak bir ütopya. yani 7 saat ders çalışsam bile bu verim benim için yeterli değil. ne yazık ki...

    pc oynamayı bıraktım. günde iki kez 1 saatlik yürüyüşe çıkıyorum. o sırada yürürken ders çalışıyorum. verimim baya bir arttı.

    yalnız ben pc oynamayı daha önce de bırakmıştım. öyle 2-3 ay çok iyi çalıştıktan sonra sabahları depresif mod ile uyanmaya başladım. sonunda da dişlerimi sıkıp çeneyi haşat ettim ve onun sonucunda tekrar pc oynamaya başladım. gerçekten benim hayatımda böyle döngüler var. döngüler uzun sürdüğü için anıları unutuyorum, sebep-sonuç kuramıyorum. pc oynamayı bırakmak tek başına bir çare değil. çünkü ilk krizi atlattıktan sonra tam verim arttı derken depresyon geliyor. işte ilk defa buna karşı bir çare düşündüm ve sanırım işe yarıyor.

    bitter çikolata aldım. sabahları sütle karıştırıp sıcak çikolata içiyorum. toz olanlarından değil direkt çikolata. sabah depresifliğini yok ediyor. normalde evde tatlı olursa o tatlıyı bitirmeden rahat edemem. ama bitter çikolata kötü tadı olduğu için stok olarak da kalabiliyor. çok basit bir çözüm. ama muhteşem bir çözüm. ulan bunca yıldır toplumda bir kez böyle pratik ve işe yarar bir tavsiye almadım.

    06.02.23 editi:
    yakında kahvaltımı da sabah yürüyüşünde yapmaya başlayacağım. geçmişten şunu çok iyi biliyorum, ben yüksek notları çs'lerde, kütüphanelerde, evdeki çalışma masasında değil doğada, otobüste, boş sınıflarda, terkedilmiş duraklarda çalışırken kazanıyorum. ara sıra kütüphane veya evde çalıştığım da oluyordu. ama tek bir yerde çalışmak bana uymuyor. hareket halinde ve azar azar çalışınca verim artıyor. şu sertifika işinde çok zaman geçip yeteri kadar yol alamadığımız için muharebe tarzında değişikliğe gittik. braveheart filminin ikinci cd'sinin ilk sahnesinde bir açılış vardır. adamlar dağa çıkar ve yüksekten bir su birikintisine atlayıp koşmaya başlarlar. gerilla tarzı savaş verirler. benim verim de öyle çalışınca artıyor. bugün kahvaltıyı da dışarıda yapmayı deneyeceğim. tama nehri var. onun etrafında günde 2 saat yürüyorum. yürürken ders çalışıyorum. banklar var. kahvaltıyı da orada yaparsam ve o sırada çalışabilirsem güzel olacak. günde 2 saat yürüyünce gece 22:00 civarı kütük gibi uyuyabiliyorum.

    yalnız şöyle bir sorun ortaya çıktı. lan ben bu sertifikayı alabilirsem kesinlikle aws kullanan bir machine learning yerinde çalışmam lazım. var mı böyle yerler. yüzdesi ne kadar. körlemesine bir yola çıktık ama... yani diyelim ki bir işe girdim, maaşı da iyi diyelim. ama aws kullanmıyorlar. bu kadar emekten sonra öyle bir yere girersem emeklerim hep boşa gitmiş gibi hissederim. hatta emeklerimin %75'i boşa gider. çok kötü olur ya. çok fena bir durum ya.

    09.02.23 editi:
    dün aws sertifikası için sınav yaptım 64 aldım. 10 puan daha yükseltmem gerekiyor.

    bu arada geçenlerde olan bir mülakattan bahsetmiştim. çoğu soruya doğru cevap verdim iyi geçti demiştim.
    farkettim ki o kadar da iyi geçmemiş ya. bu sertifikada az da olsa machine learning konuları da var. az çok benim bildiğim konular. fakat şöyle bir fark var. benim aklımdaki bilgiler "kavramsallaşmış" halde değil. "pratiğe" dayalı. yani missing value varsa ne yaparsın sorusu geldiğinde "mean" ile doldur yönteminin en basit yöntem olduğunu, daha karmaşık yöntemler olduğunu biliyorum. hatta bunların bir ikisini de pratik olarak uygulamışlığım da var. ama mülakatta böyle soru gelince benim aklımdaki bilgileri toplayıp ifade etmem, anlatmam uzun sürüyor. belki iyi şekilde de ifade edemiyorum. mülakatta böyle bir soru geldi. "mean" en basiti dedim. daha karmaşığını anlat dediler. bir şeyler anlatmaya çalıştım ama sanırım karşı taraf anlamadı. oysa ki bu sertifikaya çalışmış olsam "knn" der geçebilirdim. hatta daha maliyetli ama daha iyi bir yöntem istiyorsanız, ayrı bir deep learning modeli kurup missing value'ları tahmin etmeye çalışın derdim. bu kadar basit. ben ise örnekler üzerinden destan anlatmışım.
    hal böyle olunca şunu farkettim. aslında mülakatı yapan mühendis ben ikinci derinlikteki soruya yanıt veremeyince üçüncü derinlikte bir soru sormadan farklı bir alana geçmiş. öyle olunca da bana mülakat kolay geçmiş gibi gelmiş. yazık ya. aslında hep kolay kolay bilgilermiş. atla deve değil. adam vanishing gradient problemi nedir diye sormuş. onu yanıtlayamamışız.

    neyse bir kaç bilgi içeriği de ekleyelim günlüğe.
    (bkz: hyperparameter tuning/@kaizenuberalles)
    (bkz: random search/@kaizenuberalles)
    (bkz: target encoding/@kaizenuberalles)
    (bkz: feature scaling/@kaizenuberalles)

    16.02.23 editi:
    şu deprem olayı bir kaç gün disiplinimi bozdu. büyük felaket. ya üzülüyorum ama üzüntüden çok sinirleniyorum. öfkeleniyorum. millete sinirleniyorum. somut tercihler ile kanıtlanmamış birlik ve beraberliğe zerre inanmıyorum. birlikte üzülmek birlik ve beraberliği göstermez. birlik ve beraberliği yapılan tercihler inşa eder. tercihleriniz hep birlik ve beraberliğin aksine. laf etsem hem ben kötü olacağım hem de bir işe yaramayacak. o yüzden sertifikaya odaklanmak en iyisi. tekrar disiplini arttırıp çalışma miktarını arttırmak gerekiyor.

    https://www.youtube.com/watch?v=eux3g76kmze

    17.02.23 editi:
    sezar'ın kitabını ne yazık ki sadece biraz okuyabildim. kitap okumaya zaman ayıramayız. oysa ki güzel kitaptı. bir yerde sezar suevlerle yani bir alman kabilesi ile savaşırken yenilecek gibi oluyor. italya'dan da epey uzakta. oralarda o çağda yenilse o askerlerin hiç biri her halde roma'ya geri dönemez. o suev pezevenkleri onları orada diri diri pişirir yer. sezar atını ileri sürüyor. her centurion'a (yüzbaşı gibi bir şey) ismi ile seslenerek dayanmalarını söylüyor ve sonunda kazanıyorlar. bazı alman kabilelerini tamamen kılıçtan geçiriyorlar. tarihten siliyorlar.

    adamlar nasıl o kadar hızlı odundan sur örüyor, kamp kuruyor, köprü yapıyor, filo kuruyor ben anlamıyorum. her halde orta avrupa'da tahta çok olduğu için. keltler, almanlar dumur oluyor. adamlardaki mühendislik +7 gücünde.

    kitabın bir yerini çok sevdim. adamlar ingiltere denilen yere sınır ötesi operasyon yapacak. çünkü ingiltere'deki keltler, kuzey fransa'dakileri ara sıra kılşkırtıyor. ama ingiltere hakkında neredeyse romalılar hiç bir şey bilmiyor. sadece en kıyıdaki bir kaç kabilenin adını duymuşlar. biraz araştırıyorlar. ingiltere'nin ortasında tarım yapmayan süt içen kabileler yaşıyormuş. vay canına dedim. bildiğin adamlar halen avcı toplayıcı veya yarı göçebe durumdalarmış demek ki. bunun dışında romalılar irlanda'yı biliyor. sezar diyor ki bu ingiltere üçgen şeklinde. yukarı kısmından da irlanda'ya bir bağlantı var. helal olsun dedim. yıl mö50 falan. ama adamlar az çok biliyor. sonra diyor ki adamlarımız bir icat yaptı. bu ingiltere topraklarında günün daha kısa sürdüğünü falan buldular diyor.

    bu arada keltlere de biraz üzüldüm. ne gariban milletmiş lan. gelen vurmuş giden vurmuş. herifler koca orta avrupa'yı almanlara kaptırmışlar sonra yetmemiş bir de ingiltere'yi anglo-saxonlara, yine almanlara kaptırmışlar.

    18.02.23 editi:
    çikolata mutlu etmiyormuş. sanırım içindeki şekerden dolayı öyle sabahları mutlu oluyormuşum. araştırdım. phenethylamine diye bir madde var. bu insanı mutlu ediyor. ama bu madde ağızdan alınırsa midede parçalanıyor ve etki etmiyormuş. kakao miktarı daha yüksek çikolata aldım. öyle mutlu falan etmiyor. çok büyük bir buluş yaptığımı düşünmüştüm.

    hadi bir de veri bilimi ile ilgili bir soru sorayım. scaling yöntemleri içerisinde neden standardizasyon, normalizasyona göre outlier dataları daha iyi handle ediyor? ben sebebini çözdüm sanırım. ama tam olarak anlamam için excelde kendim bir örnek yapıp formülleri hesaplamam lazım.

    yani mutluluk sorununu çözemedim ama uyku sorununu çözdüm. günde iki saat yürüyünce gece 22:00'de uykum geliyor. yürürken de çalışmaktan yorulursam marş playlisti dinliyorum.
    https://www.youtube.com/watch?v=ak_i1og-gvq

    28.02.23 editi:
    lanet gelsin ya nerden bulaştım bu aws ml sertifikasına. aws kullanmayan bir yere de giremem artık. girersem çok yazık olur. nereden bulacam ben aws ml kullanan iş yerini. offf...

    --- spoiler ---

    ocak - şubat - mart 2023
    --- spoiler ---

    02.03.23 editi:
    bugün çok önceden öğrendiğim, taa aldığım ilk sadi evren şeker kursunda, ama sonradan unuttuğum bir bilgiyi tekrar öğrendim. ufkum iki katına çıktı.
    data üzerinde standardizasyon yapacaksınız diyelim. datayı train, validation ve test diye ayırdıktan sonra mı yaparsınız yoksa önce mi yaparsınız?
    ben ayırmadan önce yapardım. toptan tüm datayı bir kerede düzenlemek için. yanlışmış işte. data leak oluyor.
    train ve test data setinin bir birini görmemesi lazım. bir birlerinden habersiz olmaları lazım.
    oysa ki siz bu iki data seti üzerinde aynı formülü uygularsanız dolaylı olarak formülde mean value, variance değeri falan kullanıldığı için data setleri bir birlerinden haberdar olabiliyormuş.

    14.03.23 editi:
    bugün aws machine learning engineer sertifika sınavını 895 puanla geçtim. çok yoruldum. aylarımı aldı bu meret.
    https://www.youtube.com/watch?v=lbdoi3iomse

    23.03.23 editi:
    tekrar şirketlere başvuru yapıyorum. hollanda ve almanya'ya başvuru yapıyorum. almanya'da bir iş vardı dibim düştü. sertifikadan beri 9 yere başvurdum. bu almanya'daki iş yerine bir cover letter yazdım helal olsun dedim. 2 günde yazdım. internet sitelerini falan araştırıp presiplerine mi vurgu mu yapmadım, job requirementları nasıl sağladığımı mı anlatmadım. içinde aristotales'den falan vurgu yaptım. ama ses gelmiyor. bir taraftan da japonya'da bir yere başvurmak istemiyorum. bakalım şimdi yine bir şirket için cover letter yazacağım. aslında 9 yerden sadece 1 tanesi için letter yazdım. diğerleri easy appy'dı. eskiden 1-2 yıl önce yazdığım letter'lar çok jenerik oluyordu. şimdi emek verince, saatlerce uğraşınca ortaya gerçekten güzel letter'lar çıkıyor.

    yazdığımız akademik makaleye bir minör bir major gözden geçirme gelmiş. bunları yaparsanız yayınlarız demiş. çok moralim bozuldu. the godfather3'de ben bu işlerden kendimi çektikçe beni tekrar içeri çekiyorlar diyordu. ben artık iş aramak istiyorum. iş aramalıyım. nereden çıktı majör makale gözden geçirmesi.

    24.03.23 editi:
    bugün akademik makaleye şöyle bir bakayım dedim. yok kafa çalışmıyor. istek gelmiyor. iş arama olayına çok güzel odaklanmıştım. şimdi tekrar odak değiştirdik. odak değiştirince motivasyon sıfırlanıyor. makalede ingilizce kelime hataları da yapmışız. ulan nasıl yaptım aklım almıyor. gerçekten de hata var. e ben 50 kez grammerly'le falan kontrol ettim. bu grammerly kafasına göre bazen hataları mı atlıyor ne yapıyor.

    öte yandan akademik dili düzeltin demişler. offf zulüm ya. ne güzel ben aristolu, platonlu cover letterlar yazıyordum.

    14.04.23 editi:
    makaleyi tekrar gönderelim bir kaç hafta oldu. her gün işlere başvuruyorum. 17 marttan 2023'den beri 53 yere başvurmuşum. bazıları cv'ye baktı, bazıları red cevabı gönderdi ama daha mülakata çağıran olmadı. başvuruları genellikle hollanda ve japonya kısmen de almanya civarında yapıyorum. yorucu bir süreç.

    15.04.23 editi:
    age of empires 2 barbarossa campaign'inde bir sahne vardır. barbarossa kuzey italya'yı hre içerisine katar. ama sonrasında kuzey italya'yı elde tutamaz. italya'ya gidince alman prensleri plot çevirmeye başlar. almanya'ya gidince de italyanlar hemen ayaklanır. barbarossa aynı anda her yerde olamadığı için hre'yi bir arada tutmak çok zordur.
    https://youtu.be/i6zayktlpq0?t=302

    buna benzer bir zorluk yaşıyorum. sql bilgimi tazelemek için test çözsem o arada ml algoritmalarının parametrelerini unutuyorum, parametrelere baksam python pratiğim paslanıyor, python baksam deep learning bilgisi unutuluyor. gradient descent neydi diye ortalıkta geziyorum. yetmiyor.. yetmiyor... aws sertifikası aldım diğer bilgiler gitti. o arada akademik makale de yazayım researcher özelliğimiz de olsun dedim. en sonunda şener şen gibi sokakta koşmaya başlayacağım.

    16.04.23 editi:
    gözümün önünden ionyalıların truva'ya ok yağmuru altında saldırmaları geliyor. sanki kergit süvarisi ile rodok saflarını yarmaya çalışıyoruz ama olmuyor. zırhları geçemiyoruz. son 1 ayda 70 başvuru yaptım bir tane bile geri dönüş yok. başka bir yol bulmamız lazım. ricat borusu çalıp geri çekilip tekrar organize olacağız.

    17.04.23 editi:
    buradan şimdiye kadar bir çok arkadaş buldum ve birlikte çalıştım. ama sistemde değişiklik yapmam gerekiyor. ücret karşılığı intern bulmam gerekiyor. mesela 10 saat bir konuyu araştırıp bana 1 saatte bulgularını anlatırsa eğer daha hızlı ilerleyebilirim. öteki türlü her şeyi birlikte çalışırsak bende işlere başvuracak takat kalmıyor. öyle bir sınıra dayandım ki bu gibi işleri delege etmeden daha fazla ilerlemek mümkün değil.

    18.04.23 editi:
    2021'de bir yıl data science'a ara vermiştim. o ara finansal piyasa bir şeyler kazanıp gayrımenkule yatırmıştım. diyorum ki o kira gelirini intern olayı için ayırayım. zırhlı safları o şekilde aşmaya çalışalım.

    19.04.23 editi:
    hem buradan hem çeşitli telegram gruplarından intern bulmaya çalıştım. çok insana ulaşamadım. bir telegram grubunda taşlanarak kovalandım. admin ve yandaşları gıcık oldu bana. zamanında bir finans teknik analiz grubunda da elmas formasyonu yüzünden kavga çıkmıştı. bitcoin 6k'dan 3k'ya düşünce "zafer yakın, umutsuzluğa kapılmayın" deyince gruptan hoş olmayan tepkiler almıştım.

    neyse.. çok de-motive oldum ama başka bir yol bulmam lazım dedim. linkedin geldi aklıma. şöyle bir arattım türkiye'de kaç ilan var diye. ilan yok lan... 1 hafta veya 1 ay önce çıkmış ilanlar var. staj ilanı kaç tane diye baktım. tüüü 0 lan. koskoca ülkede bir tane ml stajı yok.
    eee herkes yok ai şöyle yok machine learning böyle diye atıp tutuyor? ulan koskoca ülkede bir tane ilan yok. lafa gelince yapay zeka şöyle yapay zeka böyle. olay bana çok garip geldi. dedim ki buradan iyi bir sonuç gelmesi lazım. güzel bir ilan hazırladım. oturdum uğraştım. ilanı verdim. gerçekten çok iyi sonuçlar geldi. ulan dedim keşke elde daha çok kaynak olsaydı da bu kadar parlak genç var, insanlara katkı sağlayabilseydim.
    ama imkanlar kısıtlı. yine de gelecek için umutluyum. bir kişi de şam üniversitesinden başvurmuş. bachelor ai, master degree ai, python developer. oha dedim. gerçi ben yine daha çok biliyorumdur gibi geliyor ama yine de over-qualified. ama bir taraftan da aklıma senaryolar geliyor. lan ilerde böyle bir grup kursak, bu şam üniversitesindeki arkadaşı da ön safa geçirip kaggle competitionlara doğru yürütsek, ben de gruba adımı eklerim. %10'a girsek cv'ye eklerim. güzel bir sinerji oluşma potansiyeli mevcut. aklıma anadolu'dan gidip cezayir'de yeniçeri cumhuriyeti kuran oluşum geliyor.

    20.04.23 editi:
    gradient descent ne demek? lan bu soru mülakatta gelmişti de unuttum demiştim. günlerdir bilinçaltımda ulan ben gradient descent/@kaizenuberalles sorusunu nasıl bilemem diye kendimi suçluyorum. hababam sınıfında bir edebiyat hocası vardı neyzen teyfik'in ölüm yıldönümünü hatırlayamadı diye harakiri yapacaktı. ben de biraz öyle hissediyorum. geçende pytorch kursunda açıkladılar. ulan çok da basit bir şey ya. lanet olsun. gradient descent nedir bilmeyen bir insan kendine nasıl machine learning engineer diyebilir?

    21.04.23 editi:
    yanlış hatırlamıyorsam stochastic gradient descent, batch gradient descent ve gradient descent üç kardeş. tüm data seti 1 yıldan oluşuyor diyelim. bunların en fevrisi ve sıcak kanlısı. stochastic gradient descent. bu kardeş 1 günlük etkiye hemen tepki veriyor. 1 günkü olaylara göre tavrını değiştiriyor. öyle olunca öğrenme sürecinde çok zigzak yapıyor. batch gradient descent daha az fevri. bu kardeş 5-10 gün falan bekliyor. ona göre tavır takınıyor. en soğuk kanlısı ise gradient descent. bir yılı gözlemliyor. ona göre tavır takınıyor. tabi üç kardeşin de güçlü ve zayıf yanları oluyor.

    cover letter olayında yeni bir teknoloji buldum. cover letterlarımı excelde modüler hale getirdim. her paragraf bir requirment için. böylece her ilana göre cover letter'ımı hızlı bir şekilde özelleştirebiliyorum. ilan almanya'da ise farklı bir cümle, hollanda'da ise farklı bir cümle hemen copy-paste ediyorum. ilaç sektörü ise farklı fintech ise farklı.

    https://www.youtube.com/…d7b6a2h2wdmg&start_radio=1

    29.04.23:
    concept drift / data drift terimi ne anlama gelir? diyelim ki iphone fabrikasında bir ml modeli geliştirdiniz. bu image recognation modeli telefonlara bakıp ekranda çizik varsa bunu tespit ediyor. yani kalite kontrol işi yapıyor. her şey iyi güzel gidiyor. sonra üretim bandında ışıkları kıstılar veya daha fazla açtılar. ve sizin model eski duruma göre eğitilmiş olduğu için performansı düşmeye başladı. ahan da buna concept drift / data drift denir.

    15.06.23:
    bu günlüğü yazmaya başlarken ne kadar da başaracağıma inançlıydım. hala da inançlıyım. ama biraz suçluluk da duymuyor değilim. günlüğün başlarındaki kişi ile "machine learning" açısından ne kadar aynı kişiyim? bu konuda bir "zeal" duyuyordum ve motive edici şeyler yazdım. çok çalışırsa herkesin bu kariyere geçiş yapabileceğini düşünüyordum. özellikle günlüğün ilk kısımlarında bunun kolay olacağına dair bir algı yaratmış olabilirim. zormuş lan gerçekten. mümkün tabi ki ama hiç kolay değil. bu işin okulunu, doktorasını okuduysanız eyvallah ama diğer türlü zormuş be.

    ama yine de ilerliyoruz. 286 yere başvurmuşum. şimdiye kadar 1 yer sadece mülakat için dönmüştü. bu hafta 2 yer daha döndü.
    bunlardan biri "yaraku" firması. evet yaraku. buna başvururken kendi kendime "lan şimdi ikiuyüz bilmem kaç başvuru arasında bu yaraku firması beni işe alır, talihin bana böyle bir şakası olur diye aklımdan geçirmiştim. 6 soru gönderdiler. onu yanıtlayınca mülakat tarihi verdiler. konu nlp. nlp en güçlü olduğum alan. ama ben hep sentiment analiz yaptım. bunlar neural network ile cümle çeviriyorlar. konu ile ilgili hiç bir fikrim ve bilgim yok. 1,5 saat mülakat zamanı olacakmış. yandım valla yandım.

    16.06.23:
    bu arada bir machine learning organizasyonu kurdum. oraya stajyer falan alıyorum. bu hafta bu mülakat olayları ortaya çıkmasa ekip üyesi sayımızı 2'ye çıkaracaktık. güzel gidiyor. internet sitesini falan yaptım. şirket ideolojisini yazdım. manpower arttıkça ortaya güzel ürünler çıkacak diye umut ediyorum.

    20.06.23:
    bugün haftalardan beri ilk kez kahve içtim. mutlu ve canlıyım.

    bu hafta iki yerde mülakata girdim. böylece şimdiye kadar girdiğim mülakat sayısı 3'e çıktı. ilk mülakat robot şirketindeydi. çok güzel konuştum. ama adamlar time-seriesçi arıyor. metrik falan sordu. ne yazık ki hep classification konusunda metriklerden bahsedebildim. regression konusunda rmse ve mse'yi öne sürdüm. ama pek başka metrik söyleyemedim. ulan keşke bu kadar nlp bileceğime time series çalışmış olsaydım.

    ikinci mülakat yaraku firmasındaydı. 2 kişi geldi. algoritma sordular. yapamadım. ulan bu kodlama dilden de nankör bir beceri. nasıl unutmuşum. ulan o kadar karmaşık algoritmalar üretmiş olan ben fibonaççi metodu üretemedim. kahroldum vallahi. 20 dakika debelendikten sonra sanırım benim kodlama becerimi recover etmem lazım dedim. tamam dediler mülakatı bitirdiler.

    ama sorun bende değil. sorun yapısal. bu data science derya deniz bir sürü skill istiyor. bunun bir tarafını hallediyorum diğer tarafı unutuyorum. teorisine çalışıyorum kod soruyorlar. koda çalışıyorum akademik research var mı diyorlar. onu hallediyorum a/b testi istatistik soruyorlar. o sırada aws/azure bilgisi falan geliyor. vallahi çok zor ya. onu da yapsam bu sefer sql soracaklar.

    sql bilmiyorum değil. hatta gittim en zor sorularını da çözdüm. ama eskiyor işte skiller. tüm skilleri güncel tutmak tek başına mümkün değil. bunu grup halinde çalışarak, sistematik idman yaparak ancak çözebiliriz. kurduğum organizasyonda kişi sayısını arttırıp 2'ye çıkacağız. o arkadaşla da her toplantıda algoritma alıştırması yaparız.

    robot şirketindeki mülakat öyle kötü değildi ama yaraku firmasında resmen ingiliz atlıları iskoç piyadelerini dümdüz etti geçti. adamlar eu4'teki gibi resmen wipe attılar.

    acayip kötü hissettim. haftalardır kahve içmemiştim. kahve içtim dota oynadım kendime geldim. yapısal reformlar yapacağız. şimdi kendimi uhud savaşındaki yenilgiden sonra çağrı filminde toprak kazan medineliler gibi hissediyorum. din sevmiyorum ama sanırım durumu en iyi o sahne anlatıyor. yenilmiş olsak da doğru yoldayız. daha organize bir takımla, yapısal reformları hayata geçirip mülakatlardaki performansımızı arttıracağız.

    09.07.23 editi:
    kurduğum organizasyon 2 kişiye ulaştı. şimdi 3 kişiye arttıracağız.
    mülakatlar ile ilgili yapısal reformlar yapacağım. izleyeceğim taktik şu.
    diyelim ki skiller paslandı. ama mülakata çağırdılar. ben kendimi biliyorum. mülakattan önce oturup 15 saat çalışamam. zaten stres olacağı için dayanıklılığım daha da azalacak.
    ama...
    mülakat daveti gelince mail atıp soracağım. "mülakat hangi alanlarda olacak, bileyim ona göre mülakata hazırlanayım" diyeceğim. mülakattan yanıt geldi. mesela sana nlp soracağız dediler. bizim organizasyondaki arkadaşların her birinden 5 saat birlikte mülakata çalışma yardımı isteyeceğim. 5 saat bir kişi için fazla değil. ama 3 kişi ile 5'er saat çalışsam toplamda 15 saat nlp mülakatına çalışmış olurum ve iyi bir mülakat veririm. (aklıma mahalleden 5 arkadaşını, ilk okuldan 4 arkadaşını bulacaksın hesabı geldi)

    bir excel şablonuna daha önce yaptığım hayali freelance projeleri yazacağım. bu da zaman ve emek isteyen bir şey. mülakat zamanı gelince bunları çalışacağım. hangi kütüphaneleri kullandım, nasıl kullandım bunları anlatacağım. mülakatta freelance yaptığın bir projeyi anlat dediler anlatamadım. gerçekçi olması için nasıl ki aslan bey ile polat alemdar ilk bölümde kurdukları yalan üzerine diyalog yöntemi ile çalışmışlarsa ben de yaptığım proje üzerine konuşup hazırlanacağım.

    diğer bir yapısal reform, artık cv'leri nlp, time_series'e göre iki farklı cv hazırlayıp hazırda tutacağız. yok öyle her yere tek cv göndermek. o cv'lere tool'lar kısımına spesifik kütüphaneler yazacağım. mesela cv time series cv'si ise oraya arima yazacağım. arima'ya da link vereceğim. linkte benim arima ile çözdüğüm bir medium makalesi olacak. yani oraya şu toolları biz yalayıp yuttuk diyeceğiz ama boş da olmayacak bu. kanıtı olacak.

    tabi çok zor yoldan gidiyoruz. keşke 20 yıl önceye gidip kendime öğüt verebilsem. evladım öss'ye iyi çalış. git en iyi okullarda bilgisayar oku, sonra yüksekte sadece ml üzerine çalış, sonra doktorayı da aynı konuda yap ve hayatta başka hiç bir şeye kafa ve enerji harcama diyebilseydim bu kadar çabaya, zorlamaya falan gerek olmazdı. ama yapacak bir şey yok.

    10.07.23 editi:
    gittim biraz da mlops öğreneyim dedim. coursera'da 4 kursluk bir set vardı. ilk kursu alınca dedim ki ben bu 4 kursu da bitiririm. tuzağa düştük....
    deeplearning.ai'dan aldım kurs setini. ilk kursta paytak paytak konuşan japon bir adam çıktı. şeker gibi adam. gözünü seveyim. basit basit anlatıyor. aynı benim sertifikasını aldığım proje yönetimine benziyormuş bu mlops dedim. basit basit şeyler. iteratif ilerle, monitör et, data shift olabilir, concept shift olabilir. hahay biz bu işi hallederiz dedim.

    lan yıldım yıldım. o japon adamı sadece ilk derse süs diye koymuşlar. geriye kalan kurslarda detaylar var. bir kodlar var destan gibi. anlayana kadar canım çıkıyor. yani mlops ile ilgim olsa daha ilgi ile dinleyeceğim ama o konuya dair bir geçmişim olmayınca daha zor oluyor. yani time series'in detayını anlatsa daha konsantrasyon ile dinlerdim.

    zamanında bir sovyet machine learning kursu almıştım. onun notebooklarında da çok ağlamıştım. ama şimdi sanki o konular şimdiki bilgimle basitmiş gibi geliyor. bir de neural network'ün detaylarına indiğimiz için daha ilginç geliyor. zamanım olursa sırf keyif için o eski kursu tekrar etmek isterim. şimdi o konular daha eğlenceli gelebilir.

    11.07.23 editi:
    şu kurduğum yeni organizasyona insan stajyer istihdam etmekte gerçekten çok zorlanıyorum. kurumsal bir kimlik oluşturmak zor. insan kaynaklarının yaptığı iş de gerçekten zor. başvuranlar ile ilk mülakat zor. istihdam süreci uzun bir süreç. bir de şunu farkettim insanlar öylesine başvuruyorlar. sonra da gelmiyorlar falan. offf. epey zaman kaybediyorum. geçen sefer linkedin açtığım stajyer ilanını kötü niyetli ilan olabilir diye otomatik olarak kapattı. baya tepem attı. öte yandan ilanda verdiğim web sitesine baktım. link ölü çıktı falan.

    hiç kimseyi görüşme yapıp elemek hoşuma gitmiyor. zaten kaliteli kişinin profili cv'den belli oluyor. o yüzden zaten görüştüğüm kişiyi stajyer olarak almak eğilimindeyim. ama böyle de olmuyor. konuş et 2 hafta geçiyor. sonra kişi vazgeçiyor. daha farklı bir yöntem izlemek gerekiyor. bu sefer aynı hafta iki-üç kişi ile görüşüp sadece bir kişiyi kabul etmemiz lazım.

    öte yandan şunu farkettim. kimse verdiğim ilana, web sitesine de pek bakmıyor. öylesine otomatik başvuruyorlar sanırım. sanırım bu durumu çözmek için motivasyon mektubu istemem gerekiyor. hatta belki de problem falan sormalıyım. gerekirse 50 kişi değil de 5 kişi başvursun ama bu başvuran 5 kişi iyice ilanı incelemiş olsun.

    13.07.23 editi:
    coursera'da mlops konusunda 4 sertifikadan 3'ünü bitirdim. sadece sonuncusu kaldı. oh be bu sefer gerçekten başladığımız işi yarım bırakmayacağız diyordum ki geçen akşam bir telefon geldi. burada tanıştığım bir güney koreli arkadaş aradı. bizim şirket ml engineer arıyor, seni tanıyorum, seninle çalışmak isterim, senin cv'yi takıma sunacağım dedi. nlp'ci arıyorlarmış. offf. battlestar galactica gemisinde "atlamaya 3 dakika, tüm personel görev yerlerine, tüm personel görev yerlerine" anonsunu duymuş gibi oldum. offff. mlops'u yarıda bırakıp bilgileri hatırlamak için tekrar bir nlp kursu aldım. bana bu işin oluru %23 ihtimal gibi geliyor. diğer olaylara göre görece yüksek bir oran.

    28.07.23 editi:
    hala güney koreli arkadaştan haber bekliyorum. önce dedi ki freelance olarak 2 aylık bir kontrat. ama ondan da haber çıkmadı. bu arada nlp dediği japonca text summarization'mış. ben hayatımda text summarization yapmadım. japonca da bilmiyorum zaten. ama oturdum epey bir öğrendim. yap deseler yaparım. ama yap demiyorlar. neyse olan bizim mlops kursuna oldu. ama bu sayede hugging face öğrenmiş oldum. çok büyük kolaylıkmış ya. ben nasıl böyle bir platformdan haberdar olmamışım. colab pro da aldım. oradan neural modellere fine tuning yapıyorum.

    29.07.23 editi:
    akademik dergiden majör revizyon geldi. lan minör'den sonra nasıl majör geliyor. tavsiyelerin bazısına hak veriyorum ama bazıları alakasız. acaba diyorum makalede kullandığımız eski lexicon based yöntemi değiştirip bu hugging face'den yeni bir neural network mü çaksak? nedense bu akademisyenler lexicon based yaklaşımdan pek haz etmiyorlar gibi hissediyorum.

    01.08.23 editi:
    majör revizyon ile uğraşıyorum. daha önceden sentiment classification için vader lexicon based yöntem kullanmıştık. bu defa hugging face öğrendiğim için oraya bir neural network çakacağız, hem f1 score yükselecek hem de yeni teknoloji kullanmış olacağız diyordum. epey sevinçliydim. fine tunning edilmiş distilbert model kullandım. sonuçlar kötü. 2014 ürünü olan vader'dan çok daha kötü. hevesim gitti...

    sentiment analiz söz konusu olduğunda cümleleri pozitif, negatif, neutral şeklinde ayırıyorsak ortaya büyük soru çıkıyor. kime göre pozitif kime göre negatif?? pozitif ve negatif yargıları işten işe göre değişir. o yüzden her işe göre özel olarak fine tunning etmek gerekir.

    ama kardeşim gidip de "e" ifadesinden ibaret cümleyi sen pozitif diye etiketliyorsan bu nasıl neural network bu nasıl distilbert diye sorarlar ya. yok son teknolojiymiş yok neymiş. hadi ordan ya.

    08.08.23 editi:
    bu aralar text summarization ile uğraştım. bir de akademik makalenin revizyonu ile uğraşıyorum. ilk defa yazdığım makale içime sindi. bence güzel bir şey oldu. eski hali çorba gibiydi. bakalım bu sefer de dergi red verirse demek ki sorun makalede değil dergide diyeceğim.

    öte yandan yine bu aralar medium'da bir arima makalem var. habire ona birileri listesine ekleyip duruyor. niye arima bu kadar popüler anlam verebilmiş değilim. zaman serilerini de çok bilmiyorum. ulan o öylesine yaptığım giriş seviye bir örnekti. durmadan notification geliyor. gidip bakıyorum belki bu sefer başka bir makaleye notification gelmiştir diye yok... niye arima ya? işin kötü yanı o makale ne kadar doğru onu da bilmiyorum. ulan yanlış bir şey falan yazdıysak milleti de yanlış yönlendirdik demektir.

    20.08.23 editi:
    akademik makale revizyonum bitti dergiye geri gönderdim. lisans bitirme tezim acayip amatörceydi. yüksek lisansta 5 adım daha iyiydi. sentiment analiz yapmıştım. ilk defa 3-5 tane kaynak vardı. ama o da yeterli değildi. şimdi ise gerçekten iyi bir makale oldu. kaynakçada 35 tane eser var. bunların 5 4-5 tanesi falan bizim çalışma ile birincil dereceden ilgili. ben artık kendime "akademik research" yapar diyebilirim. keşke eğitim sistemi iyi olsaydı da ben bu disiplinli çalışmayı lisans sonunda, 10 yıl önce falan yapmış olsaydım. olsun. geç olması hiç olmamasından iyidir. gerçekten kalite standartlarına uygun bir çalışma yapmış olmak içimde bir ukteydi. bunu gerçekleştirmiş oldum.

    22.08.23 editi:
    (bkz: rouge score)

    11.09.23 editi:
    akademik makaleden yanıt geldi. bir hakem kabul etmiş, diğeri minör revizyon vermiş. açıklama kısmına sözü edilen düzeltmeler yapılırsa kabul falan demiş ama... sözü edilen düzeltme yok ki.

    bu konunun dışında oluşturduğum platforma önceden başvuru yapmış stajyerler ile görüşüyorum. acayip zaman alıyor. bir sürü administrative görevler. kabul de etmiyorlar. kendi çapımda accept rate'ini düzeltmek ve çevrim süresini kısaltmak için bazı geliştirmeler yaptım.
    ama... bu administrative görevler acayip zamanımı çalıyor. kaggle projesi üzerinde çalışacağıma, kod yazacağıma, model train edeceğime "mülakat öncesi bilgi notu v002" yi geliştiriyorum.

    bu arada önceden başvuru yapan stajyerlere teklif göndermek için linkedin'lerine baktım. lan hepsi iyi kötü bir yerlere stajyer olarak girmiş. yani tekrar alım ilanı açmam gerekecek. offff. zor iş valla. bir parça da moralim bozuldu.

    öte yandan teknik-dışı işlere zaman harcayıp kendimi ml konusunda ileri gitmekten alı koymuş olsam da, uzun vadede bu yatırımın iyi sonuç getireceğini düşünüyorum. bir trade-off noktasından sonra stajyer almak benim kariyer kapitalimi daha da arttıracağını umuyorum. ama işte mantıklı olanı yapmak başka, mantıklı olanı yaparken hissettiğin duygu başka...

    bunun dışında geçenlerde sansüre uğramamış bir chatgpt projesi gördüm. bir ml mühendisi tersine mühendislikle yapay zekayı kendini sansür etmeyen hale getirmiş. mesela bu konu ilgimi çekti. oturup bu modelleri lokale indirip çalıştırmak falan istiyorum. ama olmuyor işte.

    bu arada yaptığım iş başvurularını şöyle bir inceledim. eski skorum 300 başvuruda 3 mülakat şeklindeydi. ama bu mülakatların hepsi japonya'da. japonya'da kaç başvuru yapmışım diye baktım. 80 civarı. hadi 90 desek 30 başvuruda 1 mülakat. ya ben iş arama enerjimin çoğunu almanya ve hollanda için harcamışımdır. bir aydınlanma yaşadım. demek ki japonya'ya daha fazla resource tahsis etmeliyiz. ama japon marketinin farklı zorlukları var.. linkedin gibi platformlara ilan açmıyorlar vs. offf.. neyse en azından buraya daha fazla zaman ayırmamız gerektiğini anladık.

    bu arada coursera'da bir aws ile data science kursu vardı. 3 alt kurstan oluşan. kurs 1 ayda biter gibi tahmin vardı. 1 haftada deneme sürümü bitmeden tamamladım. o 1 hafta biraz zorlu geçti. müsait bir zaman oradan 1 nlp veya time-series kurs serisi bitireyim diyorum.

    18.09.23 editi:
    akademik dergiden cevap geldi. makaleyi kabul etmişler. medieval total war1'de cihat hedefe ulaştığında bir event çıkıyordu. ekrana o event çıkmış gibi hissediyorum.

    bu sefer insan kaynakları konusunda daha az çaba ile daha çok verim aldım. yazdığım bilgi notunu stajyer adayları okumuş. görüşmeler çok daha verimli geçti. daha az çaba ile daha çok kişi ile görüştük. bu iyi bir gelişme.

    13.10.23 editi:
    şu döneme kadar ara ara düşündüğüm bir konu vardı. elimizdeki enerjiyi nereye harcarsak iş bulma ihtimalimizi maksimize edebiliriz. ben epey bir medium makalesi yazdım. bu güzel bir şey. ama sanırım kaggle'da competition kazanmak birim çaba başına daha verimli bir yoldu. kaggle yarışmalarına girmeye başladım. ilk yarışmaya 2 hafta kala takımımızla birlikte girdim. ilk %37'ye girdik. eğer ilk %10'a girebilirsek bronz madalya alacağız. ilk amacımız bitmesine az süre kalmış yarışmalara girip madalya almaya çalışmak.

    bu arada artık japonya, almanya ve hollanda onsite işlere başvurmuyorum. japonya onsite ama avrupa, singapur, avustralya, amerika remote işlere başvuruyorum.

    15.10.23 editi:
    zamanında japon eşimi data science çalıştırıp data science işi aramıştık. gerçekten öyle bir iş buldu ama iş sonrasında data science çıkmadı. projeler yapan bir şirket. data science projesi gelecek diye diye oyaladılar. şirketin yaptığı tam bir orospu çocukluğu. ben bu şirkete girmeden önce eşime dil döktüm. hemen teklifi kabul etme daha araştıralım dedim. kabul etmedi.

    şimdi tekrar data science çalıştırmaya başladım. e tabi bilgilerinin bir kısmını unutmuş durumda olduğundan hevesi bir miktar düşük. data scientist kariyerinde ilerleyeceğiz, çok başarılı olacağız temalı bir metin yazdım. akşam yemeklerinden önce "andımız"ı okur gibi onu okutuyorum. her kim bu hedeften şüphe ederse haindir falan diye bitiyor metin. ondan sonra yemeğe başlıyoruz. 4 kursluk bir coursera nlp sertifika görevi verdim. bu 4 kursu 1 ayda bitirirsen disneyland'a gideceğiz dedim. işi bitince coursera kursunda ilerliyor. hakikaten 1 ayda 4 kursu bitirecek gibi. lan bende bu endurance olsaydı fezaya gitmiştim diye düşünüyorum.

    ben de bizim takımla birlikte bir kaggle yarışmasına başladım. kodlar destan gibi. dhkpc militanının polise direndiği gibi bir ruh hali ile kodları çözmeye çalışıyorum. kodlar çok fena. ama az şey de öğrenmedim ya. bazen insanın kendisini sıkması gerekiyor. 5:30 gibi uyanıyorum. 21:30 gibi, bilemedin 22:30 gibi uyuyorum.

    erken uyumak için şimdiye kadar 50 tane hipotez oluşturup yanlışlamışımdır. benim bünyenin formülü şu: 0 çay ve kahve. uyumadan en az 2 saat önce pc oyunu bitecek. kimseyle siyaset konuşup adrenalin yükselmeyecek. bu reçeteyi her halde 1 aydır falan uyguluyorum. bu sefer erken uyumanın formülünü bulmuş gibiyim.

    18.10.23 editi:
    bir yarışmada bir gnn modeli yazmış hayvan evladları. bu notebook'u okuyacağız ve anlayacağız dedim. silah cepten çıkarıldıktan sonra ateş etmeden yerine koyulmaz. ben hayatımda böyle kod görmedim. tepedeki fin askerlerine doğru taarruz eden sovyet askeri gibiyim. ulan tek bir kod bloğu içerisinde 12 tane farklı class yazılır mı hayvan oğlu hayvan.
    keje filmindeki gibi pervasızca mermilere doğru yürüyoruz. kafam elektrikleniyor. hayatı sorguluyorum. bu ne ya. kim yazdı lan böyle kodu. demir maskeyi ele geçireceğiz.

    26.10.23 editi:
    haftasonu kayınvalide ve peder tatile çağırdı. dağın tepesinden go-karta binip indik. tatil olayı güzel bir değişiklik ama bir taraftan da 2-3 günlük çalışmamı aksattı. yolda protestan ahlakı ve kapitalizmin ruhu adlı max weber kitabını okudum. kitap gereksiz yere teorik. ama avrupalının bakış açısını işte şimdi tam olarak çözdüm. bende de tam bir protestan, püriten ahlakı varmış onu anladım.

    02.11.23 editi:
    şimdiye kadar linkedin defalarca bizim ilanlarımızı yarıda kapatmıştı. çok uğraştım. çok didindim. yeri geldi linkedin müşteri temsilcilerine çemkirdim. recruitment technology'imizi update ettim. bu sefer linkedin ilanı otomatik olarak kapatmadı. sonuç olarak epey bir manpower potential elde etmiş olduk.

    lale savaşçıları adlı oyunda bir sahne vardı. mecidiyeköy'de "koşun lan koşun himmet abiyi dövüyorlar" diye bir replik sonrası olay yerine yetişiyor ve bir muharebe veriyorduk. bu sefer kimi bulduysak kavga sahasına yönlendiriyorum. dün yüksek lisans yapmış mısırlı bir arkadaş ile görüştüm. mülakat yaptık. "kavga nerede? diye sordu". kaggle problemi gerçekten zor. ama sayı çokluğu ile bu problemde görece iyi bir skor elde etmeye çalışıyoruz.

    bir yazılım projesine sonradan kavgaya gönderir gibi adam katmanın marjinal faydasının çok olmayacağının farkındayım. yine de bu marjinal fayda 0 değil. öte taraftan yarışmada alacağımız skordan daha çok nasıl organize olmamız gerektiği ile ilgili önemli bilgi birikimi elde etmiş oluyoruz.

    22.11.23 editi:
    bir iki kaggle yarışmasına katıldık. ilkinden %37, ikincisinde %25 yaptık. administrative ve hr taskları bende saba makamında şarkı dinleme isteği uyandırıyor. ben de kod yazmak, ben de model kurmak istiyorum. ne var ki yaptığım işler başarı ihtimalimizi en çok arttıran işler.

    01.12.23 editi:
    insan kaynakları yönetimini iyi bilmemem bana epey zaman kaybettirdi. organizasyon için anayasa yazdım mk. bir sürü insan geldi. neredeyse çoğu gitti. bazılarını 2 hafta falan bekledik yok şu vardı yok bu vardı diye.
    ulan senin eline cillop gibi staj olanağı düşmüş kullansana. kaggle'dan da derece aldıracağız sana.
    sonra gidecekler yarrak kürek işlere girip bir ömür boyu vıdı vıdı şikayet edecekler.

    neyse. darboğazın nerede olduğunu biliyorum. insan istihdam etme sürecini ucuz, hızlı ve yalın hale getiriyoruz. artık öyle milleti 2 hafta beklemek yok. mülakat işlerini bir arkadaşa devredeceğim. zaten sürecin her şeyi dokümante edilmiş durumda. 1 kişilik pozisyon için 6-7 kişiyi sırada hazır tut diyeceğim. çalışma kotasını dolduramayan veya staja başlayıp ilk iki gün inaktif kalan kim olursa hemen sepetleyip yerine başkasını alacağız. eğer işgücü kaynağımız sınırsız olursa adım adım prusya disiplini yaratabiliriz.

    --- spoiler ---
hesabın var mı? giriş yap