• günlük hayatta farkında olmadan kurduğumuz sebep-sonuç ilişkilerini keşfeden teknoloji.

    insan beyninin şöyle bir özelliği var; günlük hayatta onbinlerce uyarana maruz kalıyoruz ve her birinin bilinçli olarak düşünsek beynimiz başka bir iş yapamaz hale gelirdi. bu sebeple enerji tasarrufu için beyin evrimsel olarak bilinçaltı denilen bir mekanizma geliştirdi; arka planda çalışan bu işlemci, günlük hayatta karşılaştığımız pek çok detayı değerlendirerek sadece sonuçları üst beyne iletiyor.

    örneğin yeni biri ile tanıştınız ve bu kişiyi gözünüz pek tutmadı. neden? bunun sebebi ne? kimse bu soruya somut bir yanıt veremez, bu sonucun sebebini kesin şekilde söyleyemez. belki kıyafetlerindeki ufak bir detay, belki yüzündeki belli belirsiz bir yara izi, belki konuşma şeklindeki ufak bir vurgu. ve hatta bunların çeşitli bir kombinasyonu. hiç kimse günlük hayatta bu binlerce detayı puanlayıp bir kağıda alt alta yazıp birbirine not vermez, bunu bilinçaltı yapar ve sadece sonucu üst beyne iletir; "bu kişiyi gözüm pek tutmadı". biz bu rapor sonuçlarına "hissetmek, öyle gelmek" vb. isimler taktık.

    işte bilgisayarları kullanarak binlerce detayı işleyerek bunlar arasında sebep sonuç ilişkisi bulmaya makine öğrenmesi deniyor. makineler bilinçaltımızın yerini alıyor ve bizim ilk bakışta söyleyemediğimiz ama bilinçaltında algıladığımız detayları işleyerek bize sonuçlar üretiyorlar. makine öğrenmesi budur.
  • çalışmayan televizyonun yediği yumruktan sonra düzelmesidir
  • 3 farklı türü vardır
    elimizde 5000 tane sınıflandırılmış data olsun.

    supervised learning (eğiticili sınıflandırma) = belli bir eğitim datanız vardır ve bu eğitim datanızı kullanarak test datanızı sınıflandırırsınız veya test edersiniz. örnek olarak 3000 eğitim kullanarak 2000 test verisini test ederiz.

    semi-supervised learning (yarı- eğiticili öğrenme) = belli bir eğitim datanız vardır. bu eğitim datasını kullanarak test verisini eğitirsiniz, eğitilen test verisini eğitim verinize eklersiniz. böylece eğitim veriniz artmış olur bu eğitim verisi ile kalan test verinizi sınıflandırırsnız. örnek 1500 eğitim datası 1500 eğitilecek data 2000 test datası. 1500 eğitim ile 1500 eğitilecek datayı eğitiriz böylece 3000 eğitim datamız olur daha sonra bu 3000 ile 2000 test verisini sınıflandırırız.

    unsupervised learning = eğitim datanız bulunmaz eğitim datanızı sistem kendisi oluşturur ve test verisini sınıflandırır
  • geleceğin para kazanma potansiyeli en yüksek işlerinden biri
  • makine öğrenmesi dediğimiz şeye aslında tamamen istatistik bilimi ile iç içe geçmiş, sayamayacağımız kadar sayısal analiz tekniğini içerisinde barındıran bir yöntemler bütünü diyebiliriz. makine öğrenmesini veri tahmini ve daha çeşitli bilgilerin eldesi amacıyla kullanırız. olasılık ve istatistik dersinde aldığımız teorik bilgilerin daha gelişmiş versiyonlarını bu yöntemlerde kullanacağız. lafı daha fazla uzatmadan söze geçiyorum. daha fazla bilgi sahibi olmak isteyen arkadaşlar sorularını mesaj olarak yazarlarsa bildiğim kadarıyla kaynak tavsiyesi, bilgi paylaşımı vb. yardımlarda bulunabilirim.

    makine öğrenmesi dediğimiz teknikler bütünü öncelikli olarak bilgisayarlar veya bilgisayar işlevi gören işlemcilerle uygulanmakta. bu kısım şu an için çok önemli olmadığı için sizlerle makine öğrenmesindeki temel kavramlara değineceğim.

    veri: yorumlanmamış bilgilerdir. örneğin: bir ilçenin bir gün boyuncaki sıcaklığının saniyelik olarak kaydedilmesiyle oluşmuş yüzbinlerce satırlık bilgiler.

    veri seti: birbiriyle arasındaki ilişkinin (korelasyon) olup olmamasının bir önemi olmayan, lakin birden fazla türde verinin birleşimiyle oluşan veri kaynağına denir. örneğin yukarıdaki örneğe bir de o gün o ilçedeki her saniyede kaydedilen nem verileri de eklenirse bir veri seti elde etmiş oluruz. makine öğrenmesi uygulamalarında veri setlerini böleriz.

    veri setleri neden bölünür?

    veri setlerinin bölünme nedenini şöyle örnekleyebiliriz. diyelim ki elimizde 12 aylık bir hava durumu verisi var. ve biz bu verileri kullanarak hava durumu tahmin uygulaması yapmak ve gelecekteki hava durumlarını tahmin etmek istiyoruz. makine öğrenmesi algoritmaları kendilerini eğitmek için veriye ihtiyaç duyar. şöyle düşünebilirsiniz. bir şehre dair kanaatleriniz memleketi o şehir olan daha önceden tanıdığınız kişilerle oluşur. memleketi o şehir olan insanların az çok ne özelliklere sahip olduğunu bilirsiniz. işte makine öğrenmesi uygulamaları da bizden o şehrin insanlarını kafasında bir şekle oturtmak için memleketi o şehir olan insan verilerini ister.

    fakat olay burada bitmiyor. bizim elimizde sınırlı veri var ve algoritmamızın doğru çalışıp çalışmadığını test etmeliyiz. diyelim ki tanıdığımız tüm hataylı insanların verilerini algoritmamıza verdik. bu sefer doğru çalışıp çalışmadığını test etmek için elimizde insan verisi kalmaz. bundan dolayı verilerimizi ikiye ayırırız. hataylı insanları tanıması için insan verilerimizin bir kısmını veririz. lakin doğru çalışıp çalışmadığını test etmek için de verilerimizin kalan kısmını saklarız. veri setleri genel olarak ikiye bölünür.

    eğitim seti: eğitim seti makine öğrenmesi algoritmasının eğitilmesi için verileri tanıması ve tahminlerini bu veriler üzerinden yapması için oluşturulan settir. buna kısaca bundan sonraki verilere belli şekillerde önyargılı olmasını sağlayan veri seti diyebiliriz.

    test seti: eğitim seti kullanılarak oluşturulan algoritmanın ne derece doğru çalıştığını test etmek için daha önce kenara ayırdığımız veri setidir.
  • terimi yapay öğrenme olarak kullanalım. bu konuda çalışmalar yapan hocalarımız da yapay öğrenme olarak kullanıyorlar.

    ingilizcede machine learning terim olarak yapılan işi anlatıyor ama bunu türkçe'ye çevirirken yapay öğrenme olarak çevirmek gerekiyor. çünkü makine kendi kendisine öğrenmiyor aslında ortada yapay bir öğrenme var. bu öğrenmeyi sağlayan da yapay öğrenme algoritmaları.
  • son zamanlarda yapay zeka ile birlikte ayağa düşmüş bir terim.

    adam bir yer doldurtuyor, bunu doldurduktan sonra size öneride bulunuyor ve diyor ki makine öğrenme algoritması kullandık. bildiğimiz if-else kullanmışsınız.

    insanların girdiği şeylere göre bilgisayarın vereceği cevap değişirse ya da değişme olasılığı varsa; o zaman makine öğrenmesinden bahsedebilirsiniz. düz if/else uygulamaları makine öğr. ya da yapay zeka değildir.

    yani biri gelip size bir program pazarlamaya çalışıp makine öğrenmesi algoritmaları falan derse bunu bir düşünün.
  • türkçesi yapay öğrenme falan olmayan terimin doğru türkçe kullanımıdır. bu adla kitap yazmak da terimin doğrusunu yapay öğrenme yapmaz.

    machine learning terimini ilk kullananlardan biri arthur samuel‘dir* ve makine öğrenmesini şöyle tanımlar: “a field of study that gives computer the ability without being explicitly programmed“. yani açıkca programlanmamasına rağmen bilgisayara kabiliyet sağlayan çalışma alanı. makine dendiğinde gözünüzün önüne sadece dönen dişliler çarklar geliyorsa siz çok yanlış gelmişsiniz zaten.

    50-60 yıldır da ingilizce’de kimse çıkıp “machine ne alaka ya gelin buna artificial learning diyelim dememiştir. hala da dememektedir. bu saçma sapan işlerle uğraşmak bizim millete özgüdür ancak. otur iki algoritma geliştir, bir yöntem bul, çığır aç. yok, makine öğrenmesi değil de yapay öğrenme diyeceksiniz faşizanlığı daha kolay geliyor sanırım. işin etiketine değil içeriğine odaklanın da bilime bi katkınız olsun*.
  • bunu 2 sene kadar önce, derin öğrenme ile birlikte çok zor bir alan olarak görüyordum. ancak temelde, istatistiksel analizin, akıllı programlama paketleri (ücretsiz) ile derinleştirilmiş hali olduğunu gördüm. elinizde bir veri seti var, burada asıl mühim olan bu veri seti üzerindeki gerekli temizliği ve manipülasyonu yapmak. bundan sonraki kodlama 6-7 satırdan ibaret ve geri kalanı bilgisayar yapıyor ve modeli kaydediyorsunuz. yeni veri (gerçekleşmiş, reel) geldikçe modeli revize ediyorsunuz ve yaşatıyorsunuz.
hesabın var mı? giriş yap