şükela:  tümü | bugün
  • ks. waikato environment for knowledge analysis
    saglam learning algoritmalarinin bulundugu data mining tool'u.
    ayrica, yeni zelanda'da yasayan ucamayan, soyu tukenmekte olan bir cins kus.
  • java virtual macnine olmadan calismayan, arff uzantili dosyalari acan, bana bir süredir iskence cektirmekte olan program.
  • machine learning ile uğraşanlar için olmazsa olmaz bir programdır. sık kullanılan algoritmaları barındırmasının yanında sonuçların detaylı analiz edilmesine de imkan verir, t test filan barındırır. güzel bir şeydir.
  • kullanışlı gibi görünür, 10 adet entity e sahip bir concept learning işlemini sorunsuz yapar, arff dosyasının formatı sadeliği ile kendine hayran bırakır. lakin biraz kompleks bir şeyler yapmak isteyince o filtreler falan insanı insanlıktan soğutur. hele integer değil string ise değişken tarzı hayat bir kat daha zorlaşır. program olarak o işlemi yapmaya muktedirdir, lakin dokümentasyon kısmı içler acısıdır ve program user-friendly olmaktan çok çok uzaktadır. siz siz olun, data mining ı yaptıktan sonra learning kısmını weka yapıyor zaten diyip projenin o kısmını çantada keklik görmeyin. filtreleri ile falan weka insanı kafayı yedirtecek kudrete sahiptir.
  • avustralya'daki waikato üniversitesi'nde gnu lisansı altında geliştirilmiş java tabanlı bir veri madenciliği(data mining) aracı.

    weka'yı dosya girdisi ile weka arayüzünde kullanabileceğiniz gibi, kendi java kodunuzun içinde de algoritmalarını çağırmanın keyfini çıkartabilirsiniz.

    weka ile yapay sinir ağları(neural networks) algoritmalarını, sınıflandırma(classification) ve gruplama(clustering) algoritmalarını, öngörü(regression) algoritmalarını ve ilişkilendirme(association) algoritmalarını içeriğini bilmeseniz bile kullanabilirsiniz. neredeyse bilinen bütün veri madenciliği algoritmalarını kapsıyor. üstelik oluşan çıktıların grafiksel sunumu da oldukça tatmin edici.
  • data mining ve machine learning için kullanılacak en iyi toollardandır. temiz çalışır, pek arıza çıkarmaz. ancak büyük datasetlerle uğraştığınızda son derece yetersiz kalır. utanması arlanması kalmaz, herşeyi size yaptırmaya kalkar. madenci gibi dataları tek tek size işlettirir. java tabanlı kaynak kodları açıktır fakat, açıp biraz java yardırarak kendinize göre bir ayar çekebilirsiniz. o zaman mis gibi olur.
  • dosya formatı uzantısı: (bkz: arff)
  • yeni zellanda'da bulunan waikato university'de geliştirilmiş veri madenciliği paket programıdır. gnu general public license altında geliştirilmiştir, dolayısıyla ücretsizdir. java tabanlıdır. 4 farklı arayüzü vardır.
    simple cli; komut satırından işlem yapar.
    explorer; veri ön işleme, sınıflandırma, kümeleme, nitelik seçimi, 2 boyutlu grafik çizimi gibi işlemler yapar.
    experimenter; explorer arayüzünün yetersiz kaldığı durumlarda kullanılır.
    knowledge flow ise bağlantıları akışlarla gösteren arayüzdür.

    attribute relation file format (arff) olarak adlandırılan kendine has bir dosya formatı vardır. işlem yapılacak dosyalar bu formata dönüştürüldükten sonra kullanılabilir. sınıflandırma işlemi yaparken seçilen nitelik sayısına dikkat etmek gerekir 200 nitelikten fazla nitelik varsa sorun çıkarabilir. daha düşük sayıda niteliklerle bellek hataları alınıyorsa max heap size arttırılarak sorun çözülebilir.
  • her actigimda "ulan soyle bir proje yok ki turk universitelerinde gelistirilmis ve dunyada kullaniliyor olsun" diyorum. scala falan geliyor sonra aklima. sonra soda iciyorum, geciyor.
  • bir diğer dosya formatı uzantısı .csv*dir. veri seti için iki dakkada loo*ve lmo*cross - validated r2 değeri hesaplar, regresyon denklemini kurar daha bilmediğim nice şeyleri yapar. program çalıştırıldığında beliren kuş imajı insana bir an için nelerle uğraştığını unutturur, neşe katar. weka candır.