naive bayes teoremi
-
makine ögrnemesi konusunda sık kullanılan, naiflik konusunda ise çok eleştirilen bir teoremdir.
makina öğrenmesi tarafında kısaca şöyle kullanılır:
1. önce eğitim verisi(prior/training data) toplanır.
mesela 100 bin tane linkedin profili toplanır, bu profiller, a üniversitesinden, y bölümünden mezun olmuş z şirketinde çalışmış gibisinden ön işlemden geçirilir. elinizde 100 bin tane üniversite-çalıştığı şirket bilgisi olur.
2. bu eğitim verisini tek tek sınıflandırıcıya verirsiniz. yani adım adım makine öğrenmeye başlar.
3. eğitme işi bittikten sonra artık makine üniversite ve bölüme bakarak çalışılan yeri tahmin edebilir.
bu teoremle geliştirilen sınıflandırıcının başarısı büyük ölçüde eğitim verisine, daha sonra bu eğitim verisinin ön işlem kalitesine bağlıdır. gerisi ise teorimin söylediği hesap kitap işidir.
bu algoritmayi python dilinde gerçekleştiren bir sınıflandırıcı da ben yazdım. buradan bakabilirsiniz: https://github.com/muatik/naive-bayes-classifier
bir çok alternatif vardır, mesela scikit.learn popüler bir data science paketidir ve içinde naive bayes de dahil olmak üzere sınıflandırıcılar bulunmaktadır. benim geliştirdiğim yalın ve daha çok kendimi geliştirmek için yazdığım bir pakettir. elbette geliştirebilirsiniz.
ekşi sözlük kullanıcılarıyla mesajlaşmak ve yazdıkları entry'leri
takip etmek için giriş yapmalısın.
hesabın var mı? giriş yap