48 entry daha
  • çalıştığım departmanın ismi olmaktadır. kısaca anlatayım neler yapıyoruz:

    ben data business analyst olarak öncelikle ilgili iş birimiyle görüşerek problemi, iş değeri ve uygulama kolaylığı açısından değerlendiririm. sonrasında problemle ilgili verinin nerede bulunduğunu, özellikleri ve boyutu bilgilerini veritabanı ekiplerinden isterim. ekibimizde bulunan data engineer veriyi bulundugu ortamdan bizim data science platformumuz içerisindeki data lake'e aktarır.

    bu noktadan sonra verinin ön değerlendirilmesi platform içerisinde bulunan analitik aracı ile benim tarafımdan yapılır. ben data engineer ile birlikte çalışarak verinin temizlenmesi, dönüştürülmesi ve analize hazır hale getirilmesine yardımcı olurum.

    analize hazır hale gelmiş veriyle eda (exploratory data analysis) sürecini başlatırız. bu aşamada ben iş birinin kpı'ları ve gitmek istediği nokta ile veriden elde ettiğimiz sonuçları değerlendirerek data scientist ve iş birimi arasında köprü vazifesi görürüm. eda sonucunda birtakım actionable insights (uygulanabilir öngörüler) ortaya çıkar, bunlarla ilgili takipleri yaparım.

    ilk analizlerimizle hedeflenen sonuca bir adım atmış oluruz, bundan sonraki kısımda ileri analitik çalışmaları gerçekleştireceğiz. bu noktadan sonraki çalışmaları data scientist yapar, ben ilk değerlendirmeyi yaptıktan sonra iş birimine sonuçları iletirim. öncelikle feature engineering yani model için gerekli özelliklerin belirlenmesi kısmı yapılır. bu süreç veri temizlemesinden sonraki en önemli süreçtir, modelin sağlıklı sonuçlar vermesini sağlayacak olan feature engineering kısmıdır. model için en doğru sonuçları alırken computational power'ı minimum seviyede kullanarak maliyeti düşürmek de buradaki bir diğer önemli noktadır.

    feature engineering kısmı tamamlandıktan sonra modelleme aşamasına geçilir. modelleme aşamasında birçok model denendikten sonra en basit ve değerlendirme parametresine göre en doğru sonucu veren model seçilir. ayrıca modellemede over-fit'in önüne geçmek için cross validation yapılır. model yapılırken hyper-parameter tuning dediğimiz algoritmada bulunan parametrelerin en doğru sonucu verecek şekilde belirlenmesine dikkat edilir.

    modelleme aşamasından sonra modelin değerlendirilmesi aşaması başlayacaktır. bu aşamada iş biriminin hedefleri, problemin doğası ve verinin yapısına en uygun olacak değerlendirme kriteri seçilir. model sonuçlarını geliştirmek için süreç baştan sona birkaç kez tekrarlanabilir.

    modelin yaşayan bir süreç haline getirilmesi yani deployment aşaması için ilgili yazılım mühendislileri ile iletişime geçerek proje yaşayan bir süreç olarak tamamlanır. tüm süreç hikayeye dönüştürülerek yönetime sunulur.
111 entry daha
hesabın var mı? giriş yap