• bu eğrinin altında kalan alana area under the curve (auc) denmektedir. iki yöntemi karşılaştırırken, auc değerleri arasındaki farkın manidarlığının test edilmesinde delong ve diğerleri (1988) tarafından önerilen standart hata hesaplama yöntemi ve buna bağlı olarak z istatistiği kullanılabilmektedir.

    r'da bu işi yapabilmek için proc (p küçük, roc büyük) paketi kullanılabilir. basit bir şekilde:

    roc_yontem1 <- roc(veri$gercek, veri$tahmin1)
    roc_yontem2 <- roc(veri$gercek, veri$tahmin2)

    roc.test(roc_yontem1, roc_yontem2)

    kodları çalıştırılabilir.

    ---
    delong, e., delong, d., & clarke-pearson, d. (1988). comparing the areas under two or more correlated receiver operating characteristic curves: a nonparametric approach. biometrics, 44(3), 837-845. doi:10.2307/2531595
  • kimsenin yazmamis olduguna sasirmis durumdayim.
    muhendisligin pek cok alanindan bildigimiz roc curve'un acilimidir efendim. detektor seklinde isleyen bir sistemin (binary) sensitivity ve accuracy degerlerini gostermek icin kullanilir. genel olarak bakilan olcut area under the curve dur, yani sozkonusu egrinin altinda kalan alan.

    bu alan 1-0 arasi bir deger alir. eger 0.5 ise sisteminiz kafasina gore sans bazinda takiliyor demektir. benzer sekilde 0.5'in altindaysa buyuk sicmissinizdir bir yerde demektir (cunku sistem sizin istediginizin tam tersi yonde hareket ediyordur, o da ayri bir marifet).

    wikipedia'ya gore 2. dunya savasi sirasinda dusman ucaklarini tespit eden sistemlerin etkinligini ifade etmek icin bulunmustur, su anda muhendisligin yaninda machine learning olsun, ekonometri olsun, orada burada kullanilir.
  • kısaca "roc eğrisi" olarak adlandırılır. tıpta herhangi bir tanısal veya prognostik testin/modelin optimal duyarlılık, özgünlük, toplam doğruluk (accuracy), pozitif ve negatif öngördürücü değerini saptamak için sıklıkla kullanılır. herhangi bir test için eğri altında kalan alan 0.7'nin üzerinde ve duyarlılık - özgünlük toplamı 150%'nin üzerinde ise bu testin/yöntemin kabul edilebilir olduğu söylenebilir.
    edit: imla
  • bir sınıflandırma modelinin recall (duyarlılık) ve false positive rate(fpr) ilişkisini gösterir. binary classification'da tercih edilir. yani sonuç sadece 2 seçenekten oluşuyor ise; örneğin bir hastanın kanser riski ya da müşterinin kredi riski vb gibi. altında kalan alan ise area under the curve(auc) olarak tanımlanır.
hesabın var mı? giriş yap