• asla bir şeyin doğruluğunu ya da yanlışlığını belirtmeyen değer. yaptığı tek şey ikna derecemizi artırmak ya da azaltmak.

    başlangıçta inanılan bir düşünce, görüş vardır (h0). bir de bunun öyle olmadığını söyleyen alternatif hipotez (h1). gerekli test yapılır ve testin sonucunda bir p değeri elde edilir. diyelim ki p 0.01 çıktı. bu değerin bize söylediği şey şu: "eğer başlangıçta inanılan düşünce doğru olmuş olsaydı ilgili testin sonucuna ulaşma olasılığı 0.01 olurdu."

    şimdi 0.01 oldukça küçük bir değer. yani ilgili testin sonucuna ulaşma olasılığımız düşük. en iyisi alternatif hipotezi göz önünde bulundurmak, dikkate almak... yani alternatif hipoteze olan inancımızı artırmak mantıklı çünkü o sonuca kolay bir şekilde ulaşamayacağız belirtilmiş. o sonucu etkileyen anlamlı bir şeyler olmalı diye düşünmek gerekli.

    yoksa p yüzde 5'ten küçük çıktı, alternatif hipotez doğru; yüksek çıktı o zaman h0 doğru gibi bir çıkarım yanlış. değerin amacı sadece bize fikir vermek.
  • çok basitçe şöyle söylenebilir. seni olumsuz düşünceye itme oranı.

    yani örneklerle anlatayım.

    100 birimlik alan var. görebiliyorsunuz. bu alanın tamamı toprak. biri gelip diyor ki, ben bu alanı yeşillendireceğim. tamam diyorsun. geldiğinde bu 100 birimlik alanın kaç birimini yeşil görürsen bu alan yeşillendirilmiş dersin? unutmayın ki, tamamı yeşillendirildi diyemiyorsunuz. illaki kenarında kıyısında biraz toprak kalıyor.

    ilk örneklemde adam geliyor, işi bitirdim patron diyor.

    geldiğinizde bir bakıyorsunuz ki, 60 birimini yeşillendirmiş. 40 birimi hala toprak. eğer tamam ya gayet güzel olmuş, teşekkürler diyorsanız, sizin p value'nuz 0.40. yok bu ne biraz daha çalış diyorsanız, o zaman henüz sizin p value'nize ulaşılmamış denmektedir.

    genel geçer kabullerde bu oran 0.05'tir. yani %5. tekrar geldiğinizde yeşillenen alan %95 olmuştur ve siz bunu artık ok bu tamamdır. dersiniz. çünkü sizin p value'niz %5tir.

    ama p value kimi yerlerde çok çok daha küçük olmalıdır. bu sizin kalite anlayışınızla doğru orantılıdır.

    örneğin bir hastanede p value %1 olamaz. çok iyi bir değer gibi gelse de, p value %1 demek, 100 hastadan 1 hasta ölüyor demektir. bu sebeple bu hastane tercih edilmez. hastanelerde p valuemuz çok çok daha düşüktür. bir milyonda 1 gibidir.

    neyse p value sizin kabul kriterinizdir. %kaça geldiğinizde kabul edeceğinize göre değişir.
  • biyoloji, psikoloji, sosyoloji, ekonomi, kriminoloji gibi alanlardaki bilimsel makaleleri takip eden ve okuduğuna hakim olmak isteyen herkesin bilmesi gereken kavramdır. bilimsel makalelerde p > 0.05, p < 0.05 gibi ifadeler sık sık görülür. bu ifadelerin nasıl bir temele dayandığını anlamak isteyen bir kişi öncelikle hipotez testlerini ve bu testlerden çıkarılması olası olan hatalı sonuçları kavramalıdır.

    hipotezlerin nasıl test edildiklerine dair bir fikir sahibi olabilmek için de atılacak olan temel adım null hypothesis ve alternative hypothesis nedir ne değildir öğrenmektir. null hypothesis araştırmacıların reddetmek için ortaya attıkları hipotezlere verilen genel addır. h0 ile ifade edilir.

    peki bu araştırmacılar manyak mıdır, mazoşist midir? neden reddetmek istedikleri hipotezleri ortaya atarlar?

    çünkü mantıkta, reductio ad absurdum adı verilen bir teknik vardır. bu yöntem aristoteles'in analytica priora'sı kadar eskidir. türkçe'de bunu "olmayana ergi" olarak biliriz. olmayana ergi, kanıtlamak istediğimiz bir yargının zıttını ortaya atarak onun yanlışlığını kanıtlamaktır.

    bilim felsefesinde yanlışlama ilkesi üzerinden ilerlemenin daha makul olduğu geçtiğimiz yüzyılda da kabul görmüştür. doğrulanabilirlik prensibini merkezine alan düşünce biçiminin eleştirisi popper ve quine gibi düşünürler tarafından yapıldıktan sonra epistemoloji dünyası yeniden şekillenmiş ve pozitivizme bakış açısı değişmiştir.

    iki değişken arasında istatistiksel bir anlam ifade eden türde bir ilişki aranıyorsa bu tür bir hiç ilişkinin olmadığını öne sürüp bunu yanlışlamak daha basittir. null hypothesis yanlışlanmak için ortaya atılır lakin yanlışlanması başarı ile de sonuçlansa, başarısızlık ile de sonuçlansa tam bir kanıttan söz edilmez. yalnızca null reddedilebilmiştir veya reddedilememiştir. kanıtlanmak istenen hipotez ise "ha" şeklinde kısaltılan alternative hypothesistir.

    bizim p-value dediğimiz değer; en basit tanımı ile, null hypthesis doğru olduğu takdirde elde ettiğimiz sonucun matematiksel olarak ne kadar mümkün olduğunun bir ölçüsüdür. elde ettiğimiz sonuç ne kadar küçük olursa, null hypthesise karşı gelecek olan kanıt da o kadar güçlenir.

    yani okuduğunuz makalelerde, p < 0.05 ifadesini gördüğünüzde orada bir ilişkinin istatistiksel olarak anlamlı kabul edildiğini anlayabilirsiniz.

    somut uygulamasını görebileceğiniz önemli bir istatistik deneyi için:
    (bkz: lady tasting tea/@highpriestess)
  • gayet mantıklı.

    sen bir şey söylüyosun ve ben de bak aslında bu böyle değil diyorum ve senin hipotezin çürüyor.

    biraz öğrenelim biraz eğlenelim.

    hipotezinizin nasıl t***k malzemesi olabileceğini göstermek daha basit gibi geliyor bana.
  • p değeri küçüldükçe istatistiksel olarak anlamlı farklılığın kanıtı artar.

    p değeri 0,01 ile 0,05 aralığında ise verilerde istatistiksel olarak anlamlı fark vardır.

    p değeri 0,001 ile 0,01 aralığında ise yüksek düzeyde olarak anlamlı fark vardır.

    p değeri 0,001 den daha küçük ise çok yüksek düzeyde anlamlı fark vardır.

    p değeri 0,10 ile 0,05 aralığında ise sınırda anlamlılık-marginally significant- vardır.
  • --- spoiler ---

    how do you know if a p-value is statistically significant?
    a p-value, or probability value, is a number describing how likely it is that your data would have occurred by random chance (i.e. that the null hypothesis is true).

    the level of statistical significance is often expressed as a p-value between 0 and 1. the smaller the p-value, the stronger the evidence that you should reject the null hypothesis.

    a p-value less than 0.05 (typically ? 0.05) is statistically significant. ıt indicates strong evidence against the null hypothesis, as there is less than a 5% probability the null is correct (and the results are random). therefore, we reject the null hypothesis, and accept the alternative hypothesis.
    however, if the p-value is below your threshold of significance (typically p < 0.05), you can reject the null hypothesis, but this does not mean that there is a 95% probability that the alternative hypothesis is true. the p-value is conditional upon the null hypothesis being true, but is unrelated to the truth or falsity of the alternative hypothesis.

    a p-value higher than 0.05 (> 0.05) is not statistically significant and indicates strong evidence for the null hypothesis. this means we retain the null hypothesis and reject the alternative hypothesis. you should note that you cannot accept the null hypothesis, we can only reject the null or fail to reject it.
    a statistically significant result cannot prove that a research hypothesis is correct (as this implies 100% certainty).

    ınstead, we may state our results “provide support for” or “give evidence for” our research hypothesis (as there is still a slight probability that the results occurred by chance and the null hypothesis was correct – e.g. less than 5%).
    --- spoiler ---
  • p hackingi çok güzel anlatmış, izleyin, izlettirin.

    null hypothesisi boş hipotez diye çevirmişler ama olsun, gölge düşüremez bu güzelliğe.
  • yüzde beşin çok az üstündeyse yemin edebilirim ama ispatlayamam sonucu çıkmaktadır
  • yüksek lisansa başladığımda kutsalım olan bir sayı idi. anladığım ve bildiğim kadarıyla anlatmaya çalışacağım.

    p değeri aslında bir şey gerçekte olmasa bile olma olasılığıdır. örnekle açıklamaya çalışalım: diyelim ki iki grup var elimizde, ankaralılar ve yozgatlılar. bu grupların boylarının ortalamalarını karşılaştırdık ve p değerimiz 0.01 çıktı diyelim. bu iki şeyi gösterir aslında. ya gerçekten de ankaralılar ve yozgatlılar arasında ortalama boy farkı var ki öyle çıktı ya da gerçek hayatta iki grubun boy ortalaması farklı değil ancak bu çalışmanın örnekleminde aşırı şans eseri böyle bir fark ortaya çıktı ve bunun olma olasılığı % 1. yani 0.05’ten küçük olması ya aşırı şanslı olduğumuzu gösterir ya da gerçekten ankaralılar-yozgatlılar arasında boy farkı vardır.

    tabii bir de önemli olan kaç tane kişi aldım? gerçekten de boy farkı var diyelim. bunu az kişiyle ortaya koyamayabiliriz. tip 2 hata olur. alacağım kişi sayısı da önemli. başka faktörler de var. bu kişileri nasıl seçtim? uzunlar mahallesinden mi topladım kişileri yoksa rastgele mi? yanlılık yaptım mı? istatistiksel olarak anlamlı tamam ama klinik olarak anlamlı mı? etki büyüklüğğ vs. falan da var ki sormayın hiç.

    sonuç olarak, bilim kutsal falan kabul etmez ve p değeri tek başına hiçbir şeyin göstergesi olamaz zaten. ama yine de yeterince şanslı isek (p<0.05) şirinleri görebiliriz, bu da bir şeydir.
hesabın var mı? giriş yap