şükela:  tümü | bugün sorunsallar (1)
  • göllerin sayısı okyanuslardan, karıncaların sayısı fillerden, çimenlerin sayısı ağaçlardan fazladır.

    yani doğanın olağan akışı içinde oluşan küçük şeylerin sayısı büyük şeylerden fazladır.

    insan davranışı da doğanın olağan akışının bir parçasıdır. dolayısıyla insan davranışı sonucu oluşan şeylerin içinde de küçük şeyler, büyük şeylerden fazladır.

    yoksulların sayısı zenginlerden fazladır, fiat marka otomobillerin sayısı mercedeslerden fazladır.

    bir kütüphanedeki kitapların çoğunluğunun ilk sayfaları diğerlerinden daha fazla yıpranmıştır, çünkü bir kitaba başlayıp bitiremeyenler bitirenlerden fazladır. cahillerin sayısı da okumuşlardan fazladır.

    bütün bunları 1938 yılında matematiksel olarak formülize eden kişi fizikçi frank benford'dur.
    bu kurala da benford yasası denir.

    bu kurala göre, sayılar doğal olarak oluşmuşsa, bu sayıların ilk hanelerinde küçük rakamlar büyüklerden belli oranlarda daha fazla bulunur.

    yani doğada karıncaların fillerden fazla olması gibi, hayatın olağan akışı içinde kendiliğinden oluşan sayıların ilk basamaklarında da 1'lerin sayısı 9'lardan fazladır. bu oranlar tam olarak şöyle:

    1 ----------> 30.1%

    2 ----------> 17.6%

    3 ----------> 12.5%

    4 ----------> 9.7%

    5 ----------> 7.9%

    6 ----------> 6.7%

    7 ----------> 5.8%

    8 ----------> 5.1%

    9 ----------> 4.6%

    elimizde yüzbin tane sayı var diyelim,
    bu sayıların ilk rakamları benford yasası'na göre dağılıyorsa yani birlerin oranı %30 civarinda, ikilerin oranı %18 civarında vs. ise bu sayılar doğal olarak oluşmuş demektir, fakat dağılımdan önemli ölçüde sapmışsa bu sayılar muhtemelen insan eliyle yapay olarak üretilmiştir.

    ülkelerin milli gelirleri, nüfusları, şirketlerin gelir, gider ve borçları, hisse senedi piyasalarındaki işlem hacimleri gibi insanların gündelik ekonomik/biyolojik/sosyal davranışları sonucunda oluşan sayıların da bu kurala uyması beklenir.

    benford yasası'nın önemli uygulama alanlarından birisi de sahtecilik tespitidir. örneğin muhasebe hilelerinin ortaya çıkarılmasında benford yasası kullanılır.

    muhasebe kayıtlarındaki rakamlar benford'un dağılımına uymuyorsa, burada bir manipülasyon olduğundan kuşkulanılır. bu konuda birçok örnek mevcut.

    6 haneli 1000 adet rastgele sayı oluşturup bunları google'da aratınca da, arama sonuç sayısı tam olarak benford yasası'na uyuyor.

    yunanistan'ın makroekonomik göstergelerinde oynama yaptığı benford yasası ile anlaşılmış.

    iran'ın 2009 seçimlerinde muhtemelen hile yapıldığına dair bir analiz de yine benford yasası'nı kullanıyor.

    ve türkiye'nin 1 kasım seçimlerindeki oy sayıları da benford yasası ile uyumlu değil.

    alıntıdır...
  • tuhaf bir örneğini inceledim;
    hanımın telefon hafızası dolunca videoları bilgisayara aktardım ve boyutlarına göre sıralayınca, "dur ulan bakalım benford yasasına uyacak mı videolar" diye düşünüp on dakikamı ayırdım. sıkı durun, matematik "bi de beni şöyle çeksene" ve "oğluşumun ilk adımı" garabetlerinde bile yaşıyor.

    bu analizi yaparken 10mb ile 100mb arası boyutları ele aldım, çünkü daha küçük boyutlarda iphone'un hareketli resimleri ve daha büyük olanlarda doğum günü, özel bir gezi gibi kasten çekilmiş videolar var. ama 10-100mb aralığı istatistik için uygun olan, 10 saniye ile 90 saniye civarı daha rastgele nitelikte videoları içeriyor.

    1 ile başlayan (10mb-19,99mb aralığı) = 292 video
    2 ile başlayan (20mb-29,99mb aralığı) ifade ediyor vd.

    rakam = video sayısı --> toplama oranı ---> benford ölçeği

    1 = 292 --> %29,08 --> %30,10
    2= 187 --> %18,63 --> %17,60
    3=136 --> %13,55 --> % 12,50
    4=124 --> %12,35 --> %9,70
    5=82 --> %8,17 --> %7,90
    6=59 --> %5,88 --> %6,70
    7=46 --> %4,58 --> %5,80
    8=42 --> %4,18 --> %5,10
    9=36 --> %3,59 --> %4,60

    toplam 1004 video.

    bitmedi, bu da karşılaştırmalı grafik.

    bir kere daha gördük ki; matematik her yerde.

    bu analizde emeği geçen; başta sevgili eşim, "bi de beni böyle çek" diyen arkadaş çevresi, düşe kalka yürüyen ve ilk gülümsemelerini ben işteyken annesine yapan evlatlarıma canı gönülden teşekkür eder. bok gibi isimlendirme sistemine sahip ios işletim sistemi mühendislerine ve dolan hard diskime teessüf ederim. sayenizde uygulayarak öğrendim bu cici yasayı.
  • doğadan elde edilen veya muhasebe kayıtları gibi rakamlar içeren verilerin incelenmesinde, hata, hile tesbitinde kullanılan fenomen matematik yasasıdır.
    örnek: görsel
    grafikten anlaşılmayacağı üzere, bu yasa şunu der:
    her nereden toplanırsa toplansın, rakam içeren bilgi yığınında, tutar, para, büyüklük, uzunluk, hava sıcaklığı gibi değerlerin hepsinde, ilk rakamlarını ayırıp sayın.
    bir (1)’le başlayan sayıların adedi toplam sayı adedinin yüzde 30.10’u kadardır.
    iki (2) ile başlayan sayıların adedi toplam sayı adedinin yüzde 17.6’sı kadardır.
    üç (3) ile başlayan sayıların adedi toplam sayı adedinin yüzde 12.5’u kadardır.
    böyle azalan oranda 9’a kadar olan sayıların oranı toplam %100’ü verir.
    yani her veri seti bu oranlara uyar. doğada bilmediğimiz düzenler, gezegenler vs.
    peki ne yapalım?
    eğer size bir sürü rakam verilmişse böyle bir test yaparak rakamların uyduruk olup olmadığını anlayabilirsiniz. eğer 9’la başlayan sayılar yüzde 30 oranında mevcutsa, burada büyük sorunlar var demektir.
    eğer sayıştay’da denetçiyseniz ve gerçek zararlar (türkiye’de olmaz ama) ortaya çıkmasın diye sizin denetim yapmanızı ve sonuçları halka açıklamanızı devletin en yüksek yetkilileri engelliyorsa, vakit geçirmek için muhasebe rakamlarına bu yasayı uygulayarak eğlenebilirsiniz.
    iyi eğlenceler.
  • fiziğe nazaran, matematikte, öğrenildiğinde insana "vay be" dedirten, şaşırtan* daha az yasa var, bu da onlardan biri. ilk defa duyduysanız "olamaz" diyorsunuz, bakıyorsunuz doğru ve aslında mantıklı da.

    gerçi düşündüm de, matematiğe çok haksızlık etmişim. e^(i*pi)+1=0 var, banach tarski teoremi var ki hâlâ "olamaz" diyorum, daha gırla paradoks var.
  • benford'dan 57 yıl önce ilk olarak newcomb formülünü açıklamasına rağmen çok fazla dikkate alınmıyor ve unutuluyor formülü. newcomb'un formülünü yazdığı 1. basamak kuralını daha sonra benford örneklem yoluyla çözüyor. nehirleri ormanları insanları sayıyor ve ilk basamağının belli bir yüzde etrafında dağıldığını gösteriyor.

    1996 yılında da ted hill, newcomb'un formülünü genişleterek sadece ilk basamak değil her basamakta rakamların çıkma olasılığını bulabilecek şekilde genişletti formülü. sonrasında mali denetimde kullanılmaya başlanan benford yasası, tek başına çok efektif olamamasına rağmen, denetçilerin işini kimi zaman oldukça kolaylaştırıyor.. ancak önündeki en büyük sorun, muhasebecilerin defterlerini yasaya göre düzenleyip, benford'un radarından rahatça kaçabilecek olması ki bu da yaygın kullanılmamasının en büyük sebebi.
  • tabii bu yasayı her ne kadar frank benford bulmuş gibi gözükse de yasayı ilk keşfeden simon newcomb adında bir astronom ve matematikçi. 1800lü yıllarda logaritma tablosunu inceleyen newcomb, 1 ile logaritmaların bulunduğu sayfaların diğerlerine oranla daha eskimiş olduğuna dikkat eder.. olaylar gelişir..
  • netflix deki connected serisi bolum 4 de detayli olarak aciklanmis.

    twitter botlarinin tespitinden secimlerin hileli olup olmadiginin tespitin, resimlerin edit edilip edilmediginden mali tablolarin gercekligine her konuda bir pattern oldugunu gosteren matematik yasasi mi demeli

    yapay zeka ile birlestirilmis bir uygulama ile sans oyunlarinda denenebilir

    yatirim tavsiyesidir.
  • doğada kaos içinde yaşamadığımızı, evrenin kendine göre bir düzeni ve programı olduğunu gösteren korkutucu ve heyecan verici bir yasa. öyle ki nerede bir arıza ve hile veya istenilmeden yapılmış bir karar varsa günyüzüne çıkarıyor. özellikle teknoloji çağında oluşabilecek sahte senaryoların önüne geçebilmesi çok güzel.

    "sahte olanı gerçek sanmak değil, gerçek olanı sahte sanmak daha tehlikelidir."

    bunun gibi nice yasaları göremeden bu dünyadan göç edecek olmak çok üzücü.
  • son günlerde adını sıkça duyuyorum. oldukça ilginç bir fenomen ve bu nedenle üzerine biraz araştırma yaptım.

    önceki entrylerde detaylıca anlatılmış ama konuyu bilmeyenler için özet geçmek gerekirse; rastgele oluşmuş bir sayı dizisinin ilk basamaklarını alıp, bunları oranladığınızda logaritmik olarak bir curve ortaya çıkıyor. bu yasanın oluşturduğu grafik ve öngördüğü oranlar ise şöyle;

    1 - 30.1%
    2 - 17.6%
    3 - 12.5%
    4 - 9.7%
    5 - 7.9%
    6 - 6.7%
    7 - 5.8%
    8 - 5.1%
    9 - 4.6%
    benford yasası

    tabi nasıl çalıştığını öğrendikten sonra insan hemen bir data seti bulup denemek istiyor. doğal olarak oluştuğu için, aklıma ilk gelen nüfusun yaş dağılımı oldu. gruplandırıldığı için oranları alamıyoruz dolayısıyla bu veriye ulaşamadım. eğer otuzlu yaşlarda ve yasanın doğru olduğunu kabul ederseniz, ülkedeki ~%12,5'lik dilimde olmanız muhtemel.

    peki hangi verilere ulaşabildik diye soracak olursanız, illere göre nüfus verisini aldım ve bunun üzerinde uyguladım. tuik ya da wikipedia üzerinden bu veriyi alabilirsiniz.

    il ve nüfusa göre grafik

    bu veriye iki şekilde baktım. öncelikle il sayısına göre yani nüfusu 1 ile başlayan 21 tane ilimiz varmış. yani 21/81 %25,9 yapıyor. bu şekilde bakıldığında digit başına hata %4'ü geçmiyor. bence tahmin için fena olmayan bir oran. açıkçası o eğrinin oluşacağını bile ummuyordum. ilave olarak benford amcamızın verdiği oranlara göre, olması gereken il sayısını ekledim.

    ikinci grafik ise nüfuslara göre. yani 2 ile başlayan 17 şehrin toplam nüfusu 14 küsür milyon. bunun 83 milyona oranı %17,1. yasanın bize verdiği oran ise %17,6. oldukça şaşırtıcı.
    bu grafikte başka şaşırtıcı olan bir nokta ise 1 digitindeki %12,85'lik sapma. üzerine biraz düşünülmesi gerekiyor. 1'le başlayan 21 ilin toplamı 35 milyon. yasanın bize söylediğine göre 25 milyon olmalıydı. yaklaşık 10 milyonluk bir sapma söz konusu.

    evet burada yasayı bozan il; kayıtlardaki 15 milyonluk nüfusu ile istanbul.

    5 digitindeki muhtemel sorumlu ise ankara.

    sonuç olarak başka alanlarda henüz denemedim ama deneyenlerden gördüğüm kadarıyla çalışan bir fenomen var elimizde. bakalım gördüğüm alanlarda daha çok kullanmaya çalışacağım bundan sonra.
  • bugün bir matematik kitabı okurken denk geldiğim yasa.
    bazen zannedildiğinin aksine acayip bir durum yoktur.

    bir doğal veri kümesi içinde tavan değerden daha yüksek değerlerin olmaması,
    bunun da istatistiğe etkisi dolayısıyla oluşan bir dağılım vardır.

    mesela:
    türkiye'de altı bin metre veya daha yüksek rakımlı dağ-tepe yoktur.
    bu da dağ-tepe veri kümesindeki verilerin ilk hanelerinde 6,7,8,9 rakamlarının görünme ihtimalini daha az kılar, diğerlerini daha fazla.

hesabın var mı? giriş yap