• zipf kanunu.

    türkçe dahil test edildiği her yazılı metinde işlediği görülmüş bir kelime kullanım sıklığı kuralı. zaman içinde bunun da ötesine geçerek biyolojinin hatta evrenimizin fizik kurallarının bir gereği olarak hayatın her alanında da işlediği görülmüştür.

    şimdi önce basitçe ne olduğunu ve neden olduğunu anlatmaya çalışalım. 1930'da amerika'da harvard üniversitesi'nde dilbilim profesörü olan george kingsley zipf ingilizcede en sık kullanılanılan kelimelerin bir istatistik çalışmasını yapıyor. ortaya çıkan veriyi işlediğinde her kelimenin kullanım sıklığının kullanım sırasıyla oranlı olduğunu keşfediyor.

    yani örneklersek türkçede en sık kullanılan kelimeler ve kullanım oranları şunlar;

    1. [ bir ] oran: % 3,348
    2. [ ve ] oran: % 2,319
    3. [ bu ] oran: % 1,353
    4. [ de ] oran: % 0,794
    5. [ da ] oran: % 0,757
    6. [ için ] oran: % 0,670
    7. [ daha ] oran: % 0,524
    8. [ ama ] oran: % 0,520
    9. [ o ] oran: % 0,515
    10. [ gibi ] oran: % 0,496
    (edit* daha sağlıklı veri için kaynaklardaki türkçe makaleye bakalım)

    kelimelerin herhangi bir kitapta kaç kez geçtiğinin istatistiki çalışmasını yaparsak da ortaya şöyle bir sonuç çıkıyor. kitaptaki her kelime kullanım sıklığı ile oranlı olarak diziliyor. yani ikinci sıradaki kelime birinci sıradakinin yarısı kadar kullanılmış oluyor. üçüncü sıradaki kelime birinci sıradakinin üçte biri kadar kullanılmış oluyor. dördüncü sıradaki kelime birinci sıradakinin bir bölü dördü kadar kullanılmış oluyor ve bu böyle devam ediyor.

    buradan ortaya şu çıkıyor ki tüm kelimelerin en sık kullanılan %20lik kesimi günlük ihtiyacımızın %80'ini karşılıyor. bu oran başka alanlarda da çok sık rastlanan bir doğal eğilim. aynı oranı şehir yoğunluklarında, site trafik verilerinde, yemek tariflerinde kullanılan malzemelerde ve daha binerce veride buluyoruz.

    bu öylesine sağlam bir kural ki şu an dünyadaki her dilde yazılmış her kitapta uygulanabildiği görülüyor. öyle ki henüz çevirisini yapamadığımız antik dillerde bile çalışıyor.

    aslında bunun nedeni kesin olarak bilinmiyor ancak hakkında yazılan makalelerde çeşitli olasılıklara değinilmiş durumda. ben bunlardan en ilgimi çeken kısmına değineceğim burada. bu açıklamaya göre insan evrim sırasında özgür biçimde yaptığı seçimleri içgüdüsel olarak güvenli sağlam %20 lik kesimde odaklamanın doğal seçilimde yararını görmüş ve bu veriyi aktarmış.

    öte yandan kümülatif etkili seçimlerde kartopu etkisi de mevcut. yani eğer bir kelime pozitif ayrıma bir nedenle uğradıysa, mesela bu neden kelimenin kısa olması olabilir, o zaman daha da sık kullanılmaya başlıyor.

    biz insanlar tamamen özgür olarak seçim yaptığımızda bile doğamızın ve içgüdülerimizin etkisi altında "şey"leri zipf kanununa göre sıralıyoruz. böylece aslında bir şeyin insan müdahalesi ile şekillendirilip şekillendirilmediğini de yine bu kanunla belirleyebiliyoruz.

    mesela elimize donkişot kitabını alıp kullanılan kelimeleri sıralarsak yazan bir insan olduğu için kelimeler zipf kanununa göre bir grafik çiziyorlar. mesela belirli bir konuda yazılan akademik makaleleri de sıralarsak yine aynı grafiği çiziyorlar. mesela incili alıp sıralarsak yine zipf kanunu ortaya çıkıyor.

    çünkü insan evrende yaşıyor ve evren fizik kanunlarına göre işliyor. bu tek başına neden böyle davranıyoruzu açıklamaya yetmiyor ancak insanın özgürlük algısının ve karar verme mekanizmasının narinliğini gözler önüne seriyor.

    kaynaklar
    vsauce
    wiki1
    wiki2
    wiki3

    türkçe makale (zipf kanununun türkçe üzerinde değerlendirilmesi.)
    makale1
    makale2

    not:
    türkçe değerlendirme makalesinde kullanılan veri paketinin hata oranına yol açtığı da belirtilmiş. şerh koymuş olmak için eklemek istedim. makaleden mevzu bahis kısmı aynen kopyalıyorum;

    "çalışma sonucunda elde edilen değerlerin kesin bir ayrımı simgeleyemeyeceği ancak olası ayrım noktalarındaki b değerlerinin ingilizce’de (kornai, 2002) elde edilen sonuçlarla benzer olduğu görülmüştür. üç farklı test derlemi için elde edilen sonuçların birbirinden farklı olması derlemlerin dili modellemekte yetersiz olduğu görüşünü desteklemektedir. ileriki çalışmalarda kelime sayısı yüksek ve konu dağılımı dengeli bir derlemde araştırma yinelenecektir."

    not2:
    cevaplayabileceğimden çok daha fazla soru gelmiş öncelikle ilginiz için teşekkürler. bu vesileyle bazı konuları açayım. benim asıl ilgi alnım biyoloji ancak neredeyse her türlü bilimsel veriye tutkuyla merak duyuyorum. elbette bu her konuda konuşmak için yeterli değil.

    o nedenle burada olduğu gibi yan ilgi alanlarımda konuşurken konuyu olabildiğince çok kaynaktan inceleyip ondan sonra yazmaya çalışıyorum. bu durumda da kimi zaman sorduğunuz sorunun cevabı bende olmuyor.

    mesela bu kural kuranda işliyor mu diye çok soru gelmiş. ben baktım böyle bir çalışma bulamadım. bulursanız bana iletin beraber bakalım. işliyorsa ne olur işlemiyorsa ne olur onu da konuşalım.

    birkaç mesajda ise verdiğim istatistikler üzerinde durulmuş haklı olarak. öncelikle verdiğim en sık kullanılan türkçe kelimelerin istatistik verisini çok da güvenilir olmayan bir kaynaktan aldım daha iyisini de bulamadım. siz böyle bir veriye ulaşabiliyorsanız iletirseniz entryi editlerim. benim halihazırda koyduğum veriler zipf kanunu incelenirken ne tarz bir dataya bakılıyor bunu örneklemek için koyuldu. logaritmik azalmanın türkçede de gözlemlendiğini anlatmaya çalışıyor o örnek. ama bu kadar az ve güvenilmez veriyle kanuna uygun bir grafik elde edemiyoruz elbette bundan dolayı da zipf kanunun türkçe üzerinde nasıl gözlemlendiğini gösteren asıl makaleyi entrye ilk yazdığımda eklemiştim. benim verdiğim örneğin hatalı olma ihtimali mevcut yani siz makaleye güvenin.

    bir başka konu da ingilizcede bile bu kanunun dilin evrimi sırasında işlemez hale geldiği konusunda atılan mesajlar. ben de konuyu güncel çalışmalardan incelediğimde verilerdeki sapmanın zaman içinde arttığını ancak halen kanun içinde kaldığını gördüm. siz elinizdeki makaleleri benimle paylaşırsanız çok sevinirim.

    tekrar ilginize teşekkür ediyorum.
    sevgi saygı barış.
  • ayet okurken penise üflendin mi, cinsel güç artıyormuş.
  • zamanda geri gidemezken ileri gidebiliriz eğer bir karadelik etrafında 2 saat geçirirsek dünyaya döndüğümüzde 50 yıl ileri gitmiş oluruz
  • (bkz: googol) sayısı

    10^100 sayısıdır. googol sayısını pikometre (10^-12m) ile çarpsak yinede dünya ile güneş arasındaki uzaklıktan daha büyük bir uzunluk elde etmiş oluyoruz. ne kadar büyük olduğu canlanmıştır gözümüzde.

    ayrıca google'ında isim babasıdır. bilişim dünyasındaki gelişmeyi ifade etmek için bu yolu tercih etmişler.
  • ingilizcede "oy" anlamına gelen vote ile ses anlamına gelen "voice" sözcüğünün aynı kökenden gelmesi ve buna ek olarak arapçada oy anlamına gelen taswit ile ses anlamına gelen sawt kelimesinin de aynı kökenden gelmesi.

    oy vermek ses çıkarmaktır, ses çıkarmak ise bir çeşit oylamadır. demokrasi sesini duyurmaktır bir nevi.

    editovich: snap sağolsun, azericede de oy kelimesi doğrudan ses ile karşılanıyormuş.

    editova: natli ve focabeyi de katkı sağladı. kürtçe ve rusçada da oy ve ses benzer değil doğrudan aynı kelimelerle ifade ediliyormuş.

    ileri edit: mitokondriyel adem'in dediğine göre dutch dilinde de aynı kelime ile belirtilmekteymiş. kelime "stem".
  • ismet paşa'nın meşhur sözü "namuslular da namussuzlar kadar cesur olursa memleket batmaz" değil "namuslular da fena kişiler kadar sabırlı olmazsa memleket batar" imiş.

    kaynak: emre kongar - yozlaşan medya ve yozlaşan türkçe
  • nazım hikmet'in aynı zamanda yönetmen olması.

    filmleri:

    düğün gecesi-kanlı nigar (kısa film),
    istanbul senfonisi (kısa film),
    bursa senfonisi (kısa film),
    cici berber (muhsin ertuğrul ile),
    güneşe doğru (1937).
  • şüphesiz uyap'tır.

    hala kullanamıyorum. yani 95bin tane sekmesi olan sistemi idrak edemeyen bir ben varım, kaç yıl geçti aradan ayrı ayrı ama hala destek alırım. eğer ki öğrenirse, çözersem, ufkumun iki katına çıkmasını ben nirvanaya uğurlayacağım.
  • pasaport harçlarının en pahalı olduğu ülke türkiye. pasaportun maliyeti 10 yıl süreli 587,5 tl’yken en ucuz pasaport ise 8.7 lira ile (bkz: swaziland)'da.

    danimarka vatandaşları vizesiz olarak tam 169 ülkeye seyahat edebiliyor.

    birleşik krallık’ın kraliçesinin ingiliz pasaportu bulunmuyor. ingiliz pasaportu “majesteleri” adına verildiğinden kraliçe pasaport almıyor. örneğin ingiltere kraliçesi 2. elizabeth, 2008’de türkiye’ye geldiğinde ülkeye pasaportsuz giriş yapmıştı. ingiltere kraliçesi dünyada pasaportsuz seyahat edebilen tek kişi. kraliçe’nin haberci pasaportu diye bir şey var ve bu pasaportu aktif olarak kullanan kişi sayısı 15’ten az. bu kişiler dünyanın dört bir yanındaki ingiltere büyük elçilikleri ve konsolosluklarından çok önemli dokümanları taşıyor. bu pasaporta sahip kişiler emekli askerlerden seçiliyor. bu elçiler sadece kıyafetlerle business class uçuyorlar. bu arada birleşik krallık pasaportunun fiyatı sadece 52.56 sterlin.

    nikaragua'nın yeni pasaportu 89 ayrı güvenlik özelliği taşıyor. iki boyutlu barkodlar, hologramlar ve filigranlar gibi pek çok özelliği olan nikaragua pasaportu, taklit edilmesi en güç pasaport.

    kuzey kore pasaport almanın en zor olduğu ülke.

    türk vatandaşlarının % 42’si pasaport fotoğraflarından memnun değil.

    edit: 386 dx uyardı sağolsun. uk fiyat tarifesi güncellendi.

    (bkz: larende anadolu lisesine kitap topluyoruz)
  • bir önceki seri için. (bkz: #44112200)

    tahtakale, taht el kalha kelimesinden ortaya çıkmıştır, yani şehrin aşağı kısmı.

    demokrasibizeluksmune adlı yazara göre ise: taht el kale, kalenin alt kısmı demek şehirin değil. eskiden bir kale kalıntısı olduğu söyleniyor.

    peygamber efendimizin torunu cümlesindeki, peygamber farsça, efendi yunanca (orjinali efendos) torun kelimesi ise ermenicedir.

    gui de souza yazarımızın eklemesi: efendi sözcüğünün kökenini az daha kurcalarsak karşımıza authentes çıkıyor. hani şu "otantik"teki authentes. özgün, kendine has, birey gibi anlamları var. bir nevi reşit olan kimse, özgür kişi anlamında kullanılıyor. çağdaş yunancaya geçişte"au"nun önce "aw"a sonra "af"a dönüşmesi, "th"nin düşmesi gibi ses değişimleri sonucunda önce "afthendis" sonra "efendi"ye evrilmiş.

    bisiklet sözcüğündeki, bi iki cycle ise çark anlamına gelir, yani iki çark.

    ayak kelimesinin ilk hali hadaktır.

    eski türkçede geyik sözcüğü tüm hayvanları karşılardı. inpinkwefloyd yazarımızın eklemesi: geyik tüm hayvanları değil sadece otçul olanları karşılar.

    oğlan sözcüğü eskiden hem kız hem erkek çocuk anlaminda kullanılmıştır.

    kayseri sezarın şehri demektir.
    sezar ise kral demektir.

    defter kelimesi yunancadır. orjinali dephter.

    misafir ve safari sözcükleri arapça kökenli sefer sözcüğünden türemiştir.

    müthiş sözcüğü şiddetli anlamındadır ve tehdit sözcüğü ile akrabadır.

    olmayacak duaya amin diyen adam yazarımızın eklemesi: müthiş, dehşet ile; tehdit de hudut ile akraba kelimeler.

    draqa yazarımızın eklemesi: tehdit kelimesi bizde güzel he diye adlandırılan harfle yazılır.

    hudut ise ha harfiyle yazılıyor, arapçanın 6. harfi olan ha ile yani. tahdit ile aynı kökte kendisi. hudut bildiğimiz üzere sınır demekken tahdit 'belirlemek' anlamında. yani tehditle alakasi yok

    kontör fransızca sayı anlamına gelir.

    vapur fransızca orjinli ve buhar demektir.

    draqa dan yeni bir ekleme geliyor:ingilizcedeki magazine türkçedeki magazin sözcüklerinin kökü yine arapçaya dayanıyor. türkçedeki hazine sözcüğüyle aynı kökten türeyen, "gizli, saklı olan, özel olan" tarzı bir anlamı var. magazin haberlerinin genel eğilimi ünlü insanların özel yaşantılarından haber yapmak olduğu için, bu kelimeyi seçmişler.
    bununla birlikte ingilizce'deki crime sözcüğü de yine arapçadaki cerime (suç demek) kelimesinden geliyor.
hesabın var mı? giriş yap