• utf standardinin unicode'u 8-bit'lik parcalara ceviren hali. 0-127 arasindaki ascii karakterler aynen transform edilirken 127-10 yuzbin milyon arasindaki unicode karakterler birden fazla byte serisi kullanilarak transform edilir.

    bu da ascii olarak "sedat kapano·µòlu" gibi acayip encoding'e yol acar.

    utf-8 ietf tarafindan tum internet protokollerindeki standart encoding kabul edilmi$tir ve gerekli protokol implementasyonu tarafindan mutlaka en azindan desteklenmesi gereken encoding'dir.

    en buyuk avantaji codepage-neutral olmasi bir utf-8 dokumanin her yola gelebilmesidir.

    (bkz: utf-7)
    (bkz: utf-16)
    (bkz: utf-32)
  • türkçe karakter içermediği için benden zamanında oldukça fazla küfür yemiş encoding formatı. cep telefonundan ilk entry'i girdikten sonra* sokaklarda "allahım ssg görmesin n'oluuurr!!" diye topuklar göte vura vura entry editleyecek internet cafe aramak için birebir formattır. neyse ki iso 8859-9 var da küfür yemekten kurtuldu gariban 8-bitlik charset.
  • turkce karakter setinin de dokuzuncu revizyonunda bulundugu iso 8859, ascii ve euc gibi karakter seti standartlarinin yerini almakta olan, bir cok farkli dili ve dolayisi ile karakter setini, matematiksel ve teknik sembol setlerini yaldır yaldır kullanabilmenize olanak saglayan genis standart.

    kendisi http://www.ietf.org/rfc/rfc3629.txt rfc dosyasina goz atarak ayrintili bilgi alinabilir. ayrica utf 8 encoding iso 10646-1:2000 ile belgelenmis ve anlatilmistir.
  • (bkz: ef bb bf)
  • c#* ta bir dosyadan birşeyler okuduğunuzda bu kodlamada türkçe karakterleri de alabilirsiniz. eğer dosya kaydedilirken ascii veya unicode seçilmişse okunan veriler arasında türkçe karakterler atlanmış oluyor. eğer türkçe karakterleri de sorun çıkarmadan okumak istiyorsanız, dökümanları kaydederken bu kodlamada kaydetmeniz yeterli olacaktır.
  • muhteşem bir kodlamadır. bence dünya üzerindeki bütün programlar bu kodlamayla çalışmalıdır. farklı kodlamalarla program veya web siteleri yapanlar aşırı büyük hatta kocaman cezalara çarptırılmalıdır. (para cezası, hapis mapus vs.) o derece güzeldir, o derece tatlıdır.
  • facebook'un kullandığı dil kodlamasıdır. en azından türkçe için gerekiyor. zaten bu türkçe kodlamada bir standart yakalanabilirse çok güzel olacak. mesela sözlük de windows 1254 kullanıyor.

    edit: son zamanlarda yapılmış bir değişiklik ile sözlük de artık utf-8 kullanmaya başlamış. dil kodlaması seçenekleri çok çeşitli olmayan (özellikle mobil) cihazlar için güzel bir değişiklik...
  • bence o kadar güzel ki, diğer tüm encoding standartları iptal edilip sadece bu kullanılmalı.
  • apache tomcat ile çalışırken türkçe karakter sorununu aşmak için kullandığımız character encodingtir. uygulamanın başında eklenmesi gereken sihirli satır şöyledir:
    request.setcharacterencoding("utf-8");

    database oluştururken ve html send metodunu kullanırken de dikkatli olunmalı encodinge hassasiyet gösterilmelidir. yoksa trip atar, sizi üzer. url üzerinden url?parametre=hede şeklinde parametre gönderirseniz de parametrenin içeriği utf-8 olmayacaktır yukardaki koda rağmen. aslında atılabilecek türlü taklalar var problemin üstesinden gelmek için ama zaten bu parametre gönderme yöntemi sağlıklı değil, adam gibi form kullanın. illa url kullanacaksanız verileri sayılarla göndermek en iyisi.

    daha ayrıntılı bilgi için:
    (bkz: google)
hesabın var mı? giriş yap