şükela:  tümü | bugün
27 entry daha
  • nvidia'nın rtx 3000 kartları teraflop sayımını anlamsızlaştırıyor

    schrodinger'in cuda çekirdeği

    yıllardır teraflop "grafik gücü"nü ölçmede popüler bir yol olmuştu.terim, bir gpu'nun gerçekleştirebileceği hesaplama sayısını ifade eder, ancak her zaman teknik özellikler kağıdında bulunurken, yakın zamanlarda teraflop xbox series x gibi konsolların lansmanında bulunan pazarlama mesajlarında görünerek anaakımlaştı. gpu çekirdek sayılarının 5 haneli rakamlara ulaşmasıyla ne yazık ki teraflop hiç bu kadar az işe yarar olmamıştı.

    teraflop terimi "ondalık sayıların dahil olduğu saniyedeki hesaplama sayısı"ndan başka anlama gelmeyen flopstan ya da "saniye başı kayar-nokta işlemi"nden gelir. tera trilyon demektir, yani bunları birleştirirsek "saniyedeki trilyon kayar nokta işlemi sayısı" anlamına gelir.

    steam kullanıcıları arasında en popüler gpu olan nvidia'nın saygıdeğer gtx 1060'ın 4.4 teraflop sergileyebilirken, 2080 ti yaklaşık 13.5 ve yakında çıkacak xbox series x 12'nin üstesinden gelebiliyor. bu rakamlar çipin içindeki shader çekirdeklerinin alınıp maksimum saat hızıyla çarpılıp bunun saniyedeki komut sayısı ile çarpılması ile bulunuyor. pc alanındaki bir çok rakamın aksine adil ve şeffaf bir hesaplamadır ama oyun perfomansı için iyi bir ölçüt yapmıyor.

    örneğin amd'nin 2017'deki 6.17 teraflopluk gpusu rx 580 geçen yıl aynı firmanın piyasaya sürdğü 5.2 teraflopluk bütçe dostu rx 5500'e benzer başarım gösterir. böyle "gizli" bir gelişme mimarisel gelişimden oyun geliştiricilerinin yeni özelliklerini kullanmasına kadar çok faktörle ilişkilendirilebilir, fakat neredeyse her gpu ailesi bu jenerasyonsal kazanımlarla gelir. bu yüzden örneğin xbox series x'in xbox one x'i "12 vs. 6 teraflop" şeklindeki rakamsal verilerinin tahmin ettiğinden fazla geçmesi bekleniyor. (aynısı ps5 ve ps4 pro için de geçerlidir.)

    olay şu ki aynı gpu şirketi içinde bile, her yıl, çiplerin ve oyunların dizayn edilme şekillerinde yapılan değişiklikler, "bir teraflop" un oyun performansı için tam olarak ne anlama geldiğini ayırt etmeyi zorlaştırıyor. herhangi bir jenerasyondan herhangi bir amd kartı ve bir nvdia kartı alıp karşılaştırmanın anlamı daha da az.

    https://www.youtube.com/…ozy4tf9i&feature=emb_title

    tüm bunlar bizi rtx 3000 serilerine getiriyor. bunlar gerçekten de bazı şok edici teknik özelliklerle geldiler. 500 dolarlık bir kart olan rtx 3070 20 teraflopa muktedir 5888 cuda (nvidia'nın shader'a verdiği isim) çekirdeği ile listelendi. ve yeni 1500 dolarlık amiral gemisi kartı rtx 3090 mı? 36 teraflopluk 10496 çekirdek. anlaşılması açısından şu an bulunabilen en iyi "tüketici" grafik kartı rtx 2080 ti'ın 4352 "cuda çekirdeği" var. nvidia o zaman çekirdek sayısını %140dan ve teraflop kapasitesini %160dan fazla arttırdı.

    şey hem öyle yaptı hem öyle yapmadı.

    nvida kartlar çok sayıda "streaming multiprocessor(çoklu akışi şlemcisi)" ya da diğer adıyla smlerden oluşur. 2080 ti'ın 68 turing smleri diğer birçok şeyle birlikte 64 adet ondalık sayı hesaplamalarına ayrılmış "fp32" cuda çekirdeği ve 64 adet tamsayı hesaplamalarına(tamsayılarla yapılan hesaplamalar) ayrılmış "int32" çekirdeği içerir.

    ray tracing ve ai hızlandırmaları dışında turing smindeki büyük innovasyon tamsayı ve kayar-nokta hesaplamalarını aynı anda işlemesiydi. daha önce jenerasyon olan çekirdek kümelerinin ya o ya öteki temelinde tamsayı ve kayar nokta arasında gidip geldiği pascal'a göre önemli bir değişimdi.

    https://o.aolcdn.com/…4988f94c5511860ec4d42f746fd3d

    rtx 3000 kartları nvidia'nın "ampere" adını verdiği mimari üzerine inşa edilmiştir ve smleri, bazı açılardan hem pascal hem de turing yaklaşımını ele alır. ampere önceki gibi 64 fp32 çekirdeğini muhafaza eder fakat diğer 64 çekirdek "fp32 ve int32" olarak belirlenmiştir. yani ampere çekirdeklerinin yarısı kayar-nokta için tahsis edilmişken diğer yarısı ya kayar-nokta ya da tamsayı hesabını icra eder, tıpkı pascal'da olduğu gibi.

    bu değişimle nvidia artık her bir çoklu akış işlemcisini turing'teki gibi 64 adet saymak yerine 128 fp32 içeriyor saymakta. 3070'in "5888 cuda çekirdeği" "2944 cuda çekirdeği ve cuda olabilen 2944 çekirdek" olarak tanımlansa belki daha iyi olur.

    oyunlar daha karmaşık hale geldikçe, geliştiriciler tamsayılara daha fazla yüklenmeye başladılar. 2018 rtx lansmanındaki bir nvidia slaytı tamsayı hesapları ortalama olarak oyun içi gpu işlemlerinin yaklaşık dörtte birini oluşturduğunu öne sürdü.

    turing sm'inin dezavantajı potansiyel az-kullanımdır. mesela örneğin eğer bir iş yükünün %25i tamsayı matematiğiyse, gpu'nun çekirdeklerinin çeyrekte biri hiçbir şey yapmadan oturacaktır. bu yeni yarı birleştirilmiş çekirdek yapısının arkasındaki fikir budur ve kağıt üzerinde çok mantıklıdır: tamsayı ve kayan nokta işlemlerini aynı anda çalıştırabilirsiniz, ancak bu tamsayı çekirdekleri hareketsiz olduklarında bunun yerine kayar-nokta çalıştrabilirler.

    https://www.youtube.com/…x3tqlwdk&feature=emb_title

    nvidia'nın rtx 3000 lansmanında ceo jensen huang, rtx 3070'in "rtx 2080 ti'den daha güçlü" olduğunu söyledi. ampere'in tasarımıyla ilgili tamsayı, kayar-nokta, saat hızı ve teraflop gibi bildiklerimizi kullanırsak, işlerin nasıl sonuçlanabileceğini görebiliriz. bu "yüzde 25 tamsayı" iş yükünüde, bu çekirdeklerin 4416 tanesi fp32 hesabı yaparken, 1472 tanesi gerekli int32'yi işleyebilir.

    amperin getirdiği diğer tüm değişikliklerle birleştiğinde, 3070, oyunun 11 gb bellek yerine 8 gb belleğe sahip olmasının bir sakıncası olmadığını varsayarak, 2080 ti'den belki yüzde 10 daha iyi performans gösterebilir. iş yükünün son derece tam sayıya bağlı olduğu mutlak (ve pek olası olmayan) en kötü durum senaryosunda, daha çok 2080 gibi davranabilir. öte yandan eğer oyun çok az tamsayı matematiğine ihtiyaç duyuyorsa, 2080 ti üzerinde artış muazzam olabilir.

    tahminler bir yana, şu ana kadar bir karşılaştırma noktamız var: rtx 3080 ile rtx 2080'i karşılaştıran bir digital foundry videosu.¹ df, nvidia'nın test için sunduğu birçok oyunda jenerasyonlar arası yüzde 70 ila 90 oranında bir artış gördü, ray tracing gibi rtx özelliği kullanan yapımlarda performans farkı daha yüksek. bu aralık, yeni paylaşımlı çekirdeklerden beklediğimiz değişken performans kazancına dair bir belirti veriyor. nvıdıa muhtemelen sadece kendisi tarafından uygun görülen oyun seçimiyle iyi bir izlenim bırakmaya çalıştığı için, daha geniş bir oyun grubunun nasıl davrandığını görmek ilginç olacak. görmeyeceğiniz şey, 2080’in teraflop rakamından 3080’in teraflop rakamına sıçramanın kastettiği neredeyse 3 kat iyileşmedir.²

    https://www.youtube.com/…01yuqdva&feature=emb_title

    haftalar içinde¹ ilk rtx 3000 kartlarının ulaşmasıyla, incelemelerin size ampere performansı hakkında sağlam bir fikir vermesini bekleyebilirsiniz. hatta şimdiden ampere'in pc oyunları için heybetli bir sıçramayı temsil ettiğini söylemek yerindedir. 499 dolarlık 3070 muhtemelen bir önceki amiral gemisini yumrukluyor ve 699 dolarlık 3080'in daha önce "ti" yi seçmiş olabilecekler için fazlasıyla yeterli performans sunması gerekiyor. ancak yine de artık bu kartlar sıralanırken değerlerinin teraflop gibi tekil bir figürle temsil edilemeyeceği açıktır.

    ¹: çevirisini yaptığım bu yazı 4 eylül 2020'de yayınlandı.

    ²: techpowerup'ın verdiği ortalama değerlere göre rtx 3080 2080'in 3 katı kadar değil 1080p'de 1.5, 4k'da 1.67 kadar hızlı. yazı sadece iki mimarinin shader yapılarındaki değişikliklere odaklansa da, rtx 3000lerdeki shaderların potansiyeli piksel doldurma oranı/bant genişliği vs. gibi başka sebeplerden dolayı da limitleniyor.
77 entry daha

hesabın var mı? giriş yap