
Hepimiz günlük olarak bilgisayar kullanıyoruz ve farkında olmasak da perde arkasında güçlü bir teknik makine var. grafik işlemcisi (GPU) Günümüzde karmaşık fizik, gerçekçi aydınlatma ve gerçeğe yakın sahneler içeren video oyunlarının yanı sıra veri bilimi görevlerini hızlandırmanın keyfini çıkarıyoruz. bilgisayarınızda yapay zeka modelleri çalıştırın ve içerik oluşturma.
Bu satırlarda GPU'ların tarihini ve temel teknolojilerini inceleyeceğiz: matematik yardımcı işlemcileri (FPU) ışın izleme ve yapay zekadan, bunun insan sağlığı üzerindeki etkisine kadar Windows, DirectX ve PC oyunlarıMimarilerin nasıl değiştiğini, her aşamada hangi kilometre taşlarının işaretlendiğini ve GPU hesaplamanın (GPGPU) neden hem günümüzde hem de gelecekte kullanıldığını göreceğiz.
GPU öncesi dönemden ilk grafik kartlarına: CPU'nun her şeyi yaptığı dönem
İlk kişisel bilgisayarlar klasik von Neumann tasarımını izledi: ALU, bellek ve G/ÇCPU, işletim sisteminden grafik çıktısına kadar tüm işi yönetiyordu. İlk görsel arayüzler ve zorlu uygulamalarla (CAD, erken 2D ve 3D video oyunları), yük büyüdü ve bir müttefik ortaya çıktı: FPUCPU'nun maliyetli dönüşümler olmadan doğal olarak gerçekleştiremediği kayan nokta işlemlerini hızlandırmak için bir yardımcı işlemci.
Ekran —bir piksel matrisi— Büyük ve tekrarlayan hesaplamalar gerektiriyordu ve bu da işin büyük bir kısmının paralel hale getirilebileceğini ve CPU'dan yüklenebileceğini açıkça ortaya koyuyordu. Eş işlemciler evrimleşti ve sonunda yerini grafik kartları daha büyük çiplere, daha fazla transistöre ve daha iyi güç kaynağına sahip ayrı parçalar olarak, belirli bir işleme hızlandırmasının kapısını açarak.
Öncü standartlar: MDA ve CGA'dan VGA ve SVGA'ya
Bilgisayarlar için ilk video standartları 80'lerin başında ortaya çıktı. MDA (1981) IBM'inki tek renkli ve metin odaklıydı, oysa CGA (1984) Renk eklendi (düşük çözünürlükte 16 renk). Daha sonra HGC (Herkül), EGA ve etkili VGA (1987)daha geniş çözünürlükleri ve paletleri popülerleştiren; ardından SVGA Çözünürlüğü ve renkleri, birkaç yıl önce düşünülemeyecek seviyelere çıkardı. Bu kilometre taşları, grafik çağına atlamak PC'den.
90'larda, şuna benzer 2 boyutlu hızlandırıcılar gördük: S3 Grafikleri (1992) ve oyunlar için 3D'nin ilk çıkışı 3Dfx Voodoo (1995)Yeni otobüsler ve video optimizasyonlu limanlar da geldi, örneğin AGP (1997)Intel'in klasik PCI'a kıyasla daha fazla grafik bant genişliği sağlayacak şekilde tasarladığı bu bileşenler, gelecekte yaşanacak büyük devrimin yolunu açtı.

1999: GPU konsepti doğdu ve oyunu sonsuza dek değiştirdi
NVIDIA 1999 yılında bu terimi ortaya attı GPU (Grafik İşleme Ünitesi) GeForce 256 ile dönüşüm ve aydınlatma ilk kez grafik yongasına entegre edildi; eski T&L artık CPU'ya bağlı değildi. Bu tarihi bir sıçramaydı: grafik kartları, az çok pasif bir "video" aygıtı olmaktan çıkıp, uzmanlaşmış paralel işlemciler CPU'yu serbest bırakma ve grafik performansını artırma yeteneğine sahiptir.
O andan itibaren iktidar yarışı sürekli devam etti. Sonraki yıllarda, GeForce 7000 ve 8000 Benzer Radeon serisi, işlem birimi, bellek ve bant genişliği açısından artış gösterdi. İlerleme yalnızca FPS ile ölçülmedi: aynı zamanda yeni API'ler ve kitaplıklar (OpenGL ve Windows dünyasında, DirectX) geliştiricilerin GPU'yu daha doğrudan kullanmasını kolaylaştırdı.
Modern bir GPU'nun mimarisi: paralel çalışan birçok basit birim
Düşük gecikme ve sıralı görevler için tasarlanmış CPU'nun aksine, bir GPU grupları yüzlerce veya binlerce basit işlemci (birleşik gölgelendiriciler veya akış işlemcileri) çok özel bir aritmetik talimat repertuarına sahiptir. Bu devasa ölçek, işlemeye olanak tanır paralel algoritmalar Yüksek hızlı belleklere ve muazzam bant genişliklerine dayanarak olağanüstü verimli bir şekilde.
Sayısal olarak bakıldığında, sıçrama muazzamdı. 90'ların sonlarında, bir GeForce 256, 4 birimleri gölgelendirmeye adanmış; birkaç yıl sonra, bir GeForce GTX 780 Ti Toplam 2.880 gölgelendirici ve aşağıdaki gibi çift yapılandırmalar vardı: AMD Radeon HD 7990 Toplamda 4.096'ya (iki GPU) ulaştılar. Yazılım, aşağıdaki gibi API'lere dayanmaktadır: OpenGL ve DirectX o makineden yararlanmak için.
Birleşik gölgelendiriciler, "sıcak gölgelendiriciler" ve gigabaytlarca VRAM'e geçiş
Geçiş birleşik gölgelendiriciler Belirleyiciydi. Ev konsolları trendi belirledi: Xbox 360, PC'ye gelmeden önce birleşik bir mimari kullanarak zamanının ötesindeydi; PS3 ise GeForce 7000 serisine dayalı bir tasarım tercih etti. PC'de ise ATI, birleşik gölgelendiricileri 2007'de piyasaya sürdü. Radeon HD2900XT (yukarıdaki resimde) ve kısa bir süre sonra NVIDIA da aynısını yaptı GeForce 8000. Sonuç: performansta büyük sıçramalarÖrneğin GeForce 8800 GT, 7900 GT'yi ikiye katlıyor.
2008 yılında bu felsefe, fiyat/performans oranları bakımından efsanevi modellerle GeForce 9000 ve Radeon HD 3000 serileriyle pekiştirildi. GeForce GT 9600 o Radeon HD 3870NVIDIA « ile deneyler yaptısıcak gölgelendiriciler», gölgelendiricilerin çalışmasını sağlamak daha sıklıkla GPU'nun geri kalanından daha hızlıdır (klasik örnek: 8800 GT, GPU ~600 MHz ve gölgelendiriciler ~1.500 MHz). Aşağıdakiler de yaygınlaştı: 1 GB VRAM orta/üst seviyede.
Tırmanış daha fazla gölgelendirici ve daha fazla bant genişliğiyle devam etti: GeForce GTX 285 8800 GTX'in 128 shader ve 86,4 GB/sn'sine kıyasla 240 shader ve 159 GB/sn'ye sahipti; ATI tarafında ise Radeon HD 4890 3870'in 320 shader'ı ve 72,06 GB/sn'sinden 800 shader'a ve 124,8 GB/sn'ye çıktı. İlk olarak DirectX 11 Radeon HD 5000 ve GeForce GTX 400 ile geldiler; GTX 500 ve HD 6000, öncekileri, belirli tuhaflıklarla geliştirdiler GTX 580 3 GB.
Windows, DirectX ve büyük değişim: "Sıcak gölgelendiricilere" elveda, DX12'ye merhaba
Ekosistem Windows/DirectX Bilgisayarların evrimine rehberlik eder. AMD, bu konuda öncüydü. GCN 1.0 (HD 7950/7970)DX12'nin yeni yetenekleri için tasarlanmış bir mimari, örneğin eşzamansız bilgi işlemO zamanlar DX11 hakimdi ve rakipleri (NVIDIA'nın Kepler'i) orada daha iyi performans gösteriyordu, ancak AMD varsayılan olarak daha fazla VRAM içeriyordu (yeşil eşdeğerlerde 2 GB'a karşı 3 GB), bu da kullanım ömrü için önemli bir şeydi.
ile KeplerNVIDIA, "sıcak gölgelendiricileri" sonlandırdı; bu da gölgelendirici sayısını önemli ölçüde artırınReferans olarak: GTX 680 (Kepler), ~1.058 MHz'de 1.536 shadera sahipken, GTX 580'in ~1.544 MHz'de 512 shadera sahipti. Kepler, DX12'de parlamadı, bu doğru, ancak DX11 hala sorumluyduVe ham haliyle 2.880 shader'a sahip GTX 780 Ti, zamanında 4K'ya ulaşmış bir canavardı.

Maxwell'den Pascal'a: verimlilik, daha fazla VRAM ve DX12/Vulkan'a geçiş
Maksvel Bu, watt başına verimlilik ve performansta büyük bir iyileşme anlamına geliyordu. GeForce GTX 970"Sadece" 1.664 gölgelendiriciyle GTX 780 Ti'den daha iyi performans gösterdi, 4 GB VRAM'e sahipti ve DX12 ile daha uyumluydu. Bu fiyat/performans dengesi onu en iyilerden biri yaptı. en sevilen grafikler son zamanların.
Sonraki adım, Pascal (GeForce GTX 10), DX12'yi kararlı bir şekilde benimsedi ve Vulkan. GeForce GTX 1070 Önceki modelinin VRAM'ini iki katına çıkardı (8 GB'a karşı 4 GB) ve 1.920 gölgelendiriciye sahip olmasına rağmen, önceki modelden daha iyi performans gösterdi. 980 GTX Ti 2.816 ile AMD yanıt verdi Radeon RX Vega 56/64güçlü ve HBM2 belleğe sahip, ancak GeForce GTX 1080 Ti Hüküm sürdü ve Radeon VII bile onu tahtından indiremedi. 1080 Ti, günümüzde bile 4K oyunları klasik rasterleştirmeyle çalıştırabiliyor.
Konsol ve etkileri: Xbox 360'tan PS4/Xbox One'a
Konsollar, büyük hacimleri nedeniyle bilgisayarların teknolojik yönünü belirler. Xbox 360 da bu durumu hızla benimsedi. birleşik gölgelendiricilerve bir sonraki nesilde, PS4 ve Xbox One AMD'yi seçtiler GCN, eşzamansız bilgi işlem desteğini güçlendirdi ve daha sonra Windows ve DirectX'te yaygın olarak kullanılan standartları oluşturdu. GCN bile beş revizyon, PS4 Pro ve Xbox One X'te bile mevcut.
Zamanla AMD, HBM/HBM2 Üst düzey ürünlerde (örneğin, 4.096 gölgelendirici, 8 GB HBM2 ve 483,8 GB/sn'ye sahip RX Vega 64), önceki nesillerde ise HD 7970 (GCN 1.0) 2.048 gölgelendirici, 3 GB ve 264 GB/sn ile başladı. Bant genişliğindeki bu artış, giderek daha yüksek dokular ve çözünürlükler için önemliydi. çapraz platform oyunları.

Işın izleme ve yapay zeka: Turing, Ampere ve Ada
NVIDIA, 2018 yılında piyasaya sürdü Turing (GeForce RTX 20) ve paradigmayı değiştirdi: Geleneksel SM'lere ek olarak, RT çekirdekleri (ışın izleme hızlandırması) ve gergi çekirdekleri (Yapay zeka ve çıkarım). Sonunda uygulanabilir hale geldi. gerçek zamanlı ışın izleme Daha önceleri çok zor olan, uygun maliyetlerle. Mimarlık, çok daha gerçekçi aydınlatma, yansıma ve kapanma efektlerine kapı açtı.
Işın izlemenin yeni yeniden yapılandırma teknikleriyle desteklenmesi gerekiyordu. İlk versiyonu DLSS O ihtiyatlıydı ama DLSS2 Kuruldu ve artık bir ölçüt haline geldi: Kalite üzerinde minimum etkiyle FPS'yi artırabilir. Tensör çekirdeklerinde yapay zekaAMD şu şekilde yanıt verdi: FSR/FSR2Tensör düzeyinde özel AI donanımı olmasa da çok kullanışlı bir yazılım ölçekleme özelliği; ayrıca Windows 11, aşağıdaki gibi özellikleri içerir: Windows 11'de Otomatik Süper Çözünürlük çok fazla maliyete katlanmadan imajı iyileştirmek.
ile Amper (RTX 30) Ham güçte bir sıçrama oldu, SM başına gölgelendirici sayısı büyük ölçüde arttı (bir RTX 3060 RTX 2060'ın 1.920 gölgelendiricisine kıyasla 3.584 gölgelendiriciye sahip. RT ve Tensor çekirdekleri önemli ölçüde iyileştirildi. Ada Lovelace (RTX 40) Verimlilikte büyük bir devrim gerçekleşti: RTX 4060 110 W'lık bir güç kaynağı, 170 W'lık bir RTX 3060'tan yaklaşık %20 daha fazla performans sağlayabilir ve RTX 4090 Raster grafiklerde RTX 3090'ı yaklaşık %40 oranında geride bırakıyor. Ayrıca, DLSS3 CPU darboğazlarını hafifletmek için GPU çerçeve üretimi özelliğini tanıttı. Windows Kötü optimize edilmiş oyunlarla.
RDNA ve RDNA 2/3: AMD'nin devasa önbellek ve yongalarla cevabı
AMD karşı saldırıya geçti rDNA (Radeon RX 5700 XT), WGP (çalışma grupları) ve 2 GHz'e yakın frekanslarla. RDNA2 üst düzey aralıkta iki katına çıkarılmış gölgelendiriciler (RX 6900 XT'de 5.120'ye kadar), standartlaştırılmış 16 GB VRAM, frekansları yükseltti ve büyük bir blok ekledi L3 önbellek harici bant genişliğine olan bağımlılığı azaltmak için, birimlere ek olarak ışın izlemeyi hızlandırmak.
Bir sonraki yineleme, RDNA3, geliştirilmiş verimlilik ve RT ile ikinci nesil çekirdeklerve ilk kez bir tasarım tanıttı çoklu yonga seti Oyun serisinde: Grafik çekirdeği tek parça olarak kaldı, ancak büyük L3 önbelleği (Sonsuz Önbellek) yongalara dış kaynaklı olarak aktarıldı. Bu, yonga setini basitleştiriyor. verimi artırır Üretim ve maliyetlerin düşürülmesi, karmaşık GPU'larda MCM'nin geleceğinin öngörülmesi. Yerel yapay zeka girişimleri de ortaya çıkıyor, örneğin: Ryzen ile yerel yapay zekanın avantajlarından yararlanın AMD'nin stratejisine uygun.

GPGPU: Bilimden kripto para madenciliğine ve makine öğrenimine
Yürütme fikri genel amaçlı görevler GPU yıllardır dalga yaratıyor ve şu formatlar: GGUF formatı Modellerin yerel yürütülmesini iyileştirdiler. Her şey iyi ölçeklenmiyor (bazı süreçler kolayca paralel hale getirilemiyor), ancak büyük ve tekrarlayan hesaplama problemlerini harika bir şekilde ele alıyorlar. Popüler bir örnek şuydu: bitcoin madenciliği, gölgelendiricilerle paralel olarak birden fazla dizede SHA-256 çalıştırılıyor.
Verimli bir şekilde madencilik yapmak için, ekipman mütevazı CPU (ULV dahil), 2-4 GB RAMküçük depolama (güç tüketimi açısından SSD daha iyidir), birden fazla GPU CrossFire X (AMD'nin büyük akış işlemcisi sayısı nedeniyle çok yaygındır) ve sağlam güç kaynağıAncak güç tüketimi önemli bir faktördür: Birden fazla GPU'ya sahip çiftlikler, 7/24 çalışarak yaklaşık 1.000 W'a ulaşabilir ve bu durum maliyetler ve güç gereksinimi üzerinde açık bir etkiye sahiptir. PC'nizi koruyun.
Madenciliğin ötesinde, GPGPU şunları yönlendirdi: HPC ve veri bilimiÖrnekler: MareNostrum gibi süper bilgisayarlar hızlandırıcılar içeriyor; NVIDIA piyasaya sürüldü CUDA (2006) Genel hesaplamada GPU'yu programlamak için sunucu DGX-2 Tesla V100 ile ve NVS anahtarı (2 PFLOPS) ve platformlar gibi HIZLI veri bilimini hızlandırmak için Clara tıbbi görüntüleme için DRIVE Takımyıldızı sürüş simülasyonu ve aile için Jetson AGX Xavier Yapay zeka destekli robotik için. Tüm bunlar, bilgisayarlarda ve sunucularda çalışır. Windows ve Linuxve DirectCompute, CUDA ve OpenCL gibi API'ler.
Entegre Grafikler (IGP) ve evdeki rolü
Görsel olarak daha az talepkar web sitelerinin ve uygulamaların yükselişi, IGPCPU'ya entegre edilmiştir (Intel UHD, Iris Xe; AMD Radeon Vega gibi) yeni APU'lar). İşletim sistemi, ofis paketi veya yayın akışı için modern bir IGP O fazlasıyla yeterli.ve yalnızca zorlu oyunlar veya profesyonel yazılımlar özel bir tane gerektirir.
Örnek bir durum: Dizüstü bilgisayarda Alienware 14Orta seviye bir GTX 765M, yaklaşık olarak şu kadar performans gösterir: 410% Intel HD 4600 iGPU, oyunlarda daha iyi performans gösteriyor; entegre grafik kartı birçok oyunda 30 fps'nin altına düşüyor; ancak günlük kullanımda (Windows, tarayıcı, ofis uygulamaları) deneyim... çok benzerBu, dGPU'nun ciddi oyunlar için önemli olduğunu, ancak günlük kullanım için olmazsa olmaz olmadığını kanıtlıyor.
PGI'ların tipik avantajları: daha az tüketimAvantajları: daha az ısı, sürekli artan performans ve sıfır ek alan gereksinimi. Dezavantajları: fiziksel sınırlamalar (SoC içindeki boyut/sıcaklık) ve güncelleme yetersizliği Montajı değiştirmeden. Bu entegre sistemlerin geleceği, düğüm atlamaları (22 nm'den 14 nm'ye kadar, eskiden Broadwell'de olduğu gibi) ve bu tür teknolojiler AMD insanCPU ve IGP'nin genel performansı artırmak için aynı bellek alanını paylaşmasına olanak tanır.
GPU türleri: entegre, özel ve hibrit
İç pazarda üç büyük aile bir arada faaliyet gösteriyor. Birleşik İşlemciye girerler ve günlük işleri hallederler. özel Bunlar, kendi VRAM'i ve soğutması olan bağımsız kartlardır (örneğin, NVIDIA GeForce RTX 3090 veya AMD Radeon RX 6800), oyunlar, yaratım ve GPGPUVe tasarımlar var melezler Örneğin, yüksek frekansları korumak için hava ve sıvı soğutmanın avantajlarını birleştiren karma soğutmaya sahip bazı RTX 3090'lar.
Yıllar boyunca NVIDIA ve ATI üst düzey pazara öncülük etti; 2006 yılında ATI AMD satın alınmasından bu yana NVIDIA ve diğerleriyle başa baş rekabet ediyor Intel Entegre sistemlerde, şu gibi muhteşem anlar yaşandı: HD 3870 X2, AMD'nin GeForce 8800 Ultra'yı yüksek çözünürlükte geride bırakan Rage Fury MAXX'ten bu yana ilk çift GPU'su veya Radeon HD 5970 ve Radeon R9 295X2 çoklu GPU çağında.
Windows ve oyunlar: Omurga olarak DirectX
PC oyunculuğunun evrimi büyük ölçüde şuna bağlıdır: Windows'ta DirectXDX9'dan DX11'e geçiş sürekliydi; DX12Microsoft, GPU'yu daha iyi kullanmak için motorlara yönelik düşük seviyeli bir denetim (çoklu iş parçacığı, komut kuyrukları, asenkron hesaplamaWDDM sürücüleri ve özellikleri gibi DXR'de ışın izleme gelişmiş efektlerin ölçeklenebilirlik ve istikrarla PC oyuncularına ulaşmasını sağladı.
Günümüzün önde gelen başlıkları birleşiyor rasterleştirme, ışın izleme ve süper çözünürlük (DLSS/FSR) kalite ve performansı dengelemek için. Cyberpunk 2077'nin Overdrive modu gibi durumlar, yol izlemeÖzellikle CPU'nun sınırlamalar getirebileceği sistemlerde, yüksek çözünürlüklerde FPS'yi sürdürebilmek için Ada gibi mimarilere ve kare oluşturma tekniklerine ihtiyaç duyarlar.
Yakın tarihteki ek kilometre taşları
Bahsedilen büyük sıçramalara ek olarak, şunu da hatırlamakta fayda var: GeForce 8800 GTX (2006) DX10'daki rolü için GeForce GTX 680 (2012) Kepler ile birlikte GTX 1080 (2016) Pascal ve ailesiyle birlikte RTX 30 (2020) Ampere ile ışın izleme ve yapay zekayı daha da popüler hale getirdi. Buna paralel olarak, SLI (2004) y CrossFire Çoklu GPU'yu keşfettiler, ancak bugün oyunlarda eskiye kıyasla ivme kaybettiler. dikey ölçek tek bir güçlü GPU'nun.
Oyun oynamanın dışında da önemli dönüm noktaları var: platform IZGARA (2012) GPU'yu buluta taşıdı ve şu gibi çözümler: DGX-2, HIZLI, Clara, DRIVE Takımyıldızı y Jetson AGX Xavier GPU hızlandırmayı yapay zeka, tıp, otomotiv ve robotik alanlarına genişlettiler ve grafik hesaplamanın etkisinin arttığını gösterdiler. eğlencenin ötesinde.
Performans, yakıt tüketimi ve pratik seçim
Seçerken, bütçenizi belirleyin, izleyin ve... kullanım türüOrta düzey ışın izleme ile 1080p/1440p'de oynamak için, desteği olan orta seviye bir GPU DLSS/FSR Bu yeterli olabilir; yüksek ışın izlemeli 4K için en üst düzey bir karta ihtiyacınız olacak. Önceliğiniz video düzenleme, yapay zeka veya veri bilimiyse, diğer seçeneklere bakmalısınız. VRAM, bant genişliği ve kütüphane desteği (CUDA, TensorRT, ROCm).
Enerji tüketimi göründüğünden daha önemlidir. Çiftlikler gibi birden fazla karta sahip ekipmanlar kripto para madenciliği —geçmişin— faturasını uçurabilir. Oyunlarda, bu tür mimarilerin verimliliği Ada o RDNA3 Gürültüyü ve ısıyı azaltmaya yardımcı olur, yüksek performanstan ödün vermeden küçük kasalara sığar. Windows.
Onlarca yıllık yeniliklerin ardından GPU, tek renkli metni taşımaktan desteklemeye geçti fotogerçekçi dünyalarGerçek zamanlı yapay zekayı hızlandırın ve Windows ve oyun deneyimini şu teknolojilerle iyileştirin: DX12/DXR, DLSS ve FSRMDA, CGA ve VGA'dan RTX ve RDNA'ya kadar her bir kilometre taşı (birleşik gölgelendiriciler, büyük önbellekler, HBM, ışın izleme, yongacıklar) bugün evde, işte ve veri merkezinde keyfini çıkardığımız bulmacanın bir parçası haline geldi.

