Po długim oczekiwaniu AMD oficjalnie zapowiedziało swój najnowszy układ graficzny Vega 10, który pojawi się w kartach Radeon Pro Vega. Tak naprawdę amerykańska firma nie miała zbyt dużego wyboru, ponieważ dosłownie wczoraj Apple zapowiedziało te układy w komputerach iMac Pro.
Vega, która pojawi się zarówno w Radeon Vega Frontier Edition oraz Radeon RX Vega to znacząco większy pod względem wielkości powierzchni układ względem Polarisa 10 czy 20, napędzającego karty RX 480 / RX 580. AMD upakowało w nim 256 TMU (Texture Mapping Units) oraz 64 jednostki CU, każda z dwoma silnikami przetwarzającymi (compute engines). Z kolei każda jednostka Compute Engine zawiera dwa osobne klastery przetwarzające, każdy z 512 procesorami strumieniującymi i 32 jednostkami TMU. Cały układ posiada zatem 4096 procesory strumieniujące oraz 256 jednostek mapujących (TMU). 64 jednostki renderujące tworzą bloki składające się z 16 jednostek, łącząc się z 2048-bitową szyną pamięci HBM2, mogącej posiadać dwa stosy, której może być do 8 GB dla jednego oraz 16 GB dla dwóch stosów HBM2.
Najnowszy Radeon Pro Vega wykorzystujący Vegę jest w stanie dostarczyć imponujących 22 Teraflopów mocy graficznej oraz przepustowości pamięci na poziomie 400GB/S, której może być 8 lub 16 GB (tej drugiej przy dwóch stosach pamięci HBM2).
AMD Vega 10 GPU – specyfikacja
GPU | Polaris 10 XT | Vega 10 XT |
---|---|---|
Process Node | 14nm | 14nm |
Shader Engines | 4 | 4 |
Stream Processors | 2304 | 4096 |
Performance | 5.8 TFLOPS 5.8 (FP16) TFLOPS |
12.5 TFLOLPS 25 (FP16) TFLOPS |
Render Output Units | 32 | 64 |
Texture Mapping Units | 144 | 256 |
Hardware Threads | 4 | 8 |
Memory Interface | 256-bit | 2048-bit |
Memory | 8GB GDDR5 | Up To 16GB HBM2 |
Podsystemy unikalnej i wysokiej przepustowości pamięci
Architektura opracowanego przez AMD układu Vega uwzględnia unikalny system pamięci HBM2, który działa jako szybka pamięć cache, a to dzięki jej współpracy z kontrolerem High Bandwidth Cache Controller, dostarczającym i odprowadzającym dane z pamięci. Takie rozwiązanie pozwoliło na uzyskanie bardzo dużej przestrzeni adresowej do 512 TB, praktycznie ograniczonej przez pojemność dysków znajdujących się w systemie użytkownika.
Silnik Next Generation Compute Engine
Silnik przetwarzający najnowszej generacji (Next Generation Compute Engine) oferuje połowę precyzji 16 bitowej (floating point) przy podwójnej ilości uzyskiwanej typowo dla 32 bitowej. To z kolei pozwala na zwiększenie przepustowości oraz zmniejszenie temperatur i TDP kart Vega.
Silnik Geometrii
Karty z układem Vega posiadają także nowy, programowalny silnik geometroo mogący dostarczyć dwa razy więcej instrukcji na cykl zegara. Czyni to z Vego znacznie szybsze rozwiązanie m.in przy teselacji (tworzeniu obrazu 3D z wielokątów) i renderowaniu skomplikowanych scen.
Pixel Engine
Kluczowym elementem architektury Vega jest ponadto nowy silnik zajmujący się przetwarzaniem pikseli (pixel engine), który jest w stanie podzielić zasób pracy na mniejsze części, które mogą napełnić cache bezpośrednio niż przechodząc najpierw przez pamięć karty. To pozwala oszczędzić nie tylko na zużywanej energii, ale również cyklach, co powoduje szybsze renderowanie scen.
Nie mniej ważne będzie obecna z silnikiem pixel engine technologia shade-once, analizująca piksele schowane za innymi na tyle wcześnie, że układ nie traci czasu i zasobów na ich renderowanie. Co więcej, AMD ułatwia zadanie deweloperom tworzącym gry na konsole zadanie poprzez oddanie im bezpośredniego dostępu do cache a nie tylko do pamięci. Takie rozwiązanie wprowadza dodatkowy stopień optymalizacji, tak kluczowej przy dzisiejszych grach.
Porównanie kart AMD Radeon Vega z układami Polaris 10 oraz Fiji XT
Graphics Card | Radeon R9 Fury X | Radeon RX 480 | Radeon RX Vega Frontier Edition | Radeon RX Vega (Gaming) | Radeon Vega Pro 64 | Radeon Vega Pro 56 |
---|---|---|---|---|---|---|
Układ | Fiji XT | Polaris 10 | Vega 10 | Vega 10 | Vega 10 | Vega 10 |
Procestechnologiczny | 28nm | 14nm FinFET | FinFET | FinFET | FinFET | FinFET |
Compute Units | 64 | 36 | 64 | b.d. | 64 | 56 |
Procesory Strumieniujące | 4096 | 2304 | 4096 | b.d. | 4096 | 3584 |
Wydajność | 8.6 TFLOPS 8.6 (FP16) TFLOPS |
5.8 TFLOPS 5.8 (FP16) TFLOPS |
13 TFLOLPS 25 (FP16) TFLOPS |
b.d. b.d. |
~13 TFLOLPS ~25 (FP16) TFLOPS |
11 TFLOLPS 22 (FP16) TFLOPS |
Texture Mapping Units | 256 | 144 | 256 | 256 | 256 | 224 |
Render Output Units | 64 | 32 | 64 | 64 | 64 | 64 |
Pamięć | 4GB HBM | 8GB GDDR5 | 16GB HBM2 | b.d. | 16GB HBM2 | 8GB HBM2 |
Szyna pamięci | 4096-bit | 256-bit | 2048-bit | 2048-bit | 2048-bit | 2048-bit |
Przepustowość | 512GB/s | 256GB/s | 480GB/s | b.d. | b.d. | 400GB/s |
TDP | 275W | 150W | b.d. | b.d. | b.d. | b.d. |
Premiera | 2015 | 2016 | Czerwiec 2017 | Lipiec 2017 | Grudzień 2017 | Grudzień 2017 |
Jak więc widzicie, Vega jest naprawdę mocnym, dobrze zoptymalizowanym układem z mocą do 25 teraflopów (z dostępnych na razie danych, które zostały udostępnione). Testy pokażą czy dane te potwierdzą się w praktyce oraz czy NVIDIA odpowie odpowiednio mocnym układem ze swojej strony. Po premierze kart AMD można też się spodziewać sporego spadku cen obecnych kart (Polaris i Pascal).