Home / Komputery Stacjonarne / Karty graficzne / Szczegóły układu NVIDIA Tesla GP100

Szczegóły układu NVIDIA Tesla GP100

Tesla GP100

Tesla GP100, nadchodzący Goliat w układach graficznych jak wspominaliśmy wcześniej będzie przypominał AMD „Fiji” pod względem wielkiego rdzenia GPU oraz czteropoziomowej pamięci komunikującej się z nim przy pomocy 4096-bitowego  interfejsu  HBM2 (jej maksymalna przepustowość to 1 TB/s). Niemniej jednak trzeba nadmienić, iż w tym układzie NVIDII uzyskamy jedynie (lub aż) 720 GB/s.

Z podobieństwem do większości kart graficznych NVIDII, Tesla GP100 oferuje także kilka kluczowych zmian, wśród których należy wspomnieć połączenie PCI-Express 3.0 x16 i silnika graficznego GigaThread Engine, który rozdziela pracę pomiędzy 6 klusterów obliczeniowych (GPC). Z kolei osiem kontrolerów pamięci dokłada się do 4096-bitowej szyny danych, a szybki hub łączy się z czterema portami NVLink, których przepustowość ma wynieść 80 GB/s.

Stanowiące oddzielne jednostki obliczeniowe, przetwarzające klustery graficzne zajmują się renderowaniem zarówno obrazu widocznego, jak i wszystkiego niewidocznego dla użytkownika.

Wykorzystujący architekturę Pascal GP100, a dokładnie każdy z jego klusterów (GPC) posiada 10 wieloprocesorowych jednostek przesyłających (SM), a które z kolei oferują 64 rdzenie CUDA i 240 TMU. Matematycy pewnie obliczyli już, że stąd właśnie bierze się 640 rdzeni CUDA – jednak GP100 oferuje ich aż 3840, więc niech także skojarzą skąd wzięła się ta liczba.

Zastanawiające jest także dlaczego NVIDIA odbezpieczyła jedynie 56 z 60 procesorów strumieniujących, co oznacza, że Tesla będzie w stanie dostarczyć jedynie 3584 rdzeni CUDA.

Architektura PAscal obecna w Tesli GP00 to także, lub przede wszystkim szybkie taktowanie zegarów, które w tym przypadku oznacza 1328 MHz (1480 MHz w Turbo). TDP tego układu to 300W, co przy takiej mocy jest naprawdę niezłe. Do tego dochodzi fakt, że tym razem układy pamięci przesunięto do GPU, co jeszcze bardziej zwiększa ilość ciepła z jakim musi sobie radzić sam procesor. 

Ostatnią niewiadomą były zapewne porty NVLink, które działają podobnie jak QPI Intela czy HyperTransport AMD, zapewniając szybkie łącza dla sąsiadujących gniazd. Wspomniane 80 GB/s w jednym kierunku pozwala na wirtualizację pamięci w pełnym tego słowa znaczeniu, szczególnie w przypadku wielu układów graficznych (multi GPU).

Zunifikowana Architektura Pamięci Pascala podnosi jeszcze bardziej wydajność systemu, a to chociażby z uwagi na fakt iż wykorzystuje korzyści języka programowania CUDA 8 przez podbicie wielkości pamięci ponad tą kontrolowaną przez sam układ GPU oraz do granic pamięci systemowej. Mowa tu oczywiście o rozwiązaniach takich jak komputery HPC, które wyposażone dodatkowo w dedykowane karty graficzne widziane są pod względem graficznym jako jeden wielki układ dodatkowo zwiększony przez układ znajdujący się w procesorze CPU.

NVIDIA Tesla GP100  diagram

NVIDIA Tesla GP100 01