„NVIDIA Ampere A100“ 250 W TDP GPU, sukurtas „AI“, duomenų mokslui ir superkompiuteriui, sukurtas dirbtiniam intelektui, duomenų mokslui ir superkompiuterijai, pristatytas pažadėtu 90 procentų 400 W modelio našumu

Aparatinė įranga / „NVIDIA Ampere A100“ 250 W TDP GPU, sukurtas „AI“, duomenų mokslui ir superkompiuteriui, sukurtas dirbtiniam intelektui, duomenų mokslui ir superkompiuterijai, pristatytas pažadėtu 90 procentų 400 W modelio našumu 2 minutės perskaityta

Nvidia



„NVIDIA“ oficialiai išleido A100, su PCIe 4.0 suderinamą GPU, pagrįstą naujos kartos „Ampere“ architektūra. Nors „NVIDIA“ pasižymi mažesniu 250 W TDP profiliu, „PCIe 4.0 Ampere A100“ GPU žada, kad jis galės pasiūlyti iki 90 procentų viso 400 W A100 HGX GPU našumo. Trečiasis augančios „Ampere A100“ GPU šeimos variantas „A100 PCIe“ yra skirtas serveriams, naudojantiems dirbtinio intelekto (AI), duomenų mokslo ir superkompiuterių grupes.

NVIDIA atskleidė A100 GPU PCI-Express 4.0 variantą. GPU yra pagrįstas 7 nm Ampere mikroarchitektūra. Be to, bendrovė taip pat pranešė apie keletą A100 maitinamų sistemų iš pagrindinių serverių gamintojų, įskaitant „Asus“, „Dell“, „Cisco“, „Lenovo“ ir kt. 250 W A100 PCIe 4.0 GPU greitintuvas yra gana panašus į pilną 400 W TDP variantą, o NVIDIA taip pat žada beveik vienodą našumą, nepaisant reikšmingo TDP profilio kritimo.

„NVIDIA A100 Ampere“ GPU „PCIe 4.0“ formos koeficiente su ta pačia 400 W A100 HGX GPU konfigūracija, bet esant 250 W:

„NVIDIA“ paskelbė savo PCIe 4.0 A100 PCIe GPU greitintuvą. „Ampere“ GPU galima įsigyti įvairiems pramoninio naudojimo atvejams, kai sistemos yra nuo vieno A100 PCIe GPU iki serverių, naudojančių dvi korteles vienu metu per 12 NVLINK kanalų, kurie iš viso teikia 600 GB / s sujungimo pralaidumą. 250 W TDP A100 PCIe GPU greitintuvas daug ko nekeičia, kalbant apie pagrindinę konfigūraciją, palyginti su 400 W A100 HGX GPU.



GA100 GPU turi 400W A100 HGX varianto specifikacijas su 6912 CUDA branduoliais, išdėstytais 108 SM vienetais, 432 „Tensor“ branduoliais ir 40 GB HBM2 atminties, kuri suteikia tą patį 1,55 TB / s atminties pralaidumą (suapvalinta iki 1,6 TB / s). Tačiau diegiant GPU paketą PCIe 4.0 standartas turėjo savo trūkumą - žymiai sumažinti TDP. Pranešama, kad tai reiškia nuo 10 iki 50 procentų baudą už našumą pagal darbo krūvį. Be to, A100 GPU 250 W TDP variantas labiau tinka trumpoms serijoms, o ne ilgalaikėms apkrovoms.

„NVIDIA A100 Ampere GPU PCIe 4.0 formos faktoriaus našumas:

Dėl žymiai sumažėjusio TDP profilio galima daryti prielaidą, kad kortelėje bus žemesni laikrodžiai, kad kompensuotų mažiau TDP įvestį. Tačiau NVIDIA išleista našumo metrika išties stebina, nes priartėja prie 400 W TDP varianto. FP64 našumas vis dar vertinamas 9,7 / 19,5 TFLOP, FP32 našumas vertinamas 19,5 / 156/312 TFLOP (Sparsity), FP16 našumas vertinamas 312/624 TFLOP (Sparsity), o INT8 - 624/1248 TOP ( Sparsity).



Paprasta matematika rodo ir „NVIDIA“ užtikrina, kad „Ampere“ pagrįstas „PCIe 4.0“ 250 W A100 GPU gali pasiekti 90 procentų „A100 HGX“ kortelės (400 W) našumo svarbiausiose serverio programose. Tai pateisinama, nes naujam variantui atlikti anksčiau minėtas užduotis reikia mažiau laiko. Tačiau skaičiai turėtų galioti tik trumpais intervalais. Sudėtingose ​​situacijose, kurioms reikalingos ilgalaikės GPU galimybės, 250 W PCIe 4.0 GPU gali pasiekti bet kokią 90–50 proc. 400 W A100 HGX GPU našumą.

„Ampere“ mikroarchitektūra tikrai bus naudinga naujajam „A100“. NVIDIA žada mažiausiai 20 kartų didinti našumą, palyginti su „Volta“ pagrindu veikiančiu pirmtaku. „PCIe 4.0 A100“ GPU yra daugelio GPU technologija. Tai reiškia, kad vieną A100 galima padalyti į septynis atskirus GPU, kad būtų galima atlikti skirtingas skaičiavimo užduotis. Nors tai padidina segmentavimą, yra 3-os kartos „NVLink“, leidžiantis sujungti kelis GPU į vieną milžinišką GPU.

Žymos nvidia