Nvidia представи Blackwell Ultra с 288 GB HBM3e памет – ИИ-ускорител за „ерата на разсъжденията“
Nvidia публично показа ИИ-ускорителя за калкулации в центрове за данни Blackwell Ultra B300, суперчипа Grace Blackwell Ultra GB300 и разнообразни системи, основани на него, като част от откриването на конференцията GTC 2025. Новият артикул е основан „ за ератана разсъжденията “, т.е. за най-новите, по-сложни и изискващи доста запаси ИИ-модели, способни да размишляват върху разнообразни проблеми, сходно на хората.
Nvidia обичайно не разкри всички детайлности за новите артикули. Компанията единствено означи, че графичните процесори Blackwell Ultra (в GB300 и B300) физически се разграничават от чиповете Blackwell (в GB200 и B200).
Обърнете внимание, че Blackwell Ultra B300 е типичен графичен ускорител, до момента в който Grace Blackwell Ultra GB300 е комплект от процесор Grace Arm със 72 Neoverse V2 ядра и два графични процесора Blackwell Ultra.
Платка с чифт процесори Grace и четири процесора Blackwell Ultra Nvidia акцентира 50-процентно нарастване на потенциала на паметта на комплекта. Blackwell Ultra разполага с 288 GB HBM3e памет, което ще е потребно при работа с изключително огромни ИИ-модели. Капацитетът на паметта е повишен посредством потреблението на нови 12-степенни HBM3e стекове – Blackwell B200 употребява 8-степенни HBM3e стекове, които обезпечават 192 GB памет.
Според Nvidia продуктивността на Blackwell Ultra би трябвало да е 1,5 пъти по-висока от тази на Blackwell при работа с към този момент подготвени ИИ-модели (FP4 inference).
Компанията твърди, че продуктивността е 15 Pflops за FP4 калкулации и 30 Pflops за разредени FP4 калкулации. За истинския ускорител Blackwell B200 тези стойности са надлежно 10 и 20 Pflops.
GB300 NVL72 Nvidia ще предложи няколко подготвени системи, основани на новите ускорители, които ще стартират да се доставят през втората половина на тази година. GB300 NVL72 в действителност е подготвен сървърен долап, който съчетава 72 графични процесора Blackwell Ultra и 36 процесора Grace. Новият артикул, както и предшественикът му GB200 NVL72 е оборудван със система за течно изстудяване, употребява NVLink от пето потомство, модули Nvidia ConnectX-8 SuperNIC и предлага 18 TB оперативна памет LPDDR5X. Производителността доближава 1100 Pflops при FP4 калкулации и до 1400 Pflops при разредени FP4 калкулации.
Nvidia особено отбелязва потреблението на 5-то потомство NVLink интерконектор, който свързва обособените чипове, с цел да сътвори „ един огромен графичен процесор “. Пропускателната дарба на всеки графичен процесор е 1,8 TB/s, а общата пропускателна дарба е 130 TB/s. Започвайки с Blackwell, NVLink може да се употребява и като интерфейс за свързване на няколко сървърни шкафа, което преди този момент се правеше посредством InfiniBand със скорост 100 GB/s. Поради това Nvidia твърди, че за този съответен сюжет скоростта е увеличена 18 пъти.
Blackwell Ultra DGX SuperPOD Към NVLink могат да бъдат свързани до 576 графични процесора. Всъщност Nvidia също ще предлага такава система – Blackwell Ultra DGX SuperPOD. Това е клъстер от осем стойки NVL72, който включва 288 процесора Grace, 576 чипа Blackwell Ultra, 300 TB HBM3e памет и FP4 продуктивност от 11,5 екзафлопа.
Накрая Nvidia показа системата HGX B300 NVL16 – решение за тези, които желаят чип с x86 архитектура вместо процесора Grace Arm.
Системата има 16 графични процесора B300 и някакъв тип x86 процесори, свързани посредством NVLink. Nvidia не прецизира кои процесори се употребяват, само че в предишното са употребявани чипове от AMD и Intel.
Изчислителните ускорители и системите, основани на Blackwell Ultra ще се появят на пазара през втората половина на тази година. Те ще се оферират от всички огромни производители на сървъри, както и нови артикули ще се оферират от огромните снабдители на облачни услуги.




