NVIDIA ще пусне 3 нови модела специализирани ИИ-ускорители за Китай.

...
NVIDIA ще пусне 3 нови модела специализирани ИИ-ускорители за Китай.
Коментари Харесай

NVIDIA ще пусне 3 нови модела ИИ-ускорители за Китай със занижена производителност: H20, L20 и L2

NVIDIA ще пусне 3 нови модела профилирани ИИ-ускорители за Китай. Новите артикули ще бъдат в отговор на новите търговски ограничавания на Съединени американски щати за експорт на компютърно съоръжение за центрове за данни в Китай и други страни. За това оповестяват няколко източника.

Новите правила за експорт, въведени от Съединени американски щати регистрират цялостната продуктивност на профилираните ИИ-ускорители и намаляват летвата дотолкоз, че даже геймърската видеокарта GeForce RTX 4090 е неразрешена за експорт в Китай, Русия и редица други страни. Според новите ограничавания, творбата от броя на битовете за изчислителна продуктивност, наречено Total Processing Performance или TPP не би трябвало да надвишава 4800, а геймърският флагман на NVIDIA доближава стойност от 5285.

NVIDIA към този момент разполага с нови модели ИИ-ускорители, които не са обект на последните ограничавания за експорт. Те са наречени H20, L20 и L2. Масовото им произвеждане ще стартира идващия месец. На собствен ред китайският държавен информативен канал Chinastarmarket, представен от Bloomberg, оповестява, че NVIDIA ще стартира да доставя тези ускорители в Китай през идващите няколко дни, а формалното им оповестяване ще се състои през втората половина на този месец.

Точните спецификации на NVIDIA H20, L20 и L2 не са известни. Според някои източници H20 е построен въз основата на модифициран графичен чип GH100 на архитектурата Hopper и употребява опаковката CoWoS на TSMC. Двата представители на серията L може да имат нещо общо с архитектурата на Ada Lovelace. Анализаторите от Semianalysis означават, че H20 може да се оправи с някои задания даже по-добре от ускорителя H100, който попадна под възбрана за доставка.

ITHome разгласява главните характерности на изброените ускорители. Според тези данни, H20 ще получи 96 GB памет HBM3 с пропускателна дарба 4 TB/s и ще предложи продуктивност на тензорните ядра до 296 Tflops при целочислените интервенции INT8. TPP на новия артикул ще бъде 2368 и ще бъде в границите на новите ограничавания за експорт. В интервенциите FP64 ускорителят H20 ще обезпечава продуктивност на равнище 1 Tflops (H100 обезпечава 34 Tflops), а в интервенциите FP16/BF16 – 148 Tflops (H100 обезпечава 1979 Tflops). Консумацията на сила на H20 ще бъде 400 W. H20 ще резервира поддръжката на шината NVLink със скорост 900 Gbytes/s. Това ще разреши до осем ускорителя да бъдат обединени в клъстер.

NVIDIA L20 в PCIe форм-фактор ще разполага с 48 GB GDDR6 памет и ще обезпечава оптималната изчислителна продуктивност от 239 Tflops при INT8 интервенции. На собствен ред моделът L2, също във форм-фактор PCIe ще получи 24 GB GDDR6 памет и ще има пикова изчислителна продуктивност от 193 Tflops при INT8 задания. Данните за TPP за моделите L20 и L2 ще бъдат надлежно 1912 и 1544.

Източник: kaldata.com

СПОДЕЛИ СТАТИЯТА


Промоции

КОМЕНТАРИ
НАПИШИ КОМЕНТАР