Ефективността на новите продукти на NVIDIA в класацията за суперкомпютри Green500 беше поставена под въпрос поради чиповете на AMD и… самата NVIDIA
Въпреки че ускорителите на NVIDIA са измежду най-енергоемките в своя клас, основаните на фирмените чипове суперкомпютри към момента преобладават в международната ранглиста за енергийна успеваемост на съответните машини — Green500. Компанията обаче е изправена пред мощна конкуренция от страна на AMD и не постоянно е подготвена да се конкурира даже със личните си артикули, оповестява The Register.
На пръв взор водачеството на основаните на NVIDIA планове е неоспоримо. Осем от 10 суперкомпютри, включени в „ ТОП 10 “ енергийно ефикасни машини, са основани на NVIDIA чиповете, а пет от тях на 1000-ватовите хибридни суперускорители GH200, които са доста известни измежду потребителите на HPC-решенията.
В новата ранглиста Green500 на тяхна база са построени първата и втората най-енергийноефективни системи — JEDI (EuroHPC) и Romeo-2025 (Romeo HPC Center). Във високопроизводителния бенчмарк Linpack те показват продуктивност надлежно от 72,7 Gflops/W и 70,9 Gflops/W (FP64).
Системите са съвсем идентични и са основани на платформата BullSequana XH3000 на Eviden. Решението GH200 също по този начин заема и четвърта, шеста и седма позиция в класацията: Isambard-AI Phase 1 (68,8 Gflops/W), Jupiter Exascale Transition Instrument (67,9 Gflops/W) и Helios (66,9 Gflops/W). Системите с тестваната NVIDIA H100 заемат пето, осмо и девето място — това са Capella, Henri и HoreKa-Teal.
Съществуват обаче и подозрения, че решенията на NVIDIA ще продължат да царуват в класацията. Решенията на Grace-Blackwell към този момент са на път във тип на GB200 (2,7 kW) и GB200 NVL4 (5,4 kW). Новите артикули не постоянно обезпечават оптималната продуктивност на ват употребявана сила.
От A100 през 2020 година до H100 през 2022 година, продуктивността (FP64) скочи до небето с към 3,5 пъти, само че спрямо 1,2kW платформа Blackwell, 700W, H100 в действителност са по-бързи в режим FP64. Всъщност единствено “векторната математика “ (vector math) се усъвършенства за FP64, където новите артикули бяха с 32% по-производителни.
С други думи, макар че през днешния ден NVIDIA може да се похвали с висока позиция в класацията Green500, решението, основано на ускорителите AMD MI300A, към този момент зае трето място (Adastra 2). MI300A беше разгласен доскоро по-малко от година, решението получи 24-ядрен процесор и шест CDNA-3 чиплета в един APU модул, оборудван с до 128 GB HBM3 памет, както и настройваемо равнище на TDP от 550- 760 W. Освен това системата е 1,8 пъти по-бърза от NVIDIA H100 (поне на хартия).
Създаден от HPE Cray благодарение на блейд сървърите EX255a, суперкомпютърът Adastra 2 обезпечава 69 Gflops/W продуктивност. Десето място заема също основана на MI300A машина —- RZAdams от Ливърморската национална лаборатория (62,8 Gflops/W).
Всички системи в челната десетка на класацията Green500 към този момент доста надвишават задачата за енергийна успеваемост от 50 Gflops/W. Тази цифра е нужна за реализиране на калкулации в екзамащаб, като в същото време се ограничи потреблението на сила до 20 мегавата.
Проблемът е, че по-малко мощните системи са доста по-ефективни: JEDI употребява единствено 67 kW, а най-производителната машина с GH200 в класацията Top500 — Alps на Швейцарския народен суперкомпютърен център — обезпечава 434 Pflops в HPL бенчмарка, консумирайки 7,1 MW — това е единствено 14-тата най-енергийно ефикасна машина с 61 Gflops/W.
Същият проблем се следи и с Adastra 2: компютърът употребява даже по-малко от JEDI — 37 kW. Ако 69 Gflops/W могат да се поддържат в мащаб, ще са нужни единствено 25,2 MW, с цел да се обезпечат 1742 eflops на продуктивност от El Capitan. Междувременно последният изисква към 29,6 MW, с цел да реализира своите рекордни стойности.




