Тази година Националният суперкомпютърен център в Уси (Китай) пусна в

...
Тази година Националният суперкомпютърен център в Уси (Китай) пусна в
Коментари Харесай

В Китай е създаден 384-ядрен процесор Sunway SW26010-Pro за суперкомпютри – той е 4 пъти по-бърз от предшественика си

Тази година Националният суперкомпютърен център в Уси (Китай) пусна в деяние най-мощния суперкомпютър, основан на усъвършенствани 384-ядрени процесори Sunway SW26010-Pro, създадени в страната. В съпоставяне с предшественика му – 256-ядрения модел Sunway SW26010 без постфикс „ Pro “ – продуктивността му е повишена до четири пъти, съгласно изданието Chips and Cheese.

Sunway SW26010-Pro и основаните на него суперкомпютри станаха известни за първи път още през 2021 година, само че едвам тази година на конференцията за високопроизводителни калкулации SC23 разработчикът обществено показва този процесор и описа за неговата архитектура. Максималната продуктивност FP64 на всеки Sunway SW26010-Pro е 13,8 Tflops – за съпоставяне, 96-ядреният AMD EPYC 9654 показва продуктивност от към 5,4 Tflops.

Sunway SW26010-Pro се основава на напълно нова лична RISC архитектура – тя включва 6 групи ядра (CGs) и блок за обработка на протоколи (PPU). Всяка група CG включва 64 изчислителни обработващи детайла (Compute Processing Elements – CPE) с 512 bit векторен мотор, 256 KB свръхбърз кеш за данни и 16 KB кеш за указания, един ръководещ обработващ детайл (Management Processing Element – MPE) – суперскаларно ядро за изключителни дейности с векторен мотор, 32 KB L1 кеш за данни и указания, по 512 KB L2 кеш; и 128-битов интерфейс за DDR4-3200 памет.

MPE и CPE употребяват протокол, основан на папка – той обезпечава пореден продан на данни, с цел да се понижи размерът на придвижването на данни сред ядрата и да се поддържа точна връзка сред тях. Това е изключително значимо за приложения с неточен достъп до споделени данни. Всеки 6-клетъчен процесор има 384 изчислителни ядра и 6 контролни ядра – общо 390 ядра.

Sunway SW26010-Pro се разграничава от своя предходник с по-високи скорости (2,25 GHz за CPE и 2,10 GHz за MPE по отношение на 1,45 GHz и за двете при предходния модел) и изцяло модифицирана 64-битова RISC архитектура, която спомага за 4-кратно увеличение на продуктивността на FP64. Разработчикът е нараснал пропускателната дарба на паметта, като е заменил контролерите DDR3 с DDR4. Докато предходната версия на процесора имаше 8 GB DDR3 на CPE клъстер, в този момент тя е 16 GB DDR4 – надлежно общото количество памет, поддържано от процесора се е нараснало от 32 GB в SW26010 до 96 GB в SW26010-Pro.

В същото време, както означават от Tom’s Hardware, слабите места и на двете версии на процесора са кеш паметта и RAM паметта. В SW26010-Pro е опитано да бъде решен казуса с кеша, като се усили размера на свръхбързата памет от 64 на 256 KB, само че това към момента не е задоволително при неналичието на подобаваща L2. Освен това двуканалната подсистема на паметта DDR4-3200 (51,2 GB/s) надали е задоволителна за 64 ядра, всяко от които има 512-битов векторен FPU и обезпечава до 16 FP64-флопа на цикъл. Проблемът с кеш паметта може да бъде отчасти обезщетен посредством скъпа и отнемаща време софтуерна оптимизация, само че поради незадоволителната пропускателна дарба на RAM паметта не е ясно какъв брой ефикасен ще бъде в последна сметка осъвремененият процесор за дилемите, които екзаскейл суперкомпютрите са предопределени да вземат решение.

Източник: kaldata.com

СПОДЕЛИ СТАТИЯТА


Промоции

КОМЕНТАРИ
НАПИШИ КОМЕНТАР