Технологията на Google, която може да спука балона при паметите
Алгоритъм за компресиране, показан от Гугъл предходната седмица, провокира срив при акциите на производителите на памети. До края на седмицата обаче се очерта ясна разграничителна линия: производителите на флаш памети понесоха най-тежките загуби, до момента в който тези на високоскоростна памет (HBM) се стабилизираха.
Какво е TurboQuant
В обява в своя блог Гугъл показа TurboQuant — техника, която компресира така наречен key-value кеш, употребен от езиковите модели, от 16 до единствено 3 бита на стойност.
Резултатът: паметта, нужна за AI inference, понижава най-малко шест пъти, а скоростта на обработка върху GPU Nvidia H100 нараства до осем пъти — без измерима загуба на акуратност.
Технологията е създадена взаимно с откриватели от Гугъл DeepMind и учени от Корейския софтуерен институт KAIST. Официалното показване е планувано за конференцията ICLR 2026 в Рио де Жанейро през април.
Най-богатият човек в света строи цех за чипове, който прави Тайван непотребен
Terrafab ще е без аналог... в случай че изобщо стане действителност
Главният изпълнителен шеф на Cloudflare Матю Принс назова създаването " DeepSeek момента за Гугъл " — отпратка към китайската AI лаборатория, чиято проява на евтини високоефективни модели раздруса софтуерните пазари предходната година.
Как реагира пазарът
Пазарната реакция беше незабавна. В края на предходната седмица SanDisk загуби 11%, Micron падна с близо 7%, а Philadelphia Semiconductor Index се срина с 4,8%. В понеделник разпродажбата продължи.
В Азия японският експерт по флаш памети Kioxia Holdings поевтиня с близо 6%, а южнокорейският показател Kospi означи седмична загуба от над 8%.
Samsung и SK Hynix — двата най-големи производителя на памети в света — също поевтиняха внезапно в четвъртък, само че до края на седмицата Samsung съвсем изцяло възвърне загубите си, а спадът при SK Hynix се сви до към 1%.
Стачка в Samsung може да остави света без чипове
Акциите на компанията летят в небето и чиновниците желаят да получат дължимото за това
Анализатори от Morgan Stanley и Bloomberg Intelligence обясниха разминаването: TurboQuant усъвършенства паметта при inference (т.е. при всекидневната работа с към този момент квалифициран модел), само че не визира образованието на моделите, където HBM е незаменима.
Дългосрочният напън е ориентиран най-вече към NAND флаш паметта, употребена в SSD дисковете на датацентровете.
Лабораторен пробив, (все още) не пазарна действителност
Редица анализатори предизвестяват, че реакцията на пазара за следващ път изпреварва действителността. Алгоритъмът е оповестен в arXiv още през април 2025 година, а блог обявата на Гугъл просто го вади още веднъж на ярко.
" На този стадий това е изследователска разработка, която занапред следва да бъде валидирана ", разяснява пред Korea Herald професор Ю Хои-джун от KAIST.
Освен това историята познава така наречен абсурд на Джевонс — успеваемостта не свива, а уголемява търсенето. По-евтиното съоръжение на AI системи ще форсира тяхното всеобщо нахлуване, което в последна сметка ще усили изчислителните натоварвания и потребността от памет.
" Производителите на памети биха се оказали най-големите бенефициенти на разрастващата се AI екосистема ", предвижда пред изданието Ким Донг-уон от KB Securities.
Дали най-после ще получим по-мощни inference системи, или по-евтина RAM за компютри - занапред ще излиза наяве, само че най-малко на първо четене с нововъведението сигурно ще дойдат позитиви.
Какво е TurboQuant
В обява в своя блог Гугъл показа TurboQuant — техника, която компресира така наречен key-value кеш, употребен от езиковите модели, от 16 до единствено 3 бита на стойност.
Резултатът: паметта, нужна за AI inference, понижава най-малко шест пъти, а скоростта на обработка върху GPU Nvidia H100 нараства до осем пъти — без измерима загуба на акуратност.
Технологията е създадена взаимно с откриватели от Гугъл DeepMind и учени от Корейския софтуерен институт KAIST. Официалното показване е планувано за конференцията ICLR 2026 в Рио де Жанейро през април.
Най-богатият човек в света строи цех за чипове, който прави Тайван непотребен
Terrafab ще е без аналог... в случай че изобщо стане действителност
Главният изпълнителен шеф на Cloudflare Матю Принс назова създаването " DeepSeek момента за Гугъл " — отпратка към китайската AI лаборатория, чиято проява на евтини високоефективни модели раздруса софтуерните пазари предходната година.
Как реагира пазарът
Пазарната реакция беше незабавна. В края на предходната седмица SanDisk загуби 11%, Micron падна с близо 7%, а Philadelphia Semiconductor Index се срина с 4,8%. В понеделник разпродажбата продължи.
В Азия японският експерт по флаш памети Kioxia Holdings поевтиня с близо 6%, а южнокорейският показател Kospi означи седмична загуба от над 8%.
Samsung и SK Hynix — двата най-големи производителя на памети в света — също поевтиняха внезапно в четвъртък, само че до края на седмицата Samsung съвсем изцяло възвърне загубите си, а спадът при SK Hynix се сви до към 1%.
Стачка в Samsung може да остави света без чипове
Акциите на компанията летят в небето и чиновниците желаят да получат дължимото за това
Анализатори от Morgan Stanley и Bloomberg Intelligence обясниха разминаването: TurboQuant усъвършенства паметта при inference (т.е. при всекидневната работа с към този момент квалифициран модел), само че не визира образованието на моделите, където HBM е незаменима.
Дългосрочният напън е ориентиран най-вече към NAND флаш паметта, употребена в SSD дисковете на датацентровете.
Лабораторен пробив, (все още) не пазарна действителност
Редица анализатори предизвестяват, че реакцията на пазара за следващ път изпреварва действителността. Алгоритъмът е оповестен в arXiv още през април 2025 година, а блог обявата на Гугъл просто го вади още веднъж на ярко.
" На този стадий това е изследователска разработка, която занапред следва да бъде валидирана ", разяснява пред Korea Herald професор Ю Хои-джун от KAIST.
Освен това историята познава така наречен абсурд на Джевонс — успеваемостта не свива, а уголемява търсенето. По-евтиното съоръжение на AI системи ще форсира тяхното всеобщо нахлуване, което в последна сметка ще усили изчислителните натоварвания и потребността от памет.
" Производителите на памети биха се оказали най-големите бенефициенти на разрастващата се AI екосистема ", предвижда пред изданието Ким Донг-уон от KB Securities.
Дали най-после ще получим по-мощни inference системи, или по-евтина RAM за компютри - занапред ще излиза наяве, само че най-малко на първо четене с нововъведението сигурно ще дойдат позитиви.
Източник: money.bg
КОМЕНТАРИ




