Водещи китайски компании обучават моделите си за изкуствен интелект в

...
Водещи китайски компании обучават моделите си за изкуствен интелект в
Коментари Харесай

FT: Китайските AI гиганти обучават моделите си в чужбина, заобиколяйки ограниченията на САЩ

Водещи китайски компании образоват моделите си за изкуствен интелект в чужбина, с цел да имат достъп до чиповете на Nvidia и да заобиколят американските старания да попречват развиването на мощната технология.

Alibaba и ByteDance са измежду софтуерните групи, които образоват най-новите си огромни езикови модели в центрове за данни в Югоизточна Азия, оповестява Financial Times.

Според изданието през последните месеци има непрекъсната агресия отвън Китай, откакто администрацията на Тръмп ограничи през април продажбите на H20 - полупроводниците на Nvidia, предопределени единствено за китайския пазар.

„ Очевидният избор е да дойдеш тук “, споделя пред FT оператор на център за данни със седалище в Сингапур.

„ Нуждаеш се от най-хубавите чипове, с цел да обучиш най-авангардните модели, а тук всичко е изцяло съобразено със закона. “

През последната година моделите Qwen на Alibaba и Doubao на ByteDance се трансфораха в едни от най-ефективните LLM системи в света. Qwen се употребява необятно и отвън Китай, защото е свободно наличен „ отворен “ модел.

Клъстерите от центрове за данни в Сингапур и Малайзия означават взрив, движен главно от китайското търсене. Много от тези обекти са оборудвани с висок клас артикули на Nvidia, аналогични на тези, употребявани от огромните американски софтуерни компании за образование на модели.

Според FT китайските компании нормално подписват контракти за наем на мощности в задгранични центрове за данни, които се ръководят от недържавни китайски притежатели. Това дава отговор на американските експортни ограничавания, защото така наречен „ предписание за дифузия “, въведено от администрацията на Байдън за затваряне на този междина, беше анулирано от Доналд Тръмп по-рано тази година.

Едно изключение е DeepSeek, чието образование се организира напълно в Китай. Компанията е изградилa забележителен клъстер от чипове на Nvidia преди въвеждането на американските забрани за експорт, показва FT.

В същото време DeepSeek работи в тясно съдействие с локални производители на чипове, водени от Huawei, за усъвършенстване и създаване на идващото потомство китайски AI процесори.

Huawei е разположила екип от инженери в централата на DeepSeek в Ханджоу. Компанията преглежда партньорството като стратегически инструмент за прогрес в региона на полупроводниците и софтуерните системи, които да бъдат употребявани за образование на AI модели в цялата страна.

Обучението на LLM модели изисква голяма изчислителна мощност, с цел да се обработват солидни набори от данни, което кара множеството китайски компании да избират напредналите артикули на Nvidia за тази задача.

Въпреки това тези компании все по-често употребяват китайски чипове за така наречен „ инференция “ – стадият, при който системата дава отговор на потребителски поръчки и който заема все по-голям дял от общото натоварване на AI системите.

Освен за образование, китайските софтуерни компании употребяват центровете за данни в Югоизточна Азия, с цел да обслужват своите задгранични клиенти, защото Alibaba и ByteDance се стремят да усилят каузи си на световния пазар на облачни услуги. Китайски компании уголемяват достъпа си и до центрове за данни в други райони, в това число Близкия изток.

Едно ограничаване остава в действие: на китайските софтуерни колоси не е разрешено да изнасят персонални данни отвън страната. Това значи, че в случай че даден модел би трябвало да бъде персонализиран по отношение на характерни данни на локален клиент, образованието би трябвало да се организира в Китай.
Източник: profit.bg


СПОДЕЛИ СТАТИЯТА


КОМЕНТАРИ
НАПИШИ КОМЕНТАР