Alibaba откри достъпа до над 100 големи езикови модела
Alibaba Cloud, облачното поделение на китайската компания Alibaba Group разгласи стартирането с открит код на над 100 огромни езикови модела. Те са част от фамилията на линията им от AI модели Qwen 2.5.
Представен през предходната година, моделът Tongyi Qianwen или Qwen е свален над 40 000 000 пъти. Наскоро оповестените модели варират като размер. По-малките от тях включват до половин милиард параметри, а огромните – до 72 милиарда параметъра. По-малките модели могат да бъдат обучавани доста по-бързо и изискват по-малко процесорна мощност. Те са ориентирани към по-фокусирано образование и осъществяването на по-прости задания. По-големите изискват забележителна процесорна мощност и надалеч повече време за образование.
„ Alibaba Cloud влага с невиждана активност в проучваният и развиването на AI технологиите “, декларира при анонса за стартирането на моделите Еди, ръководител и основен изпълнителен шеф на Alibaba Cloud Intelligence. „ Възнамеряваме да изградим AI инфраструктура на бъдещето. Тя ще обслужва световните ни клиенти и ще отключи техния бизнес капацитет “.
Заедно с езиковите модели, компанията разкри и актуализирани мултимодални модели. Сред тях има и нови текст-към-видео модели, които са част от Tongyi Wanxiang модела. Освен, че може да генерира изображения по поръчка на китайски и британски, новият модел трансформира статични изображения във видео.




