Стартъпът DeepSeek представи новата фамилия мултимодални модели Janus Pro, за

...
Стартъпът DeepSeek представи новата фамилия мултимодални модели Janus Pro, за
Коментари Харесай

Нямат спиране: Нашумелият стартъп DeepSeek представи Janus Pro за генериране на изображения

Стартъпът DeepSeek показа новата фамилия мултимодални модели Janus Pro, за които декларира, че могат да се конкурират с DALL-E 3 на OpenAI в генерирането на изображения. Компанията пусна серия от модели, включващи сред 1 и 7 милиарда параметри по едно и също време, освен това под безплатния MIT лиценз, тъй че разработчиците могат да ползват логаритмите гратис. DeepSeek твърди, че Janus Pro може освен да генерира, само че и да проучва графиката, и назовава своето решение повсеместен инструмент.

Флагманският модел Janus Pro 7B е минал тестванията GenEval и DPG-Bench, при които съгласно DeepSeek е надминал съперниците си, в това число PixArt-alpha и Stable Diffusion XL.

„ Janus Pro превъзхожда предходните универсални модели и е съпоставим и даже по-добър от високоспециализираните решения на другите компании. Простотата, гъвкавостта и успеваемостта трансформират нашия ИИ модел в претендент за идващото потомство мултимодални системи “, се споделя в изказване на компанията.

Janus Pro е стеснен до разграничителна дарба от 384×384 пиксела, само че основателите назовават тези числа впечатляващи за едно толкоз плътно решение.

Разработчиците акцентират, че семейството Janus съдържа от 1 до 7 милиарда параметъра, а техният брой въздейства върху точността на различаване и качеството на резултата. Моделите с над 5 милиарда параметъра, съгласно стартъпа, проучват по-добре детайлите и основават по-точни изображения. Авторите считат, че този баланс сред продуктивност и размер ще разреши на Janus Pro да се ползва в планове, които изискват компактна и бърза невронна мрежа.

DeepSeek притегли вниманието на обществеността, когато неговият чатбот се изстреля преди всичко в листата с най-популярните приложения в Apple App Store. Компанията е финансирана от High-Flyer Capital Management, която е профилирана в алгоритмичната търговия. Успешният старт на езиковите модели на DeepSeek накара някои специалисти да се запитат дали Съединени американски щати могат да запазят лидерската си позиция в създаването на усъвършенствани логаритми в изискванията на възходяща конкуренция.

Някои специалисти също по този начин сложиха под въпрос дали търсенето на високопроизводителни ИИ чипове ще остане все по този начин мощно, в случай че главните играчи възприемат по-енергийно ефикасни техники. DeepSeek акцентира, че Janus Pro е подготвен при понижена консумация на изчислителни запаси и смята това за едно от главните преимущества на своите модели.

В резултат на това Janus Pro може да се трансформира в основа за идващото потомство мултимодални системи, защото кодът с отворен код и гъвкавата архитектура улесняват консолидираното на изкуствения разсъдък в комерсиалните планове. Експертите считат, че комбинацията от разбор и генериране, въпреки и с актуалните ограничавания на резолюцията, дава на продукта на DeepSeek конкурентно преимущество на пазара.

Събитията в тази сфера започнаха да се появяват доста бързо и вероятно този китайски стартъп ще покаже още нещо.

Източник: kaldata.com


СПОДЕЛИ СТАТИЯТА


КОМЕНТАРИ
НАПИШИ КОМЕНТАР