Вчера Anthropic обяви пускането на пазара на новия си флагмански

Инженерите губят от ИИ: моделът Claude Opus 4.5 се справи със заданието на Anthropic по-добре от всеки човек

Вчера Anthropic разгласи стартирането на пазара на новия си флагмански ИИ-модел Claude Opus 4.5. Компанията по-късно разкри, че в двучасова задача, препоръчана от самата Anthropic при наемане на чиновници за инженерни позиции, Opus 4.5 се е показал по-добре от живите участници в теста.

Според Anthropic, продуктивността на изкуствения разсъдък е реализирана посредством неведнъж решение на всяка задача и избиране на най-хубавия отговор. Въпреки че пробата не покрива всички пълномощия, нужни за това да бъдеш инженер, превъзходството на модела над мощните претенденти в основни механически области допуска, че в бъдеще изкуственият разсъдък може да трансформира инженерството като специалност, оповестява Business Insider.

Подробностите за наличието на теста не се разкриват, само че отзивите в Glassdoor демонстрират, че през 2024 година той е включвал четири равнища и е претендирал внедряването на характерна система, последвано от прибавяне на функционалност. Не е известно дали сходен формат на дилемите е бил употребен при оценката на новата версия на Claude Opus 4.5, която включва усъвършенствания освен в генерирането на код, само че и в основаването на професионални документи, в това число електронни таблици в Excel и презентации в PowerPoint.

Според специалисти, тази версия продължава да затвърждава водещата позиция на Anthropic в региона на ИИ-програмирането. Дори Meta на Марк Зукърбърг, съперник в конкуренцията за изкуствения разсъдък, употребява Claude за поддръжката на своя вътрешен помощник по шифроване под името Devmate.

Компанията пази в загадка методите си за образование на ИИ-моделите. Ерик Саймънс, изпълнителен шеф на стартъпа Stackblitz, който създаде услугата Bolt.new, обаче преди този момент допусна, че Anthropic може да употребява изкуствен интелект за писане и осъществяване на код, след което да проучва резултатите както с човешки, по този начин и с ИИ-инструменти. Това изложение беше доказано от Даян Пен, началник на отдела за продуктово ръководство, проучвания и напреднали технологии в Anthropic, наричайки го „ като цяло правилно “.

През октомври, основният изпълнителен шеф на Anthropic, Дарио Амодей, разгласи, че ИИ Claude към този момент написа 90% от кода за множеството екипи в компанията. Той обаче отбелязва, че това няма да докара до понижаване на броя на инженерите, а по-скоро ще усили търсенето им, защото хората ще могат да се съсредоточат върху най-сложните 10% от работата или върху ръководството на група от ИИ-модели.

Спомнете си, че Anthropic провокира Gemini 3, защото компанията показа мощния AI-модел Opus 4.5. Също, Claude Opus 4 към този момент може да приключва разговора с токсичните консуматори. Тоест, ИИ към този момент може самичък да приключи разговора, в случай че реши, че обстановката е заплашителна не за индивида, а за самия него.

(function() { const banners = [ // --- БАНЕР 1 (Facebook Messenger) --- `