Anthropic представи Claude Haiku 4.5: Два пъти по-бърз и три пъти по-евтин от Sonnet 4.5 в кодирането
Anthropic показа нов модел от линията Claude 4 — Claude Haiku 4.5. Компанията го назовава най-бързият и най-евтин модел спрямо предшествениците си.
Anthropic предлага 1 $ на милион входни токени и 5 милиона изходни токени. Твърди се, че Haiku 4.5 на практика не отстъпва във връзка с опциите за шифроване и размишление на доста по-големия Sonnet 4.5, като в същото време работи по-бързо и е на една трета от цената.
Anthropic акцентира, че Haiku 4.5 е съвършен за ръководство на чатботове и AI-асистенти, както и за програмиране. Claude Haiku 4.5 реализира 73,3% в SWE-bench Verified — необятно употребен набор от данни за тестване на опциите за разработка на програмен продукт. Sonnet 4.5 преди този момент реализира 77,2% в същия тест.
2
Haiku 4.5 показва усъвършенствани благоприятни условия в ръководството на събагенти, където голям брой по-малки AI-модели си сътрудничат, с цел да вземат решение обособени задания в границите на по-голям работен развой. Например, Claude Sonnet 4.5 може да ръководи комплицирано обмисляне на планове, като делегира характерни калкулации или подзадачи на голям брой Haiku 4.5 сътрудници за по-бързо осъществяване.
Anthropic твърди, че Haiku 4.5 е посочил по-малко проблеми с подравняването спрямо предходните модели и други членове на линията Claude 4. Те също по този начин настояват за обилни статистически усъвършенствания в автоматизираната оценка на подравняването, което докара до систематизиране по по-малко строгия стандарт AI Safety Level 2 (ASL-2). По-големите модели Sonnet 4.5 и Opus 4.1 са класифицирани по по-строгия стандарт ASL-3.
3
Компанията твърди, че резултатите вършат Haiku 4.5 най-сигурният модел досега. Това е изключително правилно във връзка с понижаване на рисковете от корист, като да вземем за пример генериране на поръчки за основаване на оръжия и други неразрешени субстанции и дейности.
Разработчиците могат да стартират да употребяват Claude Haiku 4.5 посредством Claude API, Amazon Bedrock и платформата VertexAI на Гугъл Cloud, с поддръжка на противоположна съгласуемост за разработчици, които към този момент употребяват Haiku 3.5 и Sonnet 4.




