Claude 3.7 Sonnet: новая модель с «продвинутым мышлением» для решения сложных задач

#Anthropic, Claude, Claude 3.7 Sonnet, Бенчмарки, ИИ-агенты

25.02.2025

Компания Anthropic представила Claude 3.7 Sonnet — первую языковую модель с симулированным рассуждением (SR). Главная особенность новинки — режим «продвинутого мышления», позволяющий системе пошагово решать сложные задачи. Разработчики могут точно указать, сколько токенов модель должна использовать для «размышлений» в пределах лимита в 128 000 токенов.

Новая версия доступна во всех тарифных планах Claude, кроме бесплатного. Цены на API остались прежними: $3 за миллион входящих токенов и $15 за миллион исходящих. Интересно, что в Claude 3.7 на 45% снижено количество необоснованных отказов выполнять запросы из-за этических ограничений.

В бенчмарках модель показала впечатляющие результаты, особенно в программировании. Claude 3.7 Sonnet достиг высших баллов в тестах SWE-bench Verified и TAU-bench, которые оценивают способность ИИ решать реальные задачи разработки и взаимодействовать с инструментами.

Вместе с обновленной моделью компания анонсировала Claude Code — ИИ-агента для разработчиков, работающего через командную строку. Инструмент может самостоятельно искать код, редактировать файлы, писать тесты и работать с GitHub. По данным внутреннего тестирования, Claude Code способен за один сеанс выполнять задачи, на которые обычно уходит более 45 минут ручной работы.

Источник новости и обложки: arstechnica.com