Компания Anthropic представила Claude 3.7 Sonnet — первую языковую модель с симулированным рассуждением (SR). Главная особенность новинки — режим «продвинутого мышления», позволяющий системе пошагово решать сложные задачи. Разработчики могут точно указать, сколько токенов модель должна использовать для «размышлений» в пределах лимита в 128 000 токенов.

Новая версия доступна во всех тарифных планах Claude, кроме бесплатного. Цены на API остались прежними: $3 за миллион входящих токенов и $15 за миллион исходящих. Интересно, что в Claude 3.7 на 45% снижено количество необоснованных отказов выполнять запросы из-за этических ограничений.
В бенчмарках модель показала впечатляющие результаты, особенно в программировании. Claude 3.7 Sonnet достиг высших баллов в тестах SWE-bench Verified и TAU-bench, которые оценивают способность ИИ решать реальные задачи разработки и взаимодействовать с инструментами.
Вместе с обновленной моделью компания анонсировала Claude Code — ИИ-агента для разработчиков, работающего через командную строку. Инструмент может самостоятельно искать код, редактировать файлы, писать тесты и работать с GitHub. По данным внутреннего тестирования, Claude Code способен за один сеанс выполнять задачи, на которые обычно уходит более 45 минут ручной работы.
Источник новости и обложки: arstechnica.com