GPT-5.2 обходит экспертов в 71% задач — и в 11 раз быстрее

GPT-5.2 обходит экспертов в 71% задач — и в 11 раз быстрее

GPT-5.2 Thinking обходит топовых профессионалов в 70.9% задач по созданию документов и анализу, работая при этом в 11 раз быстрее и дешевле. Эта новая серия моделей от OpenAI задает новый стандарт для профессиональной интеллектуальной работы, показывая рекорды на ключевых бенчмарках.

Раньше ИИ-помощники могли галлюцинировать и с трудом справлялись со сложными, многоэтапными проектами, требующими глубокого анализа длинных документов или координации разных инструментов. GPT-5.2 радикально снижает частоту ошибок на 30% и вдвое улучшает понимание схем и интерфейсов, становясь надежнее для критически важных задач.

За прорывом стоят улучшения в понимании длинного контекста — модель достигает почти 100% точности на тестах с 256k токенов — и в агентских способностях, где она надежно управляет цепочками инструментов в многоходовых сценариях. Внутренние пайплайны обучили GPT-5.2 лучше работать с кодом, математикой и научными вопросами, что подтверждается рекордами на SWE-Bench Pro (55.6%) и FrontierMath (40.3%).

На практике это означает, что аналитики, разработчики и ученые смогут быстрее создавать презентации, моделировать финансы, отлаживать код и проверять гипотезы, перекладывая рутину на ИИ с человеческим надзором. Модель уже доступна в API и для платных подписчиков ChatGPT, обещая не только рост производительности, но и снижение общей стоимости достижения нужного качества работы.

Источник новости и обложки: openai.com


Главред proglib.io (01.2022-10.2025). Опубликовал более 800 статей и запустил имейл-рассылки о нейросетях и разработке. Пишу на Python.

Аватар пользователя Мирослав Кунгуров