GPT-5.2 Thinking обходит топовых профессионалов в 70.9% задач по созданию документов и анализу, работая при этом в 11 раз быстрее и дешевле. Эта новая серия моделей от OpenAI задает новый стандарт для профессиональной интеллектуальной работы, показывая рекорды на ключевых бенчмарках.
Раньше ИИ-помощники могли галлюцинировать и с трудом справлялись со сложными, многоэтапными проектами, требующими глубокого анализа длинных документов или координации разных инструментов. GPT-5.2 радикально снижает частоту ошибок на 30% и вдвое улучшает понимание схем и интерфейсов, становясь надежнее для критически важных задач.
За прорывом стоят улучшения в понимании длинного контекста — модель достигает почти 100% точности на тестах с 256k токенов — и в агентских способностях, где она надежно управляет цепочками инструментов в многоходовых сценариях. Внутренние пайплайны обучили GPT-5.2 лучше работать с кодом, математикой и научными вопросами, что подтверждается рекордами на SWE-Bench Pro (55.6%) и FrontierMath (40.3%).
На практике это означает, что аналитики, разработчики и ученые смогут быстрее создавать презентации, моделировать финансы, отлаживать код и проверять гипотезы, перекладывая рутину на ИИ с человеческим надзором. Модель уже доступна в API и для платных подписчиков ChatGPT, обещая не только рост производительности, но и снижение общей стоимости достижения нужного качества работы.
Источник новости и обложки: openai.com

