Для решения задачи используется модель Gemini 2.5 pro, которая выполняет мультимодальное zero-shot рассуждение над геометрией и функциональностью
Gemini 2.5 Pro
В то время как с визуальными подсказками точность выросла в среднем на 33,7%
@ИИ
Для решения задачи используется модель Gemini 2.5 pro, которая выполняет мультимодальное zero-shot рассуждение над геометрией и функциональностью
В то время как с визуальными подсказками точность выросла в среднем на 33,7%