Google представила Gemini Robotics 1.5 — ИИ-агентов для управления роботами в реальном мире

Google DeepMind анонсировала две новые модели семейства Gemini Robotics 1.5, которые выводят робототехнику на качественно новый уровень. Главная особенность — роботы теперь могут не просто выполнять команды, а самостоятельно планировать многоэтапные задачи, используя для этого 15 академических бенчмарков для оценки пространственного понимания.

В основе решения лежат две взаимодополняющие модели. Gemini Robotics-ER 1.5 выполняет роль «высокоуровневого мозга» — планирует действия, принимает логические решения и может обращаться к внешним инструментам вроде Google Search. Gemini Robotics 1.5 переводит эти планы в конкретные двигательные команды, причем модель «думает» перед действием и может объяснить свой процесс рассуждения на естественном языке.

Особенно впечатляет способность модели переносить навыки между разными типами роботов. Задачи, изученные на роботе ALOHA 2, успешно выполняются гуманоидным роботом Apollo от Apptronik и двурукой системой Franka — без дополнительной специализации модели под каждое устройство. Это кардинально ускоряет обучение новым поведениям.

Google также обновила бенчмарк ASIMOV для оценки семантической безопасности роботов, улучшив покрытие редких случаев и добавив новые типы вопросов безопасности. На этих тестах Gemini Robotics-ER 1.5 показала современный уровень производительности, а функция «мышления» значительно улучшила понимание семантической безопасности.

Gemini Robotics-ER 1.5 уже доступна разработчикам через Gemini API в Google AI Studio, тогда как Gemini Robotics 1.5 пока предоставляется только избранным партнерам. Это важная веха на пути к созданию универсального искусственного интеллекта в физическом мире — системы, способной не просто реагировать на команды, а по-настоящему рассуждать и планировать.

Источник новости и обложки: deepmind.google


Работаю главным редактором proglib.io — опубликовал более 800 статей и создал популярные рассылки о нейросетях и разработке. Помимо редактуры владею Python, с его помощью автоматизирую повседневные задачи.

Аватар пользователя Мирослав Кунгуров