Ant Group представила LingBot-World — опенсорсный фреймворк для интерактивного моделирования миров. Система генерирует физически правдоподобные динамические сцены с низкой латентностью, позволяя взаимодействовать с созданными мирами в реальном времени. В основе лежит Scalable Data Engine, который использует игровые движки как бесконечные генераторы данных.
LingBot-World выходит за рамки случайных галлюцинаций благодаря усиленной контекстной памяти. Система сохраняет структурную целостность, постоянство объектов и нарративную логику на траекториях длиной в минуту. Модель объединяет логику физического и игрового миров, обеспечивая надежную генерализацию от синтетических данных к реальным сценариям.
По мере масштабирования модели появляются сложные паттерны поведения, демонстрирующие понимание пространственной логики, временной персистентности и физических ограничений. Система поддерживает управление с замкнутым циклом: модель понимает причинно-следственную связь между действиями и результатами, что делает каждое взаимодействие обоснованным и реалистичным. Платформа включает возможности промптирования событий в мире, автономных агентов для планирования и выполнения действий, а также 3D-реконструкцию из сгенерированных последовательностей.
Текущие ограничения включают высокую стоимость инференса, требующую GPU корпоративного уровня, и отсутствие долгосрочной стабильности из-за эмерджентной памяти на основе контекстного окна. Это приводит к дрифту окружения, при котором сцена постепенно теряет структурную целостность на длительных интервалах. Дорожная карта команды включает расширение пространства действий и физического движка, внедрение явного модуля памяти и устранение дрифта генерации для бесконечного геймплея.
Источник новости и обложки: technology.robbyant.com

