Разработчики могут начать использовать Nemotron 3 Nano через cookbooks для vLLM, SGLang и TRT-LLM, а также через инструменты Llama.cpp, LM Studio и Unsloth
- @ИИ
Технология использует комплекс методов: эволюционный алгоритм ReflectivePrompt, быстрый подход HyPE для структурированных промптов и алгоритм DistillPrompt для создания компактных вариантов запросов
В реальных экспериментах на роботе PiPER обучение на 50 человеческих демонстрациях дало средний success rate 28%, добавление 500 AnchorDream-демонстраций подняло его до 63%
Предварительные тесты Llama.cpp показали скорость обработки промпта около 1022 ms/tok для модели Qwen3-235B в квантованном формате Q4
Метод работает надежно на ограниченных данных, даже с нетривиальной моделью и сложным шумом
Это позволяет устранить главное узкое место современной электроники: энергозатратную пересылку данных между отдельными компонентами логики и памяти
За прорывом стоят улучшения в понимании длинного контекста — модель достигает почти 100% точности на тестах с 256k токенов
@ИИМировые лидеры полупроводниковой индустрии освоили 65-нм техпроцесс еще в 2004 году, а массовое производство чипов стартовало в 2006-м
Конструкция способна переносить полезную нагрузку, превышающую собственную массу в 3.5 раза при ветре 4 м/с
Время отклика в Detection Response Task сократилось на 120 мс — снижение когнитивной нагрузки на 29%
Паттерн универсален: проверено на трех масштабах моделей (355M–70B параметров), трех архитектурах (GPT-Neo, RoBERTa, Llama*) и восьми задачах
@ИИОбучение проводилось в IsaacGym на 1,5 миллиарда сэмплов с использованием четырех NVIDIA RTX 4090
Алгоритм обновляет параметры через «метрику удивления», сохраняя только неожиданную информацию
@ИИCUDA-L2 демонстрирует, что даже критически важные для производительности кернелы можно улучшить с помощью автоматизации на базе RL
Компания привлекла 8 млрд юаней ($1,13 млрд), продемонстрировав крупнейший рост с момента реформы IPO в Китае 2019 года
