Мирослав Кунгуров

ХМ-ХМ
ЧТО ЗА ФАК*

NVIDIA выпустила Nemotron 3 с контекстом 1M токенов

Разработчики могут начать использовать Nemotron 3 Nano через cookbooks для vLLM, SGLang и TRT-LLM, а также через инструменты Llama.cpp, LM Studio и Unsloth
@ИИ
15.12.2025
ИТМО создала CoolPrompt — библиотеку для автоматической оптимизации промптов ИИ

Технология использует комплекс методов: эволюционный алгоритм ReflectivePrompt, быстрый подход HyPE для структурированных промптов и алгоритм DistillPrompt для создания компактных вариантов запросов
@ИИ, Разработка
15.12.2025
Робот научился хватать предметы за 10 часов — без 3D-моделей

В реальных экспериментах на роботе PiPER обучение на 50 человеческих демонстрациях дало средний success rate 28%, добавление 500 AnchorDream-демонстраций подняло его до 63%
@Железо, ИИ
15.12.2025
Энтузиаст собрал AI-десктоп на Grace-Hopper за €9000 для 235B моделей

Предварительные тесты Llama.cpp показали скорость обработки промпта около 1022 ms/tok для модели Qwen3-235B в квантованном формате Q4
@Железо
12.12.2025
CLAPS: роботы предсказывают траектории с вероятностью 90% — без точных моделей

Метод работает надежно на ограниченных данных, даже с нетривиальной моделью и сложным шумом
@Железо, ИИ
12.12.2025
Память и транзистор в одном стеке на чипе: прорыв MIT

Это позволяет устранить главное узкое место современной электроники: энергозатратную пересылку данных между отдельными компонентами логики и памяти
@Железо
12.12.2025
GPT-5.2 обходит экспертов в 71% задач — и в 11 раз быстрее
За прорывом стоят улучшения в понимании длинного контекста — модель достигает почти 100% точности на тестах с 256k токенов
@ИИ
11.12.2025
Россия разработала системы для 65-нм техпроцесса

Мировые лидеры полупроводниковой индустрии освоили 65-нм техпроцесс еще в 2004 году, а массовое производство чипов стартовало в 2006-м
@Железо
11.12.2025
Ветер заменил мотор: робот-перекати-поле экономит 48% энергии

Конструкция способна переносить полезную нагрузку, превышающую собственную массу в 3.5 раза при ветре 4 м/с
@Железо
11.12.2025
ИИ снизил когнитивную нагрузку на 29% — бионическая рука читает намерения

Время отклика в Detection Response Task сократилось на 120 мс — снижение когнитивной нагрузки на 29%
@Железо
10.12.2025
AN1-Core: Llama* 70B сжали в 224 раза — точность выросла на 1.81%

Паттерн универсален: проверено на трех масштабах моделей (355M–70B параметров), трех архитектурах (GPT-Neo, RoBERTa, Llama*) и восьми задачах
@ИИ
10.12.2025
Робот копирует движения из AI-видео за 0,04 мс — без дообучения

Обучение проводилось в IsaacGym на 1,5 миллиарда сэмплов с использованием четырех NVIDIA RTX 4090
@Железо, ИИ
08.12.2025
Titans обошел GPT-4: контекст 2 млн токенов без потери данных

Алгоритм обновляет параметры через «метрику удивления», сохраняя только неожиданную информацию
@ИИ
08.12.2025
CUDA-L2 обошел cuBLAS: ускорение матричных вычислений на 26%

CUDA-L2 демонстрирует, что даже критически важные для производительности кернелы можно улучшить с помощью автоматизации на базе RL
@ИИ, Разработка
05.12.2025
Акции китайского AI-чипмейкера Moore Threads взлетели на 425% после IPO

Компания привлекла 8 млрд юаней ($1,13 млрд), продемонстрировав крупнейший рост с момента реформы IPO в Китае 2019 года
@Железо
05.12.2025