CUDA-L2 демонстрирует, что даже критически важные для производительности кернелы можно улучшить с помощью автоматизации на базе RL
Разработка
Формат TOON сокращает количество токенов при передаче данных языковым моделям на 30-60%, используя табличную структуру вместо повторяющихся ключей JSON
Новый алгоритм ускоряет поиск кратчайших путей, преодолевая 40-летний барьер
Python 3.14 показал прирост производительности до 27% в тестах





