CUDA-L2 демонстрирует, что даже критически важные для производительности кернелы можно улучшить с помощью автоматизации на базе RL
Оптимизация
Aegaeon поддерживает в 2-2.5 раза более высокую скорость поступления запросов и экономит 82% GPU-ресурсов при развертывании, обслуживая десятки моделей
@ИИМатематики объяснили эффективность симплекс-метода: почему 80-летний алгоритм превосходит теоретические прогнозы



