В 4 раза меньше памяти: KVzap сжимает KV-кеш без потери точностиМетод обучается аппроксимировать политику скоринга улучшенного варианта KVzip@ИИ18.01.2026
vLLM Sleep Mode позволяет переключать ИИ-модели за секунды вместо минутСистема показывает ускорение в 18-200 раз и работает на 61-88% быстрее при инференсе по сравнению с холодным стартом@ИИ28.10.2025