vLLM Sleep Mode позволяет переключать ИИ-модели за секунды вместо минут Система показывает ускорение в 18-200 раз и работает на 61-88% быстрее при инференсе по сравнению с холодным стартом@ИИ28.10.2025