Aegaeon: эффективное объединение GPU для одновременного обслуживания LLM на рынке моделей Aegaeon поддерживает в 2-2.5 раза более высокую скорость поступления запросов и экономит 82% GPU-ресурсов при развертывании, обслуживая десятки моделей@ИИ20.10.2025