Alibaba представила Aegaeon — систему, которая снижает потребление GPU для LLM-сервисов на 82% Система Aegaeon обслуживает 7 моделей на одном GPU вместо 2-3, сокращая время автомасштабирования на 97% и повышая утилизацию до 48.1%@ИИ20.10.2025