В 72 раза эффективнее NVIDIA Jetson: аналоговые чипы ломают «стену памяти»

В 72 раза эффективнее NVIDIA Jetson: аналоговые чипы ломают «стену памяти»

Развертывание спайковых нейросетей на аналоговых CIM-ускорителях снизило энергию инференса в 72 раза. При этом задержка сократилась в 10 раз по сравнению с платой NVIDIA Jetson TX2.

Традиционное железо уперлось в «стену памяти»: разделение вычислений и хранения данных в архитектуре фон Неймана создает критические задержки. Это стало барьером для современных моделей, размер которых вырос в 5000 раз за последние 4 года.

Эволюция моделей искусственного интеллекта (ИИ) и аппаратного обеспечения с течением времени. По мере роста сложности и требований рабочих нагрузок ИИ, модели ИИ также увеличиваются в размере и сложности для сохранения производительности, что приводит к энергоемким реализациям с высокой задержкой. Для решения этой проблемы усовершенствования в аппаратном обеспечении ИИ направлены на создание новых быстрых и эффективных решений. Однако эта эволюция аппаратной части также ведет к расширению функционального разрыва между моделями ИИ и оборудованием. Данный разрыв можно охарактеризовать такими факторами, как разнообразие вычислительных ядер, непредсказуемые и разреженные шаблоны доступа, а также высокие требования к плотности памяти. Это создает необходимость совместного проектирования алгоритмов и аппаратного обеспечения ИИ в единой платформе на всех уровнях — от устройств и схем до архитектуры и алгоритмов.

Решением стала технология Compute-in-Memory (CIM), выполняющая матричные умножения непосредственно внутри массивов памяти. Аналоговые схемы используют закон Кирхгофа для суммирования токов на разрядных линиях, исключая энергозатратное перемещение данных. Такой подход позволяет интегрировать вычисления прямо в ячейки RRAM или MRAM.

Гибридная архитектура Fusion-FlowNet уже показала снижение ошибок на 40% и сокращение энергии в 1.87 раза по сравнению с методами на базе ANN. Это доказывает эффективность ко-дизайна алгоритмов и железа для создания «конвергентной платформы», объединяющей спайковые и искусственные нейросети.

Источник новости и обложки: www.frontiersin.org


Главред proglib.io (01.2022-10.2025). Опубликовал более 800 статей и запустил имейл-рассылки о нейросетях и разработке. Пишу на Python.

Аватар пользователя Мирослав Кунгуров