Google представила Coral NPU — архитектуру чипов для ИИ на носимых устройствах

Google представила Coral NPU — архитектуру чипов для ИИ на носимых устройствах

Google анонсировала Coral NPU — полнофункциональную open-source платформу для создания энергоэффективных чипов искусственного интеллекта. Новая архитектура способна обеспечить производительность до 512 гигаопераций в секунду при потреблении всего нескольких милливатт, что делает возможным круглосуточную работу ИИ на смартфонах, наушниках и умных часах.

Основная проблема современных edge-устройств — выбор между универсальными процессорами и специализированными ускорителями. Первые предлагают гибкость, но неэффективны для задач машинного обучения. Вторые показывают высокую производительность в ИИ-задачах, но сложны в программировании. Coral NPU переворачивает традиционный подход к проектированию чипов, ставя матричный движок для ИИ в центр архитектуры вместо скалярных вычислений.

Как полноценная эталонная архитектура нейронного процессора (NPU), Coral NPU предоставляет строительные блоки для следующего поколения энергоэффективных систем на кристалле (SoC), оптимизированных для машинного обучения. Данная архитектура основана на наборе блоков интеллектуальной собственности (IP), соответствующих набору команд RISC-V, и разработана для минимального энергопотребления, что делает её идеальной для систем постоянного фонового мониторинга. Базовая конструкция обеспечивает производительность в диапазоне 512 миллиардов операций в секунду (GOPS), потребляя при этом всего несколько милливатт, что позволяет реализовать мощный локальный искусственный интеллект для периферийных устройств, наушников, дополненной реальности (AR) и умных часов.

Техническая архитектура включает три основных компонента: легковесное RISC-V ядро для управления потоками данных, векторный блок SIMD для обработки больших массивов данных и специализированный матричный движок для нейросетевых операций. Платформа совместима с популярными фреймворками — TensorFlow, JAX и PyTorch, используя стандартные компиляторы IREE и TFLM.

Первым коммерческим партнером стала компания Synaptics, которая выпустила процессоры Astra SL2610 с NPU-подсистемой Torq на базе Coral NPU. Эти чипы уже поддерживают трансформерные модели и способны работать с малыми языковыми моделями типа Gemma прямо на носимых устройствах — что может стать первым случаем запуска LLM на умных часах или наушниках.

Источник новости и обложки: developers.googleblog.com


Главред proglib.io (01.2022-10.2025). Опубликовал более 800 статей и запустил имейл-рассылки о нейросетях и разработке. Пишу на Python.

Аватар пользователя Мирослав Кунгуров