Microsoft представила Fara-7B — первую агентную малую языковую модель, разработанную специально для пользования компьютерами. Модель содержит 7 миллиардов параметров и демонстрирует state-of-the-art производительность в своем классе размера.
Fara-7B работает через визуальное восприятие веб-страниц и выполняет действия вроде скроллинга, ввода текста и кликов по предсказанным координатам. Модель не использует accessibility trees и взаимодействует с компьютером теми же способами, что и люди. Небольшой размер Fara-7B позволяет запускать ее непосредственно на устройствах, что снижает задержки и улучшает приватность.
Fara-7B доступна на Microsoft Foundry и Hugging Face под MIT-лицензией. Также выпущена квантизированная версия для Copilot+ PC на базе Windows 11. Компания позиционирует релиз как экспериментальный и призывает сообщество к тестированию модели.
Источник новости и обложки: www.microsoft.com