Microsoft анонсировала Fara-7B — первую агентную SLM для пользования компьютерами

Microsoft анонсировала Fara-7B — первую агентную SLM для computer use

Microsoft представила Fara-7B — первую агентную малую языковую модель, разработанную специально для пользования компьютерами. Модель содержит 7 миллиардов параметров и демонстрирует state-of-the-art производительность в своем классе размера.

Fara-7B работает через визуальное восприятие веб-страниц и выполняет действия вроде скроллинга, ввода текста и кликов по предсказанным координатам. Модель не использует accessibility trees и взаимодействует с компьютером теми же способами, что и люди. Небольшой размер Fara-7B позволяет запускать ее непосредственно на устройствах, что снижает задержки и улучшает приватность.

Сравнение точности WebVoyager и стоимости Fara-7B с другими агентами компьютерного взаимодействия (CUAs) или агентами, которые запрашивают LLM с использованием деревьев доступности (SoM Agent с Ax Tree). Стоимость рассчитывается путем умножения среднего количества входных и выходных токенов, потребляемых каждой моделью, на цену за токен. И Fara-7B, и UI-TARS-1.5-7B основаны на Qwen-2.5-VL-7B, для которой минимальная цена инференса на https://openrouter.ai/ составляет 0,2 доллара за 1 млн входных/выходных токенов. Несмотря на одинаковую цену, Fara-7B работает эффективнее: в среднем выполняет задачи за ~16 шагов по сравнению с ~41 у UI-TARS-1.5-7B. OpenAI computer-use-preview использовался в ноябре 2025 года через Responses API.

Fara-7B доступна на Microsoft Foundry и Hugging Face под MIT-лицензией. Также выпущена квантизированная версия для Copilot+ PC на базе Windows 11. Компания позиционирует релиз как экспериментальный и призывает сообщество к тестированию модели.

Источник новости и обложки: www.microsoft.com


Главред proglib.io (01.2022-10.2025). Опубликовал более 800 статей и запустил имейл-рассылки о нейросетях и разработке. Пишу на Python.

Аватар пользователя Мирослав Кунгуров