ИИ-агенты для начинающих. Часть 1. Что такое ИИ-агенты и где они применяются

При подготовке статьи использовалась публикация «Introduction to AI Agents and Agent Use Cases».

О чем поговорим

В нашем обзоре мы детально рассмотрим:

Концепцию ИИ-агентов и их основные типы
Практические сценарии применения и реальную пользу
Базовые компоненты для создания агентных решений

Чему вы научитесь

После изучения материала вы сможете:

Четко понимать концепцию ИИ-агентов и их отличия от других ИИ-решений
Грамотно определять случаи, когда применение агентов действительно эффективно
Проектировать решения на базе агентов, которые будут полезны как пользователям, так и бизнесу

Определение ИИ-агентов и их типы

Что такое ИИ-агенты?

ИИ-агенты — это системы, которые позволяют большим языковым моделям (LLM) выполнять действия, расширяя их возможности с помощью инструментов и знаний.

Система

Важно понимать, что агент — это не просто один компонент, а целая система, состоящая из нескольких частей. На базовом уровне основные компоненты ИИ-агента включают:

Окружение — это пространство, в котором работает агент. Например, для агента по бронированию путешествий таким окружением может быть сам сервис бронирования, через который агент выполняет свои задачи.
Датчики — окружающая среда предоставляет информацию и обратную связь. ИИ-агенты используют датчики для сбора и интерпретации этих данных. В случае с агентом для путешествий такими датчиками могут быть данные о наличии номеров в отелях или ценах на авиабилеты.
Исполнители — когда агент получает информацию о текущем состоянии окружения, он принимает решение, какое действие выполнить, чтобы изменить его. Например, для агента по бронированию путешествий таким действием может быть бронирование доступного номера в отеле.

Большие языковые модели (LLM)

Идея ИИ-агентов существовала и до появления LLM. Однако с внедрением этих моделей на сцену они значительно расширили возможности ИИ-агентов. LLM позволяют агентам не только взаимодействовать с окружающим миром, но и интерпретировать человеческий язык и данные.

Выполнение действий

Без интеграции в системы агентов, LLM ограничены задачами, связанными с генерацией контента или информацией, основанной на запросах пользователя. Однако в рамках системы ИИ-агента LLM могут выполнять настоящие действия, интерпретируя запросы и используя доступные инструменты.

Доступ к инструментам

Какие инструменты доступны LLM, зависит от двух факторов:

Окружение, в котором работает агент.
Разработчик агента, который может ограничить доступ к определенным инструментам.

В примере с турагентом инструменты будут ограничены функциональностью системы бронирования. Например, доступ к функциям может быть ограничен только поиском и бронированием авиабилетов.

Знания

Помимо информации, предоставляемой окружением, ИИ-агенты могут получать знания из других систем, сервисов, инструментов и даже других агентов. В случае с турагентом, таким знанием может быть информация о предпочтениях пользователя, которая хранится в базе данных.

Разные типы агентов

Теперь, когда у нас есть общее представление об ИИ-агентах, давайте рассмотрим конкретные типы агентов и то, как они могут применяться, например, в агенте по бронированию путешествий.

Простые рефлексивные агенты

Рефлексивные агенты действуют на основе внутреннего представления о мире (набор правил) и постоянно отслеживают его изменения. Пример: турагент интерпретирует контекст электронного письма и перенаправляет жалобы, связанные с путешествиями, в службу поддержки клиентов.

Модельно-рефлексивные агенты

Модельно-рефлексивные агенты действуют на основании модели мира и ее изменений. Такой агент может, например, анализировать историю цен и автоматически определять, где произошли значимые скачки цен. Это чуть более продвинутый механизм, позволяющий учитывать динамику рынка.

Целеориентированные агенты

Целеориентированные агенты умеют разрабатывать пошаговые планы для достижения конкретных целей. В отличие от более простых реактивных систем, они сначала анализируют конечную цель, а затем выстраивают оптимальную последовательность действий для ее достижения. Например, если вы говорите турагенту «Мне нужно попасть из Санкт-Петербурга в Барселону к следующему вторнику», он не просто предложит случайный билет, а продумает весь маршрут: как добраться до аэропорта (такси или аэроэкспресс 🚅), какой рейс выбрать, понадобится ли трансфер в Барселоне. При этом агент учитывает множество факторов: время прибытия, стыковки, возможные задержки и даже погодные условия, чтобы гарантировать, что вы окажетесь в пункте назначения точно в срок.

Утилитарные агенты

Утилитарные агенты принимают решения на основе тщательного анализа числовых параметров и предпочтений. В отличие от более простых систем, они способны взвешивать множество факторов и находить оптимальные компромиссы. Например, при бронировании путешествия такой агент не просто ищет самый дешевый вариант, а оценивает соотношение цены, удобства, времени в пути и других параметров, присваивая каждому определенный вес в зависимости от предпочтений пользователя

Обучающиеся агенты

Обучающиеся агенты — это как стажер, который со временем превращается в настоящего профи, постоянно учась на собственном опыте. Представьте турагента, который не просто бронирует путешествия, а ведет настоящее расследование после каждой поездки 🔍. Когда клиент жалуется на тесные сиденья в самолете или хвалит удобную стыковку, агент не просто кивает головой — он записывает эту информацию в свою базу знаний и использует ее для будущих бронирований. Такой подход позволяет агенту постоянно совершенствоваться и делать все более точные рекомендации, превращая каждую ошибку в ценный опыт для будущих решений.

Иерархические агенты

Иерархические агенты — это как слаженная корпорация, где каждый знает свою роль и место в общей структуре. Представьте ситуацию отмены сложного путешествия: главный агент-менеджер получает задачу и сразу распределяет ее между специализированными помощниками 🎯. Один агент занимается отменой авиабилетов и следит за возвратом средств, другой отменяет бронь отеля, третий разбирается с арендой автомобиля, а четвертый отвечает за перепланировку встреч в календаре. При этом все они регулярно отчитываются главному агенту, который координирует процесс и следит за тем, чтобы все действия выполнялись в правильной последовательности и без конфликтов (как опытный дирижер, только вместо оркестра — команда ИИ). Такая структура позволяет эффективно справляться со сложными задачами, разбивая их на управляемые части и обеспечивая четкий контроль над каждым этапом выполнения.

Мультиагентные системы (МАS)

Мультиагентные системы (МАS) — это как экосистема независимых профессионалов, которые могут работать как единая команда или конкурировать друг с другом за ресурсы. В кооперативном режиме это напоминает слаженную работу туристического агентства, где один агент виртуозно находит лучшие авиабилеты, другой — бронирует идеальные отели, а третий — составляет увлекательную культурную программу, причем все они синхронизируют свои действия для создания идеального путешествия 🤝. В конкурентном режиме те же агенты могут соперничать за ограниченные ресурсы, например, последние номера в популярном отеле на новогодние праздники, где каждый стремится получить бронь для своего клиента (как в «Голодных играх», только за люкс с видом на море) используя свои уникальные стратегии и преимущества для достижения цели.

Когда использовать агентов?

Открытые задачи — позволяют языковой модели (LLM) самостоятельно определять необходимые шаги для выполнения задачи, поскольку их не всегда можно жестко закодировать в рабочий процесс.
Многоэтапные процессы — задачи, требующие такого уровня сложности, при котором ИИ-агенту необходимо использовать инструменты или информацию на протяжении нескольких итераций вместо однократного получения данных.
Улучшение со временем — задачи, в которых агент может совершенствоваться со временем, получая обратную связь либо от окружающей среды, либо от пользователей, чтобы повышать свою полезность.

Основы агентных решений

Разработка агентов

Первым шагом в проектировании системы ИИ-агентов является определение инструментов, действий и поведения. В этом курсе мы фокусируемся на использовании Crew AI для определения наших агентов. Он предлагает такие возможности, как:

Возможность совместной работы агентов, их синхронное взаимодействие и распределение задач.
Автоматизацию многоступенчатых процессов и эффективное управление поручениями.
Глубокое понимание контекста и адаптацию под реальные условия и изменения.

Агентные паттерны

Коммуникация с языковыми моделями (LLM) осуществляется через промпты. Учитывая полуавтономную природу ИИ-агентов, не всегда возможно или необходимо вручную повторно отправлять промпты LLM после изменения в окружающей среде. Мы используем агентные паттерны, которые позволяют нам более масштабируемым способом отправлять промпты LLM на протяжении нескольких шагов.

Агентные фреймворки

Агентные фреймворки позволяют разработчикам реализовывать агентные паттерны через код. Эти фреймворки предлагают шаблоны, плагины и инструменты для лучшего взаимодействия ИИ-агентов. Эти преимущества обеспечивают возможности для мониторинга и отладки систем ИИ-агентов.

***

Содержание

Практикум

Создание системы автоматического перевода и редактирования текстов