
Содержание:
Аналитики Grand View Research ожидают, что объем мирового рынка ИИ-агентов будет расти на 45% до 2030 года и достигнет $70,5 млрд. Такие решения не только ускорят автоматизацию, но и предложат гиперперсонализированный клиентский опыт, а также позволят обычным пользователям делегировать ИИ-помощникам рутинные задачи. «РБК Тренды» выяснили, как устроены ИИ-агенты и почему в будущем они смогут трансформироваться в сверхинтеллект.
Что такое ИИ-агент
ИИ-агенты — это автономные интеллектуальные системы, которые могут взаимодействовать с внешней средой, принимать решения и предпринимать действия без вмешательства человека. Такие агенты создаются с помощью специальных конструкторов на основе машинного обучения и обработки естественного языка (NLP). Они способны выполнять простые рутинные задачи, решать более сложные, а также поддерживать режим многозадачности. Отличие ИИ-агентов от традиционных систем ИИ заключается в том, что они могут постоянно улучшать свою производительность посредством самообучения.
Несмотря на кажущуюся новизну этого термина, направление ИИ-агентов начало развиваться одновременно с первыми разработками в области искусственного интеллекта — в 1950-е. В эту эпоху пионер в области машинного обучения Артур Сэмюэл разработал одну из самых ранних программ, способных к самостоятельному обучению — электронного игрока в шашки.
В 1960-х и 1970-х появился первый разговорный ИИ Eliza, а также экспертные системы, подобные DENDRAL, которые демонстрировали способность ИИ копировать человеческий опыт. Однако тогда технические ограничения привели к прекращению разработок и периоду «зимы ИИ». В 1980-х и 1990-х с разработкой более продвинутых методов машинного обучения стали возникать новые ИИ-системы, вроде Deep Blue от IBM, которая обыграла чемпиона мира по шахматам Гарри Каспарова в 1996 году. К началу 2000-х достижения в области вычислительной мощности способствовали росту глубокого обучения, а виртуальные помощники, такие как Siri, продемонстрировали полезность ИИ для потребителей. В 2010-х стали развиваться агентные системы на базе обучения с подкреплением и генеративные модели, такие как GPT-2. Современные агенты, в том числе ChatGPT, могут поддерживать беседу и решать рабочие вопросы, а также принимать решения.
Компоненты ИИ-агентов
Агенты ИИ различаются по реализации, но, как правило, включают пять основных компонентов:
- Агентно-ориентированные интерфейсы, включая протоколы и API (аппаратно-программные интерфейсы). Они используются для подключения агентов к пользователям, базам данных, датчикам и другим системам.
- Модуль памяти. Он включает как кратковременную память для запоминания недавних взаимодействий, так и долговременную — для пополнения базы знаний.
- Модуль профиля. Он определяет атрибуты агента, в том числе его роль, цели и поведенческие модели.
- Модуль планирования. Он обычно использует большую или малую языковую модель для составления планов действий.
- Модуль действий. Он включает API и системные интеграции, которые определяют широту действий, доступных агенту.

Как работают ИИ-агенты
Агенты ИИ используют большие языковые модели для планирования и получают доступ к подключенным системам для выполнения действий и достижения целей. Вот как это работает:
- восприятие — агенты ИИ постоянно собирают и обрабатывают информацию из своей среды, включая взаимодействия с пользователем, ключевые показатели производительности или данные датчиков;
- рассуждение — используя большие языковые модели, агенты автономно оценивают и расставляют приоритеты действий на основе своего понимания проблемы, а также целей, которые необходимо достичь, контекста и других параметров;
- действие — агенты используют интерфейсы, интегрированные с корпоративными системами, инструментами и источниками данных, для выполнения задач. Эти задачи прописаны в плане, который составляет большая или малая языковая модель. Для выполнения задач агент получает доступ к корпоративным службам (таким как системы управления персоналом, системы управления заказами или CRM), а затем может делегировать действия другим агентским системам или запрашивать у пользователя разъяснения.

Последние агенты опираются также на поисковую дополненную генерацию (RAG), которая позволяют им обращаться за данными к внешним источникам, в том числе с помощью интернета.

Этот цикл «восприятие-рассуждение-действие» считается самоподдерживающимся, поскольку инструменты агентов ИИ постоянно анализируют изменения, основываясь на прошлых взаимодействиях, и учатся на них, чтобы становиться более эффективными и результативными.
Виды ИИ-агентов
Существуют различные классификации типов ИИ-агентов. Они обычно включают от пяти до семи этапов эволюции агентных систем. Одна из классификаций выглядит так:
- Реактивные агенты. Этот тип действует исключительно в данный момент, не хранит воспоминания и не учится на прошлом опыте, а также следует предопределенным правилам.
- Агенты, специализирующиеся на задачах. Они обучаются на данных в довольно узких областях, часто превосходя людей при решении определенных задач и помогая в работе экспертам.
- Контекстно-зависимые агенты. Они способны обрабатывать динамические сценарии, учитывая контекст, и синтезировать различные сложные данные.
- Социально подкованные агенты. Эти системы понимают и интерпретируют человеческие эмоции, убеждения и намерения, обеспечивая более эмпатическую обратную связь.
- Саморефлексивные агенты. Эти системы будут способны к самосовершенствованию, так как смогут анализировать собственные процессы принятия решений и улучшать свои алгоритмы автономно;
- агенты обобщенного интеллекта. По сути, это AGI (общий искусственный интеллект), который способен мыслить на уровне человека.
- Сверхразумные агенты. Эта гипотетическая система будет способна превзойти человеческий интеллект во всех областях, что приведет к прорывам в науке, экономике и управлении. Идея суперинтеллекта принадлежит философом Нику Бострому, однако развитие такой технологии, вероятно, потребует внедрения квантовых вычислений.
Другие эксперты условно делят ИИ-агентов на пять уровней автономности — от простых агентов уровня L1 до полностью автономного уровня L5. Они относят уже существующие решения, в том числе ChatGPT от OpenAI и Gemini от Google, к уровню L1. Недавно представленный OpenAI ИИ-агент Operator условно можно отнести к L2, так как он, помимо выполнения задач, способен также самостоятельно действовать и принимать решения.

Как создать ИИ-агента
Разработчики советуют разбить работу над ИИ-агентом на несколько этапов:
- Определить цель и область действия агента. Для этого нужно перечислить проблемы и задачи, которые он должен решать. Затем нужно очертить целевую аудиторию и ее специфику.
- Выбрать инструменты. Они должны включать среду разработки (набор программ для создания кода), фреймворк ИИ (готовую архитектуру модели, например, TensorFlow или Pytorch), API языковой модели (аппаратно-программный интерфейс, например GPT-4 от OpenAI).
- Подготовить данные для обучения. Они могут включать текстовые стенограммы (журналы чатов, тикетов поддержки или электронных писем), голосовые записи, журналы взаимодействия (данные о работе схожих ручных систем) и многое другое. Также потребуется составить на базе этих данных примеры для обучения.
- Провести тренировку агента ИИ на базе своих примеров.
- Протестировать работу агента. После пробного запуска на специально отобранных задачах можно проверить, как работают отдельные компоненты агента и пригласить к его испытаниям реальных пользователей.
- Запустить агента ИИ. Для начала нужно выбрать платформу — веб-сайт, мобильное приложение или голосовой интерфейс. Затем потребуется встроить код агента напрямую или через API. Последним этапом станет настройка обратной связи от пользователей и собственных систем мониторинга.
Существуют проекты, которые предлагают уже готовые среды разработки, а также инструменты развертывания и интеграции ИИ-агентов.
Кроме того, появляются платформы, которые позволяют создавать ИИ-агентов пользователям без навыков программирования. Например, OpenAI предлагает инструмент GPT Builder для создания ИИ-агентов на базе ChatGPT. Для этого достаточно начать беседу с чат-ботом, где ему нужно предоставить инструкции и дать обучающую информацию. Например, можно попросить ChatGPT «создать инженера-программиста, который поможет форматировать код». После этого нужно выбрать название для своего агента, задать его описание, а во вкладке «Настроить» выбрать требуемые действия, например просмотр веб-страниц или создание изображений.

Примеры ИИ-агентов
Первой компанией, которая выпустила автономного агента, стала Antropic. Осенью 2024 года она представила версию своей модели Claude 3.5 Sonnet. Агент способен видеть экран и работать как в Интернете, так и в приложениях для ПК, совершая нажатия клавиш, перемещая курсор и выполняя клики. Разработку компании уже внедряют такие платформы, как Replit, которая использует Claude 3.5 Sonnet для помощи в автономной разработке приложений Replit Agent.

В декабре 2024 года Google презентовало целое семейство ИИ-агентов. Project Mariner функционирует как экспериментальное расширение Chrome для работы только в активной вкладке браузера. Jules предназначен для разработчиков и позволяет им отлаживать рабочие процессы в GitHub. Наконец, Project Astra работает как универсальный помощник, который способен поддерживать разговоры на разных языках и запоминать контекст. Его внедрят в поисковик Google, а также сервисы Lens и Maps.

В январе 2025 года OpenAI представила первого полностью автономного пользовательского ИИ-агента Operator, который способен выполнять многошаговые задачи на компьютере от имени пользователя. Его интерфейс напоминает ChatGPT: достаточно ввести запрос с описанием, какие действия нужно выполнить на веб‑сайтах, как агент начинает осуществлять их в реальном времени. Operator использует визуальный анализ страниц в Интернете и посылает сигналы для нажатий клавиатуры, щелчков и перемещений мыши. ИИ-агент в виде предварительной исследовательской версии доступен для подписчиков тарифного плана ChatGPT Pro за $200 в месяц.

Его уже протестировали на разных задачах, например, по поиску подходящих вакансий, более выгодных интернет-тарифов и рассылки сообщений. Однако пока не со всеми из них ИИ-агент справляется успешно.
➤ Подписывайтесь на телеграм-канал «РБК Трендов» — будьте в курсе последних тенденций в науке, бизнесе, обществе и технологиях.