
Об эксперте: Александр Крушинский, директор департамента голосовых цифровых технологий компании BSS.
Размер рынка
Российский рынок диалогового искусственного интеллекта (ИИ) с 2019 по 2023 год вырос в четыре раза, а по итогам 2024 года должен был увеличиться еще на 25% и превысить 7,45 млрд руб., свидетельствуют данные исследования Naumen.
Основной функционал голосовых и текстовых помощников — общение с пользователями. Как показывает опыт BSS, робот полностью самостоятельно обслуживает клиента в 30–70% случаев в зависимости от отрасли и темы обращения. Например, голосовой бот на линии тульского Минздрава ведет общение с клиентом от начала и до конца в 70% случаях, голосовой помощник в Промсвязьбанке полностью отвечает на обращения в 64% случаях, робот оператора цифрового телевидения «Триколора» — в 55% случаях, голосовой помощник на различных линиях Мособласти — от 25 до 85%. Такая высокая доля объясняется улучшением качества взаимодействия роботов с клиентами за счет развития речевых технологий на основе ИИ.
Однако если раньше считалось, что голосовые помощники со временем вытеснят текстовых ботов, то теперь очевидно, что эти роботы продолжат существовать вместе. Все дело в пользователях: разные категории клиентов отдают предпочтение разным ботам в разных ситуациях. Поэтому для эффективного использования ИИ-помощников лучше предлагать оба канала связи.
При этом они должны взаимодействовать омниканально. То есть процесс общения клиента с компанией необходимо выстроить таким образом, чтобы при переходе пользователя из одного канала в другой не терялась история обращения и представитель поддержки понимал, на какой стадии сейчас находится запрос без объяснений клиента.
От чего зависит выбор клиентов
Возраст. Голосовые каналы чаще предпочитают пожилые люди. По данным компании BSS, пользователи старше 55 лет в два раза чаще используют голосовые каналы, чем текстовые. Миллениалы и поколение Z, наоборот, используют текстовые мессенджеры на 30% чаще, чем телефонные звонки.
Комфорт. Более 60% пользователей выбирают голосовой канал для решения сложных и срочных задач, так как этот способ связи представляется им более оперативным и надежным. Для повышения доверия голосовые роботы научились создавать ощущение эмоциональной поддержки с помощью тона, интонаций и скорости речи.
Однако текстовые боты увеличили частоту обращений клиентов по рутинным вопросам. Ранее при наличии только голосовой связи большая доля пользователей избегала контактов, так как испытывала дискомфорт при живом общении, а при появлении текстового канала люди начали им активно пользоваться. В этом случае он удобнее, так как информация фиксируется в текстовом виде и написать в чат можно в любое время. Активными пользователями чат-ботов являются почти три четверти россиян, показало исследование «VK мессенджера».
Как используются речевые помощники
По данным исследования, чат-ботов активнее других сфер внедряют ретейл (42% компаний) и банки (27%). Голосовым помощникам отдают предпочтение также банки (21%) и медицинские организации (50%).
Опыт BSS показывает, что в банках, страховых компаниях и ретейле, где в основном обслуживается средневозрастной контингент, востребованы оба канала клиентской поддержки. Например, в Промсвязьбанке реализован процесс оплаты по счету с автоматическим заполнением реквизитов. Все, что нужно клиенту, — это отсканировать счет и прикрепить PDF-файл к сообщению. Такой функционал удобно встроить в чат-бот и совсем невозможно предоставить в голосовом канале. Поэтому клиенты выбирают звонок для решения срочных вопросов, а текст — для подробных обращений.
Другой опыт использования речевых ботов мы наблюдаем в медицинской сфере и государственных структурах, таких как «Госуслуги» и Социальный фонд России (СФР). В этих организациях преобладает использование голосовых ботов. Основные пользователи СФР — это пожилые люди, для которых удобны только звонки. «Госуслугами» пользуются все категории клиентов, но и там процесс перехода из голоса в текст идет с трудом. Несмотря на то что у «Госуслуг» есть текстовый помощник «Макс», пользователи предпочитают решать вопросы с помощью привычного голоса, так как это быстрее и проще. В клиентские поддержки поликлиник и других медучреждений обращается очень много молодых матерей. Они умеют пользоваться мессенджерами, но с маленькими детьми это неудобно, поэтому предпочтение также отдается голосу. Однако для обратной коммуникации со стороны учреждения, например, чтобы подтвердить прием, лучше использовать текстовое сообщение, чтобы не беспокоить клиентов звонком.
Какие особенности помощников нужно учитывать
Голосовые и текстовые помощники отличаются друг от друга своей функциональностью, поэтому для эффективного внедрения и использования важно учитывать их различия.
Адаптация реплик. Ответ робота должен отличаться в голосовом и текстовом виде. Например, голосовые помощники должны использовать короткие реплики, а чат-боты могут предоставлять подробную информацию, которую удобно воспринимать только в текстовом виде. При выстраивании коммуникаций нужно учитывать функциональные особенности мессенджеров. Так, в Telegram есть кнопки, с помощью которых можно дозированно отвечать на вопросы клиентов и сортировать информацию. В WhatsApp такой возможности нет, поэтому там важно сразу предоставить объемный и структурированный ответ.
Доступность канала связи. В этом аспекте больше преимуществ у голосовых помощников, так как к звонкам привыкли все, и этот процесс интуитивно понятен даже самым технологически неподкованным пользователям — достаточно набрать номер на телефоне. Продвигать чат-боты сложнее, так как в этом случае нет универсального способа связи. Поэтому задействуются все доступные мессенджеры, чтобы клиентам было удобно выбрать тот канал, которым они привыкли пользоваться без установки дополнительных приложений.
Автоматизация общения и скорость. Высокий уровень автоматизации в общении достигается путем использования больших языковых моделей (LLM, Large Language Models), но эта технология влияет на скорость общения, и ее предпочтительнее использовать в чат-ботах. LLM обрабатывает информацию с задержкой, чтобы подготовить информативный ответ. При голосовом общении это заметно и может раздражать клиента, тогда как в текстовом виде медленный ответ воспринимается как допустимый.
Сейчас эта проблема начала решаться — на рынке уже появились примеры, когда голосовой робот начинает зачитывать ответ LLM до того, как он окончательно составлен. Но процесс автоматизации в голосовом формате более сложный и дорогой: робот должен уметь отвечать короткими репликами и без задержек. Это устанавливает высокие требования для аппаратного обеспечения, способного выдерживать нагрузки.
Поэтому чат-боты автоматизировать проще. Текстовый помощник может в одном сообщении отправить всю необходимую информацию и прикрепить к ней ссылки, файлы или картинки. При голосовом же обращении для решения задачи может потребоваться переход с робота на оператора.
Стоимость обслуживания. Это еще один отличительный фактор, который вытекает из скорости и автоматизации общения. Если робот не может самостоятельно обработать обращение клиента, то он привлекает живого специалиста. В этом случае обслуживание текстовых каналов обходится дешевле, так как из-за допустимой паузы в общении можно задействовать меньшее число операторов. Голосовой формат требует большего числа специалистов, так как один оператор может общаться строго только с одним клиентом, не переключаясь между чатами.
Интеграция. Перевести пользователя из голосового канала в текстовый можно с помощью удобного объединения двух каналов связи. Например, если человек обращается на телефонную линию, то оператор или робот может перевести общение в текст, предложив отправить в сообщении документы или расширенную информацию. Такой омниканальный подход будет дешевле для компании, а клиенты получат подробный ответ на свой вопрос без дискомфорта.
Будущее речевых помощников
Рынок речевых помощников продолжит расти. По прогнозам аналитиков, мировой рынок голосовых помощников с 2023 по 2033 год увеличится на 31% и превысит $54,8 млрд, а глобальный рынок чат-ботов будет расти в среднем на 24% в течение 2024–2029 гг. и составит $20,8 млрд.
Голосовые и текстовые помощники продолжат развиваться вместе, так как их выбор зависит от предпочтений пользователей. Звонок чаще выбирают пожилые клиенты и пользователи, которым нужно срочно решить вопрос, в то время как чат-боты лучше подходят для обработки рутинных запросов, где важна подробная информация.
Также внедрение текстовых каналов дешевле для бизнеса и позволяет достичь более высокого уровня автоматизации — он выше в полтора-два раза, чем у голосовых помощников. Поэтому омниканальная интеграция голосового и текстового общения поможет снизить расходы и улучшить клиентский опыт.
В последние годы чат-боты и голосовые помощники развиваются под влиянием генеративного искусственного интеллекта и LLM. Согласно исследованию, использование генеративного ИИ дает бизнесу два ключевых преимущества: увеличивает производительность труда и создает новый пользовательский опыт. По оценкам Gartner, к 2025 году около 80% компаний с клиентской поддержкой внедрят генеративный ИИ для повышения продуктивности и улучшения клиентского опыта. Российский рынок отстает от мирового на два-три года, но также развивается в сторону этих показателей. В настоящее время отечественный рынок уже обладает инженерными инструментами для внедрения данных технологий, и сейчас главная цель у компаний — сформировать понимание того, где и как использовать технологию, чтобы получить эффективные результаты.