Об эксперте: Денис Афанасьев, директор дивизиона b2b-продуктов Салют SberDevices.
Ключевые тренды и развитие российского рынка
— Какими были главные тренды на глобальном рынке речевых технологий по итогам 2022 года?
— На развитие рынка влияют сразу несколько трендов. Главный — голосовые роботы становятся все более эмпатичными и учатся распознавать эмоции, чтобы строить более глубокий диалог. Ведь все хотят разговаривать с человеком, а не с роботом. И, соответственно, синтезированный голос постепенно становится неотличим от голоса реального человека.
Также четко формируется тренд на голосовую индивидуализацию: компании стремятся создать свой уникальный запоминающийся голос, который будет представлять их бренд и отличаться на фоне остальных. В ответ на это развиваются и антифрод-системы, выявляющие подделку голоса и его использование для мошенничества. Сейчас в этом направлении проводятся исследования, но уже можно прогнозировать, что в ближайший год-два антифрод будет достаточно развит для внедрения реальных коммерческих кейсов.
Распознавание тоже не стоит на месте, технология совершенствуется, преодолевая такие барьеры для качественного распознавания речи, как перебивание, шум открытых пространств (торговые залы, офисы open space-формата), наложение речи, спонтанная речь нескольких дикторов и другое.
Наконец, еще неуверенно, но уже можно говорить об укреплении позиций облачных размещений. Сейчас наблюдается дефицит «железа», оно сильно подорожало, и бизнес, в свою очередь, все больше доверяет облаку.
— Российский рынок развивается по собственным законам? Или движется в глобальном русле?
— В целом, 2022 год можно назвать переломным для речевых сервисов по всему миру. Голосовыми помощниками стали пользоваться намного чаще. Все больше пользователей предпочитают голосовой поиск текстовому.
Для российского рынка самые популярные направления речевых технологий — это голосовое управление, исходящие автоматизированные обзвоны, речевая аналитика в точках контакта, то есть там, где клиент соприкасается с продуктом или бизнесом и, конечно же, голосовые ассистенты.
Думаю, что интерес к голосовым ассистентам в России в ближайшие три года вырастет кратно. Уже сейчас голосовые сервисы окружают нас буквально повсюду. Мы видим, что виртуальными ассистентами пользуются дома, в машине и общественном транспорте, на рабочем месте. При этом они непрерывно развиваются. Например, наши ассистенты Салют научились понимать даже сложные голосовые запросы в рамках управления «умным» домом вроде: «Салют, вскипяти чайник и поддерживай температуру 85°C». Распознавание мультикоманд в одном предложении — это еще один шаг вперед для интуитивно понятного взаимодействия с ассистентами.
Коммерческие сценарии использования речевых сервисов тоже активно расширяются. К ним добавились онлайн-медицина, шопинг или бронирование в сети.
Кто пользуется речевыми сервисами
— Что изменилось для российских поставщиков речевых сервисов в условиях новой экономической реальности?
— Ключевые игроки на рынке остались прежними. Но до марта 2022 года в России работали зарубежные компании, самой заметной из которых был Google. Большая их часть впоследствии покинули рынок. И вместо них пришли новые российские вендоры.
— Изменился ли как-то портрет заказчика в новых условиях?
— Основной спрос по-прежнему идет со стороны крупных игроков: до 80% заказов приходится на корпорации и верхнюю часть среднего бизнеса. В последние полтора года средний бизнес проявляет больше интереса к речевым технологиям. Однако основные вендоры и их партнеры пока еще больше сфокусированы на крупных проектах.
— Какие задачи компании хотят решить с помощью речевых сервисов?
— Наверное, самый большой блок задач связан с автоматизацией работы контакт-центров. Голосовые помощники обрабатывают огромный объем типовых входящих обращений, а также проводят обзвон клиентов. Это помогает оптимизировать расходы и освободить время операторов для решения нестандартных, более сложных вопросов, требующих участия человека.
Еще одно ключевое направление — речевая аналитика. Причем анализируется не только то, что именно произнесли оператор и клиент, но и как это было сделано, с какой интонацией прозвучала фраза. Так бизнесу удается предотвратить отток клиентов и эмоциональное выгорание операторов.
Чего ждут заказчики
— На что в первую очередь обращают внимание заказчики при выборе речевых сервисов?
— Заказчики ждут готовый продукт, решающий конкретную задачу. Например, сокращение расходов, оптимизация рутинных процессов, снижение количества претензий и штрафов, повышение уровня удовлетворенности и лояльности клиентов, эффективность работы сотрудников, улучшение коммуникации.
Опросы наших клиентов показывают, что конкретный сервис выбирают, в первую очередь, из-за репутации компании, качества и скорости распознавания речи, индивидуального подхода и легкой интеграции по API.
Сравнивая технические характеристики, заказчики обращают внимание на качество синтеза, скорость распознавания и ответа на запрос (это особенно критично для call-центров), WER (доля ошибок в словах), наличие разных языков, многоканальность и другие возможности, например, распознавание эмоций или предсказание оценки CSI (индекс, который позволяет оценить уровень удовлетворенности клиентов после взаимодействия с компанией. — РБК Тренды).
Также важную роль играет сам формат поставки решения. Я уже говорил, что мы отмечаем рост лояльности к облачным решениям. Тем не менее пока львиная доля приходится на локальные решения — те, что размещаются в контуре заказчика. Такой вид поставки по-прежнему востребован у крупных организаций, которые сами владеют масштабной IT-инфраструктурой и предпочитают хранить все данные у себя.
— Что предлагаете бизнесу вы?
— Нашу платформу синтеза и распознавания речи SaluteSpeech. Она отличается высоким качеством распознавания речи, а ее синтезированный голос почти неотличим от человеческой речи. С помощью платформы можно управлять голосом виртуального ассистента: регулировать темп речи и фоновый шум, паузы, интонации, тональность. При этом SaluteSpeech умеет слышать речь даже на фоне сильных шумов.
Все функции сервиса можно использовать в телефонии. Без специального оборудования можно подключать речевые технологии, например, в интерактивном голосовом меню, IVR автоответчике, чатах, голосовых интерфейсах взаимодействия, для озвучивания контента и команд или голосового ввода на устройствах и сайтах.
Кроме того, мы предлагаем готовые речевые сервисы, которые используют технологии платформы SaluteSpeech.
Так, наша новая технология Insights анализирует эмоции клиента и оператора по фразам, которые они произносят, автоматически классифицирует все диалоги на позитивные, нейтральные и негативные, а также определяет более 300 важных метрик речи. Например, можно определить, подстраивался ли оператор под темп речи клиента и не перебивал ли его. При этом перебивания считаются только настоящие, а не поддерживающие типа «угу».
Кроме этого, SaluteSpeech Insights позволяет компаниям анализировать удовлетворенность клиентов для 100% телефонных разговоров. Технология прогнозирует оценку CSI, которую бы поставил сам клиент, без дополнительных ожиданий на линии или сообщений с цифрами от одного до пяти. Все это повышает эффективность работы компании с лояльностью и оттоком клиентов.
Также мы предлагаем услугу YourVoice, которая позволяет бизнесу получить брендированный голос. Клиент может выбрать голос для компании из готового каталога или всего за месяц создать свой собственный. Технология синтеза позволит озвучить текст любого объема и сложности и использовать фирменный голос во всех каналах коммуникации.
Как изменится рынок
— Как будет развиваться рынок речевых технологий в ближайшие несколько лет?
— Мы видим, как на российском рынке снижается порог входа и растет конкуренция. На мой взгляд это очень хороший знак, потому что здоровая конкуренция — важный драйвер для дальнейшего развития.
Также можно отметить создание упрощенных no-code продуктов с максимально простой интеграцией. Это значит, что выигрывать будет тот, кто предложит рынку конкретные удобные решения, которые быстро внедряются в бизнес-процессы и просты в использовании.
Кроме того, на рынке уже накопился убедительный опыт в виде апробированных кейсов, получены хорошие результаты, и у бизнеса созрело доверие к технологиям. В результате спрос вышел на стадию, на которой речевые технологии начинают активно внедрять и использовать.
В то же время, стоимость их внедрения снижается. Думаю, что на горизонте трех-пяти лет средний и малый бизнес займет свое место в качестве значимого заказчика. Но опять-таки для этого продукты и сервисы на базе речевых технологий должны стать легкими и недорогими для внедрения и эксплуатации.
И, конечно же, в будущем расширится перечень решений. Особенно для использования в рабочих процессах. Думаю, что вскоре мы увидим голосовых автосекретарей и супервайзеров, помощников и аватаров бизнеса. Массовые кейсы начнут появляться с внедрением протоколирования совещаний, когда по итогам встречи можно будет получить готовый текст с разделением всех участников по репликам и автоматическим подведением итогов.
Реклама, ООО «САЛЮТДЕВАЙСЫ», ЕРИР токен 4CQwVszH9pSXMEKKQ9P