Поймать полутона: как искусственный интеллект распознает эмоции в речи

Фото: Pexels
Фото: Pexels
В течение двух-пяти лет бизнес начнет массово использовать речевую аналитику, ожидают аналитики Gartner. Разбираемся, зачем эта технология нужна компаниям и как ИИ отличает шумных клиентов от несчастных

Что ИИ может узнать по голосу

Несколько лет назад в США специалисты по искусственному интеллекту создали программу, которая способна по голосу выявлять посттравматическое стрессовое расстройство (ПТСР). Точность постановки диагноза превысила 89%, сообщал тогда журнал Depression and Anxiety.

В исследовании участвовали ветераны конфликтов в Ираке и Афганистане с диагнозом ПТСР и группа бывших военных, у которых не обнаружили такого расстройства. Программа изучала их речь, разбирая каждое слово и анализируя частоту, ритм, тон и артикуляционные характеристики. Исходя из этой информации она делала вывод о состоянии говорящего, в том числе о его эмоциях, самочувствии и психологическом здоровье.

Но возможности ИИ по анализу речи можно использовать не только в медицинских или исследовательских целях. С момента проведения исследования с участием американских ветеранов речевая аналитика успела стать полноценным бизнес-инструментом. Глобальный рынок таких решений в 2020 году оценивался в $1,5 млрд.

Один из самых быстрорастущих сегментов — анализ разговоров клиентов с операторами call-центров. В 2022 году на такие продукты компании потратят столько же, сколько сейчас платят за всю речевую аналитику — около в $1,5 млрд.

Почему растет сектор речевой аналитики

На развитие рынка влияют несколько трендов.

  • Анализ речи становится все более точным благодаря резкому скачку в сфере искусственного интеллекта, машинного обучения и технологий обработки естественного языка.
  • Растет спрос на мониторинг производительности сотрудников. Этот тренд стал особенно заметен после массового перехода на удаленку.
  • Бизнес учится извлекать ценные данные из речи человека с помощью последних разработок из области психолингвистики и искусственного интеллекта.

Как ИИ и технологии машинного обучения работают в call-центре

«Пандемия разрушила барьеры на пути к инновациям, которые десятилетиями блокировали прогресс в индустрии контакт-центров», — отмечают отраслевые аналитики в отчете, опубликованном MarketsandMarkets. Теперь эти центры могут стать более эффективными и заботливыми с помощью речевого ИИ, который слушает звонки клиентов.

Экономика инноваций Эмоциональный робот: как стартап меняет отрасль клиентских коммуникаций

«Сервис для анализа эмоциональной окраски разговоров изучает звонки и сам находит записи, которые отличаются излишней эмоциональностью. Те участки, где клиент разговаривает с оператором на повышенных тонах, система помечает красным. Спорные участки окрашиваются в желтый. Их появление может быть связано с громким голосом клиента или экспрессивной манерой общения», — описывают алгоритм работы своего речевого сервиса в «МегаФоне».

В августе 2021 года компания запустила решение «Разговор на повышенных тонах». Оно интегрировано в «Виртуальную АТС» — сервис «умной» телефонии для малого и среднего бизнеса.

Система, обученная на 30 тыс. разговоров общей длительностью 750 часов, умеет считывать человеческие эмоции. Причем ориентируется она не на громкость речи, которая не всегда сигнализирует о конфликтной ситуации, а на изменение тональности разговора. Алгоритмы машинного обучения оценивают колебания звуковой волны с помощью спектрального анализа звуковых файлов.

Менеджер контакт-центра, в котором используется такой сервис, может прослушать отобранные записи, оценить работу оператора и при необходимости доработать скрипты.

В небольших компаниях записи часто прослушивает руководство, и сервис значительно сэкономит время, которое на это тратится: в фокус попадают только разговоры, требующие внимания. Если на сотрудника поступила жалоба от клиента, не придется слушать разговор целиком — можно сосредоточиться на конфликтном участке.

По словам представителей «МегаФона», компания планирует и дальше развивать сервис, чтобы система распознавала полутона человеческой речи еще точнее. Она будет постоянно обучаться на новых датасетах записей бесед и обратной связи от клиентов. Оператор также хочет расширять возможности по интерпретации полученных данных.

Какие возможности дает аналитика

К 2025 году мировой рынок речевой аналитики вырастет более чем в 2,5 раза. В России прогнозируют стремительное развитие всего рынка «разговорного» ИИ, включая голосовую аналитику. Через четыре года он увеличится с нынешних $76 млн до $561 млн, ожидает Just AI.

Фото:Shutterstock
Индустрия 4.0 Как языковые исследования помогают развиваться голосовым помощникам

Этот рост опирается на целый ряд возможностей, которые дает бизнесу новый инструмент.

  • Проследить опыт потребителя

Сочетание технологий разговорного ИИ, анализа текста и данных из различных цифровых каналов обеспечивает всестороннее понимание пути клиента к продукту или покупке, пишут специалисты Mordor Intelligence.

В качестве примера они приводят сервис Medallia Speech, который позволяет отслеживать впечатления клиентов в реальном времени на единой платформе. Сервис анализирует отклики клиентов по всем возможным каналам — голосовым, текстовым, видео — и умеет считывать эмоции.

  • Обрадовать клиента

Результаты исследования Oracle свидетельствуют, что 9 из 10 клиентов меняют бренд в первую очередь из-за плохого опыта взаимодействия. 86% потребителей готовы платить больше ради качественного обслуживания.

Разговорный ИИ дает возможность анализировать тон голоса, паузы и громкость речи. В итоге бизнес лучше понимает намерения и мотивацию потребителей.

Фото:РБК Тренды
Экономика инноваций Как работают голосовые помощники: подкаст РБК Тренды

  • Обучить персонал и поднять качество обслуживания

По данным LiveVox, 98% взаимодействий с call-центрами остаются неконтролируемыми и непроверенными. Речевая аналитика позволяет расшифровать и оценить 100% звонков.

Благодаря технологиям на базе ИИ компания может точно узнать, с чем операторы не справляются. На основании этих данных можно разработать стратегию обучения персонала, чтобы обеспечить стабильное качество обслуживания.

  • Повысить вовлеченность сотрудников

Хорошая работа должна быть справедливо оценена и вознаграждена, добавляют в LiveVox. Использование речевой аналитики вселяет в сотрудников спокойствие и уверенность в том, что компания оценивает их усилия быстро и объективно. А это благотворно сказывается на уровне вовлеченности персонала.

Кроме того, менеджерам больше не нужно тратить время на анализ звонков в ручном режиме, их ресурсы можно перенаправить на более творческие задачи.

  • Сократить издержки

Речевая аналитика поможет бизнесу улучшить результаты за счет роста производительности и снижения издержек, отмечают в Velvetech. Так, на основе накопленных данных компания будет лучше управлять расходами фронт-офиса.

Разговорный ИИ также полезен при оценке спроса на определенные товары и услуги. Он позволяет понять, когда продукт можно снимать с продажи или, напротив, когда его лучше продвигать. «При правильном использовании речевая аналитика обычно окупается за три-девять месяцев», — говорит Донна Флюсс из DMG Consulting.

Аналитики Gartner указывают, что хайп вокруг технологий речевой аналитики постепенно сходит на нет. Время, когда ожидания от технологии завышены, а перспективы ее внедрения до конца ясны, остается в прошлом.

По их мнению, на горизонте от двух до пяти лет разговорный ИИ выйдет на плато продуктивности. Здесь риски для крупного бизнеса минимальны, но выгода от использования высока. А следом за корпорациями новый инструмент массово освоят малые и средние компании.

Обновлено 18.10.2021
Главная Лента Подписаться Поделиться
Закрыть