Что ИИ может узнать по голосу
Несколько лет назад в США специалисты по искусственному интеллекту создали программу, которая способна по голосу выявлять посттравматическое стрессовое расстройство (ПТСР). Точность постановки диагноза превысила 89%, сообщал тогда журнал Depression and Anxiety.
В исследовании участвовали ветераны конфликтов в Ираке и Афганистане с диагнозом ПТСР и группа бывших военных, у которых не обнаружили такого расстройства. Программа изучала их речь, разбирая каждое слово и анализируя частоту, ритм, тон и артикуляционные характеристики. Исходя из этой информации она делала вывод о состоянии говорящего, в том числе о его эмоциях, самочувствии и психологическом здоровье.
Но возможности ИИ по анализу речи можно использовать не только в медицинских или исследовательских целях. С момента проведения исследования с участием американских ветеранов речевая аналитика успела стать полноценным бизнес-инструментом. Глобальный рынок таких решений в 2020 году оценивался в $1,5 млрд.
Один из самых быстрорастущих сегментов — анализ разговоров клиентов с операторами call-центров. В 2022 году на такие продукты компании потратят столько же, сколько сейчас платят за всю речевую аналитику — около в $1,5 млрд.
Почему растет сектор речевой аналитики
На развитие рынка влияют несколько трендов.
- Анализ речи становится все более точным благодаря резкому скачку в сфере искусственного интеллекта, машинного обучения и технологий обработки естественного языка.
- Растет спрос на мониторинг производительности сотрудников. Этот тренд стал особенно заметен после массового перехода на удаленку.
- Бизнес учится извлекать ценные данные из речи человека с помощью последних разработок из области психолингвистики и искусственного интеллекта.
Как ИИ и технологии машинного обучения работают в call-центре
«Пандемия разрушила барьеры на пути к инновациям, которые десятилетиями блокировали прогресс в индустрии контакт-центров», — отмечают отраслевые аналитики в отчете, опубликованном MarketsandMarkets. Теперь эти центры могут стать более эффективными и заботливыми с помощью речевого ИИ, который слушает звонки клиентов.
«Сервис для анализа эмоциональной окраски разговоров изучает звонки и сам находит записи, которые отличаются излишней эмоциональностью. Те участки, где клиент разговаривает с оператором на повышенных тонах, система помечает красным. Спорные участки окрашиваются в желтый. Их появление может быть связано с громким голосом клиента или экспрессивной манерой общения», — описывают алгоритм работы своего речевого сервиса в «МегаФоне».
В августе 2021 года компания запустила решение «Разговор на повышенных тонах». Оно интегрировано в «Виртуальную АТС» — сервис «умной» телефонии для малого и среднего бизнеса.
Система, обученная на 30 тыс. разговоров общей длительностью 750 часов, умеет считывать человеческие эмоции. Причем ориентируется она не на громкость речи, которая не всегда сигнализирует о конфликтной ситуации, а на изменение тональности разговора. Алгоритмы машинного обучения оценивают колебания звуковой волны с помощью спектрального анализа звуковых файлов.
Менеджер контакт-центра, в котором используется такой сервис, может прослушать отобранные записи, оценить работу оператора и при необходимости доработать скрипты.
В небольших компаниях записи часто прослушивает руководство, и сервис значительно сэкономит время, которое на это тратится: в фокус попадают только разговоры, требующие внимания. Если на сотрудника поступила жалоба от клиента, не придется слушать разговор целиком — можно сосредоточиться на конфликтном участке.
По словам представителей «МегаФона», компания планирует и дальше развивать сервис, чтобы система распознавала полутона человеческой речи еще точнее. Она будет постоянно обучаться на новых датасетах записей бесед и обратной связи от клиентов. Оператор также хочет расширять возможности по интерпретации полученных данных.
Какие возможности дает аналитика
К 2025 году мировой рынок речевой аналитики вырастет более чем в 2,5 раза. В России прогнозируют стремительное развитие всего рынка «разговорного» ИИ, включая голосовую аналитику. Через четыре года он увеличится с нынешних $76 млн до $561 млн, ожидает Just AI.
Этот рост опирается на целый ряд возможностей, которые дает бизнесу новый инструмент.
- Проследить опыт потребителя
Сочетание технологий разговорного ИИ, анализа текста и данных из различных цифровых каналов обеспечивает всестороннее понимание пути клиента к продукту или покупке, пишут специалисты Mordor Intelligence.
В качестве примера они приводят сервис Medallia Speech, который позволяет отслеживать впечатления клиентов в реальном времени на единой платформе. Сервис анализирует отклики клиентов по всем возможным каналам — голосовым, текстовым, видео — и умеет считывать эмоции.
- Обрадовать клиента
Результаты исследования Oracle свидетельствуют, что 9 из 10 клиентов меняют бренд в первую очередь из-за плохого опыта взаимодействия. 86% потребителей готовы платить больше ради качественного обслуживания.
Разговорный ИИ дает возможность анализировать тон голоса, паузы и громкость речи. В итоге бизнес лучше понимает намерения и мотивацию потребителей.
- Обучить персонал и поднять качество обслуживания
По данным LiveVox, 98% взаимодействий с call-центрами остаются неконтролируемыми и непроверенными. Речевая аналитика позволяет расшифровать и оценить 100% звонков.
Благодаря технологиям на базе ИИ компания может точно узнать, с чем операторы не справляются. На основании этих данных можно разработать стратегию обучения персонала, чтобы обеспечить стабильное качество обслуживания.
- Повысить вовлеченность сотрудников
Хорошая работа должна быть справедливо оценена и вознаграждена, добавляют в LiveVox. Использование речевой аналитики вселяет в сотрудников спокойствие и уверенность в том, что компания оценивает их усилия быстро и объективно. А это благотворно сказывается на уровне вовлеченности персонала.
Кроме того, менеджерам больше не нужно тратить время на анализ звонков в ручном режиме, их ресурсы можно перенаправить на более творческие задачи.
- Сократить издержки
Речевая аналитика поможет бизнесу улучшить результаты за счет роста производительности и снижения издержек, отмечают в Velvetech. Так, на основе накопленных данных компания будет лучше управлять расходами фронт-офиса.
Разговорный ИИ также полезен при оценке спроса на определенные товары и услуги. Он позволяет понять, когда продукт можно снимать с продажи или, напротив, когда его лучше продвигать. «При правильном использовании речевая аналитика обычно окупается за три-девять месяцев», — говорит Донна Флюсс из DMG Consulting.
Аналитики Gartner указывают, что хайп вокруг технологий речевой аналитики постепенно сходит на нет. Время, когда ожидания от технологии завышены, а перспективы ее внедрения до конца ясны, остается в прошлом.
По их мнению, на горизонте от двух до пяти лет разговорный ИИ выйдет на плато продуктивности. Здесь риски для крупного бизнеса минимальны, но выгода от использования высока. А следом за корпорациями новый инструмент массово освоят малые и средние компании.