Голос, пол и характер: как придумывают личность виртуальным ассистентам

Фото: из личного архива

Современные голосовые помощники все больше напоминают человека. Как виртуальных ассистентов наделяют чертами характера и чем это помогает бизнесу?

Об эксперте: Игорь Калинин, основатель компании TWIN.

Цифровое доверие

Более 3 млрд людей регулярно обращаются к голосовым ассистентам — одним только Google Assistant пользуются 500 млн человек. Siri, Alexa, Bixby, «Алиса», а также тысячи других помощников и сервисных ботов за последние 5-10 лет проделали огромный путь. Синтетические голоса и предписанные однообразные скрипты остаются в прошлом — на передний план выходят живые диалоги, вариативные сценарии и более развитые алгоритмы синтеза и распознавания речи.

ИТ-гиганты вкладывают в голосовых помощников миллиарды долларов. А компании готовы тратить миллионы ежемесячно на развитие и совершенствование смарт-систем для общения с клиентами — довольствоваться базовыми настройками они уже не хотят. Современный голосовой ассистент — неважно, в b2b- или b2c-сегменте — это максимально реалистичная симуляция собеседника, с неподдельными интонациями, вариативностью, а главное, набором уникальных черт.

Личностными характеристиками в последние годы стали наделять даже обслуживающих ботов, которые решают задачи бизнеса. Конечно, они не пытаются шутить или рассказывать сказки, как Siri, но могут проявлять эмпатию или, наоборот, твердость. Для работы над скриптами привлекают психологов, лингвистов, сторителлеров и профессиональных сценаристов, а ассистентов все чаще наделяют именами, узнаваемым голосом, а иногда и визуальным образом.

Индустрия 4.0 Нейросеть научилась моделировать сверхреалистичные теннисные матчи

Но зачем это брендам?

Персонализированный сервис помогает отстроиться от конкурентов и получить преимущество на рынке;
большинство компаний использует ботов как инструмент для продажи других товаров и услуг, поэтому важно создать продукт, к которому пользователи захотят возвращаться снова и снова;
Самый важный фактор — это доверие. Бот с именем вызывает больше доверия, чем условный «Виртуальный ассистент». А если он умеет шутить, обладает собственными предпочтениями (пусть даже мнимыми), это помогает наладить дружескую связь между клиентом и компанией. Исследования показывают, что пользователи, которые видят в боте черты человека, обычно больше удовлетворены сервисом;
Голосовые помощники — это одна из самых очевидных и доступных форм ИИ, с которой взаимодействуют пользователи. Робот, который реалистично имитирует речь человека, располагает к себе пользователя. Мы убедились в этом на своем опыте при создании ботов для бизнеса. Оказалось, что лучшая стратегия разработки — это использование готовых сценариев, например, успешных диалогов между реальным оператором и человеком. Наша задача — разметить референсный диалог и превратить его в набор данных для обучения нейросети. Такой метод позволяет создавать правдоподобных сервисных ботов для любой индустрии — от банкинга до логистики.

Элементы личности бота

Имя

Людям сложно коммуницировать с обезличенными собеседниками: клиенты хотят представлять, с кем именно общаются, тем более если ведут диалог по телефону или в мессенджере. В случае с ботами имя запоминается лучше, чем абстрактный номер или код. Имя становится синонимом бренда и в то же время создает иллюзию дружеского общения — это повышает восприимчивость. Люди часто вешают трубку, когда понимают, что общаются с обезличенным ботом. У помощника, который представляется, больше шансов быть услышанным.

Для бизнеса ИИ — это такой же сотрудник компании, только виртуальный, поэтому он должен обладать именем. Например, мы разрабатывали помощницу для цифрового офиса СК УРАЛСИБ Страхование. Ее задача — напоминать о выплатах и выступать в роли интерактивного советника для клиентов и партнеров компании. В этом случае важно было наделить бота не только именем, но и фамилией — так появилась Оксана Соколова. При утверждении концепции цифрового офиса помощницу переименовали: чтобы сгладить образ, фамилию Соколова заменили на более мягкую — Соловьева. Также компания разработала прототип аватара для виртуальной советницы.

Оксана Соколова (Фото: vc.ru)

Подбор имен для голосовых сервисов — это отдельная наука. Большинство компаний-разработчиков делает ставку на простые и понятные имена, которые легко произносить и печатать. Также бизнесу важно, чтобы имя бота запоминалось, но при этом не вызывало негативных ассоциаций. Как раз по этой причине бренды чаще всего делают ставку на нейтральные имена — такие, как Аня, Олег или Оксана.

Впрочем, не все используют имена. Например, Google Assistant намеренно отказалась от имени — компания хотела, чтобы виртуальный ассистент ассоциировался с линейкой продуктов Google, оставаясь при этом максимально нейтральным.

Голос и гендер

Большинство голосовых помощников на момент запуска обладали только женским голосом, за что их разработчики часто подвергались критике. Эксперты ЮНЕСКО отмечали, что такой формат укрепляет гендерные предрассудки и предписывает женщинам обслуживающую роль.

На эту проблему нужно посмотреть с позиции разработчика. Исследования показывают, что люди разного пола лучше распознают именно женские голоса. К тому же большинство text-to-speech систем натренированы на записях женской речи, поэтому создать помощницу проще, чем помощника.

В некоторых случаях сервисам дают голоса знаменитостей — опять же в маркетинговых целях. Причем приглашать звезду в студию не требуется — всю работу выполняют алгоритмы. Например, нейросетевые модели WaveNet помогли Google создать имитацию голоса певца Джона Ледженда.

Интересно, что в последнее время голосов становится все больше и они не ограничиваются только женскими и мужскими. Так, Google маркирует разные варианты не гендерным признаком, а оттенками — всего у компании более 11 различных голосов только на английском языке. Появляются и нейтральные боты, например, Q, который разговаривает на частотах, которые затрудняют распознавание гендера.

В случае с ботами многое зависит от сферы услуг, в которой их используют. Если банку нужно напомнить клиенту о задолженности, он может задействовать мужской голос. Если курьерская служба предлагает клиенту скидку, то виртуального оператора по традиции наделят женским голосом. Например, в банке «Тинькофф» утверждают, что люди охотнее общаются на финансовые темы с мужчинами, чем с женщинами. Поэтому команда создала помощника по имени Олег — мужчину 25-40 лет.

Характер

Характер — это, пожалуй, самый сложный элемент любого голосового помощника. Разработчики пытаются найти баланс между безликостью и индивидуальностью, чтобы ассистент мог поддержать живой диалог, но в то же время не высказывал свое мнение по противоречивым вопросам и сохранял нейтралитет.

Индустрия 4.0 Ученые научили искусственный интеллект угадывать характер по чертам лица

Для этого к работе над скриптами привлекают целый пул специалистов. Например, психологи работают над формулировками в сложных ситуациях, особенно если собеседник делится с ботом мрачными мыслями. Дизайнеры разговоров учат бота поддерживать диалог и казаться естественным, а комики создают подобие чувства юмора.

Впрочем, подобные характеристики обычно нужны виртуальным помощникам, сценарии взаимодействия с которыми постоянно меняются. При разработке сервисного ИИ компании важно учитывать, какие именно задачи она решает с помощью бота и какой процесс хочет оптимизировать.

Чаще всего бизнес стремится проводить как можно больше звонков за короткий промежуток времени, поэтому главное — это экономия и эффективность. Сервисным ботам шутки, скорее, мешают, потому что они усложняют диалог и замедляют обработку звонка. А сокращение диалога с 1 минуты до 50 секунд может сэкономить немало ресурсов. Эмпатия также уместна не всегда — например, банковскому помощнику не так важно проявлять сочувствие, тогда как медицинскому боту без этого не обойтись.

Использование уже готовых сценариев — референсных диалогов — обычно упрощает задачу и помогает быстро создавать точечные решения с учетом потребностей каждой компании. Хотя сейчас на рынке принято создавать ботов с нуля, это не самая эффективная стратегия. Как показывает практика, лучше записать сотню реальных диалогов и выбрать из них два идеальных сценария, а потом воспроизвести их с помощью нейросети.

В TWIN мы всегда опираемся на референсы — беседы с наибольшей конверсией преобразуем в текст, проводим разметку данных и на основе полученной базы обучаем нейросеть и синтезируем речь. Так создаются реалистичные сервисные боты. В будущем этот процесс можно будет выстраивать автоматически — достаточно загрузить в систему образцовый диалог-референс и нажать «Преобразовать».

Экономика инноваций Как работают голосовые помощники: подкаст РБК Тренды

Проработанная личность сервисному боту обычно также не требуется. Важнее добавить эмоциональный окрас. Для этого дизайнеры диалогов могут задействовать разные приемы: например, использовать теорию Карла Юнга об архетипах или наделить бота определенной акцентуацией. Многое зависит от собеседника — для этого мы, например, считываем настроение клиента. Бот или оператор будут менять тактику в зависимости от того, настроен человек позитивно, негативно или нейтрально.

На то, как клиент воспринимает помощника, влияют многие мелкие факторы, которые со стороны могут показаться незначительными. Например, правильное ударение в имени и фамилии при обращении к клиенту. Это усложняет процесс синтеза речи, потому что нужно сверять данные по базам и проверять ударение для каждого элемента ФИО. Но такие детали играют важную роль, ведь достаточно одной ошибки, чтобы клиент мгновенно потерял доверие к боту.

Будущее цифровой личности

Несмотря на все эксперименты, боты пока далеки от совершенства: они все еще не могут работать автономно, выполняя задачи секретаря и персонального помощника. Паритет между искусственным интеллектом и человеком на диалоговом уровне пока не достигнут, а создать виртуального собеседника на основе реального — до сих пор непростая задача, которую пытаются решить многие компании.

Очевидно, что в будущем базы данных расширятся, а тренировать нейросети будет проще. Пару лет назад исследователи из Facebook запустили Persona-Chat — базу данных, в которую входит более 160 тыс. отрывков диалогов реальных людей. С ее помощью компания будет обучать компьютерные модели.

Пока первостепенная задача ассистентов и ботов — это помощь людям. Для этого они должны понимать не только речь, но эмоции и намерения собеседника, а также решать задачи самого клиента или бизнеса. Личностные характеристики, которые положительно влияют на эффективность, продолжат развиваться. Но создавать реалистичные цифровые копии людей для бизнес-задач пока не имеет смысла. Цель существования бота — это выполнение конкретной функции, и в этом заключается его принципиальное отличие от человека.

Подписывайтесь на Telegram-канал РБК Тренды и будьте в курсе актуальных тенденций и прогнозов о будущем технологий, эко-номики, образования и инноваций.

Обновлено 08.05.2021

Теги

Искусственный интеллект Внедрение инноваций IT Люди будущего Гендер Нейросети Как это устроено